AI News

~AI関連記事を3行にまとめて紹介~

Cover Image
1週間のAIの話題をまとめて読める、📨Weekly AI News はこちら!

🧬

生命科学研究のための推論AIモデル「GPT-Rosalind」をOpenAIが発表 - GIGAZINE

  • GPT-ロザリンドという生命科学向け推論AIを発表。
  • 論文整理・仮説生成・実験計画を一括支援する。
  • エンタープライズ導入とライフサイエンス向けプラグインを公開。

OpenAIがAIエージェント「Codex」を大幅刷新、「PCの操作」「ブラウザで直接指示」「画像生成でU..

  • macOS上でPC操作とデバッグが可能な独自カーソル搭載。
  • アプリ内ブラウザでウェブ指示を直接処理、画像生成はGPT Image 1.5対応。
  • 90種以上のプラグインとスケジュール機能で長期タスク管理を支援。

🤖

川崎重工、四足歩行のAI造船ロボット開発へ 溶接技術者不足で対策 - 日本経済新聞

  • 自律歩行の四足AI造船ロボットが大型構造物を自動溶接。
  • 船体組み立ての溶接工程を2028年実用化で2倍に高める。
  • 障害物を避け現場へ自ら赴き溶接部位を把握する。

🤖

Gemma 4の音声認識機能でリアルタイム文字起こしを試してみた

  • 小型モデルE2B/E4Bが音声入力に対応した点を確認。
  • E2Bは約9.5GBVRAM、総計51億、有効23億パラメータ。
  • 5秒音声はStage1で0.3〜1.8秒、Stage2で文脈補正、E4Bは追従不可。

🔥

OpenAI、「Codex」を開発"全部入り”アプリに コンピュータ操作+画像 - Impress Watch

  • コーディング以外に操作と画像生成へ対応したアップデート
  • Mac/Windows用デスクトップアプリとして順次提供、初期はmacOS
  • gpt-image-1.5で画像生成と反復処理を強化、プラグイン追加も開始

💡

CloudflareがAI統合推論レイヤーを発表 — 70+モデルを単一APIで管理、エージェント時代の複数プ..

  • エージェント用推論レイヤーで70超のモデルを単一APIで切替可能
  • 複数プロバイダー対応と1行コードでの切替完了、画像・動画・音声にも対応
  • 自動フェイルオーバーとメタデータ追跡で費用管理を強化、Replicate連携も進行中

🚀

CloudflareがAI特化のGit互換ストレージ「Artifacts」発表 — エージェントによる爆発的コード生..

  • AIエージェント時代向けのGit互換分散ストレージを公開
  • リポジ作成はWorkers API、既存リポは.import()で取り込み
  • 大規模リポは非同期クローン、フォーク・共有は可能、βは5月初旬

🙂

自分のPCで簡単にAIを動かせる「Ollama」には多数の問題点があり、llama.cppを使った方が良いと..

  • ローカル運用における中心は llama.cpp とする批判がある。
  • クレジット未履行や独自バックエンドの問題が指摘される。
  • 起動の遅さや脆弱性放置など欠点が挙げられる。

🎯

生成AIの動画・音声 深刻化する無断利用の権利侵害を整理 法務省が検討会設置 - ITmedia NEWS

  • 生成AIで有名人の顔や声に似た作品が無断で作られている問題が深刻化。
  • 法務省は肖像・声の利用を巡る民事責任を検討する会を設置した。
  • 初会合は24日、7月までに計5回を予定し、侵害有無と損害賠償の範囲を検討する。

😊

そのAI臭を消す努力は、誰のためにやっているのか

  • AI臭の消し方は誰のためかを問い直す。
  • 嫌悪の背後には品質向上と出自隠しの二つが混ざる。
  • 語尾整えや表現置換で出自を隠し判断を揺らす。

🤖

Anthropic、AIデザインツール「Claude Design」プレビュー公開──「Opus 4.7」搭載でコーディン..

  • リサーチプレビュー公開のAIデザインツール。
  • テキスト指示・画像・コードを読み込み初期デザインを生成。
  • 資産を学習して自動でデザインシステムを構築、コード連携と出力をサポート。

🎯

Many anti-AI arguments are conservative arguments

  • 反人工知能論は保守寄りと見られがちだが左派の論点もある。
  • 著作権問題や『人は人が創るべき』は保守寄りだが左派も支持する。
  • 雇用と環境の影響は左右双方で論じられ現状は不安定だ。

🔥

π 0.7 の概要|npaka

  • π0.7は新しいロボット基盤モデルで、未学習対応を重視。
  • 学習時は言語指示に加え、低品質データも文脈付き経験として活用。
  • 合成一般化と跨身体移行を実証し、UR5eで高い成功率を示す。

Microsoft 365 Copilot ライセンスがなくてもヌルっと Word / Excel / PowerPoint エージェン..

  • ライセンス不要でWordエージェントが使えるようになった。
  • Excel/PowerPointのエージェントも同様に追加可能。
  • 使い方は人それぞれ、まずは触って確かめよう。

📱

ソフトバンク、登録不要の生成AI体験「だれでもAI」提供開始 - ケータイ Watch

  • 登録不要の生成AI体験を新たに提供開始。
  • 画像生成は写真をアニメ風やKPOP風に変換できる。
  • 複数AIで体験と割引情報を案内、契約者には特典あり。

🌟

ASCII.jp:【無料ローカルAI】音声付き動画を生成できる「LTX-2.3」ComfyUIでの使い方をわかりや..

  • RTX4070+ComfyUIで動画と音声を同時生成する新モデルを検証。
  • 無料枠を使って数本の生成を試せる方法を紹介。
  • クラウドはクレジットと規制が壁、ローカル運用は自由。

😊

M365 Copilot、社内95%が使っても利用格差はなぜ起きる? やって分かった定着の鉄則(ITmedia ..

  • 使い慣れた業務アプリから呼べる点が評価されている。
  • 格差解消へ初期誤解回避と運用課題の対策が鍵。
  • 進化追随と推進体制整備の鉄則を整えよう。

🚀

Anthropic、「Opus 4.7」ベースのAIデザインツール「Claude Design」発表 Canvaとの連携も可能 ..

  • 新AIデザインツールはOpus 4.7を基盤に提供。
  • 指示・画像・文書を読み込ませ初期デザインを自動生成。
  • 外部ツールとの連携でドラフトをエクスポートし共同編集。

💸

Are the Costs of AI Agents Also Rising Exponentially? — Toby Ord

  • METRは7年間でタスク長が拡大する一方、費用は不透明。
  • モデル規模は約4000倍、生成トークンは約10万倍と報告。
  • 推論費用が持続的に上がれば時間枠と経済性が乖離する恐れがある。

🧬

OpenAI、生命科学向け「GPT-Rosalind」 ゲノム解析など支援 - Impress Watch

  • ・生命科学分野向けの新AIが研究を支援する。
  • ・機関向けにプレビュー版の会話・APIを提供。
  • ・ゲノム解析・RNA予測・データ分析を多段階で支援。

🧠

GR00T N1.7 の概要|npaka

  • オープンなVision-Language-Actionモデルで商用利用可能。
  • 3BパラのReasoning型で連続動作を実現するAction Cascade採用。
  • 約2万854時間の一人称視点動画学習で20種以上をカバー。

🌟

AI「GrandCode」が全人類を抑えて競技プログラミングで単独1位を達成、AI自身が“次のPC”になる..

  • Neural Computersの新概念でPCが主役になる時代を解説。
  • GrandCodeが競技プログラミングで全人類を抑え優勝。
  • GLM-5.1の評価とPaperOrchestra、ACE-Step 1.5 XLの動向を紹介。

💡

設計書・コード・テストを全部AIに書かせて半年間開発してみたよ

  • 設計書・コード・試験をAIで自動作成した開発を実施。
  • ゼロベースでサブシステムを構築、AWS/Terasolunaを活用。
  • 設計・実装・試験を自動生成、要件はモックと対話型AIで作成。

🔥

Power video semantic search with Amazon Nova Multimodal Embeddings | Artificial Intelligen..

  • 多模態埋め込みで映像・音声・文字を意味空間へ写像
  • 約10秒区切りのシーン境界検出と個別埋め込み生成
  • 意味情報とキーワードの並行検索、ベクトルとメタデータを分割保存

🔥

Optimize video semantic search intent with Amazon Nova Model Distillation on Amazon Bedroc..

  • 大教師モデルから小型モデルへ蒸留し意味検索を最適化。
  • 推論コストを95%以上削減しレイテンシを約50%低減。
  • 10,000件の合成データ作成と蒸留学習でHaiku同等の精度を維持。

🚀

Kevin Weil and Bill Peebles exit OpenAI as company continues to shed 'side quests' | TechC..

  • 野心的な月面計画の設計者が退任を発表した。
  • 経営方針は企業向けAIと次期超アプリへ舵を切る中、サイドクエストを縮小。
  • コスト増のSoraは閉鎖、他部門へ統合される動きも明らかに。

🤖

Nova Forge SDK series part 2: Practical guide to fine-tune Nova models using data mixing c..

  • データ混合機能を使い微調整の全体像を解説する。
  • 環境構築・データ準備・訓練設定・評価の5段階を紹介。
  • 前提条件とデータ混合の設定ポイントを要点だけ紹介。

🚀

"Tokenmaxxing” is making developers less productive than they think | TechCrunch

  • 入力を増やしても生産性は必ず上がらない、現場の盲点。
  • AI時代はコード量が増え修正も増えるのが実情だ。
  • 採択率が80〜90%と見積もれても、技術負債は蓄積する。

🚀

Gemini CLIに「サブエージェント」機能登場 専門AIへのタスク委任で複雑・大量処理を高速化:AI..

  • サブエージェント機能で複雑タスクを専門エージェントへ委任。
  • 独立環境・ツール・指示で文脈肥大を抑制。
  • 並列実行で作業時間とコストを削減、Markdown/YAMLで定義。

🤖

Are we tokenmaxxing our way to nowhere? | TechCrunch

  • AI内部者と一般層の差が広がり、支出や疑念が増えている。
  • ある企業がAIインフラへ路線変更など戦略が動く。
  • 強力なモデルの公開事情とAIインフラの実像と戦略を解説。

😊

Building a Fast Multilingual OCR Model with Synthetic Data

  • 合成データで多言語OCRを高速・高精度化する手法。
  • 改良版で三階層の境界と読み順を同時生成。
  • 六言語を一モデルで処理、34.7ページ/秒を達成。

🚀

From hours to minutes: How Agentic AI gave marketers time back for what matters | Artifici..

  • AIでマーケ作業の時間を大幅に短縮する仕組み。
  • Agentic AIで公開ワークフローを自動化。
  • Proxy経由のCMS実行を含む一括処理で速度と品質を向上。

🎬

YouTube含む1000超の動画配信サイトから動画やライブ配信をダウンロードできるAIツール「VideoPr..

  • YouTubeを含む1000サイト以上から動画とライブ配信をダウンロード可能
  • 音声化や4K化などAI処理で出力を拡張
  • 無料版は制限、有料版はAI機能とダウンロード無制限

🚀

OpenAI、Codexに「自律型UI操作」機能など追加 PC画面の直接操作で定型業務と開発フローを高速..

  • 画面認識で自動操作する自律UIを搭載
  • 長期タスクを自律遂行するメモリ機能を搭載
  • ロールアウトは2026/4/16開始、macOS提供へ

🔥

Agents that remember: introducing Agent Memory

  • 会話から情報を抽出し、必要時に取り出せる永続的メモリを提供します。
  • 複数の検索手段を並列に走らせ、統合して最適な答えを生成します。
  • データはエクスポート可能で、プロファイル単位で管理し、Workers上で動作します。

🔥

Redirects for AI Training enforces canonical content

  • Wrangler CLIの過去6年間の変更と公開資料を案内
  • AI用クローラが非推奨コンテンツを学習対象にしやすい点を説明
  • AIトレーニング用リダイレクトの自動301と設定方法を要約

🚀

Is Your Site Agent-Ready?

  • 発見性を診断し、robots.txt・サイトマップ・リンクヘッダを点検。
  • 入手性・ボット制御・プロトコル発見・コマースの要素を評価。
  • 公開の改善案として、有効なrobots.txtとサイトマップの公開を提案。

🌟

Google's AI Mode can now help you find products in stock nearby | TechCrunch

  • エーアイモードのエージェントが近くの店舗在庫を確認できる
  • デスクトップはホテル名検索後に価格追跡へ切替可能
  • 夏の人気地はセントマーチン島やストックホルムが注目

🌟

生成AIによる肖像・声の無断使用、民事責任の範囲整理へ 法務省 - 日本経済新聞

  • 法務省は生成AIの無断肖像・声利用の民法責任を整理すると発表。
  • 著名人の権利は判例で認められるが法文はなく、境界は未確定。
  • 7月までに有識者会議を5回程度開き、初会合は24日でディープフェイクと声の扱いも議論する。

😅

AI小説と判明し書籍化取り消し 圧迫される投稿サイトの新着欄 - 日本経済新聞

  • AI小説の受賞で投稿動向が大きく変化した。
  • 新人発掘の場としてAI作品が急増、閲覧数も伸びた。
  • 運営は対応に苦慮し、編集部は事態を嘆いた。

🚚

Loop raises $95M to build supply chain AI that predicts disruptions | TechCrunch

  • AIで予測・処方的なサプライチェーン解決を目指す。
  • 約9,500万ドルの資金調達が報じられた。
  • ERP・TMS・サプライヤー情報を統合し全体最適を支える。

🔥

Netflix plans to add a vertical video feed, use AI for recommendations | TechCrunch

  • アプリ内にTikTok風の縦型動画フィードを導入予定。
  • 縦型動画は動画ポッドキャストの発見に寄与し、AIを制作と推奨に幅広く活用。
  • 広告収益は今年約30億ドルを見込み、2025年末の有料会員は3億2500万。

🤖

もう入門書はいらない? Colabに統合されたGeminiの学習モードを使ってみた:HPかわさきの研究..

  • 統合AIには学習モードとカスタム指示が搭載されている。
  • カスタム指示はノートブック単位で保存・共有できる。
  • nyaは語尾のみを変える例で、三モードを同一プロンプトで比較。

🚀

OpenAI、「Codex」刷新 PCの直接操作に対応し汎用作業エージェントへ - ITmedia AI+

  • PC上のアプリを直接操作できる新機能を搭載。
  • 汎用作業エージェント化を推進、同時実行と背景処理を実現。
  • 画像連携でUI設計・モック作成を支援、履歴記憶も強化。

🎯

Claude Opus最新版「4.7」公開 「難しいコーディングも任せられる」「指示を無視せずちゃんと守..

  • コーディングと画像認識を強化し、セーフガードを搭載。
  • Mythos Previewはサイバー攻撃能力を抑制、従来プロンプトは再調整推奨。
  • 新トークナイザーで入力増の可能性、料金は前と同額、入力5ドル/百万・出力25ドル/百万。

🤖

怪しいメールが届いたら…「これは詐欺メールですか?」まず生成AIに聞いてみるという活用術【読..

  • 怪しいメールは本文と原文ヘッダーをAIへ渡すと判定が得られやすい。
  • 送信元矛盾や偽リンクの証拠をAIに提示して確認しよう。
  • 最終判断は自分が下し、公式サイトでの確認習慣を身につけよう。

🚀

OpenAIの「Codex」が大幅アップデート、PCアプリ操作や自動化が可能に - CNET Japan

  • デスクトップ横断で100種以上のプラグインと連携強化。
  • Slack/Notion/Google連携で自動化と記憶機能を拡張。
  • heartbeatsによる自動化で日次ブリーフィングを追加。

🤖

就活でAI面接は不公平? 熱心な企業と戸惑う学生、EUでは厳しく規制 - 日本経済新聞

  • AI面接の公平性を巡り、学生と企業の間で揺れが生じる。
  • EUは規制を強化し、偏りを減らす対話型AIの導入を促進。
  • 実際には約8割の意欲低下があり、スマホ画面のキャラ相手で戸惑い再回答後も内定に結びつかず。

🎉

DeepLがリアルタイムの音声翻訳スイート「DeepL Voice-to-Voice」をリリース - GIGAZINE

  • リアルタイム音声翻訳スイートを発表、会議向け機能を搭載。
  • 会議向け機能は主要アプリ対応、6月に早期アクセス開始予定。
  • 音声APIと用語集機能を搭載、一般提供は2026年5月7日開始。

🔥

Gemma4より高性能な中華AI「Qwen3.6-35B-A3B」がオープンモデルとして公開される - GIGAZINE

  • 新MoEモデルQwen3.6-35B-A3Bが公開。
  • 12種ベンチマークで高性能、他モデルを上回る。
  • 連携機能と公開プラットフォーム経由で利用、Apache 2.0ライセンス。

もっと見る
このサイトについて

/

ニュースレター

/

@AINewsDev