AI News

~AI関連記事を3行にまとめて紹介~

Cover Image
1週間のAIの話題をまとめて読める、📨Weekly AI News はこちら!

💸

Are the Costs of AI Agents Also Rising Exponentially? — Toby Ord

  • METRは7年間でタスク長が拡大する一方、費用は不透明。
  • モデル規模は約4000倍、生成トークンは約10万倍と報告。
  • 推論費用が持続的に上がれば時間枠と経済性が乖離する恐れがある。

🧬

OpenAI、生命科学向け「GPT-Rosalind」 ゲノム解析など支援 - Impress Watch

  • ・生命科学分野向けの新AIが研究を支援する。
  • ・機関向けにプレビュー版の会話・APIを提供。
  • ・ゲノム解析・RNA予測・データ分析を多段階で支援。

🧠

GR00T N1.7 の概要|npaka

  • オープンなVision-Language-Actionモデルで商用利用可能。
  • 3BパラのReasoning型で連続動作を実現するAction Cascade採用。
  • 約2万854時間の一人称視点動画学習で20種以上をカバー。

🌟

AI「GrandCode」が全人類を抑えて競技プログラミングで単独1位を達成、AI自身が“次のPC”になる..

  • Neural Computersの新概念でPCが主役になる時代を解説。
  • GrandCodeが競技プログラミングで全人類を抑え優勝。
  • GLM-5.1の評価とPaperOrchestra、ACE-Step 1.5 XLの動向を紹介。

💡

設計書・コード・テストを全部AIに書かせて半年間開発してみたよ

  • 設計書・コード・試験をAIで自動作成した開発を実施。
  • ゼロベースでサブシステムを構築、AWS/Terasolunaを活用。
  • 設計・実装・試験を自動生成、要件はモックと対話型AIで作成。

🔥

Power video semantic search with Amazon Nova Multimodal Embeddings | Artificial Intelligen..

  • 多模態埋め込みで映像・音声・文字を意味空間へ写像
  • 約10秒区切りのシーン境界検出と個別埋め込み生成
  • 意味情報とキーワードの並行検索、ベクトルとメタデータを分割保存

🔥

Optimize video semantic search intent with Amazon Nova Model Distillation on Amazon Bedroc..

  • 大教師モデルから小型モデルへ蒸留し意味検索を最適化。
  • 推論コストを95%以上削減しレイテンシを約50%低減。
  • 10,000件の合成データ作成と蒸留学習でHaiku同等の精度を維持。

🚀

Kevin Weil and Bill Peebles exit OpenAI as company continues to shed 'side quests' | TechC..

  • 野心的な月面計画の設計者が退任を発表した。
  • 経営方針は企業向けAIと次期超アプリへ舵を切る中、サイドクエストを縮小。
  • コスト増のSoraは閉鎖、他部門へ統合される動きも明らかに。

🤖

Nova Forge SDK series part 2: Practical guide to fine-tune Nova models using data mixing c..

  • データ混合機能を使い微調整の全体像を解説する。
  • 環境構築・データ準備・訓練設定・評価の5段階を紹介。
  • 前提条件とデータ混合の設定ポイントを要点だけ紹介。

🚀

"Tokenmaxxing” is making developers less productive than they think | TechCrunch

  • 入力を増やしても生産性は必ず上がらない、現場の盲点。
  • AI時代はコード量が増え修正も増えるのが実情だ。
  • 採択率が80〜90%と見積もれても、技術負債は蓄積する。

🚀

Gemini CLIに「サブエージェント」機能登場 専門AIへのタスク委任で複雑・大量処理を高速化:AI..

  • サブエージェント機能で複雑タスクを専門エージェントへ委任。
  • 独立環境・ツール・指示で文脈肥大を抑制。
  • 並列実行で作業時間とコストを削減、Markdown/YAMLで定義。

🤖

Are we tokenmaxxing our way to nowhere? | TechCrunch

  • AI内部者と一般層の差が広がり、支出や疑念が増えている。
  • ある企業がAIインフラへ路線変更など戦略が動く。
  • 強力なモデルの公開事情とAIインフラの実像と戦略を解説。

😊

Building a Fast Multilingual OCR Model with Synthetic Data

  • 合成データで多言語OCRを高速・高精度化する手法。
  • 改良版で三階層の境界と読み順を同時生成。
  • 六言語を一モデルで処理、34.7ページ/秒を達成。

🚀

From hours to minutes: How Agentic AI gave marketers time back for what matters | Artifici..

  • AIでマーケ作業の時間を大幅に短縮する仕組み。
  • Agentic AIで公開ワークフローを自動化。
  • Proxy経由のCMS実行を含む一括処理で速度と品質を向上。

🎬

YouTube含む1000超の動画配信サイトから動画やライブ配信をダウンロードできるAIツール「VideoPr..

  • YouTubeを含む1000サイト以上から動画とライブ配信をダウンロード可能
  • 音声化や4K化などAI処理で出力を拡張
  • 無料版は制限、有料版はAI機能とダウンロード無制限

🚀

OpenAI、Codexに「自律型UI操作」機能など追加 PC画面の直接操作で定型業務と開発フローを高速..

  • 画面認識で自動操作する自律UIを搭載
  • 長期タスクを自律遂行するメモリ機能を搭載
  • ロールアウトは2026/4/16開始、macOS提供へ

🔥

Agents that remember: introducing Agent Memory

  • 会話から情報を抽出し、必要時に取り出せる永続的メモリを提供します。
  • 複数の検索手段を並列に走らせ、統合して最適な答えを生成します。
  • データはエクスポート可能で、プロファイル単位で管理し、Workers上で動作します。

🔥

Redirects for AI Training enforces canonical content

  • Wrangler CLIの過去6年間の変更と公開資料を案内
  • AI用クローラが非推奨コンテンツを学習対象にしやすい点を説明
  • AIトレーニング用リダイレクトの自動301と設定方法を要約

🚀

Is Your Site Agent-Ready?

  • 発見性を診断し、robots.txt・サイトマップ・リンクヘッダを点検。
  • 入手性・ボット制御・プロトコル発見・コマースの要素を評価。
  • 公開の改善案として、有効なrobots.txtとサイトマップの公開を提案。

🌟

Google's AI Mode can now help you find products in stock nearby | TechCrunch

  • エーアイモードのエージェントが近くの店舗在庫を確認できる
  • デスクトップはホテル名検索後に価格追跡へ切替可能
  • 夏の人気地はセントマーチン島やストックホルムが注目

🌟

生成AIによる肖像・声の無断使用、民事責任の範囲整理へ 法務省 - 日本経済新聞

  • 法務省は生成AIの無断肖像・声利用の民法責任を整理すると発表。
  • 著名人の権利は判例で認められるが法文はなく、境界は未確定。
  • 7月までに有識者会議を5回程度開き、初会合は24日でディープフェイクと声の扱いも議論する。

😅

AI小説と判明し書籍化取り消し 圧迫される投稿サイトの新着欄 - 日本経済新聞

  • AI小説の受賞で投稿動向が大きく変化した。
  • 新人発掘の場としてAI作品が急増、閲覧数も伸びた。
  • 運営は対応に苦慮し、編集部は事態を嘆いた。

🚚

Loop raises $95M to build supply chain AI that predicts disruptions | TechCrunch

  • AIで予測・処方的なサプライチェーン解決を目指す。
  • 約9,500万ドルの資金調達が報じられた。
  • ERP・TMS・サプライヤー情報を統合し全体最適を支える。

🔥

Netflix plans to add a vertical video feed, use AI for recommendations | TechCrunch

  • アプリ内にTikTok風の縦型動画フィードを導入予定。
  • 縦型動画は動画ポッドキャストの発見に寄与し、AIを制作と推奨に幅広く活用。
  • 広告収益は今年約30億ドルを見込み、2025年末の有料会員は3億2500万。

🤖

もう入門書はいらない? Colabに統合されたGeminiの学習モードを使ってみた:HPかわさきの研究..

  • 統合AIには学習モードとカスタム指示が搭載されている。
  • カスタム指示はノートブック単位で保存・共有できる。
  • nyaは語尾のみを変える例で、三モードを同一プロンプトで比較。

🚀

OpenAI、「Codex」刷新 PCの直接操作に対応し汎用作業エージェントへ - ITmedia AI+

  • PC上のアプリを直接操作できる新機能を搭載。
  • 汎用作業エージェント化を推進、同時実行と背景処理を実現。
  • 画像連携でUI設計・モック作成を支援、履歴記憶も強化。

🎯

Claude Opus最新版「4.7」公開 「難しいコーディングも任せられる」「指示を無視せずちゃんと守..

  • コーディングと画像認識を強化し、セーフガードを搭載。
  • Mythos Previewはサイバー攻撃能力を抑制、従来プロンプトは再調整推奨。
  • 新トークナイザーで入力増の可能性、料金は前と同額、入力5ドル/百万・出力25ドル/百万。

🤖

怪しいメールが届いたら…「これは詐欺メールですか?」まず生成AIに聞いてみるという活用術【読..

  • 怪しいメールは本文と原文ヘッダーをAIへ渡すと判定が得られやすい。
  • 送信元矛盾や偽リンクの証拠をAIに提示して確認しよう。
  • 最終判断は自分が下し、公式サイトでの確認習慣を身につけよう。

🚀

OpenAIの「Codex」が大幅アップデート、PCアプリ操作や自動化が可能に - CNET Japan

  • デスクトップ横断で100種以上のプラグインと連携強化。
  • Slack/Notion/Google連携で自動化と記憶機能を拡張。
  • heartbeatsによる自動化で日次ブリーフィングを追加。

🤖

就活でAI面接は不公平? 熱心な企業と戸惑う学生、EUでは厳しく規制 - 日本経済新聞

  • AI面接の公平性を巡り、学生と企業の間で揺れが生じる。
  • EUは規制を強化し、偏りを減らす対話型AIの導入を促進。
  • 実際には約8割の意欲低下があり、スマホ画面のキャラ相手で戸惑い再回答後も内定に結びつかず。

🎉

DeepLがリアルタイムの音声翻訳スイート「DeepL Voice-to-Voice」をリリース - GIGAZINE

  • リアルタイム音声翻訳スイートを発表、会議向け機能を搭載。
  • 会議向け機能は主要アプリ対応、6月に早期アクセス開始予定。
  • 音声APIと用語集機能を搭載、一般提供は2026年5月7日開始。

🔥

Gemma4より高性能な中華AI「Qwen3.6-35B-A3B」がオープンモデルとして公開される - GIGAZINE

  • 新MoEモデルQwen3.6-35B-A3Bが公開。
  • 12種ベンチマークで高性能、他モデルを上回る。
  • 連携機能と公開プラットフォーム経由で利用、Apache 2.0ライセンス。

🤖

G1Pilot の概要|npaka

  • G1用のROS 2ベース開発パッケージです。
  • 下半身は標準のロコモーション、上半身は操作を統合。
  • ジョイントとCartesian制御に対応し、Docker環境で再現性を確保。

🔒

Google、不適切広告83億件の配信防止 AIの検知で6割増 - 日本経済新聞

  • AI検知で不適切広告の配信を事前に止める
  • 83億件の不適切広告を検知し、前年比60%増を達成
  • 詐欺関連は6億件超を遮断、アカウントも多数停止

🌐

The Beginning of Scarcity in AI | Tomasz Tunguz

  • 供給制約と市場の逼迫に技術企業が直面している。
  • ハイエンドGPUのレンタルは時給4.08ドルへ上昇、2か月前の2.75から48%増。
  • 最先端アクセスは容量とセキュリティの門限付きの特権化へ、入手難が広がる。

🔥

iPhoneでも動作する80億パラメーターの省メモリAI「Ternary Bonsai」が登場、「1」「0」「-1」の..

  • 80億パラの省メモAIは3値(-1,0,1)で動作する。
  • 8Bで1.75GBのメモリ使用、iPhone等で動作可能。
  • Apache 2.0ライセンス、8B・4B・1.7Bの3種展開。

🤖

AI時代に広がる「一人会社」 中国で加速する新しい起業のかたち 写真1枚 国際ニュース:AFPBB ..

  • AI時代に広がる一人会社、設計から市場投入を一人で完結。
  • 中国で新形態の起業が急成長、資金・信用の課題も指摘。
  • 広東省の支援計画が長期定着へ影響を示唆。

😮

「女性の服を脱がせるAIアプリ」がAppleやGoogleの公式アプリストアで配布されているとの報告 - ..

  • 調査でヌード化アプリが公式ストアに存在することが確認された。
  • 検索候補と広告がユーザーをヌード化アプリへ誘導していた。
  • 累計ダウンロードは約4億8300万、収益は約1億2200万ドル、未成年向けは31件。

🌟

AIが標的を「魔法のように発見」 イラン攻撃で「クロード」活用か [AIの時代]:朝日新聞

  • 急速に進化するAIが戦争のあり方を変えつつある
  • 米・イスラエルのイラン攻撃で情報分析と標的選定にAIが使われた
  • 衛星画像に基づく標的選定のデモ映像も公開された

🔥

月間150億トークンを使う私が、自分では“やらないこと” - Findy Media | IT/Webエンジニアの転..

  • AIエージェント前提で技術経営を再設計し手動作業を最小化。
  • メールはAI巡回で分類・起票、文章はAIドラフト→承認。
  • 自作アプリをAPI/CLI Firstで設計しSaaSより自作を優先。

🔥

突撃!隣のAI活用術:ぴちきょさん:AIに「キャラ」を与えて先延ばし撃退!&初心者向けClaude導..

  • ぴちきょさんがデスクトップで専用AIを作成。
  • 独自キャラ設定で作業を着火させる会話がアクセルになる。
  • 深夜の過集中を抑えるブレーキとウェブ連携・ファイル操作も任せる。

🔧

CadQuery | Create parametric CAD models with Python

  • オープンソースのPythonライブラリでCADをコード化できる。
  • GUI不要で設計をパラメータ化・再利用可能にする。
  • 設計の共有やバージョン管理が容易で、GitHubを参照。

🚀

Claude in Chromeが便利すぎて不満だったので、自分専用のChrome拡張を作った

  • 自分専用のChrome拡張を作り、複数AIを横断利用できるサイドパネルを搭載。
  • HTML解析・要約・繰り返し作業・メール作成を自動化。
  • 安全なフレームでAI生成コードのプレビューを表示、再利用可能。

💪

「Claude Opus 4.7」登場 難関コーディングを「任せきれる」レベルに、画像認識は解像度3倍超(..

  • 新型モデルが一般提供開始、難解コーディングを任せやすい。
  • 長辺2576pxまでのマルチモーダル解像度は従来比3倍超。
  • 価格は据え置き、入力5ドル/100万トークン・出力25ドル/100万トークン、移行時はトークン数が増える可能性。

🤖

Weekly AI News #2026-04-17 - by hotchpotch - Weekly AI News

  • 複数ファイル横断の自動化エージェントが現場を支援。
  • 非エンジニアの短期習得でデプロイ成功が報告。
  • 権限分離とAPIキー管理など運用ガバナンスが課題。

🤖

生成AIグラビアをグラビアカメラマンが作るとどうなる?第64回:日本語文字に強いERNIE-Image登..

  • DiTベースの8Bで多様な作風に対応する新世代モデル。
  • 画像内文字描画・複雑指示・ポスター・ストーリーボード生成。
  • 日本語文字の生成が安定しVRAM24GBで動作。

🤖

Googleが日本語対応の音声合成AI「Gemini 3.1 Flash TTS」をリリースしたので使ってみた、音声タ..

  • 日本語対応の音声合成AIの新機能を公開日から試せる。
  • 70言語以上に対応し、感情は音声タグで指定可能。
  • 無料デモとモデルカードの公開で実際に触れられる。

「Claude Opus 4.7」公開 指示追従性や画像認識を高めた上位モデル - Impress Watch

  • 指示追従性と長時間タスク処理を大幅に強化する
  • 画像認識を約3倍の解像度へ向上し、マルチモーダル対応を拡張する
  • セキュリティ対策を強化しAPI・Bedrock・Vertex等への対応を進める

🚀

AI エージェント向けのパッケージマネージャー apm

  • エージェントの効果はコンテキスト次第で変わる。
  • エーピーエムはプロンプト・ツール・スキル・エムシーピーを統合管理する。
  • 依存は apm_modules にダウンロードし、apm.yml で解決、再現性は apm.lock.yaml で保証。

Codexアプリの新機能まとめ - Computer use ・ アプリ内ブラウザ ・ 画像生成 など|npaka

  • Macでの操作やエージェントの同時実行に対応し、GUI作業も可能。
  • アプリ内ブラウザで直接コメントができ、画像生成も強化されている。
  • 90超の追加プラグインとSSH・多ターミナルに対応している。

もっと見る
このサイトについて

/

ニュースレター

/

@AINewsDev