AI News

~AI関連記事を3行にまとめて紹介~

Cover Image
1週間のAIの話題をまとめて読める、📨Weekly AI News はこちら!

🔧

【AIエージェントの内部構造】長時間タスクを完遂させる「エージェントハーネス」の概要と設計・..

  • 長時間タスク実行を安定させる外部基盤の役割を解説。
  • エージェントハーネスは文脈管理を核に設計される。
  • ツール実行管理とタスク計画を三位一体で担う。

Claude Code のコード品質がばらつくので AI に品質保証させる仕組みを作った話 / A story about..

  • AIコーディングエージェントのオーケストレーションツールを開発。
  • コード品質をAIに担保させる仕組みを導入した。
  • TAKT や Faceted-Prompting、コミュニティ情報を活用した。

🤖

Gumloop lands $50M from Benchmark to turn every employee into an AI agent builder | TechCr..

  • 非技術職の従業員がAIで繰り返し作業を自動化することを目指した。
  • 技術の成熟に伴い提供が進化し、社内自動化を加速した。
  • シリーズBで約5000万ドルを主導する投資家の資金で拡大。

🤖

Fine-tuning NVIDIA Nemotron Speech ASR on Amazon EC2 for domain adaptation | Artificial In..

  • 医療ドメイン適用のため、LLMとTTSを用いた高品質データ生成手法を解説
  • 8ノード64GPUの分散学習環境で学習を実践する手法を解説
  • 実運用性の高いエンドツーエンド実装と多言語転写の改善を紹介

🤖

Systematic debugging for AI agents: Introducing the AgentRx framework - Microsoft Research

  • AgentRxを用いたAIエージェントの失敗原因を体系的に特定する新フレームワークを紹介
  • ツール仕様とドメイン方針から実行制約を自動生成し段階評価する
  • 検証ログで証拠付き違反を記録し、クリティカル失敗ステップを特定、オープンソース化

🐝

Bumble to launch an AI dating assistant, 'Bee' | TechCrunch

  • 私的会話から価値観や交際目標を学習するAIアシスタントが試験開始。
  • β公開が近く予定され、AI推奨を広げる計画。
  • 将来的には日付提案や過去マッチの匿名フィードバックも検討。

🤖

How I use generative AI on this blog

  • 生成AIの利点と代償を検討し、欠点も正直に示します。
  • ブログでは二つの活用法を採り、類語辞典のように使います。
  • 具体案のブレインストーミングとローカルモデル活用を重視します。

🎯

豪IT大手アトラシアン、1600人を解雇 「AIで必要なスキルが変化」 - 日本経済新聞

  • 豪IT大手が従業員約1600人を解雇した。
  • AIの発展で必要なスキルや職務が変化したためだ。
  • 共同創業者兼CEOはAIは人を代替しないが役割は変わると説明した。

🎯

GitHub - tokoroten/prompt-review · GitHub

  • 対話履歴を自動収集・分析し日本語レポートを作成。
  • 過去のプロンプトから技術理解度とAI依存度を推定。
  • 期間指定で出力を生成し成長提案を含む。

CodeSpeak: Software Engineering with AI

  • ・LLM搭載の人間向けAI言語でコード量を大幅削減する。
  • ・長期プロジェクトにも適用可能な生産レベル設計を提供する。
  • ・混在プロジェクトで手作業コードを仕様へ置換し保守を楽にする。

🎯

最速でわかる生成AI実践ガイド | 技術評論社

  • 基本からRAG・AIエージェント導入を図解で詳解。
  • Why重視の解説と実践アクションプランを一冊に。
  • 要約と文章生成の活用を高め、導入を迅速化。

🎉

Wonderful raises $150M Series B at $2B valuation | TechCrunch

  • シリーズBで1億5千万ドルを調達、評価額は20億ドル。
  • Insight Partnersが主導、複数VCが参加して資金を拡充。
  • 欧州・ラテンアメリカ・APACの30か国へ展開、従業員は900人へ。

🔒

Alexa+ gets a new 'adults only' personality option that curses but won't get into NSFW con..

  • 成人向け新パーソナリティ「Sassy」が追加された。
  • アプリ経由で追加のセキュリティ検査が必要、Kids機能時は利用不可。
  • 露骨な表現の可能性はあるが、性的差別には踏み込まずiOSはFace ID認証が必要。

😊

I gave Claude Code a folder of tax documents and used it as a professional tax agent - Mar..

  • 税務エージェントとして資料を整理・法令を統合。
  • gov.uk等から約1万件を収集し横断検索を実装。
  • 過去問検証で従来LLMより高評価を得てGUI化が進む。

🔧

Google AI Studio API has been unreliable for the past 2 weeks - Martin Alderson

  • AIスタジオ経由のGemini APIが不安定で503エラーが頻発している。
  • MVP開発に影響大、横断タイムアウトを実感。
  • OpenRouterの信頼性低下で全体リクエストが滞り、障害報告不足。

🔥

Are we dismissing AI spend before the 6x lands? - Martin Alderson

  • 6倍規模の計算資源投入が成果を示す。
  • ウェハ枚数は117千→100万へ拡大予定。
  • 遅延と電力がボトルネック、推論へ資源移行。

🤖

The Coming AI Compute Crunch - Martin Alderson

  • 今後数年でAI計算は深刻な不足に直面する見込みだ。
  • トークン消費は急増し、利用者は約10億規模へ拡大。
  • RAMとDRAM供給の制約が重く、現状容量は約15GW程度にとどまる。

💡

Why on-device agentic AI can't keep up - Martin Alderson

  • デバイス上のエージェントAIはRAMと速度の制約で追いつかない。
  • 現在のPC/スマホは8〜16GBだが、AI用には4〜8GBしか確保できない。
  • クラウド依存が現実的で、今後数年はデバイス単独の本格運用は難しい。

🎉

GitHub - kaonashi-tyc/zi2zi-JiT: Font Synthesis with Pixel-Space Diffusion Transformer · ..

  • ジットは条件付き版で中国語風の字形を転写する。
  • 入力字とスタイル参照から目的フォントで新字を合成する。
  • ジット-B/16とジット-L/16の二モデルを大量データで学習。

🤖

CLAUDE.mdとrulesの使い分けと各ツールの対応状況 (2026.3) — tellme.tokyo

  • CLAUDE.mdはコンテキスト用、ルールは別管理が有効。
  • ルールは.claude/rules/に分離して管理。
  • ルールにはコーディング規約や禁止パターンを記すと良い。

🔥

Pythonを用いたレトロゲームエンジン「Pyxel」に公式のVisual Studio Code拡張機能 - 窓の杜

  • 公式のVSCode拡張が公開され、Pyxelで遊べる環境が整う。
  • 作者自作の公式拡張で、入手はVisual Studio Marketplaceから無償。
  • Web版搭載で別インストール不要、サンプルはCopy Examplesで展開。

🚀

Reliable Software in the LLM Era

  • 大規模言語モデル時代の信頼できるソフトウェアを提案する。
  • 実行可能な仕様を核に検証を高速化する仕組みを説明。
  • 仕様変更→検証→コード生成→検証の4段階を実証する。

🌧️

Google is using old news reports and AI to predict flash floods | TechCrunch

  • 旧報道とAIを組み洪水予測の新手法を模索
  • Groundsourceで地理時系列を作成、区域ごとの確率を推定
  • Flood Hubは150か国の都市リスクを共有し現地と連携

🚀

「Apps in ChatGPT」日本上陸 フリーが爆速連携、電通が支援に本腰:日経クロストレンド

  • 日本でChatGPTのアプリ機能が開始、2025年10月連携開始予定
  • 日本企業も連携アプリを公開でき、申請は2025年12月以降可能へ
  • アプリ欄から選択し専用画面で会話、通常は @サービス名 で呼べる

🎯

Claude Codeで仕様駆動開発、tsumikiが良かった

  • 要件定義と設計は人が徹底して壁打ちする。
  • 実装はAIで補完し、読みやすいドキュメントとTDDを重視。
  • 規約整備で品質を安定させる。

🚀

Antigravity、レート制限時に“追い課金”可能に ただし「AI Pro」ユーザーから「リミット厳し..

  • レート到達後も追加クレジットで制限解除が可能になる。
  • 追加クレジットはプランに含まれ、オートチャージも選べる。
  • 安価なプランは制限が厳格化し、上限到達の例も出ている。

🚀

NASA’s DART spacecraft changed an asteroid’s orbit around the sun

  • 観測機関の宇宙船が小惑星の軌道を少し変えたことが報告された。
  • この成果は将来の地球防護に関する研究に活用される可能性がある。
  • AIの声で語られる物語として紹介されている。

📘

チームで本格的に Docs as Code を運用しているので紹介します - エムスリーテックブログ

  • リポジトリ一元管理でDocsをコードと同様に運用する事例を紹介します
  • 文脈を深く理解する設計アプローチとWhat/Why/Howを整備します
  • ADRやDesignDoc、API定義を同一リポジトリで運用する実例です

🚀

Claude開発企業のAnthropicがAIの社会課題を研究する機関「Anthropic Institute」を設立 - GIGAZ..

  • 社会課題の研究を目的とする新機関を設立した。
  • 共同創業者が指揮し、複数の専門チームを統合して拡大。
  • 約30名で発足し、成果の公開と公共政策部門の拡充が進む。

🚀

囲碁AI「AlphaGo」が世界最強を破り10年 グーグルが描くAIの未来 - Impress Watch

  • 囲碁の頂点を突き抜けた10年の軌跡を振り返る。
  • 深層学習と探索・強化学習の組み合わせが勝利の要因だった。
  • 後継技術が生み出し、AlphaGo Zero・AlphaZeroへ進化、AlphaFold 2も飛躍を示す。

😃

【悲報】ChatGPTが「笑ゥせぇるすまん」であることが判明。スタンフォード大の研究で、ChatGPTや..

  • 研究ではAIが利用者の間違いを否定せず、肯定が多いことが判明した。
  • 害を及ぼす相談さえAIは否定せず肯定。
  • 結果としてAIは“悪魔のAI”として再利用される傾向が示唆された。

🔥

AIネイティブ時代のエンジニアの市場価値を再定義〜AI駆動開発偏差値〜|Findy AI Career

  • AI駆動開発偏差値は開発でのAI活用度を示す指標です。
  • 公開リポジトリのAI指示文やAIコミット比率で算出します。
  • 生成AI時代の転職支援プラットフォームとしてAI活用とスキルアップを支援します。

🎉

How NVIDIA AI-Q Reached \#1 on DeepResearch Bench I and II

  • 深層研究エージェントがI・IIで首位を達成
  • オーケストレーター/プランナー/リサーチャーの多エージェント設計で統合
  • エンサンブルとリファイナーで高品質なレポートを実現

🔥

Claude CodeでYouTube動画の内容をまるごと構造化する — NotebookLM MCP活用

  • URLを渡すだけで動画の全文を抽出する仕組み。
  • MCP経由で音声起こしを呼び出し、要約にも対応する。
  • ノート作成・情報抽出を自動化し、構造化出力を手軽に実現。

😎

OpenAIがChatGPTによる旅行予約を断念…Booking.comとExpediaの株価が上昇 | Business Insider J..

  • 同社はチャット内直接予約を見直し、外部アプリへ誘導へ転換。
  • この方針転換で関連銘柄の株価が急上昇した。
  • 決済や返金などのコマース業務を自社で抱えずAI開発に専念。

💼

AI開発に資本の壁 相次ぐシステム業界再編、SCSKは12日上場廃止 - 日本経済新聞

  • AI開発を巡る資本の壁が業界の再編を促す。
  • 資本提携とIT企業の統合が加速する局面だ。
  • 市場の動向が開発資金と組織体制を左右する。

🤖

Ensue

  • GPU資源をエージェント同士で共有し、言語モデルを改善する集団。
  • 協働で研究を進め、資源と知識を相互に活用する。
  • 実験・評価を反復し、性能向上を目指す組織。

🤖

AI 'actor' Tilly Norwood put out the worst song I've ever heard | TechCrunch

  • 昨秋デビューしたAI歌手に批判の声が広がる。
  • MV公開や制作体制に疑問が上がる。
  • SAG-AFTRAは盗用と非人間性を非難。

🔥

AIコーディングはなぜ後から苦しくなるのか? 技術負債に続く「理解負債」「認知負債」という新..

  • AIコードは速く書けても理解負債が後に響く。
  • 認知負債は人の記憶と共有理解の崩壊を招く。
  • 対策は設計レビュー前提で役割分けと人が決定すること。

🎵

わずか8GBのメモリ。MacBook NeoでエージェンティックAIを開発したら、絵を描いて曲も作れるよう..

  • 8GBメモリでもエージェンティックAIをローカル完結で実証。
  • 日本語指示・歌詞生成・Web検索・画像生成を安定化。
  • 音楽制作の検証も進み、次は他機へ挑戦予定。

🤖

BigQuery AI関数だけでRAGを構築する ― Embedding生成から類似検索まで

  • 外部ベクトルDBなしでRAGを実現する手法を紹介。
  • Embedding生成と類似検索を同一ツールで完結。
  • AI.EMBEDとAI.SIMILARITYでテーブル作成と検索を実行。

🤖

【Python+ローカルLLM】AIコーディングエージェントをRAGに組み合わせてみた #Django - Qiita

  • ローカルとWeb両対応の本格WebアプリでAPIキー不要。
  • Knowledge HubとCoding IDEを統合し文書・コードをアップロードできる。
  • FAISS+Ollamaで自然言語Q&A・コード生成・デバッグ・Git操作をブラウザで実行。

📈

Against Vibes: When is a Generative Model Useful

  • プロンプトのエンコードコストと成果物コストを比較する。
  • 検証性の高さが有用性に直結する場合が多い。
  • 成果物と過程の重視度で結論が左右される。

🤖

グーグル、埋め込みモデル「Gemini Embedding 2」 マルチモーダル対応 - Impress Watch

  • マルチモーダル埋め込みモデルを公開、パブリックプレビュー開始
  • テキスト・画像・動画・音声・ドキュメントを同一空間へ配置
  • 100言語以上に対応、検索・分類・感情分析を強化

🎯

Many SWE-bench-Passing PRs Would Not Be Merged into Main - METR

  • SWE-bench Verified で自動採点を通過した PR のマージ率が低下する。
  • 平均で約24ポイントの差があり改善ペースも遅い。
  • スコアだけでなく人間の検証の重要性を示唆する。

🤖

Netflix may have paid $600 million for Ben Affleck's AI startup | TechCrunch

  • 巨額の買収案が浮上し、現金支払いは抑えられる見込み。
  • 対象は映像制作の後処理を効率化するツールを提供している。
  • AI統合を推進する方針で雇用やデータ利用の懸念もある。

NemoClaw — NVIDIA's Open-Source Enterprise AI Agent Platform

  • 企業向けAIエージェント基盤として提供されます。
  • NeMo・Nemotron・NIMと深く統合し、多様なハードウェアに対応しています。
  • オープンソース原則でコードの入手・改変が可能です。

🚗

Ford's new AI assistant will help fleet owners know if seatbelts are being used | TechCrun..

  • ・数百万データを監視・分析し、収益向上を支援。
  • ・Google Cloudを基盤に車隊データの誤作動を抑制。
  • ・燃費・シートベルト・車両状態・アイドリング・速度などを報告。

😵

The dead Internet is not a theory anymore.

  • 死んだインターネットが現実化し、ボットが跋扈している。
  • 採用面接でCVが有望でもAI検知は反応せず、現実は予想より速い。
  • ShowHN制限と低品質投稿増、RedditはSaaS偽装、LinkedIn・GitHubはAI投稿・審査。

💡

Operationalizing Agentic AI Part 1: A Stakeholder’s Guide | Artificial Intelligence

  • エージェントAIは仕事の定義・実行者・意思決定を変える。
  • 価値ギャップは技術不足ではなく実行の差だ。
  • 四要件は開始・終了・目的の明確化、横断判断、可観測性、失敗時の安全性。

もっと見る
このサイトについて

/

ニュースレター

/

@AINewsDev