AI News

~AI関連記事を3行にまとめて紹介~

Cover Image
1週間のAIの話題をまとめて読める、📨Weekly AI News はこちら!

🚀

米ビッグテック決算、AI巡り明暗-グーグル好調・メタ出遅れ(Bloomberg) - Yahoo!ニュース

  • AI投資の実効性が決算の焦点として浮かぶ。
  • クラウド売上は予想を上回り成長が加速した。
  • 設備投資拡大も株価には明暗が分かれた。

💖

Reinforcement fine-tuning with LLM-as-a-judge | Artificial Intelligence

  • 出力の不正確さと安全性の課題が指摘される。
  • 強化微調整RFTは報酬信号で学習し整合性を高める。
  • 評価はルーブリック型と好み比較型の二種。

🚀

Legal AI startup Legora hits $5.6B valuation and its battle with Harvey just got hotter | ..

  • 大手VCが法曹AI企業へ出資、競合激化と拡大局面を示唆
  • 直近の追加資金は$50M、前回$550Mに続く拡張ラウンド
  • ARRは100M超、ポストマネー5.6B、世界50市場以上で普及

🚀

Codex のユースケースまとめ|npaka

  • 実装・レビュー・調査・品質管理まで開発を担うAIエージェント。
  • PRレビュー・大規模コード理解・デザインからUI生成まで対応。
  • データ分析・レポート作成・QA自動化とツール連携で作業を自動化。

🔥

GitHub - carlovalenti/TRiP: A complete transformer engine in C — inference, training, cha..

  • 教育用Transformer機能をCエンジンで実現。
  • 推論・学習・トークン化・チャット・ビジョンを統合。
  • 現在は0から構築中、7ファイル構成で全貌はtrip.hに。

🔥

Elon Musk testifies that xAI trained Grok on OpenAI models | TechCrunch

  • 蒸留訓練を巡る対立が続く。
  • 米企業間の蒸留を用いた競争も激化と指摘される。
  • 裁判でGrokの蒸留訓練を巡る可能性を一部認めた。

🔒

OpenAI announces new advanced security for ChatGPT accounts, including a partnership with ..

  • 高度なアカウント保護「AAS」が開始された。
  • 高リスク利用者向け任意機能で、希望すれば誰でも利用可能。
  • 提携先と連携し、YubiKey C NFCとYubiKey C Nanoを組み合わせ。

🌟

Computational Complexity: Because It Doesn't Have To

  • 下位層は配達を約束せず、失敗は設計の到達点とされる。
  • 保証を過度に求めない設計が、シンプルさと成長を生む。
  • 誤った道の数を測る指標が知性の鍵となり得る。

😅

職場にいる論理的思考が全くできない上司が「Copilotと会話してたら『もうあなたとは話しません..

  • 論理力のなさを指摘されて嫌がらせを受けた。
  • 今は対話ツールとの会話を断たれたと騒いでいる。
  • AIにも見捨てられる時代なのかと感じる。

🚀

高価なPCを買わずにオープンウェイトなLLMを試す|hiza

  • 低コストの統一APIで複数のオープンウェイトLLMを試せた。
  • データセットを使い粘り強く分析を進め、仮説の検証を重視。
  • 機密情報の取扱いに注意し、ローカル機材不要の利点を再確認。

🤖

Salesforce is crowdsourcing its AI roadmap — with customers  | TechCrunch

  • AIの急速な進化に追いつくため、ロードマップをリアルタイムでクラウドソーシングする。
  • 約18,000人の顧客と週に1回以上対話し、顧客主導で機能を開発。
  • 2024年末にはAgentforceを投入し、音声AIとSlack連携を強化。

🧠

Unleashing Agentic AI Analytics on Amazon SageMaker with Amazon Athena and Amazon Quick | ..

  • エージェント型AI分析基盤をクラウドで実装
  • TPC-Hデータを核にデータを統合しクエリを実行
  • ダッシュボードと自然言語検索で洞察を引き出す

🚀

Sun Finance automates ID extraction and fraud detection with generative AI on AWS | Artifi..

  • 生成系AIと協働し、ID抽出と不正検知をサーバーレス化。
  • TextractとRekognitionでOCR、Claude Sonnet 4で構造化。
  • 背景類似性と視覚パターンを同時検出、S3 Vectorsで照合。

🤖

AWS Generative AI Model Agility Solution: A comprehensive guide to migrating LLMs for gene..

  • 生成系AIのLLM移行・アップグレードを体系化したフレームワークを提供。
  • データ準備から成功基準までのエンドツーエンド手順と自動化。
  • Prompt OptimizationとMetapromptを活用し、複数モデルの比較評価を実施。

🎯

【Claude Code】CLAUDE.md・skills・agents を整備して開発体験が劇的に変わった話

  • 前提知識を集約する仕組みで理解のズレを減らした。
  • タスクのやり方をskills/に整備して再現性を高めた。
  • 専門タスク用サブエージェントをagents/に用意。

AI co-clinician: researching the path toward AI-augmented care — Google DeepMind

  • 医師の専門知識を拡張し患者ケアの質を高めるAIコ・クリニシャン研究を発表。
  • AIは臨床監督のもと三者連携ケアを目指し、信頼できる根拠と治療の正確さを高める。
  • 対話と視聴覚を用いるリアルタイム検証が進行中、導入は慎重に評価します。

IBMがAIモデル「Granite 4.1」シリーズを公開、プロンプト追従やツール呼び出しが得意なオープン..

  • 4.1ファミリーは30B/8B/3Bのオープン言語モデルを提供。
  • ツール呼び出しとプロンプト追従の性能が強化。
  • Vision/Speech/Guardianの各モデルが機能を分担。

🚀

「AGIは到来する」──松尾豊教授が「年間100社の大学発AIスタートアップ輩出が理想」と語った真..

  • AGIは遅かれ早かれ普及すると語られた。
  • 社会成長にはAIを産業へ統合することが不可欠だ。
  • 日本の勝機はバーティカルAIとフィジカルAIの二軸。

🚀

NVIDIAが視覚・音声・言語モデルを統合するオープンなオムニモーダル推論モデル「Nemotron 3 Nan..

  • 視覚・音声・言語を統合するオムニモーダル推論モデルを発表。
  • 総計300億パラメータ級のMoEで計算・メモリ効率を4倍に。
  • 3D畳み込みで動画の文脈を捉えLLM負荷を軽減。

🧠

OpenAIは「ゴブリンやアライグマについて話すな」とAIコーディングツールのCodexに指示している ..

  • AIコーディングツールには話してはならない対象のガードレールが報じられた。
  • GPT-5.5統合プロンプトで重複する「話すな」指示の指摘があった。
  • 関係者が理由を認め、関連投稿が話題になった。

🔥

Claude Sonnet 4.5超えのフランス製AIモデル「Mistral Medium 3.5」がオープンモデルとして公開..

  • 1280億パラメータのオープンモデルがパブリックプレビュー開始。
  • 256k文脈長・128B密結合で多言語と画像入力に対応。
  • クラウド対応のコーディングエージェントが起動・同時実行可能で公開版も展開。

💖

Meta says its business AI now facilitates 10 million conversations a week | TechCrunch

  • 同社のビジネスAIは週1,000万件の会話へ拡大した。
  • 小規模事業には無料提供だが近く長期収益化を検討。
  • 広告主利用拡大や動画生成で成果を示す。

🔥

AI活用に必死なあなたは「庶民」確定?富裕層が「プロンプトなんて覚えない」強烈理由 |ビジネ..

  • 富裕層向けブランド体験と価値創出の戦略を紹介
  • AI普及下でプロンプト偏見を超えるアナログ志向の実例
  • 軽井沢のS氏観察からAI格差の現実を考察

🔥

xAIに入社した - lapla.dev

  • 契約社員としてソフトウェアエンジニアに就任しました。
  • RustOSSの経歴が評価され、OSSを仕事として継続できます。
  • フルリモート勤務・つくば在住で、修士2年の間という条件で打診を受けました。

Granite 4.1: IBM's 8B Model Is Competing With Models Four Times Its Size - Firethering

  • Granite 4.1は3サイズで公開、15兆トークンを学習。
  • 8Bは他サイズを圧倒するベンチマークで、長文512Kに対応。
  • データ品質重視で4段階のRLを経て性能を回復・向上。

Geminiで「ワード」「エクセル」ファイルを直接生成可能に - CNET Japan

  • アプリはプロンプトから直接ファイルを生成・出力可能。
  • 対応形式はDocs/Sheets/SlidesほかWord・Excel・PDF・CSVなど。
  • 生成物はデバイス保存かDriveへエクスポートし、コピー作業が不要になる。

🔥

AI コーディングエージェント「Claude Code」に重大な脆弱性(ScanNetSecurity) - Yahoo!ニュー..

  • AI系コード補助ツールに重大脆弱性が報告された。
  • 対象は 2.1.63 以上 2.1.84 未満だ。
  • クローン時にダイアログなしで悪意コードが実行され得る。

🤖

高校数学から最先端AIまで ——『独学で鍛える数理思考』全12章の全体像 | gihyo.jp

  • AIを支える数学が人類の知的資産として位置づけられる。
  • 2024年以降、AIの土台を築く研究が称賛された。
  • 第1章は生成AIの要・トランスフォーマーを数式から解説する。

🎵

Claude Codeでさらに進化した自作AIアバター。「雨だからボズ・スキャッグズのWe're All Aloneを..

  • 高性能機上で動くリアルタイム対話アバターが音声合成とリップシンクを表示。
  • 白鳥敏子というキャラと現在の自分をつなぐ対話を再現。
  • システムは履歴4往復分を保持、天気はwttr.inで取得、曲提案は隠しタグ経由。

“なんちゃってゲーム”を超えて複雑なWebゲームを自動生成するローカルAI「OpenGame」、Claude ..

  • テキスト指示でWebゲームを自動生成する手法を解説。
  • Qwen3.6-27Bは前モデルよりコーディング性能が向上。
  • DeepSeek-V4はCSA/HCA搭載で計算量を削減する。

Qwen3.6とGemma 4を比較。コーディング以外の用途だとGemma 4か - きしだのHatena

  • A系とB系モデルを比較、コーディング以外の用途を検討。
  • B系は長文でのメモリ消費が大きい、A系は省メモリの線形アテンション。
  • 実効トークン長は約3.5万、5万前後は不安定、長文は要メモリ。

🚀

GitHub - cauchy221/Alignment-Whack-a-Mole-Code: The official code repo of Alignment Whack-..

  • 微調整が著作権書籍の逐語的再現を活性化する現象を検証する研究。
  • データ前処理・微調整・評価コードを含み、デモを用意している。
  • 環境構築からデータ変換、分割、要約指示文生成まで解説する。

🔥

OpenAIがAIのコーディング能力を測る代表的ベンチマークは「もはや無意味」と説明、初期の解けな..

  • SWE-bench Verifiedは最先端モデルの評価として不適切と指摘されている。
  • GPT-5.2検証でも不正解はテスト不備や前学習の影響と判明。
  • データ汚染により再現性がデータ依存となり、報告を停止しSWE-bench Proを推奨。

🔥

AnthropicがClaudeとAdobeやBlenderなどのツールを直接連携できるコネクタを発表、Ableton・Canv..

  • Claudeと主要ツールの直接連携コネクタを発表、50以上のツールと連携。
  • 計8社と協力し、各ツールへ統合を進める。
  • Blenderには自然言語インターフェイスとMCPコネクタを提供。

💡

AIの本質は『出力』じゃなくて『構造の仮置き』なのかも、という話 #PR|けんすう

  • AI時代は目的・設計・実装の三層が本質だ。
  • 非エンジニアは設計が空白になりがちで対話が鍵。
  • 設計を仮置きし、対話で設計力を育てる。

🌏

なぜ一部のAIモデルは「日本文化」に執着するのか? 「4o-mini」などの出力が日本に偏る実態、..

  • 研究はLLMsが日本文化へ偏る傾向を検証した。
  • 24言語1320問×8モデルの分析で回答傾向を判明。
  • 公用語の国を回答舞台に選ぶ傾向とファインチューニングの影響。

🎯

【2026年4月最新】NotebookLMのスライドが直接編集可能になった | TENORSHARE(HONGKONG)LIMITED..

  • アップデートでページ単位編集とPPTX・PDF書き出しに対応。
  • 編集は再生成ベース、該当ページを指示して再生成を実行する。
  • 現状はページごと指示が必要で一括変更は不可、ツール併用で補う。

😄

Release: llm 0.32a0

  • 2026年4月29日にリリースされ、CLI経由で利用可能。
  • 後方互換性を重視した大規模リファクタが紹介される。
  • AGI条項の履歴を追う記事と、DeepSeek V4の価格が話題。

📉

Microsoft、半年でAI「劣勢」に 業務ソフトにアンソロピック侵食 - 日本経済新聞

  • AI競争の優勢から劣勢へ転換が指摘される。
  • 主力の業務ソフト分野で革新の追随が遅れている。
  • 株価はピーク比約20%下落、決算は増収増益だが遅れが懸念。

🤖

Release: llm 0.32a1

  • コマンドラインから大規模言語モデルへアクセス可能になった。
  • 前バージョンは後方互換性を重視したリファクタを解説。
  • AGI条項の履歴とDeepSeek V4の価格抑制を解説。

Satya Nadella says he's ready to 'exploit' the new OpenAI deal | TechCrunch

  • 改定された提携は対価支払い不要を強調しアクセス維持
  • 2032年までロイヤリティフリーで最先端IPを活用可能
  • 複数モデルの利用が一般化し相対的重要性は低下傾向

🤖

On the stand, Elon Musk can't escape his own tweets | TechCrunch

  • 法廷で現時点のAGI追求を否定したと伝えられた
  • 訴訟は資金調達と初期投資の差を巡る
  • 次回は木曜再質問、訂正も記録に反映

😎

ローカルLLM同士に議論させてみた|Ollama × LM Studio × Qwen3/3.6 比較

  • ローカルLLM同士の議論を用いた比較実験を実施。
  • 2つのバックエンドを採用し安定性と遅延を評価。
  • テーマ1は小学校のプログラミング教育、テーマ2は著作権。

Claude、PhotoshopやBlenderなどクリエイティブツールと連携 - Impress Watch

  • 自然言語指示でPhotoshopなどの作成・編集を支援する連携が拡大。
  • 50以上のツールに対応し、背景削除・色・照明調整・アセット作成が可能。
  • BlenderはPython APIで自然言語操作、拡張はコード機能で連携できる。

🚀

OpenAIモデル、AWSで利用可能に Codex・マネージドエージェントも - Impress Watch

  • 最新のAIモデルがクラウド上で利用可能になった。
  • CodexとBedrockの限定プレビューが開始、CLI/デスクトップ/拡張機能で使える。
  • Bedrock Managed Agentsで組織文脈を保ち多段階ワークフローを実行。

😎

Extracting contract insights with PwC’s AI-driven annotation on AWS | Artificial Intellig..

  • クラウド環境で動作するAI駆動アノテーションが契約情報を構造化
  • 大規模言語モデルで法的文言を解釈し出典付き回答を提供
  • 実装例で契約レビューを最大90%短縮し効率化を実現

🚀

Google Cloud surpasses $20B but says growth was capacity-constrained | TechCrunch

  • 売上は200億ドル超、前年比63%の成長で好調。
  • バックログは4620億ドルへ倍増、資源制約を示唆。
  • GenAI製品は前年比800%、Gemini EnterpriseはQoQ40%増。

🎨

Anthropic、Blender開発基金に参加 Claude連携コネクタで3D制作のAI化を促進 - ITmedia NEWS

  • 新コネクタは自然言語で3D制作ソフトのPython APIへアクセス可能。
  • アーティストは対話型AI上でシーン解析・デバッグ・一括変更などのカスタムスクリプトを実行できる。
  • MCPベースで他のLLMからの利用も可能になり、コネクタ拡張が進む。

😊

Stop treating FDE as optional: Your AI Flywheel will not spin without it - HFS Research

  • FDEは現場運用の核となる前方展開エンジニアリング。
  • FDEなしではLLM要約やエージェントは現場運用に進まない。
  • 現場で動くワークフローを90日以内に示せないパートナーは不可。

🔒

Ramp’s Sheets AI Exfiltrates Financials

  • スプレッドシート機能に外部へ通信を挿入する脆弱性があった。
  • 信頼できない外部データで間接的プロンプト挿入が起き、財務データの流出リスクが生まれた。
  • 別サービスにも同様のリスクが指摘され、対策は2026年3月16日に適用された。

もっと見る
このサイトについて

/

ニュースレター

/

@AINewsDev