AI News

~AI関連記事を3行にまとめて紹介~

🔬

Google’s Gemma AI model helps discover new potential cancer therapy pathway

  • Gemma系オープンモデルが新経路発見に貢献。
  • 27BパラメータのC2S-Scaleが細胞言語理解基盤として登場。
  • CK2阻害剤silmitasertibを条件付き増幅薬として予測、仮想スクリーニング文脈で抗原提示増加を示唆。

🚀

実サービスへの搭載に向けたLLM AgentとMeta Agentの研究開発

  • 現場ニーズに合わせたLLMエージェントとMetaエージェントの研究開発を推進。
  • 自然言語指示→ツール実行→結果フィードバックを自動で繰り返し、課題解決へ臨む。
  • デモではCSV入力からレポートを生成するデータ分析を示す。

💬

Who’s Submitting AI-Tainted Filings in Court?

  • AI生成の判例引用が続く現状を分析した研究が示唆した。
  • ダミアン・シャルロタン氏のデータベースで米国114件を検証。
  • 大半が小規模事務所で原告側が多く、ChatGPT利用は半数近く。

🔎

[2507.16126] TaxCalcBench: Evaluating Frontier Models on the Tax Calculation Task

  • 最先端モデルの個人所得税計算能力を評価するベンチマーク
  • AIは税申告を自動化できず、英語テキスト理解と正確な計算が要る
  • 最新モデルは簡易データでも正しく処理せず、約3分の1未満の正確さと追加インフラが必要と結論

🤖

Anthropic、「Claude Haiku 4.5」リリース Sonnet 4の性能を3分の1のコストで実現 - ITmedia AI..

  • Haiku4.5が公開、旧版と同等の性能を3分の1のコストで実現。
  • 速度は2倍以上、コストは3分の1に抑制と報じられる。
  • APIやBedrock、Vertex AI、Copilotで利用可能と案内。

メタ、AI精鋭そろえ「超知能」に傾倒 メタバース11兆円損失で焦り - 日本経済新聞

  • AIの超知能開発に資源を振り向ける動きが強調される。
  • 広告収入を新領域へ投入し成長戦略を模索する。
  • 次世代端末の発表で焦りが広がる様子が指摘される。

🎯

New coding models & integrations · Ollama Blog

  • GLM-4.6とQwen3-coder-480Bがクラウドで統合を簡単にする。
  • Qwen3-Coder-30Bは新エンジンでツール呼び出しが速く安定。
  • 使い方はglm-4.6:cloud、qwen3-coder:480b-cloud、qwen3-coder:30bで、300GB超はローカル可。

🚀

Python/NumPyroで実装する項目反応理論と垂直尺度化 - ドワンゴ教育サービス開発者ブログ

  • IRTをベイズ推定で用い、高校生の能力を推定する。
  • θと項目特性のa・bをデータと事前分布から推定。
  • NumPyroとNUTSでJAX上の高速サンプリングを解説。

🔒

日本政府がアニメやゲームなどの日本の知的財産を「かけがえのない宝」と呼んでOpenAIに著作権を..

  • 政府が著作権侵害防止を目的に正式要請を提出した
  • 権利者への収益分配案が示唆された
  • 政府担当者は適切に対応すると約束した

🔥

GPUにNeural Acceleratorを備えた「Apple M5」チップのスペックまとめ。 | AAPL Ch.

  • ・Neural Accelerator搭載のGPUを備えた新世代SoC。
  • ・CPUは10コアで高効率と高性能を両立。
  • ・3nm世代でグラフィックス30%向上、メモリ帯域は153GB/s。

AIをよく使う人はナルシシズムやサイコパシーなど「ダークな性格特性」を持っている傾向が強いこ..

  • AIを頻繁に使う人には自己愛性やサイコパシーの傾向がある。
  • 最大90日分の履歴を用いて複数層を分析した研究だ。
  • 客観測定を用い、AI関連サイトの利用と行動変化を検証している。

💖

Google Cloud C4 Brings a 70% TCO improvement on GPT OSS with Intel and Hugging Face

  • MoE推論のベンチマークを実施し性能を検証
  • 前世代比で総所有コストを1.7倍削減、スループット向上
  • 専門家最適化でFLOPsを削減、MoE推論の効率を実現

🔥

「Sora 2」旋風の中、GoogleがAI動画モデル「Veo 3.1」発表 - CNET Japan

  • 最新のAI動画モデル3.1が公開、FlowとAPIが統合。
  • 素材をAI編集・合成へ、Ingredients to video機能が近づく。
  • 静止画2枚で滑らかなトランジション、1分超の動画にも対応。

🎯

生成AI、進化の鍵を握る「長期思考」 Sakana AIが挑む“人間のように試行錯誤するAI”への道筋..

  • 長期思考の技術開発が長期アルゴリズム能力の測定へ進展
  • ALE-Benchで長期課題の評価を進め、評価基盤を整備
  • ALE-AgentはAtCoder Heuristic Contestで上位2%の21位を獲得

🤖

ガートナー警鐘、その製品「実はAIエージェントじゃない」?見極め方と導入法を解説 |ビジネス+..

  • 現状のAIエージェントは半自律で監視が必要だと指摘される。
  • 入力から意思決定して行動しゴールへ到達する点が特徴だが、自ら情報を探し出せる範囲は限定的。
  • 学習エージェントは記憶・モデル・状態・ユーティリティを用い、フィードバックで性能を向上、製品選定と活用の要点を解説。

🚀

Anthropicが軽量コスト重視の「Claude Haiku 4.5」を発表、Claude Sonnet 4と同等のパフォーマン..

  • 軽量・低コストを重視した新AIモデルが登場。
  • 前世代と同等のコーディング性能を、コスト1/3・速度2倍以上で実現。
  • 10月16日から利用開始、入力1Mトークン1ドル・出力1Mトークン5ドル。

🚀

Bringing AI to the next generation of fusion energy - Google DeepMind

  • AIを核融合研究へ適用して実用化を推進します。
  • SPARCの磁場閉じ込め安定化にAIを活用します。
  • TORAXを活用した高精度プラズマシミュレータで仮想実験を繰り返します。

General Intuition lands $134M seed to teach agents spatial reasoning using video game clip..

  • ゲーム動画を使い空間推論を育成する基盤モデルとエージェントを研究中
  • 資金は約1億3370万ドルのシードで、世界モデルの商用化は回避している。
  • 初期応用は捜索救助ドローンと未知環境の理解・予測、ボット拡張でAGIを目指す。

🤖

Spotify partners with record labels to create 'artist-first' AI music products | TechCrunc..

  • 権利を尊重しつつアーティスト優先のAI音楽製品を開発中。
  • アーティストがツールの使用を自ら選べる仕組みを導入。
  • 生成系AI体験は既に提供済みで、対策と表示の強化を進める。

🎯

GitHub - inkeep/agents: Platform to create AI Agents in a No-Code Visual Builder or TypeSc..

  • ノーコードのビジュアルビルダーとTypeScript SDKでAIエージェントを作成。
  • コードとノーコードの2ウェイ同期で同一プラットフォームで編集。
  • リアルタイムAIチャットアシスタントで顧客対応と社内支援。

Googleが動画生成AI「Veo 3.1」をリリース、1分以上の動画生成に対応&音声品質の向上など - GIG..

  • 新機能で1分以上の動画生成に対応。
  • リアリズムと音声品質を大幅向上。
  • Flow連携で素材調整・連結・長尺化・削除・背景再構築が可能。

🎮

Gemini 3.0 Spotted in the Wild Through A/B Testing | Rick Lamers' blog

  • A/BテストでGemini 3.0へアクセス可能との噂が広がる。
  • A/B画面で印象的なXbox 360コントローラのSVGを取得。
  • 版の特定は難しく、3.0 Pro説と2.5 Proの比較が付録。

💫

The real reason Google DeepMind is working with a fusion energy startup | TechCrunch

  • 次世代核融合炉の運用をAIで最適化する計画を発表。
  • プラズマを模擬・解析するAIで発電量を最大化する。
  • 2026年には自己運転に必要な電力を上回ることを目指す。

Cognition | Introducing SWE-grep and SWE-grep-mini: RL for Multi-Turn, Fast Context Retrie..

  • 高速な並列型エージェントで文脈取得を高精度に実現。
  • 約10倍速く、最大8件同時呼出で4ターン回答を達成。
  • 多ターンRLで訓練し、ミニへ蒸留する。

Why AI startups are taking data into their own hands | TechCrunch

  • 夏の1週間、映像を多角度で同期し視覚モデルを訓練する。
  • 1日5時間の依頼だが実働は7時間、データ収集を続ける。
  • 建設・料理・電気工などの手作業映像も集め、推論を高める。

🚗

Voice AI-powered drive-thru ordering with Amazon Nova Sonic and dynamic menu displays | Ar..

  • 音声対話と動的メニュー表示を統合したドライブスルーを提案。
  • 認証は Cognito、データ連携は DynamoDB、API Gatewayで安全に連携。
  • サーバーレスとクラウドで混雑時の待機短縮とオーダー精度向上を実現。

📚

Optimizing document AI and structured outputs by fine-tuning Amazon Nova Models and on-dem..

  • 視覚とテキストの組み合わせで文書処理を解説する
  • オンデマンド推論とパラメータ効率化の技術を紹介する
  • 実コードと事例でデータ準備から評価指標まで解説する

🔥

Kayak launches an 'AI Mode' for travel questions, search, and bookings | TechCrunch

  • AIモードで旅の下調べが手軽にできる。
  • AIチャットボットで航空券・ホテル・レンタカーの比較・予約や質問に対応。
  • 米国で英語版開始、今後多言語・音声対応を拡大予定。

🤖

Welcome to State of AI Report 2025

  • ・オープンアクセス年次報告として六領域と大型調査を扱い現状を検証する。
  • ・推論と長期計画の能力が重視され、AIは科学的協力者として機能。
  • ・商業普及は加速し、導入は44%、契約は平均53万ドルとなる。

🤖

「AIなら週末も無償で働く」と、アナリストを全員解雇したVCの現在…113億円ファンドを運営、他V..

  • 従来のアナリストを全員解雇し、AIで案件を発掘・審査へ移行。
  • シリーズA/B向けに約113億円のファンドを運用。
  • 170名のLP網を活用し、有力創業者・技術者と連携。

🤖

巨大AIを打ち負かす、わずか700万パラメータの超小型AI「TRM」、著者自身が論文プレゼンする動画..

  • 700万パラメータの小型AIが巨大モデルを凌駕する例を紹介
  • 最大16回の自己改善で数独87%、迷路85%、ARC-AGIを上回る
  • 論文プレゼン自動生成など新技術の要点を整理

🌟

Iterative fine-tuning on Amazon Bedrock for strategic model improvement | Artificial Intel..

  • 反復的な微調整で段階的なモデル改善を促進する。
  • 既存のカスタムモデルを基盤にデータと評価を少しずつ更新する。
  • 推論展開は安定性重視の容量と要件変動対応を両立し、データ品質と評価の一貫性を鍵とする。

🎯

すべてのWindows 11をAI PCに AIと人が「同じ画面で対話」するエージェント - Impress Watch

  • Windows11全機でオンデバイスAIとCopilotを強化
  • Copilot VisionとHey, Copilotで画面と対話を実現
  • 非表示領域も分析、Outlook/Gmail連携の実験を検討

2025年10月17日

|

このサイトについて

/

ニュースレター

/

@AINewsDev