AI News

~AI関連記事を3行にまとめて紹介~

🎉

OpenAI、ChatGPTが朝イチに知りたい情報をまとめてくれる新機能「 Pulse」を発表。月額200ドルの..

  • 新機能がProプランで提供開始される。
  • 朝に5〜10件のレポートを要約して提示する。
  • Gmailとカレンダーと連携し要点抽出と今後の予定生成が可能。

🤖

Gemini Robotics 1.5 の概要|npaka

  • 新しいエージェント型ロボット開発の一歩を示す。
  • 複雑なタスクを汎用的にこなす2モデルとAPI経由のER 1.5を提供。
  • 空間認識・言語対話・ツール活用を統合し、思考を自然言語で説明する。

🎯

Weekly Kaggle News #302 - by u++ - Weekly Kaggle News

  • NFL Big Data Bowl 2026の空中動作予測を紹介。
  • Ariel Data Challenge 2025は終了と振り返りを紹介、gpt-oss-20bの脆弱性分析も紹介。
  • LoRAの進化と2025年の国際AIオリンピック日本代表派遣報告会のニュースも取り上げ。

🤖

選択:AI主権への道

  • AI主権の機会とリスクを各国が見極める動向を伝える。
  • データ主権と相互運用性を重視し、分散型エッジで多様な市場を促進。
  • 現地発のオープンソースAIを地域で展開し、現地語対応を拡大。

🚀

NotionAIコネクターで “すべて任せる” ナレッジ管理術

  • 情報収集から整理・DB化までを自動化する連携機能。
  • 外部ツールを横断検索でき、SlackやGoogle Drive、GitHubと連携。
  • 依頼一言でDB完成、接続・権限・リソース設定で完了。

🔥

ChatGPT Pulse の概要|npaka

  • モバイル版Pro向け新機能のプレビューを紹介。
  • 日次でパーソナライズ情報をカード表示します。
  • 安全性チェックと設定でオン/オフ可能です。

🎯

LLMを駆使したSlackbotによる例外アラート調査・分析の自動化 - ZOZO TECH BLOG

  • SlackbotとLLMで例外アラートの調査を自動化する。
  • MCPと2体のエージェントが協調して分析を進める。
  • GitHub/Sentry/AWSの資料を活用し、Slackへ回答を返す設計。

🔥

[2509.07025] 1 bit is all we need: binary normalized neural networks

  • 全層を0/1のパラメータに限定する新型層を提案。
  • 畳み込み・全結合・注意機構へ適用可能で、メモリを32分の1に削減。
  • 画像分類と次語予測で検証、32ビットとほぼ同等の性能を維持。

🤖

公式の「Chrome DevTools MCP」を VS Code の GitHub Copilot(エージェントモード)で軽く試す..

  • 公開プレビュー中の MCPを VS Codeで試用した
  • 設定はcode --add-mcpかJSON編集で行う
  • 初回プロンプトで性能指示を確認し起動・結果を表示、成功

🤖

世界初!日本企業がGPUを不要とする生成AI (LLM) の開発に成功。/2025年10月10日の都内イベント..

  • GPUを一切使わず、従来型LLM並みの性能を実現。
  • パラメータは32個の小規模モデルで、CPU環境で稼働。
  • コスト削減とプライバシー保護を実現、10月10日の都内イベントで先行発表。

🚀

LLMの出力が毎回変わる問題、原因はGPUではなかった?Thinking Machinesが解決策を発見 - すまほ..

  • 推論の非決定性はGPUではなくエンジンの不変性欠如が原因
  • バッチ構成の変化が経路を変え再現性を崩す
  • RMSNormを同一パス、乗算は同じタイル、1000回全て一致

🚀

【Copilot】GPT-5実装で“大進化”──知らないと損する「プロンプト」の“新常識” 連載:Copil..

  • GPT-5実装でCopilotは自律的な業務パートナーへ進化する。
  • 従来の精度向上だけでなく思考・行動を設計する点が鍵。
  • 設定とプロンプト次第で効果が大きく変わる点に注意。

🚀

データサイエンスのためのソフトウェアエンジニアリング入門 - O'Reilly Japan

  • データサイエンスの現場で使える実践的な設計とコード改善。
  • Pythonコード解説で保守性と可読性を高める技法を学ぶ。
  • テスト・ロギング・リファクタリングなど実務直結の技術を網羅。

🚀

Customer Solutions Engineer at kapa.ai | Y Combinator

  • 顧客・従業員向けAIアシスタントの導入と運用を支援。
  • 200社超の顧客と協力し障害対応・デバッグを担当。
  • 自己解決文書の作成やオンボーディング、セールスエンジニア業務も対応。

🎨

The great sameness: a comic on how AI makes us more alike

  • AIの普及が創作現場の個性を揺さぶる笑いの物語だ。
  • 登場人物は、協力と競合の狭間で自分を見つけようとする。
  • 読者は直感と多様性をどう守るかを考えさせられる。

🎯

『AI に使われた』と感じてから始めた3つのこと

  • ・タスクを細かく分解し計画を立て、方針を承認してから進める。
  • ・Whyを問う。成果物に理由を添え、Why付きコメントで納得を得る。
  • ・AI任せにせず、必要時は自分で手を動かす選択をする。

💡

生成AIで「雇用を段階的に減らす」23%、「全社導入」47% 民間調査 - 日本経済新聞

  • 生成AIの導入で雇用を段階的に調整する企業が23%
  • 全社導入は47%、人員の配置転換を4割超が実施
  • 過半数が収益増を見込み、利用率の伸び悩みも確認

How developers are using Apple's local AI models with iOS 26 | TechCrunch

  • Foundation Modelsの発表でローカルAIの推論コストを気にせず機能強化。
  • 局所モデルにはガイド付き生成とツール呼び出し機能が搭載。
  • ストーリー生成・語彙学習など多様な用途を実現。

🚀

無料で使えるGoogle製AI「Gemini 2.5 Flash」が高速かつ高精度にアップデートされる - GIGAZINE

  • 無料版の高速化と精度向上を含むアップデートを公開
  • 出力トークンをFlashで24%、Liteで50%削減を実現
  • 宿題解説の段階提示と画像認識の精度も改善

🚀

ついにPhotoshop内でGoogle製画像生成AI「Nano Banana」とBlack Forest Labsの「FLUX.1 Kontext ..

  • このソフト内でAI画像生成機能が使えるようになった。
  • 背景生成や被写体追加、欠損箇所の補完が自然言語指示で可能。
  • 現時点はβ版、利用には月額プランが必要。

🚀

An AI Index for all our customers

  • ドメイン向けAIインデックスをプライベートβで提供開始。
  • 自動でAI最適化の検索インデックスを作成・提供。
  • サイト所有者はインデックスを管理・収益化でき、外部AI連携で発見性を高められる。

🔒

Microsoftが隠そうとした、Copilotの“不審な挙動”とは?:848th Lap - キーマンズネット

  • 監査ログを残さずファイルへアクセス可能な重大脆弱性が報告された。
  • 公表はされず修正済みだがCVEも割り当てられなかった。
  • 7月報告、8月17日に修正展開、8月18日以降情報公開予定、原因は監査ログの仕様不備とみられる。

マイクロソフト、イスラエル国防省向けクラウドサービス停止 | ロイター

  • イスラエル国防省の一部部局向けクラウドとAIサービスを停止。
  • 監視報道を裏付ける暫定証拠が調査で確認された。
  • 大規模監視を可能にする技術は提供していないと説明。

🧭

Runner - Coding Agent

  • 現状のボトルネックは知性ではなく文脈の理解だ。
  • 自動化は進んでも実務コードは人の指導を要する。
  • 文脈は仕様や開発慣行、要件など多様に分散している。

🔥

DeepFabric Documentation

  • 話題主導の合成データ生成で学習用データを作成します。
  • 階層ツリーと跨結合グラフで多様な文脈例を提供。
  • 蒸留・エージェント評価・統計研究向けデータを供給し出力をパッケージ化。

🚀

イーロン・マスクGrokが「大躍進」のワケ、なぜビジネスパーソンが「使いまくる」のか |ビジネ..

  • WebとXのリアルタイム情報取得と自動要約が強み。
  • Grok4は38.6%、Grok4 heavyは44.4%の記録を達成。
  • 評価は高く実務適性が注目され、米国防省が2億ドル契約。

🌟

Building health care agents using Amazon Bedrock AgentCore | Artificial Intelligence

  • 臨床データ統合と安全な認証を実現するエージェント群。
  • FHIR標準とMCPを活用し診療連携を強化する。
  • 予約案内・予防接種履歴確認・治療計画調整を自動化する。

🔧

Build multi-agent site reliability engineering assistants with Amazon Bedrock AgentCore | ..

  • 分散SREを支える多エージェントアシスタントを構築。
  • ログ・指標・Kubernetesイベントを横断して根因を特定。
  • 統括エージェントを核に5体制で観測性と実運用を実現。

🧭

Towards better health conversations: Research insights on a “wayfinding” AI agent based ..

  • 健診情報を能動的に見つける対話体験を設計・検証した。
  • 質問を最大3つのターゲット質問で事前に明確化する。
  • 対話ごとに最適な回答を提示する二段構えのインターフェースを採用。

🌟

Dreamtap

  • 創作作業を支援するチャットボット用プラグイン。
  • 執筆・デザインの創作を広げる多様なインスピレーション源が使える。
  • 生成前にランダムな着想を注入して刺激を加える。

🤖

Googleがロボット用のAIモデル「Gemini Robotics 1.5」を発表、思考して行動を決定できる - GIGA..

  • ・現実世界で推論・計画・意思決定を同時に行うエージェントを実現。
  • ・デモは果物の色分けや衣類分類など具体的タスクを実演。
  • ・前思考型の仕組みで長期タスクの成功率を高める。

🚀

GitHub - apple/ml-simplefold

  • 汎用トランスフォーマー層で流れ整合のタンパク質折りたたみを実現。
  • 三角注意やバイアスに依らず、30億パラで860万件の蒸留構造と学習。
  • 公開リポジトリからインストールし、推論はコマンドで簡便。

😂

Smol2Operator: Post-Training GUI Agents for Computer Use

  • GUI自動化へ適応する軽量な視覚・言語モデルがエージェント級のコーダへ成長する。
  • データ・ツール・学習レシピ・モデル・デモを公開し再現性を確保する。
  • フェーズ1で認識を、フェーズ2で推論・計画を強化、aguvis-stage-1/2とScreenSpot-v2で評価。

🎯

Gaia2 and ARE: Empowering the community to study agents

  • Gaia2はGAIAの後継で、現実条件下のエージェント挙動を評価するベンチマーク。
  • ARE上で実行・デバッグ・評価を行い、1000超のシナリオとスマホ環境を検証。
  • データはCC BY 4.0、AREはMITライセンス、導入はpipでAREを入れ結果をアップロード。

🤖

Scaleway on Hugging Face Inference Providers 🔥

  • JS/Python用SDKから利用可能で導入が楽。
  • オープンウェイトモデルへ簡単アクセス(例:gpt-oss)。
  • サーバーレスのGenerative APIsでデータ主権・低遅延を実現、パリ拠点。

🔒

Democratizing AI Safety with RiskRubric.ai

  • モデルエコシステム全体のリスク評価を標準化して安全性を高める
  • 六分野横断の透明性と信頼性を同時に評価します
  • 1000超の信頼性テストと対敵検証で脆弱性と対策を提示します

🔥

Public AI on Hugging Face Inference Providers 🔥

  • 大手MLプラットフォームの推論プロバイダとして正式提供開始。
  • 言語横断対応の開発キットと統合され、手軽に利用可能。
  • 公開・主権モデルへも直接アクセス可能、非営利のOSSプロジェクト。

🔥

Visible Watermarking with Gradio

  • Gradioで可視ウォーターマークを使う方法を紹介します。
  • 画像・動画・テキストの watermark パラメータで実装可能。
  • QR水印やファイル名指定、NumPy配列にも対応。

🚀

Tricks from OpenAI gpt-oss YOU 🫵 can use with transformers

  • MXFP4量子化と新チャット形式などの新技術を搭載。
  • 大規模モデルの基盤を大幅更新し、ロード・実行を高速化。
  • Zero-build KernelとFlash Attention 3を統合し、分散処理を強化。

🚀

Jupyter Agents: training LLMs to reason with notebooks

  • ノートブック内でコード実行と推論を統合するエージェント開発。
  • デモはQwen-3Coder、スキャフォールドを約200行に簡略化。
  • DABStepで評価、easyで44.4%→59.7%、最大73.6%達成。

🎉

mmBERT: ModernBERT goes Multilingual

  • 約3兆トークン・1800言語で学習する多言語エンコーダ。
  • 3段階訓練で60→110→1833言語を順次追加。
  • 8192トークン対応と高速化を実現、実装例も公開。

😊

Welcome EmbeddingGemma, Google's new efficient embedding model

  • 308Mパラメータの高効率埋め込みモデルです。
  • 2K文脈・100言語超をサポート、端末で動作可能。
  • 768次元を512/256/128へ圧縮可能で用途拡大。

🚀

Make your ZeroGPU Spaces go brrr with ahead-of-time compilation

  • ・アイドル時にGPUを占有せず自由に起動を選べる。
  • ・1回最適化したモデルを再ロードして高速化するAoTを活用。
  • ・FP8量子化や動的形状にも対応して柔軟性が向上。

🎨

Generate Images with Claude and Hugging Face

  • 最先端AIモデルで高品質な画像を手軽に生成できる連携機能。
  • プロンプト作成をAIが補助し、生成後の設計を改善。
  • 最新モデルへ簡単に切替え可能、アカウント後の設定で完了。

🚀

MCP for Research: How to Connect AI to Research Tools

  • AIが自然言語指示で外部データへアクセスする標準を提供
  • arXiv・GitHub・Hugging Faceを横断して情報連携を簡素化
  • 導入は設定有効化と監視を組み合わせる。

💬

TextQuests: How Good are LLMs at Text-Based Video Games?

  • 動的対話環境で自律エージェントの推論と探索を評価する。
  • ヒント有無の二段階評価で最大500手の進行を測定。
  • 幻覚・循環・空間推論の難しさと推論コストのトレードオフ。

🤖

🇵🇭 FilBench - Can LLMs Understand and Generate Filipino?

  • 本ベンチマークはフィリピン語圏のLLMを総合評価する。
  • 4カテゴリ・12課題で20以上のLLMを比較。
  • 地域特化モデルはGPT-4oに及ばないが、データ収集と微調整で2–3%向上。

🎵

YouTube Music tests AI hosts that share trivia and commentary | TechCrunch

  • 再生中の曲に関する情報を提供するAIホストを試験中
  • ファン向け豆知識や解説を交える会話機能も検証中
  • 実験拠点で検証中、全ユーザー利用可だが米国枠は限定、方針更新

😊

What’s behind the massive AI data center headlines? | TechCrunch

  • AIインフラ投資の急拡大が話題となっている。
  • 巨額資金の流入とデータセンター拡張が進む。
  • 容量制約のため一部機能は限定提供と告知。

Game over for pure LLMs. Even Turing Award Winner Rich Sutton has gotten off the bus.

  • 純粋な大規模言語モデル依存は終わりつつある。
  • 世界モデルと推論以外の手法も必要で、併用が鍵だ。
  • 動画データだけでは物理や人間行動は理解できない。

💡

How the von Neumann bottleneck is impeding AI computing - IBM Research

  • フォン・ノイマン型ではデータ転送がエネルギーと遅延の要因になる。
  • モデルの重み量と移動距離が転送ボトルネックを生む。
  • アナログ・インメモリや PCM、Near-memory で省エネと性能を高める。

🚀

[2509.04501] Understanding Reinforcement Learning for Model Training, and future direction..

  • モデル訓練に使われる強化学習の基本を整理して解説。
  • 報酬最大化法や拒否サンプリングなどの手法を整理する。
  • LLMとの関連と現在の技術動向、今後の展望を示す。

🤖

AIと『対話しない』対話法、モノローグ法 #ChatGPT - Qiita

  • ・バックステップ・プロンプティングで思考を後退させ検証を促す。
  • ・スキャフォールディングは課題を小さなステップに分解して解決を導く。
  • ・モノローグ法は私自身を主語に思考を呟く新法。

🌟

ChatGPT、”やるべきこと”を毎朝提案する新機能「Pulse」 質問は不要 - Impress Watch

  • 朝に個人向け提案を自動で行う新機能が登場
  • 会話履歴と連携データを基に日課や旅プランを提案
  • Gmail/カレンダー連携で会議議題や誕生日通知も可能、設定でON/OFF

2025年09月27日

|

このサイトについて

/

ニュースレター

/

@AINewsDev