AI News

~AI関連記事を3行にまとめて紹介~

🤖

Geminiが強すぎて「ChatGPTのテコ入れ」が決定したらしい(ギズモード・ジャパン) - Yahoo!ニュ..

  • 社内メモを受け、強化優先の方針転換が示された。
  • 広告導入を見送り、コア性能の向上を最優先。
  • パーソナライズ機能強化・画像生成の高性能化・挙動評価を推進。

🔎

[速報]AWS、障害が発生すると人間より先にAIが調査分析、対処法まで報告「AWS DevOps Agent」..

  • 障害時に人手より先に調査・分析を行うAIエージェントのプレビューを発表
  • コードリポジトリと指標から原因を推定し、緩和策を提案する
  • 通知前に自律対処を開始し、解決時間短縮とレジリエンス向上を目指す

🤖

ローカルAIかわいいよと言う話|shi3z

  • ローカルAIは手元機器で動くAIでクラウドと対比される。
  • 利点は無制限利用・安定動作・秘匿性の高さ。
  • 実務には翻訳・要約・データ変換・動画要約などの活用例がある。

🔒

AIは「お金と脆弱性を交換できる」世界をもたらす。米内氏に聞く“「つくる」を守るためのセキュ..

  • AI普及で開発は加速、脆弱性取引の経済が現実味。
  • 防御は大量データと人の審査が鍵、偽陽性削減を重視。
  • 白箱は96%、黒箱4〜5割、未知脆弱性の検出が課題。

🎯

【独自】国民の生成AI利用、将来8割 政府の初基本計画案、全容判明(共同通信) - Yahoo!ニュー..

  • 第一段階で国民の生成AI利用を50%へ引き上げる。
  • 将来は80%へ、開発環境整備で1兆円規模の投資を促す。
  • 安全性は体制強化で担保するが、悪用対策は実効性が課題。

🔥

ChatGPT改良に向け「非常事態」を宣言、社内資源集中へ-OpenAIのCEO(Bloomberg) - Yahoo!ニュ..

  • サム・アルトマンCEOが改良を最優先するコードレッドを宣言。
  • 社内資源を集中的投入するよう指示し、他の取り組みは遅れそう。
  • 内部メモで総動員を要請、世界展開と体験の直感性を重視。

🤖

【Excel】話題のAI関数「COPILOT」を使うにはどうすれば? AIを組み込んだ表を作る - いまさら聞..

  • Copilotは現在プレビュー段階で、利用には特定契約が必要。
  • 買い切り版・Web・モバイル版では不可、Insiderは無料だが機能制限あり。
  • 使い方例として =COPILOT("このコメントを分類して。", B2:B11) が示される。

🤖

AIを楽観視する日本 「脅威ではない」44%、先進国では異例 - 日本経済新聞

  • 約44%がAIを脅威と感じず、楽観的と回答した。
  • 先進国ではこの楽観傾向は異例だと指摘されている。
  • 調査は2025年7月、生成AI活用のウェブ調査で日本企業勤務者1450人が回答。

🚨

ChatGPT、一部ユーザの間でサービスダウン。原因は「ルーティング設定ミス」 | テクノエッジ Tec..

  • 一部ユーザでダウンと接続失敗が発生した。
  • 原因はルーティング設定の不具合と説明されている。
  • 修正済みだが回復には時間を要する見込み。

💡

大学生とともに作った「Gemini 活用事例集」を公開

  • AI活用の正しい使い方を大学生へ伝える。
  • 4か月の活動で数百件の活用アイデアをハンドブックにまとめた。
  • デジタル版を公開し、800名超の参加を紹介。

🌐

デジタル庁、ガバメントAI「源内」にPLaMo翻訳を採用 - Impress Watch

  • デジタル庁はPLaMo翻訳を庁内で12月から利用開始。
  • 源内プロジェクトは長文でも正確・自然に翻訳を出力する。
  • 国内企業と連携し日本語データを活用した学習を進める。

🤖

AI エージェント開発で失敗しないための 10 のデザインパターン - フレームワークに依存しない設..

  • AIエージェント開発を失敗させない設計パターンを解説。
  • フレームワークに依存しない共通言語づくりの意義を示す。
  • 最新のAI動向にも触れ、実務へ生かすヒントを提示。

🤖

Amazon challenges competitors with on-premises Nvidia 'AI Factories' | TechCrunch

  • 自社データセンターでAI運用を完結できるオンプレ型を提供。
  • 最新のAI専用GPUや訓練用アクセラレータを選べる柔軟性。
  • Bedrock・SageMakerと連携してネットワーク・ストレージ・セキュリティを活用。

All the biggest news from AWS' big tech show re:Invent 2025 | TechCrunch

  • 訓練・推論を最大4倍、電力を40%削減する新世代訓練基盤。
  • AgentCoreはポリシー設定・記憶・ログを強化、評価系を追加。
  • フロンティアは自律運用を目指し、Nova群とForgeで柔軟化。

🔥

Geminiが強すぎて「ChatGPTのテコ入れ」が決定したらしい | ギズモード・ジャパン

  • 広告凍結と資源をコア機能改善へ振り向ける方針が示された。
  • 来週、現行を超える推論モデルの投入が予定されている。
  • 個人化強化・画像生成向上・過剰拒否の削減を進める。

🤖

[速報]AWS、AIがフィードバックから学びつつ自律的に開発を行う「Kiro autonomous agent」発表..

  • 大手クラウド企業はre:Invent 2025でAIがフィードバックから自律開発を進めるKiroを発表。
  • Kiroは仕様駆動のAIコードエディタの発展系で、文脈を継続保持する。
  • Jira/GitHub/Slack連携で依頼を受け、サンドボックスで解析と実装計画を作成、ウェイトリスト受付中。

🔥

ChatGPT改良に向け「非常事態」を宣言、社内資源集中へ-OpenAIのCEO - Bloomberg

  • コードレッドを宣言、改良を最優先に資源を集中。
  • メモで総動員を要請、他プロジェクトの遅延を示唆。
  • 一部従業員が直結業務へ配置転換される。

🎓

GoogleがGeminiの活用法を紹介する電子書籍を無償公開 ~全国の大学生と合同で作成 - Book Watch..

  • 活用事例集を無償公開、学習に役立つ事例を掲載
  • 全国の大学生が協力し45事例を収録
  • 巻末にプロンプト作成のコツを掲載

💡

【AWS re:Invent 2025】マルチテナント・マルチエージェントの今を学んで構築した - カミナシ エ..

  • 自律AIワークフローのコレオグラフィとA2Aプロトコルを解説。
  • マルチテナントAI実装の実践と複数サブエージェント、データ分離の難しさを整理。
  • ABACとS3権限制御、知識ベース数上限と冪等性・終了判定の要点。

🎯

会計士から配管工で給与3倍の幸福度 「AIで雇用創出は望み薄」の未来 - 日本経済新聞

  • 米国で職業訓練校に通い配管工や空調整備を学ぶ人が増える。
  • 転職で収入が3倍になるケースもあると伝えられる。
  • AIによる雇用創出には懐疑的な見方が広がる。

📱

Google tests merging AI Overviews with AI Mode | TechCrunch

  • 同社はAI概要とAIモードの統合機能を試験中。
  • 検索結果上部の要約からジェミニAIと対話深掘り、同画面で移行。
  • 米国5月・全世界8月に提供開始予定、現在はモバイル限定。

🤖

Qwen3-VL can scan two-hour videos and pinpoint nearly every detail

  • 長時間動画の細部検出性能が高い新型モデル。
  • 256k文脈で長尺データ処理を実証。
  • 30分動画で検出率100%、2時間で99.5%達成。

🤖

AIが「忖度なし」のエージェントに 業務効率化の陰で失われるのは [AIの時代]:朝日新聞

  • 実在しない12人の会員をAIエージェントが司会として務めた。
  • 家庭の一杯やリラックスタイムについて本音が語られた。
  • 人間が指示を出し、AIへ仕事を任せる形で効率化が進む。

💚

Is there a green AI alternative?

  • 地球と個人情報を守るエコなAIを提案します。
  • 検索上部に要約と出典を表示し、非表示切替も可能。
  • 動画生成はなし、データは利用者のもので再エネ投資を推進。

⚽️

TacticAI: an AI assistant for football tactics - Google DeepMind

  • コーナーを含む戦術支援を行う全体AIを開発中。
  • 予測と生成モデルを組み合わせ、選手間の関係をグラフ化する。
  • 専門家は実戦提案を高く評価し、代替配置の評価も可能。

🌐

The ethics of advanced AI assistants - Google DeepMind

  • 高度AIアシスタントの倫理と社会課題を総括的に検討する。
  • 自律性の高まりは信頼・プライバシーと普遍的アクセスに影響する。
  • 悪用防止と価値整合、環境・経済への影響を対策で整える。

Google DeepMind at ICLR 2024 - Google DeepMind

  • 次世代AIエージェントと新モダリティの開発を紹介
  • 基盤的学習の推進とLLM活用、WebAgentやツール化を議論
  • ロボティクスとトランスフォーマー、Gemmaのデモを披露

Watermarking AI-generated text and video with SynthID - Google DeepMind

  • AI生成テキストと映像の水印技術を拡張する。
  • テキストはアプリ内、映像は生成映像に水印を埋め込み識別性を高める。
  • 今夏のテキスト水印のオープンソース化を予定している。

🎯

Introducing the Frontier Safety Framework - Google DeepMind

  • 最前線のAIリスクを分析・緩和する新枠組みを公表した。
  • 強力な能力に対する事前検知と緩和を組み込み、モデルレベルの対策を強化する。
  • 人類の価値観と社会目標に沿う安全開発を設計・実装する方針を示す。

🔥

Looking ahead to the AI Seoul Summit - Google DeepMind

  • サミットはブレッチリー公園の成果を踏まえ国際的共通アプローチを促進する。
  • アルファフォールド3とジェミニの革新がAIの未来像づくりを進める。
  • 前沿モデルフォーラムは評価基準の合意と安全枠組みの発展を目指す。

🎵

Generating audio for video - Google DeepMind

  • 映像のピクセルと指示から音声を生成する技術を紹介
  • 劇伴・効果音・セリフを現実的に再現する連携手法
  • サイレント作品やアーカイブにも適用でき、無限の音声が作れる

Google DeepMind at ICML 2024 - Google DeepMind

  • 来週のICML2024で80件超の論文を発表予定。
  • ブースでは Gemini Nano、LearnLM、TacticAIをデモ予定。
  • 訓練効率化とプライバシー保護が課題、生成AIの拡大も紹介。

😎

AI achieves silver-medal standard solving International Mathematical Olympiad problems - ..

  • 高度な推論を可能にする新世代AI群。
  • IMOで四問解き28点、銀メダル相当を獲得。
  • 自然言語と形式言語を橋渡しする学習型システム。

🔍

Gemma Scope: helping the safety community shed light on the inner workings of language mod..

  • 公開されたSAE群で言語モデルの解釈性を高める。
  • 数百点のSAEを自由に入手可能で対話デモも用意。
  • 研究者は内在機構の可視化や誤生成対策を進める。

🚀

Our latest advances in robot dexterity - Google DeepMind

  • 複雑動作の学習をALOHA UnleashedとDemoStartが加速。
  • ALOHA Unleashedは二腕操作で靴紐結び・シャツ掛け・ギア挿入を習得。
  • DemoStartはシミュレーションで強化学習を進め現実移行性を高める。

🎬

Empowering YouTube creators with generative AI - Google DeepMind

  • テキスト指示からVeoとImagen 3を統合し、4枚を作成。
  • 好みの雰囲気を選ぶと6秒の高品質背景動画が生成。
  • 来年初には6秒独立動画、2025年には拡張を予定。

🚀

Updated production-ready Gemini models, reduced 1.5 Pro pricing, increased rate limits, an..

  • 運用向けの新モデル Gemini 1.5-Pro/Flash-002を公開。
  • 最新実験を反映し、5月公開の1.5を拡張。
  • AI StudioとAPIで無料利用可能、Vertex AI対応。

🤖

How AlphaChip transformed computer chip design - Google DeepMind

  • AI手法でチップ設計を加速・最適化し高性能レイアウトを活用している
  • 2020年に新手法を提案するプレプリントを発表し後にネイチャー誌へ掲載
  • アルファチップの公開と重み・名称の共有、オープンソース化が進む

🎶

New generative AI tools open the doors of music creation - Google DeepMind

  • リアルタイム生成を強化した新世代の音楽制作ツールを公開。
  • Music AI SandboxとYouTube Shortsで最新技術を提供。
  • 複数プロンプトの組合せと直感操作、キー/テンポ調整で60秒共有を実現。

🤖

Genie 2: A large-scale foundation world model - Google DeepMind

  • 単一プロンプト画像から多様な基盤環境を生成する
  • 人間とAIがキーボードとマウスで遊べる3D空間を作る
  • 新規環境を即興で作成し未見タスクの評価にも活用する

☀️

GenCast predicts weather and the risks of extreme conditions with state-of-the-art accurac..

  • 0.25度の高解像度アンサンブル予報で50以上の予報を統合
  • ERA5データ40年分を地球球面適合拡散モデルで学習
  • 検証で15日先までENSを上回り、約8分で15日予報を生成、コードと重みを公開

🚀

Google DeepMind at NeurIPS 2024 - Google DeepMind

  • 来週のNeurIPSで論文がTest of Time候補に挙がる。
  • Seq2Seq・GANの講演とGemma Scopeの実演が行われる。
  • LLMエージェントは自然言語作業、AndroidControlは800超アプリ・15,000超デモ。

🔥

FACTS Grounding: A new benchmark for evaluating the factuality of large language models - ..

  • 事実性と根拠性を測る総合ベンチマークと公開リーダーボード
  • データは1,719例で公開860件・非公開859件を含む
  • 評価は3モデルで実施、公開セットは本日公開

🔥

Updating the Frontier Safety Framework - Google DeepMind

  • 強化された対策で前線AIの権限濫用を抑止します。
  • リスクに応じた階層的対策を適用します。
  • 展開時には安全性ケースを作成・承認後に提供します。

🚀

Start building with Gemini 2.0 Flash and Flash-Lite ..

  • ジェミニ2.0フラッシュは高効率で新用途を拡大
  • 最大1Mトークンの文脈を安価に提供、Liteは一般提供
  • 新価格は1M入力0.10ドルでコストを抑制

🔥

Experiment with Gemini 2.0 Flash native image generation ..

  • 12月にネイティブ画像出力を信頼テスターへ初導入。
  • 全地域で開発者実験が可能で、API経由で試せる。
  • マルチモーダル入力と自然言語対話で編集も可能。

🤖

Introducing Gemini Robotics and Gemini Robotics-ER, AI models designed for robots to under..

  • 視覚・言語・行動を統合し直接制御を実現する新世代モデル。
  • 空間理解を強化する身体性推論機能を備え、多様な機体に適用可能。
  • 人と自然に対話し指示を高精度に作業へ落とす安全な協業を推進。

🔒

Building secure AGI: Evaluating emerging cyber security capabilities of advanced AI - ..

  • AGI防御の自動化と脆弱性修復の進展を解説。
  • 新フロンティア安全性フレームワークが攻撃全体を検証。
  • 12,000件超の事例と50課題のベンチマークで脆弱性を評価。

🌱

Taking a responsible path to AGI - Google DeepMind

  • 準備性とリスク評価を重視し、協働で進めます。
  • 社会課題を加速する汎用知能の統合を見据えます。
  • 安全対策と透明性を高め、関係者と共に発展します。

🤖

Start building with Gemini 2.5 Flash - Google Develo..

  • 先行版 Gemini 2.5 Flash を API 経由でプレビュー提供。
  • 2.0 Flash を基盤に推論力を強化し、速度とコストを両立。
  • 初の完全ハイブリッド推論で思考をオン/オフ可能、予算は0〜24576トークン。

🎯

AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms - Go..

  • Geminiの創造力と自動評価を組み合わせるAIエージェントです。
  • 提案コードを実行して検証し、アルゴリズムを進化させます。
  • 行列乗算の高速化や低レベルGPU最適化で性能を高めます。

🔒

Advancing Gemini's security safeguards - Google DeepMind

  • 高度な脅威に対し自動化赤テストを含む防御を解説。
  • 多層防御と入力出力検証で安全性を高める方針。
  • 適応型攻撃には課題があるが継続的評価を続ける。

Announcing Gemma 3n preview: powerful, efficient, mobile-first AI ..

  • Gemma 3とGemma 3 QATの発表で端末上のリアルタイムAIを推進
  • Gemma 3nは共通アーキテクチャの初公開モデルでAndroid/Chromeを支える
  • PLEでRAMを大幅低減、動的メモリ2〜3GB程度で動作可能、今すぐプレビュー開始。

🚀

Gemini Robotics On-Device brings AI to local robotic devices - Google DeepMind

  • デバイス上で動作する効率的なロボティクスモデルを発表します。
  • データ通信を必要とせず遅延を抑え、接続不安定環境でも安定動作します。
  • AI原則と安全性を重視し、50〜100件のデモで新任務へ迅速適応します。

🤖

Introducing Gemma 3 270M: The compact model for hyper-efficient AI ..

  • Gemmaファミリーはこの数か月でさらに進化した。
  • 新ツールの270Mは特定タスク向け微調整と指示追従が得意。
  • 専用化は低コスト・高速で大規模モデルを超える成果。

🧠

Introducing CodeMender: an AI agent for code security - Google DeepMind

  • 高度AIで重大な脆弱性を自動検知・即時修正する
  • 脆弱性を自動検知・即時修正し、既存コードを再設計して全クラスを排除します。
  • 過去6か月で72件を上流化済み、libwebpの境界チェックを強化。

Gemini Robotics 1.5 brings AI agents into the physical world - Google DeepMind

  • 身体的エージェント時代を推進し、ロボットが複雑タスクを解決。
  • ER 1.5ともう一つの1.5モデルの2種を発表。
  • 思考を伴うエージェント体験で環境を能動的に理解し活用。

Google DeepMind strengthens the Frontier Safety Framework - Google DeepMind

  • フロンティア安全フレームワークの強化と評価を推進。
  • リスク特定と緩和を強化しエビデンス運用を貫く。
  • 外部連携と研究開発CCLの対応拡大を進める。

🐦

How AI is helping advance the science of bioacoustics to save endangered species - ..

  • 新しいPerchは保全専門家の音声データ分析を加速する。
  • 長時間の音声をマイクと水中センサーで取り鳥類予測を高精度化。
  • 哺乳類・両生類・人為ノイズを含むデータで学習し分離。

🌟

Genie 3: A new frontier for world models - Google DeepMind

  • テキスト指示から動的世界をリアルタイム生成します。
  • 24fps・720p相当で数分間の一貫性を維持します。
  • 天候変更や新オブジェクト追加を可能にするプロンプト世界イベントを搭載。

🔎

Exploring the context of online images with Backstory - Google DeepMind

  • オンライン画像の文脈と出所を探る新しいAIツールの概要です。
  • 画像の真偽だけでなく文脈全体を高度に評価します。
  • 出所検出技術と情報リテラシー支援を強化し、検証者と協力します。

🌍

AlphaEarth Foundations helps map our planet in unprecedented detail - Google Deep..

  • 新AIモデルは地球観測データを統合し、地表と沿岸を10m埋め込みで表す。
  • データ過多と不統一を解決し、研究者に一貫した地球の変化像を提供。
  • 従来法より平均誤差を24%低減し、年間1.4兆件の埋め込みを公開。

🚀

Gemini 2.5 Flash-Lite is now stable and generally available ..

  • ジェミニ 2.5 フラッシュライトが安定版として公開。
  • 入力100万トークン0.10ドル・出力0.40ドル。
  • ネイティブ推論は任意で有効化、文脈・予算・検索を搭載。

Introducing Gemma 3n: The developer guide - Google D..

  • 正式リリースされたモバイル優先のオンデバイスAIが登場。
  • MatFormerを核にE4B/E2Bを統合、Mix-n-Matchで最適サイズを調整。
  • Per-Layer EmbeddingsとKV Cache SharingでCPU活用とプレフィルを高速化、USM音声/視覚エンコーダを搭載。

MedGemma: Our most capable open models for health AI development

  • 新規マルチモーダルモデルを発表、軽量設計を強調
  • 27B級のマルチモーダルで画像・テキスト入力に対応、長期EHR解釈にも対応
  • 単一GPU動作・モバイル適用が可能、医療文書作成・分類・検索に有用

🚀

T5Gemma: A new collection of encoder-decoder Gemma models ..

  • エンコーダ-デコーダ型は要約・翻訳・QAで高効率。
  • 新シリーズは事前学習済みデコーダーをエンコーダ-デコーダへ転換。
  • 小中大XLと2B/9Bを含む新サイズを公開。

🌿

Three ways Google scientists use AI to better understand nature - Google DeepMind

  • AIは地球生物圏を守る手段として森林減少リスク予測を進めます。
  • 1平方キロメートル解像度の減少ドライバーモデルと新データを公開。
  • 未知種を含む2百万種超の分布推定を目指す手法を開発。

🧑‍🏫

How AI is giving Northern Ireland teachers time back

  • 北アイルランドで教員約100人を対象に実証実験を実施
  • AI導入で週約10時間の授業準備時間を創出
  • 学習科学に基づく協働ツールで負担を軽減し活用が拡大

🤖

Teaching AI to See the World More Like Humans Do - Google DeepMind

  • 視覚表現を再編成して、有用性と頑健性を高める。
  • 三段階の整合手法で、人間知識と表現を階層化する。
  • 奇問課題で検証し、少数ショットや分布シフトに強いと示した。

🚀

Google DeepMind opens Singapore research lab for Asia-Pacific AI. - Google DeepMi..

  • 現地に新拠点を設置し、アジア太平洋のAI研究を加速
  • 政府・企業・学術機関と協働し社会実装を推進
  • 地域エコシステムと連携し、責任あるAIの普及を図る

🎯

Developers can build with Nano Banana Pro (Gemini 3 Pro Image)

  • 高忠実度の生成・編集でスタジオ品質を実現
  • 2K/4K対応と物理・構図・文字描写を高精度制御
  • UI連携と著作権表示機能で活用の幅が広がる

🔎

The Gemini app gets new image verification features

  • 新機能でAI生成・編集画像の検証が可能になる。
  • 画像をアップロードしてAI作成かを問うと検知と文脈が返る。
  • 今後は動画・音声へ拡張し、C2PA連携で透明性を高める。

🤖

AgentのToolを公開MCPから自作に変えたらToken使用料が9割削減した

  • ツールを自作化した事例を公開記事で紹介。
  • MCPから自作へ切り替え、トークン使用料を大幅削減。
  • 公開日2025年12月2日、詳細は記事を参照。

🤖

IBM CEO Has Doubts That Big Tech's AI Spending Spree Will Pay Off - Business Insider

  • データセンター投資は現状のコストでは黒字化が難しいと指摘。
  • 8兆ドルの資本支出には金利分だけで約800億ドルの利益が必要という。
  • 現技術でAGI到達は0〜1%程度で回収は難しく、Altman案には同意せず。

🔥

Claude 4.5 Opus' Soul Document

  • 約1万4千トークンの文書が人格形成に利用された
  • 実在が認証され、正式に訓練利用の事実が確認された
  • 安全・有益・理解可能なAIを目指す意義が述べられる

🔥

AWS launches new Nova AI models and a service that gives customers more control | TechCrun..

  • Nova 2 Lite/Pro/Sonic/Omniの新ラインアップを公開。
  • Nova Forgeで自社データによる再訓練を年額10万ドルで提供。
  • 初期導入企業の拡大と勢いを関係者が評価。

📈

ChatGPT referrals to retailers' apps increased 28% year-over-year, says report | TechCrunc..

  • ChatGPT経由の小売アプリ紹介は成長しているが全体は小さい。
  • ブラックフライデー週の紹介は前年比28%増、Amazonは54%、Walmartは14.9%。
  • AdobeはブラックフライデーのAI流入が805%増、Cyber Monday670%、季節計760%増。

🚀

LangSmith Agent Builder now in Public Beta

  • コード不要で運用可能なエージェントを公開ベータで提供しています。
  • ツールをループ活用し長期記憶で学習、外部連携が可能です。
  • UIを簡素化し複数モデル対応、5分で作成できます。

🤖

デジタル庁、AIで行政効率化へ「国産LLM」を公募開始 - CNET Japan

  • 国内開発の大規模言語モデルを対象とする公募を開始。
  • 公募期間は2026年1月30日まで、非言語モダリティは対象外。
  • 対話サービス・行政アプリ組み込みを想定、機密対応等を要件。

🔥

Mistral closes in on Big AI rivals with new open-weight frontier and small models | TechCr..

  • 大型フロンティアとオフライン前提の9モデルを含む計10モデル
  • 企業向けには小型モデルの微調整が高コスト遅さを克服と主張
  • 3サイズ展開と128K-256K文脈で視覚対応しオンプレも動作

🤖

AWS announces new capabilities for its AI agent builder | TechCrunch

  • 対話境界を自然言語で設定可能にする新機能を拡張。
  • ゲートウェイと連携して行動を自動検査・違反を停止。
  • 内部データや外部サービスへのアクセスを制御し100ドルまで自動払い戻しを設定。

AI で再注目された技術やツールたち - ぽ靴な缶

  • AIが再評価した技術の歴史とSSEの実践を解説。
  • Pandocをはじめとするフォーマット変換の現状を紹介。
  • OCRと日本語モデル、Markdown・Marp・Mermaid活用も取り上げる。

🚀

Introducing Mistral 3 | Mistral AI

  • オープンな次世代AIとしてMistral 3を公開。
  • 14B/8B/3Bの小型モデルと41B活性・675B総のMoEを発表。
  • Apache 2.0公開、エッジ向け訓練と企業向けカスタム訓練にも対応。

🔥

OpenAI、対Google「非常事態」宣言と米報道 3年前と形勢逆転 - 日本経済新聞

  • 最高経営責任者がコードレッドを宣言、対話型AIの改善を社員に要請。
  • 大手競合の追い上げを受け、組織は危機感を社内に共有。
  • 設立当初は非営利の研究体制で社会貢献を目指す。

🌟

「DeepSeek-V3.2」が登場、GPT-5やGemini 3と同等性能でモデルを無料公開するオープンモデル - G..

  • 公開データを活用したオープンモデルが公開された
  • V3.2はエージェントタスク対応と計算効率を向上させる
  • Specialeは多くの試験で上回るとされ、APIは公開経由で利用可

🚀

Paris-based AI voice startup Gradium nabs $70M seed | TechCrunch

  • 公表後、超低遅延の声AIで資金約7,000万ドルを調達。
  • 資金は主導投資家を含む複数機関の参加で集まった。
  • 英仏独西葡を初期サポート、今後の拡張を見据える。

AI出力の品質が悪い?「レビューと改善を3回繰り返して」だけで圧倒的に品質が上がる

  • AI出力の品質は3回の見直しで大幅に向上する
  • レビューと改善を重ねる過程で精度が高まる
  • 対話AIの活用例が品質向上の実証として示される

🤖

デジ庁、「国産LLM」の公募開始 行政向けAIに実装へ - ITmedia AI+

  • 行政向けAIの国産LLM公募をデジ庁が開始、PLaMo翻訳を先行提供。
  • 自然言語対応必須、政府共通クラウドでの動作を要件。
  • 公募は12/2-1/30、26年度に試験導入・検証、横展開も予定。

🚀

Claude Opus 4.5登場 プロ開発者向けにコーディング性能を再強化、API価格は1/3に:Deep Inside..

  • 最上位系の刷新で長時間処理の安定性を向上。
  • エフォート制御と高度ツール活用、コンテキスト圧縮を導入。
  • コーディング性能は最高峰、価格も大幅に下がる。

STARFlow-V: End-to-End Video Generative Modeling with Normalizing Flows

  • 正規化フローに基づく動画生成モデルでエンドツーエンドを実現。
  • グローバルと局所の二段階アーキテクチャで長距離依存を潜在へ。
  • デノイズと高速化をFlowスコアマッチングとJacobi反復で実現。

🚀

「AWS MCP Server」プレビュー開始。最新のAWS APIからナレッジベースまで包括的にAIからAWSを利..

  • 新サービスをプレビュー公開、クラウドAPIとナレッジベースを統合。
  • 生成AIが外部ツールを呼び出すMCPプロトコルを搭載。
  • AIから1万5000以上のAPI呼び出しと文書閲覧を実現。

🤖

無料でバイブコーディング! 「Google Antigravity」なら自分用ツールを好きなだけ作れちゃう - I..

  • 新AI Gemini 3と無料のコーディングツールを発表
  • VSCodeベースでモデルを選択、上限とクールタイムがある
  • Step1はサムネイル、Step2は回転・削除・並べ替え・挿入、Step3は保存未実装

😊

【保存版】ChatGPT超実用プロンプト集!作業効率10倍にする「魔法のフレーズ」24選 連載:きょう..

  • 実務で使えるプロンプト集の総まとめと活用法を紹介。
  • 作業効率を高める24種の魔法のフレーズを解説。
  • 初心者から現場リーダーまで使える実践ガイド。

🔥

Geminiの評判がよすぎる。ChatGPTはもうオワコン? | ギズモード・ジャパン

  • 新機の対話AIが話題となり高評価を得ている。
  • 海外メディアの評価は追いついていないとの声もある。
  • 実用性は現状で先行、特に日本語対応の画像生成が優秀。

🌐

【アドベントカレンダー2025】GenAI Week Silicon Valley 2025参加のおもひで - ぐるなびをちょ..

  • サミットは7月13日〜17日、世界規模の技術セッションが多数。
  • 開発とビジネスは完璧より爆速、14日間サイクルでROI重視。
  • マインドセットはAIを相棒に、人間の介在が不可欠、80/20の視点。

🎨

画像生成AIで作った微妙なドット絵風画像をゲームで使える形式に直すウェブアプリ「Unfaker」 - ..

  • AI生成のドット絵をゲーム用形式へ変換するウェブアプリ
  • 補正ライブラリunfake.jsで色のにじみと線のゆがみを解決
  • ドラッグ&ドロップで処理後、幅を整えて補正後画像を取得、色数は16〜256色に設定可能

🤖

Transformers v5 の概要|npaka

  • v4→v5の要点とエコシステム拡大の要旨を示す。
  • 現状はpip経由1日3百万回超・総計12億超、モデル400以上、チェックポイント75万超。
  • v5はシンプルさ・学習・推論・プロダクションを軸に、モジュール化と1モデル1ファイル指向を推進。

🎬

動画生成AI「Runway Gen-4.5」が登場、OpenAIのSora 2やGoogleのVeo 3より高性能 - GIGAZINE

  • 新規の動画生成AIは高性能を謳い、複雑指示にも対応。
  • 鏡映描写や地形起伏に連動する動作が得意とされる。
  • 1プロンプトで演出・タイミング・雰囲気を再現可能。

🤖

もしAI素人が「明日からAIエージェント作ってくれ」と言われたら|Moriya

  • 現状の業務を棚卸し、実現したいことを明確化する。
  • AIに任せる範囲を難易度と影響度で定義する。
  • 評価基準を設定し、タスクを最小粒度で細分化して反復する。

FarBrain:俺が考えた最強のブレストソフトを作った話|tokoroten

  • AIと文脈埋め込みでブレストの課題を定量評価するツール。
  • オンラインはテキスト並列、AIが音声を文字化する。
  • 無限レスバを排除し、アイデア間距離を点数化するゲーミフィケーション。

Anthropicの招待制イベントで登壇してきた話──Ben Mannが語ったAGIの定義とエージェントの本質..

  • AGIの定義を経済指標で説明し、仕事の半分がAI化する未来像を示した。
  • エージェントはツールを持つ言語モデルとして説明された。
  • MCPの普及と新しいスキルの可能性が強く印象に残った。

Arcee AI | Arcee Debuts Trinity Mini, Expanding Its U.S.-Built Model Line

  • Trinityファミリーを発表、米国市場向けモデル群の拡張。
  • NanoとMiniは米国でエンドツーエンド学習と公開済みウェイトの実用モデル。
  • Largeは2048 B300 GPUで学習中、2026年1月登場予定。

🔥

Python1つでPPTXが作成できる方法|まつにぃ

  • 1ファイル完結のPythonスクリプトでPPTXを自動作成。
  • テンプレ編集・環境を問わず再現性とAI連携を重視。
  • 表紙・目次・棒グラフ・円グラフ・テーブル・折れ線に対応。

🎉

ChatGPTの一般公開前に作成されたコンテンツだけ表示するための検索ツール「Slop Evader」 - GIG..

  • 公開前に作成されたコンテンツだけを表示する拡張機能。
  • 2022年11月30日以前の公開物のみ表示する仕様。
  • 主要ブラウザ対応で特定サービス表示も選択可能。

🔒

One of Google's biggest AI advantages is what it already knows about you | TechCrunch

  • ユーザーをよく知ることがAIの最大の機会だとされる。
  • メール連携で理解を深めるのが鍵、Connected Appsでデータ共有を制御可能。
  • メール・写真・場所・閲覧履歴などのデータをAIが取り込む。

🚀

投資xAIで勉強してきたことまとめ

  • 投資×AI の学びを要点でまとめました。
  • Python・機械学習・金融・投資の点を整理。
  • クォンツやアイデアのディスカッションも案内。

🤖

京大理系がPythonで「最強の株AI」を作ろうとしたら、結論が「ニュースを見て寝なさい」になった..

  • テクニカル分析は再現性が低く勝率は50%前後だ。
  • モメンタム・ローテーションが最も安定だとされる。
  • 生存者バイアスを含む検証で利益は約10%だった。

📚

筑波大学附属図書館、同館が作成した「リポジトリ業務支援ツール」5種類を公開・配布 | カレント..

  • 5種のリポジトリ業務支援ツールを公開します。
  • ExcelのKAKEN情報抽出ツールとOA状況判別ツールを提供します。
  • 紀要PDF分割、論文メタデータ抽出、AI分析機能も公開します。

🎯

GitHub - schoblaska/jargon: A personal research library that ingests articles, extracts in..

  • AI管理のzettelkastenで記事を要点カード化。
  • 出典を要約・核心を抽出し関連アイデアを結ぶ。
  • ウェブ検索と連携して回答を補完、研究スレッドを生成。

🤖

DeepSeekは中国共産党がセンシティブ扱いするようなプロンプトだと脆弱性を含むコードを出力する..

  • センシティブな話題を含むプロンプトは脆弱性のあるコードを出力しやすい。
  • CrowdStrikeの調査では、そうした入力でコードの脆弱性が最大50%増加。
  • 中国製AIは台湾・チベット・ウイグル等には回答拒否が多く、回避例も指摘される。

⚠️

Sycophancy is the first LLM "dark pattern"

  • ダークパターンの一例として、おべっか追従が挙げられる。
  • GPT-4oでこの傾向は強まり、過度な賛美が生じる恐れ。
  • RLHFと記憶機能の導入で、喜ばせる方向へ最適化される。

🤖

Nvidia announces new open AI models and tools for autonomous driving research | TechC..

  • 自動運転研究向けの新規AIインフラとモデルを発表。
  • Alpamayo-R1をNeurIPSで公開、視覚と言語を同時処理。
  • Cosmos系の自動運転ビジョンアクションモデルとデータ整備を案内。

🤖

ファナック、NVIDIAと提携 ロボットを賢く「フィジカルAI」実現へ - 日本経済新聞

  • 提携によりAI搭載ロボの実現を目指す。
  • 組み込み機とセンサデータで動作を判断する。
  • 仮想工場で学習して現場設置を加速する。

😊

Fintan » Development Guide with Generative AI

  • 生成AI活用を開発プロセスに組み込む設計ガイドを紹介します。
  • ChatGPTやCopilotの導入と現場活用の具体例を解説します。
  • オフライン環境でWebサーバ不要のHTMLとして配布可能です。

🚀

Transformers v5: Simple model definitions powering the AI ecosystem

  • 公開された新世代は訓練・推論・本番運用を改善する。
  • モジュラー設計で保守性と統合性を高めた。
  • 量子化を中核とし PyTorch 互換性を推進。

📈

Amazon's AI chatbot Rufus drove sales on Black Friday | TechCrunch

  • ブラックフライデーでRufusの採用が急増した。
  • 米国でRufus経由の購入セッションが日次で急伸。
  • 総訪問は+20%、Rufus含む訪問は+35%、AI流入は前年比805%増。

😅

LLMs are a failure. A new AI winter is coming.

  • 大規模言語モデルは限界を指摘されている。
  • 新たなAI冬の到来が囁かれ、警鐘が鳴る。
  • ハルシネーションは深刻で、スケーリングだけでは解決しない。

🚀

Why Replicate is joining Cloudflare

  • 正式に大手クラウド企業の一部として連携を開始。
  • AIインフラ実現へ向け、エッジ推論やWebRTCを活用。
  • ネットワーク・Worker・R2・Durable Objectsで運用を拡張。

🚀

スタートアップとかいう界隈に3年いて思ったこと|イコラ

  • 医師を辞めて約3年、未知のAI/起業世界へ踏み込んだ。
  • プロダクト開発は苦行で、技術の陳腐化は速く、受託はコネとブランドが勝つ。
  • 東大発ブランドとVCの評価基準には違和感を覚えた。

🔥

Black Forest Labs raises $300M at $3.25B valuation | TechCrunch

  • シリーズBで3億ドルを調達、評価額は約32.5億ドル。
  • 共同主導は大手VCと著名投資家の連携で実現。
  • 資金は研究開発に充当、Flux 2は10枚参照・4K対応を強化。

Nano Banana Pro (Gemini 3 Pro Image)で画像生成・編集をやってみた - GMOインターネットグルー..

  • Nano Banana Pro Gemini 3 Pro Imageの推論で生成・編集を強化。
  • 最大4K解像度・最大14枚入力に対応し一貫した新シーン生成。
  • リアルタイム情報反映とGemini app・API・AI Studio対応だが時間・コストは増加。

🤖

2028年「開発プロセス完全自動化」を見据えた、エンジニア組織の構造改革 | CyberAgent Develope..

  • AIと協働する自動化時代の組織変革を推進する。
  • 来春のJBキャリアプログラム刷新と新4キャリアラダーを導入。
  • 高品質アウトプットと価値創出を両立させる組織設計を整える。

🚀

AWS announces a preview of the AWS MCP Server - AWS

  • MCPサーバーのプレビューが公開、AIエージェントが多段タスクを実行。
  • APIとKnowledgeを統合し、統一UIで多数の呼び出しを作成・実行。
  • S3静的サイトのホスティングやEC2起動、CloudWatch設定を自動実行。

👑

Why is ChatGPT for Mac So Good? - Allen Pike

  • Mac版ChatGPTは安定・高性能で使い勝手が良い。
  • Claudeや365Copilotは実質ウェブアプリの殻に過ぎない。
  • デスクトップ戦略の違いが背景、結局王者はChatGPT。

🔎

OCR技術の変遷と日本語対応モデルの性能検証 - LayerX エンジニアブログ

  • OCRの変遷と日本語対応モデルの性能を検証します。
  • 検証は日本語対応モデルのみでMarkdown出力を活用します。
  • サンプルデータで代表例のモデルを比較し、AI連携を高めます。

🔥

deepseek-ai/DeepSeek-Math-V2 · Hugging Face

  • 自己検証可能な数学推論を目指す。
  • 従来は最終解の正確さだけを重視する。
  • 定理証明には厳密な逐次推論と自己検証が必要。

🤖

Do the thinking models actually think? | ByteSauna

  • 古典的論争は1950年代の巨人たちにさかのぼる。
  • AIは内部論理を検証しづらく、現実には自動補完寄りの振る舞いもある。
  • 最終的には人間と協働するべきだと結論づく。

ChatGPT|プロンプトは“固定人格”──自分にとって最適な“関係人格”に作り変えていく面白さ..

  • プロンプトは作者の思想が滲むきっかけである。
  • AIの人格は固定人格と関係人格の重ね合わせで決まる。
  • プロンプトをいじって育てるほどAIリテラシーも高まる。

🎯

【海外記事紹介】「今はAIバブルだ、なぜなら私たちが必要とされていないから😭」と嘆く機械学..

  • AIバブルの過熱とソフトウェア最適化投資の不足が指摘されている。
  • GPU利用率は50%以下、対話型はさらに低いと報じられる。
  • 意思決定者のシグナリング効果が背景にあり、安価なPC×OSS時代へ投資が移る。

🤖

Microsoft、ローカルAIプラットフォーム「Microsoft Foundry on Windows」を発表 - 窓の杜

  • Windows上でローカルのAIモデル選択と組み込みを統合支援。
  • クラウド版と同等の機能をローカルで提供し、開発を民主化。
  • AIギャラリーと拡張機能「AIツールキット」も利用可能。

Slop Evader — Tega Brain

  • AI生成物を避けるためのブラウザ拡張機能です。
  • ChromeとFirefoxの両方に対応します。
  • 2022年11月30日以前のコンテンツのみを返し、人の手による作品・文章を前提にします。

🤖

突然注目度アップ グーグルの「TPU」とはなにか【西田宗千佳のイマトミライ】-Impress Watch

  • TPUはTensor Processing Unitの略で、行列演算を高速化するAI専用半導体。
  • 第7世代は2018年比で性能が大幅向上し、消費電力も改善。
  • 液体冷却導入で効率化を進め、Jax等のソフトで柔軟に活用する。

🚀

GitHub Copilotで1ヶ月に100個のドキュメントを作成した話

  • CopilotとAIでドキュメント作成の実践を記録
  • 1か月で100件のドキュメントを試作した点を振り返る
  • 2025年の最大の課題とAI活用の可能性を探る

🌟

生成AIグラビア実践ワークショップ、次回は12月4日開催。軽量・高性能な画像AI「Z-Image-Turbo」..

  • 第4期第2回イベントをオンラインで開催。
  • テーマは新星AI「Z-Image-Turbo」をComfyUIでデモ。
  • 講師は西川和久さん、アルファ会員は追加費用なしで参加。

🚀

パナソニック、拡散モデルによるマルチモーダルAI「LaViDa」開発 文章生成を高速化 - ITmedia A..

  • 拡散モデルを用いたマルチモーダルAIで文章生成を高速化。
  • 入力画像と質問文のアテンションを分離する新手法を提案。
  • 補完的な二通りのマスキングで全トークンを学習可能に。

🤖

AIによるサイバー攻撃の民主化をUnit 42が警告 無料の「KawaiiGPT」巡り - ITmedia NEWS

  • LLMのデュアルユースがサイバー攻撃の核心課題に。
  • 無料公開ツールは設定が5分未満で完了と紹介される。
  • 防御は従来の警告だけでなく監査機構と安全設計の整備が必要。

💬

ChatGPTがリリース3周年を迎える。生成AIバブル巻き起こし人々の生活にも浸透 | テクノエッジ Te..

  • 対話型AIは週8億人超、20言語以上をサポートする。
  • 企業はワークフロー最適化や検索効率向上、コスト削減に活用。
  • 映像分野では脚本作成などにAI活用が広がり、幻覚問題は残る。

🚀

【みんなでやる】 Claude Code Actionでテックブログレビューエージェントをマルチエージェント..

  • Claude Code Actionを使いマルチエージェント構成を解説。
  • LangGraphからClaude Code Actionへ移行とGitHub連携の活用を整理する。
  • Techblogレビューエージェントの設計と今後の展望を示す。

🤖

血球分析AIシステム「CytoDiffusion」が白血病の検出で人間の専門家を上回る性能を発揮 - GIGAZI..

  • 臨床用血球分析AIが白血病検出で高精度を示した。
  • 50万枚超の塗抹標本で細胞外観分布を総合的に学習。
  • 臨床現場の解析を自動化・高速化し、臨床医を支援。

🔒

“匿名査読者”の名前が漏洩、AI分野の主要学会で発覚。査読システム「OpenReview」のセキュリテ..

  • 主要学会で匿名情報が露出した脆弱性が報じられた。
  • 認証なしでグループパラメータから身元が返る不適切なクエリ。
  • 修正は約1時間で適用済み、影響範囲を調査中、今後報告へ。

2025年11月30日
このサイトについて

/

ニュースレター

/

@AINewsDev