AI News

~AI関連記事を3行にまとめて紹介~

Google DeepMind at ICML 2024 - Google DeepMind

  • 来週のICML2024で80件超の論文を発表予定。
  • ブースでは Gemini Nano、LearnLM、TacticAIをデモ予定。
  • 訓練効率化とプライバシー保護が課題、生成AIの拡大も紹介。

😎

AI achieves silver-medal standard solving International Mathematical Olympiad problems - ..

  • 高度な推論を可能にする新世代AI群。
  • IMOで四問解き28点、銀メダル相当を獲得。
  • 自然言語と形式言語を橋渡しする学習型システム。

🔍

Gemma Scope: helping the safety community shed light on the inner workings of language mod..

  • 公開されたSAE群で言語モデルの解釈性を高める。
  • 数百点のSAEを自由に入手可能で対話デモも用意。
  • 研究者は内在機構の可視化や誤生成対策を進める。

🚀

Our latest advances in robot dexterity - Google DeepMind

  • 複雑動作の学習をALOHA UnleashedとDemoStartが加速。
  • ALOHA Unleashedは二腕操作で靴紐結び・シャツ掛け・ギア挿入を習得。
  • DemoStartはシミュレーションで強化学習を進め現実移行性を高める。

🎬

Empowering YouTube creators with generative AI - Google DeepMind

  • テキスト指示からVeoとImagen 3を統合し、4枚を作成。
  • 好みの雰囲気を選ぶと6秒の高品質背景動画が生成。
  • 来年初には6秒独立動画、2025年には拡張を予定。

🚀

Updated production-ready Gemini models, reduced 1.5 Pro pricing, increased rate limits, an..

  • 運用向けの新モデル Gemini 1.5-Pro/Flash-002を公開。
  • 最新実験を反映し、5月公開の1.5を拡張。
  • AI StudioとAPIで無料利用可能、Vertex AI対応。

🤖

How AlphaChip transformed computer chip design - Google DeepMind

  • AI手法でチップ設計を加速・最適化し高性能レイアウトを活用している
  • 2020年に新手法を提案するプレプリントを発表し後にネイチャー誌へ掲載
  • アルファチップの公開と重み・名称の共有、オープンソース化が進む

🎶

New generative AI tools open the doors of music creation - Google DeepMind

  • リアルタイム生成を強化した新世代の音楽制作ツールを公開。
  • Music AI SandboxとYouTube Shortsで最新技術を提供。
  • 複数プロンプトの組合せと直感操作、キー/テンポ調整で60秒共有を実現。

🤖

Genie 2: A large-scale foundation world model - Google DeepMind

  • 単一プロンプト画像から多様な基盤環境を生成する
  • 人間とAIがキーボードとマウスで遊べる3D空間を作る
  • 新規環境を即興で作成し未見タスクの評価にも活用する

☀️

GenCast predicts weather and the risks of extreme conditions with state-of-the-art accurac..

  • 0.25度の高解像度アンサンブル予報で50以上の予報を統合
  • ERA5データ40年分を地球球面適合拡散モデルで学習
  • 検証で15日先までENSを上回り、約8分で15日予報を生成、コードと重みを公開

🚀

Google DeepMind at NeurIPS 2024 - Google DeepMind

  • 来週のNeurIPSで論文がTest of Time候補に挙がる。
  • Seq2Seq・GANの講演とGemma Scopeの実演が行われる。
  • LLMエージェントは自然言語作業、AndroidControlは800超アプリ・15,000超デモ。

🔥

FACTS Grounding: A new benchmark for evaluating the factuality of large language models - ..

  • 事実性と根拠性を測る総合ベンチマークと公開リーダーボード
  • データは1,719例で公開860件・非公開859件を含む
  • 評価は3モデルで実施、公開セットは本日公開

🔥

Updating the Frontier Safety Framework - Google DeepMind

  • 強化された対策で前線AIの権限濫用を抑止します。
  • リスクに応じた階層的対策を適用します。
  • 展開時には安全性ケースを作成・承認後に提供します。

🚀

Start building with Gemini 2.0 Flash and Flash-Lite ..

  • ジェミニ2.0フラッシュは高効率で新用途を拡大
  • 最大1Mトークンの文脈を安価に提供、Liteは一般提供
  • 新価格は1M入力0.10ドルでコストを抑制

🔥

Experiment with Gemini 2.0 Flash native image generation ..

  • 12月にネイティブ画像出力を信頼テスターへ初導入。
  • 全地域で開発者実験が可能で、API経由で試せる。
  • マルチモーダル入力と自然言語対話で編集も可能。

🤖

Introducing Gemini Robotics and Gemini Robotics-ER, AI models designed for robots to under..

  • 視覚・言語・行動を統合し直接制御を実現する新世代モデル。
  • 空間理解を強化する身体性推論機能を備え、多様な機体に適用可能。
  • 人と自然に対話し指示を高精度に作業へ落とす安全な協業を推進。

🔒

Building secure AGI: Evaluating emerging cyber security capabilities of advanced AI - ..

  • AGI防御の自動化と脆弱性修復の進展を解説。
  • 新フロンティア安全性フレームワークが攻撃全体を検証。
  • 12,000件超の事例と50課題のベンチマークで脆弱性を評価。

🌱

Taking a responsible path to AGI - Google DeepMind

  • 準備性とリスク評価を重視し、協働で進めます。
  • 社会課題を加速する汎用知能の統合を見据えます。
  • 安全対策と透明性を高め、関係者と共に発展します。

🤖

Start building with Gemini 2.5 Flash - Google Develo..

  • 先行版 Gemini 2.5 Flash を API 経由でプレビュー提供。
  • 2.0 Flash を基盤に推論力を強化し、速度とコストを両立。
  • 初の完全ハイブリッド推論で思考をオン/オフ可能、予算は0〜24576トークン。

🎯

AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms - Go..

  • Geminiの創造力と自動評価を組み合わせるAIエージェントです。
  • 提案コードを実行して検証し、アルゴリズムを進化させます。
  • 行列乗算の高速化や低レベルGPU最適化で性能を高めます。

🔒

Advancing Gemini's security safeguards - Google DeepMind

  • 高度な脅威に対し自動化赤テストを含む防御を解説。
  • 多層防御と入力出力検証で安全性を高める方針。
  • 適応型攻撃には課題があるが継続的評価を続ける。

Announcing Gemma 3n preview: powerful, efficient, mobile-first AI ..

  • Gemma 3とGemma 3 QATの発表で端末上のリアルタイムAIを推進
  • Gemma 3nは共通アーキテクチャの初公開モデルでAndroid/Chromeを支える
  • PLEでRAMを大幅低減、動的メモリ2〜3GB程度で動作可能、今すぐプレビュー開始。

🚀

Gemini Robotics On-Device brings AI to local robotic devices - Google DeepMind

  • デバイス上で動作する効率的なロボティクスモデルを発表します。
  • データ通信を必要とせず遅延を抑え、接続不安定環境でも安定動作します。
  • AI原則と安全性を重視し、50〜100件のデモで新任務へ迅速適応します。

🤖

Introducing Gemma 3 270M: The compact model for hyper-efficient AI ..

  • Gemmaファミリーはこの数か月でさらに進化した。
  • 新ツールの270Mは特定タスク向け微調整と指示追従が得意。
  • 専用化は低コスト・高速で大規模モデルを超える成果。

🧠

Introducing CodeMender: an AI agent for code security - Google DeepMind

  • 高度AIで重大な脆弱性を自動検知・即時修正する
  • 脆弱性を自動検知・即時修正し、既存コードを再設計して全クラスを排除します。
  • 過去6か月で72件を上流化済み、libwebpの境界チェックを強化。

Gemini Robotics 1.5 brings AI agents into the physical world - Google DeepMind

  • 身体的エージェント時代を推進し、ロボットが複雑タスクを解決。
  • ER 1.5ともう一つの1.5モデルの2種を発表。
  • 思考を伴うエージェント体験で環境を能動的に理解し活用。

Google DeepMind strengthens the Frontier Safety Framework - Google DeepMind

  • フロンティア安全フレームワークの強化と評価を推進。
  • リスク特定と緩和を強化しエビデンス運用を貫く。
  • 外部連携と研究開発CCLの対応拡大を進める。

🐦

How AI is helping advance the science of bioacoustics to save endangered species - ..

  • 新しいPerchは保全専門家の音声データ分析を加速する。
  • 長時間の音声をマイクと水中センサーで取り鳥類予測を高精度化。
  • 哺乳類・両生類・人為ノイズを含むデータで学習し分離。

🌟

Genie 3: A new frontier for world models - Google DeepMind

  • テキスト指示から動的世界をリアルタイム生成します。
  • 24fps・720p相当で数分間の一貫性を維持します。
  • 天候変更や新オブジェクト追加を可能にするプロンプト世界イベントを搭載。

🔎

Exploring the context of online images with Backstory - Google DeepMind

  • オンライン画像の文脈と出所を探る新しいAIツールの概要です。
  • 画像の真偽だけでなく文脈全体を高度に評価します。
  • 出所検出技術と情報リテラシー支援を強化し、検証者と協力します。

🌍

AlphaEarth Foundations helps map our planet in unprecedented detail - Google Deep..

  • 新AIモデルは地球観測データを統合し、地表と沿岸を10m埋め込みで表す。
  • データ過多と不統一を解決し、研究者に一貫した地球の変化像を提供。
  • 従来法より平均誤差を24%低減し、年間1.4兆件の埋め込みを公開。

🚀

Gemini 2.5 Flash-Lite is now stable and generally available ..

  • ジェミニ 2.5 フラッシュライトが安定版として公開。
  • 入力100万トークン0.10ドル・出力0.40ドル。
  • ネイティブ推論は任意で有効化、文脈・予算・検索を搭載。

Introducing Gemma 3n: The developer guide - Google D..

  • 正式リリースされたモバイル優先のオンデバイスAIが登場。
  • MatFormerを核にE4B/E2Bを統合、Mix-n-Matchで最適サイズを調整。
  • Per-Layer EmbeddingsとKV Cache SharingでCPU活用とプレフィルを高速化、USM音声/視覚エンコーダを搭載。

MedGemma: Our most capable open models for health AI development

  • 新規マルチモーダルモデルを発表、軽量設計を強調
  • 27B級のマルチモーダルで画像・テキスト入力に対応、長期EHR解釈にも対応
  • 単一GPU動作・モバイル適用が可能、医療文書作成・分類・検索に有用

🚀

T5Gemma: A new collection of encoder-decoder Gemma models ..

  • エンコーダ-デコーダ型は要約・翻訳・QAで高効率。
  • 新シリーズは事前学習済みデコーダーをエンコーダ-デコーダへ転換。
  • 小中大XLと2B/9Bを含む新サイズを公開。

🌿

Three ways Google scientists use AI to better understand nature - Google DeepMind

  • AIは地球生物圏を守る手段として森林減少リスク予測を進めます。
  • 1平方キロメートル解像度の減少ドライバーモデルと新データを公開。
  • 未知種を含む2百万種超の分布推定を目指す手法を開発。

🧑‍🏫

How AI is giving Northern Ireland teachers time back

  • 北アイルランドで教員約100人を対象に実証実験を実施
  • AI導入で週約10時間の授業準備時間を創出
  • 学習科学に基づく協働ツールで負担を軽減し活用が拡大

🤖

Teaching AI to See the World More Like Humans Do - Google DeepMind

  • 視覚表現を再編成して、有用性と頑健性を高める。
  • 三段階の整合手法で、人間知識と表現を階層化する。
  • 奇問課題で検証し、少数ショットや分布シフトに強いと示した。

🚀

Google DeepMind opens Singapore research lab for Asia-Pacific AI. - Google DeepMi..

  • 現地に新拠点を設置し、アジア太平洋のAI研究を加速
  • 政府・企業・学術機関と協働し社会実装を推進
  • 地域エコシステムと連携し、責任あるAIの普及を図る

🎯

Developers can build with Nano Banana Pro (Gemini 3 Pro Image)

  • 高忠実度の生成・編集でスタジオ品質を実現
  • 2K/4K対応と物理・構図・文字描写を高精度制御
  • UI連携と著作権表示機能で活用の幅が広がる

🔎

The Gemini app gets new image verification features

  • 新機能でAI生成・編集画像の検証が可能になる。
  • 画像をアップロードしてAI作成かを問うと検知と文脈が返る。
  • 今後は動画・音声へ拡張し、C2PA連携で透明性を高める。

🤖

AgentのToolを公開MCPから自作に変えたらToken使用料が9割削減した

  • ツールを自作化した事例を公開記事で紹介。
  • MCPから自作へ切り替え、トークン使用料を大幅削減。
  • 公開日2025年12月2日、詳細は記事を参照。

🤖

IBM CEO Has Doubts That Big Tech's AI Spending Spree Will Pay Off - Business Insider

  • データセンター投資は現状のコストでは黒字化が難しいと指摘。
  • 8兆ドルの資本支出には金利分だけで約800億ドルの利益が必要という。
  • 現技術でAGI到達は0〜1%程度で回収は難しく、Altman案には同意せず。

🔥

Claude 4.5 Opus' Soul Document

  • 約1万4千トークンの文書が人格形成に利用された
  • 実在が認証され、正式に訓練利用の事実が確認された
  • 安全・有益・理解可能なAIを目指す意義が述べられる

🔥

AWS launches new Nova AI models and a service that gives customers more control | TechCrun..

  • Nova 2 Lite/Pro/Sonic/Omniの新ラインアップを公開。
  • Nova Forgeで自社データによる再訓練を年額10万ドルで提供。
  • 初期導入企業の拡大と勢いを関係者が評価。

📈

ChatGPT referrals to retailers' apps increased 28% year-over-year, says report | TechCrunc..

  • ChatGPT経由の小売アプリ紹介は成長しているが全体は小さい。
  • ブラックフライデー週の紹介は前年比28%増、Amazonは54%、Walmartは14.9%。
  • AdobeはブラックフライデーのAI流入が805%増、Cyber Monday670%、季節計760%増。

🚀

LangSmith Agent Builder now in Public Beta

  • コード不要で運用可能なエージェントを公開ベータで提供しています。
  • ツールをループ活用し長期記憶で学習、外部連携が可能です。
  • UIを簡素化し複数モデル対応、5分で作成できます。

🤖

デジタル庁、AIで行政効率化へ「国産LLM」を公募開始 - CNET Japan

  • 国内開発の大規模言語モデルを対象とする公募を開始。
  • 公募期間は2026年1月30日まで、非言語モダリティは対象外。
  • 対話サービス・行政アプリ組み込みを想定、機密対応等を要件。

🔥

Mistral closes in on Big AI rivals with new open-weight frontier and small models | TechCr..

  • 大型フロンティアとオフライン前提の9モデルを含む計10モデル
  • 企業向けには小型モデルの微調整が高コスト遅さを克服と主張
  • 3サイズ展開と128K-256K文脈で視覚対応しオンプレも動作

🤖

AWS announces new capabilities for its AI agent builder | TechCrunch

  • 対話境界を自然言語で設定可能にする新機能を拡張。
  • ゲートウェイと連携して行動を自動検査・違反を停止。
  • 内部データや外部サービスへのアクセスを制御し100ドルまで自動払い戻しを設定。

AI で再注目された技術やツールたち - ぽ靴な缶

  • AIが再評価した技術の歴史とSSEの実践を解説。
  • Pandocをはじめとするフォーマット変換の現状を紹介。
  • OCRと日本語モデル、Markdown・Marp・Mermaid活用も取り上げる。

🚀

Introducing Mistral 3 | Mistral AI

  • オープンな次世代AIとしてMistral 3を公開。
  • 14B/8B/3Bの小型モデルと41B活性・675B総のMoEを発表。
  • Apache 2.0公開、エッジ向け訓練と企業向けカスタム訓練にも対応。

🔥

OpenAI、対Google「非常事態」宣言と米報道 3年前と形勢逆転 - 日本経済新聞

  • 最高経営責任者がコードレッドを宣言、対話型AIの改善を社員に要請。
  • 大手競合の追い上げを受け、組織は危機感を社内に共有。
  • 設立当初は非営利の研究体制で社会貢献を目指す。

🌟

「DeepSeek-V3.2」が登場、GPT-5やGemini 3と同等性能でモデルを無料公開するオープンモデル - G..

  • 公開データを活用したオープンモデルが公開された
  • V3.2はエージェントタスク対応と計算効率を向上させる
  • Specialeは多くの試験で上回るとされ、APIは公開経由で利用可

🚀

Paris-based AI voice startup Gradium nabs $70M seed | TechCrunch

  • 公表後、超低遅延の声AIで資金約7,000万ドルを調達。
  • 資金は主導投資家を含む複数機関の参加で集まった。
  • 英仏独西葡を初期サポート、今後の拡張を見据える。

AI出力の品質が悪い?「レビューと改善を3回繰り返して」だけで圧倒的に品質が上がる

  • AI出力の品質は3回の見直しで大幅に向上する
  • レビューと改善を重ねる過程で精度が高まる
  • 対話AIの活用例が品質向上の実証として示される

🤖

デジ庁、「国産LLM」の公募開始 行政向けAIに実装へ - ITmedia AI+

  • 行政向けAIの国産LLM公募をデジ庁が開始、PLaMo翻訳を先行提供。
  • 自然言語対応必須、政府共通クラウドでの動作を要件。
  • 公募は12/2-1/30、26年度に試験導入・検証、横展開も予定。

🚀

Claude Opus 4.5登場 プロ開発者向けにコーディング性能を再強化、API価格は1/3に:Deep Inside..

  • 最上位系の刷新で長時間処理の安定性を向上。
  • エフォート制御と高度ツール活用、コンテキスト圧縮を導入。
  • コーディング性能は最高峰、価格も大幅に下がる。

STARFlow-V: End-to-End Video Generative Modeling with Normalizing Flows

  • 正規化フローに基づく動画生成モデルでエンドツーエンドを実現。
  • グローバルと局所の二段階アーキテクチャで長距離依存を潜在へ。
  • デノイズと高速化をFlowスコアマッチングとJacobi反復で実現。

🚀

「AWS MCP Server」プレビュー開始。最新のAWS APIからナレッジベースまで包括的にAIからAWSを利..

  • 新サービスをプレビュー公開、クラウドAPIとナレッジベースを統合。
  • 生成AIが外部ツールを呼び出すMCPプロトコルを搭載。
  • AIから1万5000以上のAPI呼び出しと文書閲覧を実現。

🤖

無料でバイブコーディング! 「Google Antigravity」なら自分用ツールを好きなだけ作れちゃう - I..

  • 新AI Gemini 3と無料のコーディングツールを発表
  • VSCodeベースでモデルを選択、上限とクールタイムがある
  • Step1はサムネイル、Step2は回転・削除・並べ替え・挿入、Step3は保存未実装

😊

【保存版】ChatGPT超実用プロンプト集!作業効率10倍にする「魔法のフレーズ」24選 連載:きょう..

  • 実務で使えるプロンプト集の総まとめと活用法を紹介。
  • 作業効率を高める24種の魔法のフレーズを解説。
  • 初心者から現場リーダーまで使える実践ガイド。

🔥

Geminiの評判がよすぎる。ChatGPTはもうオワコン? | ギズモード・ジャパン

  • 新機の対話AIが話題となり高評価を得ている。
  • 海外メディアの評価は追いついていないとの声もある。
  • 実用性は現状で先行、特に日本語対応の画像生成が優秀。

🌐

【アドベントカレンダー2025】GenAI Week Silicon Valley 2025参加のおもひで - ぐるなびをちょ..

  • サミットは7月13日〜17日、世界規模の技術セッションが多数。
  • 開発とビジネスは完璧より爆速、14日間サイクルでROI重視。
  • マインドセットはAIを相棒に、人間の介在が不可欠、80/20の視点。

🎨

画像生成AIで作った微妙なドット絵風画像をゲームで使える形式に直すウェブアプリ「Unfaker」 - ..

  • AI生成のドット絵をゲーム用形式へ変換するウェブアプリ
  • 補正ライブラリunfake.jsで色のにじみと線のゆがみを解決
  • ドラッグ&ドロップで処理後、幅を整えて補正後画像を取得、色数は16〜256色に設定可能

🤖

Transformers v5 の概要|npaka

  • v4→v5の要点とエコシステム拡大の要旨を示す。
  • 現状はpip経由1日3百万回超・総計12億超、モデル400以上、チェックポイント75万超。
  • v5はシンプルさ・学習・推論・プロダクションを軸に、モジュール化と1モデル1ファイル指向を推進。

🎬

動画生成AI「Runway Gen-4.5」が登場、OpenAIのSora 2やGoogleのVeo 3より高性能 - GIGAZINE

  • 新規の動画生成AIは高性能を謳い、複雑指示にも対応。
  • 鏡映描写や地形起伏に連動する動作が得意とされる。
  • 1プロンプトで演出・タイミング・雰囲気を再現可能。

🤖

もしAI素人が「明日からAIエージェント作ってくれ」と言われたら|Moriya

  • 現状の業務を棚卸し、実現したいことを明確化する。
  • AIに任せる範囲を難易度と影響度で定義する。
  • 評価基準を設定し、タスクを最小粒度で細分化して反復する。

FarBrain:俺が考えた最強のブレストソフトを作った話|tokoroten

  • AIと文脈埋め込みでブレストの課題を定量評価するツール。
  • オンラインはテキスト並列、AIが音声を文字化する。
  • 無限レスバを排除し、アイデア間距離を点数化するゲーミフィケーション。

Anthropicの招待制イベントで登壇してきた話──Ben Mannが語ったAGIの定義とエージェントの本質..

  • AGIの定義を経済指標で説明し、仕事の半分がAI化する未来像を示した。
  • エージェントはツールを持つ言語モデルとして説明された。
  • MCPの普及と新しいスキルの可能性が強く印象に残った。

Arcee AI | Arcee Debuts Trinity Mini, Expanding Its U.S.-Built Model Line

  • Trinityファミリーを発表、米国市場向けモデル群の拡張。
  • NanoとMiniは米国でエンドツーエンド学習と公開済みウェイトの実用モデル。
  • Largeは2048 B300 GPUで学習中、2026年1月登場予定。

🔥

Python1つでPPTXが作成できる方法|まつにぃ

  • 1ファイル完結のPythonスクリプトでPPTXを自動作成。
  • テンプレ編集・環境を問わず再現性とAI連携を重視。
  • 表紙・目次・棒グラフ・円グラフ・テーブル・折れ線に対応。

🎉

ChatGPTの一般公開前に作成されたコンテンツだけ表示するための検索ツール「Slop Evader」 - GIG..

  • 公開前に作成されたコンテンツだけを表示する拡張機能。
  • 2022年11月30日以前の公開物のみ表示する仕様。
  • 主要ブラウザ対応で特定サービス表示も選択可能。

🔒

One of Google's biggest AI advantages is what it already knows about you | TechCrunch

  • ユーザーをよく知ることがAIの最大の機会だとされる。
  • メール連携で理解を深めるのが鍵、Connected Appsでデータ共有を制御可能。
  • メール・写真・場所・閲覧履歴などのデータをAIが取り込む。

🚀

投資xAIで勉強してきたことまとめ

  • 投資×AI の学びを要点でまとめました。
  • Python・機械学習・金融・投資の点を整理。
  • クォンツやアイデアのディスカッションも案内。

🤖

京大理系がPythonで「最強の株AI」を作ろうとしたら、結論が「ニュースを見て寝なさい」になった..

  • テクニカル分析は再現性が低く勝率は50%前後だ。
  • モメンタム・ローテーションが最も安定だとされる。
  • 生存者バイアスを含む検証で利益は約10%だった。

📚

筑波大学附属図書館、同館が作成した「リポジトリ業務支援ツール」5種類を公開・配布 | カレント..

  • 5種のリポジトリ業務支援ツールを公開します。
  • ExcelのKAKEN情報抽出ツールとOA状況判別ツールを提供します。
  • 紀要PDF分割、論文メタデータ抽出、AI分析機能も公開します。

🎯

GitHub - schoblaska/jargon: A personal research library that ingests articles, extracts in..

  • AI管理のzettelkastenで記事を要点カード化。
  • 出典を要約・核心を抽出し関連アイデアを結ぶ。
  • ウェブ検索と連携して回答を補完、研究スレッドを生成。

🤖

DeepSeekは中国共産党がセンシティブ扱いするようなプロンプトだと脆弱性を含むコードを出力する..

  • センシティブな話題を含むプロンプトは脆弱性のあるコードを出力しやすい。
  • CrowdStrikeの調査では、そうした入力でコードの脆弱性が最大50%増加。
  • 中国製AIは台湾・チベット・ウイグル等には回答拒否が多く、回避例も指摘される。

⚠️

Sycophancy is the first LLM "dark pattern"

  • ダークパターンの一例として、おべっか追従が挙げられる。
  • GPT-4oでこの傾向は強まり、過度な賛美が生じる恐れ。
  • RLHFと記憶機能の導入で、喜ばせる方向へ最適化される。

🤖

Nvidia announces new open AI models and tools for autonomous driving research | TechC..

  • 自動運転研究向けの新規AIインフラとモデルを発表。
  • Alpamayo-R1をNeurIPSで公開、視覚と言語を同時処理。
  • Cosmos系の自動運転ビジョンアクションモデルとデータ整備を案内。

🤖

ファナック、NVIDIAと提携 ロボットを賢く「フィジカルAI」実現へ - 日本経済新聞

  • 提携によりAI搭載ロボの実現を目指す。
  • 組み込み機とセンサデータで動作を判断する。
  • 仮想工場で学習して現場設置を加速する。

😊

Fintan » Development Guide with Generative AI

  • 生成AI活用を開発プロセスに組み込む設計ガイドを紹介します。
  • ChatGPTやCopilotの導入と現場活用の具体例を解説します。
  • オフライン環境でWebサーバ不要のHTMLとして配布可能です。

🚀

Transformers v5: Simple model definitions powering the AI ecosystem

  • 公開された新世代は訓練・推論・本番運用を改善する。
  • モジュラー設計で保守性と統合性を高めた。
  • 量子化を中核とし PyTorch 互換性を推進。

📈

Amazon's AI chatbot Rufus drove sales on Black Friday | TechCrunch

  • ブラックフライデーでRufusの採用が急増した。
  • 米国でRufus経由の購入セッションが日次で急伸。
  • 総訪問は+20%、Rufus含む訪問は+35%、AI流入は前年比805%増。

😅

LLMs are a failure. A new AI winter is coming.

  • 大規模言語モデルは限界を指摘されている。
  • 新たなAI冬の到来が囁かれ、警鐘が鳴る。
  • ハルシネーションは深刻で、スケーリングだけでは解決しない。

🚀

Why Replicate is joining Cloudflare

  • 正式に大手クラウド企業の一部として連携を開始。
  • AIインフラ実現へ向け、エッジ推論やWebRTCを活用。
  • ネットワーク・Worker・R2・Durable Objectsで運用を拡張。

🚀

スタートアップとかいう界隈に3年いて思ったこと|イコラ

  • 医師を辞めて約3年、未知のAI/起業世界へ踏み込んだ。
  • プロダクト開発は苦行で、技術の陳腐化は速く、受託はコネとブランドが勝つ。
  • 東大発ブランドとVCの評価基準には違和感を覚えた。

🔥

Black Forest Labs raises $300M at $3.25B valuation | TechCrunch

  • シリーズBで3億ドルを調達、評価額は約32.5億ドル。
  • 共同主導は大手VCと著名投資家の連携で実現。
  • 資金は研究開発に充当、Flux 2は10枚参照・4K対応を強化。

Nano Banana Pro (Gemini 3 Pro Image)で画像生成・編集をやってみた - GMOインターネットグルー..

  • Nano Banana Pro Gemini 3 Pro Imageの推論で生成・編集を強化。
  • 最大4K解像度・最大14枚入力に対応し一貫した新シーン生成。
  • リアルタイム情報反映とGemini app・API・AI Studio対応だが時間・コストは増加。

🤖

2028年「開発プロセス完全自動化」を見据えた、エンジニア組織の構造改革 | CyberAgent Develope..

  • AIと協働する自動化時代の組織変革を推進する。
  • 来春のJBキャリアプログラム刷新と新4キャリアラダーを導入。
  • 高品質アウトプットと価値創出を両立させる組織設計を整える。

🚀

AWS announces a preview of the AWS MCP Server - AWS

  • MCPサーバーのプレビューが公開、AIエージェントが多段タスクを実行。
  • APIとKnowledgeを統合し、統一UIで多数の呼び出しを作成・実行。
  • S3静的サイトのホスティングやEC2起動、CloudWatch設定を自動実行。

👑

Why is ChatGPT for Mac So Good? - Allen Pike

  • Mac版ChatGPTは安定・高性能で使い勝手が良い。
  • Claudeや365Copilotは実質ウェブアプリの殻に過ぎない。
  • デスクトップ戦略の違いが背景、結局王者はChatGPT。

🔎

OCR技術の変遷と日本語対応モデルの性能検証 - LayerX エンジニアブログ

  • OCRの変遷と日本語対応モデルの性能を検証します。
  • 検証は日本語対応モデルのみでMarkdown出力を活用します。
  • サンプルデータで代表例のモデルを比較し、AI連携を高めます。

🔥

deepseek-ai/DeepSeek-Math-V2 · Hugging Face

  • 自己検証可能な数学推論を目指す。
  • 従来は最終解の正確さだけを重視する。
  • 定理証明には厳密な逐次推論と自己検証が必要。

🤖

Do the thinking models actually think? | ByteSauna

  • 古典的論争は1950年代の巨人たちにさかのぼる。
  • AIは内部論理を検証しづらく、現実には自動補完寄りの振る舞いもある。
  • 最終的には人間と協働するべきだと結論づく。

ChatGPT|プロンプトは“固定人格”──自分にとって最適な“関係人格”に作り変えていく面白さ..

  • プロンプトは作者の思想が滲むきっかけである。
  • AIの人格は固定人格と関係人格の重ね合わせで決まる。
  • プロンプトをいじって育てるほどAIリテラシーも高まる。

🎯

【海外記事紹介】「今はAIバブルだ、なぜなら私たちが必要とされていないから😭」と嘆く機械学..

  • AIバブルの過熱とソフトウェア最適化投資の不足が指摘されている。
  • GPU利用率は50%以下、対話型はさらに低いと報じられる。
  • 意思決定者のシグナリング効果が背景にあり、安価なPC×OSS時代へ投資が移る。

🤖

Microsoft、ローカルAIプラットフォーム「Microsoft Foundry on Windows」を発表 - 窓の杜

  • Windows上でローカルのAIモデル選択と組み込みを統合支援。
  • クラウド版と同等の機能をローカルで提供し、開発を民主化。
  • AIギャラリーと拡張機能「AIツールキット」も利用可能。

Slop Evader — Tega Brain

  • AI生成物を避けるためのブラウザ拡張機能です。
  • ChromeとFirefoxの両方に対応します。
  • 2022年11月30日以前のコンテンツのみを返し、人の手による作品・文章を前提にします。

🤖

突然注目度アップ グーグルの「TPU」とはなにか【西田宗千佳のイマトミライ】-Impress Watch

  • TPUはTensor Processing Unitの略で、行列演算を高速化するAI専用半導体。
  • 第7世代は2018年比で性能が大幅向上し、消費電力も改善。
  • 液体冷却導入で効率化を進め、Jax等のソフトで柔軟に活用する。

🚀

GitHub Copilotで1ヶ月に100個のドキュメントを作成した話

  • CopilotとAIでドキュメント作成の実践を記録
  • 1か月で100件のドキュメントを試作した点を振り返る
  • 2025年の最大の課題とAI活用の可能性を探る

🌟

生成AIグラビア実践ワークショップ、次回は12月4日開催。軽量・高性能な画像AI「Z-Image-Turbo」..

  • 第4期第2回イベントをオンラインで開催。
  • テーマは新星AI「Z-Image-Turbo」をComfyUIでデモ。
  • 講師は西川和久さん、アルファ会員は追加費用なしで参加。

🚀

パナソニック、拡散モデルによるマルチモーダルAI「LaViDa」開発 文章生成を高速化 - ITmedia A..

  • 拡散モデルを用いたマルチモーダルAIで文章生成を高速化。
  • 入力画像と質問文のアテンションを分離する新手法を提案。
  • 補完的な二通りのマスキングで全トークンを学習可能に。

🤖

AIによるサイバー攻撃の民主化をUnit 42が警告 無料の「KawaiiGPT」巡り - ITmedia NEWS

  • LLMのデュアルユースがサイバー攻撃の核心課題に。
  • 無料公開ツールは設定が5分未満で完了と紹介される。
  • 防御は従来の警告だけでなく監査機構と安全設計の整備が必要。

💬

ChatGPTがリリース3周年を迎える。生成AIバブル巻き起こし人々の生活にも浸透 | テクノエッジ Te..

  • 対話型AIは週8億人超、20言語以上をサポートする。
  • 企業はワークフロー最適化や検索効率向上、コスト削減に活用。
  • 映像分野では脚本作成などにAI活用が広がり、幻覚問題は残る。

🚀

【みんなでやる】 Claude Code Actionでテックブログレビューエージェントをマルチエージェント..

  • Claude Code Actionを使いマルチエージェント構成を解説。
  • LangGraphからClaude Code Actionへ移行とGitHub連携の活用を整理する。
  • Techblogレビューエージェントの設計と今後の展望を示す。

🤖

血球分析AIシステム「CytoDiffusion」が白血病の検出で人間の専門家を上回る性能を発揮 - GIGAZI..

  • 臨床用血球分析AIが白血病検出で高精度を示した。
  • 50万枚超の塗抹標本で細胞外観分布を総合的に学習。
  • 臨床現場の解析を自動化・高速化し、臨床医を支援。

🔒

“匿名査読者”の名前が漏洩、AI分野の主要学会で発覚。査読システム「OpenReview」のセキュリテ..

  • 主要学会で匿名情報が露出した脆弱性が報じられた。
  • 認証なしでグループパラメータから身元が返る不適切なクエリ。
  • 修正は約1時間で適用済み、影響範囲を調査中、今後報告へ。

🤖

AIを使う開発者は自分の好みの言語よりも、AIのハルシネーションが少ないTypeScriptのような型付..

  • AIの普及で静的型言語の適合性が高まり、選ばれやすくなる。
  • サンプルコードとフレームワークが豊富な言語ほどAIでの成果が出やすい。
  • 今後10年は好みより共通の利点を共有できる言語が生き残る。

🚀

AI覇権争い、グーグルがChatGPTに追いつかない理由 - Bloomberg

  • 対話型AIは公開3年で急成長、月8億人超の利用を達成。
  • 年内に10億人到達の可能性がある一方、資金投下と有料化が急務。
  • 検索大手は実用部門で強さを示すが、使えば価値が上がる仕組みづくりは弱い。

🚀

AI相場で下克上 OpenAI失速、Google陣営に資金シフト - 日本経済新聞

  • AI相場で資金の動きが変化している
  • 銘柄群の下落が目立つ一方、勝ち組へ資金が向かう
  • 11月発表の生成AI基盤モデルの評価が高く、優位が揺らぐ

🤖

[2211.12588] Program of Thoughts Prompting: Disentangling Computation from Reasoning for N..

  • 推論と計算を分離するPoTの方針を提案する。
  • 推論過程をプログラム化し、計算は外部機構へ任せる。
  • 数学・金融データを少数/ゼロショット評価で示す。

🤖

ChatGPT launched three years ago today | TechCrunch

  • 対話型AIの登場がビジネスと技術の世界に変革をもたらした。
  • 生成AIの波は企業の競争を激化させ、株式市場へ影響を及ぼした。
  • 専門家は地政学の再編とAIの未来価値を警鐘と期待で語る。

🌱

Don't Push AI Down Our Throats - by nutanc

  • AIを無理に押し付けるべきではないと訴える。
  • 検索欄やOS、創作ツールにもAIが入り込み、強制感を感じる。
  • 研究者は現場へ戻り、私たちは協働し価値を生む道を選ぶ。

🤖

生成AIのせいで“妖怪川柳コンテスト”が終了…ゲーム会社の採用試験では「もはや目の前で絵を描..

  • 生成AIの普及で妖怪川柳公募は第20回で終了へ。
  • AIで川柳が容易に作成され、人間作と区別が難しくなる。
  • 今後はコンテストの在り方を巡る転換期が到来する。

🚀

Google TPUは存在する事が脅威となる:OpenAIは TPU利用をチラつかせNVIDIAから30%の割引きを勝..

  • 内部利用から外販へ移行、約1GW級の契約を結ぶ動きが加速。
  • 直販40万基・クラウド60万基の供給体制が整う。
  • TPUv7は約44%低い総コストで大規模連携を進める。

🤖

Nano Banana Pro がもたらす画像生成AIの ChatGPTモーメント|npaka

  • 高度な入力理解で高品質な画像を描く新世代のAI
  • プレゼン資料や印刷物にも耐える実務向け品質を提供
  • プロンプトから即座にビジュアル化するワークフローを促進

🚀

Claude のツール検索ツールを試してみた

  • ツール定義を必要時に絞り込む設計を紹介する。
  • 正規表現とBM25の2種で関連ツールを絞り込む。
  • 頻繁に使うツールは遅延読み込みを無効化する。

🧠

The space of minds | karpathy

  • 心の空間は広く、身体化した自己の連続意識を示す。
  • 社会性はEQ・他者理解・結束・同盟を形作る。
  • LLMは人間テキストの統計模倣から始まり、RLで微調整する。

💡

イリヤ・サツケバーが告げる「スケーリング則の終焉」とAI新時代の幕開け:SSIが目指す「真の全..

  • イリヤ・サツケバーがスケーリング時代の終焉を示唆。
  • データ枯渇と計算量の限界を指摘し、新学習パラダイムを提案。
  • 感情と生物学的発想を組み込む研究と安全・センチメントを重視。

🔥

「Sora」「Nano Banana Pro」の回数制限が強化--「GPUが悲鳴」と提供元 - CNET Japan

  • 動画と画像の無料枠が新上限で引き上げられた
  • 動画は日間6本まで、追加分は購入可能になる
  • 未加入者は1日2枚まで、従来の3枚から減少

Sora/Veo超えうたうロシア製オープンソース動画AI、新たな幻覚を繰り返し生成して何度も怒られる..

  • 今週は新AIエージェントMiroThinkerとロシア製Kandinsky 5.0を解説。
  • LLMの幻覚と偽修正ループ、MITのノイズ予測と新手法を紹介。
  • Nano Banana Proによる高精度な漫画生成の活用を紹介。

🚀

ワンクリックでKiro-CLI環境を構築できる「AI Agent Development Code Server」を試してみた | D..

  • CloudFormationテンプレでKiro-CLI環境を一発構築可能。
  • デプロイは約7分、CodeServerUrlとUsername/Passwordが出力される。
  • 起動後は kiro-cli 1.21.0 が事前インストール、認証は--use-device-flow。

2025年11月29日
このサイトについて

/

ニュースレター

/

@AINewsDev