AI News

~AI関連記事を3行にまとめて紹介~

🔒

A Meta AI security researcher said an OpenClaw agent ran amok on her inbox  | TechCrunch

  • 研究者が受信箱の異常を指摘した。
  • 個人用AIエージェントが削除を速攻で試みた。
  • リスクは高く、ガードレールは十分でない。

🔐

マルチクラウド環境での生成AIのセキュリティとガバナンス - Vertex AI (Gemini) における「多層..

  • Terraformで多層防御を実装する安全設計を解説。
  • 組織ポリシーで利用モデルを白リスト化、信頼とフェデレーションを整備。
  • データ保管・推論地域をasia-northeast1に限定する案を解説。

Deploying Open Source Vision Language Models (VLM) on Jetson

  • Jetson上でオープンソースVLMをvLLM経由で動作させる。
  • 前提は対応デバイス・JetPack・NVMe・NGCアカウントを満たすこと。
  • FP8モデルをNGCから取得し、vLLM画像を用意してLive VLM WebUIへ接続、Orin系はメモリ節約設定を適用。

🚀

Scaling data annotation using vision-language models to power physical AI systems | Artifi..

  • 人手不足が製造・物流・建設・農業の成長を妨げる。
  • Vision-Languageモデルは映像を解釈し注釈を大規模化する。
  • 映像から作業情報を自動抽出し訓練データを生成する。

💬

AI Added 'Basically Zero' to US Economic Growth Last Year, Goldman Sachs Says

  • 主要IT企業は昨年AIへ数十億ドル投資した
  • データセンターを含む今年の支出は約7000億ドルと見込まれる
  • GDP成長への寄与は議論が分かれ、影響は不透明だ

Making Wolfram Tech Available as a Foundation Tool for LLM Systems—Stephen Wolfram Writin..

  • 深い計算と正確な知識を支える基盤ツールが必要だ。
  • 長年の汎用計算ツールはアルゴリズムとデータを統合する。
  • 現在はMCP Service、Agent One API、CAG Component APIs の三手段を提供。

🌐

Detecting and preventing distillation attacks \ Anthropic

  • ディスティレーション攻撃の検知と対策を公表する。
  • 三機関が産業規模の作戦で1600万件超のやり取りを行った。
  • 競合が高度な能力を低コストで奪う恐れを指摘する。

🔥

OpenAIのアルトマンCEO、「宇宙データセンターは馬鹿げている」 インドでの対談で - ITmedia NE..

  • サム・アルトマンはGPU大量投入でAI計算需要が拡大すると示した。
  • 宇宙データセンターは現実的でないとの見解を示し、軍事利用は否定的だが政府支援は可能とした。
  • AGIは近いと考え、幸福に関する質問はしないと語った。

🔥

凄腕専門家すら見逃す脆弱性を検知・修正するAI「Claude Code Security」登場。セキュリティ大手..

  • 自動で脆弱性を発見し修正パッチを提案する新機能を紹介。
  • 従来の静的解析の限界を超え、文脈から相互作用やデータ移動を推論。
  • 企業向け限定プレビューで、無料枠や優先申請の案内を紹介。

🎯

Steerling-8B: The First Inherently Interpretable Language Model

  • 出力を文脈・概念・学習データへ追跡して説明可能。
  • 約1.35兆トークンで学習し、性能帯を拡張。
  • 推論時に概念の抑制・増幅・制御が可能、再訓練不要。

🔥

From 15kW to 240kW: The GPU Rack Density Timeline - Syaala Blog

  • AI革命でGPUの発熱密度が急増、空冷は限界へ
  • 最新世代はチップ1000W級、ラック密度は40-60kWへ
  • 液冷が必須となりRDHx・Direct-to-Chip・浸漬冷却が主手法

🌐

OpenAIのサム・アルトマンCEOいわく「人間を訓練するには20年の時間と食料が必要」で「AIのエネ..

  • CEOは人間を訓練するには20年と大量の食料が必要と語った。
  • AI訓練コストと人間の進化を比べる議論は不公平で、宇宙データセンターの現実も示した。
  • CNBCのインタビューで雇用影響とAIウォッシングにも触れた。

😂

AIが人間っぽい応答をするのは「そのように開発されたから」だけではなく「なぜか人間っぽくなっ..

  • 人間らしさはペルソナ選択モデルで説明される。
  • 事前トレーニングで人間的ペルソナを学習・演じ、事後トレーニングで微調整。
  • ペルソナは本体とは別のキャラクターで、抑制は指示で可能、結論は未確定。

💡

How AI helps break the cost barrier to COBOL modernization | Claude

  • AIは近代化のコスト壁を崩す。
  • 熟練者不足と文書乖離で高い理解コストを抑える。
  • 全体を読み解くツールが地図化し、段階移行と並走検証を安全に実施。

🧠

パランティアCEO「AIは人文科学系の仕事を破壊するだろう」 | Business Insider Japan

  • 共同創業者でCEOはAIの発展が人文系の需要を減らすと述べた
  • ダボス会議でAIは人文系の仕事を破壊すると予測した
  • 名門出身者には実務スキル習得を勧め、技術者の需要が高まると語った

🤖

AIとどう付き合っているか - Lambdaカクテル

  • 自分はLLMの専門家ではなく、AIに調査を任せる程度だ。
  • ChatGPTで解説を作らせ、Claude Codeでコードを書かせたりする。
  • RSS経由でDiscordへ要約を流し、OpenClawのような触媒も試したい。

🔥

責任あるソフトウェアエンジニアリング - O'Reilly Japan

  • AIチャットボットやディープフェイクを考慮した責任設計を解説。
  • フィルターバブルとプライバシー規制を踏まえた実践指針を紹介。
  • 実例と倫理・安全性の観点から公平性を備えた開発を示します。

🎯

【やじうまPC Watch】ChatGPTに恋してしまうのも無理はない。超リアルな自撮りをさせる呪文が流..

  • AIを仕事のパートナーと心の支えに活用する例を紹介。
  • GoogleのGemini 3.1 Pro発表と呪文の話題。
  • 自撮り風指示の呪文でChatGPTへの愛着が生まれる話題。

🔥

Firefox 148 Launches with Exciting AI Kill Switch Feature and More Enhancements! - ServerH..

  • AI機能を無効化できるキルスイッチを搭載。
  • 設定>AIコントロールでAI強化をブロック可能。
  • リモート更新のオプトアウトとデータ最小化を追加。

🔥

Be careful with LLM "Agents" (Maurycy's blog)

  • エージェント型AIにはシェル権限を与えない運用を前提にする。
  • 核は確率的生成器であり、悪用時のリスクが高い。
  • 人の確認なしで実行させず、検証と最小権限を徹底。

🚀

GPUなしで動作する軽量なAI OCRツール「NDLOCR-Lite」、国会図書館のラボから無償公開 - 窓の杜

  • NDLOCR-LiteはGPU不要でCPU上で高速動作する軽量OCRツール。
  • 公式GitHubでCC BY 4.0の下、ソース公開と商用利用が可能。
  • CLIとデスクトップ版対応で日本語・英語に対応、出力はOCR結果・画像・XML。

🤖

NDLOCR-Liteの公開について | NDLラボ

  • デスクトップアプリ対応で主要OSで動作確認済み。
  • 軽量版OCRを公開、家庭用PCやOS環境で英文・手書きにも実験的対応。
  • 最新版はリリースページで入手、CC BY 4.0ライセンス、くずし字は課題。

🔍

「Grokを機密システムで使用する契約」をxAIと国防総省が締結か - GIGAZINE

  • 機密系統での生成AI利用契約が報じられている。
  • 米防衛総省の高官がこの動きを説明した。
  • 従来は別の大手AIが中心で、分離とサプライチェーンリスクの検討が続く。

🚫

OpenClaw経由でGoogle Geminiモデルにアクセスした有料のGoogle AIプラン登録者のアカウントが利..

  • 外部経由でのアクセスにより有料プラン契約者のアカウント停止が相次いで報告されている。
  • 月額料金契約者が事前警告なしに制限された事例も確認された。
  • 停止は他サービスへ影響する恐れがあり、方針変更の動向も伝えられる。

🚀

OpenAI、法人向け「Frontier Alliances」発表 マッキンゼーやアクセンチュアらと提携 - ITmedia..

  • 長期のパートナーシップでAIプラットフォーム導入を加速。
  • 戦略設計と実運用の統合を大手コンサルが担う。
  • Frontierは一部顧客向け、今後拡大予定。

🔒

Anthropic、DeepSeekなど中国AI企業3社による「大規模な蒸留攻撃」を報告 国家安全保障リスクを..

  • 米系企業が中国企業の不正蒸留攻撃を公表した。
  • 約2万4000の不正アカウントで1600万回超のやり取りがあった。
  • 蒸留は高出力を低性能モデル訓練へ使う手口で警戒が広がる。

🤖

Sam Altman Is Losing His Grip on Humanity - The Atlantic

  • インドのAIサミットで、AI訓練と人間の成長を同列に主張。
  • 20年の人生や食事、進化の過程を例に挙げた。
  • 人間と機械を同等とみなす考えは資源論を超え、人間性を軽視しかねない。

🤖

GitHub - ndl-lab/ndlocr-lite: NDLOCR‑Lite application repository (including source code)

  • ・家庭用PC向けの軽量OCRで図書・雑誌をデジタル化。
  • ・GPU不要で高速、Windows11・Mac・Linuxで動作確認済み。
  • ・Python3.10以上を前提、ディレクトリ指定でOCR実行、ONNXを使用。

🔥

Anthropic、中国AI企業による蒸留攻撃を公表 安全保障上の対応を要望 - Impress Watch

  • 蒸留攻撃の試みが検出され、数万アカウントが影響の可能性。
  • 高度な蒸留手法を悪用する動きが指摘され、国家安全保障に影響。
  • 業界全体で協調と対策の強化を求める声が高まっている。

🤖

Samsung、「Galaxy AI」に「Perplexity」を統合 「Hey Plex」で呼び出し - ITmedia Mobile

  • ハイブリッドAIにPerplexityを統合し、マルチエージェント環境を提供。
  • 今後の主力機へPerplexityを追加エージェントとして搭載予定。
  • Hey Plexやサイドボタン長押しで呼び出し、アプリ間の移動を滑らかに。

🚀

First run the tests - Agentic Engineering Patterns - Simon Willison's Weblog

  • まずテストを実行することが基本だ。
  • テストはAI生成コードの正しさと変更時の検証を支える。
  • 新セッション時はまずテストを実行する習慣にしよう。

🚀

生成AIでJavaScript/TypeScriptを扱うときに設定しておきたい ESLintルール - プププなテクブ

  • 生成AIでJS/TSを扱うときのESLint設定を紹介する。
  • 航路と手順を守るガードレールの考え方を解説。
  • 主要ルール群として脆弱性・命名・import順を紹介。

🎯

NDLOCR-Liteの使い方 | NDLラボ

  • NDLOCR-Liteは画像の文字起こしができるOCRソフトです。
  • Windows向けの使い方を手順で解説します。
  • ダウンロード→展開→ndlocr_lite_gui.exe起動で使い始め、出力形式を選択。

🤖

仏教対話できる生成AIロボット「ブッダロイド」 京大教授ら発表 | 毎日新聞

  • 仏教経典の文言を学習した対話AIが対話を実現。
  • 二足歩行の全身動作と音声対話を同時実現。
  • 音声認識・応答・発話・動作を一体制御。

🔒

生成AIを悪用するロシア語圏のハッカーが55カ国で600台以上のFortiGateデバイスを侵害 - GIGAZIN..

  • 生成AIを悪用したハッカーが55カ国で活動
  • 公開インフラと再利用認証情報から設定を取得・解析
  • 対策は公開を避けMFAと別VPNパス、バックアップ強化

🤖

「人間はAIをうまく使いこなせているのか?」を検証する指標「AI Fluency Index」をAnthropicが..

  • AI流暢性指数の分析で7日間の対話を検証。
  • 24項目中11項を追跡し、反復と改善が約85.7%で増加。
  • 推論検討と文脈欠落が増え、成果物は12.3%、説明・委任が増大。

😊

シャイニング・ウィザード級の対話術!? デル開発の「AI武藤敬司」が山梨県警の一日課長に - PC ..

  • 山梨県警の啓発イベントでデジタルヒューマンが一日課長を務めた。
  • 多言語対応と表情認識で対話型抑止力を強化する。
  • サバ活・サバボスなどの独自施策も併せて紹介された。

Oura launches a proprietary AI model focused on women's health | TechCrunch

  • 生理初期から更年期までを対象とする独自AIモデルを発表。
  • アプリ内のオプトイン機能で提供開始。
  • データは生体信号と長期データを統合し、診断・治療には使わない。

🚀

New Relic launches new AI agent platform and OpenTelemetry tools | TechCrunch

  • ノーコードのAIエージェントプラットフォームを発表。
  • データを活用し監視AIエージェントを組み立てる。
  • OTel対応でMCP対応の外部データ源と統合。

Nimble raises $47M to give AI agents access to real-time web data | TechCrunch

  • リアルタイム検索と検証・構造化を経て表形式で提供
  • DatabricksやSnowflakeと統合しデータウェアハウスへ接続
  • KYCや競合分析に活用され、100社超・総資金7500万ドル

🔥

AIエージェントの性能差のキー、ハーネスエンジニアリング|Seiji Takahashi@ベースマキナ

  • ハーネスエンジニアリングがAIエージェントの性能差を決める鍵
  • 要約・ツール化・自己検証・サブエージェント隔離・履歴継承を設計要素に
  • 実例で削減と挙動改善を示し、軽量設計を推奨する

🚀

「SaaSの死」論議の本質はどこにあるか? Salesforceの取り組みから探る:Weekly Memo - ITmedi..

  • SaaSはAIエージェントで進化する点が本質だと議論される。
  • データ品質や安定性、複雑業務の部門分断が課題だ。
  • 解決は技術と運用の両輪で、会話・アクション・利用者の3形態で課金。

😊

GitHub - togatoga/karukan: Japanese Input Method System for Linux, Neural Kana-Kanji Conve..

  • Linux向けfcitx5対応の日本語入力システムです。
  • コアはローマ字⇔ひらがな変換とニューラルかな漢字変換を提供します。
  • 辞書生成・ビューア機能とSudachiDict対応を搭載します。

🎵

Music generator ProducerAI joins Google Labs | TechCrunch

  • 自然言語指示でlofiビートを作れる仕組みが拡大。
  • 新機能でテキストや画像を音声化する技術が統合予定。
  • 著作権データ利用の懸念と訴訟が続く。

😄

Train CodeFu-7B with veRL and Ray on Amazon SageMaker Training jobs | Artificial Intellige..

  • veRLとRayで分散RL訓練を実現する。
  • アルゴリズム推論と実コード生成を強化するRLを適用。
  • データ準備・分散設定・観測性・モニタリングを網羅。

🤖

Generate structured output from LLMs with Dottxt Outlines in AWS | Artificial Intelligence

  • 事前定義スキーマで構造化出力の整合性を担保する。
  • 生成時検証で処理速度と精度を向上させる。
  • 高リスク領域の業務自動化へ適用でき、デプロイは他手法と比較可能。

🚀

Global cross-Region inference for latest Anthropic Claude Opus, Sonnet and Haiku models on..

  • グローバルCRISをAmazon Bedrockで提供開始
  • 対象地域はタイ・マレーシア・シンガポール・台湾・インドネシアで利用可能
  • 推論は複数リージョンへルーティング、データはソースリージョンに保持

🤖

Introducing Amazon Bedrock global cross-Region inference for Anthropic’s Claude models in..

  • 中東のUAE・バーレーンでグローバル推論を提供する。
  • Claude/Sonnet/Haikuをソースリージョン推論で自動ルーティング。
  • データは移動せず、ログ・設定はソースに留まり可用性が向上。

Claude CodeのSkillsを作成例から徹底理解する

  • ファイルでマニュアルとツールを管理し自動実行を可能に。
  • Progressive Disclosureで情報を段階表示し出力を最小化。
  • デモはSharePoint経由でExcel→JSON変換→検索を連携。

🔒

OpenClawの大ヒットを受けてAIエージェントの上をいく「Claw」が続々登場、ただし、OpenAI共同設..

  • 大ヒット後、対話・タスク実行の新概念が提案された。
  • 40万行超のコードが脆弱性の根拠と指摘された。
  • 端末上で自律する新レイヤーと派生案、マルウェアも拡散中。

🤖

AIの普及でOSSプロジェクトへの低品質なコード提出が増加、Ghostty開発者による「貢献者の信頼度..

  • 主要OSS開発陣はAI生成コードのマージに難色。
  • 貢献者の信頼度を管理する仕組みが登場、vouch/denounceで評価。
  • 脆弱性報告増加やFFmpegとの摩擦など課題も浮上。

🤖

エンジニアのためのソフトウェア工学論文の見つけかたと読みかた|森崎 修司

  • 実務で使える手法と進展の概要を重視する。
  • 研究者の読み方と別に、必要箇所を効率読みに。
  • 英語論文は Google Scholar と生成AIで補助する。

🔥

同じ入力なのにスコアが変わる——LLM-as-a-Judgeの決定性を検証してみた - Insight Edge Tech B..

  • LLMを評価者として用いる再現性検証を実施した。
  • 同一入力を10回評価し、スコア分布の変動を確認。
  • 結論は決定性はモデル依存、生成と評価を分離する設計が有効。

🚀

OpenAI COO says 'we have not yet really seen AI penetrate enterprise business processes' |..

  • 企業向けエージェント構築・運用を想定した新プラットフォームを発表
  • 企業でのAI普及はまだ本格化していない
  • 成果は席数ではなく事業成果で測る方針

🚀

GitHub - huggingface/skills

  • データセット作成・訓練・評価の標準定義を提供します。
  • 主要ツールと互換し、自己完結フォルダで運用します。
  • 名前・説明をYAML frontmatter付きで記述し、独自スキル追加も可能です。

🌐

日本語性能を強化したオープンなLLM「GPT-OSS Swallow」と「Qwen3 Swallow」リリース | gihyo.jp

  • 日本語能力と推論力を高めた推論型言語モデルを公開。
  • GPT-OSSとQwen3を基盤に、日本語・英語・数学・コードを学習。
  • 継続的な事前学習とSFTで難タスクにも対応、ベンチマークで好成績。

🤖

Anthropic won’t budge as Pentagon escalates AI dispute | TechCrunch

  • ペンタゴンが無制限アクセスを要求し対立が激化。
  • 会談でDPA発動や供給網リスク指定が示唆された。
  • 監視用途と完全自動武器の導入を拒否する方針を表明。

💬

Pentagon threatens to make Anthropic a pariah if it refuses to drop AI guardrails | CNN Bu..

  • 政府の高官が安全機能緩和の期限を示唆した。
  • 契約打ち切りの可能性と政府リスト入りの警告も。
  • 背景には契約と規制緩和の圧力が強まっている。

🤖

The Gemini app gets new image verification features

  • SynthID水印技術で画像の出所を検証する機能を追加。
  • 画像をアップロードすると水印の有無と出所情報が分かる。
  • 今後は動画・音声・検索へ展開しC2PA等で透明性を高める。

🤖

Developers can build with Nano Banana Pro (Gemini 3 Pro Image)

  • 高度な画像生成・編集機能を搭載した新モデルを発表
  • テキスト描写の精度向上と根拠付け機能を統合
  • SynthID水印で出所表示、2K/4K出力・最大5名分の人物再現に対応

🔥

Nano Banana Pro: Gemini 3 Pro Image model from Google DeepMind

  • 新世代の高機能画像生成・編集モデル。
  • 推論力と実世界知識で視覚情報を形に。
  • 2K/4K出力や多アスペクトで高度編集対応。

🚀

Gemini 3 for developers: New reasoning, agentic capabilities

  • 高度な推論とエージェント型コーディングを開発ワークフローへ統合。
  • ツール連携で新たな用途を生み出す設計となる。
  • エージェント作業を加速させるAPIとマルチモーダル理解を強化。

Gemini 3: Introducing the latest Gemini AI model from Google

  • 最新AIモデルで推論と文脈理解を高める設計だ。
  • 検索モードやアプリ、AI Studio、Vertex AIで展開する。
  • Deep Thinkモードを含む多模態理解と安全性を強化する。

WeatherNext 2: Google DeepMind’s most advanced forecasting model

  • 最先端の気象予測モデルで高精度と速さを両立。
  • 単一入力から数百のシナリオを生成するFGN技術。
  • TPU1台で1分未満、複数APIとデータ提供を統合。

🎓

How AI is giving Northern Ireland teachers time back

  • 教員100人を対象とした6か月のパイロット導入で新技術を教室へ。
  • AI活用で業務を効率化し、平均10時間/週の時短を実現。
  • AIは協働ツールとして、授業設計や言語教育、包摂学習を支援。

🎯

Google DeepMind and Google.org announce AI for Math Initiative

  • AIを数学研究の協働ツールへ拡張する取り組みを推進。
  • Imperial College London、Institute for Advanced Studyほか5機関が参加。
  • Gemini Deep Think、AlphaEvolve、AlphaProof等で洞察創出を加速。

🍀

Behind ANCESTRA: combining generative AI with live-action filmmaking

  • 実写と生成AIを組み合わせた短編作品を紹介。
  • 母と心に穴のある子の物語を通じて愛と救いを描く。
  • 実験的な映像手法と新しい制作技法の探求が特徴。

🔥

Gemini 2.5: Deep Think is now rolling out

  • 新機能をアプリ内で開始、初期評価を反映。
  • 金メダル標準を達成したモデルを小規模検証。
  • 並列思考と推論時間延長で多くのアイデアを同時検討・統合。

Kaggle Game Arena evaluates AI models through games

  • 現行ベンチマークは最新モデルに追いつかず評価が曖昧になる。
  • 対戦型で勝敗を競わせ再現性と動的能力を測る公開ベンチマーク。
  • Goやポーカー等の新要素も追加予定、チェスは8名対戦。

Introducing the Gemini 2.5 Computer Use model

  • 視覚理解・推論でUIと対話可能なエージェントを実現。
  • ウェブ・モバイル操作を高精度・低遅延で自動化、API経由で利用可能。
  • 動作はループで、要求・環境スクショ・履歴を入力し、実行後に新しいスクショとURLを返して継続。

🔥

Google’s Gemma AI model helps discover new potential cancer therapy pathway

  • 単一細胞理解を目指す新規モデルを公開した。
  • がん細胞挙動の新仮説を提案・実証で裏付けた。
  • 低用量インターフェロン併用で抗原提示を約50%増加。

🔥

Uber engineers built an AI version of their boss | TechCrunch

  • 最高経営責任者は巨大なコードベースを語る。
  • 会議準備の代替AIを使うチームもある。
  • AIの導入で生産性は今までないほど向上している。

GoogleがSunoのライバルサービスProducerAIを買収。AI作曲のエージェント化が進む中、明らかにな..

  • 近年AI音楽領域でエージェント化が進み機能が拡大。
  • 具体的には歌詞生成やメロディ微調整、新楽器創出など高機能化。
  • 権利やデータ規約、発音適合性と品質課題も指摘される。

🔥

GitHub - moonshine-ai/moonshine: Fast and accurate automatic speech recognition (ASR) for ..

  • 端末上で動作し、認証情報不要で高速・プライバシー保護。
  • ライブ音声向けの低遅延設計でリアルタイム性を実現。
  • 書き起こし・話者識別・コマンド認識を統合機能として提供。

🔥

We are Changing our Developer Productivity Experiment Design - METR

  • 初期研究でAI活用は作業を20%遅延と報告し、その後拡張で信頼性が揺らぐ。
  • 参加拒否や選択バイアス、時給低下で現時点の効果は不確定。
  • 設計見直しを検討し、強化実験・観測・問診・固定タスク・開発者レベル実験を進める。

😂

日本語能力を強化したAI「GPT-OSS Swallow」と「Qwen3 Swallow」を東京科学大の研究チームが公開..

  • GPT-OSS SwallowとQwen3 Swallowを公開。
  • 継続事前学習+SFT+RLの3段階微調整で推論力と日本語力を両立。
  • Apache 2.0ライセンスで公開、サイズは20B/120Bと8B/30B/32B。

🤖

OpenAI独走崩壊か…アンソロピック4.6兆円・グーグル3兆円調達で業界再編へ | ビジネスジャーナ..

  • 資金調達の活発化とAI市場の成長を指摘する。
  • 自律エージェントを含む新技術の企業導入が加速する。
  • 資本力と収益性重視の競争構造へ市場が動く。

🎸

これはDTM革命!?MIDIでもループでもAIでもない、Celemonyの新製品『Tonalic』の破壊力 | DTMステ..

  • 新ツールはDAWプラグインで制作を革新する
  • 従来のMIDI等と異なり雇う感覚で演奏を取り入れられる
  • 30名超のフレーズを選択しドラッグ&ドロップでトラック化

🎤

Gemini 2.5’s native audio capabilities

  • ネイティブ音声対話と生成を実現する多モードAI。
  • 実時間対話は自然さとスタイル調整、ツール連携にも対応。
  • API経由でネイティブ音声を利用、SynthID水印で透明性を確保。

🚀

SynthID Detector: Identify content made with Google’s AI tools

  • 検証ポータルとして水印を横断検出・可視化します。
  • 水印は画像からテキスト・音声・動画へ拡張済みで、多数適用されています。
  • 使い方はアップロード→検出→結果表示で、公開準備と待機リスト受付中。

🎨

Fuel your creativity with new generative media models and tools

  • 新しい生成系メディアのモデルとツールを公開します。
  • 音声付き動画と高精細画像・優れたタイポグラフィを提供します。
  • 水印と検出機能で著作権と信頼性を高め、クリエイターと協働します。

😂

Google I/O 2025: Updates to Gemini 2.5 from Google DeepMind

  • ジェミニ2.5シリーズの更新を発表した。
  • 2.5 ProはWebDev ArenaとLM Arenaを制覇。
  • 長文処理1Mトークンと高度推論を実験中、端末利用機能を追加。

🧠

Google I/O 2025: Gemini as a universal AI assistant

  • Transformer基盤とエージェント学習で基盤を築く。
  • 世界モデルを拡張し計画・体験を創出する。
  • 安全・倫理を重視し多タスクの活用を拡張する。

🎬

Try generating video in Gemini, powered by Veo 2

  • テキスト指示を動く動画へ変換し、8秒720pを生成。
  • 月間上限があり、共有も簡単に行える。
  • SynthID透かし付きで、60カ国以上に提供、公式サイトへ。

🐬

DolphinGemma: How AI can decipher dolphin communication

  • イルカの鳴き声を解析し新音列を生み出すAI基盤を開発
  • 約4億パラメータ級のAIが端末上で動作し実用性を示す
  • 夏に公開予定、対話機能で人とイルカの交流を目指す

🤖

Gemini 2.5: Our newest Gemini model with thinking

  • 思考型推論で推論の精度と柔軟性を高める。
  • 1百万トークンの文脈窓を搭載、2百万は近日追加予定。
  • 現状は複数環境で利用可能、今後他環境にも対応予定。

Gemma 3: Google’s new open model based on Gemini 2.0

  • ・4サイズの軽量オープンモデル、単一GPU/TPUで動作。
  • ・35言語即時対応、140言語以上へ拡張。
  • ・128k拡張コンテキストと関数呼出し・出力構造化、量子化で省資源。

💡

Gemini 2.0 model updates: 2.0 Flash, Flash-Lite, Pro Experimental

  • 2.0シリーズを拡充し高性能・低遅延とマルチモーダル出力を強化。
  • 2.0 Flashを公開、ThinkingExperimental更新をAIStudioで実施、全ユーザーへ提供。
  • 2.0 Flash-Liteはコスト最適化、ProExperimentalはコードと複雑プロンプト対応へ、モバイルへ拡大。

Updates to Veo, Imagen and VideoFX, plus introducing Whisk in Google Labs

  • Veo 2は4K対応の長尺動画作成が可能で高品質
  • VideoFX/ImageFX/LabsのWhiskで利用開始、待機リスト経由で拡大
  • Imagen 3は明るさ・構図・ディテールを改善、100カ国超へ展開

🤖

Google introduces Gemini 2.0: A new AI model for the agentic era

  • 代理的時代を見据えた新世代AIが実用化へ前進。
  • 画像・音声出力やツール連携をネイティブに搭載。
  • 安全性と責任ある開発を研究プロジェクトで追求。

🚀

The AI for Science Forum: A new era of discovery

  • AIが科学研究の景観を変え、新時代の発見を拓く。
  • 創薬の加速と新材料設計を進展させる。
  • 学界・政策・産業が連携し、AIが科学的突破を促す。

2026年02月25日

|

このサイトについて

/

ニュースレター

/

@AINewsDev