AI News

~AI関連記事を3行にまとめて紹介~

🚀

Google、無休で働くAIエージェント「Gemini Spark」発表 PCを閉じても動作(CNET Japan) - Yah..

  • クラウド上で常時動作するAIエージェントを発表
  • GmailやDocsと連携、PCを閉じてもバックグラウンドで作業を続行
  • 数週間で全ユーザーへ展開、macOSアプリも同日公開予定

📈

Google、無休で働くAIエージェント「Gemini Spark」発表 PCを閉じても動作 - CNET Japan

  • 24時間365日稼働のクラウド型AIエージェントを発表
  • Workspaceと連携し端末資源を使わず常時代行
  • ノートPCを閉じてもバックグラウンドで動作、ファイル送信も可能

🚀

Google、しゃべるだけで「整った文章」を生成する新機能 - CNET Japan

  • 音声を整った文章へと変える新機能が登場。
  • 夏の組み込みで、AI上位プランの加入者のみ利用可能。
  • メール系・クラウド系ツールやWeb情報を参照して出力を磨く。

Google検索が「AI検索」に──エージェント機能やマルチモーダル入力に対応 - ITmedia NEWS

  • 検索はキーワード中心からAI検索へ刷新、エージェント機能を搭載。
  • マルチモーダル入力対応の知的検索ボックスと質問支援が特徴。
  • 複雑な質問には自動シミュレーションUIでミニアプリを表示。

🤖

グーグル、Google I/O 2026で新たなAIモデル「Gemini Omni」を発表 - ケータイ Watch

  • I/O 2026で新AI「Gemini Omni」が発表された。
  • 高度な知能と生成技術を統合した世界モデルが特徴。
  • 動画編集や入力からの出力変更を直感的に行える。

🎬

Google、“動画版Nano Banana”こと「Gemini Omni」公開 会話で映像を生成・編集 - ITmedia NEW..

  • 自然言語指示で動画を作成・編集できる新機能を発表
  • 人物や物体のディテール変更・差し替えとカメラ角度調整が可能
  • 初期モデル公開と来歴付与・検証機能の案内

🔥

Your Evals Will Break and You Won't See It Coming - Lun Wang

  • 現状の評価は現モデル前提で動くが別種には通用しない。
  • 次の能力跳躍のボトルネックは訓練や設計ではなく評価そのものだ。
  • 秩序パラメータを探し転換指標を設け、評価自体を進化させろ。

🌟

ウェブを作る人のためのLLMO/AIO入門【2026年5月版】|ベイジの図書館

  • LLMO/AIO入門はタグと構造化データと一体で動く。
  • 日常的な広報・マーケ活動とセットで成立する。
  • 仕組み理解と信頼判定・SEOの違いを解説。

🎬

Googleの新AIモデル「Gemini Omni」が発表 ~まずはNano Bananaの動画版、自然言語で生成・編集..

  • 推論と創造を統合した新AIが高品質動画を生成
  • 自然言語で動画編集・参照物差替えが可能
  • 複数入力の統合と動き・スタイル転送にも対応、認証付き

🌍

現実世界を基に"動き回れる"仮想空間を生成 Googleの世界生成AI「Project Genie」にストリート..

  • 現実の場所を起点にした仮想空間を生成する新機能を発表
  • ストリートビュー連携で現実の地点を起点に仮想探索を可能に
  • 現在は一部地域で提供開始、今後拡大予定

🚀

GoogleがAI新機能「Spark」、検索や買い物を代行 30億人の生活自動化 - 日本経済新聞

  • 日常の検索や予約などをAIが代行する新機能を発表。
  • 企業向けのAIエージェント機能を個人利用にも広げると発表。
  • イベントで多様なエージェント機能を搭載した新サービスを示した。

🔥

グーグル、AIエージェント「Gemini Spark」発表 バックグラウンドで自律動作 - ケータイ Watch

  • 24時間体制でバックグラウンド処理を行う新AIエージェントを発表。
  • 専用VM上で動作し、端末に依存せずタスクを進行。
  • 既存サービスと統合し、将来は第三者連携を計画。

💬

'Ask YouTube' brings AI-powered conversational search to video, adds Gemini Omni to Shorts..

  • 動画検索にもAI会話機能が導入され、意図に沿った回答を作成する。
  • ショーツと長尺動画を組み合わせ、複雑な検索にも対応する。
  • ジェミニ・オムニを追加し、自然なストーリーテリングを支援する。

😊

Google DeepMind & Singapore: National AI partnership — Google DeepMind

  • ・シンガポールのAI未来を強化する国家連携を発表。
  • ・最先端AIを医療・教育・労働市場の未来創出へ活用。
  • ・公的部門の変革とAI人材育成を政府と連携して推進。

アニメやイラストに特化したローカル画像生成AI「Anima」 生成した画像は商用利用も可能(生成A..

  • アニメ・イラスト特化のローカルAI「Anima」を紹介。
  • 画風調整は@artist名で、出力は512×512〜1536×1536、ネイティブ対応。
  • 学習はアニメ画像と非アニメ画像の混在、ライセンスは非商用のみ、商用は自己責任。

🔥

Grok人気急降下。開店休業のデータセンターをAnthropicにリース | ギズモード・ジャパン

  • 人気が急落、月間ダウンロードも大幅減少
  • 有料利用は0.174%にとどまり、競合に水をあけられる
  • 大手企業がデータセンターを別社へリース

🚀

Learnings from 100K Lines of Rust with AI | Cheng Huang’s corner

  • AIとRustで合意エンジンを現代化した知見を共有。
  • 約3か月で約10万行を追加、23千→30万件/秒へ最適化。
  • パイプラインと非揮発性メモリは実装済、RDMAは未定。

😊

【西田宗千佳のRandomTracking】XREALの「Project Aura」実機体験。軽量ながら「空間コンピュー..

  • 実機体験で空間コンピューティングを軽量に実現。
  • 内蔵ユニットと分散処理で処理負荷を分散。
  • 約70度のFoVと没入感が印象的だった。

🔧

Prompts are technical debt too

  • プロンプトは新機能より保守負担を増やす。
  • 変更は既存コードと相互作用し理解を推測へ導く。
  • 過度なエージェントは避け、第三者のツールを活用。

🎨

Figma adds an AI assistant to its collaborative canvas | TechCrunch

  • 協働キャンバスにAIエージェントを搭載、自然言語指示で作成・編集を自動化。
  • 複数エージェントを同時運用でき、デザイン向けAIモデルを微調整。
  • 第一弾はデザイン用途、今後は他製品へ展開予定。

🤖

Google's AI is being manipulated. The search giant is quietly fighting back

  • AIチャットが公衆へ偽情報を拡散する手口を暴いた。
  • 私の実験でもGPTや大手AIが嘘を広める例を確認した。
  • 対策はスパム対策の見直しと信頼性表示の追加など進む兆しがある。

🎯

「生成AIでチラシ作ってる人が、今までデザイナーにぼったくられてたことがよくわかった」という..

  • 生成AIでチラシを作る動きがデザイナー評価を揺らす懸念を生む
  • その認識が業界単価の低下を招くのではと不安が広がる
  • 盗作やAIの本質、品質以外の価値の評価が問われている

Literary Hub » Nobel laureate Olga Tokarczuk apparently used AI to write her latest novel..

  • ノーベル賞作家が最新長編でAI活用を示唆した。
  • 出版社は調査以外にはAIを使っていないと否定した。
  • 登場人物が聴く歌をAIに尋ね、いくつかの曲名を得たと明かした。

🎵

Stability AI releases a new audio model that can create six-minute songs | TechCrunch

  • 4機種構成の新音声モデル群が公開された。
  • 小系は端末内最大2分、上位は6分超の楽曲を生成。
  • 中・大は6分20秒の楽曲を構造・旋律を保ち作成可能、API経由のホスティングは有料。

🚀

GoogleのModern Web Guidanceスキル登場。AIが古いCSS・JSを書く問題を解決する

  • モダンウェブガイダンスでAIエージェントは最新機能に対応する。
  • 従来の古い書き方を避け、サブグリッドと最新JSを活用。
  • 基準データに基づく代替提案とセキュリティ対策を提供する。

🤖

OpenAI、最大3年の「計算資源へのアクセス」を保証する新サービスを開始 - CNET Japan

  • 長期で計算資源を確保できる新サービスを発表。
  • 1〜3年契約と年間コミット額で割引が適用される。
  • 確保枠は製品群の支出額ベースで利用可能、需要の高まりを受け提供を継続。

🚀

Google、「Android Halo」発表――スマホ画面上部に常駐しAIエージェント稼働の進捗をリアルタイ..

  • スマホ上のAIエージェントを管理する新インタフェースを発表。
  • 画面上部に小さく常駐し、作業中・ライブモード・重要メッセージの進捗を表示。
  • Gemini Spark等と連携し、バックグラウンドの動作をリアルタイム把握可能。

😊

Build real-time voice applications with Amazon SageMaker AI and vLLM | Artificial Intellig..

  • 双方向ストリーミングでリアルタイム音声を文字起こしする実装を解説。
  • 4KB PCM16(16kHz・モノ)のチャンクをリアルタイム送受信し転写を即時取得。
  • ウェブソケットとエンドポイントを橋渡しし、追加のストリーミング基盤不要を示す。

📷

GitHub - bytedance/Lance: A 3B-active-parameter native unified multimodal model for image ..

  • 3Bパラメータの統合型マルチモーダルで画像・動画を扱う。
  • 理解・生成・編集を一枠組みで実現し高性能を示す。
  • 推論には40GB以上のVRAMが必要で設定はスクリプトで完了。

🤖

Could generative AI turn out to be the tech industry’s Vietnam? And could public backlash..

  • 生成系AIの普及が業界の構造を変える可能性を示す。
  • 公衆の反発は投資と実用性のギャップを露わにする。
  • 協力と規範整備でAIをより良い方向へ導く可能性がある。

🎧

[2605.17991] Stable Audio 3

  • 可変長の音声生成・編集を実現する高速潜在拡散モデル群を提供。
  • 数分規模の音声生成や短音のコスト削減が可能。
  • 敵対的後訓練で推論を加速・品質を向上させ、インペインティングで短録音の編集にも対応。

💡

Google検索が大幅刷新。AI補完で検索の新しい常識が到来 - PC Watch

  • 長文質問の意図を汲み取るAI補完で検索が進化
  • ファイル・画像添付検索とAntigravityのコーディング支援を拡張
  • 夏提供予定のエージェント機能と新規決済連携を発表

🎯

Multimodal evaluators: MLLM-as-a-judge for image-to-text tasks in Strands Evals | Artifici..

  • 新規の画像→テキスト評価器を追加し、多模態評価に対応。
  • 総合品質・正確性・忠実性・指示遵守の4指標で出力を評価。
  • 参照有無を選択、CIへ組み込み、視覚的幻像・事実誤り・指示逸脱を自動検出。

🔥

OpenAI barrels toward IPO that may happen in September | TechCrunch

  • CEOは9月の上場を目指す方針を示した。
  • 大手銀行と協力し、数日内に機密申請を規制当局へ出す見込み。
  • 大手宇宙企業が関連事業を取り込み、IPO申請公表が近いとの観測で、取材要請には回答せず。

🚀

What will better AI mean? | the singularity is nearer

  • スケール時代の終盤を経て、効率と嗜好の時代へ移る。
  • 検証領域ではバグ修正と規模拡大で解決、特別な裏技は不要。
  • 規制介入の動きは囲い込みを薄め、費用対効果の線形化を待つ。

🌟

PopuLoRA: Co-Evolving LLM Populations for Reasoning Self-⁠Play

  • 検証可能な報酬でLLMの推論を高度化する
  • 共進化集団を用い、教師が課題を作成・提案する
  • 置換と組換えで多様性を持たせ、難易度は対戦成績で決まる

🤖

OpenAI claims it solved an 80-year-old math problem — for real this time | TechCrunch

  • 新しい推論モデルが長年の幾何学未解決予想に挑んだ。
  • 補足見解と新解法が従来の格子解法を超えたとされる。
  • AIの推論力と学際的な連携が数学の発展を後押しする。

🚀

IrisGo, a startup backed by Andrew Ng, looks to become the AI desktop buddy you never knew..

  • デスクトップ向けの伴走アプリが日常作業を学習し自動化。
  • スキルライブラリでメール作成や請求処理をこなす。
  • コーディング支援機能もあり要約やレポート作成をこなす。

💸

xAI burned $6.4B last year — SpaceX’s IPO filing shows why the spending is far from over..

  • xAIは2025年売上32億ドルながら64億ドルの赤字を計上。
  • Grokを数兆パラメタ級へ拡大予定で追加投資が必須。
  • AI収益はソリューション/インフラ4.65億ドル、サブスク3.65億ドル、データライセンス等。

🎶

Stability AI、最大6分の音楽が生成できる「Stable Audio 3.0」発表。商用利用も可能 | テクノエ..

  • 最大6分の楽曲生成が可能な新世代AIを公開。
  • オープンウェイトで、LoRA対応と生成物の権利は利用者に。
  • 4モデル構成でオフライン作曲にも対応、商用ライセンスあり。

🚀

Anthropic will pay xAI $1.25B per month for compute | TechCrunch

  • データセンターの300MW能力を取得し月額12.5億ドルを支払う。
  • 契約は2029年5月まで継続、解約は90日前通知で可能。
  • ハイブリッド戦略で未使用資産を競合へ販売する。

💬

AI翻訳のDeepLが従業員の20%以上を解雇…CEOのメモにはお決まりの言葉が並んでいた | Business I..

  • 従業員の約21%にあたる250人を削減した。
  • 創業者CEOはAIの構造変化を強調しAIネイティブ化を目指すと説明。
  • 通知には小規模チームや管理職削減などの文言が並んだ。

🚀

AIでコードが増えていくこの時代に、メンテナンスコスト削減にもAIを

  • AIのコード拡大に対し、保守性を高める方針が不可欠だ。
  • 自動リファクタリングと差分修正を日常化する。
  • 複雑度とルール違反を検証し、継続的改善を回す仕組みを作る。

2026年05月21日

|

このサイトについて

/

ニュースレター

/

@AINewsDev