AI News

~AI関連記事を3行にまとめて紹介~

Cover Image
1週間のAIの話題をまとめて読める、📨Weekly AI News はこちら!

🚀

IrisGo, a startup backed by Andrew Ng, looks to become the AI desktop buddy you never knew..

  • デスクトップ向けの伴走アプリが日常作業を学習し自動化。
  • スキルライブラリでメール作成や請求処理をこなす。
  • コーディング支援機能もあり要約やレポート作成をこなす。

🤖

OpenAI claims it solved an 80-year-old math problem — for real this time | TechCrunch

  • 新しい推論モデルが長年の幾何学未解決予想に挑んだ。
  • 補足見解と新解法が従来の格子解法を超えたとされる。
  • AIの推論力と学際的な連携が数学の発展を後押しする。

🌟

PopuLoRA: Co-Evolving LLM Populations for Reasoning Self-⁠Play

  • 検証可能な報酬でLLMの推論を高度化する
  • 共進化集団を用い、教師が課題を作成・提案する
  • 置換と組換えで多様性を持たせ、難易度は対戦成績で決まる

🚀

What will better AI mean? | the singularity is nearer

  • スケール時代の終盤を経て、効率と嗜好の時代へ移る。
  • 検証領域ではバグ修正と規模拡大で解決、特別な裏技は不要。
  • 規制介入の動きは囲い込みを薄め、費用対効果の線形化を待つ。

🔥

OpenAI barrels toward IPO that may happen in September | TechCrunch

  • CEOは9月の上場を目指す方針を示した。
  • 大手銀行と協力し、数日内に機密申請を規制当局へ出す見込み。
  • 大手宇宙企業が関連事業を取り込み、IPO申請公表が近いとの観測で、取材要請には回答せず。

🎯

Multimodal evaluators: MLLM-as-a-judge for image-to-text tasks in Strands Evals | Artifici..

  • 新規の画像→テキスト評価器を追加し、多模態評価に対応。
  • 総合品質・正確性・忠実性・指示遵守の4指標で出力を評価。
  • 参照有無を選択、CIへ組み込み、視覚的幻像・事実誤り・指示逸脱を自動検出。

💡

Google検索が大幅刷新。AI補完で検索の新しい常識が到来 - PC Watch

  • 長文質問の意図を汲み取るAI補完で検索が進化
  • ファイル・画像添付検索とAntigravityのコーディング支援を拡張
  • 夏提供予定のエージェント機能と新規決済連携を発表

🎧

[2605.17991] Stable Audio 3

  • 可変長の音声生成・編集を実現する高速潜在拡散モデル群を提供。
  • 数分規模の音声生成や短音のコスト削減が可能。
  • 敵対的後訓練で推論を加速・品質を向上させ、インペインティングで短録音の編集にも対応。

🤖

Could generative AI turn out to be the tech industry’s Vietnam? And could public backlash..

  • 生成系AIの普及が業界の構造を変える可能性を示す。
  • 公衆の反発は投資と実用性のギャップを露わにする。
  • 協力と規範整備でAIをより良い方向へ導く可能性がある。

📷

GitHub - bytedance/Lance: A 3B-active-parameter native unified multimodal model for image ..

  • 3Bパラメータの統合型マルチモーダルで画像・動画を扱う。
  • 理解・生成・編集を一枠組みで実現し高性能を示す。
  • 推論には40GB以上のVRAMが必要で設定はスクリプトで完了。

😊

Build real-time voice applications with Amazon SageMaker AI and vLLM | Artificial Intellig..

  • 双方向ストリーミングでリアルタイム音声を文字起こしする実装を解説。
  • 4KB PCM16(16kHz・モノ)のチャンクをリアルタイム送受信し転写を即時取得。
  • ウェブソケットとエンドポイントを橋渡しし、追加のストリーミング基盤不要を示す。

🚀

Google、「Android Halo」発表――スマホ画面上部に常駐しAIエージェント稼働の進捗をリアルタイ..

  • スマホ上のAIエージェントを管理する新インタフェースを発表。
  • 画面上部に小さく常駐し、作業中・ライブモード・重要メッセージの進捗を表示。
  • Gemini Spark等と連携し、バックグラウンドの動作をリアルタイム把握可能。

🤖

OpenAI、最大3年の「計算資源へのアクセス」を保証する新サービスを開始 - CNET Japan

  • 長期で計算資源を確保できる新サービスを発表。
  • 1〜3年契約と年間コミット額で割引が適用される。
  • 確保枠は製品群の支出額ベースで利用可能、需要の高まりを受け提供を継続。

🚀

GoogleのModern Web Guidanceスキル登場。AIが古いCSS・JSを書く問題を解決する

  • モダンウェブガイダンスでAIエージェントは最新機能に対応する。
  • 従来の古い書き方を避け、サブグリッドと最新JSを活用。
  • 基準データに基づく代替提案とセキュリティ対策を提供する。

🎵

Stability AI releases a new audio model that can create six-minute songs | TechCrunch

  • 4機種構成の新音声モデル群が公開された。
  • 小系は端末内最大2分、上位は6分超の楽曲を生成。
  • 中・大は6分20秒の楽曲を構造・旋律を保ち作成可能、API経由のホスティングは有料。

Literary Hub » Nobel laureate Olga Tokarczuk apparently used AI to write her latest novel..

  • ノーベル賞作家が最新長編でAI活用を示唆した。
  • 出版社は調査以外にはAIを使っていないと否定した。
  • 登場人物が聴く歌をAIに尋ね、いくつかの曲名を得たと明かした。

🎯

「生成AIでチラシ作ってる人が、今までデザイナーにぼったくられてたことがよくわかった」という..

  • 生成AIでチラシを作る動きがデザイナー評価を揺らす懸念を生む
  • その認識が業界単価の低下を招くのではと不安が広がる
  • 盗作やAIの本質、品質以外の価値の評価が問われている

🤖

Google's AI is being manipulated. The search giant is quietly fighting back

  • AIチャットが公衆へ偽情報を拡散する手口を暴いた。
  • 私の実験でもGPTや大手AIが嘘を広める例を確認した。
  • 対策はスパム対策の見直しと信頼性表示の追加など進む兆しがある。

🎨

Figma adds an AI assistant to its collaborative canvas | TechCrunch

  • 協働キャンバスにAIエージェントを搭載、自然言語指示で作成・編集を自動化。
  • 複数エージェントを同時運用でき、デザイン向けAIモデルを微調整。
  • 第一弾はデザイン用途、今後は他製品へ展開予定。

🔧

Prompts are technical debt too

  • プロンプトは新機能より保守負担を増やす。
  • 変更は既存コードと相互作用し理解を推測へ導く。
  • 過度なエージェントは避け、第三者のツールを活用。

😊

【西田宗千佳のRandomTracking】XREALの「Project Aura」実機体験。軽量ながら「空間コンピュー..

  • 実機体験で空間コンピューティングを軽量に実現。
  • 内蔵ユニットと分散処理で処理負荷を分散。
  • 約70度のFoVと没入感が印象的だった。

🚀

Learnings from 100K Lines of Rust with AI | Cheng Huang’s corner

  • AIとRustで合意エンジンを現代化した知見を共有。
  • 約3か月で約10万行を追加、23千→30万件/秒へ最適化。
  • パイプラインと非揮発性メモリは実装済、RDMAは未定。

🔥

Grok人気急降下。開店休業のデータセンターをAnthropicにリース | ギズモード・ジャパン

  • 人気が急落、月間ダウンロードも大幅減少
  • 有料利用は0.174%にとどまり、競合に水をあけられる
  • 大手企業がデータセンターを別社へリース

アニメやイラストに特化したローカル画像生成AI「Anima」 生成した画像は商用利用も可能(生成A..

  • アニメ・イラスト特化のローカルAI「Anima」を紹介。
  • 画風調整は@artist名で、出力は512×512〜1536×1536、ネイティブ対応。
  • 学習はアニメ画像と非アニメ画像の混在、ライセンスは非商用のみ、商用は自己責任。

😊

Google DeepMind & Singapore: National AI partnership — Google DeepMind

  • ・シンガポールのAI未来を強化する国家連携を発表。
  • ・最先端AIを医療・教育・労働市場の未来創出へ活用。
  • ・公的部門の変革とAI人材育成を政府と連携して推進。

💬

'Ask YouTube' brings AI-powered conversational search to video, adds Gemini Omni to Shorts..

  • 動画検索にもAI会話機能が導入され、意図に沿った回答を作成する。
  • ショーツと長尺動画を組み合わせ、複雑な検索にも対応する。
  • ジェミニ・オムニを追加し、自然なストーリーテリングを支援する。

🔥

グーグル、AIエージェント「Gemini Spark」発表 バックグラウンドで自律動作 - ケータイ Watch

  • 24時間体制でバックグラウンド処理を行う新AIエージェントを発表。
  • 専用VM上で動作し、端末に依存せずタスクを進行。
  • 既存サービスと統合し、将来は第三者連携を計画。

🚀

GoogleがAI新機能「Spark」、検索や買い物を代行 30億人の生活自動化 - 日本経済新聞

  • 日常の検索や予約などをAIが代行する新機能を発表。
  • 企業向けのAIエージェント機能を個人利用にも広げると発表。
  • イベントで多様なエージェント機能を搭載した新サービスを示した。

🌍

現実世界を基に"動き回れる"仮想空間を生成 Googleの世界生成AI「Project Genie」にストリート..

  • 現実の場所を起点にした仮想空間を生成する新機能を発表
  • ストリートビュー連携で現実の地点を起点に仮想探索を可能に
  • 現在は一部地域で提供開始、今後拡大予定

🎬

Googleの新AIモデル「Gemini Omni」が発表 ~まずはNano Bananaの動画版、自然言語で生成・編集..

  • 推論と創造を統合した新AIが高品質動画を生成
  • 自然言語で動画編集・参照物差替えが可能
  • 複数入力の統合と動き・スタイル転送にも対応、認証付き

🌟

ウェブを作る人のためのLLMO/AIO入門【2026年5月版】|ベイジの図書館

  • LLMO/AIO入門はタグと構造化データと一体で動く。
  • 日常的な広報・マーケ活動とセットで成立する。
  • 仕組み理解と信頼判定・SEOの違いを解説。

🔥

Your Evals Will Break and You Won't See It Coming - Lun Wang

  • 現状の評価は現モデル前提で動くが別種には通用しない。
  • 次の能力跳躍のボトルネックは訓練や設計ではなく評価そのものだ。
  • 秩序パラメータを探し転換指標を設け、評価自体を進化させろ。

🎬

Google、“動画版Nano Banana”こと「Gemini Omni」公開 会話で映像を生成・編集 - ITmedia NEW..

  • 自然言語指示で動画を作成・編集できる新機能を発表
  • 人物や物体のディテール変更・差し替えとカメラ角度調整が可能
  • 初期モデル公開と来歴付与・検証機能の案内

🤖

グーグル、Google I/O 2026で新たなAIモデル「Gemini Omni」を発表 - ケータイ Watch

  • I/O 2026で新AI「Gemini Omni」が発表された。
  • 高度な知能と生成技術を統合した世界モデルが特徴。
  • 動画編集や入力からの出力変更を直感的に行える。

Google検索が「AI検索」に──エージェント機能やマルチモーダル入力に対応 - ITmedia NEWS

  • 検索はキーワード中心からAI検索へ刷新、エージェント機能を搭載。
  • マルチモーダル入力対応の知的検索ボックスと質問支援が特徴。
  • 複雑な質問には自動シミュレーションUIでミニアプリを表示。

🚀

Google、しゃべるだけで「整った文章」を生成する新機能 - CNET Japan

  • 音声を整った文章へと変える新機能が登場。
  • 夏の組み込みで、AI上位プランの加入者のみ利用可能。
  • メール系・クラウド系ツールやWeb情報を参照して出力を磨く。

📈

Google、無休で働くAIエージェント「Gemini Spark」発表 PCを閉じても動作 - CNET Japan

  • 24時間365日稼働のクラウド型AIエージェントを発表
  • Workspaceと連携し端末資源を使わず常時代行
  • ノートPCを閉じてもバックグラウンドで動作、ファイル送信も可能

🚀

Google、無休で働くAIエージェント「Gemini Spark」発表 PCを閉じても動作(CNET Japan) - Yah..

  • クラウド上で常時動作するAIエージェントを発表
  • GmailやDocsと連携、PCを閉じてもバックグラウンドで作業を続行
  • 数週間で全ユーザーへ展開、macOSアプリも同日公開予定

🤖

【笠原一輝のユビキタス情報局】曖昧な指示で全部やってくれる。AIエージェントが変えるPCとソフ..

  • AIエージェントの進化で自律動作型アプリが主流になりつつある。
  • 事前定義型ソフトは動的動作へ転換している。
  • OTA予約の自動化を含む業務自動化が拡大している。

🤖

米大学で進む「成績インフレ」 評価Aが急増、ChatGPT影響で - 日本経済新聞

  • 米大でAI活用による成績インフレが顕在化している。
  • 高評価が続くと学力実態の把握が難しくなる。
  • 調査はテキサス州の州立大データを収集した。

Google launches Antigravity 2.0 with an updated desktop app and CLI tool at IO 2026 | Tech..

  • 新エージェント型コーディングアプリの新バージョンを公開
  • デスクトップ版・CLI・SDKを刷新し、同時実行機能を拡張
  • AI Studio・Android・Firebase連携や音声指示、企業向け機能を追加

🧠

Google updates its Gemini app to take on ChatGPT and Claude at IO 2026 | TechCrunch

  • スタンドアロンのチャットを万能AIハブへ拡張する更新。
  • Daily BriefとNeural Expressiveデザイン、動画モデルを追加。
  • 24/7個人AIエージェントを統合し競合と戦う方針。

🔥

Gemini Omni の概要|npaka

  • テキスト・画像・音声・動画を横断して扱える新世代生成モデル.
  • 複数入力を組み合わせて一貫性のある動画生成が可能.
  • 会話で編集を指示し周囲環境や動作を段階的に変えられる.

🤖

You can now talk to your Gmail inbox, as seen at Google IO 2026 | TechCrunch

  • 受信箱AI機能が拡張され、会話型AIが追加された。
  • 高度AI搭載機能で自然言語検索が可能になる。
  • 受信メールの便名や予約時間などを素早く取り出せる。

Google just declared itself a contender in AI design at IO 2026 | TechCrunch

  • 教師や小規模事業者向けのAI設計機能を公開。
  • テキストプロンプトだけでSNS画像や招待状を作成。
  • 既存ツールに対抗する新競争軸として位置づけ。

🎬

YouTubeが会話型検索「Ask YouTube」とAI動画リミックス機能を発表 | テクノエッジ TechnoEdge

  • Gemini Omni搭載で会話型検索とShortsリミックス機能を提供開始
  • Ask YouTubeは18歳以上のプレミアム会員に先行公開
  • リミックスは透かし・識別データ・元リンク付きで、肖像リミックス拒否機能も提供

💡

あるソフトウェアエンジニアの1日(2028)

  • 起床後Slackのエージェントダッシュボードを確認。
  • 前夜の5タスクはAIがレビュー・テスト・セキュリティを経て完了。
  • リリースは10分サイクル、最終判断は人間が行い、自然言語UIを核に可視化。

🔥

GitHub - wiltodelta/remove-ai-watermarks: CLI and library for removing visible (Gemini) an..

  • 生成物の可視・不可視水印とメタデータを一括除去。
  • 逆アルファブレンディングと拡散再生成で自然さを維持。
  • 初回約2GBのモデルを自動ダウンロード、Batch処理対応、CLI対応。

🔧

GitHub - antoinezambelli/forge: A Python framework for self-hosted LLM tool-calling and mu..

  • 自己ホスト型LLMのツール呼び出しを支える信頼性レイヤーを提供。
  • ガードレールと文脈管理で8Bクラスモデルを多段エージェント作業で高性能化。
  • WorkflowRunner・SlotWorker・Guardrailsミドルウェア・プロキシを統合し、複数バックエンドに対応。

🚀

Google Search’s I/O 2026 updates: AI agents and more

  • 人工知能サーチが新時代へ、デフォルトは Gemini 3.5 Flashへ更新。
  • 25年超ぶりの検索窓をAI対応に大刷新。
  • テキスト・画像・ファイル・動画・ブラウザのタブを横断検索。

もっと見る
このサイトについて

/

ニュースレター

/

@AINewsDev