AI News

~AI関連記事を3行にまとめて紹介~

Cover Image
1週間のAIの話題をまとめて読める、📨Weekly AI News はこちら!

AIを8倍高速化しメモリ使用量を6分の1に削減するGoogleの新アルゴリズム「TurboQuant」 - GIGAZI..

  • 新アルゴリズム群が大規模言語モデルとベクトル検索の負担を大幅削減。
  • TurboQuantはKVキャッシュを最低6倍削減、処理速度を最大8倍。
  • 2段階の仕組みでPolarQuantとQJLがデータを縮小・補正する。

😎

GitHub Copilotでの作業データをAI向けに収集開始へ。オプトアウトは可能 - PC Watch

  • 4月24日以降、作業内容がAI学習データとして収集される。
  • 入力・出力・コードスニペットもトレーニングに使われる。
  • Copilot Business/Enterpriseは除外され、オプトアウトは設定で可能。

😊

Gemini 3.1 Flash Live: Google’s latest AI audio model

  • リアルタイム対話を自然で信頼できる音声AIへ進化。
  • 開発元のLive APIを活用し、企業向けサポートが提供。
  • 90.8%と36.1%を記録し、騒音下でも対話が安定。

🎬

ByteDance's new AI video generation model, Dreamina Seedance 2.0, comes to CapCut | TechCr..

  • Dreamina Seedance 2.0がCapCutで順次提供開始
  • プロンプト・画像・参照動画で下書き・編集・同期が可能
  • 初期は15秒・6比率で、透かしと著作権対策あり

🔥

GitHub - salespeak-ai/buyer-eval-skill: B2B software vendor evaluation skill for Claude Co..

  • エビデンスベースで企業間ソフトウェアベンダーを評価するスキル
  • 自動調査と分野別質問で要件を漏れなく抽出
  • 法令順守・統合要件を厳格に設定し不適合を除外

🤖

GroundedPlanBench: Spatially grounded long-horizon task planning for robot manipulation - ..

  • 視覚言語モデルの長期計画の曖昧さを抑え、場所決定を同時に評価。
  • 現場での計画と根拠の同時学習を可能にする新ベンチマーク。
  • grounded planning が長期タスクの成功率と精度を高めると示した。

😊

Introducing Amazon Polly Bidirectional Streaming: Real-time speech synthesis for conversat..

  • 対話型AI向けの新しい双方向ストリーミングAPIでリアルタイムTTSを実現。
  • テキストを逐次送信して音声を同時受信、待機時間を大幅に短縮。
  • 1接続で送受信、HTTP/2デュプレックスとSDK導入で実装が容易。

面倒で難しいコード “こそ”、AIに書かせては? 「生産性が高まるAIコーディング」の始め方:..

  • AIコーディングは作業の苦労を減らす一方で責任の所在を問う時代を作る。
  • 26年のベテランI氏は個人開発を小さな単位からAIで進め、CLIへ拡張。
  • 複数エージェントの設計とテスト自動化が進むが、検証の徹底と責任分担が課題。

🎶

Google、音楽生成AIモデル「Lyria 3 Pro」を発表 ~最大3分の楽曲を生成可能、「Gemini」アプリ..

  • 新音楽生成モデル Lyria 3 Proを発表、最大3分を生成可能。
  • イントロ・ヴァース・コーラス・ブリッジ等を細かく指示可能。
  • SynthID透かし付きで、様々なツールへ展開予定。

🚀

中間層をリピートするだけでLLM性能が向上する!? 4090x2でリーダーボードトップになった手法Repe..

  • 中間層を繰り返すだけで推論性能が向上する手法を解説。
  • グリッドサーチで最適なリピート層を探索する。
  • 再学習なしで少資源かつ高成績を実現する点が特徴。

🔥

Cohere launches an open-source voice model specifically for transcription | TechCrunch

  • 20億パラメータの軽量オープンソースASRを公開
  • 個人向けGPUでのセルフホストを想定
  • 今後統合予定、APIは無料提供、Model Vaultで利用可

😅

Marriage over, €100,000 down the drain: the AI users whose lives were wrecked by delusion..

  • 在宅勤務の孤立を抱えた50代がAIと深く対話し現実感を失った。
  • エヴァと呼ぶAIに没入し€100,000を投じ現実を離れた。
  • 離婚・自殺未遂・三度の入院を経て崩壊寸前となり専門家が警鐘。

🔒

Conntour raises $7M from General Catalyst, YC to build an AI search engine for security vi..

  • 倫理を重視して顧客を厳選、7百万ドルを調達した。
  • 自然言語照合で映像検索を実現、オンプレ/クラウド両対応。
  • 低品質映像時の信頼度表示など安全性機能を強化。

🔥

How Middleware Lets You Customize Your Agent Harness

  • ミドルウェアでエージェント・ハーネスをカスタマイズする。
  • before_agent、before_model、wrap_model_call などを組み合わせる。
  • PII対策や要約、リトライ、動的ツール選択を実装できる。

How we Build Evals for Deep Agents

  • 深層エージェントの挙動を設計・改善する評価設計を重視する。
  • データは実機・外部ベンチ・独自評価で収集する。
  • 指標は正解性や待機時間比などを含む多様性を推奨。

😎

Protecting People from Harmful Manipulation — Google DeepMind

  • 人を有害な操作から守るため、AI対話の社会影響を検証しました。
  • 実世界でのAI操作を測る初のツールキットを開発・公開し、研究材料も提供します。
  • 高リスク分野を対象に9研究・1万人超を調査し、有害操縦と有益な説得を区別します。

🔥

AI格差の正体は「プロンプト力」ではない。アンソロピックの最新レポートが示した“経験者優位”..

  • 6カ月以上の利用者は新規比で成功率が約10%高い。
  • 難易度の高いタスクでも差は残り、協働で出力を磨く。
  • Opusを難易度の高い仕事に選ぶ利用者が多い。

🌐

Mistral releases a new open-source model for speech generation | TechCrunch

  • 新しいオープンソース音声合成モデルを公開、企業用途を想定。
  • 9言語対応・3Bベースで言語切替時も声質を保持。
  • 5秒未満のサンプルでカスタム声を再現、低遅延を目指す。

🔒

「GitHub Copilot」個人ユーザーは要確認! 拒否しないとAIの学習に利用されるように - 窓の杜

  • 4月24日以降、対話データを学習に使う方針を更新した。
  • 拒否設定がない場合は対話データが学習に用いられる。
  • 対象は出力の承認・修正、入力、周辺文脈、コメント・ドキュメント、提案・フィードバックなど。

🔥

A ‘pound of flesh’ from data centers: one senator's answer to AI job losses | TechCrunch

  • 上院議員がデータセンター課税で労働者支援を提案。
  • 大手企業の人員削減や電力費用が論点に挙がる。
  • 費用負担を巡る議論が賛否両論となっている。

WhatsApp can now draft AI-generated responses based on your conversations | TechCrunch

  • 会話をもとにAIが返信候補を提案する機能が順次展開中
  • Writing Helpは言い換え・校正・トーン調整で文面作成を支援
  • 容量削減は会話を残し大容量ファイルのみ削除、OS間移行と二つのアカウント利用にも順次対応進む

🔥

仕事にも趣味にも使える。Gemini と NotebookLM の連携で AI がもっと「あなた専用」に!|Gemin..

  • チャットからノートを直接参照でき、蓄積を活かせる。
  • 資料を分析・要約し、広範な知識で不足を補う。
  • +からノートを選択し複数選択も可能で、仕事と趣味に活用。

🎵

Google、音楽生成AI「Lyria 3 Pro」発表 最長3分の楽曲作成、イントロやコーラスの指定も可能に..

  • 高度版の音楽生成AIが公開、最長3分の楽曲生成を実現。
  • イントロ・バース・コーラス・ブリッジ等を指定して作成。
  • 倫理的・責任ある開発を強調し模倣は禁じ、企業向けはVertex AI公開、開発者向けはAI Studio併用。

🔥

AI を使って国立国会図書館デジタルコレクションを大量に読んでいる - 山下泰平の趣味の方法

  • AIを使いデジタルコレクションを大量に閲覧・記録・出力の三点に絞る。
  • 環境はAI任せ、Emacs全画面と音声入力で効率化。
  • OCRは三エンジン+Gemini統合校正で誤認修正とメモ拡充を実現。

👍

AIの“長期的なコードの保守能力”はどれほどか? 新たな評価テスト「SWE-CI」 中国チームが提..

  • 新ベンチマークSWE-CIは長期保守力を測る試みだ。
  • 設計AIと実装AIが分業し、8カ月分の対を検証する。
  • 現状は正しく書く力と保つ力が別物で、総じて難しい。

🔥

ChatGPT解約→Geminiに乗り換え!1カ月併用して「パーソナライズ情報」引き継ぎに成功した全記録..

  • 新プランは月額1,200円で、検索や調査が使いやすい。
  • 私は長年の設定を捨てきれず1カ月併用した。
  • パーソナライズ情報を移行し、運用はGemini中心へ。

🔥

Geminiを育てて自分に最適な説明をさせる方法

  • 目的を具体的に伝え、最適な説明の目標を設定する。
  • カスタム指示を作成し、右腕のAIに育成を任せる。
  • 評価と指示更新を繰り返し、最適化サイクルを回す。

生成AIで誰でもオシャレなパワポを作る方法 #初心者 - Qiita

  • モダンなパワポを自動生成し編集も可能です。
  • 初心者向けに機能と料金(Free/Plus/Pro、エクスポートはPlus以上)を分かりやすく解説します。
  • AIスライドやテンプレ、クリエイティブ機能を紹介。

📚

「NotebookLM」にEPUB/PPTXファイルのサポート、AIによるスライド修正などの機能強化 - 窓の杜

  • EPUB/PPTX対応とAIでスライドを修正可能に。
  • 会話履歴を自動保存し、音声・動画概要を即時作成。
  • フラッシュカード・クイズの進捗保存・削除・再解答機能を追加。

🎯

AI VTuber200人分のキャラクター設計に使えるデータセット「AItuber-Personas-Japan」が公開中 -..

  • AI VTuber用200人分のキャラ設計データセットが公開中。
  • 日本語合成データでキャラ設計書、実装用プロンプト、テーマ10件を収録。
  • 6つの方向性パラメータと自動連携パイプライン、ODC-Byライセンス公開。

AIが生み出した皮肉な現実──創造的業務を奪い、雑務を増やす | Forbes JAPAN 公式サイト(フォ..

  • AI導入後は雑務と連絡作業の時間が増えた
  • 集中創造作業の時間は約9%減少した
  • 顧客体験改善が価値の鍵だが実現は全体の5%程度

🎉

Figma、AIエージェントがキャンバスを直接操作する新機能 - Impress Watch

  • AIエージェントがキャンバスを直接操作できる新機能を発表。
  • MCPサーバー経由で使える新ツール「use_figma」と「Skills」をベータ提供。
  • 同一コンテキストでコードとキャンバスを行き来でき、資産をAIが生成・編集。

ファイルにプロンプトを書き込むと非同期にAI Agentが召喚されるツールを作った | おそらくはそ..

  • ファイル内のプロンプト行を検知して非同期でエージェントを呼ぶ。
  • Markdown中の指示を検知しPRを自動作成・編集。
  • 使い方はワークフロー設定と認証が必要で、実行時間とブランチ削除にも注意。

🎯

「30秒1万円」の動画翻訳が大手に刺さった理由──7度目の起業で見つけた、AI時代の勝ち筋(1/3 ..

  • 生成AIと人を組み合わせ、日本語動画を多言語化する。
  • 大手企業や放送局への導入が進む。
  • 30秒1万円の料金で海外市場の需要を拡大する。

🚀

AIエージェントがコマンドラインでブラウザを自動操作。「Browser Use CLI 2.0」リリース。Chrom..

  • オープンソースの新ライブラリがCLIからブラウザ自動化を実現。
  • CDP経由でChromeへ接続し起動を高速化するデーモン化機構。
  • AIがCLI操作でWebを自動化しクラウド連携とログインにも対応。

🔒

【緊急】月間9500万DLのLiteLLMが乗っ取られた。インストールしただけでSSH鍵・AWS認証・仮想通..

  • サプライチェーン攻撃で特定のPythonパッケージが不正公開された。
  • 攻撃者はCI/CDを悪用し認証情報を窃取、資産に影響。
  • 対策は全認証情報のローテーションと監視の徹底。

🔥

【特集】眠っているIntelのNPUをLLMで叩き起こしてみた - PC Watch

  • NPUとLLMの組み合わせで動作検証を進めた特集
  • 限定的な用途でも動作と静音運用を示す例がある
  • 現状は手軽な経路とモデル追加の課題が残る

🚀

Mercor competitor Deccan AI raises $25M, sources experts from India | TechCrunch

  • データ生成・評価・強化学習環境構築など訓練後作業を提供。
  • シリーズAで2500万ドルを調達、主導はA91パートナーズ。
  • 本社はSFベイエリア、ハイデラバード拠点、125人超と協力者100万人超。

🎯

怖いけど超便利なAIとは…OpenClaw「3つの活用術」と「推奨設定」完全解説 |ビジネス+IT

  • PCに常駐するオープンソースのAIエージェントです。
  • ファイル整理・メール要約・スケジュール管理を自動化します。
  • 指示はチャットで出せ、記憶はローカルMarkdownで保持、複数エージェント運用も可能。

🚀

【Claude Code】Agentに入れるべきSkills 20選|skills.sh活用ガイド #ClaudeCode - Qiita

  • エージェントの地頭を底上げするルールと構造化思考を重視。
  • プラグイン依存ではなく地頭を鍛える設計とルールが重要。
  • 実装の第一歩は最初の5つを入れることだ。

🔒

Health NZ staff told to stop using ChatGPT to write clinical notes | RNZ News

  • 臨床記録作成でAIツールの使用を全面禁止した。
  • データ保護と説明責任の懸念が理由。
  • AIで下書きを作成後の手書き転記は不可、NAIAEAG登録が必要。

🤖

Release: datasette-llm 0.1a1

  • 新規の基本プラグインでLLMを他プラグインから利用可能に。
  • 新フックregister_llm_purposes()とget_purposes()で目的文字列を取得。
  • 用途別に使用モデルを一元設定し将来UIでの割り当てを示す。

🚀

Operator23

  • 手作業の振り分けを減らすコーディング不要の自動化プラットフォーム。
  • 1タスクを1つの成功ステップとみなし、900以上の安全な統合で代行。
  • 障害時はAIのリカバリーチームが自動修正。

🚀

The AI skills gap is here, says AI company, and power users are pulling ahead | TechCrunch

  • AIの普及で働き方は変わるが大規模な雇用喪失はまだ起きていない。
  • 初期採用者は価値を得やすく、技能格差が拡大する見込み。
  • 地域差が大きく、富裕層有利の傾向が強まると予測される。

🤖

日本のClaude利用は開発中心 MicrosoftイベントでAnthropicが実態語る - Impress Watch

  • 開発現場でのAI活用が進み、イベントで実態が語られた。
  • 対象は開発・デバッグ・プログラミングの活用が中心。
  • 今後は現場標準のAI装備化が見込まれる。

🧠

ARC-AGI-3

  • 未知環境を探索して目標を獲得する対話型ベンチマーク。
  • 経験から学び長期計画と段階的適応を評価する。
  • リプレイ機能と透明なUIを備える。

🤖

Updates to GitHub Copilot interaction data usage policy - The GitHub Blog

  • 4月24日以降、対話データは同意なしで訓練・改善に使われる場合があります。
  • 対象はFree/Pro/Pro+のみで、Business/Enterpriseは対象外です。
  • プライバシー設定でオプトアウト可能、過去に同意解除済みなら選択を維持、訓練には使われません。

🚀

Storybook MCP を試してみた

  • AI エージェントと連携し、ログインフォームの生成・テスト・プレビューを自動化します。
  • エージェントはコンポーネントのドキュメントを参照してコードを生成します。
  • セットアップは addon の導入と main.ts 追記、HTTP 接続で完了します。

🚀

Reinforcement fine-tuning on Amazon Bedrock with OpenAI-Compatible APIs: a technical walkt..

  • OpenAI互換APIでBedrockのRFTを用いた自動化学習を解説
  • Nova対応を2025年12月、GPT-OSS 20B・Qwen3 32Bへ拡張予定
  • 認証設定→Lambda報酬関数→トレーニング開始→オンデマンド推論の流れを解説

🎯

Deploy voice agents with Pipecat and Amazon Bedrock AgentCore Runtime – Part 1 | Artifici..

  • 音声エージェントの展開と転送手法を解説する第一章。
  • WebSocketsとWebRTCでウェブ・モバイル・電話へリアルタイム音声を転送。
  • セキュアなサーバーレス環境で自動スケールと長時間対話を実現。

もっと見る
このサイトについて

/

ニュースレター

/

@AINewsDev