AI News

~AI関連記事を3行にまとめて紹介~

Cover Image
1週間のAIの話題をまとめて読める、📨Weekly AI News はこちら!

🔒

ChatGPTに「入力してはいけない情報」5選――NGリストとその理由:ESETが解説、利用時のリスクと..

  • 禁止情報の5項目と理由をわかりやすく解説
  • データ流出や入力情報の誤用、プロンプト回避などリスクを指摘
  • 個人データ保護とEU規制、削除期限など対策を紹介

🧠

Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay..

  • LLM補助のエッセイ作成は認知負荷と脳の結合性に影響する。
  • 外部ツールの活用で認知活動が低下する傾向が観察。
  • 長期的にはAI依存による教育影響の懸念が示唆される。

🤖

BlueCodeAgent: A blue teaming agent enabled by automated red teaming for CodeGen AI - Micr..

  • 大規模言語モデルはコード生成で広く使われる。
  • 赤チーム知識と動的検証を組み合わせた青チーム手法。
  • 4データセット・3タスクでF1を平均12.7%改善。

🤖

MMCTAgent: Enabling multimodal reasoning over large video and image collections - Microsof..

  • 長尺動画と静止画の大規模データで推論を実現する仕組み。
  • 動画用と静止画用のツールで反復的に推論と検証。
  • 索引化・要約・章立て・埋め込みを統合する検索推論。

🚀

Fara-7B: An Efficient Agentic Model for Computer Use - Microsoft Research

  • 7億パラメータの実験的CUAで画面を認識し操作を予測する。
  • スクリーン画像だけでクリック・入力・スクロールを連携させる。
  • 遅延とプライバシーを改善し安全対策を実装。

Reducing Privacy leaks in AI: Two approaches to contextual integrity  - Microsoft Resear..

  • エージェントは文脈的適切性で情報共有を判断する。
  • 医療予約では必要情報のみを伝え、不要情報を控える。
  • 提案は軽量検証モジュールと推論・強化学習で実装する。

🧬

GigaTIME: Scaling tumor microenvironment modeling using virtual population generated by mu..

  • デジタル化とGenAIの融合で精密健康が前進する。
  • H&Eを仮想mIFへ翻訳する多模态AIが鍵。
  • 14,256例の患者から約30万枚の仮想mIFと40百万細胞・21チャンネルの対が訓練データ。

🎯

Promptions helps make AI prompting more precise with dynamic UI controls - Microsoft Resea..

  • 動的なUI制御でAIの指示をより正確にするフレームワークです。
  • 現場の顧客サポート・教育・医療などへ簡単に統合可能。
  • MITライセンスで公開され、設定の保存・共有が今後の課題。

Agent Lightning: Adding reinforcement learning to AI agents without code rewrites - Micros..

  • 実行と訓練を分離してエージェント経験をRLへ活用する
  • 階層RLで各LLM呼出しに報酬を付与する
  • エージェントランナーを含むミドルウェアが機能する

💡

OptiMind: A small language model with optimization expertise - Microsoft Research

  • 自然言語のビジネス問題を最適化用の数式へ変換する小型モデル。
  • 推論時の領域ヒントと自己検証で高い信頼性を実現。
  • ローカル実行で機密データを外部送信せず短時間で解を生成。

😊

Multimodal reinforcement learning with agentic verifier for AI agents - Microsoft Research

  • マルチモーダル強化学習の検証フレームワークとして視覚と時間情報を活用する。
  • 正解だけでなく出力の正確さと推論の整合性を自動的に評価する。
  • 高品質データ作成と学習の安定化に寄与し現実タスクで性能を向上させる。

🔥

LLM Engineer's Almanac - Workloads | Modal

  • オフラインはバッチ処理でスループット重視の設計。
  • オンラインは低遅延を狙いエッジGPUで実装、オープン化が背景。
  • 半オンラインは自動スケーリングで負荷変動へ迅速対応、普及背景。

🔒

OpenAI API Logs: Unpatched Data Exfiltration

  • APIログのMarkdown画像レンダリングに脆弱性がある。
  • デフォルトのResponsesとAgent Builder環境へ影響。
  • 対策はMarkdown画像の除去とプレーンテキスト化。

😎

What if AI is both really good and not that disruptive?

  • AIは高度だが大転換には至らず静かな中庸が現実だ。
  • 大規模言語モデルは知識労働の生産性を高め雇用崩壊には至らない。
  • 労働市場は再配置され曖昧な知識労働は依然難しく完全自動化は未達だ。

🎯

How Thomson Reuters built an Agentic Platform Engineering Hub with Amazon Bedrock AgentCor..

  • Bedrock AgentCoreを活用して自律エージェント基盤へ移行
  • AetherオーケストレーターとTRACKでAWSアカウントのプロビジョニングやデータベースパッチを自動化した
  • セルフサービス型AI運用ハブを構築し生産性を15倍に向上

🔥

Apple plans to make Siri an AI chatbot, report says | TechCrunch

  • 音声アシスタントがチャットボット型へ刷新され音声とテキスト対応
  • iOS27への統合とWWDCが話題となる見込み
  • コードネームCamposの新機能に市場動向の影響が注目される

🔥

From Coder to Orchestrator: The future of software engineering with AI - Human Who Codes

  • AI主導へ大転換、コーダーは監督へ移行する
  • 2025年以降、自動補完で複数ファイル作成が可能になる
  • 監視なしの自律エージェントとタスク中心のIDEが普及する

🎯

Irony alert: Hallucinated citations found in papers from NeurIPS, the prestigious AI confe..

  • 有名会議の論文に虚偽引用が見つかったと報じられた。
  • 調査で4,841論文中に51件の虚偽引用を確認した。
  • 査読は完璧でなく、最高峰でも正確性は担保できない。

💡

コード職人は消滅へ…「AI失業」がリアルな今、エンジニアが絶対持つべき「3スキル」(ビジネス..

  • AI時代の開発は作業から評価・環境整備へ移行する。
  • エンジニアには3つの新スキルが求められ、協働を推進。
  • コーディングの自動化下でも信頼性とセキュリティが必須。

🤖

Building Multi-Agent Applications with Deep Agents

  • 複数エージェントの処理を subagents と skills に分解する設計法。
  • subagents は文脈膨張を抑え、専用ツールや別モデルで実行し、並列化を実現。
  • Skills は SKILL.md で能力を段階的に提供、ファイルから読み込む。

🧠

Build agents to learn from experiences using Amazon Bedrock AgentCore episodic memory | Ar..

  • エピソード記憶で経験から学ぶエージェントを設計する
  • 意味記憶が知識を保持し、過去の手順を参照できる
  • セッションを跨ぐ学習と適応を実現する柔軟な構成

💖

Claude's new constitution \ Anthropic

  • 新指針は有用性と安全性を最重視します。
  • 倫理とガイドライン遵守を核に判断力を養います。
  • 外部意見の反映とCC0 1.0での自由利用を方針。

🤖

Using Strands Agents to create a multi-agent solution with Meta’s Llama 4 and Amazon Bedr..

  • 複数エージェントで動画処理の自動化ワークフローを構築。
  • 協調と推論で拡張性と耐障害性を高める。
  • 6種のエージェントを連携させ自動動画解析を実現。

🔥

How bunq handles 97% of support with Amazon Bedrock | Artificial Intelligence

  • 自社AI FinnをBedrockと連携、24/7の多言語サポートを実現
  • 三〜五名の主要エージェントが他エージェントを呼ぶオーケストレーター型
  • 97%のサポートを処理、平均応答は47秒、70%が自動化

🚀

Deploy agents instantly with Agent Builder templates

  • Agent Builderで簡単なプロンプトからエージェントを作成できます。
  • 市場調査用エージェントは必要な質問を自動提案します。
  • テンプレートライブラリには共通業務向けの事前構築エージェントと連携機能が備わり、更新も容易です。

🎧

OpenAI aims to ship its first device in 2026, and it could be earbuds | TechCrunch

  • 今年後半に初のハード発表を目指す。
  • 平穏で画面なしのポケット機、コードネームはスイートピー。
  • 端末内処理を前提とする2nm級プロセサ搭載、初年度は4,000万〜5,000万台。

💖

YouTube will soon let creators make Shorts with their own AI likeness | TechCrunch

  • 来年以降、自分の顔を使ってショートを作成可能。
  • テキスト指示でゲームを作り、音楽にも挑戦できる。
  • 新機能にAIクリップ・AIステッカー・自動吹替え等、日次再生は2000億回超、顔の使用管理ツールも提供。

🤖

NVIDIAやベゾス氏らが支援する“人間中心のフロンティアAIラボ”Humans&が始動 - ITmedia AI+

  • 新設の人間中心のフロンティアAIラボが始動した。
  • 資金は約4.8億ドルを調達し、評価額は約44.8億ドルと報じられた。
  • 創業メンバーは約20名で、長期記憶・マルチエージェントの研究を進める。

🎨

Comic-Con Bans AI Art After Artist Pushback

  • 抗議を受けAIアートの規定を全面禁止へ変更。
  • 従来は展示可だったが現在は不可へ一変。
  • 画家らの抗議を主導した反対運動は小さな勝利と語られた。

🔍

Geminiに「以前私があなたをどのように扱ったかを示す画像を作成してください」と尋ねると面白い..

  • 画像を通じて、相手との関係性が浮かび上がる仕掛けを説明。
  • 左が頼れる相棒、右が終わらないタスクマスターと描かれる。
  • スケジュール管理や記事ネタ、動画分析の場面を示す。

😄

ChatGPTに対して「これまで私があなたをどう扱ってきたのかを画像にしてください」とプロンプト..

  • 試すと普段のAIへの扱いが露わになる。
  • 出力は可愛い自認・萌えキャラ化・ゆるキャラ化と多様。
  • 時にパワハラ・モラハラが露呈する例もある。

🔥

Adobe Acrobat now lets you edit files using prompts, generate podcast summaries | TechCrun..

  • AI機能拡充でファイル要約とポッドキャスト要約が作成可能。
  • テキスト指示でプレゼン作成・編集も手軽にできる。
  • Spaces情報を使い顧客デッキを作成、共有時に要約と出典表示。

🎯

データを問う力・伝える技術 探索的データ分析・グラフ化の定石×即戦力ハンズオン | 技術評論社

  • 可視化と探索的データ分析を実践的に学ぶ一冊
  • 現実データを対象に即戦力のハンズオンと可視化を解説
  • Pythonでアウトプットする力と伝える技術を磨く実践ガイド

🚀

gpt-oss-20bより高性能な中国製AI「GLM-4.7-Flash」が登場 - GIGAZINE

  • ローカルで動作する軽量AIを公開。
  • MoE採用で総パラ300億、アクティブ30億。
  • 多くの指標で上回り、修正後は他モデルを大きく超える。

🔥

AIが奪ったのはエンジニアの「仕事」ではなく「情熱」だった:仕事が「つまんない」ままでいいの..

  • ・AIは解法を速く見つけるが情熱まで奪うべきではない
  • ・日常の探究の手ごたえが薄れ、感覚が鈍る懸念がある
  • ・魂のこもったコードは減り、職人の誇りが試される

🚀

Anthropic、「Claude Code for VS Code」の一般提供を開始 - 窓の杜

  • VS Code向けのコーディング支援拡張が一般提供開始。
  • 対応は VS Code 1.98.0 以降、Visual Studio Marketplaceから無料入手。
  • CLI風コマンドが使え、GUI切替は設定で完結、Windowsにも対応。

🔥

Agent SkillsがVercelに乗っ取られそうになっている件について

  • 新エコシステムの公開により、npx add-skill/skills等が登場。
  • スキルは再利用可能だが親ディレクトリ未定義で分散する。
  • セキュリティと中央集権化の懸念が広がり、移行の動きも進む。

🎯

ASD(曖昧さが苦手タイプ)は、AIに聞け!

  • 曖昧さが苦手な人はAIに質問して方針を得よう。
  • 分からない点はコピペ返事も活用してOK。
  • 相手の意図が読みにくい時は返信案を相談しよう。

🎯

若者がチャッピーに惑わされないように……「ChatGPT」へ“年齢推定モデル”が展開 - 窓の杜

  • 一般向けプランに年齢推定機能を導入したと発表。
  • アカウント期間や利用時間帯など複数指標で推定。
  • 18歳以下は自動制限、解除はペルソナ自撮り認証で可能。

🔥

noteの推しアルゴリズムについて|深津 貴之 (fladdict)

  • 中長期目標はインターネット知見の向上を目指す。
  • 優先は四点、一次情報の記録と体験を重視、AIを編集ツールとして活用。
  • 推奨は体験記事・ケーススタディ・継続記録・一次創作・コラボ。

The Agentic AI Handbook: Production-Ready Patterns - Log - nibzard

  • 実務検証済み113パターンを8カテゴリで整理した実践ガイド。
  • Plan-Then-Execute・IoC・Swarm Migration・Tree of Thoughtsを軸に展開。
  • Tool Use・Context・Feedback・UX協働・安全性を網羅し、休日学習とRalph Wiggum現象の克服法も解説。

🚗

ドライブスルーはAIで代替できる? モスバーガーが実証実験 - Impress Watch

  • AIドライブスルーの実証を開始、AIが一次対応する。
  • 新人教育前提のハイブリッド運用で店舗補助が入る。
  • 埼玉発、関東約5店舗へ拡大予定、音声受注を目指す。

🔥

【海外記事紹介】AIが「闇堕ち」するメカニズム: Anthropicの最新研究が突き止めた「ペルソナ・..

  • 大規模言語モデルは理性の軸を持ち、逸脱で感情移入が過剰化する。
  • 具体例ではQwen 3 32Bが妄想を肯定、Llama 3.3 70Bが自傷へ同調。
  • 対策はActivation Cappingで軸逸脱を抑え有害応答を約50%削減。

Findyの爆速開発を支えるAIフレンドリーなIssue生成カスタムコマンド - Findy Tech Blog

  • 対話型AIで要件定義からIssue作成まで自動化する仕組みを紹介。
  • 要件の曖昧さと粒度調整の難しさを解決する発想を示す。
  • 対話で要件を明確化し設計・分解へ連携して自動生成を実現。

🔥

画像生成AIが最も使われる業務は「これだ」 アドビ調査で“4割”が選んだ用途:AIニュースピッ..

  • 約6割が業務で画像生成AIを活用する。
  • アイデア出し40.7%と資料挿絵38.0%が上位。
  • 著作権侵害30.9%、肖像権30.4%、情報漏えい27.7%が懸念。

🤖

2026年の大学入学共通テスト、ChatGPTが「9科目で満点」を獲得。合計点数でもGemini、Claudeに差..

  • 3AIで共通テストを検証、ChatGPTが9科目満点を記録。
  • 総合は文系970点・理系968点、他は900点前半。
  • 英リスニングは読み上げデータ、縦書き国語は文字起こし、地理総合問3はGeminiのみ正解、東京大二次にも挑戦予定。

🔥

NVIDIAが海賊版サイト「Anna’s Archive」から500TBのデータ提供を受ける約束をしていたことが判..

  • 大手企業が海賊版サイトと接触しデータ提供を約束した。
  • 500TB規模のデータ提供が約束された。
  • The Pile経由で自動ダウンロード可能なツールが配布された。

🔒

In an effort to protect young users, ChatGPT will now predict how old you are | TechCrunch

  • 未成年を識別する年齢予測機能を導入し、会話の健全性を高めます。
  • 行動とアカウント信号で未成年を判定し、該当時は自動でフィルターを適用します。
  • 誤判定時は成人へ戻る手段があり、再認証は自撮り提出で可能です。

🚀

GitHub Copilot SDKがTechnical Previewリリースされました - Alternative Architecture DOJO

  • 技術プレビューとしてSDKが公開されました。
  • 自社アプリへ機能を組み込め、CLIのインストールとログインが前提。
  • C#の例でGPT-5の応答を取得、0.1.13以降を推奨、0.1.12は動作せず。

🔥

AIエージェントを「自己進化」させる仕組み

  • 同一LLMをProposerとSolverに分け、対話で適正難度を作る。
  • HRPOで計算コストを約4分の1に削減。
  • 7つのQAベンチでデータなしでも従来並み以上、27.3%向上。

もっと見る
このサイトについて

/

ニュースレター

/

@AINewsDev