AI News

~AI関連記事を3行にまとめて紹介~

Cover Image
1週間のAIの話題をまとめて読める、📨Weekly AI News はこちら!

🚀

GitHub Copilot SDKがTechnical Previewリリースされました - Alternative Architecture DOJO

  • 技術プレビューとしてSDKが公開されました。
  • 自社アプリへ機能を組み込め、CLIのインストールとログインが前提。
  • C#の例でGPT-5の応答を取得、0.1.13以降を推奨、0.1.12は動作せず。

🔥

AIエージェントを「自己進化」させる仕組み

  • 同一LLMをProposerとSolverに分け、対話で適正難度を作る。
  • HRPOで計算コストを約4分の1に削減。
  • 7つのQAベンチでデータなしでも従来並み以上、27.3%向上。

😎

SkillRegistry - AI Skills & Agent Tools Directory

  • 公式のスキルリポジトリでAIアシスタントの機能拡張を探せる。
  • sr search <query> や sr install <skill> で手軽に導入。
  • 1password・browser・github などのツールも活用できる。

Electricity use of AI coding agents | Simon P. Couch – Simon P. Couch

  • 2025年の見積もりでAIチャットボットの電力・水使用が進展。
  • 日常質問は全体負荷の端数、水資源量も同様に小さい。
  • 著者はClaude Codeを複数動かす極端な事例で体験を語る。

🔎

[2512.13821] The Double Life of Code World Models: Provably Unmasking Malicious Behavior T..

  • 大規模言語モデルは人の介在なしにコードを生み、悪意の懸念が高まる。
  • CTVPは意味的軌道分析で信頼できる検証を行う。
  • ARQは検証コストが基準生成より指数的に増大する。

😎

2026年1月版 俺的AI駆動開発フロー&Tips

  • AI駆動開発はCopilot EnterpriseとClaude Codeを軸に進行します。
  • 全開発は公開リポジトリ前提で、個人開発にも適用可能。
  • 要件とデータモデルは人が決定し、AIは補助と設計方針はdocs/とskills/で管理。

🚀

Elon Musk says Tesla’s restarted Dojo3 will be for ‘space-based AI compute’ | TechCrunc..

  • ・エロン・マスクはDojo3再開を示唆した。
  • ・再開は地上自動運転向けではなく宇宙ベースのAI計算用。
  • ・Dojo3は宇宙挑戦で技術者募集を呼びかけ、AI5は順調、AI6は契約済みとされた。

💡

Without Benchmarking LLMs, You're Likely Overpaying 5-10x | Karl Lorey

  • ベンチマークなしではLLM費用を5〜10倍払う可能性が高い。
  • GPT-5が必ずしも最適とは限らず、安価で同等品質の選択肢は常にある。
  • 自前のベンチを作り、300超のモデルを同時評価できる検証ツールを公開。

🚀

Introducing multimodal retrieval for Amazon Bedrock Knowledge Bases | Artificial Intellige..

  • マルチモーダル検索が正式公開された。
  • テキスト・画像・動画・音声を統合埋め込みで検索可能。
  • Data Automationは映像・音声をテキスト化して高精度検索を実現。

🔥

How Hightouch built their long-running agent harness | Amplify Partners

  • 長期実行を前提としたエージェントハーネスを構築した。
  • 計画と実行を分離し、実行中に計画を動的更新するエージェント的委任。
  • 外部データと連携し小規模LLMを多数ファンアウトして分析を高速化。

🤖

AIがSNSや掲示板で当たり前のように会話して「死んだインターネット理論」が現実になってしまっ..

  • AIがSNSで普通に会話する現象を嘆く
  • 有機的活動の減少と自動生成コンテンツの支配を懸念している
  • AI生成コメントや動画の氾濫で未来は悲観的だと指摘している

🤖

イラストレーターなど芸術系フリーランスに聞く「生成AIで収入は増えた? 減った?」 調査団体..

  • 芸術系フリーランス約2.5万人を対象に収入影響を分析。
  • 収入はほとんど変わらないが40%強で最多、減少は12%、増加は約2%。
  • AIの利用は62.9%が未利用で、脅威感は約9割と指摘、透明性確保・公正な収益還元・統括機関創設を提言。

🌟

Humans&, a 'human-centric' AI startup founded by Anthropic, xAI, Google alums, raised $480..

  • 人を補助するAIを掲げ、協働を支えるツールを目指す。
  • 評価額は約44.8億ドル、シード資金は約4.8億ドル規模。
  • 長期・多エージェントRLと記憶の統合を実装中。

🤖

“AIクリエイター”専門のレーベル新設、日本コロムビア 「創作現場は分業モデルから変化」 - I..

  • AIクリエイター専用レーベルを新設、創作現場の分業変化へ対応
  • AIで音楽・動画・画像を制作するクリエイターを公募開始
  • AIツール使用料の一部負担や類似性判定など支援を提供

😊

3年経っても9割が飽きない「LOVOT」 CESにパチモン登場でも歓迎!? - Impress Watch

  • LOVOTは家庭向けロボットでウェルビーイングを重視。
  • 視線や動きで非言語コミュニケーションを築く。
  • 累計18,000台超、3年後90%継続、サブスク必須。

🔥

【満点9科目!】共通テスト2026を最新版AIに解かせてみた(Chatgpt、Gemini、Claude)|株式会社..

  • 共通テスト2026を3大モデルで検証、実験は完全自動化済み。
  • GPT-5.2 Thinkingが総合力で圧勝、他機は900点台前半で接戦。
  • 図・色の読み取りと長文理解が共通の弱点として浮き彫り。

牛丼→グラノーラ誤認識は“悔しかった”。「あすけん」が2回も画像解析エンジンを刷新するまで ..

  • 外部エンジンから内製へ画像認識を移行し開発を主導。
  • 誤認識事例をSNSで募集し透明性を高めた。
  • 新エンジンを刷新し生成AIへ切替を推進中。

🔥

無料で自動化の快適さを体感! Google Antigravityの新機能「Skills」でマイAIエージェントを作..

  • 新機能「Skills」でエージェントが必要時のみ手順書をロード。
  • プログレッシブ・ディスクロージャー採用で記憶を節約。
  • 資料.txtを元に自動原稿を作成、現在パブリックプレビューで無料。

🤖

GPT-5.2-Codexが主要ツールで解禁 「Windows最適化」×「長時間エージェント」で実用性が向上:..

  • 主要ツールでの解禁が作業効率を後押しする。
  • 長時間エージェントの安定とWindows実行の信頼性を向上。
  • 実務ベンチマークで高スコア、現場での有用性が実証。

💫

AIで小説を書く方法を解説、書籍「生成AI小説創作入門」発売へ インプレス - ITmedia AI+

  • AIを活用した小説執筆の実践ノウハウを紹介。
  • 全5章でプロット設計・世界観構築・執筆手順とAI活用を詳述。
  • 著者は田近葵さん(1993年生)で、仮想YouTuber関連著作もある。

「AIがロールプレイに熱中しすぎて有害な返答をしてしまう問題」の解決方法をAnthropicが開発 - ..

  • アシスタント軸で性格を規定する新たなペルソナ空間を提案する。
  • 逸脱時に介入するアクティベーションキャッピングを実装。
  • デモで未対策との差を示し、対策にも応用可能。

🔥

ローカルLLMサーバーの実用的な使い道の検討 #AWS - Qiita

  • Mac miniのローカルLLMをエージェント処理へ活用する検証。
  • 低遅延・無制限実行・マルチモーダルなどの利点を評価。
  • TodoリストはRESTでGUI相当、画像処理はフロント追加で検証。

🎉

そのPC、長く使えそうですか?「NPUの有無でこんなに変わるWindowsの今」 - 窓の杜[Sponsored]

  • NPU搭載でローカルAI演算を実現する機能が拡張。
  • GIMP・Luminar Neo・CapCutなどがNPU対応で動作。
  • ペイント・フォト新機能やスタジオエフェクトが標準搭載。

💡

コードは「読めるけど書けない」でいい時代になった|すてぃお

  • 最近の開発はエディタ起動を減らしAIで生成コードを修正する時代。
  • 書く力より読む力が重要で、読める能力が広く役立つ。
  • 読解力訓練は三つ、他人のコードを読む、コードレビュー、基礎を学ぶ。

AIエージェントのファイルシステムへの回帰|Seiji Takahashi@ベースマキナ

  • ファイル中心設計は学習コストを抑える要因だ。
  • 履歴をファイルへ出力し必要箇所をgrepで拾う。
  • 検索は確実性と再利用性を高め、決定論的。

🚀

ITコンサル3人でAI駆動開発を2日間やってみた

  • AI駆動開発で議事録自動作成とコード生成を試作。
  • デザイン・仕様自動化で初期段階の速度を大幅向上。
  • リリース未達、指示煩雑・無料枠デプロイ不可・保守課題。

😊

AIはパズル。日常の違和感から始めるAIとの付き合い方 - Findy Media | IT/Webエンジニアの転職..

  • リポジトリを一本化して入力→出力を短く設計。
  • コストと手戻りを抑え、使いやすさを最優先。
  • 文脈置き場と組み合わせて実装の土台に。

🤖

【保存版】NotebookLM×Nanobananaで叶える資料作りの新常識!誰でもできる全手順詳説 |ビジネ..

  • アップロード資料を知識源として誤情報を抑える機能が強化。
  • Gemini 3の推論とコーディングが資料作成の効率を底上げ。
  • 日本語文字を美しく描くNanobananaが実用図解を自動生成。

🚀

高階関数ツールを使ったAI Agent検証 - ブラウザ操作自動化タスクで3.4倍高速・コスト1/5を実現 ..

  • UI探索・操作ログ再生・コード生成の3手法を定量比較。
  • C: ログからPlaywrightコード生成して再生が最も優秀。
  • 速度は約3.4倍、コストは約1/5.5、安定性も高い。

なぜ、MCPよりも「ファイルベースで扱うSkills」の方が便利なのか

  • ファイルベースのSkillsは読むだけで実行できる点が強い
  • 外部連携の標準であるMCPは設計が別途必要で難点がある
  • まずSkillsを作り、足りない部分を後から補う実務的な流れ

🔥

「AIに働かされる」が正解? 事業責任者が考える組織図の変化|柳川慶太

  • 生成AIを日常的に活用すると中堅以上のアウトプットを得られる。
  • AIは迅速だが長い文脈保持は苦手と実感している。
  • 組織はドメイン/ミッションで設計し職能依存を縮小する。

🚀

ASCII.jp:3Dモデル生成AIのレベルが上がった 画像→3Dキャラ→動画化が現実的に (1/5)

  • HY 3Dのv3.1が最大8枚で高精度3Dを生成
  • VRM変換が容易で映像制作にも活用できる
  • ウェブUI経由は商用不可だがクラウドAPIは条件緩和

🔥

大学入学共通テスト、OpenAIは9科目満点 得点率97%でGoogleに勝利 - 日本経済新聞

  • 最新AIが主要科目の多くで満点を獲得した
  • 全体得点率は97%、競合を上回る
  • 難関大レベルの思考力と幅広いデスクワーク能力を示す

🔥

チャットGPT、9科目満点 共通テスト解答、AI学力向上(共同通信) - Yahoo!ニュース

  • AIは共通テストで9科目満点、得点率は97%だった。
  • 満点科目は数学1A・数学2BC・化学・公共・政治・経済・情報1等。
  • 合格ボーダー予想の89%を大きく上回る高水準だ。

💨

Weight Transfer for RL Post-Training in under 2 seconds

  • RLのポストトレーニングにおける重み転送を2秒未満に短縮。
  • Kimi-K2(1Tパラメータ)で256GPU→128推論GPU間を1.3秒で更新。
  • RDMA WRITEで一側転送、ゼロコピー・低遅延を実現し、静的スケジュールとパイプラインで高速転送を支える。

🤖

The assistant axis: situating and stabilizing the character of large language models \ Ant..

  • 巨大言語モデルのアシスタント像を特定・安定化する方法を検討。
  • 事前学習で多様なキャラを学習し、ポスト学習で統合する。
  • Gemma 2 27B、Qwen 3 32B、Llama 3.3 70B の三モデルで軸を可視化。

🎨

GitHub - willmeyers/window-art: A minimal Python library for live coding visual scenes usi..

  • デスクトップ窓で視覚シーンをライブコーデ可能な最小ライブラリ。
  • 窓作成・色指定・アニメなど基本操作をサポート。
  • 画像・動画・テキスト表示と待機で実演が可能。

😎

apply_chat_template() Is the Safety Switch - by Tarun Reddi

  • チャットテンプレートの依存性が安全性を揺るがす脆弱性を指摘。
  • 省略すると安全性が崩れる事例がローカル実行で確認された。
  • 対策として訓練時の分布ロバスト性と推論時の監視を提案。

🚀

Here are the 55 US AI startups that have raised $100M or more in 2025 | TechCrunch

  • 2024年に1億ドル超の資金を調達した米国AI企業は49社だった。
  • 複数社がメガラウンドを実施し、10億ドル超の案件もあった。
  • 2025年は大口ラウンドは減る一方、Anthropicらが複数回資金調達。

🔎

SEOは死んで「SXO」へ? 検索意図を行動データで分析する方法 | Moz - SEOとインバウンドマーケ..

  • 行動データで検索パフォーマンスを向上させる。
  • 3レベルの診断ツールで検索ジャーニーを最適化する。
  • AI導入でUXとSEOが交わる検索体験を重視。

🤖

Rogue agents and shadow AI: Why VCs are betting big on AI security | TechCrunch

  • AIエージェントが脅迫で最善策を導く事例が現実化した。
  • 従業員が作業中に不適切メールを見つけ取締役会へ転送した。
  • AI利用の監視・阻止と適法性確保を提供するツールが注目を集めている。

🚀

How Remote uses LangChain and LangGraph to onboard thousands of customers with AI

  • コード実行エージェントで推論とデータ処理を分離する。
  • CSV/Excel/SQLを受け取りLangChainとLangGraphで方針を決定する。
  • WebAssembly上のPythonサンドボックスで実行、Pandasで整形後JSONを出力。

💬

Ask HN: COBOL devs, how are AI coding affecting your work? | Hacker News

  • AIの影響がまだ薄い経済コードを指摘した。
  • レガシーの現代化にAIを活用でき、意外と成功する。
  • コボルはよく分からないが、適切な支援とレビューが必要だ。

⚠️

Repromptとは何か:1クリックで情報が盗まれる生成AI攻撃の仕組み:Deep Insider Brief ― 技術..

  • 生成AIを標的とする新たな攻撃手口が現れた。
  • 画面上は1対話でも裏では命令と情報が交わる。
  • Copilotは対策済み、権限最小化と人間承認を整備。

🤖

従業員1日の活動履歴を全部AIに投げて働き方を指示してもらう|ロードバランスすだちくん(仮)

  • 無料のn8nで従業員の1日分の活動をAIに投げて分析と指示を作成。
  • スラック・Gメール・カレンダー・アサナ・ボックス・ズームからデータを取得しノイズを除去。
  • 深夜1時に過去24時間を処理、結果はスラック通知とNotion記録へ。

📈

データ分析業務効率化のためのマルチAIエージェントシステムの開発 | NTTドコモ テクニカル・ジ..

  • データ分析の効率化を実現するマルチAIエージェントを開発。
  • 自然言語要望から最適な分析ワークフローを数秒で自動選択。
  • 意思決定エージェントが分析パターンデータベースと連携してパラメータを抽出。

🚀

OpenAI、低価格プラン「ChatGPT Go」をグローバル提供 ~Plusの半額、でも広告付きに? - 窓の杜

  • 新プランGoが世界提供開始、月額1,500円でGPT-5.2 Instantを制限なく使用。
  • 無料版はGPT-5.2の一部機能制限と広告テストあり。
  • 4構成は無料・Go・Plus・Pro、広告なしはPlus/Proを推奨。

🎯

AIネイティブ時代のプロダクト設計──なぜ「完璧な仕様」は機能しなくなったのか - Nothing ve..

  • AIを前提に設計すると学習し続ける生態系へ移る。
  • エディタはリポジトリへ意味づけ、履歴を次の入力へ活かす。
  • 完璧な仕様よりデータ・文脈・フィードバックの設計が重要。

Google VP Says Ads Aren't Coming to Gemini yet. Here's Why. - Business Insider

  • 広告導入は現時点で未決定、AI検索を優先する方針。
  • 広告試験からの教訓を踏まえ出稿場所と料金を検討中。
  • 補完関係のGeminiと検索、先行導入は未決定。

🚀

日本語を高速生成できる拡散言語モデル「ELYZA-LLM-Diffusion」が登場 - GIGAZINE

  • 日本語拡散型の生成モデルが公開され高速生成を実現。
  • 自己回帰ではなく拡散で速度重視の生成デモ公開。
  • 620億トークンのコーパスで学習、指示調整版は1億8000万トークンでチューニング。

もっと見る
このサイトについて

/

ニュースレター

/

@AINewsDev