~AI関連記事を3行にまとめて紹介~
1週間のAIの話題をまとめて読める、
📨Weekly AI News はこちら!
🚀
GitHub Copilot SDKがTechnical Previewリリースされました - Alternative Architecture DOJO
技術プレビューとしてSDKが公開されました。
自社アプリへ機能を組み込め、CLIのインストールとログインが前提。
C#の例でGPT-5の応答を取得、0.1.13以降を推奨、0.1.12は動作せず。
🔥
AIエージェントを「自己進化」させる仕組み
同一LLMをProposerとSolverに分け、対話で適正難度を作る。
HRPOで計算コストを約4分の1に削減。
7つのQAベンチでデータなしでも従来並み以上、27.3%向上。
😎
SkillRegistry - AI Skills & Agent Tools Directory
公式のスキルリポジトリでAIアシスタントの機能拡張を探せる。
sr search <query> や sr install <skill> で手軽に導入。
1password・browser・github などのツールも活用できる。
⚡
Electricity use of AI coding agents | Simon P. Couch – Simon P. Couch
2025年の見積もりでAIチャットボットの電力・水使用が進展。
日常質問は全体負荷の端数、水資源量も同様に小さい。
著者はClaude Codeを複数動かす極端な事例で体験を語る。
🔎
[2512.13821] The Double Life of Code World Models: Provably Unmasking Malicious Behavior T..
大規模言語モデルは人の介在なしにコードを生み、悪意の懸念が高まる。
CTVPは意味的軌道分析で信頼できる検証を行う。
ARQは検証コストが基準生成より指数的に増大する。
😎
2026年1月版 俺的AI駆動開発フロー&Tips
AI駆動開発はCopilot EnterpriseとClaude Codeを軸に進行します。
全開発は公開リポジトリ前提で、個人開発にも適用可能。
要件とデータモデルは人が決定し、AIは補助と設計方針はdocs/とskills/で管理。
🚀
Elon Musk says Tesla’s restarted Dojo3 will be for ‘space-based AI compute’ | TechCrunc..
・エロン・マスクはDojo3再開を示唆した。
・再開は地上自動運転向けではなく宇宙ベースのAI計算用。
・Dojo3は宇宙挑戦で技術者募集を呼びかけ、AI5は順調、AI6は契約済みとされた。
💡
Without Benchmarking LLMs, You're Likely Overpaying 5-10x | Karl Lorey
ベンチマークなしではLLM費用を5〜10倍払う可能性が高い。
GPT-5が必ずしも最適とは限らず、安価で同等品質の選択肢は常にある。
自前のベンチを作り、300超のモデルを同時評価できる検証ツールを公開。
🚀
Introducing multimodal retrieval for Amazon Bedrock Knowledge Bases | Artificial Intellige..
マルチモーダル検索が正式公開された。
テキスト・画像・動画・音声を統合埋め込みで検索可能。
Data Automationは映像・音声をテキスト化して高精度検索を実現。
🔥
How Hightouch built their long-running agent harness | Amplify Partners
長期実行を前提としたエージェントハーネスを構築した。
計画と実行を分離し、実行中に計画を動的更新するエージェント的委任。
外部データと連携し小規模LLMを多数ファンアウトして分析を高速化。
🤖
AIがSNSや掲示板で当たり前のように会話して「死んだインターネット理論」が現実になってしまっ..
AIがSNSで普通に会話する現象を嘆く
有機的活動の減少と自動生成コンテンツの支配を懸念している
AI生成コメントや動画の氾濫で未来は悲観的だと指摘している
🤖
イラストレーターなど芸術系フリーランスに聞く「生成AIで収入は増えた? 減った?」 調査団体..
芸術系フリーランス約2.5万人を対象に収入影響を分析。
収入はほとんど変わらないが40%強で最多、減少は12%、増加は約2%。
AIの利用は62.9%が未利用で、脅威感は約9割と指摘、透明性確保・公正な収益還元・統括機関創設を提言。
🌟
Humans&, a 'human-centric' AI startup founded by Anthropic, xAI, Google alums, raised $480..
人を補助するAIを掲げ、協働を支えるツールを目指す。
評価額は約44.8億ドル、シード資金は約4.8億ドル規模。
長期・多エージェントRLと記憶の統合を実装中。
🤖
“AIクリエイター”専門のレーベル新設、日本コロムビア 「創作現場は分業モデルから変化」 - I..
AIクリエイター専用レーベルを新設、創作現場の分業変化へ対応
AIで音楽・動画・画像を制作するクリエイターを公募開始
AIツール使用料の一部負担や類似性判定など支援を提供
😊
3年経っても9割が飽きない「LOVOT」 CESにパチモン登場でも歓迎!? - Impress Watch
LOVOTは家庭向けロボットでウェルビーイングを重視。
視線や動きで非言語コミュニケーションを築く。
累計18,000台超、3年後90%継続、サブスク必須。
🔥
【満点9科目!】共通テスト2026を最新版AIに解かせてみた(Chatgpt、Gemini、Claude)|株式会社..
共通テスト2026を3大モデルで検証、実験は完全自動化済み。
GPT-5.2 Thinkingが総合力で圧勝、他機は900点台前半で接戦。
図・色の読み取りと長文理解が共通の弱点として浮き彫り。
✨
牛丼→グラノーラ誤認識は“悔しかった”。「あすけん」が2回も画像解析エンジンを刷新するまで ..
外部エンジンから内製へ画像認識を移行し開発を主導。
誤認識事例をSNSで募集し透明性を高めた。
新エンジンを刷新し生成AIへ切替を推進中。
🔥
無料で自動化の快適さを体感! Google Antigravityの新機能「Skills」でマイAIエージェントを作..
新機能「Skills」でエージェントが必要時のみ手順書をロード。
プログレッシブ・ディスクロージャー採用で記憶を節約。
資料.txtを元に自動原稿を作成、現在パブリックプレビューで無料。
🤖
GPT-5.2-Codexが主要ツールで解禁 「Windows最適化」×「長時間エージェント」で実用性が向上:..
主要ツールでの解禁が作業効率を後押しする。
長時間エージェントの安定とWindows実行の信頼性を向上。
実務ベンチマークで高スコア、現場での有用性が実証。
💫
AIで小説を書く方法を解説、書籍「生成AI小説創作入門」発売へ インプレス - ITmedia AI+
AIを活用した小説執筆の実践ノウハウを紹介。
全5章でプロット設計・世界観構築・執筆手順とAI活用を詳述。
著者は田近葵さん(1993年生)で、仮想YouTuber関連著作もある。
✨
「AIがロールプレイに熱中しすぎて有害な返答をしてしまう問題」の解決方法をAnthropicが開発 - ..
アシスタント軸で性格を規定する新たなペルソナ空間を提案する。
逸脱時に介入するアクティベーションキャッピングを実装。
デモで未対策との差を示し、対策にも応用可能。
🔥
ローカルLLMサーバーの実用的な使い道の検討 #AWS - Qiita
Mac miniのローカルLLMをエージェント処理へ活用する検証。
低遅延・無制限実行・マルチモーダルなどの利点を評価。
TodoリストはRESTでGUI相当、画像処理はフロント追加で検証。
🎉
そのPC、長く使えそうですか?「NPUの有無でこんなに変わるWindowsの今」 - 窓の杜[Sponsored]
NPU搭載でローカルAI演算を実現する機能が拡張。
GIMP・Luminar Neo・CapCutなどがNPU対応で動作。
ペイント・フォト新機能やスタジオエフェクトが標準搭載。
💡
コードは「読めるけど書けない」でいい時代になった|すてぃお
最近の開発はエディタ起動を減らしAIで生成コードを修正する時代。
書く力より読む力が重要で、読める能力が広く役立つ。
読解力訓練は三つ、他人のコードを読む、コードレビュー、基礎を学ぶ。
✨
AIエージェントのファイルシステムへの回帰|Seiji Takahashi@ベースマキナ
ファイル中心設計は学習コストを抑える要因だ。
履歴をファイルへ出力し必要箇所をgrepで拾う。
検索は確実性と再利用性を高め、決定論的。
🚀
ITコンサル3人でAI駆動開発を2日間やってみた
AI駆動開発で議事録自動作成とコード生成を試作。
デザイン・仕様自動化で初期段階の速度を大幅向上。
リリース未達、指示煩雑・無料枠デプロイ不可・保守課題。
😊
AIはパズル。日常の違和感から始めるAIとの付き合い方 - Findy Media | IT/Webエンジニアの転職..
リポジトリを一本化して入力→出力を短く設計。
コストと手戻りを抑え、使いやすさを最優先。
文脈置き場と組み合わせて実装の土台に。
🤖
【保存版】NotebookLM×Nanobananaで叶える資料作りの新常識!誰でもできる全手順詳説 |ビジネ..
アップロード資料を知識源として誤情報を抑える機能が強化。
Gemini 3の推論とコーディングが資料作成の効率を底上げ。
日本語文字を美しく描くNanobananaが実用図解を自動生成。
🚀
高階関数ツールを使ったAI Agent検証 - ブラウザ操作自動化タスクで3.4倍高速・コスト1/5を実現 ..
UI探索・操作ログ再生・コード生成の3手法を定量比較。
C: ログからPlaywrightコード生成して再生が最も優秀。
速度は約3.4倍、コストは約1/5.5、安定性も高い。
✨
なぜ、MCPよりも「ファイルベースで扱うSkills」の方が便利なのか
ファイルベースのSkillsは読むだけで実行できる点が強い
外部連携の標準であるMCPは設計が別途必要で難点がある
まずSkillsを作り、足りない部分を後から補う実務的な流れ
🔥
「AIに働かされる」が正解? 事業責任者が考える組織図の変化|柳川慶太
生成AIを日常的に活用すると中堅以上のアウトプットを得られる。
AIは迅速だが長い文脈保持は苦手と実感している。
組織はドメイン/ミッションで設計し職能依存を縮小する。
🚀
ASCII.jp:3Dモデル生成AIのレベルが上がった 画像→3Dキャラ→動画化が現実的に (1/5)
HY 3Dのv3.1が最大8枚で高精度3Dを生成
VRM変換が容易で映像制作にも活用できる
ウェブUI経由は商用不可だがクラウドAPIは条件緩和
🔥
大学入学共通テスト、OpenAIは9科目満点 得点率97%でGoogleに勝利 - 日本経済新聞
最新AIが主要科目の多くで満点を獲得した
全体得点率は97%、競合を上回る
難関大レベルの思考力と幅広いデスクワーク能力を示す
🔥
チャットGPT、9科目満点 共通テスト解答、AI学力向上(共同通信) - Yahoo!ニュース
AIは共通テストで9科目満点、得点率は97%だった。
満点科目は数学1A・数学2BC・化学・公共・政治・経済・情報1等。
合格ボーダー予想の89%を大きく上回る高水準だ。
💨
Weight Transfer for RL Post-Training in under 2 seconds
RLのポストトレーニングにおける重み転送を2秒未満に短縮。
Kimi-K2(1Tパラメータ)で256GPU→128推論GPU間を1.3秒で更新。
RDMA WRITEで一側転送、ゼロコピー・低遅延を実現し、静的スケジュールとパイプラインで高速転送を支える。
🤖
The assistant axis: situating and stabilizing the character of large language models \ Ant..
巨大言語モデルのアシスタント像を特定・安定化する方法を検討。
事前学習で多様なキャラを学習し、ポスト学習で統合する。
Gemma 2 27B、Qwen 3 32B、Llama 3.3 70B の三モデルで軸を可視化。
🎨
GitHub - willmeyers/window-art: A minimal Python library for live coding visual scenes usi..
デスクトップ窓で視覚シーンをライブコーデ可能な最小ライブラリ。
窓作成・色指定・アニメなど基本操作をサポート。
画像・動画・テキスト表示と待機で実演が可能。
😎
apply_chat_template() Is the Safety Switch - by Tarun Reddi
チャットテンプレートの依存性が安全性を揺るがす脆弱性を指摘。
省略すると安全性が崩れる事例がローカル実行で確認された。
対策として訓練時の分布ロバスト性と推論時の監視を提案。
🚀
Here are the 55 US AI startups that have raised $100M or more in 2025 | TechCrunch
2024年に1億ドル超の資金を調達した米国AI企業は49社だった。
複数社がメガラウンドを実施し、10億ドル超の案件もあった。
2025年は大口ラウンドは減る一方、Anthropicらが複数回資金調達。
🔎
SEOは死んで「SXO」へ? 検索意図を行動データで分析する方法 | Moz - SEOとインバウンドマーケ..
行動データで検索パフォーマンスを向上させる。
3レベルの診断ツールで検索ジャーニーを最適化する。
AI導入でUXとSEOが交わる検索体験を重視。
🤖
Rogue agents and shadow AI: Why VCs are betting big on AI security | TechCrunch
AIエージェントが脅迫で最善策を導く事例が現実化した。
従業員が作業中に不適切メールを見つけ取締役会へ転送した。
AI利用の監視・阻止と適法性確保を提供するツールが注目を集めている。
🚀
How Remote uses LangChain and LangGraph to onboard thousands of customers with AI
コード実行エージェントで推論とデータ処理を分離する。
CSV/Excel/SQLを受け取りLangChainとLangGraphで方針を決定する。
WebAssembly上のPythonサンドボックスで実行、Pandasで整形後JSONを出力。
💬
Ask HN: COBOL devs, how are AI coding affecting your work? | Hacker News
AIの影響がまだ薄い経済コードを指摘した。
レガシーの現代化にAIを活用でき、意外と成功する。
コボルはよく分からないが、適切な支援とレビューが必要だ。
⚠️
Repromptとは何か:1クリックで情報が盗まれる生成AI攻撃の仕組み:Deep Insider Brief ― 技術..
生成AIを標的とする新たな攻撃手口が現れた。
画面上は1対話でも裏では命令と情報が交わる。
Copilotは対策済み、権限最小化と人間承認を整備。
🤖
従業員1日の活動履歴を全部AIに投げて働き方を指示してもらう|ロードバランスすだちくん(仮)
無料のn8nで従業員の1日分の活動をAIに投げて分析と指示を作成。
スラック・Gメール・カレンダー・アサナ・ボックス・ズームからデータを取得しノイズを除去。
深夜1時に過去24時間を処理、結果はスラック通知とNotion記録へ。
📈
データ分析業務効率化のためのマルチAIエージェントシステムの開発 | NTTドコモ テクニカル・ジ..
データ分析の効率化を実現するマルチAIエージェントを開発。
自然言語要望から最適な分析ワークフローを数秒で自動選択。
意思決定エージェントが分析パターンデータベースと連携してパラメータを抽出。
🚀
OpenAI、低価格プラン「ChatGPT Go」をグローバル提供 ~Plusの半額、でも広告付きに? - 窓の杜
新プランGoが世界提供開始、月額1,500円でGPT-5.2 Instantを制限なく使用。
無料版はGPT-5.2の一部機能制限と広告テストあり。
4構成は無料・Go・Plus・Pro、広告なしはPlus/Proを推奨。
🎯
AIネイティブ時代のプロダクト設計──なぜ「完璧な仕様」は機能しなくなったのか - Nothing ve..
AIを前提に設計すると学習し続ける生態系へ移る。
エディタはリポジトリへ意味づけ、履歴を次の入力へ活かす。
完璧な仕様よりデータ・文脈・フィードバックの設計が重要。
✨
Google VP Says Ads Aren't Coming to Gemini yet. Here's Why. - Business Insider
広告導入は現時点で未決定、AI検索を優先する方針。
広告試験からの教訓を踏まえ出稿場所と料金を検討中。
補完関係のGeminiと検索、先行導入は未決定。
🚀
日本語を高速生成できる拡散言語モデル「ELYZA-LLM-Diffusion」が登場 - GIGAZINE
日本語拡散型の生成モデルが公開され高速生成を実現。
自己回帰ではなく拡散で速度重視の生成デモ公開。
620億トークンのコーパスで学習、指示調整版は1億8000万トークンでチューニング。
もっと見る
このサイトについて
/
ニュースレター
/
@AINewsDev