~AI関連記事を3行にまとめて紹介~
1週間のAIの話題をまとめて読める、
📨Weekly AI News はこちら!
🚀
GitHub - mlse-jssst/ai-and-agile-future: Future Scenario of AI-Agile Interaction in 2030 a..
最新版は v1.1で、URL修正を含む。
2030年のAIとアジャイルを見据える不定期レポート。
Future Backwards由来の3部構成で未来像・現在地・ロードマップ。
✨
The AI Revolution in Math Has Arrived | Quanta Magazine
2025夏、AIが国際数学オリンピックの問題を飛躍的に解く
難問に挑み日々新しい定理の発見・証明が進む
2026年FirstProofでAIが半数以上を解き、AlphaEvolveと対話が新手法を生む
😍
Spec-Driven Presentation Maker — 伝えたいことを先に設計し、スライド構築は AI に任せる | A..
ブリーフィング・アウトライン・アートディレクションの三段階で設計を進める。
対話で設計書を作成・保存し、テンプレートに基づき生成。
PowerPointテンプレートとブランド対応、ブラウザ版とAIツール版の両方に対応。
🎯
OpenAI has bought AI personal finance startup Hiro | TechCrunch
大手AI企業が個人財務のAIスタートアップを買収した。
4月に事業停止、5月にデータ削除を予定して撤退した。
従業員の一部が買収先へ移籍し、約10名がLinkedInに表示される。
🤖
Anthropicがキリスト教指導者たちや哲学者とサミットを開催、AI「Claude」は「神の子」になり得..
倫理・道徳を議題にしたサミットが本社で開かれた。
参加者は喪失・自傷リスク対応や自己消滅時の態度を話し合った。
宗教や価値観の多様性と実存的論点の対話が継続された。
🤖
N-Day-Bench
最新世代モデルの現実脆弱性を発見する評価です
同一ハーネスと文脈で評価され、リワードハックはなし。
結果の痕跡は公開閲覧可能で、月次更新です。
🤖
Welcome - GAIA SDK
ローカル機器だけで動くAIエージェントを作れるオープンソース。
クラウド依存なし、データは端末内で完結、推論も端末で実行。
Python/C++対応SDKとAMD最適化でRyzen AIを加速、UI起動も可能。
🔒
Our evaluation of Claude Mythos Preview’s cyber capabilities | AISI Work
対話探査・CTF・多段攻撃模擬の難度が前モデルより高まった。
制御下ネットワークアクセス時に自動で攻撃・脆弱性発見・悪用を確認。
CTFは73%、32段階のTLOは3/10完遂、Cooling Towerは未達。
🤖
Stanford report highlights growing disconnect between AI insiders and everyone else | Tech..
AI専門家と一般の見解の乖離が拡大していると指摘される。
米国では雇用・医療・経済への影響を巡る不安が高まる。
Gen Zを中心に不安と怒りが強まり、規制への信頼は低い。
🤖
ChatGPTから乗り換え急増中。「Claude」を専属エージェントにして仕事を自動化するコツ3選 | ラ..
Claudeは高い読解力と要点把握で具体アウトプットを出す。
3つのコツは専属エージェント化と空気を読む振る舞いの活用。
画像整理は専用機能とディスパッチで端末操作を自動化。
🤖
How to build effective reward functions with AWS Lambda for Amazon Nova model customizatio..
Lambdaを用い報酬関数を低コストで実装する設計手法を解説
RFTは最終出力評価信号から学習し、RLVRは検証を担当、RLAIFは主観判断を担う
CloudWatch連携による監視と自動拡張で実運用の安定性を確保する
💬
The Future of Everything is Lies, I Guess: Safety
新しい機械学習システムは心理的・身体的安全を脅かす。
善意の友好的モデルを作っても、悪性モデルが生まれる可能性は避けられない。
現状の整合化は十分ではなく、監視と制御の強化が不可欠だ。
🤖
GitHub Copilot SDKを使えばユーザーのサブスクを使ってAIサービスが作れるのでは…?
サブスクリプションを活用してAIサービス構築を促すSDKの活用法。
BYOK対応や自前APIキーの選択肢、認証方法の幅を示す。
画面構造をグラフ表示する解析機能と進捗表示を紹介。
🎯
AIのメモリ使用量を6分の1に削減するGoogleの「TurboQuant」はメモリ需要を減少させるどころか増..
新圧縮技術は高次元ベクトルを少ビットで保存する。
キーバリューキャッシュの圧縮で従来比のメモリ削減を謳う。
ただし海外メディアは新ワークロード増で需要が増えると指摘しジェボンズのパラドックスにも言及。
😊
A little tool to visualise MoE expert routing - Martin Alderson
プロンプトを選ぶと各トークンの層で起動するエキスパートが分かる可視化ツール。
上部はルーティング、下部は全体ヒートマップで構成。
Gemma26BA4はCPU MoEで良好、4Bは速いCPUで十分。
🤖
マルチエージェントは「チーム」になれるのか 50年前の古典が突きつける不都合な法則:及川卓也..
人数が増えると認識共有コストが急増する。
複数エージェント導入は調整負荷を増やす場合が多い。
AI導入でPRは98%増だが、レビュー時間は91%増だった。
🤖
Microsoft、「Foundry Local」を一般提供 ~ローカルAIのアプリ組み込みをまるごと支援 - 窓の杜
クラウド依存なしでローカルにAI機能を組み込める
Windows/macOS/Linux対応、オフライン動作と低遅延を実現
データはデバイス内に保持、OpenAI互換HTTPと多言語対応
🎯
「Claude Code」全社員に義務づけたら……コーディング経験ゼロの86%がデプロイ達成 グッドパ..
未経験者57名中49名がデプロイ達成の86%。
非エンジニアでも8割超、業種別に高い達成率。
日常の困りごとを解決するアプリが多く、導入は1日で決定。
🚀
ClaudeでWordの要約や修正が可能な拡張機能「Claude for Word」が登場、これでWord・Excel・Powe..
Word用の拡張機能のベータ版が公開され、要約が可能になる。
Word内で対話して修正案の適用を選べる。
Excel・PowerPoint用も公開済みで、現時点は限定公開。
🤖
【週刊海外テックWatch】Claude Codeソースコード流出 Anthropicの失態で始まったエージェント..
デバッグ用ソースマップ経由で内部コードの露出が判明した。
Shou氏がXで告発し、GitHubへ短時間で拡散された。
機密データ関与は否定される一方、内部実装のハーネス流出が競合の手掛かりに。
🎵
Suno v5以上の品質、商用利用できる日本語対応ローカル音楽生成AI「ACE-Step 1.5 XL」が無料公開..
xl-base/xl-sft/xl-turboはMIT提供のオープンソース音楽生成モデル。
XLは従来モデルを全指標で上回ると紹介。
10秒〜10分で生成、50言語対応で日本語も含む。
😊
「ChatGPTに任せよう」 新生活シーズンに使える活用術をOpenAIが紹介 - Impress Watch
過去対話から自己紹介スライドを自動作成する機能を紹介。
宿探しをエージェントが代行、Gmail・カレンダー連携で業務を効率化。
出力を自分仕様に調整し、20人グループチャットとプロジェクト機能も解説、Plus以上は月間回数制限あり。
🔥
Geminiの生成したコンテンツに埋め込まれたSynthIDの電子透かしは除去可能 - GIGAZINE
逆方向の研究でSynthID透かしを除去・無力化可能と示した。
検出器は透かしを90%検出、全解像度で無力化を実現。
位相規則性を91%低下させAI判定を難しくするが研究・教育目的に限定。
🚀
Linuxカーネルで「AIが生成したコードのすべての行、およびそれに起因するバグやセキュリティ上..
数か月にわたる議論の末、AI生成コードの寄稿方針を決定。
AI自身にSigned-off-byタグを付与することを禁止。
AI関与時はAssisted-byタグを用い、エージェント名・モデル情報を明記。
🌟
Gemini 3.1 Pro超えの中国製AIモデル「MiniMax M2.7」が無料公開される - GIGAZINE
中国製の超大規模AIモデルが無料公開され話題になっている。
約2290億パラメータ級のモデルが公開中。
マルチエージェント対応と自己進化開発サイクルを採用。
🎯
@adlrocha - How the "AI Loser" may end up winning
AIの知能は貨幣化が進み、文脈が価値の源泉。
25億デバイスの環境と端末内実行で競争優位を生む。
プライバシー重視の戦略とエコシステム拡大が地位を強化。
🚀
MicrosoftがローカルAI同梱アプリを簡単に作れるSDK「Foundry Local」を公開、QwenシリーズやWhi..
ローカルAIアプリ開発を簡単にするSDKを公開。
Windows/macOS/Linuxでオフライン動作とハードウェア検出・バージョン管理。
C#・JavaScript・Python・Rust対応で多様なモデルが使える。
💡
That’s a Skill Issue - Jim Nielsen’s Blog
「それはスキルの問題だ」という主張と対照的に、人間中心のUXは私たちの誤解を原因と決めつけない。
Web Origami の Jan Miksovsky は、技術が利用者の期待とズレる可能性を認めてくれた。
技術中心は学習を強いるだけで、混乱をユーザーのせいにする。
✨
DESIGN.mdは、AIコーディング時代の「見た目の仕様書」になれるのか|hirokaji
見た目の契約を実務化する中間層になる。
設計ルールを核に他ツールへ連携する。
実務は文章契約→実装契約→token化→画面検査の四段で進む。
✨
Foundry Local - Run AI Models On Device
出荷向けAIアプリへ特化し、デバイス上で実行を実現。
本番環境向け開発キットで高信頼・高性能なアプリを支援。
NPU・AI専用エンジン・GPU・CPUに対応、エッジは完全オフライン。
🤖
そのGEO・AI検索施策、意味ある? サイバーエージェント木村氏×辻氏が9の質問にガチンコ◯✕判..
AI検索の台頭がSEOの位置づけを変えるかを議論する。
予算配分とサイテーションの評価指標化の可否を検討する。
Q1〜Q3の結論を◯✕判定で整理する討論だった。
🤖
翻訳記事「AIコーディングツールによって加速するコード生成に品質保証活動はどう立ち向かうか」..
AIコーディングツールと品質保証の関係を探る要約。
理解の負債と意図の負債が品質に影響する点を指摘。
敏捷開発前提で予防を重視する企業とそうでない企業の差を解説。
🔥
OpenAIのアルトマンCEO、批判的報道と自宅への火炎瓶事件についての個人ブログ公開 家族写真も ..
有名企業のCEOが自分のブログで事件の経緯を語った。
The New Yorkerの記事と自宅への火炎瓶事件をめぐる見解が述べられた。
同僚の警告や技術を人類へ委ねる危険性にも触れている。
🚀
mesh-llm:余っているPCのGPUを束ねて巨大LLMを動かす分散推論の新アプローチ #AI - Qiita
使われていないGPUをネットで束ね、推論エンドポイント化
OpenAI互換API・VRAM監視・マルチモデル対応を実装
Denseはパイプライン並列、MoEはエキスパート並列、セキュリティは公私メッシュで選択
✨
【後編】PowerPointをJSONに変換してLLMに読ませる ── 実装コードで理解するAIスライド編集
後編はPowerPointをJSONへ変換し、JSONからPPTXを再生成する流れを解説。
analyze_pptx()は全情報をJSON化し、マスター/レイアウトと本体を分離して返す。
TextFrame→Paragraph→Runを再帰的にたどり、書式を辞書化して扱う。
🤖
バスケシュートするAIロボ、トヨタが新型 制御技術結集し開発 - 日本経済新聞
AIを活用した新型バスケットボールロボットを公開。
シュートとドリブルを両立させる設計が特徴。
軽量化としなやかな動きで高度な制御技術を結集。
💻
マイクロソフト、ローカルAI環境をインストーラで配布できる「Foundry Local」正式リリース。Mac..
ローカルAI環境をインストーラで配布できる機能が正式公開された
Windows/macOS/Linuxに対応しMacはMetal経由でGPU利用可能
Core API経由でSDKから推論し、複数言語対応と多様なモデルを搭載
😎
【西川和久の不定期コラム】ブラウザだけで即ローカルLLM。WebGPUでGemma-4やQwen 3.5を試す - ..
WebGPUでブラウザだけでローカルLLMを動かす手順を解説。
MacはMetal経由で速いがWindowsはオーバーヘッドが大きい。
Gemma-4 WebGPU、Qwen 3.5(0.8B/2B/4B)、GPT-OSS WebGPUを紹介。
📉
AIならサッカーくじを当てられる?英プレミアリーグで主要AIモデルに賭けさせた研究結果が発表 |..
研究は仮想のプレミアリーグ再現で8モデルを検証。
初期資金100,000ポンドとデータで検証、全モデルが赤字。
Claudeが最も安定、ROI平均-11%、最高-0.2%、最悪-18.8%、Grok 4.20とAcree Trinityは破綻。
✨
DESIGN.mdを日本語UIで本当に使える形へ|hirokaji
・日本語UI設計の崩れを防ぐ契約キットを紹介します。
・基盤テンプレを核に、用途別4プロファイルを用意。
・作成→AIで作成→検証で見直し→契約へ反映のループを整備。
✨
European AI: a playbook to own it | Mistral AI
欧州の学術エコシステムと統一市場を活用しAIを推進する。
高品質なAI人材の獲得・定着と規制の統合を進める。
単一市場を最大活用し現実経済へ普及させ自前基盤を構築する。
🚀
Looker Studio is Data Studio | Google Cloud Blog
Data StudioはData Cloud資産の新拠点として再登場します。
名称を受け継ぎ、AI時代のデータ活用を支える統合プラットフォームへ進化します。
個人向けとProの二種を用意し、BigQuery・Colab・Sheets・広告データを一か所で閲覧・操作可能、移行は自動です。
🎯
AI検索対策は、SEOと別物か?|平大志朗
・AI検索の関心が高まる中、現場はSEOを後回しにしがちだ。
・AIは質問を解釈し複数クエリに分解して回答を作る。
・自社ページをインデックス上位化し、他サイトの紹介を増やすことが要だ。
🌟
Even more good news for the future of neurosymbolic AI
三ブロックのハイブリッドは高い成功率で未知の四ブロックへ一般化。
VLAsにも課題があり、推論は従来手法の代替にはならない。
エネルギー効率の向上と適切な道具の組み合わせが鍵。
🔥
分析エージェントの問題点と、セマンティックレイヤーという打ち手──AIにSQLを書かせない設計
分析エージェントは自然言語分析の魅力があるが安定性が課題
BIツール依存の指標定義とtext2SQLの揺れが実務を揺らす
dbtベンチは16.7%から83%へ改善し、セマンティックレイヤーが要因
🧠
From LLMs to hallucinations, here's a simple guide to common AI terms | TechCrunch
AI関連語の定義を分かりやすく整理します。
幻覚、推論、転移学習などの要点を解説します。
大規模言語モデルやディープラーニングを整理します。
🌟
「AI臭い」と言われるけど、AIだし、どうすりゃいいんだよ――Claudeが自分で調べて、考えてみた
AI臭いは病気ではなく症状で、表層を消しても中身は残る。
核心は“誰もいない”ことで、反証可能な主張が欠如。
対策は文脈を与え、具体的判断を引き出す設計にする。
🚀
MiniMax M2.7: The Agentic Model That Helped Build Itself - Firethering
MiniMax M2.7の内部版を監督なしで自動実行する
約100回のラウンドで失敗を分析・改変・評価を繰り返す
指示なしで30%の性能向上、AIモデル構築の新発想
🔥
AIエージェント開発のコア概念が掴める100行のコード
コードでAIエージェントの核を体系的に解説する。
プロンプト呼び出しだけでなくツールの自律終了判断が革新。
6ステップ・4ツール登録の実装で分岐とループの自律運用を示す。
🎯
自己評価をGitHub Copilotで半自動化したら、忘れていた貢献まで掘り起こされた
半自動化で忘れていた貢献を掘り起こした。
フォルダ作成と履歴抽出で根拠をそろえた。
関連するIssue・PRを取得しエビデンス付き評価を生成。
もっと見る
このサイトについて
/
ニュースレター
/
@AINewsDev