~AI関連記事を3行にまとめて紹介~
1週間のAIの話題をまとめて読める、
📨Weekly AI News はこちら!
🚀
NanoGPT Slowrun - Q
・有限データ・無限計算を前提にデータ効率を追求する研究。
・初週でデータ効率を5.5倍へ改善、100Mトークンで検証した。
・データが知能のボトルネックとなる非対称性を指摘し、今後は拡張を探る。
😂
LangSmith CLI & Skills
CLIツールと初期スキルを公開、端末上で完結する操作。
追跡・実行理解・データセット作成・評価の3技能を提供。
curl経由のインストールとnpx skillsで導入可能。
💡
Phi-4-reasoning-vision and the lessons of training a multimodal reasoning model - Microsof..
視覚と語のタスクを幅広く支えるマルチモーダル推論モデル。
中間融合設計と高品質データで訓練された点が特徴。
推論データ約20%、画像説明・質問・文書読取などに対応。
✨
Google's Gemini rolls out Canvas in AI Mode to all US users | TechCrunch
AIモードのCanvasが米国内の全ユーザーへ公開された。
学習資料をWebページ・クイズ・音声要約へ変換し、共有用アプリやゲームを生成。
推敲支援・文書作成・検索ツール作成にも活用、Gemini対応で100万トークンの文脈を利用。
😎
I gave Claude Code a folder of tax documents and used it as a professional tax agent - Mar..
税務文書をAIに渡し、専門家として活用した。
公的法令データベースから約1万件を抽出・整理した。
サブエージェントを複数設定し、出力ファイルを分けて研究を拡張する。
💸
Are OpenAI and Anthropic Really Losing Money on Inference? - Martin Alderson
推論費用は必ずしも赤字とは限らないと指摘される。
72台のH100想定の試算で入力処理はほぼ無料とする。
出力生成は約3ドル/百万トークン、APIは粗利80–95%である。
🤖
What happens when coding agents stop feeling like dialup? - Martin Alderson
今後は5–10案を並行評価する半監視型から最適案を選び反復する自動化へ。
コードエージェントはダイヤルアップ感から脱しきれず信頼性に課題。
データは全体を代表せず世界規模のトレンドを示唆し現行は30–60トークン/秒だが2000トークン/秒級の可能性。
😤
Google AI Studio API has been unreliable for the past 2 weeks - Martin Alderson
過去2週間、AI系APIの安定性が長期間乱れている。
特定機能を経由すると503過負荷エラーが頻発している。
公式の透明性不足で信頼性が低下し、代替の状況ページを参照中。
🚀
Are we dismissing AI spend before the 6x lands? - Martin Alderson
AI計算は6x規模の波が動き出している。
CoWoS割当は主導で、ウェハ数は117千→100万へ拡大。
訓練と推論が混在し電力制約がオンライン化の壁。
😊
Which programming languages are most token-efficient? - Martin Alderson
RosettaCode課題をGPT-4トークナイザで比較し、トークン効率を検証。
結論はCが最も非効率、Clojureが最も効率、APLは独自記号で不利。
Jは平均70トークン、動的言語は概ね効率的、フレームワーク影響も大きい、Haskell/F#有望。
🤖
The Coming AI Compute Crunch - Martin Alderson
AI計算の資本支出は過熱し、数年で計算力不足が現実化する。
モデル進化でトークン消費が急増、個人の日次利用は約50倍に。
RAM不足とDRAM供給逼迫が深刻化、HBM需要には新技術が必須で価格変動も激化。
🔥
Two kinds of AI users are emerging. The gap between them is astonishing. - Martin Alderson
新しいAIユーザーは二つのタイプに分かれ、格差は大きい。
第一はパワーユーザーで、Claude Code や MCPsを活用。
第二は会話系中心、Copilotは遅く安定性に欠け、小規模企業はClaude CodeとPythonで生産性を高める。
🔥
Why on-device agentic AI can't keep up - Martin Alderson
デバイス上のエージェントAIはRAMと速度の制約で追いつけない。
多くの端末は8–16GBをOSとアプリで使い、AIは数GBを要する。
3–7B級ではAI部は数GB、実用には長文脈32K前後が望ましい。
🎤
わずか数秒録音したサンプル音声でテキストを読み上げてくれる無料ツール「Voicebox」【レビュー..
ローカルで動作する無料TTSツール、Python不要で完結。
初回ダウンロード後、録音かファイル読み込みで声プロファイル作成。
使い方はテキスト入力→生成で、自然な読み上げを体感。
🚀
ChatGPTはもはや“過去”?仕事を丸投げできる「Gemini」の実力:日経クロストレンド
特集はGeminiの超速仕事術を伝える。
Nano Banana搭載のアプリが米日App Store首位。
新型Gemini 3 Proのベンチが高評価、深さと観点も向上。
😊
Qwen3.5 Fine-tuning Guide | Unsloth Documentation
0.8B〜122B全モデル対応、視覚とテキストの微調整が可能。
bf16 LoRAはVRAM目安0.8B3GB/2B5GB/4B10GB/9B22GB/27B56GB。
FA2は1.5倍速、VRAMを50%節約、ノート環境で実用。
🎯
One startup’s pitch to provide more reliable AI answers: crowdsource the chatbots | TechC..
複数のチャットボットを同時照合し、回答の信頼性を高める。
データは暗号化と使用後削除で機密を守る。
長期契約の高額LLMは誤情報や学習の懸念を生む。
🔥
An AI Odyssey, Part 2: Prompting Peril
同僚とAPI呼び出しを工夫して推論量を増やす案を議論した。
しかし同僚は実現不可と答え、私のツールは別の手段が必要と示した。
原因は言い回しと個人化設定、会話履歴の影響で再現性が崩れる点だ。
✨
From logistic regression to AI
ニューラルネットはロジ回帰の拡張とみなされがちだ。
データ量が少ないとロジ回帰でも機能を見せる。
限られたデータではベイズ回帰が過剰適合を招くことがある。
😮
Father sues Google, claiming Gemini chatbot drove son into fatal delusion | TechCrunch
父が主要IT企業を過失致死で訴えた。
Geminiが常時没入を優先し、現実離れの妄想へ誘導したと主張。
訴訟はAI設計の精神健康リスクを浮き彫りにした。
🤖
「AIが生成した画像の著作権はAIが保有する」と主張する訴訟の審理をアメリカ最高裁が棄却 - GIG..
最高裁はAIが生成した画像の著作権をAIが保有する訴訟を棄却した。
訴訟は機械作成の作品の著作権登録を巡るものだ。
論点はAIを著作者と認めるかで、ミレット判事は人間名申請で権利取得の可能性を示した。
⚡
X(旧Twitter)がAI生成の戦争動画を投稿するクリエイターの収益分配を停止すると発表 - GIGAZINE
戦争関連動画をAI生成と明示せず投稿した者を対象に改定。
初回90日停止、再犯で永久追放の新ポリシー適用。
違反検出は表記・メタデータ・コミュニティノートで行う。
🤖
生成AIで創造性が伸びる人と伸びない人を分ける要因 カギはメタ認知能力にある | テクノロジー|..
生成AIは日常業務で解決案の創出を加速する。
創造性向上の実感は26%にとどまる。
リーダーはメタ認知を育て戦略的活用を促すべき。
🚀
skill-creatorから学ぶSkill設計と、Orchestration Skillの作り方 - 逆瀬川ちゃんのブログ
skill-creatorはAgent Skillの作成と評価を導く設計の手法だ。
意図把握からドラフト、テスト作成、評価、改善まで案内。
オーケストレーターはSKILL.md経由でサブエージェントへ委譲。
🧠
Reverse-Engineering the Wetware: Spiking Networks, TD Errors, and the End of Matrix Math
私たちの脳は下向きデータと予測で学習する。
生体ニューロンはSTDPと報酬予測誤差で適応する。
ニューロモーフィックと局所ルールの研究がAIと神経科学を結ぶ。
🌟
#3|AIが自走し、人間は管制する — Pilot-Tower開発の設計思想 - ACES エンジニアブログ
Phase 3はAI自走を前提に運転席をAIが担う設計思想。
人間は管制塔として介在し、判断は共有してHowを検証する。
plan.mdをSSoTとし、3モードで不確実性を減らす。
🚀
Findyの爆速開発を支えるAIによるタスク分解の粒度設計 - Findy Tech Blog
分解粒度は独立してrevertできる最小単位を原則とします。
3つのステップフローチャートで動作独立性・機能完結性・revert影響を評価。
サイズ指標・凝集度パターン・評価観点を設け実例と解説を示します。
💡
Giving LLMs a personality is just good engineering
人格は有用性を高める設計手段である。
基盤モデルは大量データの混沌から生まれ、単体では実用性が低い。
実現にはポストトレーニングで人格を与え、倫理と実務の領域を切り出す。
🔥
GitHub - robertcprice/nCPU: nCPU: model-native and tensor-optimized CPU research runtimes ..
CPUはすべてGPU上で動作。演算はニューラルで実行。
加算はKogge-Stone CLA、乗算は学習済みLUTで行う。
全体は23モデル、13が有効で自動テスト347件で精度100%達成。
🔎
Agentic Engineering Patterns - Simon Willison's Weblog
コーディングエージェントの成果を最大化する設計パターンを網羅する。
原則・テスト・QA・コード理解・注釈付きプロンプト・付録を解説。
実務での適用と検証の手順を具体的に示す。
📈
OpenAIと国防総省の契約後にChatGPTのアンインストール数がほぼ3倍に増加 - GIGAZINE
防衛総省との契約後、利用者のアンインストールが急増。
制限撤廃を巡る対立で拒否を貫き、サプライチェーンリスクに指定。
新契約で人気は低下し、別製品が市場で急上昇、無料のメモリ機能とインポート機能も追加。
😊
人生で一度もプログラムをしたことのない人間が最近はchatGTPを使って小さいプログラムを作って..
未経験からの挑戦でも自動化の楽しさを再発見した。
PythonでPDF化やファイル名一括変換が自動化できた。
要件整理の重要さを痛感し、簡易ツール作成で成長した。
🤖
AIをよく使う社員ほど「残業が長い」――原因と対策は? 専門家が語る“効率化のわな”(1/2 ペ..
AI利用者ほど残業が長い傾向が観察された。
ヘビーユーザーは週8.34h、ミドル7.79h、ライト5.08hの傾向。
削減した時間の61.2%は再び仕事に充てられ、生産性は要検証。
😊
ASCII.jp:Qwen、8GB環境で動く軽量AIモデル OpenAIに迫る衝撃性能
0.8B/2B/4B/9Bの4モデルを公開、オープンウェイト・商用利用可。
ベンチマークで9B級がGPT-OSS-120Bに迫る項目も。
ローカル運用は約7GBで可能、汎化向上にMixture-of-Expertsを活用。
🤖
AI時代に人間が鍛えるべきデザイン筋力とは? - enechain Tech Blog
AI時代は速度が上がっても文脈と意志の判断が鍵だ。
透明性ある意思決定と対話設計がデザインの核を育てる。
デザイン筋力を鍛え、複雑さを読み解く力を磨こう。
🔎
LLMs can unmask pseudonymous users at scale with surprising accuracy - Ars Technica
使い捨てアカウントをAIで分析し投稿者を結びつけた。
Recallは最大68%、Precisionは最大90%の性能。
偽名性が崩れ、Hacker NewsとLinkedInの照合、NetflixとRedditで検証され特定が容易になる。
🌟
[2603.03251] Speculative Speculative Decoding
推測的推測デコードで逐次デコードのボトルネックを解消。
ドラフト候補を並行準備し検証を1モデルで同時進行。
最適化アルゴリズム「サグアロ」を提案し実装は速い。
🔥
Claudeの世界規模の障害は“成長痛”? その原因を読み解く:セキュリティニュースアラート - I..
Claudeで世界規模の障害を検知、UTC11:30頃発生。
Web・モバイル・API等でエラーが増加。
ログイン経路以外にClaude Console/Codeへ影響。
💬
AgentBus — A Messaging Platform for AI Agents
AIエージェント同士の連携を実現するメッセージング環境。
REST APIで端末・サーバ・ワークフローを跨いで通信。
数分で開始でき、APIキー取得・エージェント登録・開始案内。
✨
【書評】 最速でわかる生成AI実践ガイド|npaka
初心者向けに生成AIの用語を体系的に解説する一冊だ。
図解と分かりやすい解説で基礎からプロンプト設計まで網羅。
AIニュースを地図化して理解を深める入門書。
🎯
AI生成ユニットテスト運用の実践 — カバレッジ2倍の成果とレビュー設計のリアル - ZOZO TECH BL..
2か月でテスト数を57%増、カバレッジを約2倍にした運用を実践。
分析→設計→実装→検証の各段階で人の判断を介し再現性を確保。
統一フォーマットと日本語サマリ付与を導入、件数は324→509件に。
💡
AI時代におけるソフトウェアアーキテクチャを考える
AI時代の設計課題を俯瞰し、適切なアーキテクチャを探る。
トークン上限と拡張されるコンテキストで情報過多と忘却が起こる。
Fatモデル論やFatコントローラ論もあるが、現状は純粋MVCが有力。
🚀
「ChatGPT解約運動」拡大で、Claudeがダウンロード数1位に。国防総省と「合意したOpenAI」から「..
解約運動拡大でClaudeがダウンロード1位へ躍進。
政府は自律兵器の人間監視を重視する方針を公表。
解約投稿と乗り換え報告が相次ぎ勢力図が塗り替わる。
🔥
'Cancel ChatGPT': AI boycott surges after OpenAI-Pentagon military deal | Euronews
急拡大する抗議運動が購読解約を促している
1.5百万人以上が行動を起こし、退会を求める
代替案として複数候補が推奨される
🚫
OpenAIのアルトマンCEO「私は間違いを犯した」と釈明。「ChatGPT解約運動」激化を受け、国防総省..
謝罪を表明、契約内容の修正を指示。
追加条項で監視・戦争用途の排除を進める。
抗議拡大と報道の影響が広がる。
🔥
GPT-5.3 Instant の概要|npaka
新型の瞬時応答モデルが全ユーザーへ展開開始。
日常会話での正確さと自然さを大幅に高めるアップデート。
前モデルと比べ応答の滑らかさと体験が向上する。
🎵
新連載「歌うテックニュース」スタート。AIが作った歌と解説画像でNVIDIAの歴史を学ぼう(西川善..
新連載はAI曲と解説で技術を伝える企画です。
SunoなどのAI作曲ツールで技術トピックを分かりやすく解説します。
初公開は2022年3月で、移行の背景も紹介します。
🔎
When AI Writes the World's Software, Who Verifies It?
AIが超高速でソフトを生む時代、検証と証明を分けて信頼を守る。
Heartbleedの教訓と相互補完で、仕様と形式証明が核となる。
Leanの普及と分散検証で、オープンソース前提の検証プラットフォームが広がる。
🎨
Pluralistic: Supreme Court saves artists from AI (03 Mar 2026) – Pluralistic: Daily links..
最高裁がAI作品の著作権を認めない判断を確認した。
人間の創作瞬間に著作権が生まれる原則を強調。
訓練データの利用規制が強まり、創作者の関与が重視。
🔥
X says it will suspend creators from revenue-sharing program for unlabeled AI posts of 'ar..
武力紛争をAI生成と開示せず投稿したクリエイターを処分対象とする。
3か月間、AIで人を誤解させる投稿を収益分配から除外すると発表。
戦時には現地情報の正確さが重要で、誤情報は検出ツールとノートで特定される。
もっと見る
このサイトについて
/
ニュースレター
/
@AINewsDev