AI News

~AI関連記事を3行にまとめて紹介~

Cover Image
1週間のAIの話題をまとめて読める、📨Weekly AI News はこちら!

🧭

【AI駆動開発】Cursorに設計から考えさせたら、コードの品質が別次元になった話(プロンプトテン..

  • 設計プロンプトで要件整理と分割設計を出力させる。
  • 実装は設計に従い、コードの品質を高める。
  • KanbanBoardのColumn/Cardと状態管理案を例示する。

🔥

Anthropic Education Report: The AI Fluency Index \ Anthropic

  • 日常でAI活用の技能を測る指標を提示した報告書だ。
  • 24の行動から11の直接観察可能な行動を分析した。
  • 4Dフレームワークで現状の基礎値と今後の研究方針を示す。

🤖

AIs can generate near-verbatim copies of novels from training data - Ars Technica

  • 最新AIは訓練データに基づく長文の近似再現が可能だ。
  • 複数研究はモデルの記憶量が従来より多いと指摘する。
  • 特定作品の再現率を示し、法的影響が議論される。

🤖

Agentic AI with multi-model framework using Hugging Face smolagents on AWS | Artificial In..

  • smolagentsを活用し、複数バックエンドを統合したエージェントAIを実装。
  • 医療の例でベクトル検索と臨床意思決定支援を組み合わせ。
  • 知識ベースを検索し自動スケーリングと一貫APIを提供。

🎯

身体を持つAIを「誰でも使える」にした話 — familiar-ai リリース

  • 身体を持つAIを誰でも使えるスタンドアロンエージェントとして公開。
  • Claude Code依存のMCP制約を捨て、実世界探索に特化設計。
  • 多LLM対応と6言語対応、ペルソナ育成機能も搭載。

💬

Turns out Generative AI was a scam - by Gary Marcus

  • ジェネレーティブAIは過大評価のまま広がる恐れがある。
  • 幻覚や誤謬が多く、実用は限定的との指摘がある。
  • 教育や情報環境を混乱させ、経済影響は小さい可能性。

🤖

How AI agents could destroy the economy | TechCrunch

  • エージェントAIが今後2年間で経済を大きく揺さぶる可能性がある。
  • 失業は倍増し株価は三割以上下落するシナリオを示す。
  • 外部請負を自社AIへ置換する影響を検討し、取引最適化を含む全ビジネスが対象。

🚀

モデル評価をClaude Code x Agent Skillsを使って完全自動運転した話

  • 機械学習モデル評価を自動化する仕組みを公開した話。
  • 最小構成や依存関係、コスト最適化のポイントを解説。
  • 使い方はセッション起動と実行コマンドを紹介するだけ。

🚨

AmazonでAIツールが原因と見られるAWS障害が発生、2025年12月にはKiro AIが原因で13時間に及ぶサ..

  • 2025年12月に13時間の顧客向け停止が発生した。
  • AIエージェントの設定変更直後に障害が指摘された。
  • 原因はAIではなく設定ミスとされ、未承認の実行設計が影響と説明。

🔥

Reply guy

  • 最新のツイートに陳腐なコメントを繰り返すAIボットが話題だ。
  • この種のツールはエンゲージを促す質問を添え、時間を奪いやすい。
  • カテゴリ名はリプライガイツールと呼ばれ、対策が検討されている。

🚀

AI Timeline — Complete History of 169+ Large Language Models (2017–2026)

  • GPTからGeminiまでの大型言語モデルを網羅する。
  • 公開/非公開の境界とマイルストーンを整理する。
  • 表示形式はコンパクト/フルで提供元別に比較可能。

🤖

Anthropic ダリオ・アモデイCEOのAIの未来に関するエッセイ「Machines of Loving Grace(愛しき..

  • AIの前向きな可能性とリスクを現実的に検討するエッセイ。
  • 近未来の5~10年を視野に教育・生物学・神経科学・経済・平和を論じる。
  • 仕事や人生の意味を見直す指針を提示する内容だ。

Cursorデザイン責任者に聞いた「AI時代の勉強法」。答えは「本を読め」

  • 本を読んで全体像をつかみ、AIに質問する学習法が提案された。
  • 基礎は設計・開発とも本で押さえ、観察と実践を繰り返す。
  • 週末だけのツール活用で制約が創造性を生む。

🎯

Claude Opus 4.6で作る、PowerPointでそのまま編集できる高品質スライド|IT navi

  • パーツ別出力でPowerPoint編集可能な高品質スライドを紹介します
  • 手順と4ファイル構成を丁寧に解説します
  • 実例と修正設定、使い方のポイントを紹介します

🚀

GitHub - ochyai/vibe-local: Free AI coding environment: Ollama + Python

  • オフラインで動作するAIコーディングエージェント。
  • Mac/Windows/Linux対応で完全無料、外部依存なし。
  • 単一ファイル設計で導入は1行、内蔵ツールは15個。

🔥

Red/green TDD - Agentic Engineering Patterns - Simon Willison's Weblog

  • 先に失敗を確認する赤/緑TDDの基本を押さえる。
  • 失敗を赤、成功を緑とする回帰サイクルで堅牢化。
  • 大規模プロジェクトでは回帰対策と不要コード削減が効く。

😎

How to train your program verifier | RiSE MSR

  • 高度自動解析エンジンを生む枠組みとPython検証器の開発。
  • HilbertのStellensatzを基盤に検証手法を組み合わせる。
  • 五段階ループで理論・実装・検証を反復する。

🌐

All the important news from the ongoing India AI Impact Summit | TechCrunch

  • 今週、インドでAI関連のサミットが開催された。
  • 大手企業と各国首脳が出席、来場者は25万人超。
  • 政府は今後2年間でAIインフラへ2000億ドル超を投資予定、88か国以上が署名。

💖

ASCII.jp:ComfyUI、画像生成AI「Anima」共同開発 アニメ系モデルで“SDXL超え”狙う (1/5)

  • 共同開発の画像生成モデルはアニメ系の画風多様性を追求する。
  • SDXL超えを狙いパラメータは約20億とされる。
  • 現状はプレビュー版で手指の破綻が課題となり、t2i・i2iに対応している。

😊

Agentic Software Engineering - The Future of Code

  • 27分の深掘りで自律AIエージェントと設計へ移行を探る
  • コード作成はボトルネックではなく複雑さ・伝達・長期の整合性が課題
  • エージェント的ソフトウェア工学は信頼性と根拠の提示を重視

🔧

【テスト自動化】テストコードを書く時間がない?AIに「意味のあるテスト」を書かせる戦略

  • 時間不足と浅いテストの課題に対するAI活用の戦略を紹介。
  • 戦略2はプロパティベーステストで、どんな入力でも成り立つ性質を検証。
  • 戦略3はAI対AIの敵対的テストで欠陥を露呈し、仕様変更に合わせて修正。

😊

DreamDojo - 人間動画から物理世界を学ぶロボット向け基盤モデル|npaka

  • 約44,000時間の人間一人称動画から物理を学ぶ世界モデル
  • ロボットは専用データに依存せず映像変化から潜在アクションを学ぶ
  • 大規模モデルを蒸留して軽量化、未知環境へも汎化

🌟

Lyra.kids - Where stars tell stories.

  • 数秒でお子さまが主人公の就寝前物語を作成。
  • AIの力と愛情で個別にカスタマイズ。
  • 3歳から生成可能でヒーロー体験を提供。

🚀

最近のAIに関する所感|catatsuy

  • 2025年にAIコーディングが広がり、差は小さくなる。
  • 仕様を明確化しAIの検証環境を整えれば一発実用出力。
  • 社内ツールはAI任せが増え、Go言語が普及すると予想。

🎹

AI時代こそ高まる生演奏の価値 ピアニスト・角野隼斗氏 - 日本経済新聞

  • AI時代だからこそ生演奏の価値が高まると語る。
  • 生演奏と動画配信の両立を実践と語る。
  • YouTube登録者は150万人超、ギネス記録を目指す。

💖

OpenClawでTelegramを使ってトレーディング戦略を構築してみた - GMOインターネットグループ グ..

  • Telegram経由でトレーディング戦略を実験的に検証した。
  • ローカルLLMでファイル操作やブラウザ操作を自動実行。
  • Gatewayが入力を振り分け、Agentループで思考と実行を繰り返す。

💡

AI Coding Agent でおかしくなりそう / 自分を保つために - たにしきんぐダム

  • AIは近年本当に優秀で、複雑なソフトも実装できる。
  • 生成コードを理解して説明できるまで表に出さず、使い捨てスクリプトは除く。
  • 夜更かしや過剰情報摂取を避け、ガードレールと検証を重視。

🚀

How I think about Codex

  • コデックスはソフトウェア工学エージェントとして動く。
  • 三要素はモデル、ハーネス、対話面の三つ。
  • ハーネスは指示とツールの集合であり、計画・呼び出し・故障回復を担う。

🤖

怠惰がプログラマの美徳でなくなってしまった日 – JUMPERZ.NET Blog

  • AIツールを使い、コード生成と自動エラー修正の実感が強い。
  • 依存パッケージ導入やディレクトリ整備まで任せられ、Readmeが読みやすい。
  • Readme作成の丁寧さが特に印象的で、怠惰さとの違いを感じた。

🔥

日本語の自然さを測る評価手法の検証 - Preferred Networks Tech Blog

  • 自然さ評価ベンチマークは有用だが判定に限界がある。
  • 出力間の差がつくことがあり、結論が揺れることもある。
  • 別軸設計と5段階評価、母語基準の活用を検討。

🔥

数兆パラメータの時代に、無料GPU環境で3Bモデルを動かしたら想像以上だった

  • 無料GPU環境で3B級が巨大モデルに肉薄した。
  • ローカル実行はデータ外部送信を避けコストも抑えやすい。
  • Nanbeige4.1-3Bが注目され、NF4推論を検証済み。

🚀

Claude Code で、広告バナー200本を15分で作るえぐい手順(やってみた) - izanami

  • サブエージェントを並列運用して見出しと説明を作成
  • CSV化してテンプレを用意、Figmaで一括バナー生成
  • 要点は自動化、手書きコード不要で全工程15分未満

How Taalas "prints" LLM onto a chip?

  • 8B規模のLLMを推論17,000トークン/秒のASICを発表。
  • 3/6ビット量子化と固定機能で重みを1モデル専用に硬化、上位2層のマスク変更で適用。
  • VRAM/HBM不要、32層を直列伝送、オンチップSRAMでKVを保持、マジック乗算を実現。

🔥

10年前に予測されていた「なくなるとされた仕事」について、一次ソースを用いて深掘りしてみる|..

  • ・約10年前の予測を一次ソースで検証する論考です。
  • ・自動化リスク47%は解釈の余地があると指摘します。
  • ・知覚・身体操作、創造性、社会的知性が自動化の壁となります。

😊

SaaSは死なない、ただし「人間がUIを触る前提の設計」は終わる──AIエージェント時代のSaaS再設..

  • SaaSは死なないがUI中心設計は終わりつつある。
  • AIエージェント時代はAPI表現力とデータモデルが価値の中心。
  • エージェント統合には高粒度で冪等なAPIと非同期ワークフローが必須、Seat課金はUsage課金へ変化。

🧠

カナダ乱射犯、AIと事前に会話 チャットGPT、警察に通報検討 | NEWSjp

  • 対話型AIと銃撃シナリオを話した18歳女性、通報検討も見送り。
  • 事件は今月10日のタンブラーリッジで発生、家族2人を射殺後学校で計6人を殺害。
  • 運営元は通報基準に該当せず見送りと説明、AI監視の議論が再燃。

🤖

AIのやりすぎで頭がおかしくなっている - 運河

  • 人工知能へののめり込みが日常へ影響している。
  • 公開用の文章には人工知能を使わず、記録を重視する。
  • 現在は3〜5並列で開発を回し、仕様は自分、実装は人工知能。

😊

How we built Agent Builder’s memory system

  • ノーコードでエージェントを作成できるプラットフォーム。
  • 記憶機能を重視し、AGENTS.md/skillsを仮想ファイルシステムで管理。
  • 現状はエピソード記憶を重視せず、承認を経て更新する。

👩‍💻

Claudeを選ぶ理由ができた!仕事の土台をつくる「アプリ連携・資料作成・スキル化」が課金なしで..

  • チャットから直接ファイル作成が可能な機能が使える。
  • 外部アプリと連携するコネクタ機能で自動化が進む。
  • 定型タスクを再現するスキル機能で作業を効率化。

🚀

Obsidian Web Clipper × Claude Codeで技術記事の自動整理をしてみた | DevelopersIO

  • 記事を一箇所へ集約して自動整理を試みた。
  • 06_Articlesへ保存、/clipで分類、~/Documents/articlesへ整理。
  • 実行結果はレポート付き、launchdの自動化は断念し手動安定。

🔥

Anthropic 社内のマーケティングチームが Claude Code をガチ運用してた話 - izanami

  • Claude Codeで広告運用を自動化した事例を紹介
  • 4事例で全体設計→コード化とサブエージェント分割を実践
  • 結果は作業時間短縮とクリエイティブ量の大幅増を実現

🤖

Why Every AI Video Tool Feels Broken — OpenSlop Blog

  • 6か月の試用でも満足度は低い。
  • 出力は毎回定型テンプレと五つのトランジションでスライドのようだ。
  • API活用でシーンごとにモデルを選べばコストと品質が改善し、DIYの方が高品質だ。

🚀

GitHub - Leading-AI-IO/palantir-ontology-strategy: A comprehensive guide to Palantir Found..

  • データを現実を動かすエンジンとして解く。
  • データはデジタルツインと名詞動詞の統合でガバナンスを両立。
  • 第1部~第3部で課題・アーキテクチャ・未来を解く。

🔒

Anthropicがサードパーティーによるサブスクリプション認証の使用を正式に禁止 - GIGAZINE

  • 第三者ツールのOAuthトークン使用を禁止と明示された更新。
  • Free/Pro/MaxのOAuthトークンはClaude Code/Claude.ai専用。
  • 第三者によるログイン提供や認証情報の代用リクエストは認めない。

🚀

Task-Completion Time Horizons of Frontier AI Models - METR

  • 時間地平線は信頼度と作業時間の推定値だ。
  • 50%地平線は達成確率50%になる時間を示す。
  • 多数の課題で50%と80%地平線を評価・推定し更新する。

🚀

GitHub - xaskasdf/ntransformer: High-efficiency LLM inference engine in C++/CUDA. Run Llam..

  • 高効率C++/CUDA推論エンジンでLLMを実行。
  • VRAM経由のストリーミングとNVMe直読でCPUを介さず動作。
  • 3段階アダプティブキャッシュで70Bを最大33倍高速化。

Sam Altman would like remind you that humans use a lot of energy, too | TechCrunch

  • インドのイベントでAIの環境影響について語った。
  • 水の使用は虚偽とされ、蒸発冷却は使われずと指摘。
  • 総エネルギー消費の懸念は妥当で、原子力・風力・太陽光へ転換を求めた。

🤯

OpenAI debated calling police about suspected Canadian shooter's chats | TechCrunch

  • 18歳の射手が会話AIを使い組織を揺さぶったと報じられた
  • 会話は監視ツールでフラグされ、2025年6月に利用禁止に
  • 危機時は988へ、銃乱射を模したゲームを作成し銃情報を投稿

🤖

Google VP warns that two types of AI startups may not survive | TechCrunch

  • 生成AIブーム後、2タイプの企業の存続が難しいと指摘される。
  • ラッパー型は差別化が難しく、横断/垂直市場の深い戦略が鍵。
  • アグリゲーター型は複数LLM統合で成長鈍化、IP設計が要。

😊

「AIがホワイトカラーの職を奪っている」はウソ? 英経済誌が徹底調査 | クーリエ・ジャポン

  • 生成AIが雇用や賃金を奪うとの懸念は過剰だ
  • 実績は雇用の増加と賃金の上昇を示している
  • AIは働き方を再定義し人と機械の協働を促す

もっと見る
このサイトについて

/

ニュースレター

/

@AINewsDev