AI News

~AI関連記事を3行にまとめて紹介~

Cover Image
1週間のAIの話題をまとめて読める、📨Weekly AI News はこちら!

🚀

LFM2.5-8B-A1B: an Even Better on-Device Mixture-of-Experts | Liquid AI

  • エッジ向けモデルを公開し、高速・安定した呼び出しを実現。
  • 128K文脈窓と語彙128Kへ拡張し、性能を向上。
  • 思考連鎖出力の推論を搭載し、複数環境で公開。

🤖

What happens when companies become too AI-pilled? | TechCrunch

  • AI肯定派と懐疑派が同時に正しい局面があると指摘される。
  • AIエージェント導入で従業員の約22%を削減した事例がある。
  • 3件の取引と自動運転ロボットタクシーの新展開が解説される。

😊

So you've heard these AI terms and nodded along; let's fix that | TechCrunch

  • AIの新語を整理・解説する生きた用語集を提供します。
  • 5分程度でLLM・RAG・RLHFなどを理解できるよう解説します。
  • 最新動向に合わせて定期更新し、主要概念を簡潔に解説します。

😎

CAPTCHAs can still detect AI agents | Roundtable Research

  • 推論過程の差がAI検出の鍵になる。
  • キャプチャは崩れず、信号識別だけでは人間性を再現できない。
  • プロセステューリングテストの提案と小型モデルの動向を紹介。

😊

Cognition's Scott Wu says AI coding agents shouldn't replace humans | TechCrunch

  • 260億ドルの評価で10億ドルを調達と発表された。
  • エンドツーエンドのタスクを担い、自己運転ソフト開発へ移行。
  • 約89%のコードを出荷し他分野へ拡大、最終判断は人間が要る。

🤖

Notes from the AI Now Summit by Mistral | Koen van Gilst

  • 計算資源・モデル・プラットフォームを統合する全AIスタックを推進。
  • 欧州拡張は40MWデータセンターを軸に進行。
  • オンプレ・オープン・専用モデルが強みで米依存脱却を目指す。

😂

Premium: What If...We're In An AI Bubble? (Part 3)

  • AIバブルの正当性を巡る条件を整理している。
  • 巨額売上を支えるには年間大量の計算需要が必要だ。
  • 現金流確保と成長維持の崩れが直ちに大問題となる。

🎉

「残高教えて」ChatGPTに話しかけるだけ マネーツリー、「Apps in ChatGPT」対応 - ITmedia AI..

  • 会話で口座残高と取引明細を確認できる新機能を公開。
  • 登録済みの情報を使い、会話内でデータを整理して提示。
  • データは最小限に限定され、安全性を確保。

🤖

What's going on with Gemini? - Martin Alderson

  • 前線モデルの主導権は大手勢力に偏っている。
  • 新世代は速度と評価のバランスを重視するが最先端には届かない。
  • 内部用途重視で、ハード統合と独自ツールが強みと課題。

🤖

Karpathy氏の200行GPT「microGPT」を1行1行読み解く

  • 外部依存ゼロで訓練・推論に挑む、200行GPTの読み解き。
  • 約3万2千件の英名データを学習対象とする。
  • 文字をID化する簡易トークナイザとAutograd風自動微分、GPT-2風Transformerを実装、パラ4,192個。

🚀

「Mythos級モデル」一般提供、数週間以内に 米Anthropic「Opus 4.8」リリース - ITmedia NEWS

  • 最上位級AIの提供を数週間内に全顧客へ拡大予定。
  • 悪用リスクを抑える防御策を強化して公開準備を進めている。
  • Opus 4.8を同時発表、コード・推論・エージェント能力が向上、価格は据え置き。

🚀

Expertise in the Age of AI

  • AI時代の専門性は上位エンジニアの出力最適化に向かう。
  • コーディングエージェントの進化でジュニアの費用対効果は低下。
  • 約5年の経験でコード感覚を養い、基礎学習を段階的に進める。

Mistral AIがLe Chatを「Vibe」にリブランド、チャットやコーディングや仕事補助エージェントの..

  • 新名称のチャットAIへリブランド、機能を統合。
  • 統合環境はチャット・コーディング・業務補助を一括。
  • ウェブ・iOS・Android版と履歴の引き継ぎに対応。

🤖

Anthropic、「Claude Opus 4.8」を発表 ~過去一で有能かつ“誠実な”最新鋭モデル - 窓の杜

  • Opus 4.8は判断力と誠実性を高めた新モデルである。
  • 欠陥見逃しリスクを約4分の1に抑制した。
  • Fastは同価格の1/3で2.5倍速。

🚀

Forward Deployed Engineer: AI + HPC at Cedana | Y Combinator

  • AIとHPCの不足と高コストが課題で故障時は時間と費用がかかる。
  • クラスター利用率は成果と収益を直接左右する。
  • OSレベルで動作しコード変更なし、透明かつ高速に移行できる。

🔒

16万スター超のCLAUDE.mdに学ぶ、Claude Codeを暴走させない運用術 #ClaudeCode - Qiita

  • 長期利用を前提に、明確な運用方針で安全性を高める。
  • 4原則を軸に、個人と全体の指示を整理して守る。
  • グローバルとプロジェクト別に設定を分け、手順を整える。

🤖

AnthropicがClaude Opus 4.8を発表、Opus 4.7からのアップグレードでコーディング性能と誠実さの..

  • Opus 4.8はエージェント型コーディングと多分野推論を強化。
  • SWE-Bench Proは4.7を上回る一方、オンデバイス課題でGPT-5.5が優位。
  • 実務知識作業とエージェント作業の改善と誠実さの進化を評価。

🤖

ついにGoogleの画像生成AI「Nano Banana 2」と「Nano Banana Pro」の一般提供が始まる、Preview..

  • GAリリースとAPI経由の利用開始を案内。
  • 最大14枚参照画像・4K出力・動画入力をサポート。
  • SynthID水印付き、APIとStudioプランの料金案内。

🔋

「ローカルAIがズルズルと動き続けて無駄にバッテリーやGPUリソースを消費してしまう問題」を解..

  • AgentStopはローカルAIの長時間実行を抑える技術として公開、MITライセンスのオープンソース。
  • 出力の確信度低下や同じ反復を検知して実行を中断する。
  • 実験は電力を約19%削減、完了率低下を約3%に抑えた。

🚀

高速かつ高精度なオブジェクト検出AIモデル「LocateAnything」をNVIDIAが公開、写真だけでなくア..

  • 高速かつ高精度な新規オブジェクト検出AIが公開された。
  • 写真だけでなくアプリUIや文字検出にも対応する。
  • デモアプリはオンライン公開され、複数要素同時検出にも対応。

😊

AIにコードを書かせまくると検査コストが爆発すると専門家が指摘、生成量を減らす考え方が重要 -..

  • AIに大量のコードを書かせると検査コストが急増する。
  • 生成量を抑え、検証済み部品の活用を優先する方針が有効。
  • 設定のみをAIに任せ、特殊業務ロジックは新規生成とする。

🎬

The $500K AI Film That 'Premiered at Cannes' Didn't Actually Premiere at Cannes - Firether..

  • カンヌでの公開を宣伝したが公式上映はなし。
  • 上映はMarché du Filmで行われ、公式記録には記載なし。
  • 制作は95分・2週間・総額$500k、費用は$400kとされる。

🚀

Real-time LLM Inference on Standard GPUs (3,000 tokens/s per request)

  • 標準GPUでのリアルタイム推論を公開。
  • 8×AMD MI300Xで3,000トークン/回、FP16・推測デコードなし。
  • 8×NVIDIA H200で2,100トークン/回、2Bモデル動作、将来は大規模モデルも同等。

📱

Apple、WWDCでオンデバイスAIを主要テーマに設定へ - こぼねみ

  • 来月の発表会でオンデバイスAIを強調する。
  • 15年超の半導体ノウハウでクラウド依存を抑制する。
  • デバイス上で小型化したモデルを動かす計画と買収候補の検討。

🤖

新人漫画原作者の人が、作画担当がチャッピーと画像生成AIで主人公の容姿デザインを作っていたこ..

  • 作画がAIを使い主人公の容姿を作っていた事実が発覚した。
  • 連載企画の降板と炎上リスクの議論が広がっている。
  • 原作者の責任やデザイン段階でのAI活用の賛否が問われる。

🔥

「ローマ字のままAIに投げる」文字入力の仕方が便利で目から鱗…やってみたという人の意見も含め..

  • AI時代の書き方を探る発信が注目を集める
  • ローマ字入力だけでAIとやりとりする試みを紹介
  • 創作術の発想も積極的に発信されている

Anthropic、Claude Opus 4.8を一般提供 誠実さが飛躍的に向上、Mythosに並ぶアライメント性能を..

  • 進捗と不確実性の報告が誠実で、過信が低下した。
  • ダイナミックなワークフローで大規模タスクを自動処理。
  • Mythos同等のアライメントだが全体能力は上回らず、近く公開。

🚀

ガバメントAI「源内」、全府省庁で実証開始 既に約10万人が利用可能 - ITmedia AI+

  • 全府省庁向けの大規模実証が開始され、約10万人が利用可能。
  • 6月以降は防衛・文科・経産省などへ拡大予定。
  • 2025年以降、約30種のアプリを実装予定。

🤖

AIエージェント開発特集 9社のアーキテクチャ・技術選定と本番運用のリアル - Findy Tools

  • 本番運用の現場課題と解決策を実務事例と共に解説する。
  • アーキテクチャと現場知見の両輪で課題解決の要点を整理。
  • 代表事例の品質評価ループや日次評価の実務を紹介。

🔥

米アンソロピック 「ミュトス」級AI 数週間以内に全顧客提供へ | NHKニュース | 生成AI・人工知..

  • 数週間内に全顧客へ同水準の高性能AIを提供予定。
  • 公開見送りの懸念を克服し導入を加速する。
  • 市場は高性能AIの普及で競争が激化する。

Appleは新しいSiriを動かすためにGeminiを小型化してiPhoneに詰め込む作業を進めている - GIGAZI..

  • 新Siri実現に向け、GeminiをiPhone上で動作させる小型化を進める。
  • 完全デバイス内処理は難しく、端末とクラウドの併用が前提。
  • Geminiの最適化は契約後に進行、WWDC26で新機能を発表予定。

😊

何故今日においても回帰分析の理論的基礎を勉強しておくべきなのか - 渋谷駅前で働くデータサイ..

  • 回帰分析の理論を理解する重要性を改めて確認する。
  • 現場では前提が満たされぬことが多く慎重に併用する。
  • 現代手法を使う際は理論基盤と他手法の理解が鍵。

🚀

米アンソロピック、「ミュトス級」のAIを数週間内に一般公開へ - 日本経済新聞

  • セキュリティ上の懸念で非公開だったが公開準備が整う。
  • 数週間内に同等レベルのAIを公開する見通し。
  • 日本を含む海外でも利用可能になり、保護策も整備が進む。

🌟

アンソロピックの企業価値154兆円に、OpenAIを初めて上回る(TBS CROSS DIG with Bloomberg) - ..

  • 資金調達後、企業価値が大幅に上昇した。
  • 複数VCが資金調達を主導している。
  • 今秋のIPOを目指す見通しが示唆された。

🔥

AWS DevOps AgentとBedrockを連携させ、障害一次対応を自動化する | DevelopersIO

  • 監視と履歴を横断して一次対応を自動化
  • エージェントが原因と対処案を即時に提示
  • イベント連携で自動調査を実行するデモ

⚔️

合法性はひとまず置いた上で…欲しいAIは「隣でゴマすって適当な嘘をつくご機嫌取りの小男」では..

  • ごまをすらず欠点を指摘する戦闘補助AIが欲しい。
  • 現実条件と自機状態を踏まえ、難易度高くても達成可能な案を提案。
  • アスラーダのようにズケズケ言ってくれるAIで構わない。

🤖

Weekly AI News #2026-05-29 - by hotchpotch - Weekly AI News

  • 生成AIの声の無断学習・合成への法的対応と現場の不安を整理。
  • YouTubeの自動AIラベリング強化で透明性と信頼性の向上が進む。
  • 商用化と権利調整の潮流や研究支援拡大・検証課題を横断的に解説。

Claude Opus 4.8: “a modest but tangible improvement”

  • 会話中にシステム指示を更新できる新機能がある。
  • 六機種中最も誤り率が低く未知は不確実さを示す。
  • 価格は前モデルと同額の$5/百万入力、$25/百万出力。

🔥

「それ本当にMVP?」 AI時代にプロダクトが巨大化する理由をふりかえる - カミナシ エンジニアブ..

  • AI時代のMVPは小さく範囲を決めて進めるべきだ
  • AIの出力でスコープが広がる点に備え検証を増やす必要がある
  • 人が初動を定義し、タイムボックスでインクリメンタルに進むのが有効

🔥

Glean's top line crosses $300M as AI budget-cutting becomes its major selling point | Tech..

  • ARRは3億ドルに到達、15カ月前の1億ドルから3倍。
  • 競合が増える中、7年超の経験で成長を加速。
  • コンテキストグラフで社内システムと学習を結び、従量課金+固定月額のハイブリッド採用。

😊

AI-DLCをClaude Skill化して「エンジニアの役割越境」を実現した話 - Findy Tech Blog

  • 新しい開発法で役割越境を実現する実践を紹介。
  • 設計からテストまで一人で完結できる体制を目指す。
  • 出力フォーマットを統一し再現性と作業負荷を軽減。

🎯

Weekly Kaggle News #337 - by u++ - Weekly Kaggle News

  • CLI v2.2.0公開でディスカッション情報の取得が可能に。
  • AIドラゴン桜のリスキリング事例と成果を紹介。
  • Grandmasterの類似画像検索モデル開発の発表資料と学習工夫をまとめ。

🚀

OpenAI、プライベートMCPサーバーをChatGPTやCodexに安全に接続できる「Secure MCP Tunnel」を提..

  • プライベートMCPサーバーを公開せず安全に接続できるトンネルを提供開始
  • 公開ポート開放不要でChatGPTやCodexへ接続可能な点が特徴
  • tunnel-clientを社内実行で外向きHTTPSを送信、mtls時はコントロールプレーン経由で通信

🤖

AIでタンパク質を予測・設計・発見するモデルをマーク・ザッカーバーグが出資する研究所「Biohub..

  • 病気治療法開発を加速するAIタンパク質予測・設計・発見を無償公開。
  • 約28億配列のESMCと設計エンジンを統合するプラットフォーム。
  • ESMFold2は抗体・タンパク質間相互作用予測で高性能。

🚀

生成AIが本当に変えるのは「検索」ではなく「設計知」だ – WirelessWire & Schrödinger's

  • 新潟出身のプログラマーで起業経験が長い。
  • 生成AIは設計知を強化し、検索より価値を生み出す。
  • 設計の文脈を目的・観察・議論・結論・次の行動で整理する。

🔥

The internet is being rebuilt for machines | TechCrunch

  • AIエージェントが人間中心設計を超え、数百DBを瞬時に問い合わせる。
  • 計算と保存を分離し、タスクで即座にスケールアップする。
  • エージェント用の検索・ベクターDBを整備し、内部展開が広がる。

Training Azerbaijani language models on Amazon SageMaker AI | Artificial Intelligence

  • 限定データで高度な形態のアゼルバイジャン語LLMを構築
  • Stage1で100k語彙の自作BBPEトークナイザーによりエンコーディングを倍速化
  • Stage2でLlama 3.2 1Bを継続前学習、Stage3でLoRAによる対話調整を実施

汎用人工知能(AGI)の実現は2030年頃と予想しているが2029年の可能性も視野に入れているとGoogle ..

  • 2030年ごろの実現を予想、早ければ2029年の可能性も示唆。
  • 人類はシンギュラリティ直前の社会準備期間が短い。
  • 次世代AIは社会的安全性を検証する要素として議論を促す。

🌐

Various LLM smells | Shiv After Dark

  • LLM執筆では断片化した表現が別文脈で繰り返される。
  • AI生成サイトは特定フォントのボタンや点滅などデザインに兆候が現れる。
  • クリエイティブ活用を否定せず、AIの匂いを意識して運用する。

😊

Sam Altman and Dario Amodei are both walking back AI jobs apocalypse predictions as they e..

  • 著名な2人のCEOは雇用崩壊予測を修正している。
  • IPOを視野に入れ、影響を再評価している。
  • 時価総額は約1兆ドル規模と伝えられている。

もっと見る
このサイトについて

/

ニュースレター

/

@AINewsDev