AI News

~AI関連記事を3行にまとめて紹介~

Cover Image
1週間のAIの話題をまとめて読める、📨Weekly AI News はこちら!

🌟

Introducing Modal Auto Endpoints: Optimized inference you actually own

  • 推論エンドポイントを自前で運用できるセルフサービス型
  • 業界標準API互換のエンドポイントを支え、コードと指標を公開
  • CLIでGLM-5.2-FP8のエンドポイント作成が可能、観測性も整備

🎯

AI時代のナレッジ管理手法 - Googleの「OKF」を解説

  • YAMLメタデータを冒頭に置く簡易規約を紹介
  • フォルダ構成と概念間リンクで接続性と検索性を高める
  • 3つの設計思想と架空の製品で実例を紹介

😊

「馬鹿とハサミは使いようだ…」あえて能力の低いAIにマニュアルを実行させ、「賢いAIなら補完し..

  • 低能力AIにマニュアルを実行させ暗黙知を炙り出す試みが話題。
  • GPT/DeepSeekを熟練エンジニア、M3を新人に見立て設計を任せる。
  • コストを抑え小型モデルを組み合わせ、役割分担でワークフローを設計。

🔥

NotebookLMの限界を突破する代替ツール「Open Notebook」が自由すぎた | ライフハッカー・ジャパ..

  • 自分の資料だけを根拠に動く点が魅力。
  • ソースをアップロードしてチャット・要約・ポッドキャスト作成が可能。
  • ローカル運用やDocker対応で導入が容易。

💸

DSHR's Blog: AI's Affordability Crisis

  • 従業員のトークン消費コストが企業の課題に急増。
  • 月額200ドルで最大8,000〜14,000ドル分のトークン実費。
  • AI投資は巨額の負債と人間置換の検討が前提。

🤖

Shared infrastructure, isolated tenants: Pool model multi-tenancy with Amazon Bedrock Agen..

  • 安全なマルチテナント運用の実践パターンを紹介。
  • 階層分離を実現しデータを階層化。
  • テナント単位でコストを追跡し機能差を提供。

🔥

Build a protein research copilot with Amazon Bedrock AgentCore | Artificial Intelligence

  • クラウドのエージェントコア環境でタンパク質研究を構築する。
  • パーサー・サーチャー・サマナイザーをSDKで統合。
  • 埋め込みはESM-C300M、Aurora pgvectorとSageMakerを併用。

🛡️

OpenAIがClaude Mythos 5超えのセキュリティー特化AI「GPT-5.5-Cyber」のアップデートを発表&セ..

  • 最新のセキュリティ特化AIのアップデートを発表。
  • 大規模コード分析や脆弱箇所のパッチ作成を支援、 Daybreak Cyberパートナーも発表。
  • Codex Security更新で詳細スキャン・影響分析・修復レポートを提供。

🤖

Mistral OCR 4 : SOTA OCR for Document Intelligence

  • 境界ボックス・ブロック種別・信頼度を同時に返します。
  • 170言語・10グループ対応、1コンテナで自己ホスト可能。
  • APIは4ドル/千ページ、Batchは2ドル/千、Document AIは5ドル/千。

🔥

第313回 TPU製造を巡るGoogleとIntelの賭け――AIが強いる「ハード使い捨て」の過酷な舞台裏:頭..

  • TPUを巡る大口発注と供給体制の逼迫が話題に。
  • 現行世代は第7世代、次世代は3nm製造を予定。
  • 巨額投資の回収と普及の速さが課題として指摘。

🤖

ループエンジニアリングとは? チャットとAIコーディングの往復から卒業する新しい開発スタイル..

  • AIエージェントを回し続けるループ設計で自動化を維持。
  • ハートビートで継続稼働し、衝突回避はGit worktreeで対応。
  • セッションごとにSKILL.mdでルールを記録、外部連携はMCPベース。

🔥

2億2600万パラメーターで100億パラメーター級の画像補完性能を示すAIフレームワーク「Moebius」..

  • 約2.26億パラで欠損部を周囲と自然につなぐ補完技術を実現。
  • 不要物除去や顔の置換にも対応可能な用途特化型。
  • 512x512を単一GPUで26.01ms処理を実証。

😅

Tech giant Oracle cuts 21,000 jobs as it embraces AI

  • AI戦略を強化する中で、過去1年で約21,000職を削減。
  • 5月末時点の従業員は約141,000人となり前年から減少。
  • 再編費用は約18億ドルで、クラウドとAIの成長が背景。

💖

Fika Jobs raises $4M to build a video-first hiring platform where AI agents interview cand..

  • 動画中心の採用プラットフォームでAI面接官が候補者を評価。
  • 短尺動画プロフィールとAI分析で人格・伝達力を評価。
  • 求職者は無料、企業は前払い不要、第一年給与の10%が成功報酬。

😊

複数の写真から3Dシーンを生成するAIモデル「ArtiFixer」をNVIDIAが発表、写真にない部分も生成..

  • 複数枚の写真から高品質な3Dシーンを生成するAIを紹介。
  • 欠損部を補完する自己回帰モデルと2段階学習を採用。
  • 従来手法の欠点を克服し、3種のArtiFixerを提供。

😊

Shipping huggingface_hub every week with AI, open tools, and a human in the loop

  • オープンツールとオープンウェイトで週次リリースを実現。
  • AIと人の判断を組み合わせ、4〜6週分を週次へ転換。
  • ノート作成はAI案を人が最終確認、コストはほぼゼロ。

💧

AIが飲み込む水、アフリカ13億人の生活用水に匹敵――国連大学が警告、「丁寧すぎる指示」も負荷..

  • ・AIのデータセンター電力は全体の約3%に達する見込み。
  • ・水使用量は9.3兆リットル、生活用水に匹敵する。
  • ・指示を簡潔化し負荷を軽減することが提言される。

🔥

We got local models to triage the OpenClaw repo for FREE!*

  • 地元モデルを使い課題やPRを無料で分類する取り組みを紹介します。
  • GemmaとQwenをPi型ハーネスと組み合わせ安全な環境で分類を進めます。
  • Reposhellで安全にコード参照を行い、結果をSQLiteに保存して通知します。

🔥

Claude Opus級のGLM-5.2をローカルで動かすガイドが公開される、最小構成の目安はメモリ223GB - ..

  • ローカル実行用ガイド、最小構成は223GB程度の量子化。
  • 4ビットで上位1%の精度は約97.5%、1ビットは約76.2%。
  • 2ビットはMoEオフロード推奨、Macは256GB統合推奨。

AIでおしゃれな画面を作るためのデザインシステムを学ぼう! #生成AI - Qiita

  • デザインシステムと生成AIの指示設計を解説。
  • 情報設計・レイアウト・カラー・タイポグラフィ・UI状態・アクセシビリティを網羅。
  • 実務で使えるプロンプトの例を章立てで紹介。

🎯

YOLO26: YOLO Model for Real-Time Vision AI [2026]

  • 複数タスクを同時処理する統合モデル群で検出・分類を実現。
  • Nano〜エクストララージの5サイズを採用。
  • 遅延低減のためNMS排除とCPU推論の高速化、学習安定化手法を搭載。

🤖

[2606.03748] Ultralytics YOLO26: Unified Real-Time End-to-End Vision Models

  • リアルタイム推論を統合した新世代モデル群を紹介。
  • NMS不要のエンドツーエンド推論とDFL排除で軽量ヘッド、TensorRT遅延1.7–11.8 ms。
  • 5スケール対応と多タスクヘッド統合で小物体性能向上。

🤖

Claude CodeがSOC業務を全自動でやってくれるってさ - ZOZO TECH BLOG

  • Claude CodeでSOC業務を自動化するエージェントを構築。
  • アラートを分析・優先度評価してSlackへ要約を投稿。
  • データはSplunk MCP/OpenCTI MCPで取得、初動はRead権限で完結、SubAgentを並列起動。

🚀

「AI銘柄」になったリクルート データで攻勢、市場の評価一変 - 日本経済新聞

  • データ活用が銘柄化を促し市場評価を変える。
  • AI関連銘柄への資金集中が株価を押し上げる。
  • 求人サービスのAI活用拡大が成長期待を高める。

💡

AIエージェントに身分証を発行するエストニア、電子政府で先頭を走る人口130万人の小国が問うAI..

  • 人口130万の小国エストニアがAIエージェントにデジタルIDを付与する世界初の試み。
  • 首相が計画を承認し、AIの作業を限定・監査可能にする狙いを説明。
  • 現状はAIが指示者のIDを借り、予約や申告を代行している。

🔥

Sakana Fugu (GA) をサブスクリプションプランで試してみた | DevelopersIO

  • GA同日開始のサブスクで3プランを用意。
  • 料金はStandard20$/月、Pro100、Max200。
  • 内部は訓練済みLLMが複数モデルを動的振り分け。

🤖

AIがコードを書ける時代だからこそ、Jrエンジニアに「AIを疑う力」を育てた話 - MonotaRO Tech B..

  • 教材×1on1×実務課題でAIを疑う力を育てる。
  • マインドマップで基礎力・批判的レビュー力を可視化。
  • 後者の出力を批判的に読む力を主役に据えた。

😅

The running list: major tech layoffs in 2026 where employers cited AI | TechCrunch

  • 大手は過去12か月で約2.1万人を削減と公表した。
  • AI導入で人員削減が進み今後も影響が続く見通し。
  • 業界はAIを成長エンジンにしつつ削減理由にもなると認識。

🔥

[2606.16140] VibeThinker-3B: Exploring the Frontier of Verifiable Reasoning in Small Langu..

  • 小型モデルのパラメータ設定を提示し検証可能な推論を探る。
  • 訓練は Spectrum-to-Signal 後訓練と複数手法を組み合わせる。
  • AIME26 94.3点、LiveCodeBench 80.2、LeetCode未見問題の受理率96.1%を記録。

踏切に取り残された人をAIで検知→列車を自動停止 小田急が実運用 - ITmedia NEWS

  • 踏切内の取り残しをAIで検知し列車停止へ連携
  • 沿線4カ所で24日から新システムを運用開始
  • 映像は危険検知目的のみで個人識別はしない

🔥

「仕事のための仕事」を撲滅せよ 95%失敗するAI導入、Notionが語る「レベル2の壁」とは?(1/3..

  • 研究は大半のAI導入が効果を出せず停滞すると示す。
  • 統合型ワークスペースが生産性向上の鍵とされる。
  • 価値実感の欠如・偏在・文脈理解不足が落とし穴の三点。

🚀

マツダはなぜデータ分析基盤にClickHouseを使うのか――データをためるより「取り出す」こそ問題..

  • 大量データを取り出す設計が分析の主眼だ。
  • 高速検索と高圧縮が価値創出を加速する。
  • 2018年導入以降、データレイク/DWH/データマートを統合。

🚀

GLM-5.2がGRPOを密かに放棄、オープンソース大規模モデルの強化学習パラダイムに分水嶺 — BigGo..

  • GLM-5.2はGRPOを放棄し、長距離タスクへPPOを適用へ転換。
  • 新しい採点官を再訓練し、長さの異なる軌跡を独立評価。
  • 二段遮断で報酬ハックを抑制し、複数エキスパートを蒸留統合。

🔥

Amazon BedrockのLLM呼び出しコストをApplication inference profileでAI機能別に可視化する - ..

  • 機能ごとにプロファイルを作成しコストを可視化する。
  • ARNを指定して呼び出し時に機能別に集計できる。
  • 4手順はTerraform/IAM/ARN渡し/タグ有効化。

🚀

Porting the Moebius 0.2B image inpainting model to run in the browser with Claude Code

  • Moebius 0.2Bの画像修復をブラウザで動かす実験を実現。
  • ONNX Runtime WebとWebGPUを組み合わせブラウザ実行を目指す。
  • 約1.3GB級モデルをCacheStorageでキャッシュ可能と報告。

😊

Anthropicが2026年7月8日から一部サービスにおける本人確認の実施を明言、使用するシステムはDis..

  • 一部サービスで2026年7月8日から本人確認を実施。
  • 新ポリシーに年齢や身元の要請が明記。
  • ペルソナ・アイデンティティーズを使用。

VSCode + Continue + Ollama で構築するローカルMCP開発環境(その1)

  • ローカル環境でMCP開発を自動化する手順を解説する
  • Windows11上でLLMとローカルサーバを統合設定する
  • 設定ファイルでモデルとサーバを統合し動作を確認する

エージェントスキルを評価する仕組みを作ってみる | フューチャー技術ブログ

  • Skillsを横断ツールとして比較し、実測ベンチを作成する。
  • Codex-5.5の処理時間・トークンを比較し、実行形式を評価。
  • 明示/暗黙の実行差と将来のモデル選択・キャッシュ戦略を検討。

🧠

GLM-5.2 - How to Run Locally | Unsloth Documentation

  • 新開放モデルは長期の推論・エージェント作業でSOTA。
  • 744Bパラ、文脈窓1M、ローカル実行は動的量子化で可能。
  • RAM目安は2b239GB/1b223GB/8b810GB、思考モードは3種。

🔥

Getty ImagesがOpenAIと複数年契約、ChatGPTにライセンス画像を提供へ | テクノエッジ TechnoEdg..

  • 複数年契約で高品質画像がAIサービスへ供給される見込み
  • 検索・回答へライセンス画像が表示される予定
  • 他社AIと提携、出典クレジットと条件は未公表

🤖

Google、A24と映画制作向けAIツール開発で提携。7500万ドル(約121億円)を出資 | テクノエッジ ..

  • 映像制作のAI研究提携が発表、劇場向け革新を目指す
  • 出資は約7500万ドル、映像素材の学習・生成は行わない方針
  • 現場の声を反映させる方針で、ストーリーボードAIも開発中

🔥

The AI world is getting 'loopy' | TechCrunch

  • 創設者はエージェント同士がコードを作る時代を語る。
  • 新しい潮流では協働と監視が鍵になる。
  • エージェントは出し合い、コードは常に更新される。

Excelを代わりに操作してくれる「Copilot in Excel」がさらに便利に、「自分のやり方」や「共同..

  • 個人設定でセル結合なしやグラフ赤禁止などを事前登録可能。
  • ワークブック単位でルールを適用し、.Rulesへ保存・共有可能。
  • 作成は+からで、A列記述を既存シートへ適用してルール化。

🎬

Google DeepMind bets $75M on AI's future in Hollywood with A24 deal | TechCrunch

  • 主要スタジオと大手が新たな提携を発表した。
  • 7,500万ドルの投資で映画制作AIツールを共創へ。
  • 芸術家の声を反映するAI機能の開発を進める方針だ。

🌟

TBSラジオ、AIが音声広告を1分で作成 ポッドキャストの広告主開拓 - 日本経済新聞

  • 約1分で20秒程度の音声広告を作成する新サービスを開始
  • 22日から開始、ポッドキャスト向け広告の新規スポンサー開拓を狙う
  • 広告主・代理店向け会員サイト経由で提供、デモ版は企業名と商品名で作成

🧭

Prompt Injection as Role Confusion

  • ・役割認識の脆弱さが外部データを指示と偽認させる手口を説明する。
  • ・思考タグと表現様式が役割感知を攪乱する現象を示す。
  • ・思考連鎖偽造と現状の対策課題を論じる。

😂

Running ComfyUI workflows on Amazon SageMaker AI processing jobs | Artificial Intelligence

  • クラウド処理ジョブでLambda起動しワークフローを実行し自動生成を拡張。
  • Z-Image Turboによる高品質画像を一括生成して広告資産を迅速化。
  • セキュアなインフラを構築し、出力はS3へリアルタイムでストリーミング保存。

🚀

Embed the world: Multimodal AI for searchable aerial imagery at scale | Artificial Intelli..

  • 地理空間画像の多視点検索を7視点統合の埋め込みとキャプションで高速化。
  • AOI設定→画像取得→埋め込み・索引→検索・評価の5段階設計。
  • Ground truthはOpenStreetMapを用い、性能評価を示唆。

🤖

SpaceX inks compute deal with Reflection AI, an open-source AI lab | TechCrunch

  • メンフィス近郊のデータセンターで最新GB300AIチップへ即時アクセスの契約
  • 総額63億ドルの長期契約で、開始は2026年7月、2029年まで有効
  • オープンウェイトAI戦略の下、オープンソースモデル普及を目指す

🔥

Expert-aware quantisation: near-Q4 quality at near-Q2 size? - Martin Alderson

  • エキスパート別量子化を検討する手法を示す。
  • MoEを事前プロファイリングし高精度をホットに限定。
  • 局所性からNear-Q4をNear-Q2サイズへ適用。

もっと見る
このサイトについて

/

ニュースレター

/

@AINewsDev