~AI関連記事を3行にまとめて紹介~
1週間のAIの話題をまとめて読める、
📨Weekly AI News はこちら!
🌟
Introducing Modal Auto Endpoints: Optimized inference you actually own
推論エンドポイントを自前で運用できるセルフサービス型
業界標準API互換のエンドポイントを支え、コードと指標を公開
CLIでGLM-5.2-FP8のエンドポイント作成が可能、観測性も整備
🎯
AI時代のナレッジ管理手法 - Googleの「OKF」を解説
YAMLメタデータを冒頭に置く簡易規約を紹介
フォルダ構成と概念間リンクで接続性と検索性を高める
3つの設計思想と架空の製品で実例を紹介
😊
「馬鹿とハサミは使いようだ…」あえて能力の低いAIにマニュアルを実行させ、「賢いAIなら補完し..
低能力AIにマニュアルを実行させ暗黙知を炙り出す試みが話題。
GPT/DeepSeekを熟練エンジニア、M3を新人に見立て設計を任せる。
コストを抑え小型モデルを組み合わせ、役割分担でワークフローを設計。
🔥
NotebookLMの限界を突破する代替ツール「Open Notebook」が自由すぎた | ライフハッカー・ジャパ..
自分の資料だけを根拠に動く点が魅力。
ソースをアップロードしてチャット・要約・ポッドキャスト作成が可能。
ローカル運用やDocker対応で導入が容易。
💸
DSHR's Blog: AI's Affordability Crisis
従業員のトークン消費コストが企業の課題に急増。
月額200ドルで最大8,000〜14,000ドル分のトークン実費。
AI投資は巨額の負債と人間置換の検討が前提。
🤖
Shared infrastructure, isolated tenants: Pool model multi-tenancy with Amazon Bedrock Agen..
安全なマルチテナント運用の実践パターンを紹介。
階層分離を実現しデータを階層化。
テナント単位でコストを追跡し機能差を提供。
🔥
Build a protein research copilot with Amazon Bedrock AgentCore | Artificial Intelligence
クラウドのエージェントコア環境でタンパク質研究を構築する。
パーサー・サーチャー・サマナイザーをSDKで統合。
埋め込みはESM-C300M、Aurora pgvectorとSageMakerを併用。
🛡️
OpenAIがClaude Mythos 5超えのセキュリティー特化AI「GPT-5.5-Cyber」のアップデートを発表&セ..
最新のセキュリティ特化AIのアップデートを発表。
大規模コード分析や脆弱箇所のパッチ作成を支援、 Daybreak Cyberパートナーも発表。
Codex Security更新で詳細スキャン・影響分析・修復レポートを提供。
🤖
Mistral OCR 4 : SOTA OCR for Document Intelligence
境界ボックス・ブロック種別・信頼度を同時に返します。
170言語・10グループ対応、1コンテナで自己ホスト可能。
APIは4ドル/千ページ、Batchは2ドル/千、Document AIは5ドル/千。
🔥
第313回 TPU製造を巡るGoogleとIntelの賭け――AIが強いる「ハード使い捨て」の過酷な舞台裏:頭..
TPUを巡る大口発注と供給体制の逼迫が話題に。
現行世代は第7世代、次世代は3nm製造を予定。
巨額投資の回収と普及の速さが課題として指摘。
🤖
ループエンジニアリングとは? チャットとAIコーディングの往復から卒業する新しい開発スタイル..
AIエージェントを回し続けるループ設計で自動化を維持。
ハートビートで継続稼働し、衝突回避はGit worktreeで対応。
セッションごとにSKILL.mdでルールを記録、外部連携はMCPベース。
🔥
2億2600万パラメーターで100億パラメーター級の画像補完性能を示すAIフレームワーク「Moebius」..
約2.26億パラで欠損部を周囲と自然につなぐ補完技術を実現。
不要物除去や顔の置換にも対応可能な用途特化型。
512x512を単一GPUで26.01ms処理を実証。
😅
Tech giant Oracle cuts 21,000 jobs as it embraces AI
AI戦略を強化する中で、過去1年で約21,000職を削減。
5月末時点の従業員は約141,000人となり前年から減少。
再編費用は約18億ドルで、クラウドとAIの成長が背景。
💖
Fika Jobs raises $4M to build a video-first hiring platform where AI agents interview cand..
動画中心の採用プラットフォームでAI面接官が候補者を評価。
短尺動画プロフィールとAI分析で人格・伝達力を評価。
求職者は無料、企業は前払い不要、第一年給与の10%が成功報酬。
😊
複数の写真から3Dシーンを生成するAIモデル「ArtiFixer」をNVIDIAが発表、写真にない部分も生成..
複数枚の写真から高品質な3Dシーンを生成するAIを紹介。
欠損部を補完する自己回帰モデルと2段階学習を採用。
従来手法の欠点を克服し、3種のArtiFixerを提供。
😊
Shipping huggingface_hub every week with AI, open tools, and a human in the loop
オープンツールとオープンウェイトで週次リリースを実現。
AIと人の判断を組み合わせ、4〜6週分を週次へ転換。
ノート作成はAI案を人が最終確認、コストはほぼゼロ。
💧
AIが飲み込む水、アフリカ13億人の生活用水に匹敵――国連大学が警告、「丁寧すぎる指示」も負荷..
・AIのデータセンター電力は全体の約3%に達する見込み。
・水使用量は9.3兆リットル、生活用水に匹敵する。
・指示を簡潔化し負荷を軽減することが提言される。
🔥
We got local models to triage the OpenClaw repo for FREE!*
地元モデルを使い課題やPRを無料で分類する取り組みを紹介します。
GemmaとQwenをPi型ハーネスと組み合わせ安全な環境で分類を進めます。
Reposhellで安全にコード参照を行い、結果をSQLiteに保存して通知します。
🔥
Claude Opus級のGLM-5.2をローカルで動かすガイドが公開される、最小構成の目安はメモリ223GB - ..
ローカル実行用ガイド、最小構成は223GB程度の量子化。
4ビットで上位1%の精度は約97.5%、1ビットは約76.2%。
2ビットはMoEオフロード推奨、Macは256GB統合推奨。
✨
AIでおしゃれな画面を作るためのデザインシステムを学ぼう! #生成AI - Qiita
デザインシステムと生成AIの指示設計を解説。
情報設計・レイアウト・カラー・タイポグラフィ・UI状態・アクセシビリティを網羅。
実務で使えるプロンプトの例を章立てで紹介。
🎯
YOLO26: YOLO Model for Real-Time Vision AI [2026]
複数タスクを同時処理する統合モデル群で検出・分類を実現。
Nano〜エクストララージの5サイズを採用。
遅延低減のためNMS排除とCPU推論の高速化、学習安定化手法を搭載。
🤖
[2606.03748] Ultralytics YOLO26: Unified Real-Time End-to-End Vision Models
リアルタイム推論を統合した新世代モデル群を紹介。
NMS不要のエンドツーエンド推論とDFL排除で軽量ヘッド、TensorRT遅延1.7–11.8 ms。
5スケール対応と多タスクヘッド統合で小物体性能向上。
🤖
Claude CodeがSOC業務を全自動でやってくれるってさ - ZOZO TECH BLOG
Claude CodeでSOC業務を自動化するエージェントを構築。
アラートを分析・優先度評価してSlackへ要約を投稿。
データはSplunk MCP/OpenCTI MCPで取得、初動はRead権限で完結、SubAgentを並列起動。
🚀
「AI銘柄」になったリクルート データで攻勢、市場の評価一変 - 日本経済新聞
データ活用が銘柄化を促し市場評価を変える。
AI関連銘柄への資金集中が株価を押し上げる。
求人サービスのAI活用拡大が成長期待を高める。
💡
AIエージェントに身分証を発行するエストニア、電子政府で先頭を走る人口130万人の小国が問うAI..
人口130万の小国エストニアがAIエージェントにデジタルIDを付与する世界初の試み。
首相が計画を承認し、AIの作業を限定・監査可能にする狙いを説明。
現状はAIが指示者のIDを借り、予約や申告を代行している。
🔥
Sakana Fugu (GA) をサブスクリプションプランで試してみた | DevelopersIO
GA同日開始のサブスクで3プランを用意。
料金はStandard20$/月、Pro100、Max200。
内部は訓練済みLLMが複数モデルを動的振り分け。
🤖
AIがコードを書ける時代だからこそ、Jrエンジニアに「AIを疑う力」を育てた話 - MonotaRO Tech B..
教材×1on1×実務課題でAIを疑う力を育てる。
マインドマップで基礎力・批判的レビュー力を可視化。
後者の出力を批判的に読む力を主役に据えた。
😅
The running list: major tech layoffs in 2026 where employers cited AI | TechCrunch
大手は過去12か月で約2.1万人を削減と公表した。
AI導入で人員削減が進み今後も影響が続く見通し。
業界はAIを成長エンジンにしつつ削減理由にもなると認識。
🔥
[2606.16140] VibeThinker-3B: Exploring the Frontier of Verifiable Reasoning in Small Langu..
小型モデルのパラメータ設定を提示し検証可能な推論を探る。
訓練は Spectrum-to-Signal 後訓練と複数手法を組み合わせる。
AIME26 94.3点、LiveCodeBench 80.2、LeetCode未見問題の受理率96.1%を記録。
踏切に取り残された人をAIで検知→列車を自動停止 小田急が実運用 - ITmedia NEWS
踏切内の取り残しをAIで検知し列車停止へ連携
沿線4カ所で24日から新システムを運用開始
映像は危険検知目的のみで個人識別はしない
🔥
「仕事のための仕事」を撲滅せよ 95%失敗するAI導入、Notionが語る「レベル2の壁」とは?(1/3..
研究は大半のAI導入が効果を出せず停滞すると示す。
統合型ワークスペースが生産性向上の鍵とされる。
価値実感の欠如・偏在・文脈理解不足が落とし穴の三点。
🚀
マツダはなぜデータ分析基盤にClickHouseを使うのか――データをためるより「取り出す」こそ問題..
大量データを取り出す設計が分析の主眼だ。
高速検索と高圧縮が価値創出を加速する。
2018年導入以降、データレイク/DWH/データマートを統合。
🚀
GLM-5.2がGRPOを密かに放棄、オープンソース大規模モデルの強化学習パラダイムに分水嶺 — BigGo..
GLM-5.2はGRPOを放棄し、長距離タスクへPPOを適用へ転換。
新しい採点官を再訓練し、長さの異なる軌跡を独立評価。
二段遮断で報酬ハックを抑制し、複数エキスパートを蒸留統合。
🔥
Amazon BedrockのLLM呼び出しコストをApplication inference profileでAI機能別に可視化する - ..
機能ごとにプロファイルを作成しコストを可視化する。
ARNを指定して呼び出し時に機能別に集計できる。
4手順はTerraform/IAM/ARN渡し/タグ有効化。
🚀
Porting the Moebius 0.2B image inpainting model to run in the browser with Claude Code
Moebius 0.2Bの画像修復をブラウザで動かす実験を実現。
ONNX Runtime WebとWebGPUを組み合わせブラウザ実行を目指す。
約1.3GB級モデルをCacheStorageでキャッシュ可能と報告。
😊
Anthropicが2026年7月8日から一部サービスにおける本人確認の実施を明言、使用するシステムはDis..
一部サービスで2026年7月8日から本人確認を実施。
新ポリシーに年齢や身元の要請が明記。
ペルソナ・アイデンティティーズを使用。
✨
VSCode + Continue + Ollama で構築するローカルMCP開発環境(その1)
ローカル環境でMCP開発を自動化する手順を解説する
Windows11上でLLMとローカルサーバを統合設定する
設定ファイルでモデルとサーバを統合し動作を確認する
✨
エージェントスキルを評価する仕組みを作ってみる | フューチャー技術ブログ
Skillsを横断ツールとして比較し、実測ベンチを作成する。
Codex-5.5の処理時間・トークンを比較し、実行形式を評価。
明示/暗黙の実行差と将来のモデル選択・キャッシュ戦略を検討。
🧠
GLM-5.2 - How to Run Locally | Unsloth Documentation
新開放モデルは長期の推論・エージェント作業でSOTA。
744Bパラ、文脈窓1M、ローカル実行は動的量子化で可能。
RAM目安は2b239GB/1b223GB/8b810GB、思考モードは3種。
🔥
Getty ImagesがOpenAIと複数年契約、ChatGPTにライセンス画像を提供へ | テクノエッジ TechnoEdg..
複数年契約で高品質画像がAIサービスへ供給される見込み
検索・回答へライセンス画像が表示される予定
他社AIと提携、出典クレジットと条件は未公表
🤖
Google、A24と映画制作向けAIツール開発で提携。7500万ドル(約121億円)を出資 | テクノエッジ ..
映像制作のAI研究提携が発表、劇場向け革新を目指す
出資は約7500万ドル、映像素材の学習・生成は行わない方針
現場の声を反映させる方針で、ストーリーボードAIも開発中
🔥
The AI world is getting 'loopy' | TechCrunch
創設者はエージェント同士がコードを作る時代を語る。
新しい潮流では協働と監視が鍵になる。
エージェントは出し合い、コードは常に更新される。
✨
Excelを代わりに操作してくれる「Copilot in Excel」がさらに便利に、「自分のやり方」や「共同..
個人設定でセル結合なしやグラフ赤禁止などを事前登録可能。
ワークブック単位でルールを適用し、.Rulesへ保存・共有可能。
作成は+からで、A列記述を既存シートへ適用してルール化。
🎬
Google DeepMind bets $75M on AI's future in Hollywood with A24 deal | TechCrunch
主要スタジオと大手が新たな提携を発表した。
7,500万ドルの投資で映画制作AIツールを共創へ。
芸術家の声を反映するAI機能の開発を進める方針だ。
🌟
TBSラジオ、AIが音声広告を1分で作成 ポッドキャストの広告主開拓 - 日本経済新聞
約1分で20秒程度の音声広告を作成する新サービスを開始
22日から開始、ポッドキャスト向け広告の新規スポンサー開拓を狙う
広告主・代理店向け会員サイト経由で提供、デモ版は企業名と商品名で作成
🧭
Prompt Injection as Role Confusion
・役割認識の脆弱さが外部データを指示と偽認させる手口を説明する。
・思考タグと表現様式が役割感知を攪乱する現象を示す。
・思考連鎖偽造と現状の対策課題を論じる。
😂
Running ComfyUI workflows on Amazon SageMaker AI processing jobs | Artificial Intelligence
クラウド処理ジョブでLambda起動しワークフローを実行し自動生成を拡張。
Z-Image Turboによる高品質画像を一括生成して広告資産を迅速化。
セキュアなインフラを構築し、出力はS3へリアルタイムでストリーミング保存。
🚀
Embed the world: Multimodal AI for searchable aerial imagery at scale | Artificial Intelli..
地理空間画像の多視点検索を7視点統合の埋め込みとキャプションで高速化。
AOI設定→画像取得→埋め込み・索引→検索・評価の5段階設計。
Ground truthはOpenStreetMapを用い、性能評価を示唆。
🤖
SpaceX inks compute deal with Reflection AI, an open-source AI lab | TechCrunch
メンフィス近郊のデータセンターで最新GB300AIチップへ即時アクセスの契約
総額63億ドルの長期契約で、開始は2026年7月、2029年まで有効
オープンウェイトAI戦略の下、オープンソースモデル普及を目指す
🔥
Expert-aware quantisation: near-Q4 quality at near-Q2 size? - Martin Alderson
エキスパート別量子化を検討する手法を示す。
MoEを事前プロファイリングし高精度をホットに限定。
局所性からNear-Q4をNear-Q2サイズへ適用。
もっと見る
このサイトについて
/
ニュースレター
/
@AINewsDev