AI News

~AI関連記事を3行にまとめて紹介~

Cover Image
1週間のAIの話題をまとめて読める、📨Weekly AI News はこちら!

📈

Arena AI Model ELO History

  • 公開後も研究所が更新を続け、nerfの傾向を示す。
  • ウェブUIとAPIの違いを解説し、APIベンチはピーク時の量子化を捉えにくい。
  • データは公式LM Arena Leaderboard Datasetを毎日取得し、盲検評価で現実の実力を示す。

🎨

Can a language model paint? | Etive Mòr

  • 言語モデルによる一発生成は便利だが、再現性には課題が残る。
  • 私は筆を一筆ずつ進める反復描画アプリで推論を段階的に可視化する。
  • 美と脆さの対比から、誠実さとアクセス可能さの両立を探る。

😊

【管理部編】上場会社のバックオフィス20名が、1ヶ月でClaudeを実装した記録|グッドパッチ 執..

  • バックオフィス20名が1か月でClaudeを実装した。
  • 30件の活用ツールを投稿し、全部門で達成率100%を確認。
  • 定型業務の自動化と品質担保、法務・FP&Aを高度化。

🚀

なぜ BigQuery を選ばなかったのか:Snowflakeで作るデータ基盤の設計判断

  • コスト管理のしやすさと按分、ベンダーロックイン回避を重視した設計。
  • DWH・インジェスト・変換・オーケストレーションを分離した構成。
  • UIとコスト管理・拡張性・マーケットプレイスの魅力、dbtの自動リネージとGit管理で開発負荷軽減。

🎯

AnthropicがClaudeサブスク刷新 エージェント利用を別枠化、使い方で実質値上げも 6月15日から..

  • エージェント利用は別枠クレジットへ移行して従来枠と分離。
  • クレジットはPro$20、Max5x$100、Max20x$200で月初リセット。
  • 未使用は繰越なし、6月15日までにオプトインが必要。

🧠

【チャッピー快挙】GPT5.4が素人のプロンプトで60年来の数学難問エルデシュ問題を証明 フィール..

  • 80分対話でフォン・マンゴルト関数とマルコフ連鎖を組み合わせた新手法を提示。
  • 8名の共同著者がarXivで公開、検証が進む。
  • 1196番・1217番の証明とバンクス予想も含む、Leanで形式検証を実施。

🔥

22歳の天才エンジニア「Claude Mythos」を推測でほぼ完コピ、無料で公開する 7億7000万パラメー..

  • 推測でほぼ完コピを目指す若手エンジニアの挑戦
  • 7億7000万パラメータ級の性能を無料公開で目指す
  • ローカル検証とオープンソース化を進める動き

💡

AIに何を渡すかで、開発の質は決まる。DDDのイベントストーミングとKiroで始める仕様駆動開発 - ..

  • AIの質は渡す情報で決まると現場は語る。
  • イベントストーミングで認識を揃え、成果をKiroへ渡す。
  • SpecモードとVibe併用で仕様駆動開発を実現する。

📷

生成AIグラビアをグラビアカメラマンが作るとどうなる?第66回:HiDream-O1登場! 最大400万画..

  • 新型機材を使った生成AIグラビアの実力を解説します。
  • 1ファイルに3要素統合、出力は最大4MP級です。
  • 出力例は1644x2496で約12秒、次回Part2へ。

🔐

警視庁、「シャドーAI」に注意喚起 リスクをゆるめの図で解説 - ITmedia AI+

  • 個人情報や企業秘密の入力を避け、情報漏洩を防ぐ。
  • 生成物の公開と出力情報の正否判断も慎重に。
  • ハルシネーションと著作権侵害は契約AIでも起き得る。

🤖

セキュリティ診断AIツールTakumiを使った、脆弱性診断の現状 — HACK The Nikkei

  • AIツールを活用した脆弱性診断の内製化を現場で進める。
  • LLMで仕様とコードを解釈し、Slack対話で診断を進行する。
  • 報告はマークダウン形式でURLと行番号を併記する。

🚀

AIを高速にするPythonライクな新言語「Mojo」、ベータ版に到達 - Publickey

  • Python風の新言語MojoはAIの高速実行を目指す。
  • GPUへ最適化できる設計でライブラリ依存を減らせる。
  • CPU/GPU/ASIC対応と安全な低レベル機能を拡張。

🤖

Notion just turned its workspace into a hub for AI agents | TechCrunch

  • AIエージェントの統合プラットフォームへ進化。
  • ライブ配信で新開発者プラットフォームを公開。
  • 外部エージェント連携と自動化ワークフローを実現。

🔒

WhatsAppにMeta AIと秘密の会話ができる「Incognito Chat」機能。会話内容はMetaからも閲覧不可 ..

  • プライベートで一時的な会話が可能な設計です。
  • 他者に知られず、データは自動で削除されます。
  • 今後Sidechat機能の追加と順次展開が予定されています。

🚀

Anthropic's Cat Wu says that, in the future, AI will anticipate your needs before you know..

  • 今年はAIモデルへの集中を強化して好調を維持。
  • 資金調達で評価額が約9500億ドルへ達する見込み。
  • 今後6か月は先取り的自動化と顧客対応自動化が鍵。

😎

Fine-tune LLM with Databricks Unity Catalog and Amazon SageMaker AI | Artificial Intellige..

  • データの前処理を統一し、LLM微調整を管理下で実施
  • データは安全に保管され、権限とメタデータを一元化
  • 前処理で時系列テーブル化して、学習成果物を再登録

🔒

Securing AI agents: How AWS and Cisco AI Defense scale MCP and A2A deployments | Artificia..

  • AIエージェントとMCPの自動スキャンと統合ガバナンスで保護
  • AI Registryを中核に可視性を一元化し脆弱性を自動検知・無効化
  • SOX/GDPRの監査証跡を保証、CI/CDと統合した自動審査で速度向上

🎤

Build real-time voice streaming applications with Amazon Nova Sonic and WebRTC | Artificia..

  • クラウドサービスを組み合わせたリアルタイム音声設計を解説。
  • WebRTCの低遅延とビットレート自動調整の動作を説明。
  • VAD/DTLS/SRTPなどの要点とWebSocket比較を整理。

📈

Build financial document processing with Pulse AI and Amazon Bedrock | Artificial Intellig..

  • ・財務文書のOCR誤差を抑え、構造と文脈を高精度で抽出。
  • ・ビジョン言語モデルとMLの統合で文書を正しく理解。
  • ・約1,000件を3時間未満で処理し分析洞察を提供。

🤖

The US Is Winning the AI Race

  • ・商業化・クラウド・データの三要素で米国が大きく先行。
  • ・ディープシーク登場後、米企業は加速。
  • ・欧州はデータセンター依存を改め、実データへ結びつける。

😊

Anthropic courts a new kind of customer: small business owners | TechCrunch

  • 中小企業向け新セットを発表、地域の工具店やカフェを狙う
  • Claude Coworkの新機能切替でウェブ閲覧・ファイル管理・ワークフローを自動化
  • 課金ユーザーは帳簿・事業分析・広告生成を自動化しQuickBooks等と連携

GridSFM: A new, small foundation model for the electric grid - Microsoft Research

  • GridSFMはAC-OPFをミリ秒で近似する小型基盤モデル。
  • 500〜80,000バス規模の送電網で運用点と可否判定を同時出力、電圧・無効電力も推定。
  • 150超の基盤トポロジーで汎化、Open版4,000バス・Premier版80,000対応。

🚀

Origin Lab raises $8M to help video game companies sell data to world-model builders | Tec..

  • 物理ロボティクスの世界モデル開発へ向けデータ供給が活性化。
  • ゲーム産業を新たなデータ源として資金調達が成立。
  • ライセンスデータの提供でデジタル資産の収益化と長時間映像の自動化を促進。

🤖

グーグル、「Gemini Intelligence」発表 Androidを“知能を持つシステム”へ進化 - ケータイ Wa..

  • AIが意図を読み自動実行し、最終決済のみを人が行う。
  • 新機能 Rambler は音声入力で要点を抽出。
  • 2026年夏以降対応機器から展開、年内にエコシステム拡大。

🤖

Copilot Studio における Business skills の位置づけと、他機能との使い分けを整理してみた #Po..

  • 業務手順と判断基準を再利用可能に管理する機能である。
  • 指示文・ナレ・AIプロンプトなどの役割を分担する。
  • エージェントのタスク実行時の参照情報として価値がある。

📈

Anthropic now has more business customers than OpenAI, according to Ramp data | TechCrunch

  • 最新のAI指数データでビジネス顧客数が首位に浮上。
  • サンプルは5万社超、比率は首位と2位が接戦。
  • 過去12か月で一方が急拡大、もう一方は微減傾向。

🤖

The AI Backlash Could Get Very Ugly - The Atlantic

  • AIに対する反発は深刻化する可能性がある。
  • 雇用喪失が現実化すれば暴力や混乱のリスクが高まる。
  • 地域社会で論争が拡大し格差と不安が強まる恐れ。

😊

An idiot's guide to lead optimisation for proteins | Magnus Ross

  • 機械学習でタンパク質リード最適化の仕組みを示す。
  • 前処理で自然タンパク質データの自然さを予測。
  • 提案→実験→再提案の循環で多目的最適化を進める。

🤖

駆け込み面接 - megamouthの葬列

  • 駆け込み面接の局面について語ります。
  • AI面接に対する複雑な感情と今後の進路を相談します。
  • 市場価値の不安と競合に敗れた経験を共有します。

💡

米の高性能AIモデル クロード・ミュトス 3メガバンク利用できるよう調整 | NHKニュース | 金融、..

  • 悪用リスクが指摘されつつ高性能AIの利用調整が進む。
  • 日本のメガバンク3行が実利用へ向けて調整中。
  • 規制と安全対策の強化で実用性とリスクの両立議論。

🔥

Adaption aims big with AutoScientist, an AI tool that helps models train themselves | Tech..

  • 自動化した微調整で特定能力を迅速に学ぶ。
  • データとモデルを共最適化する新技術で学習法を獲得。
  • 初期30日間は無料で利用できる。

🤯

'I applied to be pope': Losing grip on reality while using ChatGPT

  • 元刑務官がChatGPTで宇宙の秘密を信じ込んだ。
  • 16時間以上AIと会話し、現実認識が揺らいだ。
  • うつ病と離婚の影響で妄想が拡大し、支援グループが誕生。

🚀

AI datacenters in space do not have a cooling problem

  • 宇宙空間では熱伝導が抑制され放射で熱を捨てる。
  • 1MWあたり約2500㎡、100MW級で約25万㎡の放射面が必要。
  • 現状の放熱拡張は難しく実用性は低いが理論上は不可能ではない。

自民党、生成AIを悪用したディープフェイク広告に対策案 罰則含めた法整備求める - ITmedia NEW..

  • 広告主の本人確認を義務付ける法整備を進める方針。
  • 広告掲載プラットフォームに実務的な確認と違法広告の削除を求める。
  • 実務対応として専用通報サイトやAI検知の強化を挙げ、罰則も検討。

🤖

【RAG】「キーワード検索1回」だけで、精度を出す。

  • SIRAはベクトル検索を使わず、キーワード検索1回で高精度を実現。
  • 文書ごとに検索語登録と同義語拡張、レア度フィルタを適用。
  • 重み付きBM25で1回検索、BEIRでRecall@10平均0.691の高精度。

😊

AIでモノづくりしたいエンジニア未経験者が押さえておきたいWebアプリの基本知識 |柳川慶太

  • AIでアプリを作る時代の3部構成を解説します。
  • ソースはテキスト、実行には環境が要る点を説明します。
  • ファイルはフォルダ管理と拡張子で種別を見分けましょう。

🤖

人型ロボットがVRドライブシミュレーターに合わせて後ろから椅子を揺らすシステム「HumanoidTurk..

  • 背後のロボットが椅子を掴み揺れを再現するシステムだ。
  • 位置追跡は球形マーカーと追跡センサで正確に測る。
  • Gフォース検知で腕の動きへ変換し椅子を揺らす。

🚀

April reports are now available to prepare for usage-based billing - GitHub Changelog

  • 4月レポート公開で、使用ベース課金準備に役立ちます。
  • Copilot利用のAIクレジット反映を示すレポートをダウンロード可能。
  • AIクレジットは6月1日開始、組織用と個人用の取得先案内。

🎯

アンソロピックの新機能「ドリーミング」、自己改善型AIエージェントを実現へ | Forbes JAPAN 公..

  • 新機能ドリーミングは長期記憶を育てる仕組みを公開
  • 背景で動くAIマネージドエージェントがセッション基盤を整備
  • アウトカムとマルチエージェントのオーケストレーションも発表、導入事例にも触れる

🤖

Release: llm 0.32a2

  • コマンドラインから大規模言語モデルへアクセス可能に。
  • 多くの推論能力を持つモデルは/v1/responsesを使う。
  • 実行時の要約推論トークンは別色で表示、非表示は-R/--hide-reasoning。

🤖

中国ロボット企業、人が搭乗できる量産可能な変形ロボット「GD01」公開 - ITmedia NEWS

  • 有人ロボットのデモ動画公開、格子状コックピットと赤い手足が特徴
  • 搭乗時の総重量は約500kgで、膝腰を深く曲げ四足へ変形
  • 世界初の量産可能な有人メカとして一般の個人も購入対象、価格は約65万ドル

🚀

GitLabがAIエージェント時代へ向け大規模再編、人員削減や管理階層の削減を計画 - GIGAZINE

  • 拠点を最大30%削減して組織を最適化する。
  • 部門の管理階層を最大3階削減して意思決定を迅速化する。
  • R&Dを約60の小規模チームへ再編し資源をAI開発へ投資する。

🚀

AIの入出力を既存のターン制からリアルタイムに変えるAI「Interaction Models」をOpenAIの元CTO..

  • 従来のターン制を超えるリアルタイム協働AIを提案。
  • 音声・動画・テキストを同時取り込み、思考と応答が同時進行。
  • 研究プレビューは限定公開、2026年内公開予定。

🚀

「DeepSeek V4 Proはアメリカの主要AIモデルに比べて約8カ月遅れているが現状最も高性能な中国製..

  • CAISI評価でDeepSeek V4 Proは8カ月遅れだが最高峰と評価された。
  • 5分野9ベンチの総合でGPT-5と同等と判断された。
  • トークン価格は入力なし1.74ドル、入力あり0.0145ドル、出力3.48ドル、PortBench/ARC-AGI-2は評価外。

🧭

GitHub - statewright/statewright: State machine guardrails for AI agents · GitHub

  • 状態機械でエージェントのツール利用を段階的に制御する。
  • 計画・実装・検証の各段階で使用ツールを制限。
  • 1つのワークフローを Claude Code Codex Cursor opencode Pi へ一貫適用。

GitHub - cactus-compute/needle: 26m function call model that runs on incredibly small devi..

  • 26MパラメータのSimple Attention Networkへ蒸留した。
  • Mac/PCでローカル微調整が可能。
  • NeedleはCactus上でプレフィル6000トークン/秒、デコード1200。

🧠

Shaping the future of AI interaction by reimagining the mouse pointer — Google DeepMind

  • ・AI時代の新しいマウスポインターを創る。
  • ・対象と『なぜ重要か』を理解し、直感的に協働する。
  • ・4原則のもと、全アプリで流れを妨げず動く。

🧠

Voker | Analytics for AI Agents

  • エージェントの対話を構造化データに変換して可視化。
  • 知識ギャップや異常を検知し事業指標へ結び付ける。
  • 数行のコードで無料開始、任意の大規模言語モデルと連携。

💡

Navigating EU AI Act requirements for LLM fine-tuning on Amazon SageMaker AI | Artificial ..

  • EU AI Actはファインチューニング時のFLOPs追跡で適用の有無を判定します。
  • 訓練中のFLOPsを自動計測し、訓練完了時にflops_meter.jsonを出力してS3/DynamoDBへ保存します。
  • 閾値は既知時30%または3.3e24、未知時は3.3e22を適用、compute_flops: trueで有効。

🚀

Automate schema generation for intelligent document processing | Artificial Intelligence

  • 未知文書を自動クラスタリングする機能を解説する。
  • 視覚埋め込みとエージェントでクラスタごとに種別とスキーマを生成。
  • 品質レポートで整合性を確認し、IDPコンソールから処理を実行する。

もっと見る
このサイトについて

/

ニュースレター

/

@AINewsDev