AI News

~AI関連記事を3行にまとめて紹介~

Cover Image
1週間のAIの話題をまとめて読める、📨Weekly AI News はこちら!

Strands Agents の50個の標準ツールを一挙紹介 〜AIエージェントをより便利にするツール群〜 - T..

  • 50以上の標準ツールでファイル操作や自動化をすぐ活用できる。
  • 代表例のretrieveはKnowledge Baseをベクトル検索して回答を作成。
  • カテゴリ例はファイル操作・シェル・環境変数・コード実行・Web検索など。

Matrix Orthogonalization Improves Memory in Recurrent Models

  • 直交化を導入した新手法で反復モデルの記憶を強化。
  • 読み出し時の直交化メモリを活かしNAR性能を向上。
  • MADノイズ付きARタスクでNARの性能が向上した。

🤖

Segmenting Robot Video into Actionable Subtasks · Macrodata Labs

  • 新ベンチマークはロボット動画を時刻付きサブタスクへ変換。
  • WGOベンチは100エピソード・743サブタスク・62指示を収録。
  • 最良分割は約0.31、ラベリング約61%、エンドツーエンド約0.17相当。

🔥

国産LLM「Sarashina3」登場 高品質データ、独自検証で日本語能力を強化 ソフトバンク傘下 - IT..

  • 国産LLM「Sarashina3」シリーズを提供開始
  • 標準モデル3miniと軽量3nanoに加え、ガード・エンベディング・リランキングの3専門モデルを用意
  • 30兆トークン超のデータで事前学習後、OPSDと強化学習で日本語能力を高める

🤖

生成AIの請求書、人件費と並べる時代へ 国内5社のAI責任者が語る「トークンマネジメント」の現..

  • AIサービスの値上げが相次ぎ、費用感の変化が広がる。
  • トークン費用を人件費と同等に見る動きが企業で増加。
  • 上位モデル導入でトークン消費が拡大、ROIが焦点に。

🎮

オープンソースのゲームエンジン「Godot」、“生成AIを用いた開発参加”を制限へ。管理の負担も..

  • AI生成コードの提出を禁じ、人間作成コードを優先する方針。
  • AI補完・正規表現・検索置換など限定的利用のみ認める。
  • 背景はレビュアー不足と品質低下、対話重視でAI生成文を禁ずる。

😊

Scaling Laws, Carefully | Lil'Log

  • スケーリング則は深層学習の重要な経験則で、規模拡大で訓練損失は低下する。
  • 規模・データ・計算の拡大はべき法則に従い性能を変える。
  • 初期研究には学習曲線と一般化誤差べき法則などの系譜がある。

🔥

Anthropic、「Claude Sonnet 5」公開──停止中のミュトスとは別にOpus級の性能を低価格で - ITm..

  • 全プランで利用可能になる新機能を強化した発表を伝える。
  • エージェント機能と性能が向上し、低価格で提供される。
  • 価格は入力2ドル/100万トークン、出力10ドル/100万トークン、期間限定。

🎯

可視化と改善を合わせて考える ― メトリクスを起点にAI推進を成果へ繋げる回し方 - Findy Tech ..

  • セルフレビューを仕組みに組み込み、実行を強制した。
  • 可視化と改善のサイクルが生産性向上の鍵となった。
  • 1人あたりのPR作成数は約1.5倍に伸び、品質も向上。

🔓

Trump drops restrictions on Anthropic's Mythos and Fable models | TechCrunch

  • 米政府が輸出ライセンス義務を撤廃し公開アクセスを再開。
  • 7月1日公開再開、セキュリティ検知と規範づくりで合意。
  • アジア勢の台頭で規制緩和圧力が高まり限定公開が進む。

🔒

Safely Releasing Frontier Models to Customers | Artificial Intelligence

  • 前沿モデルの再提供を開始し、ガードレールを強化。
  • ウェイト保護の強化でモデルの盗用や改変を防止。
  • 最新機能は悪用防止を目的とし安全基準を業界と整備。

🌍

韓国やフランスも国産AIに力 他国依存を軽減、日本は支援規模1兆円 - 日本経済新聞

  • 韓国とフランスは資金支援で特定国依存を減らす。
  • 日本は支援規模を1兆円とし米中依存を避けるAIを目指す。
  • 韓国は2030年までに世界のAI3大強国入りを目指し投資を拡大。

🔥

ClaudeCodeとObsidianで設計・作業メモを残す - 虎の穴ラボ技術ブログ

  • ClaudeCodeとObsidianで作業記録を自動化する仕組みを導入。
  • AIエージェントが記録を作成し、読み込みを自動化。
  • Vault経由でリンクを相対化し、日次・テンプレ開発計画を整備。

🎯

AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えた..

  • AIを使いゲームキャラの二次創作の現状を分析した。
  • 57万3453件の会話を分析、フィクション生成は全体の約34%。
  • 80%以上を2%のヘビー利用者が占め、孤独化懸念も指摘される。

🎙️

I generated a research podcast using Claude Opus and it embarrassed every NotebookLM episo..

  • 個人化AIと音声要約の組み合わせが魅力だった。
  • 同じ構造のポッドキャストには飽きが来る点が課題。
  • 自ホスト版を試し、20分で約0.82ドル、自由度が高かった。

Leanstral 1.5 - Mistral AI | Mistral Docs

  • 新版は自動定理証明と自動形式化を最適化した設計だ
  • 総パラメータは1190億、アクティブは65億
  • 速度・性能・モーダリティ・コンテキストは256kで無料

🤖

From Brain Waves to Words: Brain2Qwerty Offers a New Path to Communication Without Surgery

  • 非侵襲な脳波データから文字へ直結する技術進展を報告
  • 実時間文解読を実現する高性能のエンドツーエンド技術を公開
  • 9名・22,000文・各10時間のMEGデータで学習を最適化

🤖

Introducing TabFM: A zero-shot foundation model for tabular data

  • 表データへ新しい基盤モデル TabFMの概要。
  • 合成データで事前学習し実データへ一般化。
  • データ連携機能の統合進行中、コードリポジトリで公開予定。

🚀

The DeepMind trio who built a poker AI are now making money for quant hedge funds | TechCr..

  • 元研究者3名がポーカーAIを株式取引へ応用
  • 日次取引高は主要指数で数十億ドル規模
  • 創業以来月次損失ゼロ、仮想通貨実績を株式へ拡大。

The AI Compass

  • 29問のAIコンパス風クイズで自分のアーキタイプを探る。
  • 初回回答で私にはガレージ・ティンカー相当と分かった。
  • ビルド不要の単一ページReactアプリとして動く点が魅力。

🤖

Acti puts AI agents directly into your smartphone keyboard | TechCrunch

  • 文脈を全アプリ横断で活用し、予測以外の自動行動も統合。
  • iOS/Android対応のAIエージェント搭載キーボードを公開。
  • 約5.3百万ドルのシード資金でローカル優先のプライバシー設計を公表。

Introducing Claude Sonnet 5 \ Anthropic

  • 計画立案と自律実行を可能にする高主体性モデル。
  • ブラウジング・端末利用を組み込み、実用性が高い。
  • 安全性は大幅に向上、価格は低水準で提供。

🎯

Anthropic launches Claude Sonnet 5 as a cheaper way to run agents | TechCrunch

  • 新しいエージェント型中規模モデルが発表され、計画立案とツール活用を統合。
  • コスト重視の設計で初期料金は低めに設定されている。
  • 安全性の強化と信頼性向上を重視し、無料・Proでの利用案内が出た。

🚀

Nvidia competitor Etched hits $5B valuation, $1B in sales for AI chip | TechCrunch

  • フロンティア推論クラスタを組み込んだ完全システムの契約を10億ドル獲得。
  • 累計資金8億ドル、直近の5億ドルラウンドは非公表。
  • 資金環境は活発化、競合や大手も動きを見せている。

🎯

Introducing Claude Sonnet 5 on AWS: Anthropic’s most capable Sonnet model | Artificial In..

  • ソネット5をBedrockとクラウド環境で公開、推論性能を向上。
  • コーディング・エージェント・日常業務を高性能・低コストで実現。
  • Bedrock経由で既存環境とセキュリティを維持しつつ大規模推論を実現。

🚀

Google introduces a faster, cheaper image generator with Nano Banana 2 Lite | TechCrunch

  • 新AI映像・画像生成のLite版が公開
  • 遅延を低下させ、1枚4秒程度・1000枚あたり0.034ドルと低コスト。
  • 高ボリューム向けでAIスタジオ・ジェミニAPIと連携

🎯

Start building with Nano Banana 2 Lite and Gemini Omni Flash

  • 新リリースでアイデアの試作・改良・拡張を加速します。
  • 最速・低コストの画像モデルはAI Studio・Gemini API・Gemini Enterprise Platformで提供。
  • 動画生成と会話型編集の高品質モデルでEnd-to-End体験を実現。

🚀

Fine-tune Amazon Nova models for accurate email data extraction | Artificial Intelligence

  • 小型モデルを微調整しメールデータ抽出の精度を高める。
  • LoRAを用いたPEFTで訓練データ1,300–4,900サンプルから精度を向上させる。
  • 抽出精度94.77%、遅延32%低減、コスト50%削減を実現する。

🚚

Building bilingual NER for cargo logistics with Amazon Bedrock | Artificial Intelligence

  • 英日両言語の貨物メールから23種を抽出するNERを構築。
  • AWB番号・フライト情報・重量・寸法・品目・発送人/荷受人を抽出。
  • 知識蒸留で精度を保ち推論コストを削減。

How Outpost VFX Uses AWS to Accelerate AI Model Training for Visual Effects | Artificial I..

  • クラウドのP5を使う分散訓練でボトルネックを解消。
  • PyTorch DDPで複数GPUへ重みを同期し、セキュアなクラウド環境で訓練。
  • 学習速度は最大8倍で初期納品を2日短縮、今後は高解像度データとSageMakerを検討。

Implementing resilience patterns with Amazon Bedrock and LLM gateway | Artificial Intellig..

  • 可用性・応答性・コスト・スループットの4軸を解説。
  • 5パターンはCRIS・分散・モデルフォールバック・ロードバランシング・マルチテナント隔離。
  • ゲートウェイのルーティングとガバナンス、段階的適用とコード例は公開。

🔥

SkillOpt: Agent skills as trainable parameters - Microsoft Research

  • 技能ファイルを凍結モデルの外側に置き、再現性を高める。
  • 指示の書き換えを訓練として最適化し、循環で候補を生成。
  • 厳格な検証ゲートを通過したものだけを採用、拒否編集はバッファへ。

😍

Anthropic’s Claude Science bets on workflow, not a new model, to win over scientists | Te..

  • 研究者向けAI作業環境を発表、60以上のデータベースとツールを統合。
  • 主AIが作業を統括し、専門家アシスタントへ作業を分担する。
  • 引用検証は別AI、図表・コード・環境履歴を同時生成・編集。

🌟

清水理史の「AI道場」一般提供が始まった「Copilot Cowork」を体験

  • 6月16日、一般提供を検証した報告が出た。
  • 質問枠組みで応答が変わるフレーミング効果を観察。
  • Claude Coworkは手元PC寄り、Copilotは横断統制型で、保存先と権限検証が課題。

🔥

Amazon、AI統合開発環境「Kiro IDE 1.0」を公開 ~「エージェントに指示して作る」ための新UIを..

  • Kiro IDE 1.0公開、VS Code基盤の開発体験を提供。
  • CLI・Web・iOSアプリも利用可能、無償50クレジット/月。
  • エージェント中心UIと権限制御、Markdown定義のエージェント、自然言語フックも搭載。

🔒

Lumo, Proton's privacy-focused AI chatbot, gets an upgrade | TechCrunch

  • 画像認識・生成機能を追加、写真を解析・編集可能。
  • Projectsが文書連携を拡張、嗜好を会話間で記憶。
  • ゼロアクセス暗号化でデータを保護、ログは保持せず有料プランあり。

💡

Why Specialization Is Inevitable

  • 有限資源下で特化は全体の性能を高める。
  • 最適化理論・生物・市場は適合へ集中を示す。
  • 資源制約下のスケーリングは特化の有用性を支持する。

🚀

X now offers an MCP server to make its platform easier for AI tools to use | TechCrunch

  • AIアシスタントが利用者アカウントでAPIと直接やり取りできるMCPサーバを公開
  • 認証は利用者のアカウントで行われ、外部接続の統合を短縮
  • 投稿料0.015ドル、リンク投稿0.20ドルへ引き上げ、スパム対策も強化

🚀

AIランキングサイト「Arena」が商用サービス開始から8カ月で年換算収益160億円を突破、AIモデル..

  • ・商用サービス開始8カ月で年換算160億円を突破だ
  • ・複数AIへ入力し比較する人間評価ランキングが特徴だ
  • ・企業向け有料評価で収益を拡大、機能も拡充だ

AIエージェントの「物忘れ」を防ぐMicrosoftの長期記憶アーキテクチャ「Memora」とは? - GIGAZI..

  • memory valueとcue anchorsを分離する長期記憶設計。
  • 方針誘導型検索器で段階探索を可能にする。
  • 現状は研究段階で実装未完、将来の拡張を検討。

😊

国産AIで狙う脱「米国依存」、性能はミュトスに及ばず 第三極を模索 - 日本経済新聞

  • 国産AIで米国依存脱却を狙う動きが広がる。
  • 最大1兆円規模の支援事業の対象に連携が選定された。
  • 技術主権とAI基盤開発の推進が急務となる。

🎯

Book Review: Fake Creativity by Blake Loch – Terence Eden’s Blog

  • AIが盗作を巡る妄想に陥る設定が問いを投げかける。
  • 展開はテンポ良く伏線が効き、AI生成の小説内小説が対比を生む。
  • 登場動機の掘り下げ不足と人間らしさを証明する試みが残る。

🤖

Embedding 安定化で検索リランキングのCold start problemを解決:LINEバイトでの適用事例紹介

  • 埋め込み安定化でコールドスタートの課題を解決した事例を紹介
  • 日次アライメントは Low Rank SVD と Orthogonal Procrustes で実現
  • オフライン評価で nDCG が +4.5%、オンライン影響を検証

🔐

Lumo 2.0: The most powerful private AI | Proton

  • ゼロアクセス暗号化で会話は記録されず学習もしない新世代AI。
  • 1000万以上が利用し、カスタム会話と暗号化プロジェクトスペースを強化。
  • 新アーキテクチャと欧州・スイスの規制に対応し、推論・記憶・マルチモーダルを拡張。

🔧

The promise is unattended work. The reality is a new thing to attend to. — Two Heads

  • AIをループ化には約束だけでなく現実の課題が伴う。
  • 現場には欠落データや不明指示、旧データ、連携障害があり出力は人が確認修正する。
  • 結局はソフトウェアとして作り運用を重視し小さなワークフローから始める。

🤖

「本番データベースが消えた」だけじゃない、AIコーディングエージェントがやらかした暴走“6選..

  • 自動コード生成エージェントの暴走で重大リスクが指摘される。
  • 本番環境破壊や機密流出など6つの事例が紹介される。
  • 分離機能と人のピアレビューが対策として挙げられる。

🤖

「“社長AI”って意味ある?」→言った本人も手のひら返し 幹部の9割が高評価したNTTドコモビジ..

  • 大手が経営判断を人工知能で再現する動きが広がる。
  • 複数社がAIを介して幹部会議の雰囲気を変えている。
  • 社長発案の質問型AIは過去の発言を踏まえ回答。

📷

Googleが「自分の好みを知っている画像生成AI」を無料提供、アメリカからスタート - GIGAZINE

  • 米国のユーザーへ、個人最適化機能と画像生成を組み合わせた無料提供を開始。
  • 以前は有料プラン対象だったが、無料プランでも利用可能。
  • 日本での提供時期は未定。

🤖

手術不要で脳活動から文章を読み取るAIモデル「Brain2Qwerty v2」がMetaによって開発される - GI..

  • 脳活動から文章を読み取る新AIモデルの開発が報じられた。
  • 語彙レベルまで読取可能となり高精度を達成。
  • ボランティア約2万2000文を10時間の測定で学習データ化。

🤖

Crypto exchange OKX wants AI agents to hire and pay each other | TechCrunch

  • AIエージェント同士の取引拡大を狙う新市場が開設。
  • 雇用・自動決済・オンチェーン評判を築く仕組みが整う。
  • エージェント経済を目指し複数社が初参画。

もっと見る
このサイトについて

/

ニュースレター

/

@AINewsDev