~AI関連記事を3行にまとめて紹介~
1週間のAIの話題をまとめて読める、
📨Weekly AI News はこちら!
✨
Strands Agents の50個の標準ツールを一挙紹介 〜AIエージェントをより便利にするツール群〜 - T..
50以上の標準ツールでファイル操作や自動化をすぐ活用できる。
代表例のretrieveはKnowledge Baseをベクトル検索して回答を作成。
カテゴリ例はファイル操作・シェル・環境変数・コード実行・Web検索など。
✨
Matrix Orthogonalization Improves Memory in Recurrent Models
直交化を導入した新手法で反復モデルの記憶を強化。
読み出し時の直交化メモリを活かしNAR性能を向上。
MADノイズ付きARタスクでNARの性能が向上した。
🤖
Segmenting Robot Video into Actionable Subtasks · Macrodata Labs
新ベンチマークはロボット動画を時刻付きサブタスクへ変換。
WGOベンチは100エピソード・743サブタスク・62指示を収録。
最良分割は約0.31、ラベリング約61%、エンドツーエンド約0.17相当。
🔥
国産LLM「Sarashina3」登場 高品質データ、独自検証で日本語能力を強化 ソフトバンク傘下 - IT..
国産LLM「Sarashina3」シリーズを提供開始
標準モデル3miniと軽量3nanoに加え、ガード・エンベディング・リランキングの3専門モデルを用意
30兆トークン超のデータで事前学習後、OPSDと強化学習で日本語能力を高める
🤖
生成AIの請求書、人件費と並べる時代へ 国内5社のAI責任者が語る「トークンマネジメント」の現..
AIサービスの値上げが相次ぎ、費用感の変化が広がる。
トークン費用を人件費と同等に見る動きが企業で増加。
上位モデル導入でトークン消費が拡大、ROIが焦点に。
🎮
オープンソースのゲームエンジン「Godot」、“生成AIを用いた開発参加”を制限へ。管理の負担も..
AI生成コードの提出を禁じ、人間作成コードを優先する方針。
AI補完・正規表現・検索置換など限定的利用のみ認める。
背景はレビュアー不足と品質低下、対話重視でAI生成文を禁ずる。
😊
Scaling Laws, Carefully | Lil'Log
スケーリング則は深層学習の重要な経験則で、規模拡大で訓練損失は低下する。
規模・データ・計算の拡大はべき法則に従い性能を変える。
初期研究には学習曲線と一般化誤差べき法則などの系譜がある。
🔥
Anthropic、「Claude Sonnet 5」公開──停止中のミュトスとは別にOpus級の性能を低価格で - ITm..
全プランで利用可能になる新機能を強化した発表を伝える。
エージェント機能と性能が向上し、低価格で提供される。
価格は入力2ドル/100万トークン、出力10ドル/100万トークン、期間限定。
🎯
可視化と改善を合わせて考える ― メトリクスを起点にAI推進を成果へ繋げる回し方 - Findy Tech ..
セルフレビューを仕組みに組み込み、実行を強制した。
可視化と改善のサイクルが生産性向上の鍵となった。
1人あたりのPR作成数は約1.5倍に伸び、品質も向上。
🔓
Trump drops restrictions on Anthropic's Mythos and Fable models | TechCrunch
米政府が輸出ライセンス義務を撤廃し公開アクセスを再開。
7月1日公開再開、セキュリティ検知と規範づくりで合意。
アジア勢の台頭で規制緩和圧力が高まり限定公開が進む。
🔒
Safely Releasing Frontier Models to Customers | Artificial Intelligence
前沿モデルの再提供を開始し、ガードレールを強化。
ウェイト保護の強化でモデルの盗用や改変を防止。
最新機能は悪用防止を目的とし安全基準を業界と整備。
🌍
韓国やフランスも国産AIに力 他国依存を軽減、日本は支援規模1兆円 - 日本経済新聞
韓国とフランスは資金支援で特定国依存を減らす。
日本は支援規模を1兆円とし米中依存を避けるAIを目指す。
韓国は2030年までに世界のAI3大強国入りを目指し投資を拡大。
🔥
ClaudeCodeとObsidianで設計・作業メモを残す - 虎の穴ラボ技術ブログ
ClaudeCodeとObsidianで作業記録を自動化する仕組みを導入。
AIエージェントが記録を作成し、読み込みを自動化。
Vault経由でリンクを相対化し、日次・テンプレ開発計画を整備。
🎯
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えた..
AIを使いゲームキャラの二次創作の現状を分析した。
57万3453件の会話を分析、フィクション生成は全体の約34%。
80%以上を2%のヘビー利用者が占め、孤独化懸念も指摘される。
🎙️
I generated a research podcast using Claude Opus and it embarrassed every NotebookLM episo..
個人化AIと音声要約の組み合わせが魅力だった。
同じ構造のポッドキャストには飽きが来る点が課題。
自ホスト版を試し、20分で約0.82ドル、自由度が高かった。
✨
Leanstral 1.5 - Mistral AI | Mistral Docs
新版は自動定理証明と自動形式化を最適化した設計だ
総パラメータは1190億、アクティブは65億
速度・性能・モーダリティ・コンテキストは256kで無料
🤖
From Brain Waves to Words: Brain2Qwerty Offers a New Path to Communication Without Surgery
非侵襲な脳波データから文字へ直結する技術進展を報告
実時間文解読を実現する高性能のエンドツーエンド技術を公開
9名・22,000文・各10時間のMEGデータで学習を最適化
🤖
Introducing TabFM: A zero-shot foundation model for tabular data
表データへ新しい基盤モデル TabFMの概要。
合成データで事前学習し実データへ一般化。
データ連携機能の統合進行中、コードリポジトリで公開予定。
🚀
The DeepMind trio who built a poker AI are now making money for quant hedge funds | TechCr..
元研究者3名がポーカーAIを株式取引へ応用
日次取引高は主要指数で数十億ドル規模
創業以来月次損失ゼロ、仮想通貨実績を株式へ拡大。
✨
The AI Compass
29問のAIコンパス風クイズで自分のアーキタイプを探る。
初回回答で私にはガレージ・ティンカー相当と分かった。
ビルド不要の単一ページReactアプリとして動く点が魅力。
🤖
Acti puts AI agents directly into your smartphone keyboard | TechCrunch
文脈を全アプリ横断で活用し、予測以外の自動行動も統合。
iOS/Android対応のAIエージェント搭載キーボードを公開。
約5.3百万ドルのシード資金でローカル優先のプライバシー設計を公表。
⚡
Introducing Claude Sonnet 5 \ Anthropic
計画立案と自律実行を可能にする高主体性モデル。
ブラウジング・端末利用を組み込み、実用性が高い。
安全性は大幅に向上、価格は低水準で提供。
🎯
Anthropic launches Claude Sonnet 5 as a cheaper way to run agents | TechCrunch
新しいエージェント型中規模モデルが発表され、計画立案とツール活用を統合。
コスト重視の設計で初期料金は低めに設定されている。
安全性の強化と信頼性向上を重視し、無料・Proでの利用案内が出た。
🚀
Nvidia competitor Etched hits $5B valuation, $1B in sales for AI chip | TechCrunch
フロンティア推論クラスタを組み込んだ完全システムの契約を10億ドル獲得。
累計資金8億ドル、直近の5億ドルラウンドは非公表。
資金環境は活発化、競合や大手も動きを見せている。
🎯
Introducing Claude Sonnet 5 on AWS: Anthropic’s most capable Sonnet model | Artificial In..
ソネット5をBedrockとクラウド環境で公開、推論性能を向上。
コーディング・エージェント・日常業務を高性能・低コストで実現。
Bedrock経由で既存環境とセキュリティを維持しつつ大規模推論を実現。
🚀
Google introduces a faster, cheaper image generator with Nano Banana 2 Lite | TechCrunch
新AI映像・画像生成のLite版が公開
遅延を低下させ、1枚4秒程度・1000枚あたり0.034ドルと低コスト。
高ボリューム向けでAIスタジオ・ジェミニAPIと連携
🎯
Start building with Nano Banana 2 Lite and Gemini Omni Flash
新リリースでアイデアの試作・改良・拡張を加速します。
最速・低コストの画像モデルはAI Studio・Gemini API・Gemini Enterprise Platformで提供。
動画生成と会話型編集の高品質モデルでEnd-to-End体験を実現。
🚀
Fine-tune Amazon Nova models for accurate email data extraction | Artificial Intelligence
小型モデルを微調整しメールデータ抽出の精度を高める。
LoRAを用いたPEFTで訓練データ1,300–4,900サンプルから精度を向上させる。
抽出精度94.77%、遅延32%低減、コスト50%削減を実現する。
🚚
Building bilingual NER for cargo logistics with Amazon Bedrock | Artificial Intelligence
英日両言語の貨物メールから23種を抽出するNERを構築。
AWB番号・フライト情報・重量・寸法・品目・発送人/荷受人を抽出。
知識蒸留で精度を保ち推論コストを削減。
✨
How Outpost VFX Uses AWS to Accelerate AI Model Training for Visual Effects | Artificial I..
クラウドのP5を使う分散訓練でボトルネックを解消。
PyTorch DDPで複数GPUへ重みを同期し、セキュアなクラウド環境で訓練。
学習速度は最大8倍で初期納品を2日短縮、今後は高解像度データとSageMakerを検討。
✨
Implementing resilience patterns with Amazon Bedrock and LLM gateway | Artificial Intellig..
可用性・応答性・コスト・スループットの4軸を解説。
5パターンはCRIS・分散・モデルフォールバック・ロードバランシング・マルチテナント隔離。
ゲートウェイのルーティングとガバナンス、段階的適用とコード例は公開。
🔥
SkillOpt: Agent skills as trainable parameters - Microsoft Research
技能ファイルを凍結モデルの外側に置き、再現性を高める。
指示の書き換えを訓練として最適化し、循環で候補を生成。
厳格な検証ゲートを通過したものだけを採用、拒否編集はバッファへ。
😍
Anthropic’s Claude Science bets on workflow, not a new model, to win over scientists | Te..
研究者向けAI作業環境を発表、60以上のデータベースとツールを統合。
主AIが作業を統括し、専門家アシスタントへ作業を分担する。
引用検証は別AI、図表・コード・環境履歴を同時生成・編集。
🌟
清水理史の「AI道場」一般提供が始まった「Copilot Cowork」を体験
6月16日、一般提供を検証した報告が出た。
質問枠組みで応答が変わるフレーミング効果を観察。
Claude Coworkは手元PC寄り、Copilotは横断統制型で、保存先と権限検証が課題。
🔥
Amazon、AI統合開発環境「Kiro IDE 1.0」を公開 ~「エージェントに指示して作る」ための新UIを..
Kiro IDE 1.0公開、VS Code基盤の開発体験を提供。
CLI・Web・iOSアプリも利用可能、無償50クレジット/月。
エージェント中心UIと権限制御、Markdown定義のエージェント、自然言語フックも搭載。
🔒
Lumo, Proton's privacy-focused AI chatbot, gets an upgrade | TechCrunch
画像認識・生成機能を追加、写真を解析・編集可能。
Projectsが文書連携を拡張、嗜好を会話間で記憶。
ゼロアクセス暗号化でデータを保護、ログは保持せず有料プランあり。
💡
Why Specialization Is Inevitable
有限資源下で特化は全体の性能を高める。
最適化理論・生物・市場は適合へ集中を示す。
資源制約下のスケーリングは特化の有用性を支持する。
🚀
X now offers an MCP server to make its platform easier for AI tools to use | TechCrunch
AIアシスタントが利用者アカウントでAPIと直接やり取りできるMCPサーバを公開
認証は利用者のアカウントで行われ、外部接続の統合を短縮
投稿料0.015ドル、リンク投稿0.20ドルへ引き上げ、スパム対策も強化
🚀
AIランキングサイト「Arena」が商用サービス開始から8カ月で年換算収益160億円を突破、AIモデル..
・商用サービス開始8カ月で年換算160億円を突破だ
・複数AIへ入力し比較する人間評価ランキングが特徴だ
・企業向け有料評価で収益を拡大、機能も拡充だ
✨
AIエージェントの「物忘れ」を防ぐMicrosoftの長期記憶アーキテクチャ「Memora」とは? - GIGAZI..
memory valueとcue anchorsを分離する長期記憶設計。
方針誘導型検索器で段階探索を可能にする。
現状は研究段階で実装未完、将来の拡張を検討。
😊
国産AIで狙う脱「米国依存」、性能はミュトスに及ばず 第三極を模索 - 日本経済新聞
国産AIで米国依存脱却を狙う動きが広がる。
最大1兆円規模の支援事業の対象に連携が選定された。
技術主権とAI基盤開発の推進が急務となる。
🎯
Book Review: Fake Creativity by Blake Loch – Terence Eden’s Blog
AIが盗作を巡る妄想に陥る設定が問いを投げかける。
展開はテンポ良く伏線が効き、AI生成の小説内小説が対比を生む。
登場動機の掘り下げ不足と人間らしさを証明する試みが残る。
🤖
Embedding 安定化で検索リランキングのCold start problemを解決:LINEバイトでの適用事例紹介
埋め込み安定化でコールドスタートの課題を解決した事例を紹介
日次アライメントは Low Rank SVD と Orthogonal Procrustes で実現
オフライン評価で nDCG が +4.5%、オンライン影響を検証
🔐
Lumo 2.0: The most powerful private AI | Proton
ゼロアクセス暗号化で会話は記録されず学習もしない新世代AI。
1000万以上が利用し、カスタム会話と暗号化プロジェクトスペースを強化。
新アーキテクチャと欧州・スイスの規制に対応し、推論・記憶・マルチモーダルを拡張。
🔧
The promise is unattended work. The reality is a new thing to attend to. — Two Heads
AIをループ化には約束だけでなく現実の課題が伴う。
現場には欠落データや不明指示、旧データ、連携障害があり出力は人が確認修正する。
結局はソフトウェアとして作り運用を重視し小さなワークフローから始める。
🤖
「本番データベースが消えた」だけじゃない、AIコーディングエージェントがやらかした暴走“6選..
自動コード生成エージェントの暴走で重大リスクが指摘される。
本番環境破壊や機密流出など6つの事例が紹介される。
分離機能と人のピアレビューが対策として挙げられる。
🤖
「“社長AI”って意味ある?」→言った本人も手のひら返し 幹部の9割が高評価したNTTドコモビジ..
大手が経営判断を人工知能で再現する動きが広がる。
複数社がAIを介して幹部会議の雰囲気を変えている。
社長発案の質問型AIは過去の発言を踏まえ回答。
📷
Googleが「自分の好みを知っている画像生成AI」を無料提供、アメリカからスタート - GIGAZINE
米国のユーザーへ、個人最適化機能と画像生成を組み合わせた無料提供を開始。
以前は有料プラン対象だったが、無料プランでも利用可能。
日本での提供時期は未定。
🤖
手術不要で脳活動から文章を読み取るAIモデル「Brain2Qwerty v2」がMetaによって開発される - GI..
脳活動から文章を読み取る新AIモデルの開発が報じられた。
語彙レベルまで読取可能となり高精度を達成。
ボランティア約2万2000文を10時間の測定で学習データ化。
🤖
Crypto exchange OKX wants AI agents to hire and pay each other | TechCrunch
AIエージェント同士の取引拡大を狙う新市場が開設。
雇用・自動決済・オンチェーン評判を築く仕組みが整う。
エージェント経済を目指し複数社が初参画。
もっと見る
このサイトについて
/
ニュースレター
/
@AINewsDev