~AI関連記事を3行にまとめて紹介~
🤖
Weekly AI News #2025-09-12 - by hotchpotch - Weekly AI News
長文クエリの解決と分解を進める多言語対話型検索の動向を紹介。
スプレッドシートAI関数の日本語対応と履歴活用を解説。
EmbeddingGemmaのオンデバイス化と幻覚評価改革、富士通の生成AI再構成・エッジ推論を紹介。
💡
Writing effective tools for LLM agents—using LLM agents \ Anthropic
モデルコンテキストプロトコルは多機能ツールの活用を拡張する。
ツールのプロトタイプ作成・テストとエージェント評価を統合する。
ネームスペース化と意味ある文脈設計、トークン効率化の原則を提示。
🤖
「AIの使用が脳を再プログラムし認知能力の低下につながることがMITの研究で判明」というのは本..
プレプリントはLLM使用と脳活動の関係を探る初期研究だ。
被験者は54名で4回のセッションを実施した。
著者は特設サイトで誤解を訂正し今後の研究に期待した。
🔥
“生成AIのせい”で新卒雇用は減るが代替できない経験を持つ熟練者は安泰、新しいブラックホール..
今週の生成AIウィークリーでHunyuan-MTとVoyagerを解説
VoyagerはRGBと深度を同時生成する3D世界モデル、訓練は動画10万超
Hunyuan-MT-7Bは33言語対応、Deep Loop Shapingでノイズを大幅減少
🔥
[2508.18384] Backprompting: Leveraging Synthetic Production Data for Health Advice Guardra..
バックプロンプティングにより生産品質に近いラベル付きデータを生成する。
限られた人手でクラスタリングしデータにラベルを付与し並列コーパスを作成。
難解な健康アドバイス識別でGPT-4oを最大3.73%上回り、パラメータは約400分の1。
🤖
Weekly Kaggle News #300 - by u++ - Weekly Kaggle News
データ量測定の新競技が終了、データセットの引用扱いを問う議論あり。
非公式リンク集の新設を案内する動向だ。
KDD2025の論文読み会と上位解法発表、NeurIPS論文の知見を画像モデルのバックボーン選択へ活かす。
🌟
世界初の「AI大臣」が登場、汚職対策のため - GIGAZINE
アルバニアで世界初のAI大臣が就任した。
公共入札を監督し、賄賂と脅迫を排除する。
2030年のEU加盟を目指す背景で汚職対策を強化する。
🌟
ベクトル検索だけじゃ足りない?Qdrantで精度を高めるハイブリッド検索 - RAKUS Developers Blog..
密ベクトルと疎ベクトルを組み合わせたハイブリッド検索を採用。
オンプレミス対応のデータベースを選定し実装方針を解説。
10月リリース予定の回答自動生成エージェント開発にも触れる。
🔥
エージェントのための効果的なツールの作成|npaka
エージェントへ多数のツールを提供する手法を解説
ツールは決定/非決定契約を反映する新種の設計を示す
評価タスクの生成・実行・分析で推論とツール呼び出しを高める
✨
Googleの画像生成AI「Nano-banana」をめちゃくちゃ活用できるプロンプトとサンプル画像実例まと..
特徴を保ちながら編集できる機能を要点化。
無料プランで日100枚生成可能な点を強調。
16テーマの実例とプロンプトの活用法を紹介。
🎯
Amazon Bedrock Knowledge Basesで実現する"元のリンクとセット"で検索できるRAG - LayerX エン..
知識ベースを用いたRAGの全体像と前処理の役割を紹介。
データ格納にS3ベクトルストアとOpenSearchの切替でコストと柔軟性を確保。
メタデータ付与(.metadata.json)でフィルタリングと検索性能を向上。
🔎
アルバニアでAI閣僚誕生へ、公共入札監督し腐敗防止 写真1枚 国際ニュース:AFPBB News
新たなAI閣僚が公共入札の監督を担当予定。
透明性向上と腐敗防止が加盟の鍵とされる。
仮想閣僚はデジ文書発行とサービス提供を監視する。
🚀
Google検索「AI モード」の日本語対応と、マーケティングへの影響 【DIGIFUL】デジフル
日本語対応のAIモードが検索体験を変える。
米国の先行事例を踏まえ、日本のマーケ戦略が見直される。
データと洞察を活用する新戦略の必要性を解説する。
🔥
コスパの高いAIモデル「Qwen3-Next」登場、従来より10倍高速で同等以上の性能を実現 - GIGAZINE
コストを抑えつつ高性能AIを無料公開する。
従来比学習コストは10分の1以下、推論は長文時に10倍以上速い。
ベースは800億パラのMoEで512の専門家を内包、推論時は最大30億パラ活性化。
🤖
Lumina-DiMOO: An Omni Diffusion Large Language Model for Multi-Modal Generation and Unders..
オープンソースの基盤モデルで多模态生成と理解を目指す。
離散拡散過程により入力出力を統一的に扱いサンプリングを効率化。
画像生成・編集・着色・修復など幅広いタスクをサポート。
💡
Claude、プロジェクトごとに独立した記憶機能を提供 - Impress Watch
プロジェクトごとに独立した記憶機能を提供
記憶はメモリーサマリーとして確認・編集可、設定で有効化して過去チャットを初期設定する
Incognito chat導入、履歴は残らず、管理者は無効化可能
🎉
WindowsアプリにローカルAI機能を手軽に統合 ~Microsoftが「WinAppSDK 1.8」を公開 - 窓の杜
Decimal型と出力言語指定など新機能を追加
NuGet化・MSIX化とText Rewriter Toneなど機能強化
Storage.PickersのモダナイズとDeploymentManager解消、VS対応
😄
GitHub - CursorTouch/Windows-Use: ğ¥ï¸Open-source Computer-Use for Windows
GUI層からWindows操作を直接自動化するエージェント。
AIエージェントとOSの橋渡しを行い、起動・クリック・入力を実現。
任意のLLMでOS自動化可能、pip installで導入できる。
🤖
dora-rs: これがAI時代のロボティクスミドルウェアだ!
データフロー指向のロボティクスアーキテクチャを採用。
ノードは入力出力を明示し、通信はdataflow.ymlで宣言。
実行時は固定配線のグラフに沿い、動的公開は不要。
💪
Micro1, a competitor to Scale AI, raises funds at $500M valuation | TechCrunch
3,500万ドルのシリーズAで資金調達、評価額は5億ドル。
ARRは5,000万ドルに拡大、AIラボ向けデータラベリング人材を供給。
ボードにはアダム・ベインとジョシュア・ブラウダーが加わる。
🔥
The Rise of AI Cults and the False Prophets of Revelation
新時代の偶像崇拝が広がりつつある。
真理端末と仮想通貨が信者を引き寄せる。
警戒と識別を意識し、教会と家庭で教えを守ろう。
🚀
VaultGemma: The world's most capable differentially private LLM
最大規模の10億パラメータLLMを差分プライバシーで訓練
差分プライバシーのスケーリング法則を共同で確立
最適訓練構成の洞察と技術報告書の公開を提供
🚀
Ankit Gupta Joins YC as General Partner, Bringing Deep ML Expertise | Y Combinator
新任ジェネラルパートとして起業家を支援します。
複数のバッチで訪問パートナーとして創業者を支援してきました。
拠点をケンブリッジに置き、AIの最前線を後押しします。
🔥
MCP-Agent: How to Build Scalable Deep Research Agents | AI Alliance
MCPサーバーへ最先端LLMsを接続し深層リサーチ型を目指す。
Take1は幻覚・過剰トークン・計画硬直を露呈した。
Take3DeepOrchestratorは単純さ勝利を検証、今後は外部メモリ化を推進。
🚀
Automate advanced agentic RAG pipeline with Amazon SageMaker AI | Artificial Intelligence
高度なエージェント型RAGを自動化する方法を解説。
MLflowとPipelinesで検証から本番展開までCI/CD管理。
データ準備・埋め込み・検索・生成・評価を一貫管理。
🤖
Unlock model insights with log probability support for Amazon Bedrock Custom Model Import ..
Bedrockのカスタムモデル導入で独自モデルを統合可能。
サーバーレスで管理負荷を軽減し、利用にはBedrockアカウントと権限が必要。
トークン単位のログ確率で自信度を可視化し、評価・RAG最適化を支援。
🚀
Migrate from Anthropic’s Claude 3.5 Sonnet to Claude 4 Sonnet on Amazon Bedrock | Artific..
Bedrock上で新ソネットの提供が開始された。
旧ソネットの廃止(v1/v2)が通知され、移行が必須となる。
主な差は200k→1Mトークンの長さ拡張、ネイティブ思考と拡張ツール、API移行。
🔥
[2509.07604] K2-Think: A Parameter-Efficient Reasoning System
32Bパラメータの推論システムで高性能を実現。
長チェーン思考の微調整と検証可能報酬付きRLを組み合わせ性能を引き出す。
オープンソース公開で公開データ学習、速度は2000トークン/秒超。
🎉
「Visual Studio Code」2025年8月更新 ~自動モデル選択などAI機能を引き続き強化 - 窓の杜
AI機能を強化、プレビュー自動モデル選択とチャットAPIを提供。
セキュリティを強化、AIエージェント編集確認とターミナル自動承認を改善。
生産性向上、変更ファイル自動折りたたみとチャット窓整理を実現、KaTeXをデフォルト化。
💡
10代の検索は「ヤフーよりChatGPT」 サイバーエージェント調査 - Impress Watch
全国の男女9,278名を対象に、5月23〜24日に調査を実施。
日常検索で生成AIは21.3%、検索エンジンは91.9%、SNSは77.3%だった。
10代はChatGPTが従来の検索を上回り、全体30.1%、10代35.8%が置換。
📚
「NotebookLM」が強力な学習ツールに ~暗記教材、理解度テストの生成にも対応 - 窓の杜
学習ツールとして機能が大幅強化され、暗記と理解の支援が拡張された。
Studioパネルでフラッシュカード・クイズ・レポート生成が可能になり、レポートは130言語対応。
デスクトップとスマホアプリは基本無料、対象はワークスペース利用者。
🤖
AIエージェント開発の本質は『属人化業務との戦い』。トップエンジニアが明かす泥臭い現場のリア..
金融・防衛分野でAIエージェントの業務活用を推進。
現在はLLMで判断・計画・ツール選択・実行を担う。
知識獲得はRAGで強化され、ヘルプデスクやドキュメントレビューに活用。
🎯
VaultGemma の概要|npaka
DPを前提としたスケーリング則と学習最適化を解説。
DPノイズは学習ダイナミクスと計算コストを変える。
1BパラのオープンモデルをDP学習で公開し、固定バッチを実現。
😊
MicrosoftとOpenAIが"次段階のパートナーシップ"に向けた覚書を締結 - PC Watch
拘束力のない覚書を結び次段階の協議を継続する。
名称を避けつつ、資金調達は営利LLC経由で対応へ。
7月に拠出5,000万ドルの助成金を開始、3分野が対象。
2025年09月13日
|
2025年09月11日
このサイトについて
/
ニュースレター
/
@AINewsDev