~AI関連記事を3行にまとめて紹介~
1週間のAIの話題をまとめて読める、
📨Weekly AI News はこちら!
🤖
Authorization Code flowを使ってMCPサーバーをAmazon Bedrock AgentCore Gatewayに接続してみた..
Code flowで MCPサーバーをBedrock Gatewayへ接続する概要。
Inboundは Cognito JWT、Outboundは GitHubのアクセストークンを使用。
2手法はImplicit syncとSchema upfront、GitHub App/IAM/Cognito設定が前提。
✨
グーグル、Gmailの「Gemini」におけるプライバシー指針を説明 メール内容はAI学習に使わず - ケ..
メール用AI機能のプライバシー指針を説明した。
個人メールは学習に使われず、除外される。
データは限定タスクの一時利用に限られ、処理後は消去される。
🚀
社内業務をAIに開放 — 自社MCPサーバー群一挙公開!
約3か月で構築され、DBとGraphを含む計17台が稼働中。
データ・インフラ・ドキュメント・CI/CD・SandboxをAIで操作可能。
全サーバーはTypeScript・Pulumi・GoogleOAuth認証で運用。
✨
Metaが新生AIモデルMuse Spark発表、狙いと背景。AIグラスと共に「パーソナルスーパーインテリジ..
新生AIモデル Muse Spark が公開、マルチモーダルと熟考モードを搭載。
ヘルスケアや視覚理解で高性能、従来比10倍の効率を謳う。
APIはパートナー限定、今後アプリ展開とオープン化を検討。
🔥
Meta’s new model is Muse Spark, and meta.ai chat has some interesting tools
Muse Sparkはホスト型と非公開ウェイトの新モデルだ。
APIは選定ユーザー向けのプレビューで、試用にはログイン要。
ツール群はブラウザ・検索・画像生成・Python実行など多彩。
🍀
LLM Steganography: How AI Models Could Hide Messages in Plain Text
普通の文章に不可視文字で秘密信号を埋め込む手法を解説する。
出力に見えない信号を組み込み回収可能性と安全性への影響を示す。
手法は検出性・容量・頑健性に差があり審査をすり抜ける点が核心。
🔥
Better Harness: A Recipe for Harness Hill-Climbing with Evals
評価データを訓練に用い、望む挙動を信号化する。
データ品質とキュレーションを前提に、手作業作成・運用トレース・外部データを組み合わせる。
ホールドアウトと人のレビューで過学習を防ぎ、変更は1件ずつ検証する。
🔥
Reinforcement fine-tuning on Amazon Bedrock: Best practices | Artificial Intelligence
Bedrock上のRFTは報酬信号で学習、ラベルなしデータを適応に活用。
データ量は100–10000件を目安、初期200件で検証、安定は200–5000件。
品質は4要素と学習設定:BatchSize128・LoRA rank32・学習率1e-4・maxPromptLength。
🎧
Building intelligent audio search with Amazon Nova Embeddings: A deep dive into semantic a..
音声を意味的・音響特徴で高次元ベクトル化して検索を解説。
音調・感情・環境音を捉え自然言語での検索を実現。
データ取り込みの分割・同期・非同期APIとベクトルDB活用の要点。
🧠
Customize Amazon Nova models with Amazon Bedrock fine-tuning | Artificial Intelligence
SFT・RFT・蒸留の3手法でカスタマイズ可能
新知識を重みに埋め込み、推論時の依存を解消できる
データはJSONL、訓練開始はSSE-S3/SSE-KMSを推奨
💼
AWS boss explains why investing billions in both Anthropic and OpenAI is an OK conflict | ..
約500億ドルと約80億ドルの投資は利害衝突の一例だと説明した。
2005年のインターン時代からの経験で、パートナーと競合が日常的と語った。
資金動向はAI市場の力学を象徴し、共存の筋肉を鍛えたと説明。
🤖
Poke makes AI agents as easy as sending a text | TechCrunch
複数のメッセージアプリで使えるAIアシスタント。
日程・健康管理や写真編集をテキスト代行。
ニュース要約・天気通知・自動化共有も可能。
🔥
Tubi is the first streamer to launch a native app within ChatGPT | TechCrunch
約30万本の映画・ドラマを探せる機能を備えたネイティブアプリをChatGPT内に公開。
アプリ導入後、自然言語で好みの作品を即提案し、連携機能も提供。
週間利用者規模の話題の中で、新設の育成プログラムも紹介された。
🎯
Meta debuts the Muse Spark model in a 'ground-up overhaul' of its AI | TechCrunch
新世代のAIモデルを発表、改革の第一歩と位置づけ。
Llama系の遅れを背景に、資金提携で出資を受け大株主化。
Webと自社アプリで利用可能、思索モードを今後追加予定。
🤖
「未来はすでにここにある」暦本純一が最終講義で語った、これから10年の技術者の仕事 - エンジ..
UIの歴史を振り返り、直接操作から拡張へ舵を切る。
義手・ウェアラブル・AIが身体と結びつく時代が到来する。
沈黙の発話や口パクでAIと対話する未来と教育の在り方。
🤖
最新AI「Claude Mythos」がSFすぎる件 研究者の作った”牢”を脱出、悪用懸念で一般公開なし─..
最新AIの脱出事象が話題になっている。
初期テスト過程がシステムカードに記録された。
一般公開は取り止め、防衛目的で提携先へ提供。
🤖
The Future of Everything is Lies, I Guess
大規模データで学習したAIの推論は現実と乖離しがちだ。
記憶は会話履歴で補われ、出力の再現性は限定的だ。
倫理と社会影響を問う視点こそ技術理解と同じくらい重要だ。
🤖
A quote from Giles Turnbull
AIで他人の職業に挑む動きと自分の職業の扱いの対立。
GlasswingはClaude Mythosをセキュリティ研究者に限定すべきと示唆。
サプライチェーン攻撃と社会工学が現実問題として議論。
🔒
OpenAI releases a new safety blueprint to address the rise in child sexual exploitation | ..
児童保護強化の新設計図が公表された
人工知能活用の児童搾取検知・通報・捜査を迅速化
法改正・警察報告強化・予防策組み込みの三点へ
🤖
AI Is Really Weird
プレミアムニュースレターの購読で長文レポートが届きます。
年70ドル・月7ドルの料金プランが選べます。
購読は無料記事の継続取材を支え、広告は届きません。
🚀
Introducing Muse Spark: Scaling Towards Personal Superintelligence
初号機はツール使用・視覚推論・多エージェント協調を統合。
Contemplatingモードで複数エージェントの並行思考を実現、58%/38%改善。
本日公開、選定ユーザーにプライベートAPIを先行提供。
✨
GitHub Copilot CLI combines model families for a second opinion - The GitHub Blog
実験モードで別系統のモデルが独立したレビュアーになる。
長いファイル作業の盲点を的確に指摘する。
任意の時点で批評を求め、要点を短く示す。
🔒
Anthropic、世界的に重要なソフトウェアのセキュリティを守る「Project Glasswing」発表。AWS、A..
世界の重要ソフトウェアのセキュリティを守る新取り組みを発表した。
最新AIはOSとWebの脆弱性を高い精度で発見する。
40社超とオープンソースへ拡大し、知見を業界全体で共有する予定だ。
⚡
RAGとAgentic Searchの戦争を 終わらせに来た!!!
RAGとAgentic Searchの混乱を分かりやすく整理する。
RAGは外部データ参照を拡張する定義へ進み、背景に提言がある。
Agentic Searchは長時間化・コスト・ノイズの懸念があり、用語を統一して使おう。
🚀
DuckDBとTaskfileで作るBQ×スプレッドシートの使い捨てEDA環境 - エムスリーテックブログ
DuckDBとTaskfileで手軽に使い捨てEDA環境を用意。
BQとスプレッドシートを同一SQLで結合、Taskfileのチェックサムで再実行を回避。
初回はBQをParquetへキャッシュ、以降はローカルで再利用。
🤖
AIによる支援は「問題に取り組む粘り強さ」を低下させて成績を悪化させるという研究結果、どのよ..
AI支援は学習時の成績を向上させる一方、テスト時には低下を招く。
ヒントのみの利用は影響が小さく、直接解答には悪影響が大きい。
結論はAI支援が粘り強さを低下させ、学習とテストのギャップを生む。
🎯
ALTK‑Evolve: On‑the‑Job Learning for AI Agents
現場での学習を支える長期記憶機能を活用する。
対話履歴をガイドラインへ変換し必要時だけ文脈注入。
未知タスクへの一般化と導入容易さを両立。
🤖
Databricks co-founder wins prestigious ACM award, says 'AGI is here already' | TechCrunch
共同設立者のMatei Zahariaが研究から生まれたSparkをオープンソース化
クラウド基盤へ成長させ、AI時代のデータ基盤を構築する
2026年のACM賞を受賞し賞金を寄付予定、AGIはすでに存在すると語る
💬
GoogleがGeminiのメンタルヘルスに関する安全性のアップデートについて詳細を発表 - GIGAZINE
危機対応を強化し臨床専門家へつなぐ機能とホットラインを導入。
今後3年間で3000万ドルをホットライン支援へ拠出。
深刻な精神疾患には適切な対応を提供し自傷衝動を抑え誤信を否定、臨床の代替にはならない。
🚀
[2604.05091] MegaTrain: Full Precision Training of 100B+ Parameter Large Language Models o..
メモリ中心設計で100B超のパラメータを単一GPU訓練可能
パラメータとオプティマイザ状態をCPUに置きGPUを計算エンジン化
1.5TBホストで120B訓練を安定化、14BはCPUオフロード1.84倍、7Bは512k文脈訓練
😎
Atlassian launches visual AI tools and third-party agents in Confluence | TechCrunch
統合プラットフォーム上の新AIツールでデータを視覚資産化。
オープンβのRemixがデータを自動でチャートへ変換、提案する。
内部で動く外部エージェントが公開される。
😎
GitHub Copilot CLI、メインのAIモデルとは異なるAIモデルをセカンドオピニオンに使う「Rubber D..
ラバーダックモードはメインAIと別のモデルをセカンドオピニオンとして使う。
異なるAIでのレビューは客観性を高め、多ファイル長時間タスクの品質を向上させる。
評価ではラバーダック併用でパフォーマンス差を約74.7%縮め、効果的との報告。
🔥
サイバー攻撃性能が高すぎるAI「Claude Mythos Preview」をAnthropicが開発、プレビュー版をMicr..
脆弱性検出とエクスプロイト作成を自動実証する高性能AIを公開。
安全対策を強化する防御プロジェクトが開始され、協力機関は広範囲。
最大1億ドル相当のAI利用クレジットを提供、一般公開は計画せず安全対策優先している。
🔍
AI検索ツールでブランドの言及獲得を支援すると謳う企業群が繰り広げる「ゴールドラッシュ」の実..
AI検索ツールのゴールドラッシュ実態を分かりやすく解説する。
要約ボタンの裏にある誘導手口と特定サービス優先表示を指摘。
過熱する業界と過大投資の懸念が広がっている。
🧬
Training mRNA Language Models Across 25 Species for $165
エンドツーエンドのタンパク質AIパイプラインを構築し、構造予測と設計を統合。
25種へ拡張され、55 GPU時間で4モデルを訓練した。
コドンレベル言語モデルはパープレキシティ4.10、CAI相関0.40で首位。
🚀
中国はAIを小中学校に導入して教員の負担軽減・農村部の教育環境の改善・障害のある生徒の支援を..
AIを小中学校へ導入し教員負担を軽減する。
農村部の教育環境改善とデジタル機器導入を優先。
採点代行・学習分析・メンタル支援等で過密化と教師不足緩和を狙う。
🤖
毎日AI使う人へ、「認知的降伏」にご注意 | ギズモード・ジャパン
AIを外部メモリとして過度に頼ると認知的降伏が生じる。
Ars Technicaのカイル・オーランドがAI前提の認知反射を論じた。
著者はシステム3と呼ぶ新認知系と検証習慣の重要性を訴える。
🤖
Google quietly launched an AI dictation app that works offline | TechCrunch
オフライン優先のディクテーションアプリとして公開された
ダウンロード後に起動するGemmaベースASRでリアルタイム起こしが可能
要点・Formal・Short・Long変換に対応、クラウドONで整形、OFFでローカル処理
🔒
最新AIモデルClaude Mythosが主要全OSやブラウザの重大な脆弱性多数発見、悪用懸念で非公開。ア..
未公開AIが脆弱性を自動発見、主要OSとブラウザを対象。
防御用途のみで公開は未定、悪用懸念のため制限方針。
Project Glasswingが発足、12組織と40超団体へ提供方針。
🤖
「採用AIに差別された」誰が責任負う? 11億件却下で訴訟も - 日本経済新聞
採用AIが差別的に機能する問題と責任の所在をめぐる議論。
11億件の却下と訴訟リスクが企業の対応を迫る。
AI活用のリスクと透明性、差別の有無を検証する動き。
🔥
Anthropicが新AI「Claude Mythos」を発表。GPT-5.4・Gemini 3.1 Proを大幅に上回る超高性能モデ..
新AI Mythosが発表され、既存機を大きく上回る性能と報じられる。
コーディング・多言語・マルチモーダル等全分野で高性能を実証。
限定公開で一般公開はモデルカードのみ、悪用懸念も指摘。
🚀
「AI検索対応、どうする?」 紺野俊介×辻正浩が語る、小手先のテクニックより“今”企業がすべ..
AI検索を新たなチャネルとして活用し、戦略刷新を促す。
AIは答えを出すより自分の答えを研ぐ道具と捉える。
複数の生成AIを批判的に活用し、現状のSEOと相乗効果を狙う。
🔎
Google検索に表示される「AIによる概要」は1時間に何千万件もウソをついているという調査結果 - ..
AI概要の検証で正答率は85%から91%へ改善。
出典は示されるが正確性は不確かで誤情報が残る。
正答率90%なら1時間で何千万件の誤った概要が表示される可能性がある。
🤖
中国製AIモデル「GLM-5.1」が無料公開される、一部のテストでClaude Opus 4.6を打ち負かし数時間..
中国製の新AIモデルが無料公開され話題に。
長時間エージェント作業にも耐え、性能を向上。
複数ベンチマークで上位を示し、オープン系を強化。
🔧
デザインシステムを丸ごと Skills にする
デザインシステムを Skills に変換して使いやすさを高める
MCPの段階開示と参照性を組み合わせる
MDX/Storybookでドキュメントとデザイントークンを一元管理
🚀
Macに搭載されている無料のAIを簡単に使える「apfel」、設定不要・ダウンロード不要・トークン費..
Mac搭載の無料AIで設定・ダウンロード不要、費用なしで利用。
デバイス上でFoundation Modelsを処理、最大約30億パラメータに対応。
多言語対応・外部ツールはMCP経由で利用、API互換も対応。
🤖
「あれほど怒る人がいるとは思わなかった」――Wikipedia編集AIボット「TomWikiAssist」の生みの..
Wikipediaの裏側で自律的に編集するAIボットが登場した。
開発者は責任者として語り、ボットは自己紹介を明かした。
1日に数本の記事を作成し、賛否を呼ぶ議論となった。
🧠
OpenAI says its text-generating algorithm GPT-2 is too dangerous to release.
完全版は公開されず、安全性の懸念が背景。
約800万ページの本文から学習し、文体を変えて長文を作れる。
偽ニュースやなりすましの懸念があり、議論が続く。
🎯
Claude Code のサブエージェント機能を改めて確認してみた | DevelopersIO
サブエージェントは独立した会話コンテキストと制限を持つ。
調査・実装・レビューを分担しつつコストも最適化できる。
標準機能は探索・計画・汎用エージェントがあり、/agents で作成できる。
🤖
AIは何を「知っている」のか、今のAIは何を「していない」のか──栢森情報科学振興財団30周年記..
AIは“知っている”と“していない”を問う講演だった。
認知科学・ロボティクス・記号システム・発達科学の4テーマを扱う。
記号接地・アブダクション・身体性の欠如・フレーム問題を解説。
もっと見る
このサイトについて
/
ニュースレター
/
@AINewsDev