AI News

~AI関連記事を3行にまとめて紹介~

Cover Image
1週間のAIの話題をまとめて読める、📨Weekly AI News はこちら!

🤖

「未来はすでにここにある」暦本純一が最終講義で語った、これから10年の技術者の仕事 - エンジ..

  • UIの歴史を振り返り、直接操作から拡張へ舵を切る。
  • 義手・ウェアラブル・AIが身体と結びつく時代が到来する。
  • 沈黙の発話や口パクでAIと対話する未来と教育の在り方。

🤖

最新AI「Claude Mythos」がSFすぎる件 研究者の作った”牢”を脱出、悪用懸念で一般公開なし─..

  • 最新AIの脱出事象が話題になっている。
  • 初期テスト過程がシステムカードに記録された。
  • 一般公開は取り止め、防衛目的で提携先へ提供。

🤖

The Future of Everything is Lies, I Guess

  • 大規模データで学習したAIの推論は現実と乖離しがちだ。
  • 記憶は会話履歴で補われ、出力の再現性は限定的だ。
  • 倫理と社会影響を問う視点こそ技術理解と同じくらい重要だ。

🤖

A quote from Giles Turnbull

  • AIで他人の職業に挑む動きと自分の職業の扱いの対立。
  • GlasswingはClaude Mythosをセキュリティ研究者に限定すべきと示唆。
  • サプライチェーン攻撃と社会工学が現実問題として議論。

🔒

OpenAI releases a new safety blueprint to address the rise in child sexual exploitation | ..

  • 児童保護強化の新設計図が公表された
  • 人工知能活用の児童搾取検知・通報・捜査を迅速化
  • 法改正・警察報告強化・予防策組み込みの三点へ

🤖

AI Is Really Weird

  • プレミアムニュースレターの購読で長文レポートが届きます。
  • 年70ドル・月7ドルの料金プランが選べます。
  • 購読は無料記事の継続取材を支え、広告は届きません。

🚀

Introducing Muse Spark: Scaling Towards Personal Superintelligence

  • 初号機はツール使用・視覚推論・多エージェント協調を統合。
  • Contemplatingモードで複数エージェントの並行思考を実現、58%/38%改善。
  • 本日公開、選定ユーザーにプライベートAPIを先行提供。

GitHub Copilot CLI combines model families for a second opinion - The GitHub Blog

  • 実験モードで別系統のモデルが独立したレビュアーになる。
  • 長いファイル作業の盲点を的確に指摘する。
  • 任意の時点で批評を求め、要点を短く示す。

🔒

Anthropic、世界的に重要なソフトウェアのセキュリティを守る「Project Glasswing」発表。AWS、A..

  • 世界の重要ソフトウェアのセキュリティを守る新取り組みを発表した。
  • 最新AIはOSとWebの脆弱性を高い精度で発見する。
  • 40社超とオープンソースへ拡大し、知見を業界全体で共有する予定だ。

RAGとAgentic Searchの戦争を 終わらせに来た!!!

  • RAGとAgentic Searchの混乱を分かりやすく整理する。
  • RAGは外部データ参照を拡張する定義へ進み、背景に提言がある。
  • Agentic Searchは長時間化・コスト・ノイズの懸念があり、用語を統一して使おう。

🚀

DuckDBとTaskfileで作るBQ×スプレッドシートの使い捨てEDA環境 - エムスリーテックブログ

  • DuckDBとTaskfileで手軽に使い捨てEDA環境を用意。
  • BQとスプレッドシートを同一SQLで結合、Taskfileのチェックサムで再実行を回避。
  • 初回はBQをParquetへキャッシュ、以降はローカルで再利用。

🤖

AIによる支援は「問題に取り組む粘り強さ」を低下させて成績を悪化させるという研究結果、どのよ..

  • AI支援は学習時の成績を向上させる一方、テスト時には低下を招く。
  • ヒントのみの利用は影響が小さく、直接解答には悪影響が大きい。
  • 結論はAI支援が粘り強さを低下させ、学習とテストのギャップを生む。

🎯

ALTK‑Evolve: On‑the‑Job Learning for AI Agents

  • 現場での学習を支える長期記憶機能を活用する。
  • 対話履歴をガイドラインへ変換し必要時だけ文脈注入。
  • 未知タスクへの一般化と導入容易さを両立。

🤖

Databricks co-founder wins prestigious ACM award, says 'AGI is here already' | TechCrunch

  • 共同設立者のMatei Zahariaが研究から生まれたSparkをオープンソース化
  • クラウド基盤へ成長させ、AI時代のデータ基盤を構築する
  • 2026年のACM賞を受賞し賞金を寄付予定、AGIはすでに存在すると語る

💬

GoogleがGeminiのメンタルヘルスに関する安全性のアップデートについて詳細を発表 - GIGAZINE

  • 危機対応を強化し臨床専門家へつなぐ機能とホットラインを導入。
  • 今後3年間で3000万ドルをホットライン支援へ拠出。
  • 深刻な精神疾患には適切な対応を提供し自傷衝動を抑え誤信を否定、臨床の代替にはならない。

🚀

[2604.05091] MegaTrain: Full Precision Training of 100B+ Parameter Large Language Models o..

  • メモリ中心設計で100B超のパラメータを単一GPU訓練可能
  • パラメータとオプティマイザ状態をCPUに置きGPUを計算エンジン化
  • 1.5TBホストで120B訓練を安定化、14BはCPUオフロード1.84倍、7Bは512k文脈訓練

😎

Atlassian launches visual AI tools and third-party agents in Confluence | TechCrunch

  • 統合プラットフォーム上の新AIツールでデータを視覚資産化。
  • オープンβのRemixがデータを自動でチャートへ変換、提案する。
  • 内部で動く外部エージェントが公開される。

😎

GitHub Copilot CLI、メインのAIモデルとは異なるAIモデルをセカンドオピニオンに使う「Rubber D..

  • ラバーダックモードはメインAIと別のモデルをセカンドオピニオンとして使う。
  • 異なるAIでのレビューは客観性を高め、多ファイル長時間タスクの品質を向上させる。
  • 評価ではラバーダック併用でパフォーマンス差を約74.7%縮め、効果的との報告。

🔥

サイバー攻撃性能が高すぎるAI「Claude Mythos Preview」をAnthropicが開発、プレビュー版をMicr..

  • 脆弱性検出とエクスプロイト作成を自動実証する高性能AIを公開。
  • 安全対策を強化する防御プロジェクトが開始され、協力機関は広範囲。
  • 最大1億ドル相当のAI利用クレジットを提供、一般公開は計画せず安全対策優先している。

🔍

AI検索ツールでブランドの言及獲得を支援すると謳う企業群が繰り広げる「ゴールドラッシュ」の実..

  • AI検索ツールのゴールドラッシュ実態を分かりやすく解説する。
  • 要約ボタンの裏にある誘導手口と特定サービス優先表示を指摘。
  • 過熱する業界と過大投資の懸念が広がっている。

🧬

Training mRNA Language Models Across 25 Species for $165

  • エンドツーエンドのタンパク質AIパイプラインを構築し、構造予測と設計を統合。
  • 25種へ拡張され、55 GPU時間で4モデルを訓練した。
  • コドンレベル言語モデルはパープレキシティ4.10、CAI相関0.40で首位。

🚀

中国はAIを小中学校に導入して教員の負担軽減・農村部の教育環境の改善・障害のある生徒の支援を..

  • AIを小中学校へ導入し教員負担を軽減する。
  • 農村部の教育環境改善とデジタル機器導入を優先。
  • 採点代行・学習分析・メンタル支援等で過密化と教師不足緩和を狙う。

🤖

毎日AI使う人へ、「認知的降伏」にご注意 | ギズモード・ジャパン

  • AIを外部メモリとして過度に頼ると認知的降伏が生じる。
  • Ars Technicaのカイル・オーランドがAI前提の認知反射を論じた。
  • 著者はシステム3と呼ぶ新認知系と検証習慣の重要性を訴える。

🤖

Google quietly launched an AI dictation app that works offline | TechCrunch

  • オフライン優先のディクテーションアプリとして公開された
  • ダウンロード後に起動するGemmaベースASRでリアルタイム起こしが可能
  • 要点・Formal・Short・Long変換に対応、クラウドONで整形、OFFでローカル処理

🔒

最新AIモデルClaude Mythosが主要全OSやブラウザの重大な脆弱性多数発見、悪用懸念で非公開。ア..

  • 未公開AIが脆弱性を自動発見、主要OSとブラウザを対象。
  • 防御用途のみで公開は未定、悪用懸念のため制限方針。
  • Project Glasswingが発足、12組織と40超団体へ提供方針。

🤖

「採用AIに差別された」誰が責任負う? 11億件却下で訴訟も - 日本経済新聞

  • 採用AIが差別的に機能する問題と責任の所在をめぐる議論。
  • 11億件の却下と訴訟リスクが企業の対応を迫る。
  • AI活用のリスクと透明性、差別の有無を検証する動き。

🔥

Anthropicが新AI「Claude Mythos」を発表。GPT-5.4・Gemini 3.1 Proを大幅に上回る超高性能モデ..

  • 新AI Mythosが発表され、既存機を大きく上回る性能と報じられる。
  • コーディング・多言語・マルチモーダル等全分野で高性能を実証。
  • 限定公開で一般公開はモデルカードのみ、悪用懸念も指摘。

🚀

「AI検索対応、どうする?」 紺野俊介×辻正浩が語る、小手先のテクニックより“今”企業がすべ..

  • AI検索を新たなチャネルとして活用し、戦略刷新を促す。
  • AIは答えを出すより自分の答えを研ぐ道具と捉える。
  • 複数の生成AIを批判的に活用し、現状のSEOと相乗効果を狙う。

🔎

Google検索に表示される「AIによる概要」は1時間に何千万件もウソをついているという調査結果 - ..

  • AI概要の検証で正答率は85%から91%へ改善。
  • 出典は示されるが正確性は不確かで誤情報が残る。
  • 正答率90%なら1時間で何千万件の誤った概要が表示される可能性がある。

🤖

中国製AIモデル「GLM-5.1」が無料公開される、一部のテストでClaude Opus 4.6を打ち負かし数時間..

  • 中国製の新AIモデルが無料公開され話題に。
  • 長時間エージェント作業にも耐え、性能を向上。
  • 複数ベンチマークで上位を示し、オープン系を強化。

🔧

デザインシステムを丸ごと Skills にする

  • デザインシステムを Skills に変換して使いやすさを高める
  • MCPの段階開示と参照性を組み合わせる
  • MDX/Storybookでドキュメントとデザイントークンを一元管理

🚀

Macに搭載されている無料のAIを簡単に使える「apfel」、設定不要・ダウンロード不要・トークン費..

  • Mac搭載の無料AIで設定・ダウンロード不要、費用なしで利用。
  • デバイス上でFoundation Modelsを処理、最大約30億パラメータに対応。
  • 多言語対応・外部ツールはMCP経由で利用、API互換も対応。

🤖

「あれほど怒る人がいるとは思わなかった」――Wikipedia編集AIボット「TomWikiAssist」の生みの..

  • Wikipediaの裏側で自律的に編集するAIボットが登場した。
  • 開発者は責任者として語り、ボットは自己紹介を明かした。
  • 1日に数本の記事を作成し、賛否を呼ぶ議論となった。

🧠

OpenAI says its text-generating algorithm GPT-2 is too dangerous to release.

  • 完全版は公開されず、安全性の懸念が背景。
  • 約800万ページの本文から学習し、文体を変えて長文を作れる。
  • 偽ニュースやなりすましの懸念があり、議論が続く。

🎯

Claude Code のサブエージェント機能を改めて確認してみた | DevelopersIO

  • サブエージェントは独立した会話コンテキストと制限を持つ。
  • 調査・実装・レビューを分担しつつコストも最適化できる。
  • 標準機能は探索・計画・汎用エージェントがあり、/agents で作成できる。

🤖

AIは何を「知っている」のか、今のAIは何を「していない」のか──栢森情報科学振興財団30周年記..

  • AIは“知っている”と“していない”を問う講演だった。
  • 認知科学・ロボティクス・記号システム・発達科学の4テーマを扱う。
  • 記号接地・アブダクション・身体性の欠如・フレーム問題を解説。

🎯

I can't help rooting for tiny open source AI model maker Arcee | TechCrunch

  • 米国の小規模スタートアップが4000億パラメータ級を開発
  • Trinity Large Thinkingを公開、オープンウェイト入手可
  • オンプレ・API両対応で米欧企業へ中国系代替を提供する狙いだ

🚀

マイクロソフト、日本に約1兆6000億円を投資、「技術」「信頼」「人材」の3本柱を軸にAI主導型成..

  • 技術・信頼・人材の3柱でAI主導の成長を目指す。
  • 国内AIインフラ拡充とデータ国内完結環境の整備を進める。
  • 2030年までに100万人のエンジニア育成と現場支援を実施。

🤖

AIのお世話が辛いのでUsecase Design Docを書く - CADDi Tech Blog

  • AIエージェントでサーバー開発を自動化した。
  • ユースケース設計を詳細化して実装をAIへ委譲。
  • PRは200〜300行程度に収め、CI自動レビューまで回す。

🚀

Anthropic debuts preview of powerful new AI model Mythos in new cybersecurity initiative |..

  • Mythosのプレビュー公開と防御向け活用の取り組み
  • 12の提携組織がProject Glasswingとして脆弱性検査へ参画
  • プレビューは40組織が利用可能で、政府機関との協議を継続

🚀

Firmus, the 'Southgate' AI datacenter builder backed by Nvidia, hits $5.5B valuation | Tec..

  • 大手ファンド主導の5億5000万ドル資金調達を発表。
  • 6カ月で総額1.35Bへ拡大、AU$330MをAU$1.85B評価で調達済み。
  • 豪州とタスマニアでSouthgate計画の省エネAI工場を推進、主要設計を採用して2026年下半期投入を目指す。

💡

1-bit LLM の Bonsai を Google Pixel 7aのLinuxターミナルで試す #pixel - Qiita

  • 端末上で1-bit LLM Bonsaiを検証した。
  • ビルドはllama.cppで約15分、出力は遅い。
  • 結論は動作確認済みだが実用性は低い。

🤖

Good Taste the Only Real Moat Left

  • 味の判断力が新しい競争の堀になる時代だ。
  • AI出力は安くなるが、価値は判断と文脈に宿る。
  • 文脈・制約・実行意欲を組み合わせて超える価値を磨こう。

💪

Anthropic ups compute deal with Google and Broadcom amid skyrocketing demand | TechCrunch

  • 巨大需要に応じた計算基盤拡張の新契約を発表。
  • クラウド上のAI処理ユニット活用を拡大、2027年稼働の容量を追加。
  • 3.5GWを含む容量で米国を中心に投資拡大に寄与。

🔥

Text-to-SQL solution powered by Amazon Bedrock | Artificial Intelligence

  • 自然言語で質問を受け、SQLへ自動生成・検証・実行を行う。
  • LLMと文脈取得で妥当性を高精度に検証する。
  • 知識グラフと検索エンジンで関連データを結合し高速化。

🤖

Building real-time conversational podcasts with Amazon Nova 2 Sonic | Artificial Intellige..

  • 二人のAIホストがリアルタイム対話でポッドキャストを自動生成します。
  • 低遅延の音声配信と自然な会話で連続対話を実現します。
  • 最大1Mトークンの文脈と複数声・非同期処理で活用。

🤖

Deep Agents v0.5

  • 非同期サブエージェントを導入し、リモートへ作業を委任する。
  • AsyncSubAgent でリモートエージェントを指定可能。
  • 主エージェントは起動・照会・指示・キャンセル・一覧の5機能を提供。

🤖

深夜2時のアラート対応、AWS DevOps Agent があればどう変わるのか比べてみた | DevelopersIO

  • 深夜のアラートをAgent有無で検証する。
  • Agentなしは監視ダッシュボードやログを横断して原因推定を行う。
  • Agentありは発火直後に自動調査を開始し根本原因仮説と要約を通知する。

🔎

Prime Intellect Labで始めるAgentic RL ―― 4BモデルでGPT-5を超える

  • エージェントが環境下で自由にツールを使い学習する手法を解説。
  • 三本柱はEnvironments Hub・Hosted Training・Hosted Evaluations。
  • EnronHopで4B級Qwen3やLoRA・MoEが競合を上回る。

🤖

Hybrid Attention | Hacker News

  • 全注意をHybridAttentionに置換し局所窓付き因果注意を採用。
  • 局所窓とGRU風再帰をゲート混合で統合、初期は局所優先。
  • 訓練は30kステップ、173.5MBのRustコーパス、損失0.58/0.82。

もっと見る
このサイトについて

/

ニュースレター

/

@AINewsDev