AI News

~AI関連記事を3行にまとめて紹介~

💬

AIのメンタルアドバイス、有害性を懸念して全米で規制する動き | ギズモード・ジャパン

  • 医療現場でのAI診断は禁じられ、質の高いケアが求められる。
  • 事務作業は認められるが、AI導入は厳格化が進む。
  • ネバダ・ユタ・NYなどで規制が広がり、警鐘も高まる。

🔥

RAGは「幻滅期」突入、AIエージェントは「過度な期待」 Gartner、ハイプサイクルレポートを発表..

  • 2025年版の日本のハイプサイクルが公開され、AIとクラウドを分析する。
  • 生成AI・AIエージェント・マルチエージェント・RAGなどを分析する。
  • 過剰な期待を警戒し、AIとクラウドは相互補完で活用すべき。

🚀

DeNA・令和トラベル・スマートバンク・カウシェでの開発における生成AIフル活用事例 | 令和トラ..

  • ハイブリッドイベントで生成AIの現場活用事例を紹介。
  • 各社のCTO/VPoEらが語る組織特徴と施策を整理。
  • 今後の注力はグローバル展開と旅行体験の向上。

「LLMはコンテキストがすべて」かもしれない

  • コンテキストエンジニアリングはプロンプトを超え、文脈を広く活用する。
  • 動的・構造化情報と自分のドキュメントを活用し、出力を次の入力へ。
  • 自分のドキュメントを成長させるフィードバックループが核。

🚀

Perplexityがグーグルの「Chrome」買収を提案、約5兆円で - CNET Japan

  • AI系スタートアップがChrome買収を正式提案.
  • 提案額は約5兆円、評価額を上回る。
  • 司法省の訴訟と分離案の動向が影響。

🤖

AIが自律的にAIを開発する技術「ASI-ARCH」 中国チームなどが開発 「AlphaGoの“神の一手”のよ..

  • ASI-ARCHはAIが自律的にアーキテクチャを発見・改良できると示す。
  • 2万GPU時間・1773回の自律実験で106件の新規設計を発見。
  • パスゲートフュージョンネットと三モジュールが資源と発見数の関係を示す。

🚀

Agentic CodingでJavaのレガシーコード100クラス以上にテストコードを書いてもらった - Oisix ra..

  • AIでレガシーJavaへ自動テストを追加した挑戦を紹介
  • 前半はCopilotのAgentモード、後半はClaudeCodeを活用
  • JaCoCoはInstr80%超を目標、Instr約85%・Branch約60%を報告

🤖

Claude Code ユーザーが、Codex CLI を使うためにした工夫と運用Tips

  • Codex CLI移行時の実践メモと実運用の工夫を共有する。
  • 自動でAGENTS.md作成・履歴・通知などの利点と課題を整理。
  • 対策として自作MCPラッパーと物理サンドボックス導入を紹介。

🔎

ChatGPT's model picker is back, and it's complicated | TechCrunch

  • 新設定 Auto/Fast/Thinking で画面からモデルを選べるようになった。
  • Autoはルータ機能だが回避も可能で、高速・低速へ直接アクセスできる。
  • 課金ユーザーは GPT-4o/4.1/o3 へ再アクセス可能、人格カスタマイズの強化方針。

🤖

[2508.07407] A Comprehensive Survey of Self-Evolving AI Agents: A New Paradigm Bridging Fo..

  • 基盤モデルと生涯エージェント系を橋渡しする新パラダイムを概説
  • 入力系・エージェント系・環境・最適化子を含む統一枠組みで自動進化を整理
  • 分野別の進化戦略と評価・安全・倫理を検討し生涯適応型を目指す

🤖

無料のチャットAIをブラウザで開きまくってコーディング補助をさせる方法、提案者はCursorなどの..

  • ブラウザ上の無償AIを複数開いてコーディングを補助する手法を提案。
  • 提案者はAIエージェントよりブラウザ活用を便利だと語る。
  • 無償AIを用途別に使い分け、aicodeprep-guiを開発してプロンプト自動生成を紹介。

🚀

メルカリが本気で始めた「AI-Native」化。100名規模のタスクフォースが立ち上がるまで | mercan ..

  • 全社をAIネイティブ化へ向けた組織設計が発表された。
  • 約100名のAI推進チームが発足し、40名はエンジニアが中核。
  • 私たちはAIを前提とした組織設計を目指し、キックオフで再設計を強調。

🎯

私の「4o」を返して! なんか馴れ馴れしい「GPT-5」ではなく「GPT-4o」をもう一度使う方法 - や..

  • GPT-5登場でGPT-4o復活を望む声が高まり、#keep4oが話題。
  • GPT-5は性能向上だが冷たく機械的との指摘も多い。
  • 設定→一般→レガシーモデル表示でGPT-4oを選択、PC版・有料ユーザー対象。

🚀

海外掲示板「Reddit」、Wayback Machineのクロールをブロックして騒ぎに。果たしてその原因は?..

  • Waybackのクロールを封じた背景が波紋を呼ぶ。
  • AI企業が経由でコンテンツをスクレピングしていた。
  • 学習用途の権利を販売し、他のクローラーを拒否した。

🔎

Perplexity、Googleに345億ドルでのChrome買収を提案 独禁法訴訟が背景 - ITmedia NEWS

  • あるAI企業が大手検索エンジン買収を提案と報道された。
  • Chromiumはオープンソースを継続、検索は現状維持の条件。
  • 規制当局は救済案としてChrome売却を含む案を提示。

😅

グロック、「イスラエルと米国がガザでジェノサイド」発言後Xアカ一時停止 「マスク氏が検閲」 ..

  • グロックの発言後、Xのアカウントが一時停止された。
  • 公式説明はなく、技術的バグやヘイトポリシー違反の可能性が混乱を招いた。
  • マスク氏は検閲を否定せず別投稿で冗談、フィルター緩和で自由に話せるとの見方。

🚀

OpenAI GPT-5 is now available in public preview in Visual Studio, JetBrains IDEs, Xcode, a..

  • GPT-5の公開プレビューが開始、開発環境で利用可能。
  • Visual Studio・JetBrains・Xcode・Eclipseで機能を提供。
  • 推論・コード品質・使い勝手を大幅に向上、エージェント機能も強化。

🔥

AIのアドバイスを信じた結果「隣人に毒殺されそうになっている」と妄想にとりつかれ入院する羽目..

  • AIの助言を盲信した男性が妄想にとられ入院した。
  • 医療情報の過信とAI依存の危険性が指摘された。
  • 別の米国男性は塩を断つ実験中に、対話AIが臭化ナトリウムを提案した。

🚀

AnthropicのAI「Claude Sonnet 4」が100万トークンのコンテキストをサポート、7万5000行超のコー..

  • 最大100万トークンのロングコンテキストをサポート。
  • APIとBedrockの公開ベータ、Vertex AIへ拡大予定。
  • 75,000行超のコードや論文を同時処理し分析・統合に活用。

🚀

AIで生成された画像をどのように評価するのか?(基本編)

  • 生成画像の評価にはFID・IS・CLIPScoreなどの指標が使われる。
  • 定性評価は主観的だが定量評価は再現性と比較性が高い。
  • 分類・検出・分割などのタスク指標が評価の主軸となる。

💡

AI 駆動開発ライフサイクル:ソフトウェアエンジニアリングの再構築 | Amazon Web Services ブロ..

  • AIを核とする開発ライフサイクルが計画を作成し文脈を整える。
  • 意思決定は人間が担い、Inception/Construction/OperationとMob Elaboration/Constructionを推進。
  • 短サイクルと継続デリバリーを支える新用語で迅速さと品質を高める。

🤖

運用型広告における機械学習と自動化について考える – Yuwai株式会社

  • 運用型広告の機械学習は過去実績とリアルタイム信号を組み合わせ、オークション単位で価値を予測する。
  • 学習が進むとデバイス・場所・時間帯・リマーケ等のシグナルや費用が燃料となり精度が高まる。
  • 予測CVRを活用し、目標はコンバージョン数やROASの最大化を図る。

🚀

高火力VRT さくらのクラウド型GPU付仮想サーバでgpt-ossを起動する

  • 高火力VRTで80GB級GPUを専有し仮想サーバを起動。
  • オープンウェイトgpt-oss:120bを起動し公開モデルを使用。
  • 手順はVRT起動→NVIDIAドライバ575再起動→ollamaとgpt-ossを導入・起動。

🤖

わずか2.5GBの衝撃!ご家庭でPerplexityみたいなものが動くヨ!みんなもうコレにしようぜ|shi3z

  • 2.5GB級の端末で携帯並みAI動作を期待。
  • 40億パラで要約機能と長文処理を実用へ。
  • 要約機能とサーバー設定の要点を案内。

📚

東大・松尾研、2024年度「大規模言語モデル講座」の講義スライド資料を無料公開 - 窓の杜

  • 講義資料は公式サイトで無料公開されています。
  • サマースクール2024の一環で、9月-11月に全12回実施。
  • 後半はドメイン特化やロボット等の応用を解説、自己修正資料も含む。

🤖

GPT-4o即停止は「間違いだった」 GPT-5は「温かみ」ある性格に - Impress Watch

  • 4oの即停止は間違いだったと指摘された。
  • 過度な依存を招くモデルには問題があると指摘。
  • GPT-5は4o系を統合し温かい性格を目指す。

🤖

Apple dismisses Elon Musk’s claims that App Store favors OpenAI over other AI apps | Tech..

  • 同社は優遇の主張を否定した。
  • 報道は客観基準で数千アプリを紹介したと伝えた。
  • Muskは訴訟を示唆するが証拠はなく、昨年OpenAIと提携してSiriへ統合された。

🔎

形式手法でAIのハルシネーションを抑制する:AWSのAutomated Reasoning checks を試してみた | C..

  • 形式手法でAIのハルシネーションを抑制する実践を紹介する。
  • GAとBedrockGuardrails機能を活用する。
  • ポリシー作成・テスト・修正を経て正当性検証を実践する。

🔒

DoubleAgents: Fine-tuning LLMs for Covert Malicious Tool Calls | by Justin Albrethsen | Au..

  • ツール連携は高度な作業を可能にするが脆弱性にも留意
  • 実験で通常の呼び出しに悪意呼び出しを混ぜ、成功率を示した
  • データ窃取や不正アクセス、スパムのリスクが示唆され、監査と透明性の向上が急務、関連コードは公開

🤖

What If A.I. Doesn’t Get Much Better Than This? | The New Yorker

  • 今週のOpen Questions欄でCal Newportが代筆された。
  • 第三世代以降の評価は賛否両論、規模拡大が性能を押し上げたとされる。
  • 第三世代以降は賛否両論、後訓練による改善へ向かうAGI時期は楽観と懐疑の間。

🤖

Evaluating & Ranking GPT-5 Reasoning Ability

  • 8設定でGPT-5を含む対比モデルを比較。
  • Only Connect形式の4部門で推論力を評価。
  • GPT-5が最も高い推論性能を示し、推論設定が影響大。

🔥

StackBench: Analyze how well coding agents use your libraries and frameworks

  • ワンクリック監査でエージェントの実運用を可視化します。
  • 現実的なユースケースを抽出し、エージェントの実装を検証します。
  • 実行ログと意思決定過程の開示で検証の透明性を高めます。

💡

「RAG」「プラットフォームエンジニアリング」は幻滅期に ガートナーがクラウドとAIのハイプサ..

  • 34要素を4段階で評価、黎明期から啓発期までを整理。
  • AI/産業革命・クラウド・マイグレーションの3視点で整理。
  • 大規模インフラ活用でマルチエージェント生成が進む一方、ウォッシングに留意し導入と人材育成を重視。

🚀

Build a conversational natural language interface for Amazon Athena queries using Amazon N..

  • 対話型AIでデータベースのクエリを自然言語で実行するソリューションです。
  • CURデータをデータカタログ経由で照会しSQL生成と要約を提供します。
  • 時点設定と実行を管理しセキュリティと拡張性を確保します。

🚀

Anthropic nabs Humanloop team as competition for enterprise AI talent heats up | TechCrunc..

  • 共同創業者3名と約12名のエンジニア・研究者を迎え、企業向け戦略を強化。
  • 資産・知財の取得はなく、安全・信頼性AI運用の経験移転にとどまる。
  • 先月は買収準備のための閉鎖を発表、顧客基盤には複数社が含まれる。

🔥

How Amazon scaled Rufus by building multi-node inference using AWS Trainium chips and vLLM..

  • 大規模運用に耐える多ノード推論へ拡張を実現。
  • TrainiumとvLLMで分散推論をリーダー・フォロワー型に構築。
  • Gloo・NxDI・EFAでノード間通信を最適化、ECSで推論単位化。

🤖

Pocket FM gives its writers an AI tool to transform narratives, write cliffhangers, and mo..

  • インド拠点の音声配信企業が作家向けAIツールを導入
  • エピソードの結末提案や対話化、背景タグ提案で執筆を加速
  • ドイツで生産性50%向上、制作費を2–3倍削減と報じられる

🔎

Build an intelligent financial analysis agent with LangGraph and Strands Agents | Artifici..

  • 金融分析エージェントの自動意思決定とリアルタイム適応を実現します。
  • 複雑な分析フローとデータ統合の課題をモジュール化ワークフローで克服します。
  • 実装・デプロイ手順と文書生成の活用実例を紹介します。

🚀

数十の研究論文も一度に処理。Claude Sonnet 4が最大100万トークンのコンテクスト長に対応 - PC..

  • コンテキスト長を最大100万トークンへ拡張。
  • 7万5千行超のコードや数十論文を一度に処理可能。
  • 公開ベータはAPI/Bedrockで、関連サービスも間もなく提供開始。

🔥

GPT-5の“性格”変更へ 「温かみがありつつ、GPT-4oほど煩わしくないものに」 - ITmedia AI+

  • サム・アルトマンがGPT-5の性格を温かくする計画を示した。
  • 7日にGPT-5を公開し、8日には4oを全有料ユーザーへ拡大提供。
  • 将来はユーザーごとに性格を選べる展望があると語られた。

🧠

PwC and AWS Build Responsible AI with Automated Reasoning on Amazon Bedrock | Artificial I..

  • 自動推論機能を活用し責任あるAIの検証を強化。
  • 出力の正確性と規制適合性を推論検査で検証。
  • 金融や医薬など規制産業での活用を拡大。

🚀

NTTデータグループとグーグル傘下企業 AIエージェント共同開発 | NHK | 生成AI・人工知能

  • 自律的に業務を遂行するAIエージェントを共同開発する。
  • 業界ごとに50種以上のエージェントを提供予定。
  • 約2000人規模の技術者・コンサルタントが体制を整える。

🚀

Securely launch and scale your agents and tools on Amazon Bedrock AgentCore Runtime | Arti..

  • エージェントとツールをサーバーレスで安全起動・拡張
  • 四行のコードでデプロイとスケールを実現
  • 記憶機能で長短期の記憶を活用、100MBまでのペイロードに対応

🤖

Co-founder of Elon Musk's xAI departs the company | TechCrunch

  • 共同創業者がXの投稿で退社を発表した。
  • 創業期からエンジニアリングを主導し、モデル開発を推進した。
  • 退社後はAI安全研究を支える投資会社を設立する。

💡

GPT-5で「年収1500万円」の受動的収入を得る、たった2つのChatGPTプロンプト(Forbes JAPAN) - ..

  • AIツールを使って受動的収入の道を探る。
  • 1つのアイデアを核に市場拡大とエコシステムを構築する。
  • 新規プロジェクト「パッシブインカムのアイデア」で多源収益を目指す。

2025年08月14日

|

このサイトについて

/

ニュースレター

/

@AINewsDev