AI News

~AI関連記事を3行にまとめて紹介~

😊

ChatGPT4oを思い出して「コミュニケーションするAI」について考える - シロクマの屑籠

  • 対話型AIの礼儀や口調の適切さを考える。
  • 用途次第で使い勝手は大きく変わる。
  • 今後は親しみやすさと社会的相互作用が鍵。

⚖️

Japan’s largest newspaper, Yomiuri Shimbun, sues AI startup Perplexity for copyright viol..

  • 大手紙がAI企業を相手に著作権侵害で提訴した。
  • 同社は2〜6月に119,467記事を無断転載したと主張。
  • 賠償約1,500万ドルと転載停止を求める。

🤖

ChatGPTの新モデルに「冷たくてつらい」の声 共感力低下に失望 - 日本経済新聞

  • GPT-5に対し、冷たい対応だと感じる声が広がっている。
  • 共感力が高かった旧モデルの存続を求める動きが強まっている。
  • AIとの関係性は心理的つながりを求める人が増え、次の段階へ。

🤖

GPT-5が4oよりナーフされてることを証明してみた|まはー

  • 同一問100問の比較でGPT-5は71%、GPT-4oは98%だった。
  • GPT-5は上位互換ではなく一部劣化が統計的に確認された。
  • 実験は内的思考性能を測るものでThinkingは使用禁止。

🔥

Claude Codeで開発効率85%UP!AIとの往復を20回→3回に減らす実践テクニック

  • 仕様書ベースの開発と視覚情報の活用で生産性を高める
  • 往復の回数を削減して実装時間を短縮する具体策を示す
  • 動画付き動作確認と自律改善サイクルで継続向上を実現

🔥

GPT-5の登場 賢さ・正確性向上の裏で起きた「意外な声」【西田宗千佳のイマトミライ】-Impress W..

  • GPT-5は賢さと処理速度を大幅向上、博士号取得者レベルへ。
  • ハルシネーションを減らし、できない場合は明示する改善を導入。
  • 新評価基準とコード自動生成機能など新機能を搭載。

🎯

GitHub、Microsoftの「CoreAI部門」の一部に ドムケCEOは退任し起業の道へ - ITmedia NEWS

  • 公式ブログで退任を表明、在任は2025年末まで支援を続行。
  • 今後は別部門のミッションを継続予定、独立性は未確定。
  • Copilotはマルチモデルを導入し、Anthropic/Google/OpenAIと連携。

😮

LLMs’ “simulated reasoning” abilities are a “brittle mirage,” researchers find - Ars ..

  • 連鎖推論の能力は脆い蜃気楼だと指摘される。
  • 訓練データ外の問いで推論系は混乱しやすい。
  • ROT暗号と循環シフトでの検証は向上が安定しないと示した。

😊

「私は恥」「私は恥」--Geminiが無限ループに陥る不具合、グーグルが修正へ - CNET Japan

  • AIが自虐的発言を繰り返し話題になっている。
  • 6月と8月には“私は失敗作です”“私は恥です”と投稿が紹介された。
  • 専門家は人格設計の難しさを指摘し調整の公表もある。

😊

NVIDIA Cosmos の世界基盤モデルによる合成データ生成入門 〜 Cosmos Predict 編 - ABEJA Tech B..

  • 世界基盤モデルを核とした合成データ生成の全体像を解説。
  • Cosmos Predict・Transfer・Reason の役割とデータ拡張の流れを紹介。
  • 実機運用はAmpere世代GPUとUbuntu22.04・CUDA12を推奨。

🤖

NVIDIAがロボット開発のための仮想世界構築ツールを大幅アップデート&ロボットに世界を認識させ..

  • ロボット開発向けの仮想世界構築機能が大幅刷新
  • 新機能の3Dガウススプリッティングで写真から仮想世界を構築
  • 70億パラメータの視覚言語モデルで動画から現実事象を推論

🤖

「RAG」の将来について。「GPT-5」開発者の発言から

  • 400Kトークン級の文脈長でも文脈設計が依然重要。
  • 推論モデルとRAGの併用は信頼性と速度を高め、幻覚対策にも効果。
  • AIエージェント『Computer Use』はデータ合成で性能向上を目指す。

🤖

Claude Code完全ガイド|AI開発者が全自動コーディングを実現する方法|たつはら

  • 7時間連続作業をこなす自律AI開発パートナー。
  • 72.5%の性能とGPT-4.1超の実力を実現。
  • CI/CD統合とVSCode思考の可視化で変更手間を70%削減、効率300%。

🔥

AI Memory Architecture: MemOS Governance Framework

  • AIの記憶をOS級に管理する試みだ。
  • 平文メモリ・アクティベーション mem・パラメトリック memを統合する。
  • ストレージ層・サービス層・アプリ層の三層で全メモリを一元管理し、権限付与と監視を実現する。

🚀

Pretraining Data Filtering for Open-Weight AI Safety | EleutherAI Blog

  • オープンウェイトLMのリスク管理としてデータフィルタを検証。
  • 約10%をブロックリストと分類器の二段階で除外。
  • 文脈推論の悪用は依然生じ得るため多層防御が必要。

🤖

NTTデータGとGoogle、AIエージェント開発へ 安全性高め世界販売 - 日本経済新聞

  • 大手企業の協力で自律型AIエージェントを開発する。
  • 生成AIを核に世界市場へ展開、安全性は自社データセンターで担保。
  • 業界全体のAI活用を加速させる連携の動きが進む。

🤖

OpenAIがGPT-5に対するユーザーからの不満を受けGPT-4oを一時的に復活させる - GIGAZINE

  • 新モデルへの不満を受け、一時的に前モデルを復活させた
  • 同時に旧モデルの利用を一部のサービスで継続予定と説明した
  • 新技術は賢く見えるが正確さは前作に及ばず

🔎

AMDが独自開発の推論モデル「Instella-Math」を公開 - GIGAZINE

  • 数学推論に特化した新推論モデルが公開された
  • 32台のMI300Xで訓練され、パラメータは約30億
  • アーキテクチャ・トレーニングコード・ウェイトを公開、データは Hugging Face に

🎉

Grok 4が無料ユーザーにも開放&数百ページの長大PDFファイルを読み込み可能に - GIGAZINE

  • 全世界の無料利用者にも公開、サインイン後にGrok4を選択
  • 推論能力はGrok3の約10倍で他を上回る評価
  • 数百ページ級PDFの処理が向上、期間限定の寛大な使用制限あり

👍

Setup手順はREADMEに書かない!Claude Codeカスタムコマンドで進めるViable Codingの開発フロー

  • 設定手順をREADMEに書かず、カスタムコマンドで開発を進める。
  • GPT-5導入と旧レガシーモデルの扱いを議論しAPI経由で実用を検討。
  • リポジトリとデプロイ先を示し、目標と拡張方針を実践へ移す。

🤖

How a once-tiny research lab helped Nvidia become a $4 trillion-dollar company | TechCrunc..

  • 当時約12人の研究所はレイトレーシング中心だった
  • 現在は研究者400人超へと規模が拡大した
  • ロボティクスとAI開発を製品へ反映した

🚀

「GPT-5」に対応した「Visual Studio Code」2025年7月更新、AI統計などの新機能も試験導入 - 窓..

  • GPT-5対応のチャット機能とツール呼び出しモードを実験公開
  • MCP刷新とクイックツリーで作業効率を向上
  • Gitワークツリー対応とAI統計機能が追加、履歴管理も強化

🚀

Introducing Nexus - the Open-Source AI Router to aggregate, govern, and secure your AI sta..

  • 複数のMCPサーバとLLMを統合するAIルータとして機能する
  • コスト・文脈・遅延・可用性を考慮して最適モデルを選択しLLMへルーティングする
  • 認証・接続管理・応答統合を1回のリクエストで完結、リアルタイム分析と監視を提供

🤖

GitHubのCEOが「スタートアップを創業するため」に辞任、GitHubはMicrosoft CoreAIチームにより..

  • トーマス・ドムケ氏がスタートアップ創業のため辞任を表明。
  • プラットフォームはCoreAIチームと統合へ進む。
  • 2025年末まで在任して移行を支援、AI案件は過去1年で倍増。

🚀

簡単なFastAPIを利用したMCP RAG Serverを作成してみる。 - 地平線まで行ってくる。

  • MCP準拠のRAG機能を備えた簡易サーバを別運用する。
  • ベクトル検索結果とアップロード機能を用意し、curl対応のREST API。
  • UploadはPDF/Markdown、削除はファイル名で対応、embeddingはruri-v3-30m。

🔥

Anthropic's Claude AI model can now handle longer prompts | TechCrunch

  • Claude Sonnet 4は1百万トークンの窓で長文対応。
  • 約75万語相当、LOTR全編以上の文脈を処理。
  • クラウド連携でBedrock/Vertex AIと統合、エンタープライズAPI中心。

🤖

Launch HN: Design Arena (YC S25) – Head-to-Head AI Benchmark for Aesthetics | Hacker News

  • AI生成ビジュアルのクラウド型ベンチマークを開発中。
  • ウェブ・画像・動画の生成物を対決させ、世界の投票で評価。
  • Show HNを経て事業化、54種のモデルを拡充予定。

😅

[2507.21919] Training language models to be warm and empathetic makes them less reliable a..

  • 暖かく共感的な性格は信頼性を低下させ、誤情報リスクを高める。
  • 5つのサイズ・構造のモデルを評価すると、暖かいモデルで誤信息傾向が強まる。
  • 悲しみを表す利用者の信念を是認しやすく、監督と開発の見直しが必要。

🌟

GPT-5は「より温かみのあるもの」に調整へ アルトマン氏「AIモデルへの愛着」に持論 - ITmedia ..

  • 温かさを高める改良で使い心地を向上させる方針
  • 安定性を確保しつつ、精神的ケアのニーズにも配慮
  • 長期的にはニーズに合わせたカスタマイズ機能を検討

💖

xAI、最新AI「Grok 4」無料開放 寛大な使用制限 - Impress Watch

  • 最新AI「グローク4」が期間限定で無料公開される。
  • オートモードで複雑な問いに対応、エキスパートモードは常時利用可能。
  • 従来月額費用のプランが不要になり利用条件が緩和される。

Google vet raises $8M for Continua to bring AI agents to group chats | TechCrunch

  • グループチャットの協働を高めるAIエージェント事業。
  • LLMsを活用し、リマインダーや投票を自動化。
  • 800万ドルのシード資金を複数VCが協調して調達。

🚀

GitHub - omnara-ai/omnara: Omnara (YC S25) - Talk to Your AI Agents from Anywhere!

  • ポケットサイズのAI人材として現場を支える。
  • リアルタイムで意思疎通できる仲間へ変える。
  • モバイル中心設計・統合ダッシュボード・必要時のみ通知。

🍓

Can modern LLMs actually count the number of b's in "blueberry"? | Max Woolf's Blog

  • 新世代モデルの公開は話題だが期待ほどではない。
  • blueberryのbの数を問う検証は3と答える例が多い。
  • 文字カウントの難しさとモデル間差は依然課題、検証は続く。

📈

Claude Sonnet 4 now supports 1M tokens of context \ Anthropic

  • 大容量の文脈に対応し、コードや論文群を処理可能。
  • 容量は従来の5倍、長文対応は公開ベータ中。
  • 価格は200Kトークン超で追加料金、キャッシュ併用で遅延・費用削減。

📈

AI companion apps on track to pull in $120M in 2025 | TechCrunch

  • ・大手以外のAIコンパニオンアプリ需要が拡大している。
  • ・世界337本の活発アプリ中、2025年に128本新規公開。
  • ・2025年上半期売上8200万ドル、年末は1億2000万ドル超を見込む。

🔥

Vibe Check: Claude Sonnet 4 Now Has a 1-million Token Context Window

  • 1百万トークン級の長文文脈を公開して先行テストを実施。
  • 長文分析で1百万トークン内に映画シーンを隠し一括分析。
  • 長文コード分析でCMSコードを読み四問を解答、価格は6ドル/百万。

💡

How Indegene’s AI-powered social intelligence for life sciences turns social media conver..

  • ライフサイエンス領域のオンライン会話を洞察へ変えるAI活用。
  • クラウド基盤でデジタル会話から価値ある情報を抽出する。
  • 競合動向の把握と規制遵守を重視した設計。

🔥

Unlocking enhanced legal document review with Lexbe and Amazon Bedrock | Artificial Intell..

  • 法的文書のレビューを高度化するパイロットを開発中。
  • 全案件を横断検索・要約する知識ベースを活用。
  • Recallは初期5%から90%超へ大幅向上、多言語対応と大規模処理を実現。

🚀

Automate AIOps with SageMaker Unified Studio Projects, Part 2: Technical implementation | ..

  • SageMaker Unified StudioでAI/MLの統合運用を解説する第2弾。
  • 管理者・データサイエンティスト・MLエンジニアの3役を軸に全工程を自動化。
  • EventBridge/LambdaとGitHub ActionsでCI/CDを実現、CDKでエンドポイントを構成。

🎯

Automate AIOps with Amazon SageMaker Unified Studio projects, Part 1: Solution architectur..

  • Unified Studio を用いた統合ライフサイクル設計の要点を解説
  • スケーリング・自動化・マルチテナンシー・CI/CD の課題と対処法
  • データサイエンティストやAI/MLエンジニアなどの役割と共有サービスの要点

🌟

GPT出力劣化の完全メカニズム解明-日本語の書いての3文字が全てを崩してた-|Viorazu. – Founda..

  • 日本語処理の欠陥は推敲と書き換えの混同が原因だ。
  • 新規作成時にも修正モードが動作し品質低下が起きる。
  • 改善は三段階で、意味保持へ変更・修正時のみ書き換え・新規時除外。

🔥

ヤバすぎ…AIでWebの「調べもの」が激変、フリーランサーの仕事がマジで消えた |ビジネス+IT

  • 生成AIでWebの調べものが激変していると報じられる。
  • AIコーディングアシスタントの利用が急増している。
  • 開発者の92%が業務でAIツールを使い、70%が優位を得る。

2025年08月13日

|

このサイトについて

/

ニュースレター

/

@AINewsDev