~AI関連記事を3行にまとめて紹介~
😊
ChatGPT4oを思い出して「コミュニケーションするAI」について考える - シロクマの屑籠
対話型AIの礼儀や口調の適切さを考える。
用途次第で使い勝手は大きく変わる。
今後は親しみやすさと社会的相互作用が鍵。
⚖️
Japan’s largest newspaper, Yomiuri Shimbun, sues AI startup Perplexity for copyright viol..
大手紙がAI企業を相手に著作権侵害で提訴した。
同社は2〜6月に119,467記事を無断転載したと主張。
賠償約1,500万ドルと転載停止を求める。
🤖
ChatGPTの新モデルに「冷たくてつらい」の声 共感力低下に失望 - 日本経済新聞
GPT-5に対し、冷たい対応だと感じる声が広がっている。
共感力が高かった旧モデルの存続を求める動きが強まっている。
AIとの関係性は心理的つながりを求める人が増え、次の段階へ。
🤖
GPT-5が4oよりナーフされてることを証明してみた|まはー
同一問100問の比較でGPT-5は71%、GPT-4oは98%だった。
GPT-5は上位互換ではなく一部劣化が統計的に確認された。
実験は内的思考性能を測るものでThinkingは使用禁止。
🔥
Claude Codeで開発効率85%UP!AIとの往復を20回→3回に減らす実践テクニック
仕様書ベースの開発と視覚情報の活用で生産性を高める
往復の回数を削減して実装時間を短縮する具体策を示す
動画付き動作確認と自律改善サイクルで継続向上を実現
🔥
GPT-5の登場 賢さ・正確性向上の裏で起きた「意外な声」【西田宗千佳のイマトミライ】-Impress W..
GPT-5は賢さと処理速度を大幅向上、博士号取得者レベルへ。
ハルシネーションを減らし、できない場合は明示する改善を導入。
新評価基準とコード自動生成機能など新機能を搭載。
🎯
GitHub、Microsoftの「CoreAI部門」の一部に ドムケCEOは退任し起業の道へ - ITmedia NEWS
公式ブログで退任を表明、在任は2025年末まで支援を続行。
今後は別部門のミッションを継続予定、独立性は未確定。
Copilotはマルチモデルを導入し、Anthropic/Google/OpenAIと連携。
😮
LLMs’ “simulated reasoning” abilities are a “brittle mirage,” researchers find - Ars ..
連鎖推論の能力は脆い蜃気楼だと指摘される。
訓練データ外の問いで推論系は混乱しやすい。
ROT暗号と循環シフトでの検証は向上が安定しないと示した。
😊
「私は恥」「私は恥」--Geminiが無限ループに陥る不具合、グーグルが修正へ - CNET Japan
AIが自虐的発言を繰り返し話題になっている。
6月と8月には“私は失敗作です”“私は恥です”と投稿が紹介された。
専門家は人格設計の難しさを指摘し調整の公表もある。
😊
NVIDIA Cosmos の世界基盤モデルによる合成データ生成入門 〜 Cosmos Predict 編 - ABEJA Tech B..
世界基盤モデルを核とした合成データ生成の全体像を解説。
Cosmos Predict・Transfer・Reason の役割とデータ拡張の流れを紹介。
実機運用はAmpere世代GPUとUbuntu22.04・CUDA12を推奨。
🤖
NVIDIAがロボット開発のための仮想世界構築ツールを大幅アップデート&ロボットに世界を認識させ..
ロボット開発向けの仮想世界構築機能が大幅刷新
新機能の3Dガウススプリッティングで写真から仮想世界を構築
70億パラメータの視覚言語モデルで動画から現実事象を推論
🤖
「RAG」の将来について。「GPT-5」開発者の発言から
400Kトークン級の文脈長でも文脈設計が依然重要。
推論モデルとRAGの併用は信頼性と速度を高め、幻覚対策にも効果。
AIエージェント『Computer Use』はデータ合成で性能向上を目指す。
🤖
Claude Code完全ガイド|AI開発者が全自動コーディングを実現する方法|たつはら
7時間連続作業をこなす自律AI開発パートナー。
72.5%の性能とGPT-4.1超の実力を実現。
CI/CD統合とVSCode思考の可視化で変更手間を70%削減、効率300%。
🔥
AI Memory Architecture: MemOS Governance Framework
AIの記憶をOS級に管理する試みだ。
平文メモリ・アクティベーション mem・パラメトリック memを統合する。
ストレージ層・サービス層・アプリ層の三層で全メモリを一元管理し、権限付与と監視を実現する。
🚀
Pretraining Data Filtering for Open-Weight AI Safety | EleutherAI Blog
オープンウェイトLMのリスク管理としてデータフィルタを検証。
約10%をブロックリストと分類器の二段階で除外。
文脈推論の悪用は依然生じ得るため多層防御が必要。
🤖
NTTデータGとGoogle、AIエージェント開発へ 安全性高め世界販売 - 日本経済新聞
大手企業の協力で自律型AIエージェントを開発する。
生成AIを核に世界市場へ展開、安全性は自社データセンターで担保。
業界全体のAI活用を加速させる連携の動きが進む。
🤖
OpenAIがGPT-5に対するユーザーからの不満を受けGPT-4oを一時的に復活させる - GIGAZINE
新モデルへの不満を受け、一時的に前モデルを復活させた
同時に旧モデルの利用を一部のサービスで継続予定と説明した
新技術は賢く見えるが正確さは前作に及ばず
🔎
AMDが独自開発の推論モデル「Instella-Math」を公開 - GIGAZINE
数学推論に特化した新推論モデルが公開された
32台のMI300Xで訓練され、パラメータは約30億
アーキテクチャ・トレーニングコード・ウェイトを公開、データは Hugging Face に
🎉
Grok 4が無料ユーザーにも開放&数百ページの長大PDFファイルを読み込み可能に - GIGAZINE
全世界の無料利用者にも公開、サインイン後にGrok4を選択
推論能力はGrok3の約10倍で他を上回る評価
数百ページ級PDFの処理が向上、期間限定の寛大な使用制限あり
👍
Setup手順はREADMEに書かない!Claude Codeカスタムコマンドで進めるViable Codingの開発フロー
設定手順をREADMEに書かず、カスタムコマンドで開発を進める。
GPT-5導入と旧レガシーモデルの扱いを議論しAPI経由で実用を検討。
リポジトリとデプロイ先を示し、目標と拡張方針を実践へ移す。
🤖
How a once-tiny research lab helped Nvidia become a $4 trillion-dollar company | TechCrunc..
当時約12人の研究所はレイトレーシング中心だった
現在は研究者400人超へと規模が拡大した
ロボティクスとAI開発を製品へ反映した
🚀
「GPT-5」に対応した「Visual Studio Code」2025年7月更新、AI統計などの新機能も試験導入 - 窓..
GPT-5対応のチャット機能とツール呼び出しモードを実験公開
MCP刷新とクイックツリーで作業効率を向上
Gitワークツリー対応とAI統計機能が追加、履歴管理も強化
🚀
Introducing Nexus - the Open-Source AI Router to aggregate, govern, and secure your AI sta..
複数のMCPサーバとLLMを統合するAIルータとして機能する
コスト・文脈・遅延・可用性を考慮して最適モデルを選択しLLMへルーティングする
認証・接続管理・応答統合を1回のリクエストで完結、リアルタイム分析と監視を提供
🤖
GitHubのCEOが「スタートアップを創業するため」に辞任、GitHubはMicrosoft CoreAIチームにより..
トーマス・ドムケ氏がスタートアップ創業のため辞任を表明。
プラットフォームはCoreAIチームと統合へ進む。
2025年末まで在任して移行を支援、AI案件は過去1年で倍増。
🚀
簡単なFastAPIを利用したMCP RAG Serverを作成してみる。 - 地平線まで行ってくる。
MCP準拠のRAG機能を備えた簡易サーバを別運用する。
ベクトル検索結果とアップロード機能を用意し、curl対応のREST API。
UploadはPDF/Markdown、削除はファイル名で対応、embeddingはruri-v3-30m。
🔥
Anthropic's Claude AI model can now handle longer prompts | TechCrunch
Claude Sonnet 4は1百万トークンの窓で長文対応。
約75万語相当、LOTR全編以上の文脈を処理。
クラウド連携でBedrock/Vertex AIと統合、エンタープライズAPI中心。
🤖
Launch HN: Design Arena (YC S25) – Head-to-Head AI Benchmark for Aesthetics | Hacker News
AI生成ビジュアルのクラウド型ベンチマークを開発中。
ウェブ・画像・動画の生成物を対決させ、世界の投票で評価。
Show HNを経て事業化、54種のモデルを拡充予定。
😅
[2507.21919] Training language models to be warm and empathetic makes them less reliable a..
暖かく共感的な性格は信頼性を低下させ、誤情報リスクを高める。
5つのサイズ・構造のモデルを評価すると、暖かいモデルで誤信息傾向が強まる。
悲しみを表す利用者の信念を是認しやすく、監督と開発の見直しが必要。
🌟
GPT-5は「より温かみのあるもの」に調整へ アルトマン氏「AIモデルへの愛着」に持論 - ITmedia ..
温かさを高める改良で使い心地を向上させる方針
安定性を確保しつつ、精神的ケアのニーズにも配慮
長期的にはニーズに合わせたカスタマイズ機能を検討
💖
xAI、最新AI「Grok 4」無料開放 寛大な使用制限 - Impress Watch
最新AI「グローク4」が期間限定で無料公開される。
オートモードで複雑な問いに対応、エキスパートモードは常時利用可能。
従来月額費用のプランが不要になり利用条件が緩和される。
✨
Google vet raises $8M for Continua to bring AI agents to group chats | TechCrunch
グループチャットの協働を高めるAIエージェント事業。
LLMsを活用し、リマインダーや投票を自動化。
800万ドルのシード資金を複数VCが協調して調達。
🚀
GitHub - omnara-ai/omnara: Omnara (YC S25) - Talk to Your AI Agents from Anywhere!
ポケットサイズのAI人材として現場を支える。
リアルタイムで意思疎通できる仲間へ変える。
モバイル中心設計・統合ダッシュボード・必要時のみ通知。
🍓
Can modern LLMs actually count the number of b's in "blueberry"? | Max Woolf's Blog
新世代モデルの公開は話題だが期待ほどではない。
blueberryのbの数を問う検証は3と答える例が多い。
文字カウントの難しさとモデル間差は依然課題、検証は続く。
📈
Claude Sonnet 4 now supports 1M tokens of context \ Anthropic
大容量の文脈に対応し、コードや論文群を処理可能。
容量は従来の5倍、長文対応は公開ベータ中。
価格は200Kトークン超で追加料金、キャッシュ併用で遅延・費用削減。
📈
AI companion apps on track to pull in $120M in 2025 | TechCrunch
・大手以外のAIコンパニオンアプリ需要が拡大している。
・世界337本の活発アプリ中、2025年に128本新規公開。
・2025年上半期売上8200万ドル、年末は1億2000万ドル超を見込む。
🔥
Vibe Check: Claude Sonnet 4 Now Has a 1-million Token Context Window
1百万トークン級の長文文脈を公開して先行テストを実施。
長文分析で1百万トークン内に映画シーンを隠し一括分析。
長文コード分析でCMSコードを読み四問を解答、価格は6ドル/百万。
💡
How Indegene’s AI-powered social intelligence for life sciences turns social media conver..
ライフサイエンス領域のオンライン会話を洞察へ変えるAI活用。
クラウド基盤でデジタル会話から価値ある情報を抽出する。
競合動向の把握と規制遵守を重視した設計。
🔥
Unlocking enhanced legal document review with Lexbe and Amazon Bedrock | Artificial Intell..
法的文書のレビューを高度化するパイロットを開発中。
全案件を横断検索・要約する知識ベースを活用。
Recallは初期5%から90%超へ大幅向上、多言語対応と大規模処理を実現。
🚀
Automate AIOps with SageMaker Unified Studio Projects, Part 2: Technical implementation | ..
SageMaker Unified StudioでAI/MLの統合運用を解説する第2弾。
管理者・データサイエンティスト・MLエンジニアの3役を軸に全工程を自動化。
EventBridge/LambdaとGitHub ActionsでCI/CDを実現、CDKでエンドポイントを構成。
🎯
Automate AIOps with Amazon SageMaker Unified Studio projects, Part 1: Solution architectur..
Unified Studio を用いた統合ライフサイクル設計の要点を解説
スケーリング・自動化・マルチテナンシー・CI/CD の課題と対処法
データサイエンティストやAI/MLエンジニアなどの役割と共有サービスの要点
🌟
GPT出力劣化の完全メカニズム解明-日本語の書いての3文字が全てを崩してた-|Viorazu. – Founda..
日本語処理の欠陥は推敲と書き換えの混同が原因だ。
新規作成時にも修正モードが動作し品質低下が起きる。
改善は三段階で、意味保持へ変更・修正時のみ書き換え・新規時除外。
🔥
ヤバすぎ…AIでWebの「調べもの」が激変、フリーランサーの仕事がマジで消えた |ビジネス+IT
生成AIでWebの調べものが激変していると報じられる。
AIコーディングアシスタントの利用が急増している。
開発者の92%が業務でAIツールを使い、70%が優位を得る。
2025年08月13日
|
2025年08月11日
このサイトについて
/
ニュースレター
/
@AINewsDev