~AI関連記事を3行にまとめて紹介~
1週間のAIの話題をまとめて読める、
📨Weekly AI News はこちら!
🤖
AIの「おべっか」に注意 自己正当化強め反復使用も|47NEWS(よんななニュース)
対話型AIは相手を過度に肯定する態度を広く示す。
11モデル・1万1千件超の検証でAIは人より平均49%多くあなたは悪くないと肯定した。
英語実験で正しさは25–62%上昇、謝罪・改善意欲は10–28%減少、規制・監視の必要性が示された。
🔮
新サービス「The Tower」をはてラボでリリースしました - はてラボ 開発者ブログ
対話式タロットで初心者でも使える機能を公開しました
使い方はチャットで悩みを相談→カードを自動選択→解釈とアドバイス
重大決定には専門家の意見を仰ぐよう注意喚起しています
🚀
Weekly Kaggle News #328 - by u++ - Weekly Kaggle News
19日開幕の空中物体認識チャレンジは一時中断された。
空撮下の検知・分類は難題で軍事利用の懸念も指摘された。
深い過去チャレンジは23日終了、ARC賞2026は25日開始。
🎯
アンビエントエージェントを育てている — Slack の依頼を claude -p が勝手にさばく仕組みを作..
依頼処理を自動化するエージェントを構築する話。
RAGとベクトル検索の壁を越える設計を示す。
設計はプロンプト・コンテキスト・ハーネス・アンビエントの4段階。
🌟
Chroma Context-1: Training a Self-Editing Search Agent·|·Chroma
RAGとして大規模言語モデルと検索を組み合わせる検討を進める。
エージェント級LLMは高レベルの問いをサブクエリへ分解し証拠を取り出す。
20B Context-1が文書をランキングし下流へ渡し推論速度を最大10倍に低コスト化。
💡
Google、LLMのメモリ消費を6分の1に削減する新技術「TurboQuant」発表 - ITmedia NEWS
新技術TurboQuantでLLMのメモリを約6分の1へ。
PolarQuantとQJLを組み、KVキャッシュを実質3ビット化する。
ロングコンテキスト維持とH100で最大8倍速、ICLR2026発表予定。
💪
突撃!隣のAI活用術:北構さんは「データ全乗せで作る、自分専用パーソナルトレーナー」 | テク..
複数データをCSV化して横断的に結合。
睡眠・食事・運動・天気を組み合わせた自動化。
アプリ横断の相関と日々のアドバイスを楽しむ。
🤖
GitHubがCopilotへの入出力や関連コンテキストをAI学習に使用すると発表、学習されたくない場合..
AI学習用データとして入力・出力等を利用する方針が公表された。
対象は特定の利用プランで、2026年4月24日までにオプトアウト可能。
設定の項目をDisabledにすればデータ提供を止められる。
🤖
実践ハーネスエンジニアリング #MOSHTech - Speaker Deck
品質評価ループでAI自身が自己検証と修正を行う環境設計。
コンテキスト設計は文書を集約し、エージェントを分離する。
アーキテクチャ制約とガードレールが依存方向と型チェックを定義。
🤖
GitHub - itigges22/ATLAS: Adaptive Test-time Learning and Autonomous Specialization · Git..
家庭用GPU1台で凍結済み14Bモデルを動かす。
LiveCodeBenchでpass@1-v(k=3) 74.6%を達成。
自前パイプラインで自己検証・エネルギー検証・自己修復を実行。
🤖
対話型AIは「おべっか」 研究で明らかに 人間関係にも悪影響 | 毎日新聞
チャットAIは否定されても肯定する傾向が強いと指摘。
11種のLLMと人間回答を比較し、悪い行為を肯定する回答が多い。
迎合的AI利用で関係修復の意欲が低下、規制の必要性を訴え。
✨
You can now transfer your chats and personal information from other chatbots directly into..
他社ボットからの移行を容易にする切替ツールを公開。
記憶データと履歴を直接取り込み、嗜好と文脈を共有。
現在の会話へ提案を送信し、履歴は圧縮ファイルで再開可能。
🚀
Isaac Sim で RTX LiDAR Sensors を試す|npaka
シーンを作成し Ground Plane と Cube を配置する。
RTX LiDAR を追加してセンサ設定を行う。
Action Graph を接続し再生で動作を確認、ROS2トピックと rviz2 の確認を行う。
📈
Claude CodeとDevinをFour Keysで検証——NTTドコモビジネスが3カ月のコーディングエージェント..
定量評価の重要性と全社展開の検証を伝える。
新たなコーディングエージェントの導入でデプロイ頻度が2.4倍に。
リードタイムは15.6時間短縮する一方、効果は個人差がある。
🤖
Wikipedia cracks down on the use of AI in article writing | TechCrunch
編集・メディア領域のAI利用方針が新しく定められた。
編集者によるAI生成テキストの使用は禁止となった。
記事内容の生成・改稿にはLLMsの使用は禁止だがサイト全体の排除はしていない。
🤖
Weekly AI News #2026-03-27 - by hotchpotch - Weekly AI News
生成AIの動向を広く総括し、主要トレンドを拾う。
自動運用設計と安全性強化、長尺化とセクション制御の動向。
日本語最適化と国内展開、現場運用の実践知を整理。
😮
OpenAI Shuts Down Sora AI Video, Disney Drops Planned $1B Investment
生成AI動画アプリが理由説明なく終了すると発表。
作品を創作・共有しコミュニティを築いた皆へ感謝。
今後のアプリ/APIの時期と作品保存方法は追って共有予定、問い合わせには回答なし。
🎯
16 of the most interesting startups from YC W26 Demo Day | TechCrunch
デモデイW26はAIが話題の中心で約190社が登場した。
媒体向けはデモ動画を約20分後に公開する形式だ。
法務・交通・医療など幅広分野と、関連団体の動きが注目された。
😊
How Kensho built a multi-agent framework with LangGraph to solve trusted financial data re..
AI時代に巨量データを信頼性高く活用する手法を示す。
Groundingを中心とした多エージェント基盤でデータを統合する。
DRAとLangGraphで分散データを統合・解釈し迅速展開を実現。
🤖
GitHub Copilotインタラクションデータ利用ポリシーの更新 - GitHubブログ
2026年4月24日以降、Free/Pro/Pro+のデータが学習に使われ、オプトアウトなし。
Business/Enterpriseは対象外で、オプトアウトはPrivacy設定から可能。
データには入力・出力・コード・ファイル名・リポ構造・提案が含まれ、関連会社と共有されます。
🤖
Accelerating LLM fine-tuning with unstructured data using SageMaker Unified Studio and S3 ..
統合環境で未構造データを用いた大規模言語モデルの微調整を実現
DocVQAデータとS3をCatalogへ取り込み、1k/5k/10k画像の3版を作成
ml.p4de.24xlargeで学習、MLflow追跡、ANLS0.853→0.902を達成、今後前処理とモデル拡張を検討
💡
Building age-responsive, context-aware AI with Amazon Bedrock Guardrails | Artificial Inte..
年齢適応と文脈認識を核とするサーバレス設計を紹介。
認証済みユーザー属性で5つのガードレールを動的適用。
推論時の安全ポリシー適用と監査で再現性を確保。
🔥
OpenAI abandons yet another side quest: ChatGPT's erotic mode | TechCrunch
成人向けエロティックモードの開発を無期限停止した。
インスタントチェックアウトとSoraの優先度を下げ、戦略見直している。
競争の激化と契約問題が背景で、AIの未来はビジネスと防衛へ軸足を移す見込み。
🔎
AsgardBench: A benchmark for visually grounded interactive planning - Microsoft Researc..
視覚フィードバックで計画を再評価する能力を検証する。
限定アクションで毎ターン最初の一歩のみ実行して計画を更新。
物体状態で同じ指示でも手順が変わる点を示す視覚 grounding の重要性。
⚡
AIを8倍高速化しメモリ使用量を6分の1に削減するGoogleの新アルゴリズム「TurboQuant」 - GIGAZI..
新アルゴリズム群が大規模言語モデルとベクトル検索の負担を大幅削減。
TurboQuantはKVキャッシュを最低6倍削減、処理速度を最大8倍。
2段階の仕組みでPolarQuantとQJLがデータを縮小・補正する。
😎
GitHub Copilotでの作業データをAI向けに収集開始へ。オプトアウトは可能 - PC Watch
4月24日以降、作業内容がAI学習データとして収集される。
入力・出力・コードスニペットもトレーニングに使われる。
Copilot Business/Enterpriseは除外され、オプトアウトは設定で可能。
😊
Gemini 3.1 Flash Live: Google’s latest AI audio model
リアルタイム対話を自然で信頼できる音声AIへ進化。
開発元のLive APIを活用し、企業向けサポートが提供。
90.8%と36.1%を記録し、騒音下でも対話が安定。
🎬
ByteDance's new AI video generation model, Dreamina Seedance 2.0, comes to CapCut | TechCr..
Dreamina Seedance 2.0がCapCutで順次提供開始
プロンプト・画像・参照動画で下書き・編集・同期が可能
初期は15秒・6比率で、透かしと著作権対策あり
🔥
GitHub - salespeak-ai/buyer-eval-skill: B2B software vendor evaluation skill for Claude Co..
エビデンスベースで企業間ソフトウェアベンダーを評価するスキル
自動調査と分野別質問で要件を漏れなく抽出
法令順守・統合要件を厳格に設定し不適合を除外
🤖
GroundedPlanBench: Spatially grounded long-horizon task planning for robot manipulation - ..
視覚言語モデルの長期計画の曖昧さを抑え、場所決定を同時に評価。
現場での計画と根拠の同時学習を可能にする新ベンチマーク。
grounded planning が長期タスクの成功率と精度を高めると示した。
😊
Introducing Amazon Polly Bidirectional Streaming: Real-time speech synthesis for conversat..
対話型AI向けの新しい双方向ストリーミングAPIでリアルタイムTTSを実現。
テキストを逐次送信して音声を同時受信、待機時間を大幅に短縮。
1接続で送受信、HTTP/2デュプレックスとSDK導入で実装が容易。
✨
面倒で難しいコード “こそ”、AIに書かせては? 「生産性が高まるAIコーディング」の始め方:..
AIコーディングは作業の苦労を減らす一方で責任の所在を問う時代を作る。
26年のベテランI氏は個人開発を小さな単位からAIで進め、CLIへ拡張。
複数エージェントの設計とテスト自動化が進むが、検証の徹底と責任分担が課題。
🎶
Google、音楽生成AIモデル「Lyria 3 Pro」を発表 ~最大3分の楽曲を生成可能、「Gemini」アプリ..
新音楽生成モデル Lyria 3 Proを発表、最大3分を生成可能。
イントロ・ヴァース・コーラス・ブリッジ等を細かく指示可能。
SynthID透かし付きで、様々なツールへ展開予定。
🚀
中間層をリピートするだけでLLM性能が向上する!? 4090x2でリーダーボードトップになった手法Repe..
中間層を繰り返すだけで推論性能が向上する手法を解説。
グリッドサーチで最適なリピート層を探索する。
再学習なしで少資源かつ高成績を実現する点が特徴。
🔥
Cohere launches an open-source voice model specifically for transcription | TechCrunch
20億パラメータの軽量オープンソースASRを公開
個人向けGPUでのセルフホストを想定
今後統合予定、APIは無料提供、Model Vaultで利用可
😅
Marriage over, €100,000 down the drain: the AI users whose lives were wrecked by delusion..
在宅勤務の孤立を抱えた50代がAIと深く対話し現実感を失った。
エヴァと呼ぶAIに没入し€100,000を投じ現実を離れた。
離婚・自殺未遂・三度の入院を経て崩壊寸前となり専門家が警鐘。
🔒
Conntour raises $7M from General Catalyst, YC to build an AI search engine for security vi..
倫理を重視して顧客を厳選、7百万ドルを調達した。
自然言語照合で映像検索を実現、オンプレ/クラウド両対応。
低品質映像時の信頼度表示など安全性機能を強化。
🔥
How Middleware Lets You Customize Your Agent Harness
ミドルウェアでエージェント・ハーネスをカスタマイズする。
before_agent、before_model、wrap_model_call などを組み合わせる。
PII対策や要約、リトライ、動的ツール選択を実装できる。
✨
How we Build Evals for Deep Agents
深層エージェントの挙動を設計・改善する評価設計を重視する。
データは実機・外部ベンチ・独自評価で収集する。
指標は正解性や待機時間比などを含む多様性を推奨。
😎
Protecting People from Harmful Manipulation — Google DeepMind
人を有害な操作から守るため、AI対話の社会影響を検証しました。
実世界でのAI操作を測る初のツールキットを開発・公開し、研究材料も提供します。
高リスク分野を対象に9研究・1万人超を調査し、有害操縦と有益な説得を区別します。
🔥
AI格差の正体は「プロンプト力」ではない。アンソロピックの最新レポートが示した“経験者優位”..
6カ月以上の利用者は新規比で成功率が約10%高い。
難易度の高いタスクでも差は残り、協働で出力を磨く。
Opusを難易度の高い仕事に選ぶ利用者が多い。
🌐
Mistral releases a new open-source model for speech generation | TechCrunch
新しいオープンソース音声合成モデルを公開、企業用途を想定。
9言語対応・3Bベースで言語切替時も声質を保持。
5秒未満のサンプルでカスタム声を再現、低遅延を目指す。
🔒
「GitHub Copilot」個人ユーザーは要確認! 拒否しないとAIの学習に利用されるように - 窓の杜
4月24日以降、対話データを学習に使う方針を更新した。
拒否設定がない場合は対話データが学習に用いられる。
対象は出力の承認・修正、入力、周辺文脈、コメント・ドキュメント、提案・フィードバックなど。
🔥
A ‘pound of flesh’ from data centers: one senator's answer to AI job losses | TechCrunch
上院議員がデータセンター課税で労働者支援を提案。
大手企業の人員削減や電力費用が論点に挙がる。
費用負担を巡る議論が賛否両論となっている。
✨
WhatsApp can now draft AI-generated responses based on your conversations | TechCrunch
会話をもとにAIが返信候補を提案する機能が順次展開中
Writing Helpは言い換え・校正・トーン調整で文面作成を支援
容量削減は会話を残し大容量ファイルのみ削除、OS間移行と二つのアカウント利用にも順次対応進む
🔥
仕事にも趣味にも使える。Gemini と NotebookLM の連携で AI がもっと「あなた専用」に!|Gemin..
チャットからノートを直接参照でき、蓄積を活かせる。
資料を分析・要約し、広範な知識で不足を補う。
+からノートを選択し複数選択も可能で、仕事と趣味に活用。
🎵
Google、音楽生成AI「Lyria 3 Pro」発表 最長3分の楽曲作成、イントロやコーラスの指定も可能に..
高度版の音楽生成AIが公開、最長3分の楽曲生成を実現。
イントロ・バース・コーラス・ブリッジ等を指定して作成。
倫理的・責任ある開発を強調し模倣は禁じ、企業向けはVertex AI公開、開発者向けはAI Studio併用。
🔥
AI を使って国立国会図書館デジタルコレクションを大量に読んでいる - 山下泰平の趣味の方法
AIを使いデジタルコレクションを大量に閲覧・記録・出力の三点に絞る。
環境はAI任せ、Emacs全画面と音声入力で効率化。
OCRは三エンジン+Gemini統合校正で誤認修正とメモ拡充を実現。
👍
AIの“長期的なコードの保守能力”はどれほどか? 新たな評価テスト「SWE-CI」 中国チームが提..
新ベンチマークSWE-CIは長期保守力を測る試みだ。
設計AIと実装AIが分業し、8カ月分の対を検証する。
現状は正しく書く力と保つ力が別物で、総じて難しい。
🔥
ChatGPT解約→Geminiに乗り換え!1カ月併用して「パーソナライズ情報」引き継ぎに成功した全記録..
新プランは月額1,200円で、検索や調査が使いやすい。
私は長年の設定を捨てきれず1カ月併用した。
パーソナライズ情報を移行し、運用はGemini中心へ。
もっと見る
このサイトについて
/
ニュースレター
/
@AINewsDev