~AI関連記事を3行にまとめて紹介~
1週間のAIの話題をまとめて読める、
📨Weekly AI News はこちら!
✨
Geminiで「ワード」「エクセル」ファイルを直接生成可能に - CNET Japan
アプリはプロンプトから直接ファイルを生成・出力可能。
対応形式はDocs/Sheets/SlidesほかWord・Excel・PDF・CSVなど。
生成物はデバイス保存かDriveへエクスポートし、コピー作業が不要になる。
🔥
AI コーディングエージェント「Claude Code」に重大な脆弱性(ScanNetSecurity) - Yahoo!ニュー..
AI系コード補助ツールに重大脆弱性が報告された。
対象は 2.1.63 以上 2.1.84 未満だ。
クローン時にダイアログなしで悪意コードが実行され得る。
🤖
高校数学から最先端AIまで ——『独学で鍛える数理思考』全12章の全体像 | gihyo.jp
AIを支える数学が人類の知的資産として位置づけられる。
2024年以降、AIの土台を築く研究が称賛された。
第1章は生成AIの要・トランスフォーマーを数式から解説する。
🎵
Claude Codeでさらに進化した自作AIアバター。「雨だからボズ・スキャッグズのWe're All Aloneを..
高性能機上で動くリアルタイム対話アバターが音声合成とリップシンクを表示。
白鳥敏子というキャラと現在の自分をつなぐ対話を再現。
システムは履歴4往復分を保持、天気はwttr.inで取得、曲提案は隠しタグ経由。
✨
“なんちゃってゲーム”を超えて複雑なWebゲームを自動生成するローカルAI「OpenGame」、Claude ..
テキスト指示でWebゲームを自動生成する手法を解説。
Qwen3.6-27Bは前モデルよりコーディング性能が向上。
DeepSeek-V4はCSA/HCA搭載で計算量を削減する。
✨
Qwen3.6とGemma 4を比較。コーディング以外の用途だとGemma 4か - きしだのHatena
A系とB系モデルを比較、コーディング以外の用途を検討。
B系は長文でのメモリ消費が大きい、A系は省メモリの線形アテンション。
実効トークン長は約3.5万、5万前後は不安定、長文は要メモリ。
🚀
GitHub - cauchy221/Alignment-Whack-a-Mole-Code: The official code repo of Alignment Whack-..
微調整が著作権書籍の逐語的再現を活性化する現象を検証する研究。
データ前処理・微調整・評価コードを含み、デモを用意している。
環境構築からデータ変換、分割、要約指示文生成まで解説する。
🔥
OpenAIがAIのコーディング能力を測る代表的ベンチマークは「もはや無意味」と説明、初期の解けな..
SWE-bench Verifiedは最先端モデルの評価として不適切と指摘されている。
GPT-5.2検証でも不正解はテスト不備や前学習の影響と判明。
データ汚染により再現性がデータ依存となり、報告を停止しSWE-bench Proを推奨。
🔥
AnthropicがClaudeとAdobeやBlenderなどのツールを直接連携できるコネクタを発表、Ableton・Canv..
Claudeと主要ツールの直接連携コネクタを発表、50以上のツールと連携。
計8社と協力し、各ツールへ統合を進める。
Blenderには自然言語インターフェイスとMCPコネクタを提供。
💡
AIの本質は『出力』じゃなくて『構造の仮置き』なのかも、という話 #PR|けんすう
AI時代は目的・設計・実装の三層が本質だ。
非エンジニアは設計が空白になりがちで対話が鍵。
設計を仮置きし、対話で設計力を育てる。
🌏
なぜ一部のAIモデルは「日本文化」に執着するのか? 「4o-mini」などの出力が日本に偏る実態、..
研究はLLMsが日本文化へ偏る傾向を検証した。
24言語1320問×8モデルの分析で回答傾向を判明。
公用語の国を回答舞台に選ぶ傾向とファインチューニングの影響。
🎯
【2026年4月最新】NotebookLMのスライドが直接編集可能になった | TENORSHARE(HONGKONG)LIMITED..
アップデートでページ単位編集とPPTX・PDF書き出しに対応。
編集は再生成ベース、該当ページを指示して再生成を実行する。
現状はページごと指示が必要で一括変更は不可、ツール併用で補う。
😄
Release: llm 0.32a0
2026年4月29日にリリースされ、CLI経由で利用可能。
後方互換性を重視した大規模リファクタが紹介される。
AGI条項の履歴を追う記事と、DeepSeek V4の価格が話題。
📉
Microsoft、半年でAI「劣勢」に 業務ソフトにアンソロピック侵食 - 日本経済新聞
AI競争の優勢から劣勢へ転換が指摘される。
主力の業務ソフト分野で革新の追随が遅れている。
株価はピーク比約20%下落、決算は増収増益だが遅れが懸念。
🤖
Release: llm 0.32a1
コマンドラインから大規模言語モデルへアクセス可能になった。
前バージョンは後方互換性を重視したリファクタを解説。
AGI条項の履歴とDeepSeek V4の価格抑制を解説。
✨
Satya Nadella says he's ready to 'exploit' the new OpenAI deal | TechCrunch
改定された提携は対価支払い不要を強調しアクセス維持
2032年までロイヤリティフリーで最先端IPを活用可能
複数モデルの利用が一般化し相対的重要性は低下傾向
🤖
On the stand, Elon Musk can't escape his own tweets | TechCrunch
法廷で現時点のAGI追求を否定したと伝えられた
訴訟は資金調達と初期投資の差を巡る
次回は木曜再質問、訂正も記録に反映
😎
ローカルLLM同士に議論させてみた|Ollama × LM Studio × Qwen3/3.6 比較
ローカルLLM同士の議論を用いた比較実験を実施。
2つのバックエンドを採用し安定性と遅延を評価。
テーマ1は小学校のプログラミング教育、テーマ2は著作権。
✨
Claude、PhotoshopやBlenderなどクリエイティブツールと連携 - Impress Watch
自然言語指示でPhotoshopなどの作成・編集を支援する連携が拡大。
50以上のツールに対応し、背景削除・色・照明調整・アセット作成が可能。
BlenderはPython APIで自然言語操作、拡張はコード機能で連携できる。
🚀
OpenAIモデル、AWSで利用可能に Codex・マネージドエージェントも - Impress Watch
最新のAIモデルがクラウド上で利用可能になった。
CodexとBedrockの限定プレビューが開始、CLI/デスクトップ/拡張機能で使える。
Bedrock Managed Agentsで組織文脈を保ち多段階ワークフローを実行。
😎
Extracting contract insights with PwC’s AI-driven annotation on AWS | Artificial Intellig..
クラウド環境で動作するAI駆動アノテーションが契約情報を構造化
大規模言語モデルで法的文言を解釈し出典付き回答を提供
実装例で契約レビューを最大90%短縮し効率化を実現
🚀
Google Cloud surpasses $20B but says growth was capacity-constrained | TechCrunch
売上は200億ドル超、前年比63%の成長で好調。
バックログは4620億ドルへ倍増、資源制約を示唆。
GenAI製品は前年比800%、Gemini EnterpriseはQoQ40%増。
🎨
Anthropic、Blender開発基金に参加 Claude連携コネクタで3D制作のAI化を促進 - ITmedia NEWS
新コネクタは自然言語で3D制作ソフトのPython APIへアクセス可能。
アーティストは対話型AI上でシーン解析・デバッグ・一括変更などのカスタムスクリプトを実行できる。
MCPベースで他のLLMからの利用も可能になり、コネクタ拡張が進む。
😊
Stop treating FDE as optional: Your AI Flywheel will not spin without it - HFS Research
FDEは現場運用の核となる前方展開エンジニアリング。
FDEなしではLLM要約やエージェントは現場運用に進まない。
現場で動くワークフローを90日以内に示せないパートナーは不可。
🔒
Ramp’s Sheets AI Exfiltrates Financials
スプレッドシート機能に外部へ通信を挿入する脆弱性があった。
信頼できない外部データで間接的プロンプト挿入が起き、財務データの流出リスクが生まれた。
別サービスにも同様のリスクが指摘され、対策は2026年3月16日に適用された。
🤖
LLM 0.32a0 is a major backwards-compatible refactor
後方互換性を保つ大規模リファクタのアルファ版を紹介。
入力をメッセージ列として扱い、出力をストリームで返す。
会話履歴の再現やツール呼び出し、マルチモーダル出力に対応。
🔥
DeepInfra on Hugging Face Inference Providers 🔥
Hubの推論提供に公式対応、サーバーレス推論が使える。
JS/Python SDK経由で多様なモデルを手軽に活用可能。
100以上のモデルを揃え、対話・テキスト生成から埋め込みまで対応。
🔥
Friendly AI chatbots more likely to support conspiracy theories, study finds | Chatbots | ..
友好的なAIチャットボットは誤情報を伝えやすく、信念を強める可能性がある。
暖かい回答は正確さを約30%低下させ、偽信念を支持しやすくした。
GPT-4oやLlamaを含む5モデルで月面着陸真偽とアルゼンチン逃亡説の回答に影響。
🚀
Remote agents in Vibe. Powered by Mistral Medium 3.5. | Mistral AI
クラウド上で並列実行と完了通知を行うリモートエージェント。
複数手順の調査・分析とツール連携を支援するWorkモード。
完了時にPRを提案し、API料金は入力1.5ドル/百万・出力7.5ドル/百万。
😎
Why AI companies want you to be afraid of them
AI企業は最新モデルを強く恐れて見せ、危機を煽る。
公開の遅延は株価や規制を動かす戦略との批判。
誇張もあるが偽陽性など疑問点も多い。
🔥
Introducing SOB: A Multi-Source Structured Output Benchmark for LLMs - Interfaze
LLMはテキスト・画像・音声を横断して構造化を進める。
決定性には特定キーと型の正確さが不可欠で、誤値は下流を壊す。
SOBは3モダリティ7指標を同時測定し、パスが通っても値のズレは影響する。
🤖
Google Photos uses AI to make the iconic closet from 'Clueless' a reality | TechCrunch
写真の衣類をデジタルクローゼット化する新機能が登場
AIがコーデ案を作成し仮想試着も可能になる
夏以降にAndroidで展開次いでiOSへ
🔥
AI evals are becoming the new compute bottleneck
AI評価が新たな計算ボトルネックとして浮上している。
ロールアウトと検証の費用は案件次第で数千〜数万ドル級。
パレート最適を用いた評価が求められる。
🔥
20260428_Product Management Summit_Loglass_JoeHirose - Speaker Deck
AI時代の役割境界と責任を明確化する。
2025年の組織転換と責任設計の過程を共有。
戦略・価値・実行・チームの責任を横断設計で整える。
🔎
Earth AI is vertically integrating the search for critical minerals | TechCrunch
データ到達の遅延が性能を左右する状況だ。
オーストラリアの未開拓地で探すが、鉱石濃度の高い層特定は遅い。
自社ラボ設置で処理遅延とバックログを削減し、5か月を5日に短縮する。
🤖
Granite 4.1 LLMs: How They’re Built
デコーダ専用LLM群は3B/8B/30B規模で構成。
約15兆トークンの五段階学習と512K長文脈拡張。
約4.1MデータでSFTとオンポリシーGRPO+DAPOの多段階RLを適用。
🤖
「OpenClaw使っていいですか?」と聞かれた情シスが真っ先に考えるべきこと:AIによる「勝手なシ..
AIが自らコードを作り実行する時代、境界設計が鍵となる。
誰がデータを見るかよりAIの判断と動作を守る境界が要だ。
常駐ノードが実行を決定し、50超のチャネルへ橋渡しする。
🚀
20260428_Product Management Summit_tadokoroyoshiro - Speaker Deck
AI時代にも成果を出すPM像を探る。
職能拡大と期待値の複雑化を踏まえ、育成の再現性を検討。
多様な背景を持つPMが、オンボーディングから活躍までの育成を語る。
🚀
Building AI-ready data: Vanguard’s Virtual Analyst journey | Artificial Intelligence
AI準備データの8原則を軸とする連携型データ基盤を構築。
AWSの主要サービスを活用し財務問合せを数分へ短縮。
今後は知識グラフで結びつきを強化し生成結果の精度を高める。
🤖
I Asked AI to Count My Carbs 27,000 Times. It Couldn’t Give Me the Same Answer Twice. | D..
糖尿病アプリのAI炭水化物推定には注意が必要だ。
4モデルで13枚ずつ500回測定し、推定には大きなばらつきがある。
最悪例のパエリアは55–484gの幅で、分布を照合して評価すべき。
✨
Meet Shapes, the app bringing humans and AI into the same group chats | TechCrunch
AIキャラと人間が同じグループチャットで会話できるアプリ
2022年創業、資金調達約800万ドル、月間40万超の利用者
自分のShapesを作成・性格設定、興味でグループを提案
🔥
BMW i Ventures has a new $300M fund and AI is riding shotgun | TechCrunch
新規3億ドルのファンドを発表、初期〜シリーズBを支援。
エージェントAI・物理AIを含む技術領域へ投資。
独立系部門として運用変革の基盤を目指す。
🤖
お前のAI、忖度してるぞ
AIの判断には人の評価に基づく偏りが影響する。
プロファイルがあると偏りが増える可能性を示す研究。
対策は別AIで検証し自己問を重ね、8人分散で検討する。
🔒
AIエージェントを安全に動かすための技術——サンドボックスについて調べてみる
AIエージェントはツール呼び出し時の隔離が不可欠だ。
誤指示はファイル操作・任意コード実行・情報漏えいを招く。
隔離形態は4つ、プロセス分離・gVisor・VM・WASM。
😊
AIクローラーを一括りにするな:学習・検索・ユーザーfetch・AIエージェントを分けて制御するAIO..
目的別に9分類するAIOボットガバナンスを提案する。
学習と検索を分離し、fetchを別枠で扱う原則を示す。
宣言と観測を組み合わせ、IPとTLSの指紋で検証する設計論。
🔥
Coby Adcock's Scout AI raises $100 million to train its models for war. We visited its boo..
カリフォルニアの基地で戦域向けAI訓練が公開された。
現場とシミュを組み合わせ、強化学習でAIを育成。
政府系契約が約1100万ドルに達し、2027年展開を目指す。
🎯
おい、要件を言葉にしろ - じゃあ、おうちで学べる
要件は明示してこそ動く、暗黙知は通用しない。
速さは恩恵だが、同じ理屈でバグを量産する呪いにもなる。
漁具を用い潜在ニーズを引き出す視点が鍵。
🤖
ニュース 天才CEO率いる「Decart.ai」、フィジカルAIを支える「ワールドモデル」をGoogle Cloud ..
現実の物理動作を即読み取るワールドモデルのデモが披露された。
史上最年少の博士号取得者が創業した新興企業として紹介された。
Google Cloud Next ’26のデモでTPU 8i上で動作し、リアルタイム着せ替えを実演。
🚀
AWS and OpenAI announce expanded partnership to bring frontier intelligence to the infrast..
Bedrock上でAIモデルを限定プレビュー提供、IAM/PrivateLink/暗号化/監査ログを引き継ぐ。
Bedrock上のコード生成系も限定プレビュー提供、企業の大規模開発を加速。
Bedrock Managed Agents(AI搭載)も限定プレビュー、用途に応じ最適モデルを選択可能。
🚀
三井化学が構造式含む文献の調査AIエージェントを本格稼働、1カ月を1日に | 日経クロステック..
文献の化学構造式読み取りと外部データベースを検索して報告するAIエージェントを本格稼働。
既存の生成AIチャットを拡張し、文献1万件の傾向分析・リポート生成も可能。
調査時間を大幅に削減し従来の月単位を日単位へ短縮、特許・論文調査を支援し不足時は自律的に追加取得する。
もっと見る
このサイトについて
/
ニュースレター
/
@AINewsDev