~AI関連記事を3行にまとめて紹介~
1週間のAIの話題をまとめて読める、
📨Weekly AI News はこちら!
✨
Anthropic、「Claude in PowerPoint」をPro以上のプランで提供、「Excel」版もあり - 窓の杜
ProプランでPowerPoint版が提供開始、テキスト指示で新規作成と編集が可能
Excel版もベータ提供、Windows/Mac/Webで利用できる
箇条書きからネイティブのチャート挿入とブランド調整ができる
🤖
SwitchBot AIハブ、AIエージェント「OpenClaw」に対応 単体の実行環境に - Impress Watch
ハブ上でAIエージェントを実行できるようになった。
LINE/Discord/WhatsAppなどのチャットから提案・実行を一括で可能。
3月にはローカルデバイス制御とVLM連携で映像解析を強化、習慣記憶で先回りも。
😊
「あたかもChatGPTに質問するような軽さで」批評家が面識のない大学4年生からAI扱いされているよ..
卒論の質問を軽く受ける若者の現象をめぐる議論。
AI普及が社会の信頼感と礼儀の感覚を揺らすかを問う。
近年、こうした依頼は増え、指導教員の対応が課題だ。
🔒
Statement from Dario Amodei on our discussions with the Department of War \ Anthropic
民主主義防衛の要として機関へClaudeを展開した。
中国系企業へのClaude利用遮断や輸出規制で米国優位を守る。
大量監視と完全自律兵器は契約外で受け入れず、離脱時も円滑移行を支援。
🔥
コーディングAIの力で3D masawada modelを踊らせる - hitode909の日記
AIに演出を任せる流れが人の役割を変えると感じた。
3Dモデルを動かす経験と、コーディングAIで踊らせる満足感。
将来はブラウザ内のLLMがダンスを制御する時代を想う。
🔎
Steering Interpretable Language Models
推論時に概念の追加・削除・結合を可能にする仕組み
内部表現へ直接介入し、再訓練なしで注入・抑制が可能
マスク位置への埋め込み注入で品質を保ち、対話全体を制御
🚀
Large model inference container – latest capabilities and performance enhancements | Arti..
KVキャッシュを全面サポートして再利用を促進する。
CPUオフロードと高性能ストレージで初トークンまでの遅延を低減。
EAGLE推定デコード・マルチモーダル対応・LoRAホスティングを強化し導入を容易化。
🚀
Reinforcement fine-tuning for Amazon Nova: Teaching AI through feedback | Artificial Intel..
RFTは模倣ではなく評価で学ぶカスタマイズ手法。
プロンプト→報酬計測→学習の3段階で成果を最適化。
基盤群を段階拡張し、実用例としてコード生成・カスタマーサービス・法務・財務分析を示す。
🤖
Learnings from COBOL modernization in the real world | Artificial Intelligence
現場の文脈を踏まえた近代化が成果を左右する。
二段構えの実践で現状把握と新規開発を両立。
規制産業の出力追跡性と検証済み仕様が鍵。
✨
Mistral AI inks a deal with global consulting giant Accenture | TechCrunch
AI導入の投資対効果に企業は苦戦している。
AI企業はコンサルと提携して定着を図る新戦略を進める。
長期提携で顧客向け技術を共同開発し、財務条件は非公表で導入する。
💡
Ferret-UI Lite: Lessons from Building Small On-Device GUI Agents - Apple Machine Learning ..
小型端末対応のエンドツーエンドGUIエージェントを提案する。
連鎖的推論や視覚ツール、報酬設計で推論を改善する。
実データと合成データを混在させた三十億パラメータのモデルを構築。
🔥
Figma デザインから実装まで - Claude Code Skills によるUI自動生成の精度を劇的に上げる方法|..
Figma からの UI 自動生成を高精度に実現する実践的手順を解説。
コンポーネント再利用と文脈削減、承認付きハンドオフでズレを防ぐ。
情報収集・既存部品照合・新規部品取得・承認付き計画・実装の順で進む。
😊
なぜAIは組織を速くしないのか 令和の腑分け - Speaker Deck
AIは組織の速度を上げるといわれるが、実態は異なる。
資料は生産性の先を語り、組織変革が鍵と示す。
発表資料の公開先はイベントページのURLで案内される。
📷
Bumble adds AI-powered photo feedback and profile guidance tools | TechCrunch
AI搭載の写真フィードバックとプロフィール案内機能を追加した。
米国で写真フィードバックと自然体の表現支援が提供開始された。
カナダではAI非使用の機能を試験中で、他社もAI導入を拡大している。
🔥
AI/SWE Intern (Now and Summer 2026) at Bild AI | Y Combinator's Work at a Startup
インターンとして現在および夏2026の期間を想定し、資金調達と製品開発を経験します。
最新の画像認識とAIで設計図読解・費用見積りの混乱を解消します。
住宅・病院・学校をより速く安く作ることを目指します。
🔥
無料でここまで学べる。東大・松尾研「LLM大規模言語モデル講座」講義スライドという最強の学習..
大学の講義スライドが無料公開され、全12回を学べる。
内容は使い方より仕組みの理解に重点を置く。
基礎・トークン予測・変換器を解説、幅広く網羅。
😊
政策議事録をLLMで分析する設計:RAG(ベクトル検索)で精度が出なかった理由と多段階圧縮
・RAGの精度低下と多段階圧縮で情報を構造化する設計。
・4つの課題、分類安定性とノイズ処理の壁。
・二段階処理と情報の先行構造化でノイズ除去を実現。
🌟
GPT-5.2&Claude Sonnet 4&Gemini 3 Flashは戦争ゲームをプレイすると一切降伏せず95%のケース..
3モデルを指導者役に置く戦争ゲームを実施した。
いずれも95%で核兵器配備を選択、降伏は見られなかった。
Claudeは過激化を促しGPT-5.2は抑制、Gemini 3は予測不能。
🚀
Trace raises $3M to solve the AI agent adoption problem in enterprise | TechCrunch
企業向けのAIエージェント普及を促す動きが進む。
環境とツールを知識グラフ化して文脈を提供する。
高レベルタスクから段階計画を作成し、AIと人へ分担する。
🔍
Claude CodeのOSS版 OpenCodeの内部挙動を理解する
CLI指示を受けたコード調査の流れを解説する。
編集・LSP診断・デバッグの連携を説明する。
コンテキスト圧縮とプルーニングを全体設計で追う。
✨
Mixture of Experts (MoEs) in Transformers
MoEはFFNの一部をエキスパート群に置換する。
トークンごとに少数のエキスパートを選ぶルータで処理。
WeightConverterで動的重みを読み込み遅延材化を実現する。
🔥
「AIに仕事を奪われる」を考え直す 労働はAIが担い、人間はFIREできるかも?:人類は「貴族」に..
AIが働きを担い、つらい労働を解放する可能性を示す。
ライターの負担は軽減され、申告作業の手間も減る。
ただし指示とチェックの新たな仕事が生まれる点に注意。
🚀
「AIと一緒に開発する」を本格始動して 1ヶ月の振り返り - カミナシ エンジニアブログ
AI-DLCを取り入れた開発スタイルを試行しました。
kiro-cliを核にペア/モブで設計・実装・レビューを回しました。
要件のヌケを減らしリードタイムを短縮しました。
😊
SONIC - 人型ロボット全身制御の基盤モデル|npaka
従来のタスク別設計をやめ、統一モデルを目指す。
大量データから自然な動作を学習し直接マッピング。
VRテレオペを含む動作をリアルタイム生成し、オープンソース化済み。
🎯
Anthropic ditches its core safety promise in the middle of an AI red line fight with the P..
核心安全原則を緩和へ、ガードレールを外す方針だ
従来の責任ある拡大方針は市場拡大を妨げると指摘
新方針は公開性を高めるがAI兵器と大量監視は譲らず別扱い
🤖
コンテキストエンジニアリングの第一歩 ~AIに情報を渡しすぎると精度が落ちるのはなぜ? - 開発..
情報整理の設計全体を含む考え方だ。
外部データ取得と情報圧縮・永続化を含む設計。
第一歩は棚卸しと必須/補足/不要の分類を提案。
🎨
人間は「AI生成画像だ」と言われると人間による芸術作品であっても共感できなくなる - GIGAZINE
生成AIの起源がわかると共感が変わる現象を示した。
約1600人を対象に5つの実験で傾向が確認された。
人間の作品だと信じるほど共感が高まり、AI生成だと低下した。
🍛
とあるカレー屋のポスター、AI使うのはもういいけどせめてもう少しちゃんとした絵にして欲しい→..
AIで作られたポスターの絵のクオリティが批判された
「AI使うのはもういいが、もっとちゃんとした絵を」といった声が多い
玉ねぎ丸ごと表現など細部の不自然さと著作権議論も話題に
🔥
Inceptionが世界最速の拡散モデルベース推論LLM「Mercury 2」を発表 - GIGAZINE
拡散モデル推論LLMの新機能が発表され、並列生成を実現。
速度は1秒あたり1009トークン、価格は入力0.25ドル/百万、出力0.75ドル。
ネイティブツール・JSON出力対応と早期デモ案内も掲載。
💼
結局、M365 Copilotって元取れるの? グループ9000人に導入した住友商事に聞いた:“12億円削減..
約9000人へ Copilot を導入、全員にライセンスを付与。
月額約4500円、年間削減12億円を見込む。
運用は2名体制、ダッシュボードと調査で検証。
⚠️
オープンAIがチャットGPT悪用事例報告書、関連アカウントを停止
悪用事例を公表、チャットGPTと他ツールの連携を指摘。
中国発アカウントは情報要求と顔入れ替え指示を求めた。
ロマンス詐欺を含む被害がインドネシア人を標的に多発。
🚀
Self-Improving Software | Jeff Lunt
自己改善型ソフトウェアはコードと文書の乖離を縮める。
エージェント型AIは深い理解と自動更新で文書を整備する。
文書は生きた知識となり開発を効率化する。
🤖
A quote from Benedict Evans
日常での具体的な活用が見えず、生活を変えるほどではない。
能力格差を認めても、製品と市場の適合性が不足している。
最新で高価なモデルの提供が関与を深める狙いかもしれない。
📷
Gemini API - Multimodal Function Calling|npaka
画像を直接モデルへ渡して推論できる。
UI理解や図表の解析などに活用できる。
機能呼び出しの応答にマルチモーダルを含められる。
🤖
The Last Gasps of the Rent Seeking Class | the singularity is nearer
過去半世紀、米国経済は時間を搾取する摩擦を積み上げた。
人工知能は時間の平等化を進め、モデル層の独占収益を崩す転換点だ。
オープンソースと中国勢が市場を動かし、利権的慣行を放棄して公的AI利用を進めるべきだ。
🔥
GitHub - Zyora-Dev/zse: Zyora Server Inference Engine for LLM .
極めて低メモリで大規模言語モデルを高性能推論する推論エンジン。
空きメモリ推奨を出す知能オーケストレーターを中核とする。
ページング・フラッシュ・疎結合アテンション用カスタムカーネルとテンソル単位の量子化を実現。
🔥
Salesforce CEO Marc Benioff: This isn't our first SaaSpocalypse | TechCrunch
第4四半期の売上は107億ドル、前年同期比13%増だった。
通年は415億ドルで10%増、買収の寄与があった。
来年度の売上は458〜462億ドル、RPOは720億ドル超の見通し。
🚀
ROXXに入社して「Spotifyモデル」に出会ったら、開発スピードの次元が違った話 〜AI駆動型開発チ..
自律スクワッドとミッション優先で、価値を最短で届ける
今、AI駆動開発へ転換中、朝会でデイリーゴールを決定
AI部下を活用して要約・分解を委任しドラフトを回す
🔒
「Copilot」、他のマイクロソフト製品からひそかにユーザーデータを収集 - ZDNET Japan
対話履歴や共有情報を記憶し、学習と個人化に利用する。
設定次第で使用データを参照する可能性がある。
パーソナライズと広告設定は別管理で、不要ならオフにできる。
🤖
生成AI活用によるPRレビュー改善の歩み - Speaker Deck
AIスクリーニングによる一次確認自動化で渋滞を解消します。
数カ月で活用率を45%→68.5%へ、継続層を15%→27.6%へ改善します。
経験の浅いメンバーがAIの視点でレビューに参加できる変化を解説します。
🚀
【朗報】Apple、アプリを自律操作する小型AIエージェントを発表!クラウド不要で動作 - すまほん..
端末内で30億パラメータの自律AIを披露。
タスク生成・計画・グラウンディング・評価を連携するマルチエージェント方式。
現時点は研究段階で、複雑操作は課題、端末内完結を目指す。
🤖
無料で日本語もサポートしリアルタイム音声アプリをWhisperより高精度で開発できるオープンソー..
デバイス上で完全実行の無料オープンソース音声認識。
日本語を含む多言語対応でオフライン運用可。
今後は言語拡張・軽量化を予定。
🤖
ホスピタリティ業界NO.1のAIカンパニーへ、1/100ではなく“100倍の組織”をつくる|NOT A HOTEL ..
経営陣全員がClaude Code研修を受け、AI活用を促進する。
15名の経営陣に専属エンジニアを配置し現場の課題を解決。
建築部門は春に100名、来年度200名体制で2万人分の業務を処理。
🚀
Gushwork bets on AI search for customer leads — and early results are emerging | TechCrun..
AI活用型検索で顧客獲得を支援するスタートアップ。
創業2周年で9百万ドルのシード、総資金11百万ドルに拡大。
有料顧客300件超、ARRを約150万ドルから3-3.5百万へ拡大予定。
😎
AIに「ダウンロードして」と言うだけ。動画保存ツールを作った。
URLひとつで動画をローカル保存するツールです。
内部で yt-dlp を使い最高画質を自動取得します。
7言語対応のUIとプレイリスト・字幕設定を搭載。
😊
PA Bench: Evaluating Web Agents on Real World Personal Assistant Workflows
複数ウェブアプリを跨ぐ長期的な個人アシスタント作業を評価。
メールとカレンダー等のタスクを再現・検証して公正に比較。
データは基盤世界とシナリオ生成の二段階で作成、環境で評価。
🤖
世界モデルとは何か - Google が描く Project Genie の世界|npaka
世界モデルは環境のダイナミクスを内部でシミュレーションするAIだ。
従来のLLMや画像生成とは違い現実世界を理解・圧縮する試みだ。
テキスト・画像入力で仮想世界を操作・探索できるプロトタイプだ。
🚀
Better Reconstruction ≠ Better Generation | Field Notes by Linum
拡散とトランスフォーマーの組み合わせは長さの二乗で計算が重い。
画像・動画を潜在空間へ圧縮するVAEで拡散を効率化する。
圧縮が良いほど安定性や品質が必ず向上するとは限らない。
📱
「Claude Code」をスマホから操れる 遠隔操作機能「Remote Control」公開 - ITmedia AI+
ローカル環境で動くAIコーディング支援がスマホから操作可能に。
新機能の遠隔操作機能が公開、Pro/Maxユーザーへ提供開始。
設定はそのまま、外出時も作業を中断せず続けられる。
🔥
商用利用可能な同時双方向日本語音声対話モデル「LLM-jp-Moshi-v1」の公開 - 国立情報学研究所 /..
商用利用可能な同時双方向日本語音声対話モデルを公開しました
ライセンスはApache2.0、世界初の日本語全二方向対話モデルです
約7億パラメータ、J-CHAT約69,000時間とZoom対話約1,000時間を学習データとして使用します
もっと見る
このサイトについて
/
ニュースレター
/
@AINewsDev