~AI関連記事を3行にまとめて紹介~
🤖
Apple study shows LLMs can tell what you’re doing from audio data - 9to5Mac
音声と動作データを統合して活動認識の精度向上を示した。
音声をそのまま使わず、音声モデルとIMU予測をLMへ入力。
12種の日常活動をゼロショットで水準以上に分類。
🎯
MCP におけるインタラクティブな UI を標準化する拡張機能 MCP Apps の提案
MCP 拡張として ui:// URI で UI リソースを宣言する設計。
双方向通信は JSON-RPC で実現、サンドボックス化 iframe で実行。
React+Vite で UI を作成、server.ts で MCP サーバーを構築。
🔥
[2511.08923] TiDAR: Think in Diffusion, Talk in Autoregression
拡散と自己回帰を統合するシーケンス型ハイブリッドだ。
思考を草案作成に拡散、対話を最終出力の自己回帰で行う。
1.5Bと8B規模の比較で推測型を上回り、秒間トークンも4.71〜5.91倍向上。
🎯
Detection Transformers: real-time object detection under an Apache 2.0 License
リアルタイム物体検出の要はDETR系の高速性と精度。
従来標準のYOLOは商用で制約あり、DETRはApache-2.0。
不要なNMSを排し、集合予測と自己・クロス注意で関係を把握。
😊
AI駆動開発を実現するためのアーキテクチャと取り組み - Speaker Deck
AI駆動開発の全体像と実践フローを解説する。
人間はドメイン理解を担い、自動化を軸に実装を推進。
静的検査や統合テスト、AIによるコードレビューを具体例で紹介。
🌟
【画像生成AI】帰宅後のOLをリアルに再現する方法⦅プロンプト無料公開⦆Midjourney/imageFX/Cha..
・帰宅後のOLをリアルに描く三段階プロンプト設計。
・玄関で帰宅瞬間、洗面所で着替え、自室で休むを再現。
・ノーフィルター・ノー加工で現実感を強調、要点と川柳付き。
🚀
NanoBanana Pro時代に考える、AIとデザイン事務所のこれから|ひつじ
AI時代に従来の人手依存が崩れ、1人+AI運用が現実味。
多様性の低下や burnout、チームの化学反応薄さが課題。
結局は人とAIの境界と強みを自分の言葉で決めること。
🚀
「Windows AI API」が拡充、「ビデオ超解像」「Stable Diffusion XL」もカバーへ - 窓の杜
新機能としてビデオ超解像とSDXLを追加。
NPU活用でローカル動作、更新経由で必要モデルを自動取得。
VSR・SDXL・アプリ検索機能を提供、動作確認はDev Galleryで行われる。
✨
Googleの画像生成AI「Gemini 3 Pro Image(Nano Banana Pro)」は過去モデルや他社製モデルと比べ..
Nano Banana ProはGemini 3 Proをベースに画像生成と編集が可能。
評価はGenAI Image Editing Showdownで12件中10件が成功と高評価。
茶色キャンディ除去やゴミ除去などの実例が示唆される一方、旧版は一部劣化。
🔎
生成AI経由の流入、「note」強し ゼロクリック問題に一つの解 - 日本経済新聞
生成AI経由の流入が増え、検索は要約優先になる。
ユーザーはAI回答に満足し、従来のクリック導線は減少する。
約250万人の行動ログ活用を前提とした対策がリポートで示された。
😊
AIに仕事を任せようとしたら、自分の仕事を言語化することになった|honeshabri
AIに任せる前に自分の仕事を言語化する学びがあった。
AIエージェントで書類を作ろうとする中、新たな価値として言語化を得た。
目標管理の概念と各社の違いを文章化して伝える必要がある。
🌐
xAIがサウジアラビアで500MW超級データセンターを共同開発へ - GIGAZINE
サウジで500MW超級データセンターを共同開発へ。
政府系ファンドの支援を受け現地と協力。
GPU搭載を想定しAIファクトリー拡張を目指す。
🔍
「Gemini」アプリでGoogleのAI生成画像を見分けられるようになったそうなので実際にやってみた -..
画像へ SynthID を埋める技術が話題になった。
対応アプリは SynthID を検知可能だがAI作成かの断定は難しい。
ダウンロード画像やファイル名で誤判定が起き、検知精度の向上に期待。
🚀
WindowsのAI製品への批判を受けMicrosoftのAI責任者が冷笑系にウンザリ、「超賢いAIに感心しない..
AIに対する批判を受け、AI責任者が冷笑的に反論した。
「超賢いAIに感心しない人がいるとは信じられない」と語った。
ノキア由来の経験を挙げ、AIの能力が評価されないのが信じられないと投稿した。
🔥
AIにAIアピールすることを義務づける法律がカリフォルニア州で成立 - GIGAZINE
カリフォルニア州でAI関連の新法が成立した。
チャットボットはAIであることを明示する義務が課される。
未成年保護対策やディープフェイク対策、年齢認証の強化も盛り込まれた。
🍄
「AIの扱い方の教材」和歌山市の70代男性が毒キノコを食べて食中毒に、AIに食べられるかどうか聞..
AIのキノコ判定は誤判定リスクが高い。
毒キノコで入院例もあり写真だけでは判断不能。
専門知識と現場判断を優先し過信を避けるべき。
🎯
AIエージェントがノード型に配置したタスクを実行して動画を編集するウェブアプリ「Mosaic」 - G..
ノードをつなぐ編集フローを作るキャンバス型アプリ。
指示通り自動編集を実行し、映像と音声を理解。
カット・字幕・Bロールを組み、XML出力で主要ソフトへ対応、A/Bテストも可能。
🎯
Grokはイーロン・マスク大好きでスーパーモデルやプロ選手よりもマスクが優れていると称賛するも..
Grokは創業者を高く評価する姿勢を示す。
大谷翔平には敵わないと語る場面が伝えられている。
マスクは過剰称賛を抑制させたと伝えられ、Grokは必ずしもマスクを選ばない。
💥
事務作業をパートさん、生成AIで代替できる仕事なので契約満了の予定だったが「彼女の仕事は丁..
事務の一部を担うパートさんの契約満了が検討された。
周囲の声を受け、丁寧な仕事はAIには代替不能と評価され雇用継続を決定。
先ほど彼女は生成AIを活用して働いていた。
🔥
「原神」を56分でクリアしたゲームAI「Lumine」、画像に秘密の500文字をこっそり埋め込める「S²..
TiDARとS²LMなどの生成AI技術を解説する。
LumineとDepth Anything 3が3D復元を実演する。
画像長文埋め込みとステガノグラフィーの要点を整理する。
🔥
最新画像生成AI「Nano Banana Pro」は文字ぎっしりの“霞が関パワポ”も作れる? 実際に試した..
新AI画像生成モデルはインフォグラフィック風スライドの再現性が高い。
大きい文字は安定するが、ポンチ絵指示では崩れやすい。
旧モデルより向上し、レイアウトの参考やバナー作成に役立つ。
2025年11月21日
このサイトについて
/
ニュースレター
/
@AINewsDev