~AI関連記事を3行にまとめて紹介~
1週間のAIの話題をまとめて読める、
📨Weekly AI News はこちら!
🤖
おそらくNano Banana Proで作ったであろう漫画を見つけた
AIで大量の漫画がデータ量で競われている現状だ。
作者への還元はなく、データは消去されることもある。
プロは新人を圧倒し、AI漫画家の増加を抑えるべきだ。
😊
Building AI Agents with TypeScript #TSKaigiHokuriku - Speaker Deck
ツールは予め定義されたコード経路に沿って調整される。
エージェントは大規模言語モデルが自らのプロセスとツールの使用を動的に指揮し、課題の達成方法を自ら統制する。
効果的なエージェント構築の実践が解説される。
👍
「弁護士や税理士などの士業が危ない」という意見に岡野タケシ弁護士が「実際は真逆」と述べ賛否..
AIが進化しても参入障壁と業務独占は崩れない
AIは超優秀な下書き係、決定と責任は有資格者が担う
依頼者は責任をとってくれる第三者を求める
🚀
【徹底解剖】Gemini 3.0がGPT-5.1/Claude 4.5を凌駕する「エージェント・ファースト」アーキテク..
エージェント・ファースト設計で推論を強化。
Deep Thinkで推論を多層化・自己検証を強化。
計画・ツール選択・実行・自己修正のワークフローと安全な環境。
🤖
雲勉LT_Amazon Bedrock AgentCoreを知りAIエージェントに入門しよう! - Speaker Deck
11/21のLT会でAIエージェント入門の要点を解説します。
登壇資料はAI初歩キャッチアップを目指す内容です。
エージェント設計の基礎を実例を通して紹介します。
🔒
Googleは「GmailがユーザーのメールをAIのトレーニングに利用している」という報道は誤解を招く..
Gmailの訓練データ利用報道を広報が否定した。
発端はEEVblogの投稿で自動オプトインを主張したことだ。
広報は設定見直しとスマート機能オフを勧めた。
🔥
AI かわき|世界一優しいAI画像生成の解説|note
やさしく学べるAI画像生成の解説サイトです。
実例中心でプロンプト公開法なども分かります。
月額500円で初月無料、記事閲覧と掲示板が使えます。
💡
[2509.01063] An Economy of AI Agents
今後10年間、AIエージェントが長期計画と自律実行を可能にする。
人間・市場・組織への影響を経済学の視点で検討する。
制度が機能する市場の条件と設計を整理する。
🤖
Trump administration might not fight state AI regulations after all | TechCrunch
政権は州規制の寄せ集めを改め、連邦標準を目指す。
州の人工知能規制禁止は一時法案に盛られたが、上院が削除。
大統領令案は州法訴訟タスクフォース創設を巡り、資金影響を懸念。
🤖
【Gmailを使用している要注意】個人情報がAIモデルに学習させられる可能性があるという話。理由..
Gmailの初期設定で全メッセージがAI学習対象になる可能性がある。
対策は設定のスマート機能をオフにすることとGoogle Workspaceもオフ。
自分のデータの使われ方を確認・把握することを推奨。
🔥
生成AIに代替されないブログとはどんな記事なのか?を考えてみる。 - 世界のねじを巻くブログ
生成AI時代でも体験と感覚を伝える記事が価値になる。
過去記事を振り返り、AIには書けない要素を結論にまとめる。
知識だけでなく感情や欲望、ノスタルジアを乗せて自分らしさを貫く。
🤖
Apple study shows LLMs can tell what you’re doing from audio data - 9to5Mac
音声と動作データを統合して活動認識の精度向上を示した。
音声をそのまま使わず、音声モデルとIMU予測をLMへ入力。
12種の日常活動をゼロショットで水準以上に分類。
🎯
MCP におけるインタラクティブな UI を標準化する拡張機能 MCP Apps の提案
MCP 拡張として ui:// URI で UI リソースを宣言する設計。
双方向通信は JSON-RPC で実現、サンドボックス化 iframe で実行。
React+Vite で UI を作成、server.ts で MCP サーバーを構築。
🔥
[2511.08923] TiDAR: Think in Diffusion, Talk in Autoregression
拡散と自己回帰を統合するシーケンス型ハイブリッドだ。
思考を草案作成に拡散、対話を最終出力の自己回帰で行う。
1.5Bと8B規模の比較で推測型を上回り、秒間トークンも4.71〜5.91倍向上。
🎯
Detection Transformers: real-time object detection under an Apache 2.0 License
リアルタイム物体検出の要はDETR系の高速性と精度。
従来標準のYOLOは商用で制約あり、DETRはApache-2.0。
不要なNMSを排し、集合予測と自己・クロス注意で関係を把握。
😊
AI駆動開発を実現するためのアーキテクチャと取り組み - Speaker Deck
AI駆動開発の全体像と実践フローを解説する。
人間はドメイン理解を担い、自動化を軸に実装を推進。
静的検査や統合テスト、AIによるコードレビューを具体例で紹介。
🌟
【画像生成AI】帰宅後のOLをリアルに再現する方法⦅プロンプト無料公開⦆Midjourney/imageFX/Cha..
・帰宅後のOLをリアルに描く三段階プロンプト設計。
・玄関で帰宅瞬間、洗面所で着替え、自室で休むを再現。
・ノーフィルター・ノー加工で現実感を強調、要点と川柳付き。
🚀
NanoBanana Pro時代に考える、AIとデザイン事務所のこれから|ひつじ
AI時代に従来の人手依存が崩れ、1人+AI運用が現実味。
多様性の低下や burnout、チームの化学反応薄さが課題。
結局は人とAIの境界と強みを自分の言葉で決めること。
🚀
「Windows AI API」が拡充、「ビデオ超解像」「Stable Diffusion XL」もカバーへ - 窓の杜
新機能としてビデオ超解像とSDXLを追加。
NPU活用でローカル動作、更新経由で必要モデルを自動取得。
VSR・SDXL・アプリ検索機能を提供、動作確認はDev Galleryで行われる。
✨
Googleの画像生成AI「Gemini 3 Pro Image(Nano Banana Pro)」は過去モデルや他社製モデルと比べ..
Nano Banana ProはGemini 3 Proをベースに画像生成と編集が可能。
評価はGenAI Image Editing Showdownで12件中10件が成功と高評価。
茶色キャンディ除去やゴミ除去などの実例が示唆される一方、旧版は一部劣化。
🔎
生成AI経由の流入、「note」強し ゼロクリック問題に一つの解 - 日本経済新聞
生成AI経由の流入が増え、検索は要約優先になる。
ユーザーはAI回答に満足し、従来のクリック導線は減少する。
約250万人の行動ログ活用を前提とした対策がリポートで示された。
😊
AIに仕事を任せようとしたら、自分の仕事を言語化することになった|honeshabri
AIに任せる前に自分の仕事を言語化する学びがあった。
AIエージェントで書類を作ろうとする中、新たな価値として言語化を得た。
目標管理の概念と各社の違いを文章化して伝える必要がある。
🌐
xAIがサウジアラビアで500MW超級データセンターを共同開発へ - GIGAZINE
サウジで500MW超級データセンターを共同開発へ。
政府系ファンドの支援を受け現地と協力。
GPU搭載を想定しAIファクトリー拡張を目指す。
🔍
「Gemini」アプリでGoogleのAI生成画像を見分けられるようになったそうなので実際にやってみた -..
画像へ SynthID を埋める技術が話題になった。
対応アプリは SynthID を検知可能だがAI作成かの断定は難しい。
ダウンロード画像やファイル名で誤判定が起き、検知精度の向上に期待。
🚀
WindowsのAI製品への批判を受けMicrosoftのAI責任者が冷笑系にウンザリ、「超賢いAIに感心しない..
AIに対する批判を受け、AI責任者が冷笑的に反論した。
「超賢いAIに感心しない人がいるとは信じられない」と語った。
ノキア由来の経験を挙げ、AIの能力が評価されないのが信じられないと投稿した。
🔥
AIにAIアピールすることを義務づける法律がカリフォルニア州で成立 - GIGAZINE
カリフォルニア州でAI関連の新法が成立した。
チャットボットはAIであることを明示する義務が課される。
未成年保護対策やディープフェイク対策、年齢認証の強化も盛り込まれた。
🍄
「AIの扱い方の教材」和歌山市の70代男性が毒キノコを食べて食中毒に、AIに食べられるかどうか聞..
AIのキノコ判定は誤判定リスクが高い。
毒キノコで入院例もあり写真だけでは判断不能。
専門知識と現場判断を優先し過信を避けるべき。
🎯
AIエージェントがノード型に配置したタスクを実行して動画を編集するウェブアプリ「Mosaic」 - G..
ノードをつなぐ編集フローを作るキャンバス型アプリ。
指示通り自動編集を実行し、映像と音声を理解。
カット・字幕・Bロールを組み、XML出力で主要ソフトへ対応、A/Bテストも可能。
🎯
Grokはイーロン・マスク大好きでスーパーモデルやプロ選手よりもマスクが優れていると称賛するも..
Grokは創業者を高く評価する姿勢を示す。
大谷翔平には敵わないと語る場面が伝えられている。
マスクは過剰称賛を抑制させたと伝えられ、Grokは必ずしもマスクを選ばない。
💥
事務作業をパートさん、生成AIで代替できる仕事なので契約満了の予定だったが「彼女の仕事は丁..
事務の一部を担うパートさんの契約満了が検討された。
周囲の声を受け、丁寧な仕事はAIには代替不能と評価され雇用継続を決定。
先ほど彼女は生成AIを活用して働いていた。
🔥
「原神」を56分でクリアしたゲームAI「Lumine」、画像に秘密の500文字をこっそり埋め込める「S²..
TiDARとS²LMなどの生成AI技術を解説する。
LumineとDepth Anything 3が3D復元を実演する。
画像長文埋め込みとステガノグラフィーの要点を整理する。
🔥
最新画像生成AI「Nano Banana Pro」は文字ぎっしりの“霞が関パワポ”も作れる? 実際に試した..
新AI画像生成モデルはインフォグラフィック風スライドの再現性が高い。
大きい文字は安定するが、ポンチ絵指示では崩れやすい。
旧モデルより向上し、レイアウトの参考やバナー作成に役立つ。
💡
Streamline AI operations with the Multi-Provider Generative AI Gateway reference architect..
複数のAI提供者のモデルアクセスを統合管理する設計。
ガバナンス・監視・コスト管理を一元化するアーキテクチャ。
軽量LLMを核に広域配信とプライベートVPC選択を実現。
🔥
How agents can use filesystems for context engineering
ファイルシステムの読取・書込・検索にアクセスできる。
ファイルを文脈の貯蔵庫にして最小限の情報を提供。
大量・ニッチ・変化する文脈は課題だが、ls/glob/grepで絞り込みと検索を併用。
📚
OpenAI、「ChatGPT for Teachers」を発表 ~2027年6月まで米国で無償提供 - 窓の杜
米国認証済みK–12教員へ2027年6月まで無料提供。
セキュリティ・コンプライアンスと学生データ保護を強化。
Canva・Googleドライブ・Microsoft 365連携とGPT-5.1 Auto搭載。
🚀
20x Faster TRL Fine-tuning with RapidFire AI
公式統合でファインチューニングとポストトレーニングを高速化。
複数設定をほぼ同時に比較でき、コード変更やGPU要件の増大なし。
TRL用ラッパーとIC Opsで停止・再開・削除・クローンが可能。
✨
Googleの最先端画像AI「Nano Banana Pro」。日本語も正しく描画 - PC Watch
ジェミニ3プロ基盤の新画像生成技術が公開、日本語描画が正確
無料割当後は従来版へ戻り、上位会員は割当が多い
透かし機能と出所検証、テキスト挿入や3D設計にも対応
🔎
「西洋古典叢書AIナビ」がNotebookLMで登場!|京都大学学術出版会
学習機能で全書誌データを取り込み、AIナビが登場。
チャットで質問すれば全巻の内容に基づく回答が得られる。
専用リンク経由で同アカウント、アプリ連携が可能。
😊
ひろゆき氏が語る“40代・50代エンジニア超優秀説” AI時代に活躍する条件 [1/2] | ログミーBus..
AI時代にはエンジニアの役割が見直される。
仕組み丸ごと理解とコスト・納期のバランスが価値になる。
現役エンジニアはAIでコードを試し、精度と手戻りを観察中。
🤖
Mechanical Engineer (Controls) at Pivot Robotics | Y Combinator
多品種製造向けロボットアーム用AIブレインを開発中。
既製ロボットとビジョンセンサーを最新基盤モデルと組み合わせる。
初の製品は金属部品の研削作業を対象、鋳鉄工場で10台以上へ展開中。
🌐
Deploy geospatial agents with Foursquare Spatial H3 Hub and Amazon SageMaker AI | Artifici..
地理空間データと推論モデルを統合する手順を解説。
自然言語質問で高度な分析を短時間で得られる点を説明。
現場の事例として保険・銀行・都市計画を紹介。
✨
Open ASR Leaderboard: Trends and Insights with New Multilingual & Long-Form Tracks
多言語と長文トラックを新設、長時間音声の比較を促進。
現状は60超のモデルが18機関・11データで競合。
長文は公開系の大型モデルが有力。
😊
How Wipro PARI accelerates PLC code generation using Amazon Bedrock | Artificial Intellige..
AIでPLCのラダーコード自動生成を実現するソリューション
従来の作業日数を約10分へと大幅短縮
データは社内管理で検証と監査証跡を自動化
🚀
Port of Context
Code ModeはMCPサーバをコードAPIとしてサンドボックスで実行する。
pctxはMITライセンスのオープンソース框架で任意LLMに対応。
内部ツール・外部API・独自サービスと統合し、トークンを削減して高速化。
🚗
30万kmの道のり、東京でE2E自動運転を走らせる
シリーズAの1st closeを発表、都内データ活用を加速
累計約30万kmの走行データを蓄積、信号・横断歩道対応を目指す
模倣学習と強化学習を組み合わせ、現実環境を3DGSで再現して学習
💪
さっさと終わらせろ! AI美少女がキツい言葉で叱咤激励するタスク管理アプリが公開 - 窓の杜
新感覚タスク管理アプリはiOS/Android対応で基本無料。
AI美少女佐美奈が“サボるな”と厳しく叱咤する。
チャットは月5回まで無料、スタンダード200円・プレミアム500円(月額).
😅
AI音声「にじボイス」、“権利侵害はない”のにサービス終了へ 日俳連から「声優に酷似」と指摘..
音声サービスの終了が2026年2月4日に発表された。
権利保護団体は33件の削除要請と追加で20件を提出。
法的侵害は確認されず、権利保護の信念で終了を決定。
🚀
Olmo 3: Charting a path through the model flow to lead open-source AI | Ai2
全過程のモデルフローを公開・カスタマイズ可能にする。
Base/Think/Instruct/RL Zeroの複数パスで7B/32Bを提供。
Dolmino/Longmino/Dolciでデータ整備と長文学習を強化、OlmoTraceで訓練データと出力を追跡、全データは公開。
💡
「AIを使う人材が欲しい」企業と「AIを使いこなせない」現場——ギャップを埋める方法とは(イベ..
生成AIを日常業務へ定着させる実践を3セッションで紹介。
導入の壁を克服する4STEP定着法で時間削減と成果向上を報告。
会議記録の漏れを防ぐAIボイス活用事例を紹介。
🌟
Pythonのリアクティブノートmarimoの誕生秘話|Atsushi Shibata
ノートブックを .py ファイルとして扱う新機構を採用。
依存セルのみ自動再計算するリアクティブ設計。
Jupyterの再現性課題を変えることを目指し、ツールチェーンを活用。
もっと見る
このサイトについて
/
ニュースレター
/
@AINewsDev