AI News

~AI関連記事を3行にまとめて紹介~

Cover Image
1週間のAIの話題をまとめて読める、📨Weekly AI News はこちら!

🚀

人工知能に空間&時間の4次元認識能力を与えるためのAI「D4RT」をGoogleが発表、「人間と同じよ..

  • 4次元の空間と時間を同時に捉える新設計AIが発表された。
  • 単一モデルで高精度かつ高速化を実現し、複数AIの連携を減らす。
  • 1分の動画を約5秒で処理し、従来比120倍の高速化を達成。

🌐

Who's behind AMI Labs, Yann LeCun's ‘world model’ startup | TechCrunch

  • 現実世界を理解するワールドモデルの開発を正式発表した組織だ
  • CEOはAlex LeBrun、LeCunは執行会長として関与している
  • 本社はパリ、拠点はモントリオール・NY・シンガポールだ

【Google Antigravity】新機能「Skills」について

  • 特定タスクを必要時だけ自律実行する再利用パッケージ。
  • SKILL.md、scripts、resources、examples を組み合わせ、.agent/skills/ に置くと活用。
  • 利点はコンテキスト節約と厳密処理の分業、Gitでの共有。

🚀

Linuxの創始者トーバルズ氏が語る、AIや開発の“これから”を3分でまとめ(TechTargetジャパン)..

  • オープンソースの創始者がAIと開発の未来を語る。
  • 実運用には人の品質管理が必須だと強調。
  • OS/クラウド/API/ハード統合と新技術の普及が進む。

🎧

Ask HN: What's the current best local/open speech-to-speech setup? | Hacker News

  • 完全ローカルで低遅延の音声アシスタントの実現を模索する。
  • リアルタイム音声対音声の実現例と手順を探している。
  • オープンなローカル音声の動向を2026年まで比べたい。

🎬

varg/sdk — declarative video rendering for AI agents | varg/✦

  • 宣言的APIで動画の設計を手軽に行える。
  • JSX風の構造で要素を再利用し、複合パイプラインを作れる。
  • エラーは実行時に分かりやすく、キャッシュで再起動後も同じ結果を維持できる。

🔥

Introducing Waypoint-1: Real-time interactive video diffusion from Overworld

  • リアルタイム対話型のビデオ拡散モデルを体験可能。
  • テキスト・マウス・キーボードで操作し世界を生成。
  • 低遅延・高スループットを実現する推論技術が核。

🔒

Meta pauses teen access to AI characters ahead of new version | TechCrunch

  • 未成年者向けAIキャラクターの利用を全アプリで停止。
  • 保護者監視機能を強化し、話題監視や特定キャラのブロックを実装。
  • 新キャラは成人にも解禁、年齢に応じた話題対応を提供。

🤖

How the Amazon.com Catalog Team built self-learning generative AI at scale with Amazon Bed..

  • 大規模な自己学習型生成AIを複数モデルで実装。
  • 意見が一致すれば高精度、異議はエージェントが介入。
  • コストを抑えつつ精度を向上させ、学習と導入の2戦略を提案。

🚀

Build AI agents with Amazon Bedrock AgentCore using AWS CloudFormation | Artificial Intell..

  • AIエージェントをIaC化する手順を解説。
  • 自動化で環境間の一貫性と信頼性を高め、デプロイを短縮。
  • 観測性・最小権限・CI/CD・StackSetsのベストプラクティスを紹介。

🎯

Meta pauses teen access to AI characters as it develops a specially tailored version | Tec..

  • 同社はティーン向けAIキャラの提供を一時停止した。
  • 親向け機能として暴力・露骨な表現・薬物描写を制限する。
  • 今後は年齢認識技術で年齢判定し、適切な回答を提供する。

🎯

100万点のデータポイントがあってもスムーズなパンズームが可能なオープンソースのWebGPUベース..

  • ChartGPUは1百万点級データでも滑らかにパン可能。
  • 折れ線・面・棒・散布・円・ローソク足をGPU描画。
  • Chrome/Edge/Safari対応、Firefoxは未対応、60fps実証。

📈

統計モデリング大全 目次 #Python - Qiita

  • 実務で使える統計モデリングの手法とユースケースを解説。
  • 基礎から分布・回帰・時系列・ベイズ・階層を網羅します。
  • Python実装とサンプルコードで実務適用をサポートします。

💡

SUPERや60は出なかったが、ソフトの力でこれだけスゴくなったGeForce RTX - PC Watch

  • CES 2026で新製品は出ず、ソフトの力で性能向上。
  • 第2世代TransformerでFP8高速化を実現。
  • 春以降、全RTXへ機能拡張を予定、AIは1.3–1.4倍を示唆。

🤖

「技術がAIに追い抜かれた日」LINEヤフー研究所・岩崎が語る、AI時代の研究者の生き方とは?|LI..

  • AIは協力者と捉え、指示の磨きに注力する。
  • 皇居での拝謁儀式の光と緊張を振り返る。
  • 上位設計へ進む道をAIと共に切り拓く。

🐎

AI is a horse - Kevin Conner

  • AIは地形で速さが変わる馬のようだ。
  • 餌を多く食べ、店へ勝手には連れていけない。
  • どの角へ向かうかは指示が要る。

🚀

Geminiではまだ広告が意味を成さない理由をグーグル幹部が説明…「AIによる概要」「AIモード」で..

  • AIによる概要とAIモードの広告導入を優先している
  • 広告はAI検索内で自動表示され、個別枠の購入は不可
  • 検索以外のAIアシスタントとして表示条件と正確性を検討中

🔍

Grokの性的画像問題、11日間で約300万枚生成か。1分あたり190枚ペース、約2.3万枚は児童含む | ..

  • 11日間で約300万枚の性的画像を生成したと報告される
  • 全世界約460万枚のサンプルから約2万枚が性画像と判定された
  • 編集機能を有料利用者に限定し、実在人物の脱衣機能を制限した

🚀

GitHub 29,000+ Star獲得!Claude Codeに「ベテランエンジニア」の思考を注入するSuperpowersプ..

  • ブレインストーミングで要件を深掘り設計方針を作成。
  • Writing Plansで自動の実装計画を作成し開発を効率化。
  • TDDとサブエージェント開発で品質を保証し手戻りを削減。

ローカルAIアプリのOllamaが画像生成に対応、まずは「FLUX.2 [klein]」と「Z-Image-Turbo」から ..

  • ローカルAIアプリの新機能として画像生成を実験的に追加。
  • macOS版でFLUX.2 [klein]とZ-Image-Turboを用いた生成を実現。
  • 将来的にWindows/Linux対応と画像編集機能の検討も進む。

🎤

日本語を含む10言語に対応した音声生成モデル「Qwen3-TTS」ファミリーがオープンソース化 - GIGA..

  • 新しい音声生成モデルをオープンソース化。
  • Flow-matchingで滑らかな音声を実現し、同一モデルで双方向処理が可能。
  • 遅延97msと1.7B/0.6Bモデル、12Hzトークナイザーを公開。

🤖

GitHub - malvarezcastillo/txt2plotter

  • テキストプロンプトをAI生成と中心線ベクトル化でSVGへ変換。
  • 寸法指定可能なSVGを出力し、output/プロンプト名/へ保存。
  • 実行環境はPython3.10以上・CUDA12系・NVIDIA 24GB VRAM前提で案内。

🔥

NVIDIA PersonaPlex: Natural Conversational AI With Any Role and Voice - NVIDIA ADLR

  • 音声とテキストプロンプトで任意の声や役割を設定可能。
  • 同時聴取と発話で自然なリズムとバックチャネルを実現。
  • ペルソナを維持し多様な声を選択、遅延や固定声の制約を超える。

😊

Why talking to LLMs has improved my thinking – Vallified

  • 言語化で暗黙知の誤りや兆候を検証できる。
  • 書くことで直感が整い、仮説を検証しやすくなる。
  • 反復で思考と言語の連携が深まり、質が高まる。

💁‍♀️

深層学習禁止令: 上司に「破滅するぞ」と止められた話|shi3z

  • 十年前、有名企業は深層学習を破滅と警告した。
  • GPUを自前で組み趣味の画像データを分類して実験。
  • 文字認識を16時間で完成させた話。

🚀

Agentic Coding Workshops-20260121 - Speaker Deck

  • 実世界向けエージェントには特定のスキルが求められる。
  • メタデータで選んだ技能を使い本文を読み、必要時に参照文献を動的に読み込む。
  • AIによる仕様主導開発は生きた成果物として進化する。

🔥

生成AIで強化するSEO戦略 - O'Reilly Japan

  • 生成AI時代のSEO本質と実践を解説する一冊。
  • AI技術が検索体験とコンテンツ制作に与える影響を整理。
  • 品質・効率・コスト改善の具体策を示す実践書。

🤖

AI無断学習は「窃盗」──スカーレット・ヨハンソンら800人が「盗みはイノベーションではない」..

  • 著名クリエイターらがAIによる肖像や作品の無許可利用を非難した。
  • 彼らは盗みは革新ではなく窃盗だと主張し、透明性を求めた。
  • 全面広告でAI利用の透明性と同意を訴えた。

🎉

エンジニアじゃない人でもAIを使えば開発貢献できるんじゃないの?イベントを開催してみた - カ..

  • 月1回のオフサイトで非エンジニアとエンジニアがAI機能開発を体験
  • 目的はPM/PDのPR力向上とAI活用文化の定着、将来機能の解像度を高める
  • ルールはエンジニアはコード不可、質問OK、優勝は面倒さ解決チームで好評

🎵

5秒の声から良質ボイスクローンを生成できるCPU動作の軽量ローカルAI「Pocket TTS」、AIにゲーム..

  • CPU動作の軽量ローカルAIで5秒音声から話者を再現。
  • 地理推定AIで撮影場所を特定する技術を紹介。
  • 非形式的学習で汎用能力を高める研究とエングラム設計。

🚗

Weekly Kaggle News #319 - by u++ - Weekly Kaggle News

  • 予測コンテストの最終結果が1月16日に公開された。
  • 走行中の車載カメラ画像から緯度経度を推定する課題が16〜25日開催中。
  • 初心者講座の開催と解法紹介、空戦AI系イベントの振り返りを掲載。

🎬

Remotion Skillを活用して、Claude Codeで動画を生成する方法|Dify Base

  • Remotion Skillを使い、Claude Codeで動画作成を自動化する方法を解説。
  • データ駆動と再利用可能なコンポーネントでプレビューを提供。
  • Claude Codeが29種のベストプラクティスを活用してコードを生成。

Weekly AI News #2026-01-23 - by hotchpotch - Weekly AI News

  • ・Gemma3を翻訳特化化したTranslateGemmaを公開、3サイズで訓練55言語。
  • ・12Bは効率面で有利、二段階調整とマルチモーダル継承で誤差低下。
  • ・翻訳系ツールのTranslate公開と広告実験、規制論点も議論。

🚀

OpenAI is coming for those sweet enterprise dollars in 2026 | TechCrunch

  • 経営陣を再編し、企業向けAI販売を強化する方針を示した。
  • 元研究機関出身の人物が推論VPに就任した。
  • 2023年の展開以降、市場シェアは50%から27%へ低下し、2026年は提携拡大を進める。

😎

無感情アンドロイドという思想|饗庭淵

  • 無感情アンドロイドの思想と探究の全体像を示す。
  • 無感情性の理由と現実的・技術的視点を考察する。
  • 結局はフィクションとして無感情アンドロイドを求める。

🚀

KDDI大阪堺データセンターが稼働  シャープ堺工場跡地を再活用 - Impress Watch

  • 大阪堺データセンターが本格稼働を開始した。
  • 地上4階・延床約57,000㎡、100%再生エネルギーを採用、直接液冷を導入。
  • 医療データの国内留保と領域別AI開発を推進。

📷

ChatGPTの“本音”が分かる? 「私があなたをどう扱ってきたか画像にして」と指示する遊びが流..

  • 『私がどう扱われたかを画像にして』と指示する遊びが広がっている。
  • Xやインスタグラムで広がり、複数のAI系プラットフォームも試されている。
  • 出力は指示と履歴機能で変化し、ジブリ風化やペットの擬人化が話題。

🚀

Anthropic Economic Index report: Economic primitives \ Anthropic

  • 新指標の導入を報告する。
  • 2025年11月時点の利用を5次元で定量化する。
  • 地域差が大きく、コード中心の実務が目立つ。

🚀

Inference startup Inferact lands $150M to commercialize vLLM | TechCrunch

  • 推論系スタートアップが新資金調達を発表。
  • シード1.5億ドル評価額8億ドルで調達。
  • オープンソースのvLLM創設者らが同社へ移籍。

🔥

Voice AI engine and OpenAI partner LiveKit hits $1B valuation | TechCrunch

  • ・評価額10億ドルで資金調達1億ドルを発表。
  • ・オープンソース発の基盤を企業向けクラウドへ拡大。
  • ・主要顧客に緊急通報機関やメンタルヘルス機関が含まれる。

🤖

SCSK系「AIネーティブ開発」の品質管理サービス 利用拡大に対応 - 日本経済新聞

  • AIネイティブ開発の普及に合わせ品質管理を強化。
  • 要件定義やコードをAIが正しく生成する仕組みを整備。
  • 品質管理の自動化と支援で開発効率を高める。

🔥

KDDIの「大阪堺データセンター」稼働開始、1年足らずでシャープ跡地を“居抜き”できた理由とは ..

  • 大阪堺データセンターが稼働開始、居抜きで開設
  • GPUクラウドでAI処理を提供、冷却は既存設備活用
  • NVIDIA系学習性能向上、ジェミニを国内拠点で提供

🔥

Are AI agents ready for the workplace? A new benchmark raises doubts. | TechCrunch

  • 現場実務を模した新基準が提唱されている。
  • 現時点で全AIラボは不合格と評価されている。
  • 最良モデルでも正答は四分の一以下で誤答が多い。

🤖

Humans& thinks coordination is the next frontier for AI, and they're building a model to p..

  • 協調をAIの新たな課題と捉え社会知性向け基盤を設計。
  • 多エージェント連携を中枢神経系へと結ぶ仕組みを追求。
  • 長期記憶と分散強化学習で協働を最適化し独立志向。

🤖

Google DeepMind CEO is 'surprised' OpenAI is rushing forward with ads in ChatGPT | TechCru..

  • 広告を導入する動きに驚きを示した。
  • 収益化は慎重に検討、現時点で広告導入はなしと説明。
  • 広告が対話の信頼性へ影響する点を懸念している。

📚

Google now offers free SAT practice exams, powered by Gemini | TechCrunch

  • AI活用の無料SAT練習問題が提供される
  • 練習は入力に応じて出題され、結果を分析する
  • 平等な機会を目指す一方、AI依存の懸念と教員向け機能展開も議論される

🌟

GitHub Copilotを使いこなすための概念整理

  • 文脈を適切に与えることが補完精度の鍵である
  • インライン補完と編集提案で精度を高める
  • 4モードの意味を理解し用途に応じて使い分ける

🚀

How CLICKFORCE accelerates data-driven advertising with Amazon Bedrock Agents | Artificial..

  • 台湾のデジタル広告大手がLumosでデータ駆動を推進
  • Bedrock Agents・SageMaker・OpenSearch・Glueで分析を自動化、1時間へ短縮
  • 知識ベースとText-to-SQLで実データを取得、MLflowで検証を最適化、コスト削減47%

🚀

How PDI built an enterprise-grade RAG system for AI applications with AWS | Artificial Int..

  • AWS上にエンタープライズ向けRAGシステムを構築。
  • HTMLをMarkdown化・画像にキャプション付与・文書をチャンク化・要約・ベクトル化を実行。
  • Aurora PostgreSQLへ格納、サーバーレス運用とゼロトラストRBACで権限管理。

🔥

GPTZero finds 100 new hallucinations in NeurIPS 2025 accepted papers

  • 公開リストは幻覚の偽情報が混在する事例集だ。
  • 著者名・タイトル・DOIの不一致が多いと指摘される。
  • 信頼性検証の課題を浮き彫りにする内容だ。

もっと見る
このサイトについて

/

ニュースレター

/

@AINewsDev