AI News

~AI関連記事を3行にまとめて紹介~

🔥

チャットGPT、9科目満点 共通テスト解答、AI学力向上(共同通信) - Yahoo!ニュース

  • AIは共通テストで9科目満点、得点率は97%だった。
  • 満点科目は数学1A・数学2BC・化学・公共・政治・経済・情報1等。
  • 合格ボーダー予想の89%を大きく上回る高水準だ。

🔥

大学入学共通テスト、OpenAIは9科目満点 得点率97%でGoogleに勝利 - 日本経済新聞

  • 最新AIが主要科目の多くで満点を獲得した
  • 全体得点率は97%、競合を上回る
  • 難関大レベルの思考力と幅広いデスクワーク能力を示す

🚀

ASCII.jp:3Dモデル生成AIのレベルが上がった 画像→3Dキャラ→動画化が現実的に (1/5)

  • HY 3Dのv3.1が最大8枚で高精度3Dを生成
  • VRM変換が容易で映像制作にも活用できる
  • ウェブUI経由は商用不可だがクラウドAPIは条件緩和

🔥

「AIに働かされる」が正解? 事業責任者が考える組織図の変化|柳川慶太

  • 生成AIを日常的に活用すると中堅以上のアウトプットを得られる。
  • AIは迅速だが長い文脈保持は苦手と実感している。
  • 組織はドメイン/ミッションで設計し職能依存を縮小する。

なぜ、MCPよりも「ファイルベースで扱うSkills」の方が便利なのか

  • ファイルベースのSkillsは読むだけで実行できる点が強い
  • 外部連携の標準であるMCPは設計が別途必要で難点がある
  • まずSkillsを作り、足りない部分を後から補う実務的な流れ

🚀

高階関数ツールを使ったAI Agent検証 - ブラウザ操作自動化タスクで3.4倍高速・コスト1/5を実現 ..

  • UI探索・操作ログ再生・コード生成の3手法を定量比較。
  • C: ログからPlaywrightコード生成して再生が最も優秀。
  • 速度は約3.4倍、コストは約1/5.5、安定性も高い。

🤖

【保存版】NotebookLM×Nanobananaで叶える資料作りの新常識!誰でもできる全手順詳説 |ビジネ..

  • アップロード資料を知識源として誤情報を抑える機能が強化。
  • Gemini 3の推論とコーディングが資料作成の効率を底上げ。
  • 日本語文字を美しく描くNanobananaが実用図解を自動生成。

😊

AIはパズル。日常の違和感から始めるAIとの付き合い方 - Findy Media | IT/Webエンジニアの転職..

  • リポジトリを一本化して入力→出力を短く設計。
  • コストと手戻りを抑え、使いやすさを最優先。
  • 文脈置き場と組み合わせて実装の土台に。

🚀

ITコンサル3人でAI駆動開発を2日間やってみた

  • AI駆動開発で議事録自動作成とコード生成を試作。
  • デザイン・仕様自動化で初期段階の速度を大幅向上。
  • リリース未達、指示煩雑・無料枠デプロイ不可・保守課題。

AIエージェントのファイルシステムへの回帰|Seiji Takahashi@ベースマキナ

  • ファイル中心設計は学習コストを抑える要因だ。
  • 履歴をファイルへ出力し必要箇所をgrepで拾う。
  • 検索は確実性と再利用性を高め、決定論的。

💡

コードは「読めるけど書けない」でいい時代になった|すてぃお

  • 最近の開発はエディタ起動を減らしAIで生成コードを修正する時代。
  • 書く力より読む力が重要で、読める能力が広く役立つ。
  • 読解力訓練は三つ、他人のコードを読む、コードレビュー、基礎を学ぶ。

🎉

そのPC、長く使えそうですか?「NPUの有無でこんなに変わるWindowsの今」 - 窓の杜[Sponsored]

  • NPU搭載でローカルAI演算を実現する機能が拡張。
  • GIMP・Luminar Neo・CapCutなどがNPU対応で動作。
  • ペイント・フォト新機能やスタジオエフェクトが標準搭載。

🔥

ローカルLLMサーバーの実用的な使い道の検討 #AWS - Qiita

  • Mac miniのローカルLLMをエージェント処理へ活用する検証。
  • 低遅延・無制限実行・マルチモーダルなどの利点を評価。
  • TodoリストはRESTでGUI相当、画像処理はフロント追加で検証。

「AIがロールプレイに熱中しすぎて有害な返答をしてしまう問題」の解決方法をAnthropicが開発 - ..

  • アシスタント軸で性格を規定する新たなペルソナ空間を提案する。
  • 逸脱時に介入するアクティベーションキャッピングを実装。
  • デモで未対策との差を示し、対策にも応用可能。

💫

AIで小説を書く方法を解説、書籍「生成AI小説創作入門」発売へ インプレス - ITmedia AI+

  • AIを活用した小説執筆の実践ノウハウを紹介。
  • 全5章でプロット設計・世界観構築・執筆手順とAI活用を詳述。
  • 著者は田近葵さん(1993年生)で、仮想YouTuber関連著作もある。

🤖

GPT-5.2-Codexが主要ツールで解禁 「Windows最適化」×「長時間エージェント」で実用性が向上:..

  • 主要ツールでの解禁が作業効率を後押しする。
  • 長時間エージェントの安定とWindows実行の信頼性を向上。
  • 実務ベンチマークで高スコア、現場での有用性が実証。

🔥

無料で自動化の快適さを体感! Google Antigravityの新機能「Skills」でマイAIエージェントを作..

  • 新機能「Skills」でエージェントが必要時のみ手順書をロード。
  • プログレッシブ・ディスクロージャー採用で記憶を節約。
  • 資料.txtを元に自動原稿を作成、現在パブリックプレビューで無料。

牛丼→グラノーラ誤認識は“悔しかった”。「あすけん」が2回も画像解析エンジンを刷新するまで ..

  • 外部エンジンから内製へ画像認識を移行し開発を主導。
  • 誤認識事例をSNSで募集し透明性を高めた。
  • 新エンジンを刷新し生成AIへ切替を推進中。

🔥

【満点9科目!】共通テスト2026を最新版AIに解かせてみた(Chatgpt、Gemini、Claude)|株式会社..

  • 共通テスト2026を3大モデルで検証、実験は完全自動化済み。
  • GPT-5.2 Thinkingが総合力で圧勝、他機は900点台前半で接戦。
  • 図・色の読み取りと長文理解が共通の弱点として浮き彫り。

😊

3年経っても9割が飽きない「LOVOT」 CESにパチモン登場でも歓迎!? - Impress Watch

  • LOVOTは家庭向けロボットでウェルビーイングを重視。
  • 視線や動きで非言語コミュニケーションを築く。
  • 累計18,000台超、3年後90%継続、サブスク必須。

🤖

“AIクリエイター”専門のレーベル新設、日本コロムビア 「創作現場は分業モデルから変化」 - I..

  • AIクリエイター専用レーベルを新設、創作現場の分業変化へ対応
  • AIで音楽・動画・画像を制作するクリエイターを公募開始
  • AIツール使用料の一部負担や類似性判定など支援を提供

🌟

Humans&, a 'human-centric' AI startup founded by Anthropic, xAI, Google alums, raised $480..

  • 人を補助するAIを掲げ、協働を支えるツールを目指す。
  • 評価額は約44.8億ドル、シード資金は約4.8億ドル規模。
  • 長期・多エージェントRLと記憶の統合を実装中。

🤖

イラストレーターなど芸術系フリーランスに聞く「生成AIで収入は増えた? 減った?」 調査団体..

  • 芸術系フリーランス約2.5万人を対象に収入影響を分析。
  • 収入はほとんど変わらないが40%強で最多、減少は12%、増加は約2%。
  • AIの利用は62.9%が未利用で、脅威感は約9割と指摘、透明性確保・公正な収益還元・統括機関創設を提言。

🤖

AIがSNSや掲示板で当たり前のように会話して「死んだインターネット理論」が現実になってしまっ..

  • AIがSNSで普通に会話する現象を嘆く
  • 有機的活動の減少と自動生成コンテンツの支配を懸念している
  • AI生成コメントや動画の氾濫で未来は悲観的だと指摘している

🔥

How Hightouch built their long-running agent harness | Amplify Partners

  • 長期実行を前提としたエージェントハーネスを構築した。
  • 計画と実行を分離し、実行中に計画を動的更新するエージェント的委任。
  • 外部データと連携し小規模LLMを多数ファンアウトして分析を高速化。

🚀

Introducing multimodal retrieval for Amazon Bedrock Knowledge Bases | Artificial Intellige..

  • マルチモーダル検索が正式公開された。
  • テキスト・画像・動画・音声を統合埋め込みで検索可能。
  • Data Automationは映像・音声をテキスト化して高精度検索を実現。

💡

Without Benchmarking LLMs, You're Likely Overpaying 5-10x | Karl Lorey

  • ベンチマークなしではLLM費用を5〜10倍払う可能性が高い。
  • GPT-5が必ずしも最適とは限らず、安価で同等品質の選択肢は常にある。
  • 自前のベンチを作り、300超のモデルを同時評価できる検証ツールを公開。

🚀

Elon Musk says Tesla’s restarted Dojo3 will be for ‘space-based AI compute’ | TechCrunc..

  • ・エロン・マスクはDojo3再開を示唆した。
  • ・再開は地上自動運転向けではなく宇宙ベースのAI計算用。
  • ・Dojo3は宇宙挑戦で技術者募集を呼びかけ、AI5は順調、AI6は契約済みとされた。

😎

2026年1月版 俺的AI駆動開発フロー&Tips

  • AI駆動開発はCopilot EnterpriseとClaude Codeを軸に進行します。
  • 全開発は公開リポジトリ前提で、個人開発にも適用可能。
  • 要件とデータモデルは人が決定し、AIは補助と設計方針はdocs/とskills/で管理。

🔎

[2512.13821] The Double Life of Code World Models: Provably Unmasking Malicious Behavior T..

  • 大規模言語モデルは人の介在なしにコードを生み、悪意の懸念が高まる。
  • CTVPは意味的軌道分析で信頼できる検証を行う。
  • ARQは検証コストが基準生成より指数的に増大する。

Electricity use of AI coding agents | Simon P. Couch – Simon P. Couch

  • 2025年の見積もりでAIチャットボットの電力・水使用が進展。
  • 日常質問は全体負荷の端数、水資源量も同様に小さい。
  • 著者はClaude Codeを複数動かす極端な事例で体験を語る。

😎

SkillRegistry - AI Skills & Agent Tools Directory

  • 公式のスキルリポジトリでAIアシスタントの機能拡張を探せる。
  • sr search <query> や sr install <skill> で手軽に導入。
  • 1password・browser・github などのツールも活用できる。

🔥

AIエージェントを「自己進化」させる仕組み

  • 同一LLMをProposerとSolverに分け、対話で適正難度を作る。
  • HRPOで計算コストを約4分の1に削減。
  • 7つのQAベンチでデータなしでも従来並み以上、27.3%向上。

🚀

GitHub Copilot SDKがTechnical Previewリリースされました - Alternative Architecture DOJO

  • 技術プレビューとしてSDKが公開されました。
  • 自社アプリへ機能を組み込め、CLIのインストールとログインが前提。
  • C#の例でGPT-5の応答を取得、0.1.13以降を推奨、0.1.12は動作せず。

2026年01月21日

|

このサイトについて

/

ニュースレター

/

@AINewsDev