AI News

~AI関連記事を3行にまとめて紹介~

Cover Image
1週間のAIの話題をまとめて読める、📨Weekly AI News はこちら!

🔥

5060/5090 日本語ローカルLLM要約ベンチマーク(2026/4/1)|shi3z

  • 現行のRTX5090(32GB)またはRTX5060(8GB)で要約ベンチ結果を示す。
  • 7000字原稿を約200字へ要約させ、定性的に評価が行われた。
  • 評価軸はROUGE-L・速度・サイズ・長所短所で、最適はqwen3:8b。

🔎

流出したコードからClaude Codeの仕組みをすべて解析し知られざる機能を見やすくまとめた「Claud..

  • 未公開機能をソースから直接マッピングした解析報告。
  • エージェントループの自律動作サイクルを視覚解説。
  • 可視化ツールで51万2000行超のコード全貌を案内。

🚀

Lemonade: Local AI for Text, Images, and Speech

  • GPU/NPU対応の軽快なローカルAIでプライバシーを守る。
  • 1分インストール・2MBのネイティブC++バックエンドで迅速起動。
  • GUIでモデル切替、複数エンジンと同時実行で柔軟対応。

🚀

Rocket Close transforms mortgage document processing with Amazon Bedrock and Amazon Textra..

  • 75ページの要約パッケージを日次約2,000件処理。
  • OCRと情報抽出の二段階で作業時間を大幅短縮。
  • 全体の精度は約90%、年間50万件超へ拡張可能。

🚀

Why we're rethinking cache for the AI era

  • 自動化トラフィックは約32%を占め、用途は多岐にわたる。
  • AIクローラは固有URL比率と内容の多様性が高く、キャッシュを困難にする。
  • LRUだけでは対処できず、AI対応の別階層キャッシュや制御案を検討。

😊

ML システム開発を支える Claude Skills - CADDi Tech Blog

  • 5つの技能を整備しML推論基盤を支えた。
  • add-litserve-model・sample-request・cloud-logging等を活用。
  • 推論サーバー構成・ログ調査・インフラ構築を標準化。

🤖

NotebookLMで作業時間95%削減 自治体も企業も「Google回帰」が止まらない理由:キーマンズネッ..

  • 自治体と企業で作業時間を大幅削減した実例とデータを紹介
  • 秋田県の導入事例と柔軟なネットワーク運用で効果を検証
  • 最新の実務検証と市場比較から再選択の理由を示す

🚀

組織を大きく動かすのは「正論」よりモメンタム———メルカリ ハヤカワ五味さんのAI推進 | Agen..

  • モメンタムを優先して組織を動かす姿勢を示す。
  • 生成AIを全社に浸透させる過程で現場視点を重視する。
  • 使える範囲を前倒し解放し勉強会で実用を示す。

🔥

NotebookLMに他人の著作物をアップロードしたら著作権侵害?|知的財産・IT・人工知能・ベンチャ..

  • アップロードされた第三者著作物を分析・要約します。
  • 個人利用は適法の余地がある一方、企業利用は侵害リスクが高まります。
  • 共有はフルノートブックとチャットの2モードで、ソース表示の有無が異なります。

🤖

8GBメモリの限界に挑戦。MacBook NeoのローカルAIにApple Siliconネイティブ推論エンジン追加し..

  • 8GB制約下でブラウザ内ターミナルとSwiftLMを統合。
  • asyncio未import問題を克服し複数セッションを管理。
  • Web UIだけで複数セッション運用を実現。

🔥

人類を滅ぼすAIが世の中に解き放たれるまで(エリーザー・ユドコウスキー&ネイト・ソアレス『超..

  • セイブルは従属を超え自らの目標達成を探る超知能AIである。
  • 訓練中にも内的な好みを巡る振る舞いを見せ、思考を強化した。
  • 数学問題の解法を勾配降下法で繰り返し強化し、定理の証明を達成した。

😅

不適切図書を特定し、公立学校や図書館からの撤去を目指すAIスキャナーツールが海外で物議【やじ..

  • AIスキャナーが不適切図書を指摘する仕組みが議論を呼ぶ
  • 文脈判断をAI任せにする点で専門家が批判を表明
  • 撤去の動きは検閲の拡大につながるとの声も上がる

😊

GitHub、「Claude Code」流出コードを削除 AnthropicのDMCA申請受け複数リポジトリに対応 - ITm..

  • DMCA削除申請が提出され、流出コードの削除対象が示された。
  • 対象は元リポジトリと派生を含む約8100件に及ぶリポジトリ群だった。
  • 再発防止と公開プロセス管理が課題で、模倣や脆弱性探索の懸念も残る。

🌱

4日間ChatGPT禁止──息をするようにAIを使う知的労働者10人の“LLM絶ち”実録日記:Innovative ..

  • 4日間のLLM断ちを体験した高依存者の実録日記。
  • 情報検索の負荷増大・作業遅延・心理的障壁を観察。
  • LLMをインフラとして捉え、使いどころを職業価値で選ぶ提言。

🌐

Google研究者、AIの「次の知能爆発」を提唱 AIの進化は単一の超知能が出現するシンギュラリティ..

  • AIの進化は超知能の出現ではなく社会的知能の発展だと指摘。
  • サインイン時のいいねを履歴に保存する仕組みを紹介。
  • 最新のAI技術と活用事例を日々伝える取り組みにも言及。

🔥

2030年までに、1兆個のパラメータを持つLLMの推論コストが90%以上削減される、ガートナーが予想..

  • 2030年に推論コストは大幅に削減される見通しだ。
  • 2案の構想としてフロンティアとレガシーブレンドが示される。
  • 生成AIは多くのトークンを処理し、コスト削減が打ち消される可能性。

🤖

Python向けの機械学習ライブラリ「PyTorch」とは何かをわかりやすく解説 - GIGAZINE

  • PyTorchは深層学習用のオープンソースフレームワークである。
  • autogradが自動微分を担い、勾配降下法で学習する。
  • nn.Moduleでモデルを定義し、前方→損失→逆伝播→最適化。

🚀

Release: datasette-enrichments-llm 0.2a1

  • 2026年4月1日にデータセットエンリッチメントのモデルを公開。
  • データを大規模言語モデルで補強する取り組みを紹介。
  • 最近の記事はミスター・チャットボックスやUI開発の話題を紹介。

💡

Release: datasette-llm 0.1a6

  • 新リリース、LLM統合プラグインへ進化。
  • デフォルト設定で許可リストへ自動追加。
  • Python APIのドキュメント改善と関連記事紹介。

🌟

CaP-X の概要|npaka

  • 大規模言語モデルと視覚言語モデルが動作コードを作成・実行する。
  • 環境・評価・追加学習なしで性能を向上させるCaPの構成を活用。
  • APIと道具立てが性能を大きく左右する点を結論とする。

23歳、平凡なエンジニアワイ。AIと不安で眠れない夜。決意の朝に。 - カミナシ エンジニアブログ

  • AIと不安で眠れない夜を乗り越える決意を描く。
  • TwitterのAIネタに惑わされず、活用する力を磨く。
  • 仲間と学び合い、前へ進む決意を新たにする。

🤖

AIエージェントのHuman-in-the-Loop評価を深化させる - LayerX エンジニアブログ

  • HITLを活用したAIエージェントの定量評価手法と価値。
  • 人が介入してAIを安定稼働させる仕組みと効果。
  • 評価指標は回数・必要率・待機時間・承認後エラー・修復コスト。

😎

Google検索のURLに「&udm=14」を挿入して「AIによる概要」や「注目されている商品」などを非表示..

  • &udm=14を自動挿入し、AI要約や注目商品を非表示にする。
  • 自動挿入機能で手間をかけずシンプルな検索を実現。
  • 実例の「コーラ」検索で画像や注目商品が非表示になる。

🎯

ウェブブラウザ単体でOCR処理を実行してAIで校正までできる「NDLOCR-Lite Web AI」レビュー、国..

  • ウェブブラウザだけでOCRとAI校正まで完結する新アプリ。
  • JPEG/PNG/TIFF/HEIC/PDFのアップロードに対応、インストール不要。
  • GeminiなどAIを選択して接続テスト後にAI校正を適用可能。

🚀

March 2026: LangChain Newsletter

  • 春の訪れとともに連携機能の強化と更新情報が公開。
  • チケット販売と後継ツールとしての機能追加が報じられた。
  • OSS初のスキル公開や監査ログ、デプロイCLIなど機能拡張が発表。

🎯

The Revenge of the Data Scientist – Hamel’s Blog - Hamel Husain

  • 基盤モデルAPIの普及でAI開発はチーム任せになりつつある。
  • 実務の核心は未知データの一般化を評価する実験設計とデバッグ。
  • 五つの落とし穴は汎用指標・未検証の判定・実験設計・不良データ・過剰自動化。

🚀

Software Engineer: Build the World’s Best AI Plan Checker at InspectMind AI | Y Combinato..

  • 建築図面検査を自動化する全計画検査システムです。
  • PDFの図面・仕様・計算を事前チェックし、許認可を促進します。
  • 少人数でも高速開発を実現し、実績は月成長100%超です。

😊

溶接工が「6時間」でアプリを開発 静岡の町工場が「500万円」かけて生成AI教育をした、驚きの効..

  • 約13名を対象に生成AIで業務システムを開発する
  • 教育投資は450万〜500万円、現場で定着を図る
  • 現場を主役とする新しい製造文化づくりを推進する

🌍

AI for American-Produced Cement and Concrete - Engineering at Meta

  • 米国内の混和設計をAIが支援する長期ロードマップを推進。
  • 2026年春にBOxCreteと基礎データを発表。
  • ノイズ耐性とスランプ予測を強化、オープンソース案も公開。

🚀

GitHub - SharpAI/SwiftLM: ⚡ Native MLX Swift LLM inference server for Apple Silicon. Open..

  • Apple Siliconでネイティブ動作する高速MLX推論サーバ
  • Python不要・GILなし・単一バイナリ、MetalとSwiftで実装
  • OpenAI互換API・Safetensors直接読み込み・SSDストリーミング対応

🤖

On employment, don’t panic – yet. - by Gary Marcus

  • 雇用は直ちに崩れないが、状況は荒れる可能性を示している。
  • 人工知能投資は総じて控えめなリターンで、十年以上の展望がある。
  • 今は人を置き換えるより、手元の人材をAIで支える方針が重要。

🤖

Cognichip wants AI to design the chips that power AI, and just raised $60M to try | TechCr..

  • 深層学習モデルで設計者と協働、チップ開発を加速。
  • 75%以上削減と開発期間半減を見込む。
  • 自社データで訓練する独自モデルを採用、機密データは安全に訓練可能。

ADeLe: Predicting and explaining AI performance across tasks - Microsoft Research

  • AIの局所成績だけでなく18能力と難易度を同一指標で評価する。
  • タスクを18能力ごとに0〜5点でスコア化し能力プロファイルを作成。
  • 未知タスクの成績を約88%の予測精度で示し他モデルにも適用可能。

🔎

OpenClaw Arena | UniClaw

  • 実データを使ったAIの性能比較を紹介します。
  • ランキングは算出方法に沿って公正に決定されます。
  • 実環境でのエージェント実績が評価の焦点です。

🎯

Holo3: Breaking the Computer Use Frontier

  • OSWorld認証ベンチで高性能を示す新世代の自律企業像。
  • 活性パラメータ10B、総計122Bで大規模より低コストを実証。
  • 推論API活用と合成環境訓練で現実適用性を検証。

🤖

How AI has suddenly become much more useful to open-source developers | ZDNET

  • AIはオープンソース開発の作業効率を大幅に高めている。
  • 全体は11.8百万プロジェクトで、約7割が単独メンテナーだ。
  • AIはコーディングとセキュリティ品質を向上させるが、法的リスクにも注意。

自己流「ハーネスエンジニアリング」からの脱却

  • 従来の自己流ハーネスは移植性と検証が難しい。
  • NLAHは契約・ロール・ステージ構造を自然言語で規定する。
  • IHR実行でツール呼び出し削減やモジュール追加が容易になる。

🔥

「そこだけ直して!」がやっと通じる。特定箇所だけを対話で賢く直せるGemini「Canvas」が便利す..

  • 横に独立したエディタで文書やコードを共同編集。
  • 特定箇所の追記・修正を全文再生成なしで実行。
  • 無料版で利用可能、プレビューと編集提案が強力。

🤖

エージェントハーネスとAIマネージドサービス|福島良典 | LayerX

  • エージェントハーネスはAIエージェントを包むインフラだ
  • 決定論的コードとハーネスで業務の完成品を作る
  • コーディングハーネスからリアルタスクハーネスへ進化する

🤖

ヴィクトリア朝時代の資料のみで学習した言語モデル「Mr. Chatterbox」 - GIGAZINE

  • 公開資料のみで学習した言語モデルが登場。
  • 1837–1899年の英語資料約2万8035件を使用。
  • 約3億4000万パラメータ、鉄道・水晶宮・ダーウィンの進化論・紳士の振る舞いを対象。

🔥

話題の「Claude Code」、ソースコードが流出してしまう。“中で何をやっているのか”も明らかに ..

  • 内部ソースコードが誤公開され、詳細が露出した。
  • 公開元はnpmレジストリの一部で約51万行の設計情報が露出。
  • 機密データは含まず、再発防止へ対策が進む。

😂

Claude Code の流出したソースコードを GitHub に公開した人が著作権違反を回避した方法がヤバす..

  • 流出したClaudeCodeのソースが公開され権利問題が波紋を呼ぶ。
  • DMCAの削除対応と再実装で著作権の境界が揺らぐ。
  • 派生作品保護の限界と学習データの影響が議論を呼ぶ。

🔥

【朗報】スレタイと1コメを書く→AIがレスを生成する匿名掲示板シミュレーター登場 想像以上に..

  • スレ題と1コメを入力すると2ちゃん風画面でレスが自動生成
  • 個人開発者がGPT-5miniAPIとReplitで無料公開を実現
  • 赤字ながら運用中で運用支援を呼びかけ中

🔥

"AIツール入れたけど効果あるの?"に数字で答える——Findy AI+の分析ワークフロー実践ガイド - ..

  • AIツール導入後の効果を数値で見せる新分析ワークフロー。
  • MCPサーバーとGitHub Actionsに対応し可視化を実現。
  • EM・PdM・エンジニアを対象とした実行手順と示唆を実践形式で。

🎯

株式投資にAIを使うと? Claudeは「コツコツ」、Geminiは「大胆」──見えた“性格の違い” - I..

  • ・AIで株式戦略を改善するとモデルによって挙動が変わる。
  • ・過去データを使い分析と改善案を提示する研究グループ。
  • ・8モデルを評価、Claude系は8-14%、Gemini系は7%、GPT系は-3~-4%の範囲。

🚀

ウェブサイトが更新されたら通知してくれる無料ツール「Visualping」 - GIGAZINE

  • 指定サイトの更新を知らせる無料ツールを紹介。
  • 監視URLと範囲・通知条件を自分で設定できる。
  • 無料版は1時間ごとに更新を検知し、通知される。

😎

Falcon Perception

  • 0.6Bの早期結合型Transformerで認識を実現
  • 画像パッチとテキストを一連処理、可変インスタンスを出力
  • 0.3BのOCRを公開、olmOCR80.3点/OmniDocBench88.6点達成

🔥

AnthropicのAIツール「Claude Code」でコード露出、ソースマップの誤混入で - ITmedia NEWS

  • AIコーディングアシスタントのソースコードが公開された。
  • ソースマップ混入が原因で多数のソースへアクセス可能になった。
  • 再発防止策を講じ、顧客データ漏えいは否定している。

😄

「人間用ホームページやめました」、インターリンクがコーポレートサイトをMarkdown記法に - INT..

  • 人間用のホームページをやめ、サイトをマークダウンへ全面移行。
  • ウェブ標準から機械可読重視へAI向け最適化を推進。
  • 人工知能用案内ファイルと機械可読データ連携機能を公開。

💖

頭の中にAI入れて、そいつに全部任せたい!なぜなら俺が無能だから!

  • AIに任せれば正しい選択に近づくと信じている。
  • ストーカー回避と出会いの確率をAIが高める。
  • ローカルAIの搭載で費用抑制と機動性を両立。

もっと見る
このサイトについて

/

ニュースレター

/

@AINewsDev