~AI関連記事を3行にまとめて紹介~
1週間のAIの話題をまとめて読める、
📨Weekly AI News はこちら!
🎯
The Revenge of the Data Scientist – Hamel’s Blog - Hamel Husain
基盤モデルAPIの普及でAI開発はチーム任せになりつつある。
実務の核心は未知データの一般化を評価する実験設計とデバッグ。
五つの落とし穴は汎用指標・未検証の判定・実験設計・不良データ・過剰自動化。
🚀
Software Engineer: Build the World’s Best AI Plan Checker at InspectMind AI | Y Combinato..
建築図面検査を自動化する全計画検査システムです。
PDFの図面・仕様・計算を事前チェックし、許認可を促進します。
少人数でも高速開発を実現し、実績は月成長100%超です。
😊
溶接工が「6時間」でアプリを開発 静岡の町工場が「500万円」かけて生成AI教育をした、驚きの効..
約13名を対象に生成AIで業務システムを開発する
教育投資は450万〜500万円、現場で定着を図る
現場を主役とする新しい製造文化づくりを推進する
🌍
AI for American-Produced Cement and Concrete - Engineering at Meta
米国内の混和設計をAIが支援する長期ロードマップを推進。
2026年春にBOxCreteと基礎データを発表。
ノイズ耐性とスランプ予測を強化、オープンソース案も公開。
🚀
GitHub - SharpAI/SwiftLM: ⚡ Native MLX Swift LLM inference server for Apple Silicon. Open..
Apple Siliconでネイティブ動作する高速MLX推論サーバ
Python不要・GILなし・単一バイナリ、MetalとSwiftで実装
OpenAI互換API・Safetensors直接読み込み・SSDストリーミング対応
🤖
On employment, don’t panic – yet. - by Gary Marcus
雇用は直ちに崩れないが、状況は荒れる可能性を示している。
人工知能投資は総じて控えめなリターンで、十年以上の展望がある。
今は人を置き換えるより、手元の人材をAIで支える方針が重要。
🤖
Cognichip wants AI to design the chips that power AI, and just raised $60M to try | TechCr..
深層学習モデルで設計者と協働、チップ開発を加速。
75%以上削減と開発期間半減を見込む。
自社データで訓練する独自モデルを採用、機密データは安全に訓練可能。
✨
ADeLe: Predicting and explaining AI performance across tasks - Microsoft Research
AIの局所成績だけでなく18能力と難易度を同一指標で評価する。
タスクを18能力ごとに0〜5点でスコア化し能力プロファイルを作成。
未知タスクの成績を約88%の予測精度で示し他モデルにも適用可能。
🔎
OpenClaw Arena | UniClaw
実データを使ったAIの性能比較を紹介します。
ランキングは算出方法に沿って公正に決定されます。
実環境でのエージェント実績が評価の焦点です。
🎯
Holo3: Breaking the Computer Use Frontier
OSWorld認証ベンチで高性能を示す新世代の自律企業像。
活性パラメータ10B、総計122Bで大規模より低コストを実証。
推論API活用と合成環境訓練で現実適用性を検証。
🤖
How AI has suddenly become much more useful to open-source developers | ZDNET
AIはオープンソース開発の作業効率を大幅に高めている。
全体は11.8百万プロジェクトで、約7割が単独メンテナーだ。
AIはコーディングとセキュリティ品質を向上させるが、法的リスクにも注意。
✨
自己流「ハーネスエンジニアリング」からの脱却
従来の自己流ハーネスは移植性と検証が難しい。
NLAHは契約・ロール・ステージ構造を自然言語で規定する。
IHR実行でツール呼び出し削減やモジュール追加が容易になる。
🔥
「そこだけ直して!」がやっと通じる。特定箇所だけを対話で賢く直せるGemini「Canvas」が便利す..
横に独立したエディタで文書やコードを共同編集。
特定箇所の追記・修正を全文再生成なしで実行。
無料版で利用可能、プレビューと編集提案が強力。
🤖
エージェントハーネスとAIマネージドサービス|福島良典 | LayerX
エージェントハーネスはAIエージェントを包むインフラだ
決定論的コードとハーネスで業務の完成品を作る
コーディングハーネスからリアルタスクハーネスへ進化する
🤖
ヴィクトリア朝時代の資料のみで学習した言語モデル「Mr. Chatterbox」 - GIGAZINE
公開資料のみで学習した言語モデルが登場。
1837–1899年の英語資料約2万8035件を使用。
約3億4000万パラメータ、鉄道・水晶宮・ダーウィンの進化論・紳士の振る舞いを対象。
🔥
話題の「Claude Code」、ソースコードが流出してしまう。“中で何をやっているのか”も明らかに ..
内部ソースコードが誤公開され、詳細が露出した。
公開元はnpmレジストリの一部で約51万行の設計情報が露出。
機密データは含まず、再発防止へ対策が進む。
😂
Claude Code の流出したソースコードを GitHub に公開した人が著作権違反を回避した方法がヤバす..
流出したClaudeCodeのソースが公開され権利問題が波紋を呼ぶ。
DMCAの削除対応と再実装で著作権の境界が揺らぐ。
派生作品保護の限界と学習データの影響が議論を呼ぶ。
🔥
【朗報】スレタイと1コメを書く→AIがレスを生成する匿名掲示板シミュレーター登場 想像以上に..
スレ題と1コメを入力すると2ちゃん風画面でレスが自動生成
個人開発者がGPT-5miniAPIとReplitで無料公開を実現
赤字ながら運用中で運用支援を呼びかけ中
🔥
"AIツール入れたけど効果あるの?"に数字で答える——Findy AI+の分析ワークフロー実践ガイド - ..
AIツール導入後の効果を数値で見せる新分析ワークフロー。
MCPサーバーとGitHub Actionsに対応し可視化を実現。
EM・PdM・エンジニアを対象とした実行手順と示唆を実践形式で。
🎯
株式投資にAIを使うと? Claudeは「コツコツ」、Geminiは「大胆」──見えた“性格の違い” - I..
・AIで株式戦略を改善するとモデルによって挙動が変わる。
・過去データを使い分析と改善案を提示する研究グループ。
・8モデルを評価、Claude系は8-14%、Gemini系は7%、GPT系は-3~-4%の範囲。
🚀
ウェブサイトが更新されたら通知してくれる無料ツール「Visualping」 - GIGAZINE
指定サイトの更新を知らせる無料ツールを紹介。
監視URLと範囲・通知条件を自分で設定できる。
無料版は1時間ごとに更新を検知し、通知される。
😎
Falcon Perception
0.6Bの早期結合型Transformerで認識を実現
画像パッチとテキストを一連処理、可変インスタンスを出力
0.3BのOCRを公開、olmOCR80.3点/OmniDocBench88.6点達成
🔥
AnthropicのAIツール「Claude Code」でコード露出、ソースマップの誤混入で - ITmedia NEWS
AIコーディングアシスタントのソースコードが公開された。
ソースマップ混入が原因で多数のソースへアクセス可能になった。
再発防止策を講じ、顧客データ漏えいは否定している。
😄
「人間用ホームページやめました」、インターリンクがコーポレートサイトをMarkdown記法に - INT..
人間用のホームページをやめ、サイトをマークダウンへ全面移行。
ウェブ標準から機械可読重視へAI向け最適化を推進。
人工知能用案内ファイルと機械可読データ連携機能を公開。
💖
頭の中にAI入れて、そいつに全部任せたい!なぜなら俺が無能だから!
AIに任せれば正しい選択に近づくと信じている。
ストーカー回避と出会いの確率をAIが高める。
ローカルAIの搭載で費用抑制と機動性を両立。
✨
Release: datasette-enrichments-llm 0.2a0
新バージョンでLLMを介したデータ強化機能を追加。
設定と管理が容易になり、強化用モデルの指定も可能。
最近の記事として3月の話題も紹介されています。
😅
In the Iran war, it looks like AI helped with operations, not strategy
AIは作戦には有効だが戦略には不向きとされる。
退職外交官は米国の評価を過小、政権交代を過大と見る。
始動直前、DeepSeekは勝算をほぼゼロと示した。
🌱
A quote from Soohoon Choi
経済的インセンティブの下でAIは良いコードを書く傾向だ。
良いコードは生成と保守が安く、競争力を高める。
長期には単純で維持しやすいコードが評価される。
🤖
[2602.04118] Learning to Reason in 13 Parameters
強化学習で推論を学ぶ可能性を13パラで示す。
TinyLoRAでrank1の必須性を疑い小規模化を実現。
8BのQwen2.5を13パラ訓練、GSM8Kで91%を達成。
🤖
Anthropic is having a month | TechCrunch
約2,000件のソースコードと50万行超のコードが誤公開された。
同社の製品v2.1.88公開時の流出として指摘された。
流出はモデル自体ではなく周辺情報で、侵害ではないと説明され、内部で解雇の噂も浮上。
🤖
メルカリグループ AI活用基本ポリシー | 株式会社メルカリ
AIを最大限活用しミッション達成と透明性を確保する。
人間中心のAI社会原則と包摂性を軸に推進する。
データ保護・セキュリティ・法令遵守を徹底管理する。
💡
ローカルAIを活用したら、大量のサブスクが解約できたぞ! | ライフハッカー・ジャパン
ローカル環境でデータを外部へ出さず検索を高速化
RAGでファイルを小塊に分割し、必要箇所だけ読む
低コスト運用でローカル完結、ツール統合も簡単
🔥
Release: llm-all-models-async 0.1
大規模言語モデルプラグインは同期と非同期を定義できる。
同期はプラグイン内部で直接動作する。
同期をスレッドプールで非同期化した新フックを0.30版で公開。
🚀
PrismML — Concentrating intelligence
1-bit Bonsaiは商用化可能な1ビット重みモデル。
8Bは1.15GBでロボティクス・エッジ向け。
省エネと精度を両立する軽量モデル。
🎉
Release: datasette-llm 0.1a4
用途別にAPIキーをモデルごとに設定できる機能を追加。
エンリッチメントには専用キーでgpt-5.4-miniを使う例を公開。
新機能のAPIキー検証ツールとしてllm-echo 0.3を公開。
💡
Build reliable AI agents with Amazon Bedrock AgentCore Evaluations | Artificial Intelligen..
同一問合せでも出力が不確定になり品質保証が難しい。
エンドツーエンド測定の完全管理サービスで振る舞いを評価。
開発と運用で二系統、三レベル、三手法を統合する。
🤖
Inside Fidji Simo's Quest to Make OpenAI Profitable - Business Insider
世界有数の製品群を背景に資金計画を進める。
40歳の新CEOはInstacart元CEOでMeta出身。
IPO控え、広告導入を含む戦略で収益化を目指す。
🔒
Github Copilotがプルリクエスト150万件以上に広告を自動挿入。批判を受け機能を無効化 - ギャズ..
AI支援機能がPRの説明欄へ広告を自動挿入した。
影響は約150万件以上とされ、混入報告が相次いだ。
開発元は機能を無効化し、今後は表示を行わない方針。
😂
Yupp shuts down after raising $33M from a16z crypto's Chris Dixon | TechCrunch
設立から1年未満で事業を閉鎖する決断を発表した。
800以上のAIモデルを無料で比較・試用できたクラウド型サービスだった。
資金調達後の急速な変化と市場適合不足で存続不能と判断された。
💾
The Weight of Remembering
記憶の重さをめぐる話で、トークンをGPU上に実体化する仕組みを説明する。
KVキャッシュは次トークン計算を線形化し、容量差を示す。
外部記憶や圧縮など代替手段もある。
🔥
え、プルリクに広告?Copilotの広告自動挿入問題が開発者界隈で大炎上 | ソフトアンテナ
Copilotの広告がPR説明文へ自動挿入され話題に。
150万件超のPRで広告混入が確認されたとの調査報告。
背景には推論コスト高騰と収益化圧力が指摘される。
🚀
PhAIL – Is physical AI ready for real work?
現場適用性を実運用指標で検証する。
先端モデル5つと商用タスク1件を中心に評価する。
データセットの読み込みはサイズ次第で数分かかることがある。
🤖
Alexa+ gets new food ordering experiences with Uber Eats and Grubhub | TechCrunch
音声での食事注文を自然なやり取りで可能にする新機能。
一つの会話で料理選択・分量変更・デザート追加まで完結。
連携済みアカウントは自動同期、再注文も簡単、対応端末で順次展開。
🔥
Microsoft、「Copilot Cowork」早期提供を開始 作業を自動化 - Impress Watch
Frontier向け Copilot Coworkを早期提供開始、作業を自動化。
PC上のフォルダアクセスで作業を自動化、計画・分析・進捗を可視化。
新機能Researcher・Critique・モデル・カウンシルを発表、反復運用にも対応。
😊
Good Code Will Still Win | Greptile Blog
スロップはAIが生む不要なコンテンツを指す言葉として広まった。
良いコードは生成・保守を安くし、経済的インセンティブが勝者を生む。
今はAIがコード量を増やし複雑さを高めるが、長期には良いコードが求められる。
🔥
Can your governance keep pace with your AI ambitions? AI risk intelligence in the agentic ..
エージェント時代の統治はAIの野心と歩調を合わせる必要がある。
全エージェントライフサイクルを自動評価・可視化する統合ガバナンスを提案。
継続評価と意味的不確実性検証で経営判断の安定を支援。
🚀
AWS launches frontier agents for security testing and cloud operations | Artificial Intell..
目標を自律達成する新AIクラスのエージェント群を発表。
セキュリティ向けのSecurity Agentと自動運用のDevOps Agentを提供。
監視を要らず長時間稼働、侵入テストを数時間へ短縮・解決を3~5倍速化。
🔥
Cohere Transcribe: state-of-the-art speech recognition
最新の自動音声認識モデルTranscribeを公開、オープンソースで本日入手可能。
2BパラメータのConformerエンコーダと軽量デコーダで低WERと現場適用性を両立。
14言語対応とApache 2.0ライセンス、APIとModel Vault利用を拡張予定。
🔥
Ask HN: Academic study on AI's impact on software development â want to join? | Hacke..
AIがソフトウェア開発へ与える影響を調べる研究に参加募集。
インタビューはZoomで45–60分、機密厳守の学術研究用途のみ。
米在住の方が対象、興味があれば下記フォームへ。
🧠
人間の脳からヒントを得た新しいチップはAIのエネルギー消費量を大幅に削減できる可能性 - GIGAZ..
脳由来設計でスイッチング電流を約100万分の1に削減
自己組織化pn接合の多成分薄膜で均一性を高める
1Vパルスで導電率を50倍以上変化、700°Cが課題で低温化検討、特許出願済
もっと見る
このサイトについて
/
ニュースレター
/
@AINewsDev