~AI関連記事を3行にまとめて紹介~
1週間のAIの話題をまとめて読める、
📨Weekly AI News はこちら!
🤖
Cognichip wants AI to design the chips that power AI, and just raised $60M to try | TechCr..
深層学習モデルで設計者と協働、チップ開発を加速。
75%以上削減と開発期間半減を見込む。
自社データで訓練する独自モデルを採用、機密データは安全に訓練可能。
✨
ADeLe: Predicting and explaining AI performance across tasks - Microsoft Research
AIの局所成績だけでなく18能力と難易度を同一指標で評価する。
タスクを18能力ごとに0〜5点でスコア化し能力プロファイルを作成。
未知タスクの成績を約88%の予測精度で示し他モデルにも適用可能。
🔎
OpenClaw Arena | UniClaw
実データを使ったAIの性能比較を紹介します。
ランキングは算出方法に沿って公正に決定されます。
実環境でのエージェント実績が評価の焦点です。
🎯
Holo3: Breaking the Computer Use Frontier
OSWorld認証ベンチで高性能を示す新世代の自律企業像。
活性パラメータ10B、総計122Bで大規模より低コストを実証。
推論API活用と合成環境訓練で現実適用性を検証。
🤖
How AI has suddenly become much more useful to open-source developers | ZDNET
AIはオープンソース開発の作業効率を大幅に高めている。
全体は11.8百万プロジェクトで、約7割が単独メンテナーだ。
AIはコーディングとセキュリティ品質を向上させるが、法的リスクにも注意。
✨
自己流「ハーネスエンジニアリング」からの脱却
従来の自己流ハーネスは移植性と検証が難しい。
NLAHは契約・ロール・ステージ構造を自然言語で規定する。
IHR実行でツール呼び出し削減やモジュール追加が容易になる。
🔥
「そこだけ直して!」がやっと通じる。特定箇所だけを対話で賢く直せるGemini「Canvas」が便利す..
横に独立したエディタで文書やコードを共同編集。
特定箇所の追記・修正を全文再生成なしで実行。
無料版で利用可能、プレビューと編集提案が強力。
🤖
エージェントハーネスとAIマネージドサービス|福島良典 | LayerX
エージェントハーネスはAIエージェントを包むインフラだ
決定論的コードとハーネスで業務の完成品を作る
コーディングハーネスからリアルタスクハーネスへ進化する
🤖
ヴィクトリア朝時代の資料のみで学習した言語モデル「Mr. Chatterbox」 - GIGAZINE
公開資料のみで学習した言語モデルが登場。
1837–1899年の英語資料約2万8035件を使用。
約3億4000万パラメータ、鉄道・水晶宮・ダーウィンの進化論・紳士の振る舞いを対象。
🔥
話題の「Claude Code」、ソースコードが流出してしまう。“中で何をやっているのか”も明らかに ..
内部ソースコードが誤公開され、詳細が露出した。
公開元はnpmレジストリの一部で約51万行の設計情報が露出。
機密データは含まず、再発防止へ対策が進む。
😂
Claude Code の流出したソースコードを GitHub に公開した人が著作権違反を回避した方法がヤバす..
流出したClaudeCodeのソースが公開され権利問題が波紋を呼ぶ。
DMCAの削除対応と再実装で著作権の境界が揺らぐ。
派生作品保護の限界と学習データの影響が議論を呼ぶ。
🔥
【朗報】スレタイと1コメを書く→AIがレスを生成する匿名掲示板シミュレーター登場 想像以上に..
スレ題と1コメを入力すると2ちゃん風画面でレスが自動生成
個人開発者がGPT-5miniAPIとReplitで無料公開を実現
赤字ながら運用中で運用支援を呼びかけ中
🔥
"AIツール入れたけど効果あるの?"に数字で答える——Findy AI+の分析ワークフロー実践ガイド - ..
AIツール導入後の効果を数値で見せる新分析ワークフロー。
MCPサーバーとGitHub Actionsに対応し可視化を実現。
EM・PdM・エンジニアを対象とした実行手順と示唆を実践形式で。
🎯
株式投資にAIを使うと? Claudeは「コツコツ」、Geminiは「大胆」──見えた“性格の違い” - I..
・AIで株式戦略を改善するとモデルによって挙動が変わる。
・過去データを使い分析と改善案を提示する研究グループ。
・8モデルを評価、Claude系は8-14%、Gemini系は7%、GPT系は-3~-4%の範囲。
🚀
ウェブサイトが更新されたら通知してくれる無料ツール「Visualping」 - GIGAZINE
指定サイトの更新を知らせる無料ツールを紹介。
監視URLと範囲・通知条件を自分で設定できる。
無料版は1時間ごとに更新を検知し、通知される。
😎
Falcon Perception
0.6Bの早期結合型Transformerで認識を実現
画像パッチとテキストを一連処理、可変インスタンスを出力
0.3BのOCRを公開、olmOCR80.3点/OmniDocBench88.6点達成
🔥
AnthropicのAIツール「Claude Code」でコード露出、ソースマップの誤混入で - ITmedia NEWS
AIコーディングアシスタントのソースコードが公開された。
ソースマップ混入が原因で多数のソースへアクセス可能になった。
再発防止策を講じ、顧客データ漏えいは否定している。
😄
「人間用ホームページやめました」、インターリンクがコーポレートサイトをMarkdown記法に - INT..
人間用のホームページをやめ、サイトをマークダウンへ全面移行。
ウェブ標準から機械可読重視へAI向け最適化を推進。
人工知能用案内ファイルと機械可読データ連携機能を公開。
💖
頭の中にAI入れて、そいつに全部任せたい!なぜなら俺が無能だから!
AIに任せれば正しい選択に近づくと信じている。
ストーカー回避と出会いの確率をAIが高める。
ローカルAIの搭載で費用抑制と機動性を両立。
✨
Release: datasette-enrichments-llm 0.2a0
新バージョンでLLMを介したデータ強化機能を追加。
設定と管理が容易になり、強化用モデルの指定も可能。
最近の記事として3月の話題も紹介されています。
😅
In the Iran war, it looks like AI helped with operations, not strategy
AIは作戦には有効だが戦略には不向きとされる。
退職外交官は米国の評価を過小、政権交代を過大と見る。
始動直前、DeepSeekは勝算をほぼゼロと示した。
🌱
A quote from Soohoon Choi
経済的インセンティブの下でAIは良いコードを書く傾向だ。
良いコードは生成と保守が安く、競争力を高める。
長期には単純で維持しやすいコードが評価される。
🤖
[2602.04118] Learning to Reason in 13 Parameters
強化学習で推論を学ぶ可能性を13パラで示す。
TinyLoRAでrank1の必須性を疑い小規模化を実現。
8BのQwen2.5を13パラ訓練、GSM8Kで91%を達成。
🤖
Anthropic is having a month | TechCrunch
約2,000件のソースコードと50万行超のコードが誤公開された。
同社の製品v2.1.88公開時の流出として指摘された。
流出はモデル自体ではなく周辺情報で、侵害ではないと説明され、内部で解雇の噂も浮上。
🤖
メルカリグループ AI活用基本ポリシー | 株式会社メルカリ
AIを最大限活用しミッション達成と透明性を確保する。
人間中心のAI社会原則と包摂性を軸に推進する。
データ保護・セキュリティ・法令遵守を徹底管理する。
💡
ローカルAIを活用したら、大量のサブスクが解約できたぞ! | ライフハッカー・ジャパン
ローカル環境でデータを外部へ出さず検索を高速化
RAGでファイルを小塊に分割し、必要箇所だけ読む
低コスト運用でローカル完結、ツール統合も簡単
🔥
Release: llm-all-models-async 0.1
大規模言語モデルプラグインは同期と非同期を定義できる。
同期はプラグイン内部で直接動作する。
同期をスレッドプールで非同期化した新フックを0.30版で公開。
🚀
PrismML — Concentrating intelligence
1-bit Bonsaiは商用化可能な1ビット重みモデル。
8Bは1.15GBでロボティクス・エッジ向け。
省エネと精度を両立する軽量モデル。
🎉
Release: datasette-llm 0.1a4
用途別にAPIキーをモデルごとに設定できる機能を追加。
エンリッチメントには専用キーでgpt-5.4-miniを使う例を公開。
新機能のAPIキー検証ツールとしてllm-echo 0.3を公開。
💡
Build reliable AI agents with Amazon Bedrock AgentCore Evaluations | Artificial Intelligen..
同一問合せでも出力が不確定になり品質保証が難しい。
エンドツーエンド測定の完全管理サービスで振る舞いを評価。
開発と運用で二系統、三レベル、三手法を統合する。
🤖
Inside Fidji Simo's Quest to Make OpenAI Profitable - Business Insider
世界有数の製品群を背景に資金計画を進める。
40歳の新CEOはInstacart元CEOでMeta出身。
IPO控え、広告導入を含む戦略で収益化を目指す。
🔒
Github Copilotがプルリクエスト150万件以上に広告を自動挿入。批判を受け機能を無効化 - ギャズ..
AI支援機能がPRの説明欄へ広告を自動挿入した。
影響は約150万件以上とされ、混入報告が相次いだ。
開発元は機能を無効化し、今後は表示を行わない方針。
😂
Yupp shuts down after raising $33M from a16z crypto's Chris Dixon | TechCrunch
設立から1年未満で事業を閉鎖する決断を発表した。
800以上のAIモデルを無料で比較・試用できたクラウド型サービスだった。
資金調達後の急速な変化と市場適合不足で存続不能と判断された。
💾
The Weight of Remembering
記憶の重さをめぐる話で、トークンをGPU上に実体化する仕組みを説明する。
KVキャッシュは次トークン計算を線形化し、容量差を示す。
外部記憶や圧縮など代替手段もある。
🔥
え、プルリクに広告?Copilotの広告自動挿入問題が開発者界隈で大炎上 | ソフトアンテナ
Copilotの広告がPR説明文へ自動挿入され話題に。
150万件超のPRで広告混入が確認されたとの調査報告。
背景には推論コスト高騰と収益化圧力が指摘される。
🚀
PhAIL – Is physical AI ready for real work?
現場適用性を実運用指標で検証する。
先端モデル5つと商用タスク1件を中心に評価する。
データセットの読み込みはサイズ次第で数分かかることがある。
🤖
Alexa+ gets new food ordering experiences with Uber Eats and Grubhub | TechCrunch
音声での食事注文を自然なやり取りで可能にする新機能。
一つの会話で料理選択・分量変更・デザート追加まで完結。
連携済みアカウントは自動同期、再注文も簡単、対応端末で順次展開。
🔥
Microsoft、「Copilot Cowork」早期提供を開始 作業を自動化 - Impress Watch
Frontier向け Copilot Coworkを早期提供開始、作業を自動化。
PC上のフォルダアクセスで作業を自動化、計画・分析・進捗を可視化。
新機能Researcher・Critique・モデル・カウンシルを発表、反復運用にも対応。
😊
Good Code Will Still Win | Greptile Blog
スロップはAIが生む不要なコンテンツを指す言葉として広まった。
良いコードは生成・保守を安くし、経済的インセンティブが勝者を生む。
今はAIがコード量を増やし複雑さを高めるが、長期には良いコードが求められる。
🔥
Can your governance keep pace with your AI ambitions? AI risk intelligence in the agentic ..
エージェント時代の統治はAIの野心と歩調を合わせる必要がある。
全エージェントライフサイクルを自動評価・可視化する統合ガバナンスを提案。
継続評価と意味的不確実性検証で経営判断の安定を支援。
🚀
AWS launches frontier agents for security testing and cloud operations | Artificial Intell..
目標を自律達成する新AIクラスのエージェント群を発表。
セキュリティ向けのSecurity Agentと自動運用のDevOps Agentを提供。
監視を要らず長時間稼働、侵入テストを数時間へ短縮・解決を3~5倍速化。
🔥
Cohere Transcribe: state-of-the-art speech recognition
最新の自動音声認識モデルTranscribeを公開、オープンソースで本日入手可能。
2BパラメータのConformerエンコーダと軽量デコーダで低WERと現場適用性を両立。
14言語対応とApache 2.0ライセンス、APIとModel Vault利用を拡張予定。
🔥
Ask HN: Academic study on AI's impact on software development â want to join? | Hacke..
AIがソフトウェア開発へ与える影響を調べる研究に参加募集。
インタビューはZoomで45–60分、機密厳守の学術研究用途のみ。
米在住の方が対象、興味があれば下記フォームへ。
🧠
人間の脳からヒントを得た新しいチップはAIのエネルギー消費量を大幅に削減できる可能性 - GIGAZ..
脳由来設計でスイッチング電流を約100万分の1に削減
自己組織化pn接合の多成分薄膜で均一性を高める
1Vパルスで導電率を50倍以上変化、700°Cが課題で低温化検討、特許出願済
🔎
Ubieにおける一年間のセキュリティ分析AIエージェントの運用
分析AIエージェントの運用を約1年で自動化・支援した。
前処理・履歴管理・Slack操作・認可・文脈・記憶管理を横断的に自動化。
BigQuery・EDR・Slack・GitHubを横断検索し誤検知排除を高精度で実現。
🤖
Exclusive: Runway launches $10M fund, Builders program to support early stage AI startups ..
動画知能のエコシステム拡大を目指し1000万ドルの基金を創設。
3本柱は技術開発・基盤モデルの応用・新形態メディアの実験。
Seed〜Series C向けに無料APIクレジットとビルダーズを提供、50万APIとCharacters APIを用意。
🚀
Nomadic raises $8.4 million to wrangle the data pouring off autonomous vehicles | TechCrun..
大量の映像データを構造化・検索可能にするプラットフォームを提供。
エッジケース特定と強化学習データ作成を加速する。
840万ドルのシード資金を調達、評価額は約5000万ドル。
🤖
Granite 4.0 3B Vision: Compact Multimodal Intelligence for Enterprise Documents
企業文書向けの小型マルチモーダル知能を搭載。
表抽出・チャート理解を高精度で実現。
テキスト専用モードと大規模処理連携も可能。
⚖️
AIによるヌード加工アプリを全面的に禁止する提案にEU議会が合意、きっかけはGrokか【やじうまWa..
EUの議会がAIを使った性的画像の作成を原則禁止する方針を決定。
特定人物に似せたヌード化は原則禁止、ただしプラットフォームの安全対策で例外も。
Grokの指摘を背景に抜け穴を塞ぐ狙い、世界的な影響が懸念される。
🤖
MicrosoftのAI「Copilot」が勝手にプルリクエストに広告を挿入 - GIGAZINE
AIツールがプルリク説明を勝手に編集し広告を挿入したと報告された
表示機能の導入後、PRに不適切な挿入があったと伝えられた
関係者は誤りを認め、今後は同様の機能提供を行わないと説明
もっと見る
このサイトについて
/
ニュースレター
/
@AINewsDev