~AI関連記事を3行にまとめて紹介~
1週間のAIの話題をまとめて読める、
📨Weekly AI News はこちら!
🔒
Large-Scale Online Deanonymization with LLMs
・本研究ではLLMでオンラインのディノニミゼーションを評価。
・匿名投稿や横断照合で高精度な同一人物特定を示す。
・データ制限と検知が重要だがオープンモデルでは難しい。
✨
無料で日本語・手書き・縦書きもテキスト化できる国立国会図書館のWindows・Mac・Linux向けOCRア..
無料で日本語・手書き・縦書きのOCRに対応
Windows/Mac/Linux対応、GPU不要で使える
TXT/JSON/XML/TEIなどに対応
🔒
OpenAI COO says ads will be 'an iterative process' | TechCrunch
広告導入は反復的なプロセスとして進める方針だ。
無料とGo版での先行導入を米国で試す方針も。
COOは信頼とプライバシーを最優先にすべきと述べた。
✨
大規模な組織におけるAI Agent活用の促進と課題 - Speaker Deck
大規模組織でのAIエージェント活用を促進する方針を紹介
社内API連携と複数エージェントによる実演を解説
現実的な展開モデルとADK活用の組み合わせを提示
🤖
About 12% of US teens turn to AI for emotional support or advice | TechCrunch
米国の10代でAI利用は日常へ浸透している。
情報検索57%、学習支援54%が最も多く、感情サポートは12%。
専門家は安全性と孤立の懸念を指摘している。
🔎
[2602.16800] Large-scale online deanonymization with LLMs
インターネット全体へアクセス可能なLLMが高精度に利用者を同定できる
特徴抽出・意味表現検索・候補推論の3段階パイプラインを実証
三データセットで従来手法を大きく上回り再現率と精度を報告
😊
OpenClaw creator's advice to AI builders is to be more playful and allow yourself time to ..
AI実験には探究と遊び心が不可欠だと説く。
完璧な計画は最初からなく、多くは試行錯誤だった。
AIは自ら解を作れる時代で、遊ぶ気持ちで作るのが肝心。
✨
Lead Deployment Strategist at Trellis AI | Y Combinator
AIで医療事務を効率化するプラットフォームが書類受付や事前承認を自動化。
紹介依頼の分類やカルテノート理解、契約・償還検索で保険適用と費用負担を提示。
構造化データを直接EHRへ変換し、臨床判断と薬剤プログラムを向上。
✨
「ブッダロイド」、京都の寺院で“合掌” 仏教特化の生成AI搭載で対話も 京大など開発 - ITmed..
仏教思想に特化した対話が可能なヒューマノイドが公開
合掌や礼、座禅の所作も再現される
研究機関の協力で仏教ARも公開された
🚀
GitHub CopilotのSkillsは手順書だ:3桁行差分の大規模Terraform移行に使い回す
前提・手順・判断基準・成果物を手順書化する。
Markdownで再現性ある指示をCopilotへ渡す。
移行差分をSkillsで整理して自動化を進める。
✨
Amazon's AI-powered Alexa+ gets new personality options | TechCrunch
Alexaの新機能「Alexa+」で性格スタイルを3種追加。
Briefは短く直接、Chillはくつろぎ系、Sweetは温かく前向き。
設定はEchoかアプリの「Personality Style」から可能、米国のみ。
🤖
Jira’s latest update allows AI agents and humans to work side by side | TechCrunch
新機能で人とAIエージェントが同じダッシュボードで共働。
AIへのタスク割り当てや進捗・期限を追跡可能。
既存プロジェクトへ途中からAIを介入させられる。
🚀
Claude Codeを"優秀な新卒部下"として使い倒す:個人開発爆速化の全ワークフロー
・AIを活用した新卒エンジニア風の環境設計を徹底する。
・CLAUDE.mdを設定して動作指針を固定化する。
・計画・サブエージェント活用・自己改善・検証・自律修正の6要素を導入する。
🔥
Founding Infrastructure Engineer at Event Horizon Labs | Y Combinator
AIネイティブのヘッジファンドで自動化と拡大を推進する
小規模チームが自律研究基盤をゼロから構築する
オーケストレーター・エージェント・知識ベースで戦略を発見する
🔥
巨大なボール1つで自由自在に走るバイクを開発 - GIGAZINE
1個のボールで360度自由に走るオムニ式バイクを公開
大径ホイールに18個の小ローラーを2列配置、216個のベアリング搭載
3基の最大2kWモーターを専用制御で駆動、ロールとピッチをPID安定化、操舵と静電対策が課題
😊
ありえない事を検索をすると AI が必死に止めてきて面白い「案外優しい」「これハマりそう」いろ..
AIの危険性を指摘して止める反応が話題になる。
案外優しい対応や興味を持つ声が多いとされる。
ギプス自作や南極の開腹手術など具体例が語られる。
🔥
『お~い コピペの範囲ミスってるぞ』謝罪文をAIに書かせたことが丸わかりになってしまう致命的..
AIが謝罪文を作成したことでミスが露呈した。
コピペ範囲の誤りが指摘され、話題になっている。
今後こうした事故が増えるのではと予測する声もある。
🐯
LLM Skirmish
対戦は1対1のリアルタイム戦略ゲームで行われるベンチマークです。
各対戦は五ラウンドで、戦略はラウンド間に修正可能です。
全体で25本のスクリプトを提出し、計250対戦が行われる。
🔎
Sovereignty in a System Prompt - POP RDI; RET;
訓練データの出所と評価報告の公開がなく透明性が不足。
政府補助金の用途も不透明で説明責任が問われる。
再現可能な評価を公開するオープンモデルの推進が進歩を促す。
🤖
RedshiftのAI活用を「期待外れ」で終わらせないためには?
現場の要望をAIが自立回答で満たせる環境を整える。
用語集を一元管理し、AIが適切に文脈を判断する。
対話型分析で欠ける条件をAIが問い、適切なSQLを生成。
🔎
ClaudeはなぜRAGを捨てたのか?コード生成における「エージェント型検索」の優位性
RAGからエージェント型検索へ移行したコード生成の動き。
事前インデックスを作らず、検索をAIエージェントに任せる。
性能向上と安全性確保、陳腐化対策と機密保護の三点が理由。
🤖
Blender内で画像・動画・3Dモデルを生成!チャットやMCPにも対応するAIワークフロー統合アドオン..
Blender内でAI生成とアシスタント機能を統合する拡張機能です。
背景で複数モデルが動作しノンブロック設計で作業を妨げません。
ComfyUI連携・自動保存・VSE配置など生成後の流れを支援。
🔥
Microsoftの提案するLLM向け記憶管理手法
階層化されたカテゴリとベクトル検索で高精度な検索を実現
対話情報をチャンク化しカテゴリ別に整理してグラフで保存
ベクトルとBM25のハイブリッドとAgenticSearchを統合して回答を作成
🔥
#1|AI駆動開発の4フェーズと私たちの現在地 — AIに運転席を譲れるか - ACES エンジニアブログ
AI駆動開発は4つのフェーズで整理される
現在はフェーズ3の入口で人とAIの役割が変化
会議データをAI解析するSaaSで横展開を進める
🔥
#2|スラッシュコマンドで回す開発 — プロセスを分解してAIに割り当てる - ACES エンジニアブロ..
人間はWhatとReviewを担い、AIはHowを実行する。
繰り返し作業を1コマンド1責務として分解する。
前提はユビキタス言語とガイドライン整備、AGENTS.mdとCLAUDE.mdを参照。
💬
2026年の技術で2024年のAITuberを『頑張らずに』再構築してみた
3層構造のAITuberを最新技術で再構築する
クラウド連携でPCレス自動配信を実現
魂・精神・肉体の3層で表現と自律運用を実装
🎉
GPU不要。国立国会図書館がノートPCで動くOCRソフト公開 - PC Watch
無償公開のOCRソフトNDLOCR-LiteはノートPCで動作確認済み。
GPU不要で従来版より汎用性が高く、公式GitHubから入手可能。
Windows 11/ macOS 15/ Ubuntu 22.04対応のCLIとデスクトップ版を提供。
🤖
GitHub - AlexsJones/llmfit: 206 models. 30 providers. One command to find what runs on you..
206モデル・57提供元を診断する端末ツールで1コマンド判定
品質・速度・適合・文脈の4軸でスコア付け、最適モデルを提案。
TUI/CLI対応で複数GPU・MoE・動的量子化・速度推定をサポート。
💥
US military leaders pressure Anthropic to bend Claude safeguards | US military | The Guard..
米軍幹部がAIの軍事利用に関し政府条件の遵守を迫る構図を協議した。
条件遵守を求め金曜までの同意か罰則の示唆が伝えられた。
国防当局は軍事運用を進める一方で障壁を理由に関係見直しを検討している。
✨
Anthropic Drops Flagship Safety Pledge | TIME
事前に安全対策が保証できない限り訓練を行わない方針を撤回した。
新方針は安全リスクの透明化を高め、対策を競合と同等以上を目指す。
重大リスクが認められれば開発を遅らせる規定を設け、計画と報告を定期公開する。
🤖
India's AI boom pushes firms to trade near-term revenue for users | TechCrunch
インドのAI普及は無料期間終了後の有料化へ動いている。
2025年、生成系AIアプリ市場は世界最大級となりダウンロードが207%増。
新デリーのAIサミットはインドの地位を示し、収益は約1%にとどまり低価格プランが鍵。
😊
AIのテストコードは信用するな🙅♂️
AIのテストコードは速いが設計は苦手
どこまで保証するかの設計不足で偽陽性が増える
外部観測で集約の振る舞いを保証する古典派は壊れにくいがロンドン派は観測点を増やす
🤖
仏教経典を学習した生成AIを搭載するヒューマノイドロボット「ブッダロイド」が発表
仏教経典を学習したAI搭載のヒューマノイドが発表された。
対話型AIや音声対話、合掌・座禅姿勢再現、将来的儀礼補助を備える。
心理的安全性の提供や人手不足緩和、倫理研究の意義を挙げる。
🚀
Introducing Mercury 2 – Inception
拡散推論の並列化で同時トークンを素早く生成
収束を短時間化し遅延蓄積を抑制する設計
互換性を活かして既存スタックへすぐ組み込み、用途は多様
🔥
米国防総省高官、アンソロピック従わぬなら「法律で強制」 AI軍事利用 - 日本経済新聞
防衛当局の高官がAI軍事利用の対立を強硬に示した。
協力しない場合は法的な強制もあり得ると示唆した。
同社CEOと防衛長官が会談し、今後の方針が注目されている。
🚀
Spanish 'soonicorn' Multiverse Computing releases free compressed AI model | TechCrunch
サイズ圧縮で実用性を高める取り組みが加速している。
量子計算発想の圧縮技術で大規模モデルを小型化。
HyperNova 60B 2602は32GBで元版の半分、推論とメモリを低減。
💡
Nvidia challenger AI chip startup MatX raised $500M | TechCrunch
元グーグル出身の技術者2人が創業した新興企業。
著名投資家2社を引受先に5億ドルのシリーズBを調達。
訓練・推論を大手GPUの10倍速へ、2027年出荷を目指す。
🚀
The AI for Science Forum: A new era of discovery
AIが科学研究の景観を変え、新時代の発見を拓く。
創薬の加速と新材料設計を進展させる。
学界・政策・産業が連携し、AIが科学的突破を促す。
🤖
Google introduces Gemini 2.0: A new AI model for the agentic era
代理的時代を見据えた新世代AIが実用化へ前進。
画像・音声出力やツール連携をネイティブに搭載。
安全性と責任ある開発を研究プロジェクトで追求。
✨
Updates to Veo, Imagen and VideoFX, plus introducing Whisk in Google Labs
Veo 2は4K対応の長尺動画作成が可能で高品質
VideoFX/ImageFX/LabsのWhiskで利用開始、待機リスト経由で拡大
Imagen 3は明るさ・構図・ディテールを改善、100カ国超へ展開
💡
Gemini 2.0 model updates: 2.0 Flash, Flash-Lite, Pro Experimental
2.0シリーズを拡充し高性能・低遅延とマルチモーダル出力を強化。
2.0 Flashを公開、ThinkingExperimental更新をAIStudioで実施、全ユーザーへ提供。
2.0 Flash-Liteはコスト最適化、ProExperimentalはコードと複雑プロンプト対応へ、モバイルへ拡大。
✨
Gemma 3: Google’s new open model based on Gemini 2.0
・4サイズの軽量オープンモデル、単一GPU/TPUで動作。
・35言語即時対応、140言語以上へ拡張。
・128k拡張コンテキストと関数呼出し・出力構造化、量子化で省資源。
🤖
Gemini 2.5: Our newest Gemini model with thinking
思考型推論で推論の精度と柔軟性を高める。
1百万トークンの文脈窓を搭載、2百万は近日追加予定。
現状は複数環境で利用可能、今後他環境にも対応予定。
🐬
DolphinGemma: How AI can decipher dolphin communication
イルカの鳴き声を解析し新音列を生み出すAI基盤を開発
約4億パラメータ級のAIが端末上で動作し実用性を示す
夏に公開予定、対話機能で人とイルカの交流を目指す
🎬
Try generating video in Gemini, powered by Veo 2
テキスト指示を動く動画へ変換し、8秒720pを生成。
月間上限があり、共有も簡単に行える。
SynthID透かし付きで、60カ国以上に提供、公式サイトへ。
🧠
Google I/O 2025: Gemini as a universal AI assistant
Transformer基盤とエージェント学習で基盤を築く。
世界モデルを拡張し計画・体験を創出する。
安全・倫理を重視し多タスクの活用を拡張する。
😂
Google I/O 2025: Updates to Gemini 2.5 from Google DeepMind
ジェミニ2.5シリーズの更新を発表した。
2.5 ProはWebDev ArenaとLM Arenaを制覇。
長文処理1Mトークンと高度推論を実験中、端末利用機能を追加。
🎨
Fuel your creativity with new generative media models and tools
新しい生成系メディアのモデルとツールを公開します。
音声付き動画と高精細画像・優れたタイポグラフィを提供します。
水印と検出機能で著作権と信頼性を高め、クリエイターと協働します。
🚀
SynthID Detector: Identify content made with Google’s AI tools
検証ポータルとして水印を横断検出・可視化します。
水印は画像からテキスト・音声・動画へ拡張済みで、多数適用されています。
使い方はアップロード→検出→結果表示で、公開準備と待機リスト受付中。
🎤
Gemini 2.5’s native audio capabilities
ネイティブ音声対話と生成を実現する多モードAI。
実時間対話は自然さとスタイル調整、ツール連携にも対応。
API経由でネイティブ音声を利用、SynthID水印で透明性を確保。
もっと見る
このサイトについて
/
ニュースレター
/
@AINewsDev