~AI関連記事を3行にまとめて紹介~
🚀
OpenAIを「限界点に達した」と退社したライケ氏、競合Anthropicで安全チーム結成へ - ITmedia NE..
ライケ氏が新たなチームでAIの監視や研究に取り組む
スーパーアラインメントミッションを継続する意欲を表明
カリフォルニア州の非公開企業で活動開始
🎉
「Opera」が「Google Cloud」と提携、AIモデル「Gemini」を統合へ - 窓の杜
OperaのAI機能Ariaに「Gemini」が統合される
Ariaは画像理解やOCR機能を提供
開発者ストリームで体験可能、製品版への導入も予定
🎥
Geminiは文章生成だけじゃない!仕事で使える、便利機能3選 | ライフハッカー・ジャパン
文章生成以外にもYouTube動画要約機能を提供
最大1時間の動画や11時間の音声を処理可能
Google I/O 2024でAI技術の最新情報が紹介
📚
GitHub - 2noise/ChatTTS: ChatTTS is a generative speech model for daily dialogue.
対話シナリオ向けテキスト読み上げモデルを提供
英語と中国語の10万時間以上のデータでトレーニング
HuggingFaceでオープンソース版を公開
🤖
Microsoft、「Copilot for Telegram」のβ提供開始 日本語もOK - ITmedia NEWS
Telegram用チャットbot「Copilot」β版が無料公開
日本語対応可能でテキスト会話に1日30回の制限
Meta AIやGeminiもSNS用チャットbotとして提供
📚
What We Learned from a Year of Building with LLMs (Part I) – O’Reilly
LLMを活用した開発は、実世界アプリケーションに「十分な」性能を示す
開発の際の教訓や手法を共有し、MLの専門知識不要で競争力を提供
戦術、運用、戦略の3セクションに分けた実践的ガイドを提供
🚀
AIによるコードレビュー "PR-Agent" を導入した効果と課題について
AIコードレビューの効果が確認される
全レビューをAIで置き換え不可
横断チームの対応策についても言及
🤟
GitHub - tan-ad/SignWave: An easy-to-use program that transcribes text or audio files into..
テキストやオーディオを手話アニメーションに転写
英語からアメリカ手話への翻訳を自動化
教育ツールとしても利用可能な手話翻訳プログラム
🤖
OpenAI、「最近、次世代モデルのトレーニングを開始した」 - ITmedia NEWS
次世代AIモデルのトレーニング開始を発表
AGIへの道のりで新たな能力に期待
安全およびセキュリティ委員会が重要決定に勧告
🔍
ChainlitとLangGraphを活用してAgentによる画像認識を実現する方法
Vision APIのドキュメントを確認し画像認識を実装
APIリクエストごとに画像を渡す必要があることを把握
Agentチャットアプリを改造し画像認識ツールを実装
👀
LLM でブラウザを操作する WEB エージェントと周辺技術のざっくり紹介 - Algomatic Tech Blog
ブラウザやモバイル画面を操作するLLMエージェントに焦点
Google I/O '24での新技術発表に言及
視覚的プロンプトやWEBナビゲーションの組み合わせに触れる
🤝
OpenAI signs on 100K PwC workers to its ChatGPT enterprise tier, as the consultant becomes..
PwCが10万人のユーザーでOpenAIのエンタープライズティアに参加
2023年8月に開始された企業向けティアは収益化の一環
カスタマイズされたモデル構築の柔軟性が企業利用を促進
🌟
GPT4-Vの100分の1のサイズで同等の性能を誇るマルチモーダルモデル「Llama 3-V」が登場、トレー..
GPT4-Vの100分の1サイズで同等性能の「Llama 3-V」が登場
トレーニング費用は500ドル、性能はLlama3 8Bをベースに向上
Hugging FaceとGitHubで公開、自由な質問や画像アップロード可能
😅
プログラムのコードをChatGPTに書かせても、その半分は間違っている | ギズモード・ジャパン
ChatGPTが生成するコードは約半分が誤り
35%のユーザーがAI生成コードを好む
AIの信頼性向上が今後の課題
👀
「AI声優」利用にルール、法的論点整理 政府戦略 - 日本経済新聞
AI声優の利用に関する法的論点を政府が戦略的に整理
権利保護と生成AI活用のバランスを法律で検討
経済産業省らが合成音声の法的課題に注目
👋
OpenAIの内紛でサム・アルトマンCEOが突然解任された理由の一端が元取締役の口から語られる - GI..
CEOの解任は取締役会とのコミュニケーション不足が原因
取締役会の責任を果たす能力に疑問が持たれた
人類に利益をもたらす使命に注力するとOpenAIは表明
👀
OpenAIがサム・アルトマンCEOを含む「安全・セキュリティ委員会」を設置、さらにGPT-4後継モデル..
「安全・セキュリティ委員会」が新設され、重要な決定を勧告
次世代モデルのトレーニングが進行中、安全性の評価も実施
AGIの研究チーム解散、元主任研究員が別の企業へ移籍
👨💻
働いてみないとわかりにくいIT業界の構造 SI系・プロダクト系それぞれで異なる“求められる能力..
IT業界はSIとプロダクト系でビジネスモデルが異なる
仕事内容や求められる能力、キャリアパスに違い
生成AIに注力し、開発技術力の重要性を説く
🏢
With the EU AI Act incoming this summer, the bloc lays out its plan for AI governance | Te..
欧州連合が新しいAIオフィスの構造を発表
AI法の下でエコシステム構築・監督を担当
7月末までにリスクベースの規制フレームワーク施行
😊
AI搭載エディタCursorの紹介と機械学習コンペでの使用レビュー - Speaker Deck
社内技術共有会でAIエディタの機能紹介
CursorのAI機能について解説
Kaggleでの活用方法を共有
🤓
東京都の生成AI活用事例集にツッコミを入れてみる|さいぴ
生成AIの事業を手掛けるCTOが資料をレビュー
資料には都職員の創意工夫や業務活用事例が記載
ChatGPTの活用法や高品質なプロンプト作成の重要性を解説
😍
開発者に必要なスキルが激変、要件定義や設計も生成AIのカバー範囲に | 日経クロステック(xTECH..
生成AIがソフトウェア開発の要件定義や設計を支援
AIエージェントが開発工程の自動化を促進し業務改善
将来的にはAIが要件や設計の議論を代行する可能性
🆕
OpenAI training its next major AI model, forms new safety committee | Ars Technica
新しい「安全保障委員会」がリスク管理を監督
次世代モデルのトレーニング開始でAGIに近づく
AIの「フロンティアモデル」は能力の限界を押し広げる
🤖
Training is not the same as chatting: ChatGPT and other LLMs don’t remember everything yo..
LLMは状態を持たない関数と考えるべきです
新しいチャットごとに短期記憶がリセットされます
異なるLLMは異なるコンテキスト長を持っています
👀
テキスト生成AI利活用におけるリスクへの対策ガイドブック(α版)|デジタル庁
AIのリスクと対策を官民で検討
テキスト生成AIの利用形態によるリスク分類
政府職員やAI開発者を対象としたガイドブック
🆕
Codestral: Hello, World! | Mistral AI | Frontier AI in your hands
2024年5月29日、初のコード生成AIモデル「Codestral」が紹介される
80以上の言語に対応し、開発者のコーディング作業を効率化
22Bのオープンウェイトモデルで、HuggingFaceからダウンロード可能
📚
「AIチャットbotを作りたいけど、どんなリスクがあるの?」 デジタル庁、テキスト生成AIのガイ..
テキスト生成AI利用時のリスクや対策をまとめたガイドブック公開
政府情報システム開発者向けに59ページの内容を提供
2023年12月から生成AIの業務利用技術検証を進行
🚀
Benchmarking Text Generation Inference
テキスト生成推論のプロファイリングと展開調整に役立つツールを紹介
大規模言語モデルの効率化技術とその展開の最適化に焦点
ベンチマークツールでスループットとレイテンシのトレードオフを理解
💻
End-to-end LLM training on instance clusters with over 100 nodes using AWS Trainium | AWS ..
AWS Trainiumを活用し100ノード以上でLLMトレーニングを実施
Llama 2-7Bモデルのスケーリングとトレーニングの最適化を紹介
トレーニングの安定性と収束を達成する技術的詳細を解説
📈
Fine-tune large multimodal models using Amazon SageMaker | AWS Machine Learning Blog
マルチモーダルモデルは複数のデータタイプを統合
テキストと画像などを組み合わせて理解を深める
医療やビジネス分析に応用可能な技術
😍
Microsoft’s Copilot is now on Telegram | TechCrunch
テレグラム内でAIチャットボットとしてCopilotが利用可能に
ベータ版で@CopilotOfficialBotから無料でアクセス
Microsoft以外にもMetaやGoogleがAIチャットボットをテスト
🤖
No, Today’s AI Isn’t Sentient. Here’s How We Know | TIME
人工一般知能は人間と同等の知性を持つAIを指す
AGIは特定のタスクに特化したAIから発展
初期のAIはチェスに勝つが危険察知はできない
🔬
LLMエージェントの設計16パターン | AIDB
LLMエージェント設計には推論の不確実性などの課題
研究者が16種類の設計パターンをまとめる
エージェントの構成要素に焦点を当てたカタログ作成
🇫🇷
Mistral releases Codestral, its first generative AI model for code | TechCrunch
フランスのAIスタートアップが生成AIモデルをリリース
80以上の言語でトレーニングされたコーディング支援ツール
22億のパラメータを持ち、高性能PCでの利用が必要
🔍
Enhance image search experiences with Amazon Personalize, Amazon OpenSearch Service, and A..
画像検索体験を向上させるための多モーダルモデルの活用
CLIPとBLIPは画像とテキストのマッピングで人間に迫る成果
Amazon Titan Multimodal Embeddingsで検索をパーソナライズ
📸
Efficient High-Resolution Multiview Diffusion on Canonical Orthogonal Cameras
単一画像から高解像度マルチビュー画像を生成する手法を紹介
焦点距離と仰角を推定し形状の歪みを防ぐカメラ予測モジュールを提案
12倍の計算複雑さ削減と512×512の高品質画像生成を実現
👩💻
The women in AI making a difference | TechCrunch
AI分野で活躍する女性にスポットを当てる
未認識の業績を紹介する記事シリーズを展開
読者からの新しい名前の提案も募集
🎬
What Scarlett Johansson v. OpenAI Could Look Like in Court | WIRED
OpenAIが披露した声「Sky」が映画「Her」のAIを彷彿とさせる
ヨハンソンが法的代理人を雇い、Skyの使用停止を要求
知的財産専門家は肖像権法に焦点を当てる可能性を指摘
😱
California Senate Passes SB 1047 - by Dean W. Ball
カリフォルニア州でAI規制のSB 1047が可決される
Frontier Model DivisionがAI開発者の安全プロトコルを規定
10^26フロップ以上のAIモデルが規制対象に含まれる
🖥️
【西川和久の不定期コラム】初心者も簡単!ついにPCで104BのLLMも動かせるようになった!そして..
PCで104BのLLMを動かす方法とマルチモーダルについて解説
メインメモリ使用で104Bモデルの動作が可能に、VRAMは10GB以上必要
LM Studioを使い、簡単な手順でLLMやマルチモーダルを体験
🤓
OpenAIの共同設立者が「GPT-2」をわずか90分の時間と3100円の費用で再現するレポートを公開 - GI..
GPT-2 124Mを90分で再現、コストは約20ドル
GPT-2 350Mは14時間のトレーニングで200ドル
今後はGPT-2のサイズ増やし、コードの洗練に注力
2024年05月30日
|
2024年05月28日
このサイトについて
/
ニュースレター
/
@AINewsDev