AI News

~AI関連記事を3行にまとめて紹介~

🚀

OpenAIを「限界点に達した」と退社したライケ氏、競合Anthropicで安全チーム結成へ - ITmedia NE..

  • ライケ氏が新たなチームでAIの監視や研究に取り組む
  • スーパーアラインメントミッションを継続する意欲を表明
  • カリフォルニア州の非公開企業で活動開始

🎉

「Opera」が「Google Cloud」と提携、AIモデル「Gemini」を統合へ - 窓の杜

  • OperaのAI機能Ariaに「Gemini」が統合される
  • Ariaは画像理解やOCR機能を提供
  • 開発者ストリームで体験可能、製品版への導入も予定

🎥

Geminiは文章生成だけじゃない!仕事で使える、便利機能3選 | ライフハッカー・ジャパン

  • 文章生成以外にもYouTube動画要約機能を提供
  • 最大1時間の動画や11時間の音声を処理可能
  • Google I/O 2024でAI技術の最新情報が紹介

📚

GitHub - 2noise/ChatTTS: ChatTTS is a generative speech model for daily dialogue.

  • 対話シナリオ向けテキスト読み上げモデルを提供
  • 英語と中国語の10万時間以上のデータでトレーニング
  • HuggingFaceでオープンソース版を公開

🤖

Microsoft、「Copilot for Telegram」のβ提供開始 日本語もOK - ITmedia NEWS

  • Telegram用チャットbot「Copilot」β版が無料公開
  • 日本語対応可能でテキスト会話に1日30回の制限
  • Meta AIやGeminiもSNS用チャットbotとして提供

📚

What We Learned from a Year of Building with LLMs (Part I) – O’Reilly

  • LLMを活用した開発は、実世界アプリケーションに「十分な」性能を示す
  • 開発の際の教訓や手法を共有し、MLの専門知識不要で競争力を提供
  • 戦術、運用、戦略の3セクションに分けた実践的ガイドを提供

🚀

AIによるコードレビュー "PR-Agent" を導入した効果と課題について

  • AIコードレビューの効果が確認される
  • 全レビューをAIで置き換え不可
  • 横断チームの対応策についても言及

🤟

GitHub - tan-ad/SignWave: An easy-to-use program that transcribes text or audio files into..

  • テキストやオーディオを手話アニメーションに転写
  • 英語からアメリカ手話への翻訳を自動化
  • 教育ツールとしても利用可能な手話翻訳プログラム

🤖

OpenAI、「最近、次世代モデルのトレーニングを開始した」 - ITmedia NEWS

  • 次世代AIモデルのトレーニング開始を発表
  • AGIへの道のりで新たな能力に期待
  • 安全およびセキュリティ委員会が重要決定に勧告

🔍

ChainlitとLangGraphを活用してAgentによる画像認識を実現する方法

  • Vision APIのドキュメントを確認し画像認識を実装
  • APIリクエストごとに画像を渡す必要があることを把握
  • Agentチャットアプリを改造し画像認識ツールを実装

👀

LLM でブラウザを操作する WEB エージェントと周辺技術のざっくり紹介 - Algomatic Tech Blog

  • ブラウザやモバイル画面を操作するLLMエージェントに焦点
  • Google I/O '24での新技術発表に言及
  • 視覚的プロンプトやWEBナビゲーションの組み合わせに触れる

🤝

OpenAI signs on 100K PwC workers to its ChatGPT enterprise tier, as the consultant becomes..

  • PwCが10万人のユーザーでOpenAIのエンタープライズティアに参加
  • 2023年8月に開始された企業向けティアは収益化の一環
  • カスタマイズされたモデル構築の柔軟性が企業利用を促進

🌟

GPT4-Vの100分の1のサイズで同等の性能を誇るマルチモーダルモデル「Llama 3-V」が登場、トレー..

  • GPT4-Vの100分の1サイズで同等性能の「Llama 3-V」が登場
  • トレーニング費用は500ドル、性能はLlama3 8Bをベースに向上
  • Hugging FaceとGitHubで公開、自由な質問や画像アップロード可能

😅

プログラムのコードをChatGPTに書かせても、その半分は間違っている | ギズモード・ジャパン

  • ChatGPTが生成するコードは約半分が誤り
  • 35%のユーザーがAI生成コードを好む
  • AIの信頼性向上が今後の課題

👀

「AI声優」利用にルール、法的論点整理 政府戦略 - 日本経済新聞

  • AI声優の利用に関する法的論点を政府が戦略的に整理
  • 権利保護と生成AI活用のバランスを法律で検討
  • 経済産業省らが合成音声の法的課題に注目

👋

OpenAIの内紛でサム・アルトマンCEOが突然解任された理由の一端が元取締役の口から語られる - GI..

  • CEOの解任は取締役会とのコミュニケーション不足が原因
  • 取締役会の責任を果たす能力に疑問が持たれた
  • 人類に利益をもたらす使命に注力するとOpenAIは表明

👀

OpenAIがサム・アルトマンCEOを含む「安全・セキュリティ委員会」を設置、さらにGPT-4後継モデル..

  • 「安全・セキュリティ委員会」が新設され、重要な決定を勧告
  • 次世代モデルのトレーニングが進行中、安全性の評価も実施
  • AGIの研究チーム解散、元主任研究員が別の企業へ移籍

👨‍💻

働いてみないとわかりにくいIT業界の構造 SI系・プロダクト系それぞれで異なる“求められる能力..

  • IT業界はSIとプロダクト系でビジネスモデルが異なる
  • 仕事内容や求められる能力、キャリアパスに違い
  • 生成AIに注力し、開発技術力の重要性を説く

🏢

With the EU AI Act incoming this summer, the bloc lays out its plan for AI governance | Te..

  • 欧州連合が新しいAIオフィスの構造を発表
  • AI法の下でエコシステム構築・監督を担当
  • 7月末までにリスクベースの規制フレームワーク施行

😊

AI搭載エディタCursorの紹介と機械学習コンペでの使用レビュー - Speaker Deck

  • 社内技術共有会でAIエディタの機能紹介
  • CursorのAI機能について解説
  • Kaggleでの活用方法を共有

🤓

東京都の生成AI活用事例集にツッコミを入れてみる|さいぴ

  • 生成AIの事業を手掛けるCTOが資料をレビュー
  • 資料には都職員の創意工夫や業務活用事例が記載
  • ChatGPTの活用法や高品質なプロンプト作成の重要性を解説

😍

開発者に必要なスキルが激変、要件定義や設計も生成AIのカバー範囲に | 日経クロステック(xTECH..

  • 生成AIがソフトウェア開発の要件定義や設計を支援
  • AIエージェントが開発工程の自動化を促進し業務改善
  • 将来的にはAIが要件や設計の議論を代行する可能性

🆕

OpenAI training its next major AI model, forms new safety committee | Ars Technica

  • 新しい「安全保障委員会」がリスク管理を監督
  • 次世代モデルのトレーニング開始でAGIに近づく
  • AIの「フロンティアモデル」は能力の限界を押し広げる

🤖

Training is not the same as chatting: ChatGPT and other LLMs don’t remember everything yo..

  • LLMは状態を持たない関数と考えるべきです
  • 新しいチャットごとに短期記憶がリセットされます
  • 異なるLLMは異なるコンテキスト長を持っています

👀

テキスト生成AI利活用におけるリスクへの対策ガイドブック(α版)|デジタル庁

  • AIのリスクと対策を官民で検討
  • テキスト生成AIの利用形態によるリスク分類
  • 政府職員やAI開発者を対象としたガイドブック

🆕

Codestral: Hello, World! | Mistral AI | Frontier AI in your hands

  • 2024年5月29日、初のコード生成AIモデル「Codestral」が紹介される
  • 80以上の言語に対応し、開発者のコーディング作業を効率化
  • 22Bのオープンウェイトモデルで、HuggingFaceからダウンロード可能

📚

「AIチャットbotを作りたいけど、どんなリスクがあるの?」 デジタル庁、テキスト生成AIのガイ..

  • テキスト生成AI利用時のリスクや対策をまとめたガイドブック公開
  • 政府情報システム開発者向けに59ページの内容を提供
  • 2023年12月から生成AIの業務利用技術検証を進行

🚀

Benchmarking Text Generation Inference

  • テキスト生成推論のプロファイリングと展開調整に役立つツールを紹介
  • 大規模言語モデルの効率化技術とその展開の最適化に焦点
  • ベンチマークツールでスループットとレイテンシのトレードオフを理解

💻

End-to-end LLM training on instance clusters with over 100 nodes using AWS Trainium | AWS ..

  • AWS Trainiumを活用し100ノード以上でLLMトレーニングを実施
  • Llama 2-7Bモデルのスケーリングとトレーニングの最適化を紹介
  • トレーニングの安定性と収束を達成する技術的詳細を解説

📈

Fine-tune large multimodal models using Amazon SageMaker | AWS Machine Learning Blog

  • マルチモーダルモデルは複数のデータタイプを統合
  • テキストと画像などを組み合わせて理解を深める
  • 医療やビジネス分析に応用可能な技術

😍

Microsoft’s Copilot is now on Telegram | TechCrunch

  • テレグラム内でAIチャットボットとしてCopilotが利用可能に
  • ベータ版で@CopilotOfficialBotから無料でアクセス
  • Microsoft以外にもMetaやGoogleがAIチャットボットをテスト

🤖

No, Today’s AI Isn’t Sentient. Here’s How We Know | TIME

  • 人工一般知能は人間と同等の知性を持つAIを指す
  • AGIは特定のタスクに特化したAIから発展
  • 初期のAIはチェスに勝つが危険察知はできない

🔬

LLMエージェントの設計16パターン | AIDB

  • LLMエージェント設計には推論の不確実性などの課題
  • 研究者が16種類の設計パターンをまとめる
  • エージェントの構成要素に焦点を当てたカタログ作成

🇫🇷

Mistral releases Codestral, its first generative AI model for code | TechCrunch

  • フランスのAIスタートアップが生成AIモデルをリリース
  • 80以上の言語でトレーニングされたコーディング支援ツール
  • 22億のパラメータを持ち、高性能PCでの利用が必要

🔍

Enhance image search experiences with Amazon Personalize, Amazon OpenSearch Service, and A..

  • 画像検索体験を向上させるための多モーダルモデルの活用
  • CLIPとBLIPは画像とテキストのマッピングで人間に迫る成果
  • Amazon Titan Multimodal Embeddingsで検索をパーソナライズ

📸

Efficient High-Resolution Multiview Diffusion on Canonical Orthogonal Cameras

  • 単一画像から高解像度マルチビュー画像を生成する手法を紹介
  • 焦点距離と仰角を推定し形状の歪みを防ぐカメラ予測モジュールを提案
  • 12倍の計算複雑さ削減と512×512の高品質画像生成を実現

👩‍💻

The women in AI making a difference | TechCrunch

  • AI分野で活躍する女性にスポットを当てる
  • 未認識の業績を紹介する記事シリーズを展開
  • 読者からの新しい名前の提案も募集

🎬

What Scarlett Johansson v. OpenAI Could Look Like in Court | WIRED

  • OpenAIが披露した声「Sky」が映画「Her」のAIを彷彿とさせる
  • ヨハンソンが法的代理人を雇い、Skyの使用停止を要求
  • 知的財産専門家は肖像権法に焦点を当てる可能性を指摘

😱

California Senate Passes SB 1047 - by Dean W. Ball

  • カリフォルニア州でAI規制のSB 1047が可決される
  • Frontier Model DivisionがAI開発者の安全プロトコルを規定
  • 10^26フロップ以上のAIモデルが規制対象に含まれる

🖥️

【西川和久の不定期コラム】初心者も簡単!ついにPCで104BのLLMも動かせるようになった!そして..

  • PCで104BのLLMを動かす方法とマルチモーダルについて解説
  • メインメモリ使用で104Bモデルの動作が可能に、VRAMは10GB以上必要
  • LM Studioを使い、簡単な手順でLLMやマルチモーダルを体験

🤓

OpenAIの共同設立者が「GPT-2」をわずか90分の時間と3100円の費用で再現するレポートを公開 - GI..

  • GPT-2 124Mを90分で再現、コストは約20ドル
  • GPT-2 350Mは14時間のトレーニングで200ドル
  • 今後はGPT-2のサイズ増やし、コードの洗練に注力

2024年05月30日

|

このサイトについて

/

ニュースレター

/

@AINewsDev