AI News

~AI関連記事を3行にまとめて紹介~

🤖

xAI、AIチャットボット「Grok」発表。Xのデータで学習、きわどい質問にユーモア交えて回答 | テ..

  • 新AIチャットボット「Grok」は、最新の情報に関する質問にも回答可能で、ユーモラスな反応を示す
  • Grokはまだベータ版で、一部のユーザーに試験的な使用が許可されている
  • 最終的にはGrokをプレミアムサービスに含める予定で、AIの使命として理解を深めることを目指している

🚀

[速報]OpenAI DevDayの発表内容をまとめる!GPT VisionのAPI提供やGPT-4 turboのリリースなど | ..

  • 2023年11月6日に開催されたOpenAI DevDayで、GPT-4 TurboやGPT-4のFine-tuning、Whisper v3のリリースなどが発表されました。
  • Text2Speech APIの追加やGPTsのリリース、GPT StoreやAssistants APIのリリースも発表されました。
  • Microsoftとの連携強化や著作権問題への取り組みも発表され、これらの新機能は未来を感じさせるものであり、今後の展開が楽しみです。

💰

OpenAI、改良版生成AIモデル「GPT-4 Turbo」を「GPT-4」より安価に提供へ - ITmedia NEWS

  • 「GPT-4 Turbo」は入力トークンが3分の1、出力トークンが半額の改良版AIモデル
  • テキスト分析向けとテキスト&画像理解向けの2つのバージョンがあり、利用料金はそれぞれ異なる
  • トレーニングデータは2023年4月までで、コンテキストウィンドウは12万8000トークンに拡大

🚀

OpenAI Dev Day 2023 まとめ - 吉田の備忘録

  • GPT-4 Turboが導入され、128kのコンテキストウィンドウをサポートし、高いパフォーマンスと低価格で提供
  • 新しいAssistants APIやマルチモーダル機能、関数呼び出しの改善、指示に従う機能とJSONモードの改善、再現可能な出力とログ確率の導入、GPT-3.5 Turboのアップデートなども発表
  • 新しいモダリティやテキストから音声への変換も可能で、モデルのカスタマイズや価格の低下、レートリミットの増加も行われた

🧠

考えるだけで家事ができる脳操作ロボットシステム「NOIR」、すき焼きをつくることも!?米スタンフ..

  • スタンフォード大学の研究者らが脳の信号を使用してロボットに日常の動作を指示するシステム「NOIR」を提案
  • NOIRシステムは少数の学習サンプルからも人間の意図を予測でき、効率的な対話が可能
  • NOIRシステムは高い効率と精度で日常的なタスクを実行することが確認された

💻

OpenAI Python API Library v1.0 入門|npaka

  • OpenAI Python API Libraryを使ってPythonでOpenAI APIにアクセスする方法を紹介
  • セットアップはColabで行い、パッケージのインストール、環境変数の準備、クライアントの準備を行う
  • テキスト生成、チャット、非同期処理、ストリーミングの方法も説明

🧠

サイバーエージェント、全社的なAI人材育成に向けて「生成AI徹底理解リスキリング」をスタート |..

  • 全社員を対象に「生成AI徹底理解リスキリング」を開始し、AI人材育成を強化
  • 11月からは全社員向けのプログラムを開始し、基礎知識を身につける
  • 2024年からは「生成AI徹底理解リスキリング for ML Engineers」を開始予定

😆

OpenAI DevDay日本最速レポ!GPT-4 Turbo、GPTs、Assistant APIとは?ChatGPT最新情報徹底解説 |..

  • OpenAI DevDayでGPT-4 Turbo、GPTs、Assistant APIなどの新情報が公開されました。
  • GPT-4 TurboはChatGPT APIで、128,000トークンまでサポート可能で、より正確な情報を提供します。
  • GPTsはChatGPTをカスタマイズでき、Assistant APIにはPersistent ThreadsやData Retrievalなどの便利な機能が追加されました。

👍

Google Colab で DALL-E 3 のAPIを試す|npaka

  • 「Google Colab」で「DALL-E 3」のAPIを試す方法をまとめた
  • 「DALL-E 3」では「テキストからの画像生成」のみが利用可能
  • セットアップ手順と画像生成手順が詳細に説明されている

🖼️

(続)ファッションにおける類似商品検索アルゴリズムの性能評価 - DROBEプロダクト開発ブログ

  • ファッションアイテムの特徴を抽出するために、画像とテキストの情報を組み合わせて検索の精度を向上させる手法を評価
  • 画像とテキストの両方を活用することで、性能が大幅に改善することを確認
  • 画像と単語情報を組み合わせてファッションコーディネートを推薦する手法と比較して、我々の手法は性能の向上を示した

🚀

今日発表された「ChatGPTのアップデート内容」まとめ | ギズモード・ジャパン

  • ChatGPT Plusの全追加機能が同時に使えるようになり、GPT-4 Turboが登場しました。
  • 超長文プロンプトが可能になり、ユーザーが欲しい情報を出力するAIアプリや高度な画像認識・テキスト出力を活用したアプリが作れるようになります。
  • 開発者に関連する内容は、GPT-4 Turboが128Kのトークン数を扱えるようになり、ひとつのプロンプトで複数の行動が可能になり、出力を制御しやすくなりました。

📈

転換的なAIの下での経済成長 - himaginary’s diary

  • AIは資本の労働代替や業務自動化により生産を増やし、経済成長を加速させる可能性がある
  • AIは労働分配率を下げる可能性がある
  • AIが知識生産を増やし、資本を自己改善させることで、成長率をさらに高めることも示唆されている

💻

Google Colab で OpenAI API の Vision を試す|npaka

  • 「GPT-4 with Vision」は画像について質問応答を行うAPIで、現在は「gpt-4-vision-preview」と「Chat Completions API」を介して利用可能
  • セットアップ手順は、パッケージのインストールと環境変数の準備が必要
  • 画像の質問応答は、画像URLまたは画像ファイルを指定して行え、画像の理解度や管理方法に注意が必要

🔄

「京大生でもx=x+1が分からない」、喜多教授が明かすPython教育の実態 | 日経クロステック(xT..

  • 大学1年生向けのプログラミングコースを2018年に開始し、教科書を公開している
  • 授業では「反転授業」を採用し、学生が宿題を提出し、フィードバックを受ける形式を取っている
  • 学生がプログラミングに苦労する例として、「x=x+1」というコードを挙げ、数学の知識を活かして解説する

📢

OpenAI、「ChatGPT」の独自バージョンを構築可能に - CNET Japan

  • OpenAIは、ユーザーが特定用途のChatGPTを構築できるようにすると発表
  • プログラミングの知識がなくても、自然な言葉による指示と追加の知識を与えてアプリを作成可能
  • 11月中に「GPT Store」を立ち上げ、認証された開発者のGPTsを提供予定

🎉

ノーコードで「ChatGPT」のカスタム版を作れる「GPTs」、有料会員に提供へ - ITmedia NEWS

  • 「OpenAI DevDay」で、ノーコードで「ChatGPT」のカスタム版を作れる「GPTs」が発表された。
  • プロンプトからの指示で対話しながらオリジナルのChatGPTを構築でき、Web検索や画像作成、データ分析などと同じくらい簡単とされている。
  • 「GPT Store」も11月中に開店予定で、売り上げの一部は開発者に分配する計画だ。

💪

困難だった“食べ歩き用プリン”開発 ChatGPTに解決を託した、とある乳製品メーカーの話 【プ..

  • AIチャット「ChatGPT」を活用し、食べ歩き用プリンの開発に成功した。
  • 商品名は「山村ぷりんバー」で、棒付きアイスのような形状だが、中身は本物のプリン。
  • 開発には約半年かかり、11月1日から販売を開始。今後も新商品開発に活用する予定。

📢

OpenAIがGPT-4 Turbo発表、従来よりも安価で高性能に。画像入力に特化したGPT-4 Turbo with Visi..

  • OpenAIが開発者会議で新しい生成AIモデル「GPT-4 Turbo」を発表
  • GPT-4 Turboは2023年4月までのデータに対応し、処理できるテキスト量が増え、価格も安くなった
  • 画像入力に特化したGPT-4 Turbo with Visionも発表、有料開発者はAPIを通じて利用可能

🎙️

Google Colab で OpenAI API の Text-to-Speech を試す|npaka

  • 「Google Colab」で「OpenAI API」の「Text-to-Speech」を試用
  • テキストを読み上げるAPIで、6つのボイスが選択可能
  • オーディオ品質や音声オプションについてのTipsも提供

💻

米オープンAIが新基盤を発表 アプリストアのように収入を得ることも可能に!?「GPTストア」 | TB..

  • 新しいモデル「GPT‐4ターボ」が発表されました。
  • アプリストアのような収入を得ることが可能になる可能性があります。
  • 初めての開発はサンフランシスコで行われました。

🎉

YouTube、動画視聴時に使える会話型AIツールのテストを開始。質問や内容の要約が可能に | テクノ..

  • YouTubeが会話型AIツールのテストを開始し、現在は米国の18歳以上のYouTube Premium加入者が利用可能
  • 新機能「Ask」ボタンを使ってAIと対話し、動画の要約や関連動画のおすすめが可能
  • AIチャットボットの利用により情報収集が行われ、質問は30日後に削除される

👨‍💻

Google Colab で OpenAI API の Retrieval を試す|npaka

  • 「Google Colab」で「OpenAI API」の「Retrieval」を試す方法をまとめました
  • 「Retrieval」は、モデル外部からの知識を取得し、AIアシスタントを強化します
  • セットアップ手順には、パッケージのインストールと環境変数の準備、ドキュメントの準備とアシスタントの実行手順があります

🗣️

オペレーティング・システムから、オペレーティング・エージェントへ|深津 貴之 (fladdict)

  • OpenAIのDevDayでの発表は、ChatGPTを言語で命令できるオペレーティングエージェントとして位置付けている
  • AIを人生のあらゆるタッチポイントでのゲートキーパーとして位置づけ、音声認識や音声合成、マルチモーダルなどの機能を統合した統合会話形エージェントを作りたいと考えている
  • この進化は、企業や個人のビジネスモデルやコミュニケーション方法に大きな影響を与える可能性があり、我々は自己のポジションと価値を考える必要がある

😎

OpenAIのgpt-4-vision-previewに画像を投げてどんなことをしてくれるのか試してみた|ねぎぽよし

  • OpenAI DevDaysでマルチモーダルAPIが公開され、GPT-4が視覚を持つようになりました
  • 画像はURLまたはBase64エンコードで受け付け、特定の画像やチェスの盤面は苦手です
  • 画像を解釈して文字にする能力が強化されました

🎉

OpenAIがコーディング不要でChatGPTをカスタムできる「GPTs」発表&自分のGPTsを公開できる「GPT..

  • OpenAIがカスタム可能なChatGPT「GPTs」を発表、自分好みのチャットAIを作成可能に
  • GPTsはAPIの呼び出しに対応、メールの読み取りや買い物アシスタントの機能も追加可能
  • 自分で作成したGPTsを公開できる「GPT Store」も2023年11月中に展開予定

🤖

OpenAI、アプリに「アシスタント」を埋め込める「Assistants API」をβリリース - ITmedia NEWS

  • 「Assistants API」は開発者が自分のアプリにAIアシスタントを搭載できる
  • アプリ内で外部情報を取り入れてタスクを実行可能
  • 将来的には、コードインタープリターや検索コンポーネント、関数呼び出しを補完する独自の駆動ツールを追加予定

💼

優秀なエンジニアをどう集めるべきか?日本で最も多くの「Kaggle Grandmaster」を抱えるRistの担..

  • 優秀なエンジニアの採用と育成は企業にとって不可欠で、市場価値の高いIT人材を採用するのは難しい
  • Kaggle枠採用では、成績に応じて給与や福利厚生を提供し、業務時間の一部をKaggleの活動に充てることができる
  • エンジニアの採用においては、給与よりも環境や成長機会が重視される

💬

ChatGPTユーザーは毎週1億人 著作権侵害防止の「Copyright Shield」追加 - ITmedia NEWS

  • AIチャットボット「ChatGPT」の週当たりユーザー数が1億人に達した。
  • 企業向けの「ChatGPT Enterprise」はFortune 500社の92%以上で利用され、APIを利用する開発者は200万人以上。
  • 新機能「Copyright Shield」が発表され、生成AIモデルはWeb上の公開データを使用してトレーニングされていることも明らかになった。

🚀

HuggingFace Diffusers v0.22.0の新機能|npaka

  • 拡散モデルの推論処理がLatent Consistency Models (LCM)により高速化
  • PixArt-Alphaは、高品質な画像生成を効率的に行うTransformerベースの拡散モデル
  • AnimateDiffは、Text-to-Imageモデルを使用して動画を作成するフレームワーク

📊

Comparing the Performance of LLMs: A Deep Dive into Roberta, Llama 2, and Mistral for Disa..

  • LLMのパフォーマンス比較についての深い洞察
  • Roberta、Llama 2、Mistralを使用したLoRAを用いた災害ツイートの分析
  • ハイパーパラメータのチューニングと結果について

🔎

イーロン・マスクの人工知能企業xAIがプロンプトエンジニアリング用統合開発環境「PromptIDE」を..

  • 「PromptIDE」はプロンプトエンジニアリングと解釈可能性の研究を加速する統合開発環境
  • Pythonコードエディターとしてプロンプト技術の実装機能を提供し、分析スイートも充実
  • AIの透明性と有効性を高め、AIの不透明さを解消し、オープン性と進歩に貢献すると期待されている

💡

パブリックコメント「AI時代における知的財産権」 | NAFCA 一般社団法人日本アニメフィルム文化..

  • 生成AIと著作権の関係について、学習用データの利用や生成AIが出力したものの著作物性に懸念がある
  • 生成AIによる権利侵害がアニメ業界にも脅威となり、声の肖像権や商標権の法的体系化を望んでいる
  • オプトアウトの権利を保障するために、国による技術開発の全力取り組みが必要

💰

OpenAIが著作権侵害で法的請求が発生した場合にユーザーを守り発生費用を全額支払う「著作権シー..

  • 「著作権シールド」が発表され、ユーザーの著作権侵害に関する法的請求が発生した場合、全額費用を支払う
  • 対象はChatGPT Enterpriseおよび開発者プラットフォームの利用者
  • MicrosoftやGoogle、Amazonも同様の施策を行っており、画像生成AIではAdobeやGetty Images、Shutterstockが全額補償することを発表

💡

ASCII.jp:OpenAI発表まとめ カスタ厶版「ChatGPT」作成機能、128Kの長文入力に対応した「GPT-4..

  • 新たな大規模言語モデル「GPT-4 Turbo」が発表され、最新情報に対応し、入力ウィンドウも16倍に拡大
  • 開発者は自分のニーズに合わせたカスタムAIアシスタントを作成できる「GPTs」も導入
  • 開発者向けの「Assistants API」もリリースされ、複雑なタスクの実行や長い会話も可能に

💡

生成AIの新システム開発 安全性確認などのルール作り検討 政府 | NHK | 生成AI・人工知能

  • 政府は生成AIの利活用についてリスクを指摘し、具体的なルールづくりの検討を進めるために外部監査を行うことを決めました。
  • 金融やエネルギー、運輸や医療などの分野における規制についても議論することが確認されました。
  • 来年からは省庁のデータを活用するための取り組みも始めることが決まりました。

📚

rinna、日本語LLM「Youri 7B」シリーズを公開。Llama 2を日本語データで継続事前学習 - INTERNET..

  • 「Youri 7B」シリーズは、英語テキスト生成能力の高いLlama 2をベースに日本語データで事前学習を行った
  • 対話形式でユーザーの指示を遂行する「Youri 7B Instruction」と「Youri 7B Chat」も開発
  • 省メモリのGPUでも利用可能な軽量モデルも公開し、日本語タスクで高い性能を示す

👎

Judge Dismisses Copyright Claims Against AI Image Generators | PetaPixel

  • AI画像生成器に対する著作権侵害の訴えがカリフォルニアの裁判官によりほぼ却下されました。
  • 原告のうち2人が作品を米国著作権庁に登録していなかったため、問題が発生しました。
  • 漫画家のSarah Andersenの訴えは進行することになり、裁判官は訴えを修正する機会を与えました。

💡

GPT-4VのAPIをサクッと使ってみる!|peisuke

  • GPT-4VのAPIを使えば、画像に対して質問を投げることが可能です。
  • APIの使い方は画像をbase64エンコードして送信するだけと簡単です。
  • 今回は早稲田大学の講義のページの画像に対して、制約条件付き最適化の問題を解かせてみたところ、最適な値と最小値が得られました。

📚

Between Dreams and Reality: Generative Text and Hallucinations - KDnuggets

  • 大規模言語モデル(LLM)は、訓練フェーズで保持された知識を活用してテキストを生成しますが、その生成が正確かどうかは判断が難しいです。
  • LLMの欠点として、生成されたテキストが魅力に欠けたり、一貫性がなかったり、単調な繰り返しに陥ることがあります。
  • LLMの幻覚は、モデルが不正確で意味のない、または現実ではないテキストを生成する現象を指します。

📱

The OpenAI Keynote – Stratechery by Ben Thompson

  • 2013年にStratecheryが始まった当時、スマートフォンは新しく、プラットフォームの戦略的な決定と最終的な運命は未解決の問題でした。
  • 10年後、テックのキーノートは重要性が低下し、Appleの場合は完全に消え、事前に録画されたマーケティングビデオに置き換えられました。
  • スマートフォン時代は、戦略的な考慮に関しては終わり、iOSとAndroidは確定事項ですが、次は何で、まだわかりません。

🚀

Make your llama generation time fly with AWS Inferentia2

  • AWS Inferentia2を使用してLlama 2のテキスト生成モデルを展開することが可能です
  • 展開後は、transformersライブラリを使用してテキストを生成できます
  • 展開されたモデルはエンコーディング時間、エンドツーエンドのレイテンシ、スループットの観点から優れたパフォーマンスを示しています

💡

Introducing Prodigy-HF: a direct integration with Hugging Face

  • Explosionが開発したアノテーションツール、ProdigyがHugging Faceと直接統合するProdigy-HFをリリース
  • Prodigy-HFは、アノテーションされたデータでHugging Faceモデルをトレーニングし、再利用可能
  • アノテーションされたデータセットをHugging Face Hubに公開する機能も提供

🤖

5 Ways You Can Use ChatGPT Vision for Data Analysis - KDnuggets

  • ChatGPT Visionは、数式やデータ抽出、結果の評価、ダッシュボード、チャートなどの視覚データの解釈によりデータ分析を強化します。
  • ChatGPT Visionの導入により、データ分析は大きく進歩し、ユーザーは画像、方程式、グラフ、チャートを解釈することが可能になりました。
  • 本記事では、ChatGPT Visionをデータ分析タスクに活用する5つの主要な方法を探っていきます。

💻

OpenAI初デベロッパーイベントで発表された11のこと | ギズモード・ジャパン

  • 初のデベロッパーカンファレンス「DevDay」で基調講演を行った
  • 新モデル「GPT-4 Turbo」の発表やGPTsの導入、GPT Storeの設立など、11の重要な発表があった
  • 価格改訂やクラウドサービスとの連携など、さまざまなアップデートが行われ、プロダクトはますます進化している

😊

PyTorch compile to speed up inference on Llama 2 | PyTorch

  • PyTorchのネイティブな最適化を使用して、Llama 2ファミリーのモデルの推論レイテンシを改善する方法が説明されています。
  • このアプローチにより、70B LLaMaモデルの単一ユーザーリクエストのトークンあたりのレイテンシは29msになります。
  • この結果をコミュニティと共有し、コードを提供することを楽しみにしています。

🎉

OpenAI「GPT-4 Turbo」発表 長文処理や画像認識、初の開発者会議で - 日本経済新聞

  • OpenAIが「GPT-4ターボ」を発表しました
  • 長文処理や画像認識に対応し、300ページ以上の文書を扱えます
  • 利用単価も引き下げ、連携ソフトの開発も容易になりました

📚

Harnessing the power of enterprise data with generative AI: Insights from Amazon Kendra, L..

  • 大規模な言語モデルは幅広い知識を持ち、人間らしいテキストを生成できますが、特定のタスクには限定的な有用性しかありません。
  • Retrieval-Augmented Generation(RAG)を使用すると、モデルの回答を元の専門コンテンツと照合し、新しい言語モデルをトレーニングする必要なく既存の専門コンテンツを活用できます。
  • RAGにより、モデルは外部の知識を取得し組み込む能力を持つようになり、ドキュメントやデータベースなどからデータを取得し、生成されたテキストに統合します。

👌

Introduction to Giskard: Open-Source Quality Management for AI Models - KDnuggets

  • GiskardはAIモデルの品質管理のためのオープンソースシステムで、スキャン、テスト、デバッグ、自動化、コラボレーション、モニタリングなどのツールを提供します。
  • タブラーモデルとLLM(特にRAG)の使用例をカバーしています。
  • 2年間の研究開発の集大成であり、数百回の反復とベータテスターとの数百回のユーザーインタビューを経てローンチされました。

🔍

Implementing advanced RAG strategies with Neo4j

  • RAGアプリケーションは、ベクトルの類似性検索を利用して関連情報を取得し、それをLLMに入力して最終的な回答を生成します。
  • ステップバックプロンプティング技術は、複雑なタスクに直接取り組むことがエラーを引き起こすことがあるという観察に基づいています。
  • 親ドキュメントリトリーバーと呼ばれる手法では、ドキュメントのベクトルを直接使用するよりも効率的ではないという仮説が立てられています。

😮

Google Researchers May Have Just Turned the Race to AGI Upside Down With a Single Paper

  • Googleの研究者たちは、AIの背後にあるトランスフォーマー技術が一般化にはあまり適していないことを発見
  • トランスフォーマーは大規模言語モデルの技術で、訓練されたデータに関連するタスクには適しているが、それ以上のタスクには適していない
  • これは、人間が行うようなスキルを他のドメインにも転用することにはあまり適していないことを意味する

🎉

OpenAI、ノーコードでカスタムアプリを作れる「GPTs」 アプリ販売も - Impress Watch

  • OpenAIがノーコードのカスタムアプリ「GPTs」を発表
  • 特定のタスクに役立つカスタマイズしたChatGPTを作成・利用可能
  • 作成したアプリを他のユーザーに公開できる「GPT Store」もスタート

💻

Alternating updates for efficient transformers – Google Research Blog

  • ディープラーニングモデルのトランスフォーマーネットワークは、自然言語処理からコンピュータビジョンまで多岐にわたる領域で活用されています。
  • トランスフォーマーネットワークの規模を拡大することで性能が向上する一方、計算コストと推論の遅延が増加する問題があります。
  • 「AltUp」という手法は、計算コストを増やさずにトークン表現を増やす方法で、どのトランスフォーマーアーキテクチャにも適用可能で、ハイパーパラメータの調整も最小限です。

🚀

OpenAI、より安価で高性能な言語モデル「GPT-4 Turbo」などを発表 - ケータイ Watch

  • 新たな言語モデル「GPT-4 Turbo」は、先代よりも性能が向上し、より安価で利用可能。
  • 「GPT-3.5 Turbo」もリリースされ、高性能化や改良されたJSONモードなどが提供されている。
  • ユーザー保護のために「Copyright Shield(著作権シールド)」を導入し、著作権侵害に関する法的な請求を受けた場合に介入する。

💻

ChatGPT公開1年 はや7兆円市場、生成AI競争激しく - 日本経済新聞

  • ChatGPT公開1年で生成AI市場が7兆円に拡大
  • 米主要テクノロジー企業間での競争が激化
  • オープンAIは16倍の文書に対応する機能や価格引き下げの戦略を打ち出し、企業価値は13兆円に

💻

GPT-3.5-Turbo / GPT-4-Turbo 1106のJSONモードの使い方|shi3z

  • OpenAIの開発者向けイベントDevDayでGPT-4-TurboとGPT-3.5-TurboのJSONモードが発表されました。
  • Python APIの使い方はまだ公開されていないものの、試行錯誤を経て使い方を見つけました。
  • このJSONモードを利用すると、自動リトライする必要がなくなり、便利なJSON文字列が得られます。

2023年11月08日

|

このサイトについて

/

ニュースレター

/

@AINewsDev