AI News

~AI関連記事を3行にまとめて紹介~

📝

Stability AI、テキスト→動画の「Stable Video Diffusion」をGitHubで公開 - ITmedia NEWS

  • 「Stable Video Diffusion」はテキストから動画を生成するAIモデルで、GitHubでコードが公開されている
  • 事前トレーニングと微調整の3フェーズでトレーニングされ、2つの画像から動画を生成可能
  • フレームレートは3〜30フレーム/秒で、14フレームと25フレームの2種類の動画を生成できる

💥

NVIDIAの純利益14倍、8〜10月 AI半導体で急拡大続く - 日本経済新聞

  • 純利益が14倍に拡大し、AI半導体市場も急成長
  • 売上高も3倍に増加し、過去最高を記録
  • AIの需要増加により、半導体の需要も急増し、4四半期連続で増収増益

🔥

「AIナレーター」が動物ドキュメンタリー番組っぽく開発者本人の生態をリアルタイムで解説するデ..

  • 「AIナレーター」が開発者の生態をリアルタイムで解説するデモ動画が注目を集めています
  • ソフトウェア開発者が自身の生態に関するナレーション音声をリアルタイムで生成するシステムを発表
  • デイビッド・アッテンボロー氏の声で動物番組風のナレーションが生成されるデモ動画も公開

😱

OpenAI、経営正常化遠く Microsoftが「漁夫の利」か - 日本経済新聞

  • OpenAIの経営に混乱が続き、社員から経営刷新が求められている
  • 生成AIの普及に伴い、マイクロソフトの立場が強まるとの見方もある
  • OpenAIのサム・アルトマン氏が突如退任し、今後の動向が注目される

💡

マイクロソフト、Copilot in Windowsを解説 AIが解決を手助け - Impress Watch

  • AIアシスタント「Copilot」はコンシューマ向けに提供され、WebブラウザやWindowsで利用可能です。
  • CopilotはOpenAIのGPT-4を使用し、プログラミングコード生成や画像生成などの機能を持っています。
  • Windows上では検索や回答、操作方法の回答などができ、最新の情報も反映されます。

💼

マイクロソフト、OpenAI従業員に現在と同額の報酬で入社可能と述べる | テクノエッジ TechnoEdge

  • マイクロソフトのCTO、ケヴィン・スコット氏はOpenAIの従業員に対し、同社への移籍を検討している場合、現在の報酬を維持することを示唆
  • OpenAIの従業員の中には、アルトマン氏が復帰しない場合に退社すると公開書簡で宣言した人々がおり、取締役会は具体的な対応をしていない
  • マイクロソフトはOpenAIに多額の投資を行っており、製品の維持改善に支障が生じる可能性があるため、従業員への報酬提示は製品の維持改善体制を確保するための対策と言える

👍

FTC Authorizes Compulsory Process for AI-related Products and Services | Federal Trade Com..

  • 人工知能(AI)を使用する製品やサービスに関する非公開調査で、強制的な手続きの使用を認可する決議が承認されました。
  • この決議により、証拠開示命令(CID)を発行する能力が強化され、CIDの発行時期を決定する権限が保持されます。
  • AIや生成型AIは多くの有益な用途がありますが、詐欺、欺瞞、プライバシー侵害などの不公正な行為にも利用される可能性があります。

💪

My North Star for the Future of AI - The Atlantic

  • AIの未来は世界の強力な企業によって形成されているが、大学の科学者たちの倫理と価値観が必要
  • AIの進展はもはや学者たちのコントロール下にはない
  • AIについての文化的な関心は2010年代に入ってから公になった

🚀

「ChatGPT」とOpenAIがとりうる3つの道--アルトマン氏のマイクロソフト移籍で - CNET Japan

  • Sam Altman氏はOpenAIのCEOを解任され、Microsoftに引き抜かれました
  • Altman氏と共同創業者のGreg Brockman氏はMicrosoftで新たなAI研究チームを率いることになりました
  • OpenAIの従業員約500人はAltman氏をCEOに再任命しない場合は退職し、Microsoftに合流するという書簡に署名しました

🎬

ChatGPTの新機能であるGPTsを使って私のコピーを作ってみた #ChatGPT - Qiita

  • 「ゴジラ-1.0」は特撮映画の金字塔で、怪獣映画の傑作として知られています。
  • 映像美や緊迫感のあるストーリーが魅力で、映画ファンにとっては必見の作品です。
  • 他の方々の感想を読むことで、映画に対する様々な視点を学ぶことができました。

💻

Azure OpenAI Service - LLM Application 開発 ハンズオン - Speaker Deck

  • 既存のサンプルコードを使用して、OpenAI Serviceの挙動やLLM Applicationの開発・動作環境を構築
  • 環境構築やPlaygroundの利用、サンプルコードのデプロイなどの内容を含む
  • ChatGPTの魅力再発見と活用に向けた組み込みテクニックについても解説

🎧

スマホ版ChatGPTの音声会話機能が無料ユーザーに開放。退社したブロックマン元社長もお勧め | テ..

  • ChatGPTモバイルアプリの音声会話機能が無料ユーザーにも開放されました
  • ユーザーは画面の右下のヘッドホンボタンをタップするだけで音声だけで連続して会話が可能
  • SiriやGoogleアシスタントとは異なり、ChatGPTの音声会話はどんな言葉でも受け付け、会話の文脈を保持して答えることができます

😎

OpenAI の GPT-4-vision-preview (VLM) を利用した商品画像のタグ付け - DROBEプロダクト開発ブ..

  • OpenAIのGPT-4-Vision-Previewは、画像処理と自然言語処理を組み合わせた技術で、画像からテキスト情報を生成します。
  • ファッション商品のタグ付けを効率化するためにこの技術が導入されました。
  • 商品の色や袖の長さなどは画像から判断でき、画像とテキストを組み合わせることでファッションのデータ構造化問題に有効な解決策となる可能性があります。

💼

GitHub元CEO、OpenAI暫定CEOの就任依頼メールがきていたと明かす。しかし気づかず『スーパーマリ..

  • GitHubの共同創設者で元CEOのChris Wanstrath氏がOpenAIの暫定CEOに就任
  • Wanstrath氏は就任依頼メールが迷惑メールフォルダに入っていたため気づかず
  • 気づかない間に週末は『スーパーマリオRPG』をプレイしていたと明かした

💻

AIの訓練のために… 新興国の10代の若者たちがトラウマになるようなコンテンツにさらされている ..

  • パキスタンの15歳の少年がAIの訓練に使われるデータセット作成の仕事をしており、時給1〜2ドルを稼いでいる
  • 彼は性的な画像やアダルト広告を区別する仕事もしており、その影響が懸念されている
  • 新興国でのギグワークは年齢確認が甘く、特に10代の若者がこのような仕事を担っていることは憂慮すべきである

🔄

OpenAI理事会、サム・アルトマン氏の復帰を協議 米報道 - 日本経済新聞

  • 解任されたサム・アルトマン氏の復帰が協議されている
  • 共同創業者のサツキバー氏も復帰支持に転換
  • 3人の理事の意向が焦点となる

😱

ChatGPTが一時ダウン 平日朝からの障害で「仕事にならない」などの声も - ITmedia NEWS

  • 米OpenAIのチャットAI「ChatGPT」が一時的にダウンし、アクセス不能状態が続いた
  • 午前10時半に復旧、原因や対策については後日説明予定
  • 同日にはChatGPTの音声会話機能が無料ユーザーにも開放

💻

Stable Video Diffusion のご紹介 — Stability AI Japan

  • Stable Video Diffusionは、画像モデルStable Diffusionに基づく動画生成用の基盤モデルです。
  • マルチビュー合成などの様々なタスクに適応可能で、14フレームおよび25フレームを生成できる2種類のモデルとしてリリースされています。
  • 最新の進歩に基づいてモデルを更新し、フィードバックを取り入れていますが、現段階では実世界や商用アプリケーションでの使用を意図していません。

🗣️

OpenAIの「ChatGPT」アプリ、音声機能が無料ユーザーでも利用可能に(サーバトラブル中→復旧済..

  • ChatGPTのモバイルアプリの音声機能が無料ユーザーでも利用可能になった
  • 音声機能はアプリを起動し、画面右下のヘッドフォンアイコンをタップすることで利用できる
  • 日本語での会話も可能だが、現在はアクセス集中によりログインやWebサービスが利用できない状況が続いている

🔄

サム・アルトマン氏、OpenAIのCEOとして復帰。取締役会も刷新 | テクノエッジ TechnoEdge

  • 先週末、解任された共同創業者がCEOとして復帰することが決まった
  • 新設するAI研究グループのトップとして迎え入れると発言した後、従業員のほとんどがCEO復帰をしなければ同社を辞めて移籍するとの公開書簡を出した
  • その行方が見守られていましたが、元鞘に収まるところに収まった感じです

💼

OpenAI、サム・アルトマン氏がCEOに復帰 理事会大幅刷新へ - 日本経済新聞

  • 対話型AI「Chat GPT」を開発したサム・アルトマン氏がCEOに復帰し、理事会を大幅に入れ替えることで危機を回避
  • 新たな理事会はアダム・ディアンジェロ氏、ラリー・サマーズ氏、ブレット・テイラー氏で構成
  • アルトマン氏は強力なパートナーシップを築くために戻る意向を示した

👍

アルトマン氏 CEOに復帰へ ChatGPT開発「オープンAI」 | NHK | 生成AI・人工知能

  • 2023年11月22日、解任されたサム・アルトマン氏がCEOに復帰することで合意
  • アルトマン氏は先週17日に取締役会から解任され、会社が混乱
  • 投資家や社員の間で復帰を働きかける動きが広がっていた

🔄

アルトマン氏、オープンAIにCEOで復帰-取締役刷新で混乱収拾へ(Bloomberg) - Yahoo!ニュ..

  • オープンAIの共同創業者、サム・アルトマン氏がCEOに復帰
  • 取締役会の方針転換により混乱が収束、ガバナンスの刷新も合意
  • マイクロソフトのナデラCEOもこの決断を称賛

👍

アルトマン氏、オープンAIにCEOで復帰-取締役刷新で混乱収拾へ - Bloomberg

  • 共同創業者のサム・アルトマン氏がCEOとして復帰し、取締役会も刷新されることが決まった
  • この方針転換により、混乱が収束に向かっているとされる
  • 社員や投資家からの圧力により、アルトマン氏の復帰が決定された

👎

AIの「LLaMa」が著作権を侵害したとしてMetaを訴えた作家らの主張がほとんど棄却される - GIGAZI..

  • AIの「LLaMa」が著作権侵害で訴えられた件で、作家3名の主張はほとんど棄却されました。
  • LLaMaが著作物を訓練に使用し、その生成物が著作権侵害に当たると主張していましたが、裁判所はこれを否定しました。
  • 今後は「LLaMaの訓練を目的とした書籍の無断複製が著作権侵害にあたる」という点が争点となると予想されます。

🖼️

Google Colab で Stable Video Diffusion を試す|npaka

  • 「Stable Video Diffusion」は画像から動画を生成するAIモデルで、解像度576x1024で14または24フレーム生成します
  • Colabでの実行手順は、ノートブックを開いて自分のドライブにコピーし、セルを実行し、WebUIで画像をドラッグ&ドロップして動画を生成します
  • 生成まで数分かかり、オプションも設定できます。サポートやオススメも気軽にできます

💪

GitHub - IngestAI/deepmark: Deepmark AI enables a unique testing environment for language ..

  • Deepmark AIは、大規模な言語モデル(LLM)の選択時に情報を提供し、独自のデータ上でLLMを評価することが可能
  • AIアプリケーションの予測可能で信頼性のあるパフォーマンスを実現します
  • 信頼性、精度、コスト効率などの重要なパフォーマンスメトリックを簡単に評価できるツールです

🔄

アルトマン氏、オープンAIのCEOに復帰へ 取締役会を刷新 - BBCニュース

  • オープンAIの共同創業者であるアルトマン氏がCEOに復帰することで合意
  • 取締役会も刷新され、新たなメンバーはテイラー氏、サマーズ氏、ダンジェロ氏となる予定
  • ナデラCEOはこの変化を歓迎し、安定と効果的なガバナンスへの重要なステップと評価

🎥

テキストや画像から動画を生成するAI「Stable Video Diffusion」をStability AIが公開へ - GIGAZ..

  • 「Stable Video Diffusion」はテキストや画像から高解像度の動画を生成するAIです。
  • 14フレームおよび25フレームを生成でき、3fps~30fpsでカスタマイズ可能なフレームレートで動画を生成します。
  • 映像品質の評価をGEN-2やPikaLabsと比較し、結果を公開しています。

🎨

MicrosoftのAI画像生成サービスではディズニー作品のイラストを生成できてしまう - GIGAZINE

  • AI画像生成サービス「Image Creator」はディズニーのキャラクターを含む画像を生成可能
  • 「Disney」というワードを一時的にNGワードに指定していたことも
  • 有料版Copilotのユーザーが著作権関連の訴訟に巻き込まれた場合、和解金を肩代わりすることを表明

📚

Anthropicが大規模言語モデル「Claude 2.1」をリリース、最大20万トークン・15万ワードを読込可..

  • 「Claude 2.1」は最大20万トークンを読み込むことが可能で、約15万ワードや500ページ以上の資料に相当します
  • 幻覚が半減し、ウソをつく現象が減少しており、精度が向上しています
  • データベースの検索やウェブ検索APIの使用、ソフトウェアでのアクション実行が可能なツールの提供も始まりました

🔙

サム・アルトマン氏、米OpenAIのCEOに返り咲き 公式Xで発表 - ITmedia NEWS

  • サム・アルトマン氏がOpenAIのCEOに再任されることが発表されました
  • 新しい取締役会も設けられ、詳細は今後発表される予定です
  • アルトマン氏は以前、CEOを辞任し取締役会を離れ、マイクロソフトへ移籍していました

🤖

Will AI Replace Humanity? - KDnuggets

  • AIが人間の判断を置き換える可能性は時間の経過とともに高まっている
  • AIはパターンを学習するのに優れているが、それだけでは知能とは言えない
  • AIは大規模なパターンを特定し、効率を生み出すのに十分な知能を持っているが、共感的な関係を築くことはできない

💻

The Hardware Lottery

  • ハードウェアとソフトウェアが研究のアイデアの成功を決定してきたにもかかわらず、その扱いは奇妙であると指摘
  • ハードウェア抽選という概念を紹介し、研究のアイデアが他の研究方向よりも優れているわけではなく、利用可能なソフトウェアとハードウェアに適しているために勝利することを説明
  • ハードウェア抽選は、成功したアイデアを失敗として描写し、一部の研究方向が他よりも有望であることを示すシグナルを遅らせ、研究の進歩を曖昧にする可能性がある

📏

RAG評価ツールの "RAGAS" を使って、RAGパイプラインの性能を測定する #OpenAI - Qiita

  • RAGASはRAGパイプラインを評価/テストするためのツールで、LangSmithやPrompt Flowと同様の機能があります。
  • RAGASではFaithfulness(忠実度)、Answer Relevancy(回答の関連性)、Context Precision(コンテキストの精度)、Context Recall(コンテキストの再現性)、Context Relevancy(コンテキストの関連性)の指標を使用して評価します。
  • 自社データを使ってエンタープライズサーチを実現したい方にはRAGASという評価用フレームワークがおすすめです。

📖

Geospatial generative AI with Amazon Bedrock and Amazon Location Service | AWS Machine Lea..

  • ジオスペーシャルワークフローは、データの読み込み、変換、視覚的なインサイトの生成という手順で構成されます
  • ジェネレーティブAIを使用すると、これらのタスクを自律エージェントによって自動化できます
  • Amazon Bedrockの基礎モデルを使用して、ジオスペーシャルタスクを完了するためのエージェントを作成する方法について説明します

📱

GPT-4VでiPhoneの画面を操作するシステム 米Microsoftなどの研究者らが開発:Innovative Tech -..

  • 「Seamless」の山下裕毅氏が先端テクノロジーの研究を論文単位で記事にしています
  • 最新の研究では、スマートフォンのGUIナビゲーションにGPT-4Vを使用した新しいエージェントシステムが提案されています
  • このシステムは、画像とテキストを組み合わせた大規模マルチモーダルモデルを使用して、スマートフォンの画面と対話し、指示を遂行する行動を決定することができます

🤖

Build a contextual chatbot for financial services using Amazon SageMaker JumpStart, Llama ..

  • Amazon SageMaker JumpStartを使用して、Llama 2とAmazon OpenSearch Serverless with Vector Engineを活用した金融サービス向けのコンテキストチャットボットを構築する方法を紹介。
  • SageMaker JumpStartは、データセキュリティコントロールを提供し、コンプライアンス基準要件を満たすため、金融サービスの顧客向けの生成型AIユースケースに理想的。
  • SageMaker JumpStartを使用すると、MLプラクティショナーは、コンテンツ作成、画像生成、コード生成、質問応答、コピーライティング、要約、分類、情報検索などのユースケースに適した最新のモデルを幅広く選択できる。

💡

Build well-architected IDP solutions with a custom lens – Part 4: Performance efficiency ..

  • IDPワークロードのパフォーマンス効率に焦点を当てた記事が公開されました
  • スループット、レイテンシ、全体的なパフォーマンスの最適化について詳しく説明されています
  • AIや機械学習のユースケースに基づいた6つの柱を含むIDPウェルアーキテクチャカスタムレンズを使用して、ソリューションをレビューし、共通の課題に対処するためのガイダンスが提供されています

💻

How Amazon Search M5 saved 30% for LLM training cost by using AWS Trainium | AWS Machine L..

  • Amazon Search M5プログラムは、多言語、多地域、多エンティティ、マルチタスク、マルチモーダルの大規模なモデルを構築し、数百のMLチームに提供しています。
  • AWSの目的別アクセラレータであるAWS Trainiumを使用することで、モデルのトレーニングコストを30%削減することができました。
  • この方法により、LLMトレーニングコストを30%節約することができました。

💬

ChatGPT、仕事にすぐ役立つ簡単「命令文の書き方」 欲しい内容に調整、質問と回答の連続こそ真骨..

  • ChatGPTは仕事に役立つ簡単な命令文の書き方を教えます
  • 質問と回答を続けることで深く掘り下げることが可能
  • 回答を修正し、自分の要求に合わせた回答を得ることができます

🎉

Inflection-2: The Next Step Up

  • 新しいモデルInflection-2のトレーニングが完了し、事実の知識、スタイルの制御、推論が大幅に改善されました。
  • Inflection-2はGoogleのPaLM 2-Largeモデルと同じトレーニングコンピュートクラスに位置づけられ、AIパフォーマンスベンチマークで優れた性能を発揮しています。
  • 22,000のGPUクラスターの全容力でさらに大きなモデルのトレーニングを楽しみにしています。

👍

Sharing LangSmith Benchmarks

  • 開発者がアプリを本番環境に移行する際の問題を解決するため、LangSmithは評価データセットと結果を共有し始めました。
  • 新しいlangchain-benchmarksパッケージも共有し、結果を再現し、アーキテクチャを簡単に試すことが可能になりました。
  • 評価結果には、テストされたチェーンの完全なトレースも含まれており、異なるシステムのステップバイステップの実行を同じデータポイントで確認することができます。

📚

A Comprehensive List of Resources to Master Large Language Models - KDnuggets

  • 大規模言語モデル(LLM)を理解するためのリソースリストが提供されています。
  • 基礎コースから専門コース、記事や書籍まで、LLMの理解を深めるための多様なリソースが紹介されています。
  • LLMの理論的な側面から実用的な応用、ユースケースまで、初心者から経験者まで対象としたリソースが揃っています。

💻

Hardware-Accelerated AI for Windows Apps Using ONNX RT - KDnuggets

  • WindowsアプリでのハードウェアアクセラレーションAIをONNX RTを用いてサポート
  • Windows on Snapdragonは、モバイルコンピューティングの進化を基に構築された次世代のWindowsプラットフォーム
  • Qualcomm AI Stackは、ONNX RTをサポートし、Windows on SnapdragonアプリでハードウェアアクセラレーションAIを実現

🤖

My experience trying to write original, full-length human-sounding articles using Claude A..

  • クロードAIを使って人間らしい記事を作成する試みについての経験を共有
  • 記事作成のためのステップバイステップの解説を提供
  • AI支援コンテンツが「違和感」を感じさせる理由について考察

💻

プログラミングを始めた際に知っておきたかったPythonの基本 #Python - Qiita

  • ChatGPTを使ってプログラムを書くには基礎知識が必要で、複雑なものは作れない
  • Pythonの基礎にはモジュール、変数、関数、クラスなどの概念があり、インストールとインポート方法、エラーの見方も重要
  • これらの知識を理解することで、より効率的にプログラムを作成できる

🎉

ASCII.jp:画像生成AI「Stable Diffusion XL」が簡単に使える「Fooocus」。画像から画像が作れる..

  • 「Fooocus」は、画像生成AI「Stable Diffusion XL」を簡単に使えるWebインターフェイスで、新機能「Image Prompt」が追加されました。
  • 「Image Prompt」は、テキストの代わりに画像をプロンプトとして用いる手法で、最大4つの画像をプロンプトとして活用できます。
  • 「Image Prompt」では、生成画像への影響力を調整する「Weight」の値を変更でき、追加プロンプト次第で創作の自由度が上がります。

💻

Ask HN: Best Alternatives to OpenAI ChatGPT? | Hacker News

  • Anthropicは直接またはAWS Bedrockを介してアクセス可能
  • BardとClaudeが代替案として提案されるが、能力のギャップが存在
  • OpenAIの問題点から、真にオープンでパワフルなモデルの必要性が明確化

😲

Exclusive: Sam Altman's ouster at OpenAI was precipitated by letter to board about AI brea..

  • OpenAIのCEO、Sam Altman氏の解任は、AIの突破に関する取締役会への手紙が原因だったと関係者が明らかにした
  • Altman氏は700人以上の従業員が連帯のために辞職を脅迫していた中、OpenAIに復帰した
  • ChatGPTの開発者は、スーパーインテリジェンスの探求において突破口となる可能性があるQ*に進展を遂げていたと伝えられている

💻

Your guide to generative AI and ML at AWS re:Invent 2023 | AWS Machine Learning Blog

  • AWS re:Invent 2023では、生成AIと機械学習(ML)のセッションが開催されます。
  • 生成AIに焦点を当てたトラックでは、Amazon Bedrockの基礎的なセッションや一般的な生成AIのユースケースをカバーするセッションがあります。
  • セッションカタログをブラウズする際には、「生成AI」のタグを使用して探してみてください。

🎙️

人間らしい音声の合成を目指して感情の表現も可能なオープンソースの読み上げAI「StyleTTS 2」が..

  • 「StyleTTS 2」は、大規模音声言語モデルと拡散モデルによる敵対的学習を利用した読み上げAIです。
  • 参照音声が不要で、最適なスタイルを生成し、ネイティブスピーカーと同程度の滑らかな英語読み上げが可能です。
  • デフォルト音声は女性で、感情を設定することも可能で、ローカル音声チャットボットのデモもあります。

2023年11月23日

|

このサイトについて

/

ニュースレター

/

@AINewsDev