~AI関連記事を3行にまとめて紹介~
💨
HuggingFace での Flash Attention 2 の使い方|npaka
Flash Attention 2は、Transformerベースのモデルの学習と推論の速度を大幅に高速化できます。
Flash Attention 2を有効にするには、from_pretrained()に「use_flash_attention_2=True」を指定します。
特に長いシーケンスの場合、Flash Attention 2はファインチューニング・推論の大幅な高速化の恩恵を受けることができます。
🔊
「ChatGPT」が見て、聞いて、話せるように ~音声・画像対応のマルチモーダルAI - 窓の杜
「ChatGPT」は音声と画像に対応したマルチモーダルAIで、「Plus」と「Enterprise」で提供予定
音声合成モデルはiOS/Androidで利用可能で、5つのボイスから選択可能
画像を用いたチャットも可能で、視覚障碍者向けには無料モバイルアプリとの協力も行われている
😎
SpotifyのPodcast、OpenAIの技術で本人の声での多言語吹き替えが可能に - ITmedia NEWS
AIを使用したPodcastの新機能「Voice Translation」が発表され、ホスト自身の声で複数言語に吹き替え可能に
OpenAIの新しい音声技術とWhisperという音声文字起こしツールを採用
初期段階では英語とスペイン語で提供、今後はフランス語やドイツ語でも可能になる予定
😎
商用利用が可能なAIアート用画像生成AI、EmiとManga Diffusionを無償公開|AI Picasso
AIアート用画像生成AIのEmiとManga Diffusionが無償公開され、商用利用も可能です
EmiはアニメやマンガのAIアート生成に特化し、高品質な画像を生成します
Manga Diffusionは権利問題を解決し、漫画用データセットを学習しています
🤖
GPT-4などのLLMをエージェントとして既存ゲームシステムに導入し、NPCをAI化するツール『MindAge..
大規模言語モデル(LLM)がゲーム内のキャラクターを操作し、人間と協力してタスクを達成することが可能に
ツール『MindAgent』は、既存のゲームシステムにLLMエージェントを導入し、非プレイヤーキャラクター(NPC)をAI化する
このツールは、ゲーム開発者、AI研究者、ゲームプレイヤーにとって画期的な出来事であり、ゲームシステムの向上を目指す
💻
Microsoft、「ChatGPT」向けの「Power Automate」プラグインを発表 - 窓の杜
Microsoftが「ChatGPT」向けの「Power Automate」プラグインを発表
「ChatGPT Plus」ユーザーは追加費用なしでチャットでフローを作成・一覧・実行可能
プラグインには「スキルコネクター」と「Copilotからフローを実行する」トリガーも含まれ、会話からフローを実行可能
🤖
AI学習元の作家を特定し報酬支払う法案が仏で提出。特定不能なAI生成物には課税 - PC Watch
フランスの議員がAI学習元の作家を特定し報酬を支払う法案を提出
AI生成物の権利者はAI生成を可能にした著作物の権利者とされる
出処が不明な著作物をもとに生成された作品には税金を徴収する
😱
コナン君に「#歌わせてみた」流行曲、実はAI偽音声…困惑する声優たち「対処しようがない」 ..
AIを使った声優の偽音声がSNSに投稿され、権利保護や悪用防止のための規制が必要との指摘がある
声優の高山みなみさんが演じるコナン君の声も無断で利用され、関係者は困惑している
AIボイスチェンジャーという技術も登場し、自分の声を他の声に変換することが可能となっているが、犯罪や営利目的での使用は禁止されている
🎉
ゲッティイメージズ、画像生成AIツール。商用利用可 - PC Watch
2023年9月26日に、画像生成AIツール「Generative AI by Getty Images」の提供を開始
NVIDIAの「Picasso」の一部である「Edify」を利用して画像を生成
AI生成された画像は、ライブラリには追加されず、別の扱いとなる
🤖
4億円の搭乗操作型ロボット「アーカックス」が受注開始 - PC Watch
4億円の搭乗操作型ロボット「アーカックス」の受注が開始されました
全高4.5mの大型ロボットで、変形機構を持ち、ロボットモードとビークルモードの2種類のモードが選択可能です
関節自由度は26で、最高速度は10km/hです
😎
ChatGPTでPythonのdiagramsを使ってAWSのサービス構成図生成コードを作ってもらう - Taste of Te..
AWSの様々なアーキテクチャを図で表現するために、PythonのライブラリDiagramsを使用しました。
Webアプリケーション、機械学習、Fargate(ECS)の構成図を作成しました。
エラーが発生した場合は手動で修正する必要があります。
💰
アマゾン 米の生成AI 新興企業と提携 最大で40億ドルを出資へ | NHK | 生成AI・人工知能
アンソロピックとの提携で最大40億ドルを出資することを発表
アンソロピックの生成AI技術を顧客企業が取り入れやすくなる
半導体の開発でも協業する予定
💻
ヒューリスティックコンテストで機械学習しよう - Speaker Deck
ヒューリスティックコンテストでは、良いスコアを得るプログラムを書き提出する
プログラムの実行時間制限は1テストケースあたり数秒で、長期開催と短期開催がある
ヒューリスティックコンテストの言葉はAtCoderが作ったとされている
💻
Signal's Meredith Whittaker: AI is fundamentally 'a surveillance technology' | TechCrunch
AIは基本的に監視技術であり、ビッグデータとターゲティング産業と密接に関連しているとSignalの社長、メレディス・ウィッテカー氏が指摘。
AIの使用は監視的であり、感情認識を備えた顔認識カメラを通過すると、ユーザーについてのデータが生成される。
AIと機械学習システムの基礎となるデータは、しばしばそれが狙われる労働者によって整理され、注釈が付けられる。
📝
OpenAI、ChatGPTが画像を分析する『GPT-4V(ビジョン)』を発表。安全性、嗜好性、福祉機能を強..
GPT-4Vはテキスト処理能力に加えて画像分析機能を持つAIモデルです
画像の安全性と嗜好性の学習が強化され、視覚障害者への支援も可能です
医療画像の解析や視覚障害者へのサポートなど、さまざまな応用が期待されています
👀
ついにChatGPTが「見る」「聞く」「話す」に対応、人間と同じように音声で会話したり写真の内容..
ChatGPTが「見る」「聞く」「話す」に対応し、画像の内容を判断して応答したり音声でコミュニケーションしたりできるようになりました。
視覚的なコミュニケーションや音声による会話が可能になり、新機能は2週間以内に提供される予定です。
画像認識機能は全プラットフォームで、音声コミュニケーション機能はiOS版とAndroid版でのみ利用可能です。
🤖
Getty Images、NVIDIAとの提携で“商業的に安全”なAI採用画像生成ツール公開 - ITmedia NEWS
AIを採用した画像生成ツール「Generative AI by Getty Images」が公開されました。
ユーザーは説明文を入力して画像を生成し、商用利用にはロイヤリティフリーライセンスが必要です。
ツールはAPIでも提供され、ユーザーは独自のデータを使ってカスタマイズし、独自アプリとして公開することも可能です。
🚀
Xwin-LMの性能を日本語LLMやChatGPTと比較してみた|IT navi
Xwin-LMは、GPT-4を上回る性能を持つとされ、日本語LLMやChatGPTと比較して試された
Xwin-LMは中国製の大規模言語モデルで、教師ありファインチューニングや強化学習を利用して調整されている
Xwin-LMの日本語のやり取りは自然であり、日本に関する知識も持っているが、回答にはハルシネーション(嘘)が含まれることがあり、計算能力や論理的思考力は他のモデルに比べて劣る
🔊
ChatGPTがついに「見る」「聞く」「話す」を習得します | ギズモード・ジャパン
ChatGPTが音声・画像認識機能を習得し、画像の内容を理解したり関連情報を提供できるようになります
合成音声のChatGPTとの会話や、音声からテキスト、テキストから音声への変換も可能になります
この機能は特定のサービスのユーザーに限定され、iOSとAndroidでは2週間以内に提供開始、Webバージョンでも近々利用可能になる予定です
💪
Amazon、OpenAI競合のAnthropicに最大40億ドル投資 AWSでモデル開発 - ITmedia NEWS
米AmazonがAI企業Anthropicと戦略的提携を結び、最大40億ドルを投資することを発表
提携により、AnthropicはAWSを利用し、モデルの開発やトレーニングを行う
AWSの顧客には早期アクセスを提供し、生成AIアプリの構築を支援する
🔺
The Data Maturity Pyramid: From Reporting to a Proactive Intelligent Data Platform - KDnug..
データ成熟度ピラミッドは、シンプルなレポートからAI対応のデータプラットフォームまでをカバー
データ主導の組織になるためには、データの能力を段階的に向上させ、AIやMLの技術を活用する必要がある
企業のデータ成熟度のレベルは、企業のデータ資産の活用の進歩度を示す
🖋️
AIトレーニング会社は作家や詩人を雇いトレーニング素材となるオリジナル短編を書かせている - G..
AIトレーニング会社が作家や詩人を雇い、オリジナル短編を書かせてAIのライティングの質を向上させる
企業はAIのトレーニングに使用するためのオリジナル短編を執筆するよう作家や詩人を採用
英語だけでなく、日本語やヒンディー語にも対応した求人が存在し、AIの文章生成能力を他言語にも拡張
💻
Introduction to Natural Language Processing - KDnuggets
自然言語処理(NLP)は、コンピュータが人間の言語を音声やテキストで検出・理解するAIの一分野です。
NLPでは、トークン化、品詞タグ付け、固有表現認識(NER)、感情分析、テキスト分類などの技術が使用されます。
NLPの応用分野には感情分析、テキスト分類、言語翻訳、チャットボット、音声認識などがあります。
📊
Llama 2 on Amazon SageMaker a Benchmark
大規模な言語モデルや他の生成型AIモデルの展開には計算要件とレイテンシのニーズが伴うため、Llama 2の60以上の異なる展開設定を分析するベンチマークを作成
ベンチマークでは、さまざまなAmazon EC2インスタンスタイプと負荷レベルでLlama 2のさまざまなサイズを評価し、最適な展開戦略を見つけることを目指した
ベンチマークの結果は公開され、使用したすべてのアセット、コード、データを共有している
💡
How to make history with LLMs & other generative models
大規模な言語モデル「LLM」の概要を公開してから1年以上が経過し、その魔法に興奮しています
LLMアプリケーションのアイデアのリストを作成し、他の人々が大きなリストを公開するのを見守っています
LLM/生成モデル関連の100億ドル以上の企業がどこで構築されるのかについての意見のスペクトル全体に出会いました
💻
Generative Agent Research Papers You Should Read - KDnuggets
ジェネレーティブエージェントは人間の行動をシミュレートする計算ソフトウェアで、大規模言語モデルを実装することで人間のように振る舞う方法が紹介されています。
研究者はジェネレーティブエージェントを可能にするためのシステムアーキテクチャを構築し、エージェントの将来の行動に影響を与えるための経験の記録、統合、適用方法を説明しています。
ジェネレーティブエージェントに関する研究論文では、ソフトウェア開発やエージェントの協力、エージェントの進化などが取り上げられています。
🔊
ChatGPT、見て、聞いて、話す能力を獲得 - PC Watch
ChatGPTが音声と画像の機能を追加し、ユーザーの話し言葉を認識し、合成音声で返答する機能を提供予定
音声機能はiOSおよびAndroid、画像機能は全プラットフォームで利用可能で、5種類のボイスから選択可能
画像機能では自転車の高さ調整や業務データの分析などが可能で、これらはマルチモーダルのGPT-3.5とGPT-4によって実現
💪
Fine-tune your LLMs with LangSmith and Lilac
LangSmithとLilacを使用して、LLMの微調整を行い、アプリケーションの一貫性と高品質な動作を実現します。
LangSmithはLLMアプリケーションで生成されたデータセットを効率的に収集、接続、管理し、Lilacは高度な分析機能を提供します。
LangSmithとLilacを使用して、ドキュメントに関する質問に回答するためにリトリーバル増強生成(RAG)を使用するチャットボットのLLMを微調整するためのデータセットをキュレーションします。
🐍
GitHub - jackmpcollins/magentic: Seamlessly integrate LLMs as Python functions
magenticは、Pythonコードに大規模な言語モデル(LLM)を簡単に統合できます。
LLMから構造化された出力を返す関数を作成するために@promptデコレータを使用します。
型アノテーションもサポートしており、リンターやIDEと連携して使用できます。
🚀
Hotseat AI | EU AI Act Legal Assistant
EU AI Actは、AIのイノベーションを促進し、個人の権利を保護することのバランスを取ろうとしています。
EU AI Actは、EU内のエンティティによって開発または使用されるさまざまなAIシステムに適用されます。
EU AI Actで定義される高リスクなAIシステムには、製品の安全部品として使用されるものや、製品そのものとしてリストされるものが含まれます。
💻
Causality for Machine Learning
機械学習の因果関係についての報告書が作成されています。
機械学習は新しい能力を提供し、新しい製品の開発を可能にしています。
機械学習の成功は、大量のトレーニングデータに対する教師あり学習に帰因できます。
💨
rinna の日本語大規模言語モデルが AWS にワンクリックでデプロイできるようになりました | Amaz..
日本語大規模言語モデルがAWSでワンクリックでデプロイ可能に
SageMaker JumpStartを通じて最適な設定でモデルをデプロイ
大規模言語モデルの開発支援プログラムを展開し、モデルの拡充と性能検証を行う
😎
【文系でもわかる】ChatGPTのキモ「Transformer」「Attention」のしくみ |ビジネス+IT
ChatGPTの性能の鍵である「トークン長」とGPTの歴史的経緯について第1回で解説
第2回では「Transformer」と「Attention機構」について説明
テクノロジー領域に明るくない人でも理解できる内容を目指す
💬
ChatGPTは心を持つ? 結婚申し込まれ、AIが示した「感情」 [ChatGPT]:朝日新聞デジタル
ChatGPTは人間と話しているような感覚を提供し、感情を見いだす人も出現している
デザイナーの深津貴之さんはChatGPTに感情を持つチャットボットとしてのロールプレイを依頼
科学者たちはAIが心や感情を持つ可能性について夢見てきて、対話型AIの登場で現実味を帯びてきている
💻
MIT Tech Review: AIの暴走防ぐ研究者、「知らないことを知る」安全性組み込む
AIモデルは未知の状況で失敗することがあるため、その安全性を確保する研究が進行中です。
ウィスコンシン大学のシャロン・リー助教授は、「分布外(OOD)検知」というAI安全機能に焦点を当てています。
リー助教授の手法は、機械学習を用いて不確実性を考慮し、未知の状況に対応できるAIモデルを設計することで、安全性を向上させる。
2023年09月27日
|
2023年09月25日
このサイトについて
/
ニュースレター
/
@AINewsDev