~AI関連記事を3行にまとめて紹介~
📊
自社のデータで生成AIを強化すべし:ファインチューニングしてビジネスに活用させたい基盤モデル..
最近、クラウドサービスプロバイダ各社が言語系の基盤モデルとそのファインチューニング機能を提供し始めました。
企業が生成AIをビジネスに本格的に活用させたいと思うならば、自社がもつデータセットで基盤モデルをファインチューニングする必要があります。
OpenAIが開発したChatGPTは、GPT-3.5 Turboという大規模言語モデルを用いたAIチャットサービスです。
📚
Weekly Kaggle News #190 - by u++ - Weekly Kaggle News
Kaggleが学術・非営利機関向けの助成金プログラムを発表、コンペ開催や賞金の費用減免などが特典として提供される
Kaggleの「Machine Unlearning Challenge」は法的問題で開始が延期、学習済みモデルから特定の訓練データの影響を取り除くコンペ
Pythonの科学技術計算ライブラリ「NumPy」のページが日本語とポルトガル語に対応、英語以外の言語として初の対応
💻
Introducing code referencing for GitHub Copilot - The GitHub Blog
GitHub Copilotのプライベートベータ版が発表されました。
このベータ版では、公開コードに一致するコードの提案を検出するフィルターが含まれています。
提案が公開コードと一致する場合、そのコードが表示されるリポジトリのリストとそのライセンスが表示されます。
🤖
AIによる乳がん検診は発見率が20%上昇し放射線科医の仕事量を44%削減することにもつながる - G..
AIによる乳がん検診で発見率が20%上昇し、放射線科医の仕事量を44%削減することが可能との研究結果が出た
AIを用いた乳がんスクリーニングは放射線科医によるスクリーニングよりも41件多く乳がんを検出できた
AIの利用により、放射線科医の作業負荷を44%減少させることも確認された
💻
Azure OpenAI Service のはじめ方 - Taste of Tech Topics
Azure OpenAIの利用には申請が必要で、会社メールアドレスを使用します
申請後の承認が通るとAzure OpenAIのデプロイが可能になります
デプロイ後はAzure OpenAI Studioで様々な機能を利用でき、モデルのデプロイや利用方法についても説明します
📚
Few-shot Learning(フューショット学習)とは?:AI・機械学習の用語辞典 - @IT
フューショット学習は、言語モデルのパラメーターを更新せずに、少数の例文を提示するだけで様々なタスクを解決する能力を指す
例文が1つだけの場合は「ワンショット学習」、例文がない場合は「ゼロショット学習」と呼ばれる
フューショット学習は、フューショットと組み合わせて表現されることもあり、多くの手法や論文が存在する
💡
Cognitive Searchの生成AI用ベクトルDBの構築手順書 - Qiita
Cognitive Searchのベクトル検索機能のベクトルDB構築手順について解説
PDFやドキュメントの扱い方、チャンク分割やベクトル生成の方法などを説明
Azure公式のGitHubリポジトリのインデックス作成ツールを使用してベクトルDBを簡単に構築
💪
AWSが生成AIを強化、LLM拡充・データ連携・AI特化サーバーを一挙投入 | 日経クロステック(xTECH..
生成AIの強化に向け、大規模言語モデル(LLM)の拡充や新しいモデルの追加が行われました。
エージェント機能「Agents for Amazon Bedrock」が発表され、LLMの業務利用やデータ連携を容易にします。
Amazon BedrockやAmazon OpenSearch Serverlessなどの新サービスや機能が発表され、生成AIの利用や開発がより簡単になります。
🔍
Scikit-learnのall_estimators()関数の活用:全モデルでの精度を一括比較する - Qiita
Scikit-learnのall_estimators()関数は、全ての推定器(モデル)のリストを返す
特定の種類のモデルを取得することも可能
複数のモデルを一括で評価し、最も性能の良いモデルを選択することができる
😎
Google Colab で Vicuna-v1.5 + LlamaIndex の QA を試す|npaka
「Google Colab」で「Vicuna-v1.5 + LlamaIndex」のQAを試行し、使用モデルは「lmsys/vicuna-7b-v1.5」と「multilingual-e5-large」を使用
マンガペディアの「ぼっち・ざ・ろっく!」のあらすじを用意し、必要なパッケージをインストールし、インデックスを作成し、質問応答を行った
追加の質問も行い、正解率は8/10で、日本語で回答してくださいなしの質問でも正解率は6/10だった
💻
Microsoft謹製エンタープライズ向けPrivate ChatGPT(Azure ChatGPT)が公開されたのでローカル環..
エンタープライズ向けPrivate ChatGPTがローカル環境で動作可能に
Azure ChatGPTはプライベートで管理され、独自のビジネス価値を提供
環境構築は手間がかかるが、オープンソースとして貢献可能
📚
Multilabel Classification: An Introduction with Python’s Scikit-Learn - KDnuggets
マルチラベル分類は、入力データに適用される可能性のあるできるだけ多くのラベルを予測しようとする手法です。
マルチラベル分類はテキストデータの分類タスクでよく使用され、各ラベルは独立して考えることができます。
PythonのScikit-Learnを使ってマルチラベル分類器を構築し、モデルの評価には精度指標やハミング損失評価指標を使用します。
🎵
Deploy MusicGen in no time with Inference Endpoints
MusicGenは、テキストプロンプトとオプションのメロディを入力として、音楽を出力する音楽生成モデルです。
Inference Endpointsを使用すると、カスタムハンドラと呼ばれるカスタム推論関数を記述できます。
MusicGenのカスタムハンドラ関数を実装して展開するためには、リポジトリの複製、カスタムハンドラとその依存関係の追加、Inference Endpointの作成が必要です。
🌍
Yeager.ai x LangChain: Exploring GenWorlds a Framework for Coordinating AI Agents
GenWorldsは、マルチエージェントシステムのためのオープンソースの開発フレームワークで、専用の環境や専門のAIエージェントと共有オブジェクトが中核となっています。
エージェントの調整は、GenAIシステムが複雑な操作を行うために不可欠で、研究によれば、エージェントが狭い焦点でより良いパフォーマンスを発揮します。
開発者は、組み合わせ性と相互運用性を考慮して設計されたフレームワークを通じて、簡単に収益化することができます。
💡
Use the Amazon SageMaker and Salesforce Data Cloud integration to power your Salesforce ap..
Salesforce Data CloudとEinstein StudioのSageMakerとの統合により、Salesforceデータに安全にアクセスし、モデルを構築、トレーニング、展開できます
SageMaker上のエンドポイントに登録し、Salesforce Data Cloudにも登録することでSalesforceでの予測が可能になります
この統合は、従来のモデルだけでなく、大規模な言語モデル(LLM)にも適用できます
🎉
Bring your own AI using Amazon SageMaker with Salesforce Data Cloud | AWS Machine Learning..
Salesforce Data CloudとAmazon SageMakerの統合により、Salesforceデータに安全にアクセスし、AIモデルを構築、トレーニング、展開が可能
Einstein Studioを使用することで、カスタムモデルをSalesforceワークフローに統合し、効率性、意思決定、パーソナライズされた体験を向上させることができます
データのゼロコピーにより、ETLジョブを排除し、ストレージコストを削減し、効率を向上させることができます
😎
I Created An AI App In 3 Days - KDnuggets
AIカバーレタージェネレーターを作成し、ユーザーのスキルを求人要件にマッチさせることで、カスタマイズされた応募書類を自動化しました。
履歴書と求人要件を別々のフォームに貼り付け、それらを組み合わせてユニークなカバーレターを作成します。
Open AIプレイグラウンドを使用し、フロントエンドをコードで作成するか、bubble.ioのようなノーコードビルダーで作成します。
😎
Index your Alfresco content using the new Amazon Kendra Alfresco connector | AWS Machine L..
Amazon Kendraは、機械学習による高精度なインテリジェント検索サービスで、データソースコネクタのスイートを提供します。
Alfresco Content Servicesは、高いスケーラビリティを持つエンタープライズコンテンツ管理機能を提供し、どこでもコンテンツにアクセスできます。
新しいAmazon Kendra Alfrescoコネクタを使用すると、Alfrescoリポジトリとサイトに保存されているドキュメントを検索できます。
🗡️
OpenAI、“汎用人工知能”の開発に4日の遅れ 理由はあのゲーム - ITmedia NEWS
Nintendo Switch向けソフト「ゼルダの伝説 ティアーズ オブ ザ キングダム」は全世界で1850万本以上売れ、SNSでも話題になっている。
CEOがゲームに夢中になり、「AGIは4日遅れた」と冗談を言い、ゲームへのハマり具合も明かした。
AGIは汎用的なAIを指し、ChatGPTなどの開発により、CEOはAGIの誕生に王手をかける存在として注目されている。
🤸♂️
Forget ChatGPT, This New AI Assistant Is Leagues Ahead and Will Change the Way You Work Fo..
新しいAIアシスタントは、仕事のやり方を永遠に変えるとされています。
このAIアプリケーションは、柔軟性、使いやすさ、正確な結果を提供します。
Poeという新しいAIアシスタントは、データサイエンスのタスクにおいて優れた代替手段とされています。
📝
キーワードだけでプレゼン資料をAIが自動生成、「プレゼン資料AI」β版を提供開始 - INTERNET Wa..
「プレゼン資料AI(β版)」はキーワードだけでプレゼン資料を自動生成する機能
生成された資料は編集可能で、PDFやPowerPoint形式で出力できる
ビジネス用のチラシやSNSのアイキャッチも作成可能で、今後は機能の追加が予定されている
🎙️
GitHub - jmaczan/gdansk-ai: ��早 Full stack AI voice chatbot (speech-to-text, LLM, text-..
Gdańsk AIは、音声認識、LLM、テキスト読み上げの機能を持つAI音声チャットボットで、Auth0、OpenAI、Google Cloud API、Stripeと統合されています。
ユーザーはStripeを通じてbibsというAPIトークンを購入でき、Auth0は認証と認可を提供します。
OpenAIとGoogle Cloud APIは音声認識とテキスト読み上げのサービスを提供し、PythonとFastAPIを使用しています。
😮
Non-determinism in GPT-4 is caused by Sparse MoE - 152334H
GPT-4の非決定性はSparse MoEによるものである
GPT-4/GPT-3.5-turboは、temperature=0.0でも非決定的であることが知られている
temp=0はgreedy samplingを意味し、完全な決定性を意味するはずである
🎵
Meta、テキストから音楽を生成するAIツール「AudioCraft」を発表 - CNET Japan
「AudioCraft」はテキストから音楽を生成するAIツールです
「MusicGen」や「AudioGen」などのAIモデルで音楽や効果音を生成します
「EnCodec」オーディオコーデックで音楽の圧縮と再構築が可能で、これらはオープンソースとして公開されています
👾
AIエージェント沼にハマるためにこの辺を見ておけば良いと思われるリソースまとめ|mah_lab / 西..
AIエージェントは自律的に仕事をこなすAIで、ブレイクスルーを起こす可能性がある
AIエージェントのジャンルには自律エージェント、Copilotエージェント、AITuberなどがある
AIエージェントの詳細を理解するためには、特定の記事やリポジトリが参考になる
😎
ChatGPTをもっと活用してみよう ~関西弁で答えてもらったり、Excelとの連携もできる - これから..
ChatGPTは関西弁での回答やExcelとの連携も可能
質問テクニックやプロンプトエンジニアリングを活用して高度な操作が可能
利用規約や有料プランの利用方法についても説明
2023年08月05日
|
2023年08月03日
このサイトについて
/
ニュースレター
/
@AINewsDev