~AI関連記事を3行にまとめて紹介~
🎉
Jina AI Launches World's First Open-Source 8K Text Embedding, Rivaling OpenAI
ベルリンの人工知能企業が第2世代のテキスト埋め込みモデルを発表
このモデルは8K(8192トークン)のコンテキスト長をサポートする唯一のオープンソース
OpenAIのモデルと同等の能力とパフォーマンスを持ち、MTEBのリーダーボードでも優れた成績
🎞️
畳み込みニューラルネットワークの処理についてアニメーションで解説する「Animated AI」 - GIGA..
「Animated AI」では、畳み込みニューラルネットワークの処理をアニメーションで解説
畳み込み処理の基本的な動作や「パディング」、「ストライド」などが視覚的に紹介
他の機械学習の手法についても解説されている
🚀
Google Colab で SSD-1B を試す|npaka
「SSD-1B」はSDXLを50%小型化し、高品質のテキストから画像への生成機能を維持しながら60%高速化を実現
「Google Colab」での「SSD-1B」の実行手順は、GPUの選択、パッケージのインストール、パイプラインの準備、画像生成の順
画像生成にはT4で5.25秒かかった
🖼️
進化したChatGPT 画像認識・生成可能になったGPT-4Vが凄い - Impress Watch
2023年9月に画像アップロード機能が追加されたChatGPTは、画像内容に基づいた回答が可能になりました。
画像生成AIのDALL・E 3も実装され、テキスト指示による高品質な画像生成が可能です。
ただし、回答生成に時間がかかることや、大きな画像や日本語文書の認識精度がまだ高くない点に注意が必要です。
💡
大規模言語モデルのFine-tuningによるドメイン知識獲得の検討 - Preferred Networks Research & ..
2023年夏季のインターンシッププログラムで、大規模言語モデルに日本語のドメイン知識を習得させるためのFine-tuningを行った
Fine-tuningにはLoRAやInstruction Tuningの技術を使用した
日本語におけるドメイン知識の習得に関する実験結果と最新研究に基づく考察を行った
💡
Evaluating social and ethical risks from generative AI - Google DeepMind
AIシステムの社会的および倫理的リスクを評価するためのフレームワークを提案
AIシステムの能力、人間との相互作用、システムへの影響の3つのレイヤーで評価
社会的および技術的な課題の両方を解決する必要がある
🤖
Scaling up learning across many different robot types - Google DeepMind
33の学術研究所と協力し、22種類のロボットからデータを集め、Open X-EmbodimentデータセットとRT-Xモデルを作成
RT-1-Xモデルは5つの研究所でテストし、一般的に使用されるロボットに対して平均50%の成功率向上を実証
RT-2-Xは、以前のモデルであるRT-2よりも3倍の成功率を示し、新しいタスクを実行できるようになった
🎉
Identifying AI-generated images with SynthID - Google DeepMind
AI生成画像を特定するための新ツール「SynthID」が登場し、画像のピクセルにデジタル透かしを埋め込むことで特定可能にします。
SynthIDはImagenを使用するVertex AIの一部の顧客向けにリリースされ、AI生成画像をより高度に特定するためのツールとして機能します。
SynthIDは、画像の品質を損なうことなく、透かしを検出可能な状態に保つように設計されており、フィルターの追加、色の変更、さまざまな損失圧縮方式での保存などの変更後も透かしを検出できます。
🌐
RT-2: New model translates vision and language into action - Google DeepMind
RT-2は、ウェブとロボットのデータから学習し、ロボット制御のための一般化された指示を生成するVLAモデルです。
視覚的または言語的なパターンを認識し、異なる言語で操作することができます。
物理的なロボットの一般的な目的の達成に向けた進歩を示し、一般化能力と新たなスキルを示しています。
🤖
Using AI to fight climate change - Google DeepMind
AIを活用し、気候変動と持続可能な低炭素社会の構築に貢献
気候変動が地球の生態系に与える影響を理解し、既存のシステムを最適化し、画期的な気候科学を加速
AIを活用した核融合プロセスの制御と豊富な緑のエネルギーの利用に向けた課題の解決
💡
Google DeepMind’s latest research at ICML 2023 - Google DeepMind
AIの安全性、適応性、効率性についての最新研究がICML 2023で発表されます。
新しいAIモデルのデモや80以上の新しい論文が発表され、AIの進歩が共有されます。
AIの成功を支える基礎モデルについての研究や、具現化されたAIエージェントの構築方法についての探求が行われます。
👨⚕️
Developing reliable AI tools for healthcare - Google DeepMind
新しい研究では、AIと人間の臨床医が協力して最良の結果を提供するためのシステム、CoDoCを提案
CoDoCは、予測AIツールの信頼性を向上させ、AIが自分がわからないことを知るためのシンプルで使いやすいシステム
CoDoCの使用により、予測AIと臨床医の両方を組み込むことができ、最も正確な解釈に結びつくかどうかを判断
🌐
Exploring institutions for global AI governance - Google DeepMind
新しいホワイトペーパーでは、先進的なAIの機会を管理し、リスクを軽減するために役立つ国際機関のモデルと機能について調査
国際的な協力は、AIの利益がすべてのコミュニティに届くようにする方法を調査
4つの補完的な機関モデルを探求しています:フロンティアAI委員会、先進的なAIガバナンス機関、フロンティアAI協力体、AI安全性プロジェクト
🤖
RoboCat: A self-improving robotic agent - Google DeepMind
ロボット猫は、自己生成データから学習を改善し、異なる実ロボットで複数のタスクを解決する自己改善型AIエージェントです。
ロボット猫は他の最先端モデルよりも高速に学習し、大規模で多様なデータセットから新しいタスクを習得することができます。
新しいタスクを学習するたびに、ロボット猫はより高い成功率を達成し、自己改善を続けます。
🔬
An early warning system for novel AI risks - Google DeepMind
AIシステムの新たな能力とリスクを早期に特定するための研究が進行中
新たな脅威を評価するためのフレームワークを提案
AI開発者は、将来の開発や新たなリスクを予測し、先を見越して行動する必要がある
🧠
DeepMind’s latest research at ICLR 2023 - Google DeepMind
DeepMindのチームはICLR 2023で23本の論文を発表し、AIの一般化、スケールアップ、加速化に向けた研究を行います。
新しいアプローチとして、モデルが2つの問題を同時に解決する学習方法や、長期的なタスクでの専門レベルの進歩を目指す方法を提案します。
AIを科学の進歩に活用するための研究も行われ、分子の3D構造からその性質を予測するモデルや、複雑な形状の衝突を物理学からモデル化するシミュレータなどが紹介されます。
🤔
How can we build human values into AI? - Google DeepMind
AIの行動を指針付ける原則を特定するために、哲学からインスピレーションを得る研究が進行中です。
「無知のベール」という概念をAIに適用し、公正な原則を特定するための思考実験を行っています。
無知のベールの下で推論を行うと、最も不利な立場にある人々を助けるAIを選択する参加者が増えることが明らかになりました。
🔥
Announcing Google DeepMind - Google DeepMind
Google DeepMindとGoogle ResearchのBrainチームが統合し、一つのチームとなる
AIの研究と技術の進化により、人類の課題解決や産業変革、科学進歩に貢献する可能性がある
次世代のAIのブレイクスルーと製品を創造するために、世界的な才能と計算能力、インフラ、リソースを結集する
💻
Google Colab で Stockmark-13B を試す|npaka
「Stockmark-13B」は「Llama2」ベースの日本語LLMで、ビジネスや最新情報にも対応
「Google Colab」で「Stockmark-13B」の実行手順は、「GPU」選択とパッケージインストール、トークナイザーとモデルの準備、推論実行となる
プロンプトの準備後、モデルによる文章生成を行い、結果を表示
🎯
How to Use Hugging Face AutoTrain to Fine-tune LLMs - KDnuggets
大規模言語モデル(LLM)の微調整にはHugging FaceのAutoTrainを使用することができます。
AutoTrainはPython APIを備えたノーコードプラットフォームで、特定のドメインのユースケースの採用、精度の向上、データのプライバシーとセキュリティの確保、モデルのバイアスの制御などを可能にします。
AutoTrainの使用方法には、Pythonパッケージのインストール、データセットのロード、データのCSV形式での保存、そして微調整プロセスの適応が含まれます。
🔄
GitHub - facebookresearch/MetaCLIP: Everything about MetaCLIP: curation/training code, met..
MetaCLIPは、CLIPデータのキュレーションを単純なアルゴリズムとして形式化し、データパイプラインで実行されるスケーラブルなアルゴリズムにより、データプールをCommonCrawl全体にスケーリングすることができます。
MetaCLIPは、事前トレーニングデータの分布を公開し、データの品質を重視し、ノイズを軽減しながら信号を最大限に保持することを重視しています。
MetaCLIPはOpenCLIPの上に開発され、デフォルトのCLIPモデルのセットアップに一致させ、制御された実験に役立つように設計されています。
🍎
スマホ時代は終わり。元Appleデザイナーが手がける「ChatGPT搭載デバイス」の正体 | AppBank
元Appleデザイナーが開発したAI搭載の新型デバイス「AI Pin」は、2023年のベスト発明に選ばれた未発表のAIガジェットです。
AI Pinは軽量で衣服に磁力で取り付けられ、声だけで複雑な質問や電話の発信、テキストの送信などができます。
内蔵カメラやマイク、入力センサーも搭載されており、物の識別や文脈情報の提供、プライバシーの確保なども可能です。
🚀
朝日新聞社、文章校正AI「Typoless」(タイポレス)サービス提供開始 - INTERNET Watch
AIによる文章校正サービス「Typoless」が提供開始され、法人向けと個人向けの3つのプランが用意されている。
AIは記事の校正履歴を学習し、助詞や同音異義語の誤りを検知し、修正候補を提示する。
校正には約10万個の校閲ルールを活用し、上位プランではカスタム辞書機能も利用可能で、不適切な表現を指摘する機能も備えている。
😮
ビジネスのドメインや最新情報に対応した130億パラメータの日本語LLMの公開 - Stockmark Tech Bl..
130億パラメータの日本語LLMが公開され、ビジネスのドメインや最新情報に対応しています
このモデルはHuggingface Hubからダウンロード可能で、ビジネス関連の知識を問うタスクや日本語の言語理解のベンチマークで高い性能を示しています
他の同規模のモデルと比べてテキスト生成の効率性が高く、約4倍の速度で生成可能です
🚀
Announcing Data Annotation Queues
LangSmithが新機能のデータ注釈キューをリリースし、ログの確認やフィードバック提供、データセット作成を容易にします。
データ注釈キューは、ログを注釈付けしたりデータセットに追加したりするための理想的なUXを作成します。
データ注釈キューのリリースと同時に、同様の方向性のオープンソースパッケージであるlangfreeも共有されます。
🧠
LLMに非線形的な思考を与えてCoTを上回る性能を引き出す手法『IEP』と実行プロンプト CoTと組合..
IEPフレームワークにより非線形な推論が可能になり、CoTを上回る性能を示す
IEPは複数のステップで計画、推論、除去を行い、人間の思考を模倣
IEPとCoTを統合することで性能が向上し、MARBベンチマークで優れた結果を示す
📊
How the Foundation Model Transparency Index Distorts Transparency | EleutherAI Blog
スタンフォード大学のCRFMがFoundation Model Transparency Index(FMTI)を公開し、大規模言語モデルの透明性を評価・スコアリングすることを目指しています。
FMTIは商業製品の文書化の良さを測定していると誤解されがちですが、実際にはファウンデーションモデルの透明性を測定しています。
FMTIのスコアカードのアプローチは、分析のニュアンスを最小限に抑え、人々に最適化するスコアとして見るように促しています。
🤖
Windows on Snapdragon Brings Hybrid AI to Apps at the Edge - KDnuggets
SnapdragonによるHybrid AIは、エッジ上のアプリにAIをもたらし、ローカルとクラウドベースの推論を組み合わせて強力で効率的なAIを提供します。
デベロッパーは、モデルやクエリの複雑さに基づいて異なるオフロードオプションを選択でき、デバイス中心、デバイスセンシング、共同処理の3つの分散アプローチを提供します。
Snapdragon 8cx Gen3 Compute Platformは、エッジでAIを実行し、5GとWi-Fi 6による常時接続の機能により、クラウドベースの推論にどこからでもアクセスできます。
🔧
Overview of PEFT: State-of-the-art Parameter-Efficient Fine-Tuning - KDnuggets
PEFT(Parameter-Efficient Fine-Tuning)は、事前学習モデルのほとんどを凍結し、追加パラメータのみをファインチューニングすることで、大規模なモデルでの壊滅的な忘却を防ぎ、限られた計算リソースでのファインチューニングを可能にします。
PEFTは、画像分類やテキスト生成などのタスクにおいて、わずかなパラメータのみを使用して効果的であり、単純に元の事前学習済みの重みに追加することができます。
PEFTライブラリは、LoRA、Prefix Tuning、AdaLoRA、Prompt Tuning、MultiTask Prompt Tuning、LoHaなどの人気のあるPEFT技術をTransformersとAccelerateに統合しています。
🔍
Intelligently search Drupal content using Amazon Kendra | AWS Machine Learning Blog
Amazon Kendraは、機械学習によって強化された知的な検索サービスで、さまざまなコンテンツリポジトリからコンテンツを集約し、中央のインデックスに格納できます。
Drupalは、コンテンツ管理ソフトウェアで、Amazon Kendra Drupalコネクタを使用すると、Drupalコンテンツをインデックス化し、知的な検索を使用して簡単に検索できます。
コネクタは、各ファイルのアクセス制御リスト(ACL)情報を取り込み、ユーザーのコンテキストフィルタリングに使用され、クエリの検索結果がユーザーが承認されたアクセスによってフィルタリングされます。
🚀
Intuitivo achieves higher throughput while saving on AI/ML costs using AWS Inferentia and ..
AWS InferentiaとPyTorchを使用してAI/MLのコストを節約し、スループットを向上させています
数百万の自律型購買ポイント(A-POP)を同時に運用し、顧客のショッピング体験を変革しています
AWS Inferentiaのパフォーマンスとコストの利点により、コストを95%削減しています
💻
Empower your business users to extract insights from company documents using Amazon SageMa..
Amazon SageMaker Canvasはビジネスアナリストがコードを書かずにMLモデルを構築、展開、使用できるようにしました
SageMaker Canvasはファウンデーションモデルへのサポートを拡張し、組織固有の語彙や原則に一貫した応答を作成できるようになりました
これにより、時間系列予測、顧客離反予測、感情分析、産業の欠陥検出などのユースケースにおいて、MLを適用する能力が向上しました
🔧
Frontier risk and preparedness
AIに関連する安全リスクに真剣に取り組み、フロンティアAIの安全性に関する進捗状況を詳細に報告しています。
新たに「準備」チームを立ち上げ、フロンティアAIモデルの能力評価、評価、内部のレッドチーム活動と緊密に連携します。
AI準備チャレンジを開催し、最優秀な提案には最大10万ドルのAPIクレジットを提供します。
💻
「Microsoft Edge」のサイドバーでAI画像生成が可能に v118.0.2088.69が公開 - 窓の杜
「Microsoft Edge」v118.0.2088.69では、サイドバーに「Image Creator」が追加されました
AIを利用してイラストや写真、グラフィックデザインを生成することが可能です
生成された画像はWebページで拡大表示や共有、ダウンロードが可能です
🚀
Preparedness Challenge
準備チャレンジが開始され、応募は2023年12月31日まで受け付けます。
上位10件の応募者には最大25,000ドルのAPIクレジットが提供されます。
OpenAIのWhisper、Voice、GPT-4V、DALLE·3モデルへの無制限のアクセス権が与えられます。
💻
MT-Bench の使い方|npaka
「MT-Bench」は、80の高品質なマルチターンの質問を含むLLMのベンチマークです。
インストール手順はColabで行い、MT-Benchの質問に対する回答を生成します。
回答に対するGPT-4の評価を生成し、MT-Benchのスコアとレーダーチャートを表示します。
🎉
ð° Weekly AI News #14 - by hotchpotch - Weekly AI News
今週のAIニュースでは、大規模な機械学習モデルの公開とその影響が注目されました。
NightshadeというAIツールがリリースされ、その機能と利用可能性が話題になりました。
また、Stable-Diffusion-WebUI-TensorRTという新しい技術が登場し、その可能性が注目されました。
👍
Now add a walrus: Prompt engineering in DALL-E 3
DALL-E 3は、ChatGPT Plusを通じて利用でき、月額20ドルでGPT-4へのアクセス、DALL-E 3、GPT Vision、Code Interpreter、ChatGPTプラグイン、ChatGPTモバイルアプリの新しい音声チャット機能が提供されます。
DALL-E 3の特徴は、直接プロンプトを与えるのではなく、ChatGPTを介してアクセスすることで、クエリを複数のプロンプトに変換し、それぞれ異なる画像を生成します。
ChatGPTがDALL-Eにプロンプトを与え、生成されるプロンプトは4つの異なるスタイル(写真、イラスト、水彩画、ベクトル画)をカバーし、画像のさまざまな側面を説明するために多様な言語が使用されます。
2023年10月27日
|
2023年10月25日
このサイトについて
/
ニュースレター
/
@AINewsDev