AI News

~AI関連記事を3行にまとめて紹介~

💪

stabilityai/japanese-stablelm-base-alpha-7b ยท Hugging Face

  • 日本語安定LMベースアルファ7Bは、日本語の言語モデリング性能とタスクパフォーマンスを最大化することに特化しています
  • 多様な日本語と英語のデータセットで事前学習されています
  • 7Bパラメータのデコーダー専用言語モデルとして設計されています

💻

生成AIの活用で想定されるセキュリティリスク--NRIが解説 - ZDNET Japan

  • 生成AIの実用化が進み、情報漏えいや法令違反、ハルシネーションなど8つのセキュリティリスクが指摘された
  • サイバー攻撃者が生成AIを利用して攻撃手法を高度化させる可能性もあり、セキュリティ強化が必要とされた
  • 生成AIの利用には十分なセキュリティ対策が必要であり、大手サービスの採用が推奨され、適切なルールとリテラシーが必要とされた

👩‍💻

GitHub - tensorchord/Awesome-LLMOps: An awesome & curated list of best LLMOps tools for de..

  • 開発者向けの最高のLLMOpsツールの厳選リストが提供されています。
  • モデル、サービング、LLMOps、検索、Code AI、トレーニング、データ、大規模展開、パフォーマンス、AutoML、最適化、フェデレーテッドMLなどの項目が含まれています。
  • 大規模言語モデルのトレーニングとデータ生成のためのコードとドキュメントが提供されています。

🏛️

生成AI学習データ、事業者に開示指針 政府が骨子案 - 日本経済新聞

  • 政府がAI事業者向けの指針の骨子案をまとめる
  • 企業は開発から活用までの5段階でルールを守り、生成AIの学習データの開示を求められる
  • AIの適切な利用と透明性向上を図るため、AIのルールづくりは国際的に検討されている

🧠

AGI Introduction

  • 人工一般知能(AGI)は人間の知能に匹敵することを目指しており、特定の領域や問題に特化したAI研究から移行している
  • AGIの研究目標や開発戦略は多様で、ロジック、確率論、学習アルゴリズム、ニューラルネットワークなどの技術が使用されている
  • AGIの倫理的な側面も重要であり、安全性やリスクについての議論も行われている

🎉

Weekly Kaggle News #191 - by u++ - Weekly Kaggle News

  • Kaggleが公式Discordサーバを立ち上げ、アカウント連携が必要となりました。
  • 「Google Research Identify Contrails to Reduce Global Warming」が終了し、優勝者はGrandmasterに昇格。
  • 「ICR Identifying Age-Related Conditions」が終了し、クロージングイベントがDiscordで開催予定。

💰

画像生成AI「Stable Diffusion」の開発元・Stability AIで幹部やエンジニアが相次いで辞任、CEO..

  • AIスタートアップが開発資金の調達に苦しんでいる
  • 画像生成AIの成功により投資が集まったが、競争激化により優位性を失い、幹部の辞任も相次いでいる
  • CEOのリーダーシップに疑問が投げかけられ、資金調達にも苦労している

💻

Llama.cpp の HTTPサーバー機能を試す|npaka

  • 「Llama.cpp」のHTTPサーバー機能を試用し、モデル「vicuna-7b-v1.5.ggmlv3.q4_K_M.bin」を使用しました。
  • ローカルPCでの実行では、Llama.cppのインストールから推論の実行までを行いました。
  • HTTPサーバーの実行では、サーバーの起動からcurlでの動作確認までを行いました。

🔌

「自分でLLMを動かすことでイメージがつきやすくなる」ことが大事 ローカルで使うメリットと、..

  • ChatGPTはAPIを使って利用可能で、関数定義やJSONでの返答が簡単になる
  • 文章をベクトル化することで文章の検索が可能で、日本語特化のLLMも増えている
  • LLMを動かすためには適切なスペックが必要で、手元での実験もやりやすく、Colabなどでも利用可能

🗣️

Launch HN: Wondercraft (YC S22) – Use text-to-speech to create podcasts easily | Hacker N..

  • WondercraftはAIの声を活用してポッドキャストの作成を簡単にするプラットフォームです。
  • テキスト読み上げモデルが大幅に改善され、現実的なテキスト読み上げをポッドキャスト作成を簡素化するインフラと統合しています。
  • ローンチ以来、13,000人以上のユーザーがポッドキャスト作成のためにサインアップしています。

🤖

Harnessing ChatGPT for Automated Data Cleaning and Preprocessing - KDnuggets

  • ChatGPTを活用したデータクリーニングと前処理の手法について解説
  • 銀行のマーケティングデータセットを例に、データセットの取得・読み込み、欠損値チェック、カテゴリ変数のエンコードを実施
  • データクリーニングと前処理は、頑健な機械学習モデル構築に重要

💬

ChatGPT、「カスタム指示」機能を無料ユーザーに拡大 | マイナビニュース

  • ChatGPTの無料プランで「カスタム指示」機能が利用可能に
  • 「ChatGPT Plus」ではユーザーの条件や好みを考慮した回答を生成
  • 言語学習の添削やメール作成、小説の執筆など、さまざまな活用例が報告

💪

Amazon Translate enhances its custom terminology to improve translation accuracy and fluen..

  • Amazon Translateは、ニューラル機械翻訳サービスで、カスタマイズ可能な言語翻訳を提供します。
  • カスタム用語は、ブランド名やキャラクター名などの固有のコンテンツを翻訳するための重要な要件です。
  • カスタム用語の強化により、文脈に応じたマッチと置換を行うことで、より高品質で流暢な翻訳を目指しています。

📝

Zero-shot text classification with Amazon SageMaker JumpStart | AWS Machine Learning Blog

  • 自然言語処理(NLP)の分野で、最先端のアーキテクチャが使用され、テキスト要約、テキスト分類、エンティティ認識などのNLPの下流タスクでほぼ人間のパフォーマンスを達成しています。
  • 大規模言語モデル(LLM)は、数億(BERT)から数兆(MiCS)のパラメータを持つ大量の未ラベルテキストでトレーニングされたトランスフォーマーベースのモデルであり、そのサイズのため、単一のGPUでのトレーニングは実用的ではありません。
  • 最近、ゼロショット分類モデルのサポートを開始し、事前トレーニングされた基礎モデル(FMs)、LLMs、組み込みアルゴリズム、およびソリューションテンプレートへのアクセスを提供するハブとして機能します。

😱

Whose Responsibility Is It To Get Generative AI Right? - KDnuggets

  • ジェネレーティブAI(GenAI)技術の発展は、誤情報、誤用、情報の危険、ディープフェイク、炭素排出などの問題を引き起こす可能性がある。
  • GenAIの開発者は、これらのモデルを構築するための計算能力を提供するために大規模な投資を行っており、それらを閉鎖的なアクセスに保つことが彼らの権限である。
  • AIの開発とリリースを規制できるガバナンス機関が必要であり、その主な目的は、より責任あるアプローチを促進しながら、テクノロジーを通じたビジネスの成長を容易にするガードレールとポリシーを構築することである。

🎉

Fine-Tuning Llama-2: A Comprehensive Case Study for Tailoring Models to Unique Application..

  • Llama-2モデルを3つの実世界のユースケースで微調整し、全体的な精度が大幅に向上することを示した
  • 大規模なオープン言語モデルは、企業向けの商業的に実用的なソリューションの可能性を開拓している
  • Llama-2モデルを3つのタスクで微調整することを研究している

🎉

Introducing PlayHT2.0: The state-of-the-art Generative Voice AI Model for Conversational S..

  • 会話型音声生成AIモデルがクローズドベータ版として提供開始。APIとスタジオを通じて利用可能です。
  • モデルは、複数の言語、アクセント、話し方にわたる100万時間以上の音声データセットを使用して訓練されています。
  • PlayHT2.0は、リアルタイムで感情や話し方を理解し、それを任意の声に適用するように訓練されています。

💻

Stability AIから、日本語向け生成AI「Japanese StableLM Alpha 7B」公開 - ケータイ Watch

  • 「Japanese StableLM Alpha 7B」という日本語生成AIが公開されました
  • 汎用言語モデルと指示応答言語モデルを含み、ウェブの大規模データを学習しています
  • 商用利用可能なライセンスで一部が公開され、研究目的限定のものも公開されました

🤖

Sites scramble to block ChatGPT web crawler after instructions emerge | Ars Technica

  • OpenAIは、ユーザーエージェントGPTBotを使用して、ChatGPTのAIモデルのトレーニングに使用するウェブページを取得すると発表
  • GPTBotによってクロールされたウェブページは「将来のモデルの改善に使用される可能性がある」とOpenAIは述べている
  • OpenAIは、有料コンテンツや個人を特定できる情報、ポリシーに違反するコンテンツにはアクセスしないようフィルターを実装していると述べている

🎨

いらすとや風のイラストを生成する「AIいらすとや」を正式リリース!無制限に生成・商用利用が可..

  • 「AIいらすとや」は「いらすとや」風のイラストを無制限に生成・商用利用可能なAIモデルです
  • 「AI素材.com」でリリースされ、最適化機能やカテゴリー検索ページも実装されています
  • 無制限生成・ダウンロード、商用利用は有料プランのみで、無料プランでは20枚までお試し可能です

🇯🇵

Google Colab で AI BunChoで利用されているモデル japanese-novel-gpt-j-6b-v1.5 を試す|npaka

  • 「AI BunCho」のモデル「japanese-novel-gpt-j-6b」は、TPUで2週間の日本語トークナイザーを用いた事前学習と、2週間の小説データでの転移学習を行っています。
  • Colabでの実行手順は、ノートブックの設定でGPUのT4を選択し、必要なパッケージをインストールし、トークナイザーとモデルを準備し、推論を実行します。
  • 入力プロンプトに対して、モデルが生成した文章を出力します。

2023年08月12日

|

このサイトについて

/

ニュースレター

/

@AINewsDev