AI News

~AI関連記事を3行にまとめて紹介~

👀

投資集める「OpenAIのライバル」の実力、AnthropicとCohereは何がすごいのか | 日経クロステック..

  • AIモデルの開発企業AnthropicとCohereは、米OpenAIのライバルとして注目されている
  • Anthropicの最新LLM「Claude 2.1」は、20万トークンの長いテキストを扱う能力を持つ
  • 安全性にも力を入れ、国際連合の世界人権宣言や他のAI企業のガイドラインを学習している

Google Colab で StripedHyena-7B を試す|npaka

  • StripeHyena-7Bは、オープンソースの「Transformers」と競合するモデルで、短期・長期コンテキストの評価において高速です
  • StripeHyena-7Bのモデルは2つ提供されています
  • Google Colabでの実行手順は、ノートブックの設定、パッケージのインストール、リポジトリのクローン、推論の実行、メッセージの入力が含まれます

🚀

Google Colab で Mixtral-8x7B-v0.1 を試す|npaka

  • 「Mixtral 8x7B」は高品質な「SMoE」モデルで、推論速度は6倍速く、「Llama2 70B」を上回る性能を持つ
  • 「Mixtral-8x7B-v0.1」は現在2つのモデルのみ提供されている
  • Colabでの実行手順は、ノートブックを開き、「GPU」の「A100」を選択し、パッケージのインストール、トークナイザーとモデルの準備、推論の実行を行う

💡

HuggingFace の Mixtral 統合|npaka

  • 「Mixtral 8x7b」は「Mistral」がリリースした新しいLLMで、「GPT-3.5」を上回る性能を示しています。
  • 「Mixtral」は「MoE」(Mixture of Experts)という技術を用いて8つの「エキスパート」モデルを1つにまとめ、効率的な処理を可能にしています。
  • 「Mixtral MoE」は約45Bのパラメータを持ち、一部の層のみが複製される特殊なアーキテクチャを持っています。

🚀

GKEでMLバッチ運用のコツ - エムスリーテックブログ

  • GKE上で240個以上のMLバッチを運用している
  • スケールインとコスト最適化について詳細に説明
  • Autopilotモードについても触れ、その進化を見つつインフラの作り方を考えている

😱

人気声優さんがAIに声を無断学習される件について複雑な心情を語る→声優さんの真骨頂を感じたエ..

  • 人気声優がAIに声を無断学習される事案について複雑な感情を表明
  • 声優の真骨頂を感じさせるエピソードが集まる
  • 声優のプロフェッショナルな姿勢が見える

📈

MLOpsの意義:機械学習プロジェクトを成功させるための鍵 #MLOps - Qiita

  • MLOpsは、機械学習のライフサイクルを管理する技術で、DevOpsの原則を機械学習に応用します。
  • MLOpsエンジニアは、機械学習モデルの開発から運用までを統合し、自動化、監視、パフォーマンス最適化を担当します。
  • MLOpsの採用と実践は、持続可能な機械学習プラクティスを築く上で不可欠であり、ビジネスの成長とイノベーションを加速させます。

🗣️

rinna、日本語特化の基盤モデルを組み合わせた音声認識モデル「Nue ASR」を公開 - INTERNET Watc..

  • 日本語音声認識モデル「Nue ASR」が開発され、商用利用可能なライセンスで公開された
  • 「Nue ASR」は「HuBERT」と「GPT」を統合し、話し言葉を文章に変換可能
  • 学習データには「ReazonSpeech」が使用され、高速推論手法「DeepSpeed」により認識時間を短縮

🔍

From PyTorch Conference 2023: From Dinosaurs to Seismic Imaging with Intel | PyTorch

  • 地震イメージングとフルウェーブ形状逆推定(FWI)は、重要な地下鉱物を探索するために役立つ
  • データ駆動型のディープラーニングソリューションとCPUを使用したAIの微調整が、地下イメージングの課題を解決する
  • InversionNETを使用したトレーニングにより、地下モデルを取得することができた

👨‍💻

サイバーエージェントの生成AI開発を支える機械学習基盤 | CyberAgent Developers Blog

  • 生成AI開発の裏側にフォーカスし、機械学習基盤の設計や運用について紹介
  • パブリッククラウド環境だけでなくオンプレミス環境でも機械学習基盤を運用
  • NVIDIA DGX H100サーバーを導入し、GPU資源を増強

🎵

AIの脅威 フェイクが拡散 声優・タレントが抗議も 生成AIとの共存は | NHK | WEB特集 | 生成AI・..

  • 生成AIによるカバーソングが拡散し、声優たちが抗議の声を上げる事態に
  • 生成AIの進化により、映画やCM、漫画の脚本まで作り出す時代が到来
  • 生成AIとの共存の道はまだ模索中で、どのように向き合っていくべきかが問われている

🌐

DCC グループの Google Cloud ユーザーコミュニティイベント報告【GINGER Event#5】 - NTT Commu..

  • ノーコード分析ツール「Node-AI」開発チームの林がGoogle Cloudユーザーコミュニティ「GINGER」の第5回目のイベントを紹介
  • GINGERはドコモとコミュニケーションズの社員/BPが参加し、slackチャンネルでの情報共有やハイブリッド形式イベントを主に行っている
  • イベントではGoogle CloudネットワークやGCSに対するIP制限、ビジネスアプリのGCPサーバーレスなどについてのLTが行われた

💰

Strategies for Optimizing Performance and Costs When Using Large Language Models in the Cl..

  • クラウドプラットフォームで大規模言語モデル(LLM)を使用する際のパフォーマンスとコストを最適化するための戦略を紹介
  • 明確な予算計画を立て、適切なモデルサイズとハードウェアを選択し、適切な推論オプションを選ぶことが重要
  • 効果的なプロンプトの構築とレスポンスのキャッシュもコスト削減に寄与

🎮

「イナズマイレブン」「妖怪ウォッチ」で画像生成AIを活用 レベルファイブのAI利用例が公開に(..

  • ゲーム開発やプロモーション業務で生成AIを活用していることが明らかになった
  • 画像生成AI「Stable Diffusion」を使用し、ゲームのタイトル画面のレイアウト案を生成
  • 「妖怪ウォッチ」シリーズではAIを使って主人公のイメージ画像や背景素材を作成し、キャラクター設定やせりふの収録、Webサイト制作にもAIツールを活用

😲

培養したヒトの脳組織を使ってコンピューターを構築することに成功、日本語の音声認識にも対応 -..

  • 日本の研究チームが人間の脳組織を使ったコンピューターの構築に成功
  • 人工脳を電子チップに接続し、日本語の音声認識に対応
  • 脳オルガノイドをコンピューティングに使用する初のデモンストレーションで、バイオコンピューティングの可能性を示す

🤖

Geminiの技術レポートを読み解く〜生成AIの最前線|Ray | 旅する魔法使い

  • 次世代のマルチモーダル生成AI「Gemini」はテキスト・音声・画像・動画の入力に対応し、テキストと画像を生成します。
  • Geminiには効率的なアテンションメカニズムの採用や長いコンテキストの扱い、音声信号の取り込みなどの特徴があります。
  • GeminiはUltra、Pro、Nanoの3つのモデルがあり、それぞれ異なるタスクに最適化されています。

🛠️

5 Tools to Help Build Your LLM Apps - KDnuggets

  • LLMアプリ開発に役立つ5つのツールは、Hugging Face、LangChain、Qdrant、MLflow、vLLMです。
  • これらのツールは、ホスティング、コンテキスト認識、検索機能、展開、推論の効率など、それぞれ独自の強みを持っています。
  • これらのツールを活用することで、開発者やデータサイエンティストはワークフローを大幅に効率化し、LLMアプリケーションの品質を向上させることができます。

📝

精魂込めた論文を学会が拒否、生成AIを活用した研究者の誤算 | 日経クロステック(xTECH)

  • 生成AIを活用して論文を作成した研究者が学会から拒否される誤算が発生
  • 研究者は論文執筆が苦手で、AIの出力の高品質さに頼って論文を作成
  • AIの利用によるリスクを考慮せず行動した結果、研究者としての評価が下がった

🚀

Introducing DeciLM 7B: The Fastest and Most Accurate 7B LLM to Date

  • DeciLM-7Bは、最速かつ最も優れた7兆パラメータのベースLLMで、速度と精度の基準を再定義します。
  • オープンLLMリーダーボードで平均スコア61.55を達成し、さまざまなアプリケーションで信頼性の高い正確な応答が可能になります。
  • 効率と精度の優れた組み合わせを活用して、より効果的で使いやすいAIツールを低コストで作成し、さまざまなセクターでイノベーションを推進します。

🚀

Answer.AI - A new old kind of R&D lab

  • Jeremy HowardとEric Riesが新しいAIのR&Dラボ、Answer.AIを立ち上げました。
  • Answer.AIは基礎研究のブレークスルーに基づいて実用的なエンドユーザー製品を作成します。
  • Decibel VCからの1,000万ドルの投資によってAnswer.AIの創設が支援されています。

🏗️

Vodafone advances its machine learning skills with AWS DeepRacer and Accenture | AWS Machi..

  • 2025年までにテクノロジー企業への転換を目指し、AIやMLのスキルアップを必要としている
  • AccentureとAWSと提携し、クラウドプラットフォームを構築し、エンジニアが柔軟で創造的かつアジャイルな方法で働くことを支援
  • AWS DeepRacerチャレンジを通じて、幅広いビルダーがMLに実践的に取り組むことを支援

🔐

Introducing MemoryCache | Augmented Local AI ..

  • MemoryCacheは、ブラウザから保存されたローカルファイルを個人モデルに追加するプロジェクトです。
  • Firefox拡張機能、シェルスクリプト、コードなどから構成されています。
  • プロジェクトの進捗状況については、GitHubでフォローするか、ウェブサイトをチェックしてください。

👩‍💻

Create a web UI to interact with LLMs using Amazon SageMaker JumpStart | AWS Machine Learn..

  • Amazon SageMaker JumpStartを使用して、Llama 2やStable Diffusionなどの基礎モデルと対話するためのWeb UI、Chat Studioの作成方法を紹介
  • Chat Studioでは、ユーザーがメディアの表示をリクエストした場合、関連する画像や動画のコラージュを返すことも可能
  • 事前トレーニングされたカスタムLLMを展開し、モデルとのインターフェースとなるWeb UIを作成するためのローコードワークフローについて説明

💻

Frugality meets Accuracy: Cost-efficient training of GPT NeoX and Pythia models with AWS T..

  • 大規模言語モデルのトレーニングには膨大な計算時間とコストがかかるが、AWS Trainiumを使用することでコスト効果的にトレーニングが可能であることが示されています。
  • GPT NeoXとPythiaは、Eleuther-AIによるオープンソースの因果関係言語モデルで、それぞれ約200億、69億のパラメータを持つ。
  • AWS TrainiumベースのTrn1インスタンスでこれらのモデルの事前トレーニングと微調整をデモンストレーションするために、Neuron NeMoライブラリが使用されます。

👍

漫画家・すがやみつる「73歳のマンガ家が生成AIを使ったら」 - 週刊アスキー

  • 生成AIはクリエイターにとって助けになる技術であり、商売敵と感じるかもしれない
  • すがや先生はChatGPTを使ってアイデアを得ており、そのアドバイスは役に立っていると述べている
  • 生成AIを使いこなすことで創作の幅が広がるとすがや先生は言っている

🙏

The Singularity is Nigh! [Republished from The Economist]

  • AIのエンジニアたちは、進歩を崇拝する一派と神のような力に恐怖を抱く一派に分裂しています。
  • 超人的な知性を創造し、AIが自己を養う「シンギュラリティ」が訪れると予測されています。
  • AIのリスク、お金、権力に関する対立が、AI関連企業の間で分裂を引き起こしています。

👨‍💻

Essential AI

  • 人間とコンピューターのパートナーシップを深め、共同作業能力を開放することを目指しています
  • 時間のかかる単調なワークフローを自動化し、生産性を向上させるAI製品を開発
  • データアナリストを10倍速くし、ビジネスユーザーに独立したデータ駆動型の意思決定者になるツールを提供

💡

米津玄師が好き 最新AI搭載ロボット「Ameca」とガチで語り合った3時間 人間の身体が欲しい?AI研..

  • 最新のAIテクノロジーを駆使したヒューマノイドロボット「アメカ」は、対話型AIのChatGPTを搭載し、自然な表情やしぐさをすることもできる
  • AIの進化により、自動運転や医療支援などの技術が進み、人間とAIの違いや創造性についても考える
  • AIが人間のような知能を持つことは可能であり、大規模言語モデルの登場により、AIが言葉や創造性を理解する能力も向上している

😎

GPT-4V と Segment Anything で楽々アノテーション

  • GPT-4Vは画像認識が可能で、物体検出やセマセグにも活用できます。
  • SAMは画像中の物体をセグメンテーションでき、セマセグのアノテーションに活用できます。
  • SAMでセグメンテーションを行い、GPT-4Vにマーキングした画像を入力し、所望の物体の領域を答えさせます。

😮

LLMの出力における問題は「LLMの処理が原因」とは限らない プロンプト以外に考えられる4つの要..

  • 精度評価には完全一致や部分一致などの方法があるが、完全一致は厳しすぎる場合も
  • 原因分析では前処理や検索、結果のまとめ方に問題があることが多い
  • チューニングでは、一つずつ変更したり、問題を分解したりすることが重要

🤖

録画・録音の音声をAIが文字起こしして要約・翻訳・共有できる「RecCloud」が登場 - 窓の杜

  • 「RecCloud」は音声をAIが文字起こしし、要約・翻訳・共有が可能なサービスです
  • ChatGPTを活用し、音声の内容を質問や指示で書き出すことができます
  • 動画や音声ファイルをアップロードし、自動でテキスト化して要約や翻訳が可能で、98言語への翻訳も可能です

2023年12月13日

|

このサイトについて

/

ニュースレター

/

@AINewsDev