AI News

~AI関連記事を3行にまとめて紹介~

😲

botの運用により8ヶ月で1万ドルを1,000倍に botter・よしそ氏 1/3 - BMR

  • よしそ氏は2017年から仮想通貨に参入し、機械学習モデルを活用して価格変動を予測
  • 2021年には1万ドルを原資に8ヵ月で1,000倍のリターンを上げた
  • 現在は暗号資産が主な取引であり、株式関連のモデルの開発も始めている

📊

RedPajama-Data-v2: an Open Dataset with 30 Trillion Tokens for Training Large Language Mod..

  • 30兆トークンのオープンデータセットが大規模な言語モデルのトレーニングに利用可能
  • 英語、フランス語、スペイン語、ドイツ語、イタリア語の5つの言語をカバーし、40以上のデータ品質注釈を提供
  • データ処理スクリプトはオープンソースで、GitHubとHuggingFaceで利用可能

💼

OpenAI、オフィス3倍強に拡張 「在宅より出社」鮮明 - 日本経済新聞

  • 米新興企業OpenAIが、対話型AIのChatGPTを手がけています。
  • ビル2棟を転貸され、オフィス面積を少なくとも3.5倍に広げることが分かりました。
  • 生成AIへの注目が高まる中、国際的な規制や著作権に関するルールの策定が急がれています。

💻

BigQuery Studio は何者なのか

  • BigQuery Studioは、BigQuery上でPythonノートブック環境を利用可能な新機能です。
  • Duet AIによるコード補完もサポートし、非エンジニアでもデータ分析が容易になります。
  • SQLエディタ、データ検出・プロファイリング・品質スキャンのためのDataplex機能、ジョブ履歴表示機能など、7つの機能が組み込まれています。

📥

LLMのファインチューニングのためのツール Axolotl|npaka

  • 「Axolotl」はLLMのファインチューニングに使用されるツールで、多様なLLMやデータセット形式、アーキテクチャをサポート
  • インストール方法やデータセットの形式、学習方法、推論方法などを詳細に説明
  • DeepspeedやFSDPなどのマルチGPUオプションやWeights & Biasesの設定方法、LORAをベースにしたマージ方法についても紹介

🌐

G7のAI規制まずは開発企業から 制度の議論進む欧米、遅れる日本:朝日新聞デジタル

  • G7の「行動規範」はAI開発に関する指針を大手企業に示し、国境を越えるサプライチェーンの「上流」に対応を求めています。
  • 欧米ではAI規制の制度が進み、EUでは包括的な規制法案が承認され、リスク度合いに応じた対応と事前審査が求められます。
  • 規制違反すると最高で4千万ユーロまたは売上高の7%の罰金が科されます。

📚

ITSS+(プラス)データサイエンス領域 | デジタル人材の育成 | IPA 独立行政法人 情報処理推進機..

  • データサイエンス領域では、大量データの分析とその結果を活用するためのタスクとスキルがまとめられています
  • スキルチェックリストとタスクリストは定期的に見直され、最新版は2023年10月30日に公開されました
  • スキルの診断は教育訓練や人材市場の調査に役立つ一方、特定のスキルに偏った人材の意欲を削ぐ可能性もあるため、注意が必要です

📊

2023年度版「データサイエンティスト スキルチェックリストver.5」および「データサイエンス領域..

  • 「データサイエンティスト スキルチェックリスト」の第5版と「データサイエンス領域タスクリスト」の第4版が発表されました
  • AI利活用スキルやデータサイエンス力の再編成、新たなスキルの追加など、572項目から650項目に見直されました
  • データサイエンティスト検定も更新され、詳細は公式サイトで確認できます

👩‍💻

Google Colab で Youri-7B を試す|npaka

  • 「Youri-7B」は「Rinna」が開発した「Llama 2」ベースの日本語LLMで、現在6つのモデルが提供されています。
  • Google Colabでの実行手順は、ノートブックの設定でGPUを選択、パッケージのインストール、トークナイザーとモデルの準備、推論実行の関数の準備、推論の実行となります。
  • 「rinna/youri-7b-chat-gptq」は複数ターンの対話モデルで、例えば「まどか☆マギカで一番かわいいのは?」という質問に対して「キュゥべえが一番かわいい」と回答します。

🤖

Mistral 7B and its Fine-tuned Model | Guide of Mistral 7B

  • Mistral-7Bは大規模言語モデルで、生成型AIの開発を促進するために無料で提供されています。
  • Llama 2 13Bよりも優れた性能を持ち、自然なコーディング能力と8kのシーケンス長を備えています。
  • Apache 2.0ライセンスでリリースされ、クラウド上やゲーミングGPU上で簡単に展開できます。

👌

OptunaのPreferential Optimizationを使ったおいしいコーヒーの淹れ方探索 - まったり勉強ノート

  • OptunaのPreferential Optimizationを使ったコーヒーの淹れ方探索は、複数の試行の中で最適なものを人が判断して入力する機能です。
  • 主観的な評価でしか評価できない場合でも、二つの試行を比較して最適化を行うことが可能です。
  • 以前の絶対評価ではなく、相対的な評価での探索が可能となり、具体的な探索方法やパラメータの設定についても紹介されています。

🌐

世界最強の将棋AIを開発したHEROZ社 林社長が展望する将棋AIのいまと「人間 with AI」の未来 | ..

  • 「dlshogi with HEROZ」は2023年の世界コンピュータ将棋選手権で優勝し、最強の将棋AIとなった
  • AIの進化は機械学習からディープラーニングへの移行が大きく、アルゴリズムやビッグデータなどが重要
  • 将棋AIの進化は人間を超越し、将棋界だけでなくさまざまな業界でAIの活用が広がることが期待されている

🤖

AMD Extends Support for Pytorch Machine Learning Development nn Select RDNA™ 3 GPUs with ..

  • PyTorchを使用した機械学習モデルとアルゴリズムの開発者は、RDNA™ 3 GPUアーキテクチャに基づくグラフィックスカードの並列計算能力を活用できます
  • Ubuntu® Linux®上でROCm 5.7を使用することで、高性能GPUを使用したローカルでプライベートかつ費用効果の高いワークフローが実現します
  • これにより、クラウドベースのソリューションに頼っていた人々にとって、MLのトレーニングと推論のための新たな選択肢が提供されます

📜

生成AIに関する基本的な考え方|通信・放送|声明・見解|日本新聞協会

  • 生成AIの利用問題解決には著作権法改正や運用の透明化が必要
  • 政府は不当な利用を明確に定義し、情報開示の義務化を検討すべき
  • 報道機関の費用と労力に見合った対価の支払いを求め、知的財産法制の検討を進めるべき

🤖

画像生成AI「Stable Diffusion」や「Midjourney」に自作品の著作権を侵害されたとするアーティス..

  • 「Stable Diffusion」と「Midjourney」による画像生成AIの著作権侵害訴訟が棄却されました
  • 裁判所は生成画像に著作権が及ぶかどうかは確信できないと述べました
  • 訴状の修正は可能であり、自分の作品が使用されたかどうかはツールで確認でき、削除リクエストの送信も有効です

💻

ソフトバンク、3500億パラメーターの国産LLM構築へ 「国内最大級」生成AI計算基盤、稼働スター..

  • AI開発用計算基盤の稼働が開始され、2024年内に3500億パラメーターの国産LLMの構築を目指す
  • 計算基盤はNVIDIAのスーパーコンピュータとソフトウェアで構成され、大学や研究機関、企業にも提供予定
  • 日本語のデータセットを活用し、商習慣や文化に適した生成AIサービスを提供することを目指し、2023年度中に投資と構築を終える予定

😎

2023年版「データサイエンティストスキルチェックリスト」が無料公開 生成AIの利活用スキルなど..

  • データサイエンティスト協会が「データサイエンティストスキルチェックリスト」の第5版を公開
  • 生成AIに関する項目を追加し、必要なスキルを全69項目で定義
  • LLMを利用してコードを作成・修正・改良するスキルや、新たなサービスに興味を持ちリサーチするスキルなどを提供

📝

Introduction to NExT-GPT: Any-to-Any Multimodal Large Language Model - KDnuggets

  • NExT-GPTは、テキスト、画像、動画、音声の4つの異なる種類の入力と出力を処理できます。
  • 各モダリティに対応したエンコーダを利用し、ユーザーの意図に応じて適切なモダリティに切り替えます。
  • パフォーマンス実験の結果は良好で、多くのアプリケーションで活用できる有望な成果を示しています。

🎨

Midjourney, Stability AI and DeviantArt score in copyright case | VentureBeat

  • AIアートジェネレーターが著作権侵害を引き起こすかどうかの論争がアメリカで一歩前進しました。
  • カリフォルニア北部地区のウィリアム・H・オーリック連邦地方裁判所の判事が、Stability AI、Midjourney、DeviantArtに対する著作権侵害集団訴訟の判決を下しました。
  • オーリック判事は、原告のクレームが不十分であると判断し、一部の著作権侵害の訴えを認めました。

🎨

Judge Dismisses Copyright Lawsuit By Artists Against AI Art Generators – The Hollywood Re..

  • アーティストたちはAIアートジェネレーターに対し、無償かつ無断で画像を使用された著作権侵害の訴えを提起したが、大部分が却下された
  • 裁判所はAIシステムが著作権のある画像のコピーを含んでいるか、AIツールによって作成された侵害作品の著作権侵害をアーティストが立証できるかどうかなど、多くの問題があると結論づけた
  • 侵害、肖像権、不正競争、契約違反に関する主張は却下されたが、おそらく再提起されるだろう

👍

Google Colab で Axolotl の LoRAファインチューニングを試す |npaka

  • 「Axolotl」のLoRAファインチューニングを「Google Colab」で試行
  • 「Llama-2-7b」を「ござるデータセット」でLoRAファインチューニング
  • 学習済みモデルは「lora-out」に出力し、推論も成功

🔄

AI vs Data Analysts: Top 6 Limitations Impacting the Future of Analytics - KDnuggets

  • AIはPython、SQL、Rなどの言語で理論を持ち、機能するコードを生成する能力を持っていますが、データアナリストを完全に置き換えることは難しいです。
  • AIツールはデータ分析の一部を自動化できますが、間違った結果を出す可能性があり、その結果を理解する能力を持つ人間のデータアナリストが必要です。
  • AIツールは特定のビジネス情報を理解する能力が限られており、データアナリストやデータサイエンティストがこれらを最新の状態に保つ必要があります。

🔍

The architecture of today's LLM applications - The GitHub Blog

  • LLMアプリの構築には、適切な問題の選択、適切なLLMの選択、カスタマイズ、アーキテクチャ設定、オンライン評価の5つのステップが必要です。
  • LLMの出力は確率的であり、同じ予測可能な結果を生み出さないため、開発者はデータセット、埋め込み、パラメータの重みをナビゲートして一貫性のある正確な出力を生成する必要があります。
  • LLMをカスタマイズすることで、特定のタスクに適したテキストを生成するなど、LLMを特定のタスクに適応させることができます。

🔄

Schneider Electric leverages Retrieval Augmented LLMs on SageMaker to ensure real-time upd..

  • シュナイダーエレクトリックは、SageMaker上のRetrieval Augmented LLMsを活用してERPシステムのリアルタイム更新を確保
  • 顧客ベースが拡大するにつれて、新しい顧客が毎日追加され、アカウントチームはこれらの新しい顧客を手動で整理し、適切な親エンティティにリンクする必要がある
  • 2023年初頭、シュナイダーエレクトリックは、人工知能(AI)を使用してアカウントリンクプロセスの一部を自動化することを決定し、AWS Machine Learning Solutions Lab(MLSL)と提携

💥

Judge pares down artists' AI copyright lawsuit against Midjourney, Stability AI | Reuters

  • カリフォルニアの連邦裁判所の判事がビジュアルアーティストたちの著作権侵害訴訟を一部却下
  • MidjourneyとDeviantArtに対するすべての主張を却下し、修正訴状の提出を許可
  • McKernanとOrtizの著作権侵害の主張を完全に却下、Andersenの主張は続行許可

🚀

How fast is AI improving? - AI Digest

  • AIの進化は時間と投資により予測可能に向上し、特に言語モデルの能力は指数関数的に増加しています。
  • AIの能力向上は社会に利益をもたらす一方で、一部の開発は有害である可能性があり、大規模な生物攻撃に協力する可能性があります。
  • AIエージェントは自律的に変更可能で、ハッキングなどの危険な現実世界のタスクにおいてはるかに優れる可能性があります。

💪

「エビデンス」がないと駄目ですか? 数値がすくい取れない真理とは:朝日新聞デジタル

  • エビデンス重視の時代で、感覚や経験則に価値がないように感じる人もいる
  • 個人の経験にも普遍的な事実があり、それを学問にすることも可能
  • 客観性は分断の道具に使われ、自分の経験や考えに価値がないと感じる人もいる

🚀

pythonは_(アンダースコア)の使い方を理解するだけでプロフェッショナルになれる #Python - Qiit..

  • 第3次AIブームは2015年から始まり、Google DeepMindのAlphaGoがプロ棋士に勝利したことがきっかけです。
  • Pythonは機械学習やデータ解析に必要なライブラリが充実しており、フレームワークも優れています。
  • Pythonのコードは初心者が書くと読みにくいことがあり、アンダースコアの使い方の理解が重要です。

😎

日本オラクルのAI・クラウド教材が無料に 期間限定、1月まで - ITmedia NEWS

  • AIやクラウドサービスの学習プログラムが無料で提供されます
  • 専門的な試験も2回まで無料で受けられ、一部は日本語でも受験可能に
  • 設定をクリアすると抽選でグッズも贈呈されます

2023年11月01日

|

このサイトについて

/

ニュースレター

/

@AINewsDev