AI News

~AI関連記事を3行にまとめて紹介~

💼

GitHub - amaiya/onprem: A tool for running on-premises large language models with non-publ..

  • OnPrem.LLMは、非公開データを使用してオンプレミスで大規模な言語モデルを実行するツールです。
  • インターネット接続のないマシンで大規模な言語モデルを実行しやすくするPythonパッケージです。
  • privateGPT GitHubリポジトリとSimon WillisonのLLMコマンドラインユーティリティに触発され、ローカルのLLMを実用的なアプリケーションに統合するのに役立つように設計されています。

🔍

LLMファインチューニングの LoRA と フルパラメータ の比較|npaka

  • 「LoRA」と「フルパラメータ」のLLMファインチューニングを比較し、「GSM8k」「ViGGO」「SQL」の3つのデータセットで調査した。
  • 「LoRA」は「フルパラメータ」よりも劣る場合があるが、タスクの種類や学習率により結果が変わることが確認された。
  • 「LoRA」の利点はメモリとサービスの効率性だが、最適な構成を見つけるためには複数のジョブを起動し、グリッド検索を実行する必要がある。

💭

集英社の「AIグラビア」はなぜすぐに販売終了となったのか:日経クロストレンド

  • AI生成画像を使った写真集『生まれたて。』の販売が終了した
  • AI生成物の商品化についての検討が不十分で、より慎重に考えるべきだったと判断
  • 肖像権やパブリシティー権の侵害が懸念され、販売中止となった可能性もある

📷

「ここまで行くと気持ち悪い」 「渋谷をAIカメラ100台で監視」が炎上 なぜ、温度差が生まれた..

  • 渋谷に100台のAIカメラを設置し、人流データを取得・解析する「渋谷100台プロジェクト」が話題に
  • ビッグデータの活用は、店舗のレイアウト改善や地域のまちづくりにも良い結果をもたらす可能性がある
  • 一般の人々にとっては「気持ち悪い」と感じることもあるため、関係者は彼らの意見を確認すべき

👍

論文PDFを数式込みで全文読み取るモデル 米Metaが「Nougat」開発 スキャンした古書の画像もOK..

  • 「Nougat: Neural Optical Understanding for Academic Documents」は、PDF内のテキストや数式を正確に読み取るモデルを提案
  • 科学的な知識がより探しやすくなり、多くの人々がアクセスできるようになる
  • モデルのコードなどは全て公開されている

📊

データインテリジェンスの動向を呟く|Rytm / Quollio

  • データインテリジェンスの動向は変化し、データカタログが再定義されている
  • 海外ベンダーは自身をData Intelligence Platformとして再ブランディング
  • 日本のエンタープライズ企業でもデータ活用が進み、Data Intelligenceの導入が競争力を決める課題となっている

📢

Google、AIで生成した政治広告に明確な開示を義務付け 11月にポリシー更新 - ITmedia NEWS

  • Googleは11月中旬に政治コンテンツポリシーを更新し、選挙広告の広告主は合成コンテンツを明示する義務が生じる
  • 生成AIの普及により、ネット上の誤情報が増加している
  • 画像の編集技術や背景の編集については開示の必要はない

🗓️

OpenAI、初の開発者会議を11月6日にサンフランシスコで開催へ - ITmedia NEWS

  • 11月6日に開催される「OpenAI Devday」で新ツールがプレビューされ、アイデアが交換される
  • CEOは「gpt-5やgpt-4.5はないが、みんな満足すると思う」と述べた
  • 現在200万人以上の開発者がGPT-4、GPT-3.5、DALL・E、Whisperを使用中

🎥

“誰でも使えるアドビ”こと「Adobe Express」に生成AIがやってきた プロならどう使う?:小寺..

  • 「Adobe Express」の最新版が公開され、AI搭載の「Adobe Firefly」がβ版として提供開始された
  • UIが変わり、動画対応やPDF編集などの機能が追加され、使い勝手が向上
  • 「誰でも簡単に」を維持しつつ、プロの現場でも活用できる可能性がある

😲

「AIの力で3Dモデルを作成する」とうたう企業が実は人力だった - GIGAZINE

  • AIを使って3Dモデルを作成すると宣伝していた企業が、実際には人力で仕事をしていたことが明らかになりました。
  • この企業はゲームデベロッパーなどにサービスを提供しており、AIによる自動変換や3Dモデリングの自動化を謳っていました。
  • 報酬は1ドルから4ドル程度で、仕事を早く引き受けるとボーナスがもらえたそうです。

💻

Google Colab で Heron で学習したマルチモーダルモデルを試す|npaka

  • 「Heron」は日本語を含む複数言語に対応した大規模な学習ライブラリで、学習済みのマルチモーダルモデルも提供
  • 「Google Colab」で「Heron」のマルチモーダルモデルの実行手順は、GPUの選択、パッケージのインストール、モデルとプロセッサの準備、推論の実行となる
  • 詳細な手順やサポート情報は記事内にて提供されている

🤖

ChatGPT、「算数」より「作文」が得意な納得の仕組み 『ChatGPTの頭の中』著者、ウルフラム氏に..

  • ChatGPTは対話型AIで、その技術は日々進化しています。
  • しかし、統計的には正しいが事実とは異なる情報を生成するハルシネーションという課題があります。
  • 事実とファンタジーを区別する能力は別の問題で、ウルフラム言語を使用して取り組んでいますが、完璧な解決策ではありません。

🛠️

If You Want to Master Generative AI, Ignore All (But Two) Tools - KDnuggets

  • ジェネレーティブAIをマスターするためには、必要な2つのツール以外は無視することが推奨されます。
  • 新しいモデルのBing ChatやGPT-4などが登場し、競争が激化しています。
  • しかし、ジェネレーティブAIの過剰な存在感から解放され、疲れを避けるためには、必要なツールに絞ることが重要です。

🚗

生成AIに“視覚”与える学習ライブラリ、自動運転EVベンチャー公開 最大700億パラメータの学習..

  • マルチモーダルな学習ライブラリ「Heron」が公開され、画像認識モデルと大規模言語モデルを組み合わせることで、画像について回答するAIモデルを実現
  • Heronの学習ライブラリは、既存の言語モデルの性能を生かしつつ、新たなモデルにも対応可能
  • 日本語の画像/テキスト情報のデータセットも公開され、対話形式のマルチモーダル学習向けの大規模な日本語データセットの公開は世界初

😎

保存した文章を利用する「Indexes」、過去のやりとりを記憶する「Memory」 LLMにできることを拡..

  • 「Indexes」は新しい情報やプライベートな情報を使いたい場合に、文書をベクトル化して保存し、関連する文章を検索して質問に含めることができます
  • 「Memory」は過去の会話を記憶し、それをプロンプトに含めることで過去の会話を踏まえた応答が可能です
  • これらの機能を使うことで、LangChainはより高度な対話が可能となります

😉

Building Microservice for Multi-Chat Backends Using Llama and ChatGPT - KDnuggets

  • LLMの進化に伴い、複数のモデルの統合や切り替えが困難になっているため、マイクロサービスアプローチを提案
  • マイクロサービスアーキテクチャは、開発者がアプリケーション全体に影響を与えずに個々のサービスを維持・進化させることが可能
  • LLMを単一のアプリケーションに統合することは課題であり、単一の統合サービスを持つことがアーキテクチャの設計を改善し、独立したサービスのスケールを向上させる

🔄

そもそもLangChainは何に使えるのか 3つの基礎的なモジュール「Models」「Prompts」「Chains」..

  • LangChainは日々アップデートされ、破壊的変更がある可能性があるため、使用するかどうかは各自や組織の判断に委ねるべきである
  • LangChainは要約アプリやチャットボット、Q&Aボットなど、さまざまなユースケースに使えるフレームワークである
  • LangChainにはModels、Prompts、Chainsなどのモジュールがあり、それぞれの機能を理解していく必要がある

😎

Build AI apps and workflows faster with Retool AI

  • AIをアプリやワークフローに瞬時に統合し、事前に構築されたブロックを使用してビジネスデータを安全に接続します。
  • ビジネスデータをベクトル埋め込みに格納してインデックス化するRetool Vectorsを使用します。
  • AIボットを数分で構築し、チームが複雑な問題を解決するのを支援します。

🛠️

「OpenAI」から「Azure OpenAI Service」への移行 「LangChain」を使って実装する中で気づいた..

  • ChatGPTを使用した機能開発を通じて、OpenAIからAzure OpenAI Serviceへの移行を行った経験を共有
  • Azureを選択肢として持つことでセキュリティやプライベートネットワークの要件に対応し、新しい開発に挑戦
  • LangChainを使用して実装し、エンジニア以外の人々を巻き込んでスピードとクオリティの向上に取り組む重要性についても話す

💼

特許出願、生成AIで書類作成をサポート AOS系 - 日本経済新聞

  • AIが特許出願の書類作成をサポートするサービスが開始
  • 発明に関する語句や短文を入力すると、書類が自動生成され、出願コストを削減
  • 生成した書類の類似度もAIで判定可能で、月額料金は最低1万5千円

💾

Optimize equipment performance with historical data, Ray, and Amazon SageMaker | AWS Machi..

  • 過去のデータ、Ray、Amazon SageMakerを活用して装置のパフォーマンスを最適化する方法が紹介されています
  • オフライン強化学習を用いて、過去のデータだけで制御ポリシーを構築する制御戦略が提案されています
  • RayのRLlibライブラリを使用してAmazon SageMaker上の過去のデータのみを使用して最適な制御ポリシーを見つけるエンドツーエンドのソリューションが構築されています

👍

Best practices and design patterns for building machine learning workflows with Amazon Sag..

  • SageMaker Pipelinesは、MLワークフローの構築とオーケストレーションを可能にするAWSサービスです。
  • パイプラインの遅延読み込み、ローカルモードでの実行、バージョニング管理などがベストプラクティスとして挙げられます。
  • 軽量なPython関数の実行、データの受け渡し、変数のパラメータ化などがデザインパターンとして提案されています。

💪

Releasing Persimmon-8B

  • 2023年9月7日にPersimmon-8Bという<100億のパラメータを持つ強力な完全許容ライセンスの言語モデルをリリースします。
  • このモデルは、16Kのコンテキストサイズでトレーニングされ、LLaMA2の4倍、GPT-3やMPTなどの8倍のコンテキストサイズを持っています。
  • 推論コードはユニークで、C++の実装の速度とPythonの推論の柔軟性を組み合わせています。

🔍

GM-RKB

  • GM-RKBは約38,111ページのセマンティックウィキで、概念、出版物、人物に関連する内容を提供しています。
  • 半教師ありの機械学習アルゴリズムや自然言語処理タスク、人工知能システムなどの研究テーマを扱っています。
  • 臨床研究、キャリアテーマ、アクティビストのテーマ、道徳的意思決定に関するパズルなども取り上げています。

💯

📰 Weekly AI News #7 - by hotchpotch - Weekly AI News

  • 温泉地に100台のAIが設置されます
  • ChatGPTが最大限に活用されます
  • 温泉の名前を模した活用法が見られます

💻

中国 IT大手「テンセント」 企業向けに生成AIのサービス開始 | NHK | 中国

  • 中国のIT大手が生成AIサービスを企業向けに開始
  • 中国では他のIT大手も同様のサービスを提供
  • 開発競争が激化している

🖼️

GitHub - XPixelGroup/DiffBIR

  • DiffBIRは、盲目の画像修復に向けた生成拡散事前学習モデルで、一般的な画像修復と顔画像修復に対応しています。
  • Python 3.9以上のconda環境で動作し、pytorch 1.12.1以上とCUDA 11.3以上が必要です。
  • 事前学習済みモデルは、一般的な画像修復と顔画像修復のためのステージ1モデルとフルモデルが提供されています。

2023年09月08日

|

このサイトについて

/

ニュースレター

/

@AINewsDev