AI News

~AI関連記事を3行にまとめて紹介~

🔍

これが新しいAIググる体験か。Googleの生成AI検索「SGE」、日本語実験の現在地(Google Tales) ..

  • 新サービス「Search Generative Experience」(SGE)はAIチャットボットとの対話でWeb検索を行う
  • SGEは米国での提供が始まり、8月30日には日本とインドでも利用可能になった
  • SGEはまだ実験段階であり、フィードバックを通じて改善されている

📚

OpenAIのクローラーを拒否する動き ほか【中島由弘の「いま知っておくべき5つのニュース」2023/8..

  • 日本の4団体がAI学習に関する著作権法の問題点を指摘し、OpenAIのクローラーを拒否する動きが見られる
  • 経済産業省が公表した「電子商取引に関する市場調査」の結果、日本の電子商取引市場が拡大していることが明らかに
  • ハヤカワがNFT電子書籍付の本を販売し、NFTの意味や可能性を体験することが重要とされている

👨‍🏫

最近のLLMの学習法のまとめ - SFT・RLHF・RAG|npaka

  • 最近のLLM学習法には、教師ありファインチューニング(SFT)、人間のフィードバックからの強化学習(RLHF)、検索拡張生成(RAG)がある
  • これらの学習法はAIや自然言語処理、大規模言語モデルなどの分野で活用されている
  • 各学習法のベンチマークや関連情報もまとめられている

👀

AIの次なる波「マルチビュー」--対象物を複数の視点から捉えて関連付ける利点と課題 - ZDNET Jap..

  • マルチビューは、異なる信号が共通の情報を持つ対象物を関連付ける方法
  • 現在のAIは物事を1つの側面からしか認識できず、複数のデータを関連付けることができない
  • マルチモダリティーの波が到来することで、物事の構造をより豊かに表現できるようになる可能性がある

🤖

1本50円で外注できるAIソフトウェア開発環境「ChatDEV」、人の声を理解する言語モデル「LLaSM」..

  • 「ChatDEV」はテキスト指示からソフトウェアを自動開発するAIフレームワークで、高い効率とコスト効果を実証
  • 「LLaSM」は音声とテキストの指示に対応する大規模言語モデル
  • 「FaceChain」は顔の特徴を保持した新しい人物写真を生成するAI

😲

赤信号わたる先生の「AIが追放される話」のアレの巧妙な隠し方に驚き - Togetter

  • 「AIが追放される話」では、天使の輪っかが巧妙に隠されている
  • 読者は最後まで気づかず、驚きの声を上げている
  • また、「人間は電気信号を脳から発して体に命令を行う生物」との現実とリンクした表現も話題に

🤖

【一番星はての同人誌@AI作画】を作りました - wanwon_comic’s diary

  • 絵が全てAIによって描かれている同人誌を作成
  • 二次創作には公式サイトのポリシーと二次創作利用規約に従い、問題があれば対応
  • AIによるR-18コミックも公開し、AIでの漫画制作についての記事も提供

💪

Amazon SageMaker StudioでMLOpsを始めました - inSmartBank

  • スマートバンクのB/43では、Amazon SageMaker Studioの利用を開始し、MLOpsの運用を初めて経験
  • SageMakerには多くの機能があり、MLOpsの設計において、AWS Step FunctionsとAmazon SageMaker Studio Pipelinesのどちらがベストかを考える
  • SageMakerは機械学習モデルの構築、トレーニング、デプロイメントなどの一連の作業を簡単に実行できるマネージドサービス

😎

ASCII.jp:画像生成AIに“表現の自由”を スーパーハッカーが挑んだ「Fooocus」 (1/4)

  • 「Fooocus」は、画像生成AIの「表現の自由」を追求した作品で、スーパーハッカーが開発した
  • 「Stable Diffusion XL 1.0(SDXL)」の導入はハードルが高く、初心者には難しい印象がある
  • 「Fooocus」はControlNetを開発したlllyasvielさん(チャン・リュミンさん)が作者で、革命を起こす可能性がある

💪

Kaggle GrandMaster 振り返り. Kaggle GrandMaster… | by Jun Koda | Sep, 2023 | Medium

  • Kaggle GrandMasterになった経緯を振り返る
  • 物理に強い人として、地震予測や電線判定などのコンペで金メダルや銀メダルを獲得
  • 次の目標は分子生物学コンペに再挑戦

💻

Bingの進化が止まらない! ChatGPTを超えた機能7選【今日のワークハック】 | ライフハッカー・ジ..

  • Microsoft Edgeのサイドバーに新たに追加された「Bingチャット」は、ChatGPTをベースに多くの独自機能を持っています。
  • Bingチャットは、ChatGPT4を使って文章を作成したり、ウェブページや文書を要約・会話したりすることが可能です。
  • さらに、BingチャットはGPT-4を無料で利用でき、高性能な機能を使いながら応答を高速化・明確化することができます。

💻

[新連載 AI時代の幸福論]中年記者が美少女に 24兆円市場に飛び込もう:日経ビジネス電子版

  • AIやVR、ロボットが創り出すテクノユートピアの世界を探求
  • 死者がAIの力で蘇り、恋人ロボットが寄り添う未来を描く
  • 美少女「Yuri(ゆり)826」になり、VR空間で自由になり、仲間たちと夢の世界を楽しむ

💬

プロンプトエンジニアリングから始めるLangChain入門講座 大嶋勇樹氏が教える、OpenAIのモデル..

  • 大嶋勇樹氏がLangChain入門講座を開催
  • 自己紹介とキャリア、現在の活動について語る
  • LLMやLangChainについても解説

💻

人月商売のIT業界を滅ぼす「死に神」、想定以上だった生成AIの猛威とは | 日経クロステック(xTE..

  • 生成AIは知的労働者の仕事を奪い、特に人月商売のIT業界の技術者が最初のターゲットとなる
  • 下請けITベンダーはあと3年から5年の命で、SIerも大規模なリストラに追われる可能性がある
  • 生成AIができることは次の6つで、要件定義ができればほぼ全てを自動生成し、その破壊的な影響は広範で想定外の悪夢が現実になるかもしれない

📝

XのデータをAI開発のトレーニングに使うことが規約で明言されイーロン・マスクもコメント - GIGA..

  • XのデータをAI開発のトレーニングに使用することが規約で明言されました。
  • 公開データのみが対象で、DMや非公開のものは含まれません。
  • このポリシー変更は、他の企業も同様の行為を行っている計画の一部です。

💡

WavJourney: A Journey into the World of Audio Storyline Generation - KDnuggets

  • WavJourneyは、大規模言語モデルを活用して、正確なストーリーラインと魅力的なバックグラウンド音楽を備えたオーディオスクリプトを生成します。
  • 生成されたスクリプトは、テキスト読み上げ、音楽、効果音の追加など、オーディオ生成プロセスが別々のステップに分割されます。
  • オーディオ生成モデルはエンターテイメント業界に革命をもたらす可能性があり、教育やエンターテイメントの目的で利用できる魅力的なナラティブとストーリーを生成します。

😊

「Google スプレッドシート」にプロンプトで高機能なテンプレートを生成する機能が追加 - 窓の杜

  • 「Google スプレッドシート」に「Duet AI」を活用した新機能が追加されました
  • データ整理が迅速かつ視覚的に行えるようになり、[Help me organize]で目的を入力するとテンプレートを生成できます
  • この機能は「Duet AI for Workspace Enterprise」アドオンを使用している「Google Workspace」ユーザーが利用できます

🗣️

プロンプトの質が上がる“深津術” 今すぐ使えるChatGPTの小技を本人に聞いてみた - ITmedia NE..

  • ChatGPTの登場により、ビジネスパーソンはChatGPTの話題についていけないと言っていられなくなる日が来ると深津氏
  • 生成AIとの共同作業の重要性を強調し、プロンプトの質が仕事のパフォーマンス指標になると指摘
  • プロンプトの質を上げる小技を紹介し、回答が得られない場合はChatGPTに問いかけることを勧める

💭

ReAct, Reasoning and Acting augments LLMs with Tools! - KDnuggets

  • ReActは、推論と行動を組み合わせることでAIの知性を再現し、LLMsのパフォーマンスを向上させる新しいコンセプトを提供します。
  • ReActは、模倣や強化学習の方法よりも34%と10%の絶対的な成功率で優れています。
  • ReActは、タスクに関連する言語的な推論トレースと行動の両方をLLMsに交互に生成させ、モデルが動的な推論を実行し、高レベルの計画を作成、維持、調整することができます。

👍

3D Gaussian Splattingの使い方

  • 新たなRadiance Fieldの技術「3D Gaussian Splatting for Real-Time Radiance Field Rendering」の使い方と環境構築手順を紹介
  • 環境構築やデータの用意は不要で、3D Gaussian Splattingを試すことが可能
  • 独自データの作成やトレーニング、ビューワーの使用方法もまとめている

💪

The Battle Over Books3 Could Change AI Forever | WIRED

  • 2020年7月、OpenAIがGPT-3をリリースした後、独立したAI研究者のショーン・プレッサーと彼の仲間たちは、自分たちで再現できるかという挑戦を自らに課しました。
  • プレッサーはOpenAIのデータセットの1つがオンラインの「シャドウライブラリ」から取得されたものであると疑い、逆解析することにしました。
  • プレッサーは自身のライブラリを「Books3」と名付け、データアーカイブの集団The Eyeにホストしてもらうよう頼みました。

🔝

ChatGPTでは的確な“指示出し”が大切! セントラルオフィスが「プロンプト」のコツをまとめた資..

  • 情報メディア「Ainova」で、プロンプトエンジニアリングのコツをまとめた資料が公開された
  • OpenAI社の「GPT best practices」をもとに、ChatGPTを最大限活用するためのコツを紹介
  • ChatGPTの使い方によって精度が変わるため、公開された「ChatGPTを最大限活用するためのプロンプトの7つのコツ」が参考になる

😎

コンペで使える!?LightGBMで実装する3つの弱教師あり学習 - ABEJA Tech Blog

  • 弱教師あり学習は、限られた情報から分類を行う手法で、マルチインスタンス学習やPU分類などがある
  • テーブルデータでは汎用モデルが存在しないため、自前の機械学習モデルを作成する必要がある
  • LightGBMを使用して弱教師あり学習を行うと、PU分類やPartial Label Learningなどの手法で効果的に分類が可能

🗣️

Microsoft、AIスマートバックパックを実現する特許 - PC Watch

  • AIアシスタント搭載のウェアラブルデバイスが特許申請されました
  • 音声操作で周囲の状況を認識し、コマンドに応答します
  • プロセッサやセンサーを搭載し、環境情報を収集して処理し、ユーザーに返答します

💻

Introducing Refact Code LLM: 1.6B State-of-the-Art LLM for Code that Reaches 32% HumanEval..

  • 1.6Bのコードモデル「Refact LLM」は、リアルタイムのコード補完とチャット機能を備え、最先端のパフォーマンスを実現しています。
  • モデルは、許可されたライセンスのコードとオープンテキストのデータセットでトレーニングされ、その後、品質の高いオープンコードの指示に従うデータセットと合成データセットを用いて微調整されました。
  • Refact LLMは、オープンソースのDockerコンテナとVS Code、JetBrainsのプラグインを使用して既存の開発者のワークフローに簡単に統合することができます。

💾

What is Residual Vector Quantization?

  • データ圧縮は情報の効率的な保存と伝送を可能にし、現代のデジタル世界で重要な役割を果たしています。
  • ニューラル圧縮技術は、ニューラルネットワークを使用してデータを表現、圧縮、再構築する新しいアプローチとして急速に台頭しています。
  • Residual Vector Quantizationに基づくニューラルオーディオコーデックは、従来の手作業のパイプラインを上回る性能を示しています。

💻

GitHub - georgian-io/LLM-Finetuning-Hub: Repository that contains LLM fine-tuning and depl..

  • LLM Finetuning Hubは、大規模言語モデルをユースケースに合わせて微調整するためのコードと洞察を提供
  • 評価フレームワークを通じてLLMをストレステストし、ビジネスユースケースに適用可能か確認
  • パフォーマンスとコストの観点からニーズに合ったLLMを選択するための支援や、再現性の向上にも取り組んでいる

👏

GitHub - jzhang38/TinyLlama

  • TinyLlamaプロジェクトは3兆トークンで1.1BのLlamaモデルを事前学習することを目指しています
  • 16台のA100-40G GPUを使用し、90日で目標を達成することが可能です
  • TinyLlamaのトレーニングは2023年9月1日に開始されました

📚

Chinchilla’s Death

  • より小さなモデルは、より少ない計算でより速く実行され、トレーニングも速いが、知識の容量の限界に達すると学習が遅くなる
  • OpenAIとDeepMindは、トレーニング中に最大の効果を得るための最善の方法を推定する際に、パレートフロンティアを描くことを試みた
  • Metaは今年初めに、サイズが異なる4つのモデルを非常に長い時間トレーニングし、その結果を公開した

📚

RWKVについて解説 | AGIRobots Blog

  • RWKVはRNNとTransformerの利点と欠点を結合したモデルで、長い文章を扱い計算コストを削減します
  • 長期の依存関係を捉えることが可能なRWKVは、Transformerの進化形として注目されています
  • Attention Free Transformerという手法を採用し、内積注意を代替することで計算コストを低減しています

💪

LLM now provides tools for working with embeddings

  • 2023年9月4日に新たなツールが提供されます
  • 言語モデルを扱うためのPythonライブラリおよびコマンドラインツールが存在します
  • 新機能を追加したバージョン0.9がリリースされました

2023年09月05日

|

このサイトについて

/

ニュースレター

/

@AINewsDev