~AI関連記事を3行にまとめて紹介~
📚
LlamaIndex の RecursiveRetrieval を試す|npaka
「RecursiveRetrieval」は、階層的な文書表現に対して再帰的検索を実行できます
階層構造を活用することで、複雑な文書のRAGシステムの性能を向上させます
セットアップ手順やドキュメントの準備、質問応答の例などもまとめています
💡
Silicon Valley’s elites can’t be trusted with the future of AI. We must break their domi..
AIの未来をリードするには、利益に主導され、世界の現実から切り離されたシリコンバレーのエリートは適任ではないと指摘。
インドは既に世界最先端のがん治療インフラを構築し、電子商取引や金融などの重要な技術分野において知的な規制戦略を設計・育成している。
AIの開発はシリコンバレーのエリートの傲慢さに委ねるにはあまりにも重要で、インドは彼らの支配を打破し、AIの競争のフィールドを均等にするために最適な位置にある。
🚀
Making Deep Learning go Brrrr From First Principles
ディープラーニングモデルのパフォーマンス向上には、場当たり的なアプローチではなく、最初の原則から推論することが重要です。
トレーニングの損失とテストの損失の比較により、過学習や正則化の必要性を判断することができます。
ディープラーニングの効率を理解するためには、3つの異なる要素を考慮することが有効です。
🇺🇸
X(旧Twitter)、ユーザーの公開データをAIトレーニングに使うと改定ポリシーに明記 - ITmedia N..
米X(旧Twitter)が新たなプライバシーポリシーを発効させます
9月29日から公開データをAIのトレーニングに使用することが可能になります
この改定はユーザーの公開データの利用範囲を明確にするものです
📚
インフラだけではないMLOpsの話 - Speaker Deck
MLOpsの前提となる「ML」がプロダクトの成長に貢献する状態を実現するための方法について説明
AWSが実施しているML Enablement Workshopの内容について紹介
ML Enablement Workshopの提供の経緯について説明
🔍
LlamaIndex の VectorIndexAutoRetriever を試す|npaka
「VectorIndexAutoRetriever」は、クエリ文字列とメタデータフィルタを自動生成し、検索を実行するリトリバーです
セットアップ手順はColabで行い、VectorStoreIndexとVectorIndexAutoRetrieverの準備手順も記載しました
メタデータ「year」と「country」を使用した質問応答の例も示しました
🔄
RWKV: Reinventing RNNs for the Transformer Era — with Eugene Cheah of UIlicious
RWKVは、Transformer時代のRNNの再発明で、二次コストを持たない特徴を持つ
国際的な非公式コミュニティによって追求されている
トレーニングと推論の両方でTransformersベースのオープンソースモデルよりも優れたスケーリング性を持つ
🔄
LlamaIndex の RouterQueryEngine を試す|npaka
「RouterQueryEngine」は、クエリに応じてインデックスを切り替えることが可能なエンジンです。
インデックスを切り替えるセレクターは4つ提供され、要約や質問応答などの用途に応じて使い分けが可能です。
利用手順やセットアップ方法も詳しく説明されています。
👍
AIによる学習を妨害する敵対的ノイズを画像から除去できる「AdverseCleaner」を使ってみた - GIG..
「AdverseCleaner」はAIの学習を妨害する敵対的ノイズを画像から除去するツールです
GitHubやHugging Faceで公開されており、実際に試すことが可能です
「Advanced Config」を調整することで、ノイズ除去の設定を細かく調整することもできます
💻
「πが3.14より大きい理由は」ChatGPTの驚愕回答 警告!ChatGPTで学習すると起きるヤバい事態 | ..
ChatGPTの学習は便利だが、誤った回答が含まれる可能性がある
大規模言語モデルはハルシネーションで誤った回答を出すことがあり、2021年9月以降の情報には対応できない
ChatGPTは広く利用されており、日本でも問題が発生する可能性がある
💻
「やりたいことを書いたら、Excelの関数に変換してくれるAI」が話題 – ググらずにすむ!? - OTON..
AIスプレッドシートツール「GPTExcel」が登場し、文章で数式を指定するだけで関数を自動生成します。
GPTExcelの使い方は簡単で、ExcelやSheets、Airtableなどの種類から選ぶことができます。
GPTExcelは関数の仕組みまで解説し、作業の効率化に生かせる便利なツールです。
🤖
Googleによる新たな検索体験。知りたいことを検索すれば生成AIが要約してくれるように | ギズモ..
生成AIによる検索体験(SGE)の試験運用が開始されました
検索結果をAIで要約し、トピックを深掘りすることも可能
追加で質問することも可能で、情報アクセスを効率化し、見やすく、わかりやすい検索体験を提供
📚
A complete guide to fine-tuning Code Llama | Ragntune: A human-generated blog on RAG and f..
Code LlamaをSQL開発者のビーストにする方法を紹介
特定のタスクにモデルを特化させると、通常、Code LlamaよりもLlama 2のパフォーマンスが向上
ベースモデルをint 8に量子化し、その重みを固定し、アダプターのみをトレーニングするLoraアプローチを使用
💻
[LLM 論文]アプリ全自動開発"ChatDev"の日本語訳|すめらぎ
大規模な言語モデル(LLM)を使用したCHATDEVは、設計からドキュメンテーションまでのソフトウェア開発をチャット形式で進めるシステムです。
タスクを小さく分割し、効率的に作業を進めることが可能です。
CHATDEVの評価結果では、7分以内でソフトウェア開発を完了し、コストも抑えることができました。
2023年09月04日
|
2023年09月02日
このサイトについて
/
ニュースレター
/
@AINewsDev