AI News

~AI関連記事を3行にまとめて紹介~

🔥

凄すぎると話題の「Open Interpreter」の始め方・使い方まとめ - Qiita

  • 「Open Interpreter」は、GPT-3.5、GPT-4、Code Llamaなどの大規模言語モデルを活用したオープンソースのツールです。
  • Python、Javascript、Shellなどのプログラミング言語のコードを自然言語による対話を通じてローカル環境で実行できます。
  • Google ColabやReplitなどの制限された環境での使用が推奨されており、インストールやAPIキーの設定、対話的セッションの開始などの手順があります。

😲

画像生成AIで生成された性的な画像を使った広告がInstagramやTikTokで急増しているとの指摘 - GI..

  • AIを使った性的な画像を含む広告がInstagramやTikTokで急増している
  • 性的なコンテンツを制限するSNSでも、AIを使った広告は規制を回避
  • 批判の声に応えて、Googleは関連するアダルトアプリと広告の掲載を停止

🧠

Open Interpreterでアンケート分析をやってもらったら1時間以上かかる作業が一瞬で完了した。ヤ..

  • 「Open Interpreter」は大規模言語モデルを活用したオープンソースのツールで、ローカル環境で動作します。
  • プログラミングの知識がなくてもリサーチやデータ分析が可能で、インストールも簡単です。
  • アンケートデータの分析や分析レポートの作成が簡単に行え、その結果は非常にクオリティが高いです。

😎

60以上の大規模言語モデルに19種類の質問を行うベンチマークテストの結果公開 - GIGAZINE

  • 60以上の大規模言語モデルに対するベンチマークテストの結果が公開され、19種類の質問に対する反応を比較した
  • テストには69種類の言語モデルが使用され、出力の多様性やランダム性を調整するパラメーター以外はデフォルト設定で行われた
  • 結果はモデルごとに回答内容と出力にかかった時間が表示され、正しく回答できたモデルは14種類だった

🤖

ソフト開発支援のオーティファイ、生成AIでテスト提案 - 日本経済新聞

  • AIを活用したソフトウエア開発支援機能「Step Suggestions」を提供開始
  • ブラウザ画面に表示される3つの提案から選択し、効率的にテストを作成可能
  • ChatGPTは自然な文章生成AIで、質問に答えて自然な言葉で文章を生成

😮

Microsoft、生成AI「Copilot」サービス利用による著作権侵害の賠償金を肩代わりすると発表:「Gi..

  • 生成AIサービスの利用による著作権侵害で訴えられた場合、顧客を弁護し、賠償金を肩代わりするプログラムを発表
  • 対象は「Microsoft 365 Copilot」「Windows Copilot」などの有償版サービス
  • 有償Copilotサービスの利用による法的問題は当社の問題と述べている

🇬🇧

ELYZAが公開した日本語LLM「ELYZA-japanese-Llama-2-7b」についての解説 : (1) 事前学習編

  • 日本語テキストデータの少なさから、英語を主としたモデルから日本語を追加事前学習することを選択
  • Llama 2をベースにしたモデルは、超大規模な英語テキストデータを含んでおり、他のモデルに比べて優れた言語能力を持つ
  • 追加事前学習では、日本語テキストデータを追加し、180億トークンの日本語を学習

👏

無料図書館「Project Gutenberg」の蔵書をAIがオーディオブックに ~Microsoftが協力 - やじうま..

  • Project GutenbergとMicrosoftが協力し、数千冊の朗読コンテンツを無償で公開
  • MicrosoftのText-to-Speechを使った朗読版を公開、数千冊以上の作品が対象
  • お好みのPodcastアプリからも聴ける、日本でもオーディオブックが普及するかもしれない

📝

LLM で長文から構造化データを抽出する - DROBEプロダクト開発ブログ

  • LLMを使って長文から構造化データを抽出する手法について説明します。
  • 文章をチャンクに分割し、タグを抽出してユニークな配列にします。
  • LLMの進化によりこれらの手法は必要なくなるかもしれませんが、現時点ではまだ制限があるため、このような手法を考える必要があります。

📚

AI使った宿題カンニングに教師はどう対応すべきか。ChatGPT開発元が提言 - PC Watch

  • AIを使った宿題のカンニングに対する教師の対応について提言が出されている
  • AIが生成した文章かどうかを検出するツールの確実な区別はできないと指摘
  • 生徒とAIの対話の一部を教師と共有し、協力的な環境を促進することを推奨

💼

Microsoft、自社AIを使う顧客を著作権侵害訴訟から保護 - PC Watch

  • 企業向けのCopilotサービスの顧客を著作権侵害訴訟から保護するための「Copilot Copyright Commitment」を開始
  • Copilotサービスを利用した顧客が著作権侵害で訴えられた場合、訴訟での不利な判決や和解金を補償
  • 商用のCopilotサービスやその出力結果、Bing Chat Enterpriseに適用、無料版や個人向けのCopilotサービスは対象外

😅

FMOps/LLMOps:生成系 AI の運用と MLOps との違い | Amazon Web Services ブログ

  • 生成系AIの運用化は容易ではなく、お客様の期待が高まっています。
  • MLOpsの原則を利用して生成系AIアプリケーションを運用化する方法が存在します。
  • Text to TextのアプリケーションやLLM運用(LLMOps)についても解説があります。

🔍

Amazon Kendra と ChatGPT で RAG を実現する - Taste of Tech Topics

  • YAMALEXは機械学習がメインのデータサイエンスチームで、Amazon KendraとOpenAI ChatGPTを組み合わせてRAGシステムを構築します。
  • RAGは検索結果を解析し要約する手法で、企業内情報やドメイン知識が必要な質問に分かりやすい回答を生成できます。
  • Kendraは機械学習を利用したインテリジェント検索サービスで、Lambdaを利用してKendraとChatGPTを呼び出し、RAGを実現します。

😮

GitHubが「GitHub Copilot」開発で得た教訓、LLMアプリケーション開発のベストプラクティスとは..

  • GitHubはAIペアプログラミングツール「GitHub Copilot」の開発経験を整理し、LLMアプリケーション開発の教訓として紹介
  • Copilotの開発は3年間にわたり行われ、特定の段階を踏んで進行した
  • 開発から一般公開までの経験を共有することで、他の開発者に有益な情報を提供している

🤖

画像生成AI「Midjourney」が品評会で1位を取った絵画の著作権保護をアメリカ著作権局が拒否、624..

  • AI「Midjourney」が生成した絵画が美術品評会で1位を獲得
  • アーティストのジェイソン・アレン氏は624回のプロンプト入力とPhotoshop修正を行った
  • 著作権局は「人間の著作権が欠けている」と判断し、著作権保護を拒否

💪

3年間で17人の医師が見つけられなかった少年の痛みの原因をChatGPTが特定することに成功 - GIGAZ..

  • ChatGPTが3年間で17人の医師が見つけられなかった少年の痛みの原因を特定しました。
  • ChatGPTは文章を高い精度で生成し、医師免許試験にも合格できる能力を持っています。
  • AIを用いた医療の研究が進められ、より効果的な診断や治療が実現されることが期待されています。

🎥

Adobe、動画内の人やモノを認識し分離するビデオセグメンテーション機能「DEVA」を発表【研究紹..

  • 「DEVA」というビデオセグメンテーション技術が発表され、動画内の物や人を認識し分離することが可能になりました。
  • この技術は静止画の物体分割技術とビデオ全体で時間的に展開する技術を組み合わせたもので、「分離型ビデオセグメンテーション」と呼ばれています。
  • この手法はビデオデータが不足している場合や新しい大規模なデータセットにも効果的であり、既存の画像分割モデルへの組み込みも可能です。

💻

サイバーエージェントのGitHub Copilot導入と 開発生産性 - Speaker Deck

  • GitHub Copilotの導入により開発文化が変化
  • CTO統括室の黒崎優太氏が開発生産性について語る
  • AI事業本部やインターネットゼミについても紹介

📱

Overview of natively supported quantization schemes in 🤗 Transformers

  • モデルの量子化は、大きなモデルの推論を小さなデバイスで実行するためや、量子化されたモデルの上にアダプタを微調整するために使用されます。
  • transformersでは、bitsandbytesとauto-gptqという2つの量子化スキームがネイティブにサポートされています。
  • サポートされている各スキームの詳細は、公開されているリソースやドキュメントを参照することが推奨されています。

🔀

OpaquePrompts x LangChain: Enhance the privacy of your LangChain application with just one..

  • OpaquePromptsは、選択したLLMの周りにプライバシーレイヤーとして機能し、プロンプト内の機密情報を自動的に識別します。
  • LLMプロバイダに対してプロンプト内の機密入力を隠すための前処理を行い、LLMの応答を後処理します。
  • LangChainアプリケーションの1行のコードを変更するだけで、アプリケーションをプライバシー保護に対応させることができます。

👨‍💻

「“クールな”LLMアプリは簡単に作れるが、リリースレベルは難しい」 Azure OpenAIとCognitive..

  • 「CYDAS PEOPLE」のチャット機能にChatGPTを活用し、従業員からの質問に自動でチャットボットで答える機能を開発
  • ChatGPTの回答が一定ではないため、温度パラメーターを調整したり、プロンプトエンジニアリングを行っている
  • Azure OpenAIを利用してコンプライアンス対応を行い、Cosmos DBとCognitive Searchを使用してデータの検索を行っている

💻

Amazon SageMaker simplifies the Amazon SageMaker Studio setup for individual users | AWS M..

  • 新機能「クイックスタジオセットアップ」により、個々のユーザーが数分で機械学習のための統合開発環境を簡単にセットアップできます
  • この開発環境では、データの準備からモデルの構築、トレーニング、展開まで、すべての機械学習開発ステップを実行できます
  • また、数回のクリックで展開できるモデルや事前構築されたソリューションの大規模なコレクションにもアクセス可能です

👍

Accelerate client success management through email classification with Hugging Face on Ama..

  • Hugging Faceを使用したメール分類により、顧客成功管理が加速化
  • Amazon SageMaker上での使用により、効率的な応答プロセスと待ち時間の大幅な短縮が可能
  • 新しいリクエストが到着するとすぐに分類し、事前定義されたキューにリダイレクトする

👨‍🏫

Understanding Machine Learning Algorithms: An In-Depth Overview - KDnuggets

  • 機械学習の理解には、教師あり学習、教師なし学習、強化学習の3つの主要なカテゴリーがあります。
  • 機械学習が扱うタスクには、分類、回帰、クラスタリングがあります。
  • 決定木、サポートベクターマシン、K最近傍法、線形回帰などのアルゴリズムが機械学習でよく使用されます。

📚

Fine-tune your own Llama 2 to replace GPT-3.5/4 | Hacker News

  • オープンソースのLLMの微調整についての洞察と実用的なコードを共有
  • 微調整はモデルの重み自体にエンコードする強力なプロンプティングの形と考えられ、既存のモデルを入力/出力の例でトレーニングすることで行われる
  • 微調整されたLlama 7Bモデルは、GPT-3.5よりも50倍安価で、多くのユースケースで同等またはそれ以上の結果を生み出す

🎉

How to Safely Query Enterprise Data with LangChain Agents + SQL + OpenAI + Gretel

  • LangChainエージェントと大規模言語モデル(LLM)を組み合わせることで、データベースやデータウェアハウスとの対話方法が変わりつつあります。
  • LangChain、LLM、Gretelのシンセティックデータを組み合わせて、データベースやデータウェアハウス内のデータとの自然言語データ対話のためのソリューションを作成します。
  • LangChain SQLエージェントはデータベースのスキーマと例の行をクエリし、これらを使用してSQLクエリを生成し、要求された結果を取得します。

🌐

World scale inverse reinforcement learning in Google Maps – Google Research Blog

  • Googleマップのルーティングは、到着予定時刻、通行料、直接性、路面状況、ユーザーの好みなど、さまざまな要素の複雑なトレードオフを考慮する必要があります。
  • Google Research、Maps、Google DeepMindの共同研究により、逆強化学習(IRL)のスケーラビリティの制限を超える新しいアルゴリズム「Receding Horizon Inverse Planning(RHIP)」が開発されました。
  • RHIPポリシーは、ドライブと二輪車に対して、それぞれウェルチューンドされたMapsベースラインに比べて、グローバルなルート一致率を15.9%と24.1%向上させます。

💡

LLMが巡回セールスマン問題などの最適化問題を解く〜自分自身で優れたプロンプトを作成&活用〜 ..

  • Google DeepMindの最新研究では、Large Language Models(LLM)が最適化問題を解決する新たな手法として利用可能性が示されました。
  • LLMは自然言語を用いて最適化タスクを説明し、新しい解を生成する方法を提案しています。
  • LLMを用いて線形回帰問題や巡回セールスマン問題を解決し、その性能を評価した結果、プロンプトエンジニアリングが重要であることが示されました。

👥

動きの早い生成AIトレンドを効率良くキャッチアップするためにオススメな2つの方法|梶谷健人 / ..

  • AIトレンドを追うためには、世界のAIトップランナーをフォローすることが有効です
  • AIトップランナーがフォローしている人もフォローすることで、より広範な情報を得られます
  • AI関連のニュースレターを購読し、DeepL翻訳と組み合わせて読むこともオススメです

💻

AI trains on your Gmail and Instagram, and you can’t do much about it - The Washington Po..

  • Google、Meta、Microsoftは、あなたのGmailやInstagram、ドキュメントなどを使ってAIを教育しています。
  • 特にMetaは、許可なしにパブリックアカウントから10億のInstagram投稿を取得し、AIのトレーニングに使用しています。
  • これらの行動がプライバシーや評判、仕事にどのようなリスクをもたらすかはまだ理解されていませんが、止めることはほぼ不可能です。

2023年09月13日

|

このサイトについて

/

ニュースレター

/

@AINewsDev