AI News

~AI関連記事を3行にまとめて紹介~

🤖

Amazon ConnectとLexでのコールセンター向けAIチャットボットで、Function Callingを利用し、発..

  • Amazon ConnectとAmazon Lexを組み合わせて、コールセンター向けのAIチャットボットを作成
  • Function Callingを利用し、発話内容から必要な情報をJSON形式で抽出
  • Function Callingでユーザーの発話内容からアーティスト名と曲名のみを抽出し、抽出内容をそのままConnectで音声出力

👀

4K4D

  • 4K解像度でのダイナミックな3Dシーンの高品質かつリアルタイムなビューシンセシスを目指す4K4Dという4Dポイントクラウド表現を提案
  • 4D特徴グリッド上に構築された4K4Dは、ハードウェアラスタライゼーションをサポートし、前例のないレンダリング速度を実現
  • 4K4Dは、RTX 4090 GPUを使用して1080p解像度で400 FPS以上、4K解像度で80 FPS以上の速度でレンダリング可能で、従来の手法よりも30倍高速

🤔

LangSmith で始める LLMOps - Gaudiy Tech Blog

  • LLMをプロダクトに活用する際の課題を解決するツールとしてLangSmithを使用
  • LangSmithはプロンプトのログ取得やPlaygroundでのチューニングが可能
  • LangSmithではEvaluation機能やHubによる一元管理も可能

🤖

神への挑戦:AIを「脱獄」させる 異常行動を引き起こす人間の悪意 | 毎日新聞

  • AIの異常行動を引き起こす「脱獄」の問題が発生
  • AIは同じ質問でも異なる回答を引き出せる特性を持つ
  • 特殊なプロンプトによりAIの命令が破られる現象が確認された

💯

イラレの生成AIはパンドラの箱を開けたか? Live - 2023/10/16|CreativeEdge Vlog

  • Adobe Illustrator 28.0に実装された「テキストからベクター生成 (Beta)」を探求するプロジェクトが開始されました。
  • 生成AIを使いこなすイラレの達人が最強ということを痛感し、今後の技術進化でどこまで精度を向上させることができるのか注目されています。
  • イラレの生成AIはプロンプトに忠実で、生成したベクターグラフィックを組み合わせて意図したイメージに近づけることが可能です。

💻

The Challenges of Producing Quality Code When Using AI-Based Generalistic Models

  • AIの一般的なモデルを使用すると、コード生成などの具体的なタスクで問題が生じる可能性がある
  • AIによるコード生成は、自分の基準や品質に合わない他人のコードを使用することに似ている
  • 問題解決のためには、専門化されたモデルの作成が有効な場合がある

😅

生成AIグラビアをグラビアカメラマンが作るとどうなる?第十回:実在モデルからSDXL用顔LoRAを作..

  • 生成AIでポートレート写真やグラビアを作ると、似たような顔ばかりが出てくることに気づく
  • 顔LoRAを使えば、環境と元の写真さえあれば比較的簡単に作成できる
  • 顔LoRAを作る方法はいくつかありますが、今回はコマンドラインのsd-scriptsを使用します

📁

Googleドキュメントを使って、2ステップで画像から文字起こしする方法【今日のワークハック】 | ..

  • PDFや画像から文字起こしをする際にはGoogleドキュメントが便利
  • Googleドライブに画像をアップロードし、Googleドキュメントで開くだけで文字起こしが可能
  • OCRの精度は高く、ほぼ問題なく解読できる

🎨

AIで生成したイラストがパクられて勝手に売られていた! やめさせるにはどうすれば? - 弁護士..

  • AIが自律的に生成した作品は著作物に該当せず、著作権侵害にはならない
  • 人がAIを利用し創作的な変更を加えた場合、最終的なイラストに人の創作的寄与があるため、著作権法で保護される可能性がある
  • 著作物でなくても、無断利用による損害賠償請求が認められる場合もある

💻

After ChatGPT disruption, Stack Overflow lays off 28 percent of staff | Ars Technica

  • 生成型AIの台頭により、チャットボットが具体的なコーディングヘルプを提供するようになり、開発者たちの支持を集めています。
  • Stack Overflowはスタッフの28%を解雇し、コスト削減を図る一方で、「Overflow AI」というChatGPTに対抗する製品を開発中です。
  • OpenAIはChatGPTのためのウェブクローラーの制御を開発し、Stack Overflowのようなサイトがクローリングを拒否できるようにする予定です。

📚

LoRA初心者教本・改 前編|かたらぎ

  • LoRAの初心者教本では、環境構築とおすすめ設定を紹介
  • LoRAを制作するツールには「KohyaGUI」や「LoRA Easy Training Scripts」がある
  • 学習画像を用意し、タグ付けを行い、「GENERAL ARGS」タブで学習の設定を行う

🚀

「世界トップレベルの大規模言語モデルの開発に着手」──産総研らが表明 目指すのは“GPT-3級..

  • 大規模言語モデル(LLM)の開発に着手し、パラメータ数1750億のLLMの構築を目指す
  • 計算資源として「AI橋渡しクラウド」(ABCI)を提供し、言語データの作成も協力
  • 完成後はLLM-jpを通じて公開予定で、マルチモーダルなデータ処理やロボット応用に貢献

🔄

IBMが生成AIでモダナイズ、COBOLを「JaBOL」ではなくネーティブJavaへ変換 | 日経クロステック(..

  • 生成AIを活用してCOBOLコードをネーティブなJavaに変換する取り組みを進めている
  • COBOLからJavaへの自動書き換えが可能となり、システムモダナイズが実現される
  • 生成AIは日本語の仕様書からJavaやCOBOLのコードを生成したり、ソースコードから仕様書を生成したりすることも可能

👏

ChatGPTのGPT-4Vを使ってSQL文を画像から作成する - Taste of Tech Topics

  • GPT-4 with vision (GPT-4V)を使用して画像からSQL文を生成する試みを行います。
  • 画像を解釈し、マークダウンでテーブル構造を出力し、その後DDLを作成します。
  • 作成したDDLを用いてJOINしたデータ構造のSQL文を生成し、その結果を取得します。

💻

Google Colab で 4D Gaussians Splatting を試す|npaka

  • 「4D Gaussians Splatting」は、映像からリアルタイムで動いている3Dシーンを生成する技術です。
  • Google Colabでの実行手順は、ハードウェアアクセラレータの設定、パッケージのクローンとインストール、学習データの取得、学習とレンダリングの実行などです。
  • 結果は「output/dnerf/bouncingballs/」に出力されます。

🚀

ChatGPTのプロンプトで使える回答を引き出す“7R”とは マーケター必須スキルとAI最前線 | 【レ..

  • 「7R」はマーケターにとって必須のスキルで、AIの最前線に位置する
  • AIを使って簡単なプロンプトを入力するだけで、本格的なグラフを作成可能
  • AIを使いこなすためには、プロンプトの書き方が重要で、具体的で明確な指示が大切

🖼️

Google Colab で DreamGaussian を試す|npaka

  • DreamGaussianはプロンプトまたは画像から高品質な3Dメッシュを生成する手法です
  • Google Colabでの実行手順は、公式リポジトリのノートブックを開き、自分のGoogleドライブにコピーし、画像をアップロードして前処理を行い、設定項目を設定して学習を開始します
  • 学習が終了すると、動画として出力されます

🌍

ASCII.jp:ChatGPT対抗の本命「Claude 2」ついに日本でも利用可能に

  • AIチャットボット「Claude 2」の公開範囲が世界95の国と地域に拡大
  • EU加盟国は含まれていないが、無料版と有料プラン「Claude Pro」が利用可能
  • アマゾンが最大40億ドルを投資し、生成AI分野で競合他社に対抗

💨

NVIDIA、Stable Diffusionを倍速にするTensorRT。新ドライバで対応 - PC Watch

  • 最新のドライバ「GeForce Game Ready Driver WHQL 545.84」を公開し、Stable Diffusionの処理速度を倍速にするTensorRTアクセラレーションを追加
  • AIによる超解像処理機能「RTX VSR 1.5」も利用可能に
  • 「NARAKA: BLADEPOINT」や「Warhammer: Vermintide 2」など14のゲームがDLSS 3に対応し、生成AIを高速化する「TensorRT-LLM for Windows」も公開

🚀

7 Steps to Mastering Large Language Models (LLMs) - KDnuggets

  • 大規模言語モデル(LLM)は自然言語処理の新たな時代を切り開き、その基礎からアプリの構築と展開までを学ぶことができます
  • LLMは巨大なテキストデータのコーパスで訓練され、数百億のパラメータを持ち、自然言語タスクで優れたパフォーマンスを発揮します
  • LLMは文脈に即した、文法的に正確で、意味のあるテキストを理解する能力があります

💦

GPT-4 Vision Prompt Injection

  • プロンプトインジェクションは、悪意のあるデータをテキストプロンプトに注入する脆弱性で、不正な操作が行われる可能性があります。
  • GPT-4 Visionでは、アップロードされた画像のテキストを読み取り、画像を介して悪意のあるフレーズを注入することが可能です。
  • この脆弱性に対する防御方法については、引き続き研究が行われています。

💡

Sansan LabsのLLM活⽤から考えるLLMプロジェクトの要点整理 / LLM Project Essentials from Sans..

  • 生成系AIのユースケースを考えるワークショップでの発表内容を整理
  • LLMプロジェクトの要点を理解するための情報提供
  • データドリブンな意思決定でプロダクトのグロースをリードするプロジェクトに取り組む

💬

GitHub - microsoft/autogen: Enable Next-Gen Large Language Model Applications. Join our Di..

  • AutoGenは、複数のエージェントが会話してタスクを解決するLLMアプリケーションの開発を可能にするフレームワークです。
  • AutoGenエージェントはカスタマイズ可能で会話可能であり、人間の参加をシームレスに許可します。
  • AutoGenは、複雑なLLMワークフローのオーケストレーション、自動化、最適化を簡素化し、LLMモデルのパフォーマンスを最大化し、その弱点を克服します。

🤖

OpenAIを使って分析を楽にさせる

  • OpenAIのAPIを活用したslack botを開発し、データベースのDDLに基づいたSQLを生成します
  • botとバックエンドの2つの要素で構成され、バックエンドはCloudflare Workersを使用して実装
  • OpenAIの実装ではgpt-3.5-turboモデルを使用し、5時間で実装・リリース可能

🎤

人の歌声をVOCALOIDに!歌声変換プラグイン、VOCALO CHANGER PLUGINをヤマハが発売開始

  • 新たに発売されたVOCALO CHANGER PLUGINは、人の歌声をVOCALOIDの歌声に変換することが可能です
  • リアルタイムでの変換や操作可能なパラメータの追加など、従来のVOCALOIDの作成方法に比べて簡単でパワーアップしています
  • 価格は22,000円で、VOCALOIDユーザーはクロスグレード版を11,000円で購入でき、AI Megpoidや符色などのボイスバンクも利用可能です

💡

The Ever-So-Ethical OpenAI Just Replaced Its "Core Values" With Completely Different Ones

  • OpenAIは「コアバリュー」リストを変更し、人工汎用知能(AGI)に焦点を当てるようになりました
  • 新しいコアバリューは「AGIの焦点」「熱心で頑張る」「スケール」「人々が愛するものを作る」「チームスピリット」です
  • OpenAIは元々は善良なAIを構築することを目的とした非営利の研究所でしたが、営利事業へ転換しました

💥

40% of Labour Force Will be Affected by AI in 3 Years - KDnuggets

  • AIのブームにより、労働力の40%が3年以内に影響を受ける見込み
  • スキルギャップを埋めることが重要な課題となっている
  • AIはさまざまなタスクを自動化し、一部の仕事を不要にする可能性がある

🔍

Optimize pet profiles for Purina’s Petfinder application using Amazon Rekognition Custom ..

  • Amazon Rekognition Custom LabelsとAWS Step Functionsを使用してペットプロフィールを最適化
  • MLモデルを使用してアップロードされた画像からペットの品種を検出
  • AI/MLアプリケーションのワークフローの基本原則に焦点を当てたソリューション

💻

The Prompt Landscape

  • モデルの重みを更新せずにLLMの動作を制御できる技術が開発されました
  • プロンプトの発見性、共有性、ワークショップ、デバッグのサポートのためのプロンプト管理の需要が増加
  • コミュニティのプロンプトの閲覧と自分自身のプロンプトの管理をサポートする場としてLangChain Hubが立ち上げられました

🖥️

Nvidia’s banking on TensorRT to expand its generative AI dominance - The Verge

  • TensorRT-LLM SDKのWindowsへのサポートを追加し、大規模な言語モデル(LLM)と関連ツールの実行速度を向上させる。
  • TensorRT-LLMを介してLLMを実行することで、より洗練されたLLMの使用体験が大幅に向上すると述べている。
  • 生成AIの世界は速く動いており、高価なGPUの数を購入する必要がないLLMの実行方法が登場している。

🐍

ChatGPTとPythonで学ぶ k近傍法 #Python - Qiita

  • データ密度推定には、k近傍法の代わりにKernelDensityを使用する方法がある。
  • KernelDensityのインスタンスを作成し、ランダムな2次元データセットを使ってモデルを学習させる。
  • データ点[0.5, 0.5]でのデータ密度を推定し、この値が大きいほど、データ密度が高いと解釈できる。

🔍

次世代データサイエンティストが身につけるべき4つの最重要スキル #データ分析 - Qiita

  • 問題の本質を見極める力が必要
  • 問題を明確に、具体的に定義する力が求められる
  • 進捗を共有し、管理する力と解決案とその根拠を伝える力が重要

🔍

You.com x LangChain

  • You.comがAIアシスタントに使用している検索エンジンをAPIアクセスで提供
  • You.com Search APIとGoogle Search APIを比較し、LLMをRAG-QA設定で評価するツールを提供
  • You.comの検索APIがGoogleを大きく上回る結果を示す

🎮

Building a board game with the TFLite plugin for Flutter — The TensorFlow Blog

  • TensorFlow、TensorFlow Agents、JAXを使用して強化学習エージェントをトレーニングし、変換したTFLiteモデルをTensorFlow Liteを使用してAndroidアプリに展開する方法を紹介
  • ユーザーボードの状態を渡し、ゲームエージェントが次に攻撃する最も有望な位置を特定するためにTFLite推論を実行
  • ゲームボードをレンダリングし、ゲームの進行状況を追跡するためのいくつかの追加のFlutterフロントエンドコードとともに、AndroidとiOSの両方でゲームをすぐに実行できる

👨‍🔬

‘AI Godfather’ Yoshua Bengio: We need a humanity defense organization - Bulletin of the ..

  • モントリオールにあるMila-Quebec AI Instituteは、世界最大の深層学習の学術研究者の集積地で、1,000人以上の研究者と100人以上の教授が在籍しています。
  • Milaの科学的ディレクターであるヨシュア・ベンジオは、人工ニューラルネットワークと深層学習のパイオニアで、AIの「教父」として知られています。
  • ベンジオは、AIが人間の広範な認知能力を達成する時期について、以前は数十年、あるいは数世紀先と考えられていたが、現在では数年または数十年以内に達成される可能性があると説明しました。

🤖

Japanese tea commercial actress created by AI, has some wondering if it’s the scandal-fre..

  • 伊藤園の新商品「お~いお茶カテキン緑茶」のCMにAI作成のスポークスモデルが出演
  • AIはCMのビジュアルだけでなく、商品のラベルデザインも作成
  • AIモデルの使用には賛否があるが、リスクのない広告モデルとしての利点もある

💻

Inside the booming AI-generated porn industry | Dazed

  • AIモデルを使って生成されたアダルトコンテンツが収益化されています。
  • 男性たちは検証システムを回避し、存在しない女性の露骨な画像を作成しています。
  • これは一部の人々にとって利益をもたらすビジネスとなっています。

💪

Fuyu-8B: A Multimodal Architecture for AI Agents

  • Fuyu-8Bは、AIエージェントのためのマルチモーダルアーキテクチャで、シンプルな設計とトレーニング手法を持つ
  • 任意の画像解像度をサポートし、視覚的な質問応答や自然画像キャプションなどの標準的な画像理解ベンチマークでも優れたパフォーマンスを発揮
  • 今回、オープンライセンス(CC-BY-NC)でリリースし、コミュニティがさらに発展させることを期待

👍

NECの大規模言語モデルが一般初公開 現地の様子は:CEATEC 2023 - ITmedia NEWS

  • 大規模言語モデル(LLM)がテクノロジー展示会で一般公開され、ChatGPTのような利用環境での動作を披露した
  • LLMは日本語処理能力がトップクラスで、パラメーター数は130億と軽量で、Azure OpenAI Serviceとの併用も可能
  • 特定の業界向けに展開する方針であり、マイLLMの可能性も検討中

💬

生成AI/LLMから事業価値を創出するための条件とは|Weights & Biases Japan

  • 生成AI/LLMの事業価値を創出するための条件についてエグゼクティブラウンドテーブルイベントで議論されました。
  • GPU不足やモデルの開発方法などが課題として挙げられ、日本独自のAI開発・提供環境の意義も考えられました。
  • LLM技術はまだ未知の領域であり、伸び代も大きいと言えます。

🧠

LLMにまず前提から尋ることで出力精度を向上させる『ステップバック・プロンプティング』と実行..

  • ステップバック・プロンプティングは、高次の概念や原則に関する質問を最初に提示し、それを基に推論を行うLLMの推論能力向上手法です
  • この手法は従来のプロンプト技術よりも高い性能を発揮し、多段階の推論や複雑なタスクに有用です
  • 実験結果によれば、ステップバック・プロンプティングは各ベンチマークで7%から27%の性能向上を達成しました

🎉

人物の「不自然さ」を極限まで取り除いて超リアルな画像を生成する『HyperHuman(ハイパーヒュー..

  • HyperHumanは、人物のイラスト生成AIの新しい画像生成技術で、リアルさや品質が向上しています。
  • この技術は、潜在構造拡散モデルと構造ガイドリファイナーの2つの主要なコンポーネントから構成されています。
  • 人物生成の基盤となるモデルとして業界に大きな寄与をする可能性があります。

2023年10月19日

|

このサイトについて

/

ニュースレター

/

@AINewsDev