AI News

~AI関連記事を3行にまとめて紹介~

💻

AWSのコード生成AI「CodeWhisperer」、生成モデルのカスタマイズが可能に。社内の独自ライブラリ..

  • コード生成AI「CodeWhisperer」がカスタマイズ可能になり、社内の独自ライブラリやAPIを生成コードに組み込む新機能がプレビュー公開されました。
  • CodeWhispererは、数十億行のコードを基に機械学習を行い、プログラマが書き始めたコードの続きやコメントの内容からコードを生成、提案するサービスです。
  • 新機能は有料のProfessional版で提供され、生成モデルをカスタマイズするには、社内限のライブラリやAPIを読み込ませる必要があります。

🔊

AWS Lambda でOpenAI の Whisper API を 認識精度の改善も含めて試してみた | DevelopersIO

  • AWS LambdaでOpenAIのWhisper APIを使用し、音声データから文字起こしを行った
  • S3バケットに保存された音声データをWhisper APIで文字起こしし、精度を確認
  • 文字起こし結果の一部修正が必要だったが、プロンプトパラメーターやGPT-4による追加処理で改善可能

📊

MT-Bench の概要|npaka

  • 「MT-Bench」は80のマルチターン質問を含むLLMのベンチマークで、8つの主要なカテゴリで評価されます
  • 自動評価パイプラインを使用して人間の嗜好を評価し、LLM審査員の信頼性についての研究も行われました
  • 「MT-Bench」の結果により、異なるモデル間のパフォーマンスの差が明らかになり、LLM審査員は説明可能な評価を提供します

💪

University of Turku and SiloGen launch consortium to build the world’s largest open LLM |..

  • トゥルク大学とSilo AIは、大規模な言語モデル(LLM)の部門であるSiloGenと共同で大規模なイニシアチブを発表
  • SiloGenとトゥルク大学のTurkuNLP研究グループは、世界最大のオープンソースLLMを含む一連のオープンLLMを開発するためのコンソーシアムを立ち上げ
  • このイニシアチブは、ヨーロッパのデジタル主権を確保し、LLMへのアクセスを民主化することを目指している

🤖

AIによって作られた数十言語の音声によりニューヨーク市長が有権者に多言語話者だと思わせている..

  • AIによる多言語音声を利用して、ニューヨーク市長が自身が話せない言語でロボコールを行っていると指摘されています。
  • 市長はAIを使用して自身が話せない言語を話すことができると主張し、数百万人以上に対してロボコールが行われたと広報担当者が述べています。
  • 専門家は、多言語を話せない市長がそのような行為をすることに倫理的な懸念があると指摘しています。

🌩️

Google Cloud ComposerでGPUを使ったタスクを安定稼働するために行ったこと - ZOZO TECH BLOG

  • GPUを使うタスクでGoogle CloudのGPU枯渇問題が発生し、その解決策を探求
  • Cloud Composer 2ではGPUの利用をサポートしていないため、別途GPUが利用可能なインスタンスを用意
  • 物体検出のタスクが失敗し、原因としてGCEのリソース枯渇が特定

😎

GPT-4やLlama 2の透明性をスタンフォード大HAIが評価 トップはMetaでOpenAIは3位 - ITmedia NEW..

  • スタンフォード大学HAIがAI基盤モデルの透明性を評価するFMTIを公開
  • 評価対象は10社で、最も透明性が高いのはMetaのLlama 2で54%
  • CRFMは商業基盤モデルの透明性の重要性を指摘

💻

ChatGPT対抗の本命「Claude 2」ついに日本でも利用可能に(アスキー) - Yahoo!ニュース

  • AIチャットボット「Claude 2」が日本を含む95の国と地域で利用可能に
  • 無料版だけでなく有料プラン「Claude Pro」にもアクセス可能
  • アマゾンが最大40億ドルを投資し、戦略的な協力関係を築いている

📄

ついに日本で利用可能になったChatGPTの強力ライバル「Claude」使用レビュー、テキストファイル..

  • 「Claude」はテキストやPDFの認識が可能で、ランチの相談からコーディング補助までスムーズに応答します。
  • アカウント作成手順はメールアドレス入力、コード入力、電話認証の順です。
  • 誤った返答もあるので注意が必要で、関連記事やコンテンツも参考にすると良いでしょう。

💡

ChatGPT、最新の情報も検索可能に Microsoftと連携 - 日本経済新聞

  • ChatGPTが最新情報の検索が可能になりました
  • 対話型AIを活用し、資本・業務提携を行いました
  • 有料版利用者や法人向けサービス企業を対象に、ネット検索サービスを提供します

🚀

AI学習を高速化するプロセッサーや1000億パラメーターの大規模言語モデルなどが目を見張るPrefer..

  • AI学習を高速化するプロセッサーや1000億パラメーターの大規模言語モデルが展示されている
  • MN-Coreサーバを使った材料シミュレーションの実演も行われ、数時間で作業が完了するとのこと
  • 将来的には1000億パラメーターのモデルとマルチモーダル基盤モデルの商用提供を目指している

💡

「Android 14」はアップデート一択。期待していい機能をまとめました | ライフハッカー・ジャパ..

  • Android 14はPixel端末で公式に利用可能になり、他のAndroidスマートフォンでも利用できるようになるのは時間の問題です。
  • AI機能が特に注目で、ジェネレーティブAIを活用してユニークな壁紙を作成するオプションがあります。
  • スナップショット機能とカメラの新機能もAIを活用して強化され、ホームスクリーンでより良い情報を提供します。

💬

AnthropicのAIチャット「Claude 2」、日本語に対応 - ITmedia NEWS

  • 米AI企業がAIチャット「Claude 2」を日本を含む95カ国で無料利用可能に
  • ユーザーインタフェースは英語だが、日本語でプロンプトを入力すると日本語で返答が返ってくる
  • ユーザーのデータは必要最小限のデータのみを共有する方針

💪

NECが独自LLMで早くも成果、「GPT-4」上回る日本語性能 | 日経クロステック(xTECH)

  • 独自のLLMを開発し、GPT-4を上回る日本語処理性能を実現
  • 半年で多くの成果を出し、オンプレミス向けのハードウェアも提供
  • 2023年7月にGenerative AI Serviceを開始し、ワンストップでサービスを提供

💡

Baiduが大規模言語モデル「Ernie 4.0」を発表、全ての点でGPT-4に匹敵する実力を持つ - GIGAZINE

  • 「Ernie 4.0」は理解・生成・推論・記憶の4つの能力を向上させ、中国語以外の分野でもAIの実力が向上
  • CEOはErnie 4.0のデモを行い、他の製品へのAI導入も進めると述べた
  • 中国ではAI製品の公開前にセキュリティ審査が必要

🔄

【StreamingLLM】トークン数400万、小説40冊を読み込める無限LLM | WEEL

  • StreamingLLMは無限に入力が可能なツールで、小説40冊分のトークン数400万を読み込むことができます
  • GitHubで4500超えのスターを獲得し、対話型でリアルタイムに応答を生成することが可能です
  • 無料でGoogle Colab上で実行できますが、メモリエラーが発生する可能性があるため、十分なメモリを確保する必要があります

🚀

AWS 内で大規模言語モデルを利用できる Amazon Bedrock を使って作る RAG アプリケーション - ク..

  • Amazon Bedrockは、Amazonや主要なAIスタートアップ企業が提供する基盤モデルを利用できるサービスです。
  • Amazon Bedrockのエージェントはフルマネージド型で、生成系AIアプリケーションを簡単に作成できます。
  • RAGアプリケーションを作成するためにはVector DB、Embedding Function、Retriever、LLMのコンポーネントが必要です。

😎

Sparse LLM Inference on CPU

  • 大規模な言語モデルを微調整し、疎なモデルを作成する研究が行われ、MPTモデルは75%剪定されても精度が低下せず、量子化手法と同等のパフォーマンスを示しました。
  • 疎な微調整されたモデルは、CPU上で高速に実行可能で、AMD Ryzen CPUのシングルコアで7.7トークン/秒、4コアで26.7トークン/秒を達成しました。
  • 疎さを導入することで、メモリ、ストレージ、計算能力に制約のあるデバイス上で大規模な言語モデルを利用可能にし、市販のコモディティCPU上で展開することが可能になります。

👆

GitHub - danielgross/localpilot

  • MacbookでGitHub Copilotをワンクリックで簡単にローカルで利用可能
  • VS Codeの設定を開き、settings.jsonに特定の内容を追加
  • 仮想環境を作成し、必要なパッケージをインストールしてモデルをダウンロード

💻

ChatGPT で自分の仕事がどう楽しくなるのかを考えるネタ集 -2023年10月バージョン- - Speaker De..

  • ChatGPTの社会・ビジネスへの影響について考察
  • 人とコンピュータの関係性の変化に対応するため、Promptの使い方を学ぶ必要がある
  • ChatGPTの衝撃は「Promptが必要」という新たな認識

🤖

調査レポート:通信業界における生成系AIの活用、課題、そして未来 | Amazon Web Services ブロ..

  • 通信事業者の半数以上が2年以内に生成系AIを活用する計画で、支出は最大6倍に拡大予定
  • 生成系AIは顧客体験やビジネスアプリケーションを革新する可能性があると考えられている
  • データセキュリティとガバナンスが最大の課題で、既存モデルの活用が想定されている

📚

Gradient Descent: The Mountain Trekker’s Guide to Optimization with Mathematics - KDnugge..

  • 勾配降下法は、機械学習モデルの誤差を最小化するための最適化手法で、最も減少する方向にパラメータを反復的に調整します。
  • バッチ勾配降下法、確率的勾配降下法(SGD)、ミニバッチ勾配降下法など、さまざまな種類の勾配降下法が存在します。
  • 勾配降下法は局所最小値や消失・爆発する勾配といった問題を抱えていますが、これらは適切な手法を用いることで解決可能です。

🇨🇳

中国がAIで知的財産を盗んでいるとアメリカなど5カ国の「ファイブ・アイズ」が異例の警告 - GIGA..

  • 中国がAIを利用して知的財産を盗んでいると「ファイブ・アイズ」が共同声明を発表
  • 中国は企業のサイバー侵入や人的諜報活動を行い、個人情報や企業データを盗んでいると非難
  • 中国当局はこれに対し、根拠がなく中傷だと反論

💻

Evaluating social and ethical risks from generative AI

  • AIシステムの生成力が増すにつれ、その倫理的・社会的リスクを評価するための3層のフレームワークを提案
  • AIシステムの能力、人間との相互作用、システム全体への影響の3つのレイヤーで評価を行う
  • AI開発者、公的な主体、その他の関係者が協力して安全なAIシステムの繁栄と堅牢な評価エコシステムを共同で構築する必要がある

💻

「ChatGPT」、ウェブブラウジング機能が正式リリース--有料版ユーザー限定で - CNET Japan

  • ChatGPTのブラウジング機能が正式にリリースされ、有料版ユーザーの利便性が向上しました。
  • 以前はベータ版で利用制限があったが、現在は制限がなくなりました。
  • 有料版ユーザーは「Browse with Bing」を選択するだけで、Bing経由でインターネットにアクセス可能です。

💪

LLMにナレッジグラフ(知識グラフ)を連携させることで、タスク遂行能力を大幅に向上させるフレ..

  • 大規模言語モデル(LLM)は、正確な事実知識を捉えるのが難しいという課題があります
  • 新フレームワーク「Graph Neural Prompting(GNP)」は、LLMにナレッジグラフを連携させ、タスク遂行能力を向上させます
  • GNPを使用することで、低コストで高い成果を得ることができ、特定のドメインや業界に合わせて調整することも可能です

🏭

NVIDIAとFoxconnが提携して自動運転EV・自律機械・言語モデルの開発を加速するデータセンター「A..

  • AIファクトリーの建設で自動運転EVや自律機械、言語モデルの開発を加速する計画が発表されました。
  • AIファクトリーでは高性能チップやエンタープライズ向けソフトウェアが活用され、製造や検査のデジタル化や電気自動車へのAI搭載が進められます。
  • 自動運転車両向けプラットフォームやロボティクスシステム、映像解析システムの開発も行われます。

💻

stable-diffusion-webui の TensorRT 拡張(まさかのNVIDIA公式)を使うと早い!!!ので使い方な..

  • stable-diffusion-webuiのTensorRT拡張を使うと処理速度が2.5〜3倍に高速化される
  • 使用するためには16GB以上のメモリとNVIDIA RTXシリーズのグラフィックボードが必要
  • モデルごとに変換の作業が必要で、出力画像の解像度に制約がある

📚

Semantic Layer: The Backbone of AI-powered Data Experiences - KDnuggets

  • セマンティックレイヤーはAIデータ体験のバックボーンとなります
  • セマンティックレイヤーはLLMの文脈を与え、幻覚を減らす役割を果たします
  • セマンティックレイヤーの理解を深めるための「5つの必須要素」ガイドが存在します

🧠

Automatically redact PII for machine learning using Amazon SageMaker Data Wrangler | AWS M..

  • 深層学習手法を使用したい顧客は、ソースデータから個人を特定できる情報(PII)をマスキングする必要があります。
  • Amazon SageMaker Data WranglerとAmazon Comprehendを使用して、表形式のデータからPIIを自動的にマスキングする方法を紹介します。
  • 金融、小売、法律、政府などのビジネスドメインの顧客は、定期的にPIIデータを取り扱います。

🎉

DALL·E 3 is now available in ChatGPT Plus and Enterprise

  • DALL·E 3は、ChatGPT PlusおよびEnterpriseユーザーが会話からユニークな画像を作成できるようになりました。
  • DALL·E 3は、視覚的に魅力的で詳細がはっきりとした画像を生成し、複雑な詳細を信頼性の高い方法でレンダリングします。
  • DALL·E 3の開発と展開において、潜在的に有害なイメージを生成する能力を制限するための安全システムを使用しています。

💻

Lambda Extensionと自家版OpenTelemetry Collector - Classi開発者ブログ

  • OpenTelemetryを監視フレームワークとして導入し、AWS Lambdaの関数からDatadogにトレースを送る試行錯誤を行っています。
  • Lambda Extensionとして提供されているDatadog agentやOpenTelemetry Collectorは使用できず、OpenTelemetry SDKのみを用いてDatadogへトレースを送る方法を探っています。
  • Lambda ExtensionとしてDatadogへトレースを送るために、opentelemetry-lambdaをカスタマイズしてビルドする方法を試しています。

🔍

Defect detection in high-resolution imagery using two-stage Amazon Rekognition Custom Labe..

  • 高解像度の画像を使用した欠陥検出には、Amazon Rekognition Custom Labelsの2段階モデルを使用します。
  • 第1段階のモデルは関心領域を検出し、第2段階のモデルは関心領域内の欠陥を検出します。
  • これにより、小さな欠陥に対しても十分な解像度を維持することができます。

📸

GitHub - Dabble-Studio/3d-to-photo: 3D to Photo is an open-source package by Dabble, that ..

  • threeJSとStable Diffusionを組み合わせたオープンソースのパッケージで、製品写真のための仮想写真スタジオを構築
  • ブラウザに3Dモデルを読み込み、任意のシーンで仮想的に撮影可能
  • 製品写真の作成、合成データ生成、ゲームアセットのプレビューなどに利用可能

💡

autotab

  • 無料でAIエージェントを作成できます
  • 現実世界のタスクをAIが退屈な作業を代行します
  • 録音機能もサポートされています

🎵

Simulated Spotify Listening Experiences for Reinforcement Learning with TensorFlow and TF-..

  • SpotifyはTensorFlowとTF-Agentsを使用して強化学習(RL)を活用し、ユーザーの聴取体験を改善する方法を探っています。
  • Spotifyはオフラインのシミュレータを設計し、アイテムの推薦のための連続モデルやバニラRLエージェントを開発、トレーニング、評価しています。
  • ユーザーモデルを使用したモデルベースのRLアプローチを使用し、エージェントが実際のユーザーと対話することなくトレーニングを行っています。

💻

GitHub - david-haerer/chatapi: ChatGPT by API

  • ChatAPIはOpenAI APIを使用したフロントエンドPWAです
  • ブラウザのローカルストレージにAPIキーが保存されています
  • Alpine.jsとOpen Propsを使用し、タイピング効果には@hdsupermanさんに感謝しています

🔍

Foundation Model Transparency Index

  • 基盤モデルの透明性を評価するための「Foundation Model Transparency Index」が導入されました。
  • この指標は、基盤モデルの構築や使用に関する透明性を100の指標で評価します。
  • 最高得点は100点中54点で、平均得点は37%であり、透明性の不足が明らかになっています。

🎨

AIで作った女の子のイラストが凄い不安になる「AIは物理を理解しているわけではない」 - Togette..

  • AIが作成した女の子のイラストが不安を感じさせる
  • AIは物理を理解していないことが明らかに
  • AIの制約と能力についての理解が深まる

🎉

Announcing Rekogniton Custom Moderation: Enhance accuracy of pre-trained Rekognition moder..

  • Amazon Rekognitionのカスタムモデレーション機能が発表され、事前トレーニングされたモデレーションモデルの精度を向上させることが可能になりました。
  • カスタムモデレーション機能を使用すると、ビジネス固有のデータに対してモデレーションモデルの精度を向上させることができ、20の注釈付き画像でカスタムアダプタをトレーニングすることが可能です。
  • カスタムモデレーション機能を使用すると、機械学習の専門知識なしで、特定のモデレーションユースケースで事前トレーニングモデレーションをカスタマイズしてパフォーマンスを向上させることができます。

🎯

自動文字起こしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度を..

  • Whisper APIとAmazon Transcribeの音声文字起こしサービスの精度を比較
  • Whisper APIは精度が高いが句読点やスペースの問題がある
  • Amazon Transcribeは読みやすいが一部の音声内容や単語の変換に誤りがある

2023年10月20日

|

このサイトについて

/

ニュースレター

/

@AINewsDev