AI News

~AI関連記事を3行にまとめて紹介~

😱

学生が発表したレジュメが全編が生成AIを使ったもので特に参考文献の書籍がすべて捏造だったこと..

  • 学生が発表したレジュメは全編がAIによって生成され、参考文献の書籍が全て捏造だった
  • AIを使わずに自分で考えることの大切さを再認識した
  • AIが生成した文書は見分けがつくものの、不気味な感じがある

🤖

画像生成AIに“AIが作った画像”を学習させ続けると? “品質や多様性が悪化” 「モデル自食症..

  • AIが生成した画像を用いて別の生成モデルが学習すると、品質や多様性が低下することが明らかになった
  • この状態を「モデル自食症」と呼び、合成データの利用には注意が必要とされている
  • 良好な学習のためには、実画像データを多く使用し、合成データは選別して使用することが重要とされている

🚫

OpenAI、テキスト生成主が人間かAIかを判定するツールを取り下げ 「精度が低いため」 - ITmedia..

  • AI分類器の利用停止を発表、理由は「精度が低いため」
  • AI生成テキストを誤って人間が書いたと判定したのは9%
  • 精度改善に取り組み、再公開の可能性もあり、AI生成のオーディオやビジュアルの理解可能性にも取り組んでいる

💻

「もっともらしいウソ」をなくした“信頼できる”AI、Google「CoDoC」開発 医療診断に活用:Inn..

  • Google DeepMindやGoogle Researchの研究者らが「医療画像をAIと人のどちらが診断した方が良いかを判断するAIツール」を提案
  • 提案されたAIシステム「CoDoC」は、医療画像を最も正確に解釈するために、予測AIツールに頼るべきか、医師に委ねるべきかを学習する
  • CoDoCは胸部X線やマンモグラムなどの医療画像を解釈し、既存のAIシステムと組み合わせて動作し、精度が向上することが示されている

💡

グーグルの医療AI「Med-PaLM」開発に見るプロンプトエンジニアリングの重要性 - ZDNET Japan

  • 医療分野でのAIの応用事例では、言語の使用が課題となっている
  • 「Med-PaLM」は医療関連の質問に回答できる大規模言語モデルで、検索エンジンのデータセットも含まれている
  • AIの回答を改善するための「プロンプトエンジニアリング」の重要性が強調されている

🤖

AIに“役”を奪われる──ハリウッドの俳優組合がストライキ AIに危機感強める俳優や脚本家たち..

  • ハリウッドの俳優組合がAIの使用による存亡の危機を感じ、ストライキを開始
  • 映画やドラマの制作が中断し、声優もAIによる音声合成で置き換えられる可能性がある
  • 組合はAIの使用に関する保護策の拡大を求めているが、結末はまだ見えていない

💪

AWS Reaffirms its Commitment to Responsible Generative AI | AWS Machine Learning Blog

  • 生成型AIの開発と展開に取り組むため、専門の責任あるAIの専門家チームとエンジニアリング・開発組織を補完して製品とサービスを継続的にテスト、評価しています。
  • 新たな課題に対処するための新しいアプローチと解決策を開発するために他の人々と協力して取り組んでいます。
  • 生成型AIによって引き起こされる独特の課題に対処するために、政策立案者、学者、市民社会との知識共有に積極的に取り組んでいます。

🔍

Prompt Flowの一括テストを使ってRAGの複数回答を自動評価する - Taste of Tech Topics

  • RAGの回答を自動評価するためにPrompt Flowを使用して複数回答を検証
  • CSVファイルを使用して一括テストを実行し、評価結果を確認
  • Prompt Flowを使用することで、会話履歴のファイルから自動で評価結果を集計

🔑

技術の鍵は「トランスフォーマー」と「自己教師あり学習」 松尾豊氏が、第3次AIブームからひも..

  • 人工知能の研究者である松尾豊氏は、生成AIの重要な技術としてトランスフォーマーと自己教師あり学習を挙げています。
  • パラメーターを大きくすると性能が上がるというスケール則が存在し、これは統計や機械学習のパラダイムとは異なる現象です。
  • 松尾氏は日本ディープラーニング協会の創設者であり、「新しい資本主義実現会議」の有識者構成員、AI戦略会議の座長も務めています。

📚

O'Reilly Japan - Pythonによるデータ分析入門 第3版

  • Pythonは数学・科学計算用ライブラリが充実しており、様々な分野で利用されています。
  • 本書はPythonのデータ分析ツール、pandasの基本を網羅しています。
  • サンプルコードはダウンロード可能で、Jupyter Notebookで対話的に試すことができます。

👀

OpenAIが20億人登録目指す暗号資産「ワールドコイン」の全貌(Forbes JAPAN) - Yahoo!ニュース

  • 開発者が提供する「ワールドコイン」は、ユーザーが「ワールドID」を取得し、専用機器で目の虹彩をスキャンすることで本人確認を行います
  • ワールドIDを持つユーザーはワールドコインを使って決済や送金、デジタル資産の購入が可能です
  • ワールドコインはベータ版で200万人以上のユーザーを集め、今後は35都市で虹彩のスキャンを強化する予定です

💻

GitHub - ghmagazine/llm-book: 「大規模言語モデル入門」(技術評論社, 2023)のGitHubリポジト..

  • 「大規模言語モデル入門」のコードはGoogle Colaboratoryで動作確認済み
  • Hugging Face Hubでデータセットとモデルが公開
  • 章や節ごとのコードへのリンクも提供

🚀

OpenAI、Android版ChatGPT公式アプリ配信開始。日本向けは事前登録中 | テクノエッジ TechnoEdge

  • ChatGPTのAndroid版がリリースされ、米国、インド、バングラデシュ、ブラジルでダウンロード可能
  • 日本ではまだ利用できず、iOS版も1週間遅れでのリリース
  • ChatGPT Plusに加入すればGPT-4を選択したり、応答速度の向上やベータ機能へのアクセスなどの特典が利用できる

📺

ニュースの見出しを読み上げるAIキャスターがインドで登場 - CNET Japan

  • インドのニュースチャンネルではAIキャスター「Lisa」と「Sana」が試用されています。
  • これらのキャスターは人間らしさを持たせるために開発され、不気味の谷現象を引き起こすこともあります。
  • 「Sana」は討論にも参加できるようにトレーニングされており、人間のキャスターを補佐するために追加されました。

🚀

Text Embedding と LSH を用いた高速商品バリアント判定|Tatsuya Shirakawa

  • 商品バリアントの特定には、Text EmbeddingモデルとLSHを使用し、バリアントIDを生成
  • バリアントIDの生成アルゴリズムはLSHを使用し、商品のタイトル情報をEmbeddingsに変換、LSHにより量子化
  • このアルゴリズムは高速かつ軽量であり、実用的

📝

「大学教育における生成AIの活用に向けたチェックリスト〔第1版〕」の公表について | 一般社団..

  • 2023年07月24日、文部科学省は大学・高専における生成AIの教学面の取扱いを通知し、新たな課題となっていることを示した
  • 私大連は、生成AIの導入に関する重要な項目を整理し、チェックリストを作成した
  • このチェックリストは各大学や教員に検討を促す目的で作成され、技術の進化に伴い情報の更新が必要とされている

🔚

OpenAIがAI生成の文章かどうか判別するツールを「精度が低い」という理由でこっそり終了 - GIGAZ..

  • OpenAIが「AI Text Classifier」を終了しました
  • 精度が低いという理由で終了
  • 今後は音声や画像の判別、AIの安全性強化に注力

💻

機械学習を「社会実装」するということ 2023年7月版 / Social Implementation of Machine Learni..

  • 機械学習の社会実装には罠が存在する
  • その解決方法について考察する
  • 生成AIの進化が進む中で何ができるかを盛り込む

💾

3D-LLM:大規模言語モデルに3D世界を注入する新たな試み | AIDB

  • 大規模言語モデルはテキスト情報のみを扱うため、3D情報の理解には限界がある
  • 新たな手法である3D-LLMは、3D情報を大規模言語モデルに注入し、3D関連タスクを実行することが可能
  • 3D-LLMはキャプショニングや質問応答、タスク分解、グラウンディング、アシスト対話、ナビゲーションなどのタスクに高い性能を示すが、課題も残されている

💻

Apps Scriptではじめる🤖Google Chatアプリ開発ガイド - BIGLOBE Style | BIGLOBEの「はたら..

  • Google Chatを便利に使うChatアプリをGoogle Apps Scriptで作成します。
  • オウム返しからメンバーのシャッフルへと段階的に機能を追加します。
  • Google Cloudプロジェクトの作成やChat APIの有効化、OAuth同意画面の構成などを行い、公式チュートリアルに従ってアプリを作成します。

💻

Llama.cpp + Metal による Llama 2 の高速実行を試す|npaka

  • 「Llama.cpp」+「Metal」で「Llama 2」の高速実行を試行
  • CPUと同等の結果だが、解決策が見つかる可能性もある
  • Llama.cppのオプションやビルドツールの準備、実行手順、パラメータや結果の確認方法を説明

😎

走行動画を説明するLLMを作成し、80台のGPUで分散並列学習させた話

  • LLM分散学習ハッカソンで動画からテキスト生成するVideoBLIPを開発
  • 運転映像に対する説明文を学習し、運転状況を理解するモデルを作成
  • マルチノードでの分散学習を行い、ABCIのGPU80台を使用して計算速度を20倍に高速化

🎉

Frontier Model Forum

  • フロンティアAIモデルの安全かつ責任ある開発を目指す業界団体が設立されました
  • AI安全研究の推進、ベストプラクティスの特定、知識共有、社会課題への取り組みを目標としています
  • 諮問委員会を設置し、他のフロンティアAIモデル開発組織の参加も歓迎しています

🧠

Clustering Unleashed: Understanding K-Means Clustering - KDnuggets

  • K-Meansクラスタリングアルゴリズムは、非教師あり学習を行い、隠れたパターンを見つけ出し、意味のある洞察を抽出するための強力なツールです。
  • K-Meansクラスタリングは、顧客セグメンテーション、ドキュメントクラスタリング、推薦エンジンなど、多くの産業用途で使用されます。
  • Pythonを使用したK-Meansクラスタリングの実装方法について、必要なライブラリのインポートからデータセットの読み込み、散布図の作成、Kの最適な値の見つけ方まで詳しく説明します。

🚀

プレ・シンギュラリティ、もう始まってない?|shi3z

  • 毎日AIニュースを追いかけていると、波がある。
  • AIがAIを設計し、改良し続ける「シンギュラリティ」の定義には、今のAIは人間も考えているが、実はAIがAIを設計している部分も増えている。
  • 「AIを作るAIの作り方を考える」ことの方が面白くなる必要がある。

🎓

ASCII.jp:東大発スタートアップ、67億パラメーターの日本語LLMをOSSで公開

  • 東京大学発のスタートアップが67億パラメーターの日本語大規模言語モデルを開発
  • 開発したモデルはオープンソース・ソフトウェアとして公開、ライセンスはApache 2.0
  • 業界用語や専門用語に合わせて訓練・調整し、異なる要望に応じるサービスを提供予定

💻

ChatGPT Code Interpreterできること - Qiita

  • ChatGPTの公式プラグイン「Code Interpreter」を使うと、Pythonのコードの実行やファイルのアップロード・ダウンロードが可能です。
  • 論文の内容のまとめやWord Cloudの生成、ソースコードの表示などができます。
  • AIは会社戦略や経営提案、問題発見などの分野で役立つとされています。

🎓

MIT Tech Review: 東大発スタートアップ、67億パラメーターの日本語LLMをOSSで公開

  • 東大発のスタートアップが日本語LLMを公開
  • 67億パラメーターの大規模言語モデルを法人向けに提供
  • 自社サービスの提供も予定

💻

Automating Web Research

  • ウェブリサーチエージェントの構築を試み、比較的シンプルなリトリーバーが効果的で簡単に設定可能であることがわかった
  • リトリーバーは、複数の関連する検索クエリを生成し、各クエリに対して検索を実行し、上位K件のリンクを選択し、選択されたすべてのリンクから情報を読み込む
  • リトリーバーは、プライバシー(外部にデータを共有せずにローカルで実行できる)、設定可能性(特定のオープンソースコンポーネントを選択できる)、可観測性(LangSmithなどのツールを使用して「内部」で何が起こっているかを覗くことができる)などのメリットを持つ

💡

AzureでGPT活用するためのシステムの参考アーキテクチャ “金太郎飴的に複製できる”管理構成の..

  • AIネイティブなアーキテクチャが今後登場する予定
  • チャットボット開発では音声入力や入力補完の工夫、コンテンツフィルタリングの使用が考えられる
  • 翻訳や検索エンジンの利用、キーワード抽出や固有表現抽出なども有効

👀

AI Policy @🤗: Open ML Considerations in the EU AI Act

  • EU AI法に対する注目とその影響を共有し、オープンなML開発の役割についての経験を共有することを目指しています。
  • 開発者コミュニティの支援により、オープンな開発がもたらすイノベーションと多様性を体験しています。
  • EU AI法が最終段階に向かうにつれて、オープンソースのMLシステムの開発の特定のニーズと強みを考慮することが重要と考えています。

🎬

As Actors Strike for AI Protections, Netflix Lists $900,000 AI Job

  • ハリウッドの俳優と脚本家の労働組合がAIの使用に対する規制と給与改善を求めてストライキを行っています。
  • NetflixはAIプロダクトマネージャーに最大90万ドルの報酬を提供しており、AIがコンテンツ制作にも活用されていることが求人広告から明らかになりました。
  • ストライキ中の俳優は、AIによるスキャンされた肖像権が適切な報酬なしで操作されることに対する保護を求めています。

💻

Maximize Stable Diffusion performance and lower inference costs with AWS Inferentia2 | AWS..

  • 安定した拡散モデルは、テキストプロンプトに基づいて高品質な画像を生成する能力があります
  • AWS Neuronを使用してモデルをコンパイルし、Inf2インスタンスにデプロイする手順を紹介します
  • Amazon SageMakerを使用して安定した拡散モデルをInf2インスタンスにデプロイする方法も紹介します

💡

AWS offers new artificial intelligence, machine learning, and generative AI guides to plan..

  • AI、ML、生成AIのガイドを提供し、AI戦略を計画するための新しいガイドを提供
  • AI、ML、生成AIのためのクラウド採用フレームワーク(CAF-AI)と、機械学習の意思決定ガイドであるGetting Started Resource Centerを公開
  • CAF-AIは、AIの旅をナビゲートし、ビジネス価値を生み出す組織のためのメンタルモデルを提供

🔧

Tuning and Testing Llama 2, FLAN-T5, and GPT-J with LoRA, Sematic, and Gradio

  • LORA、Sematic、Gradioを用いて、Llama 2、FLAN-T5、GPT-Jのチューニングとテストを行う
  • 大規模な言語モデルとそれに関連する技術の急速な発展に伴い、オープンソースのモデル、ライブラリ、ツールも増加
  • 学ぶ最良の方法の1つは、例を通じて目標を設定し、それを達成するために必要なものを見ること

📚

Unlock the Power of AI – A Special Release by KDnuggets and Machine Learning Mastery - KD..

  • 新しい電子書籍「ChatGPTを活用した生産性の最大化」がリリースされました。
  • この電子書籍は、ChatGPTの理解、対話、活用に焦点を当てています。
  • 早期割引コード「20offearlybird」を使用すると、20%の割引が適用されます。

😉

🤗 Fine-tuned Image Model... | LastMile AI

  • Hugging Faceによる画像モデルがファインチューニングされました
  • クイックスタートのためのヒントが提供されています
  • 始めるためのガイドが用意されています

🎓

KDnuggets News, July 26: Free Generative AI Training from Google • Data Engineering Begin..

  • Googleから無料の生成AI学習パスが提供されています。
  • データエンジニアリングの初心者ガイドが公開されました。
  • GPT-Engineerという新しいAIコーディングアシスタントが登場しました。

💪

lightblue/japanese-mpt-7b Β· Hugging Face

  • mC4データセットの日本語サブセットを使用し、MPT 7bチェックポイントの上で3000ステップでトレーニングされた
  • GPUに収まるように低い精度でモデルをロードする必要があり、8ビットや4ビットでのロードが可能
  • 先月のダウンロード数は2,273で、オンデマンドでInference APIにロード可能

✍️

なぜ今、コード品質が求められるのか? ChatGPT時代を生き残るためのエンジニアの基礎スキル (1/..

  • ChatGPT時代の生き残り戦略は、人間のエンジニアが高品質なコードを書くことが重要
  • 生成AIはまだ力不足であり、セキュリティ脆弱性も多いため、人間のエンジニアが主役となる
  • 生成AIの強みを活かしつつ、高速なプロトタイピングを行い、高品質なコードを書くことが生き残りの鍵

👊

実験を高速化する機械学習パイプライン開発の挑戦 - ABEJA Tech Blog

  • 機械学習パイプラインライブラリを個人で開発
  • 既存のパイプラインライブラリの課題を解決
  • scikit-learnライクにタスクを定義し、PyTorchライクに繋げる

🚀

Stability AI releases its latest image-generating model, Stable Diffusion XL 1.0 | TechCru..

  • 新型AIモデル「Stable Diffusion XL 1.0」がリリースされ、より鮮やかな色彩と正確な色合い、影、照明を提供し、前モデルと比べてコントラストが向上しているとされています。
  • Stable Diffusion XL 1.0は、35億のパラメータを含み、秒単位でフル1メガピクセルの解像度の画像を生成することが可能で、カスタマイズ可能なモデルとしてコンセプトやスタイルの微調整に対応できます。
  • Stable Diffusion XL 1.0は、テキスト生成の領域でも改善されており、高度なテキスト生成と可読性が可能で、オープンソース版は悪意のある行為者が非同意のディープフェイクなどの有害なコンテンツを生成するために使用する可能性があります。

🧠

In search of a generalizable method for source-free domain adaptation – Google Research B..

  • 深層学習は多くの問題やアプリケーションで進歩を遂げているが、未知のドメインでの展開は困難
  • モデルが予測不可能に失敗することがよくある
  • ソースフリードメイン適応(SFDA)は、事前にトレーニングされたモデルを新しいドメインに適応させる研究領域

🔥

大規模言語モデル時代のHuman-in-the-Loop機械学習 - Speaker Deck

  • 大規模言語モデル時代におけるHuman-in-the-Loop機械学習についての講演
  • 画像認識・理解シンポジウム(MIRU2023)でのチュートリアル
  • 最新の機械学習技術と人間の役割について深く掘り下げる

🖼️

Stability AI Announces Stable Diffusion XL 1.0, Featured on Amazon Bedrock — Stability AI

  • 最新のテキストから画像へのモデル「Stable Diffusion XL(SDXL)1.0」がリリースされました
  • SDXL 1.0は、鮮やかで正確な色、良好なコントラスト、照明、影を生成し、秒速で1メガピクセルの画像を生成します
  • SDXL 1.0はAmazon SageMaker JumpStartでも利用可能で、アルゴリズム、モデル、機械学習ソリューションにすばやくアクセスできます

🇪🇺

EleutherAI's Thoughts on the EU AI Act | EleutherAI Blog

  • 欧州議会がAIに関する包括的な法律の立場を採択し、年末までに最終的に採択予定
  • 大規模AIシステムに関する規制については透明性と文書化への重点、トレーニングデータの適合性評価などが含まれる
  • 現行のテキストでは非営利団体やオープンソース、コミュニティ主導の研究に大きな負担をかける可能性がある

💡

Use Stable Diffusion XL with Amazon SageMaker JumpStart in Amazon SageMaker Studio | AWS M..

  • Stable Diffusion XL 1.0(SDXL 1.0)がAmazon SageMaker JumpStartを通じて提供開始
  • SDXL 1.0は、高解像度の写真のような写実的な画像生成が可能
  • SDXL 1.0は、マーケティング、デザイン、画像生成など、さまざまな業界のユースケースで使用可能

💻

Google Colab で SD-XL 1.0を試す|npaka

  • 「Google Colab」で「SD-XL 1.0」を試用し、1024x1024の画像を40秒で生成
  • 実行手順は新規ノートブック開始からGPU選択、パッケージインストール、パイプライン準備、画像生成まで
  • 記事が気に入ったら、クリエイターの支援と記事のオススメが可能

🤖

Microsoft、日本政府にChatGPT技術提供 答弁案に活用 - 日本経済新聞

  • 対話型AI「ChatGPT」の技術がデジタル庁に提供される
  • 国会答弁や議事録作成などで活用し、デジタル化を進める
  • デジタル庁は3億円を投じ、1年間利用する方針

💪

Google Japan Blog: 大胆かつ責任ある AI への共同の取り組み

  • AIの開発における責任ある実践に向けた共同の取り組みに参加
  • 社会の重要課題を解決し、安心で安全なAIシステムを推進
  • 他のAI企業と協力して責任あるAIを共に構築し、情報とベストプラクティスを共有

📚

AIの学習データが不足する「2026年問題」 | スラド

  • AIの学習データ不足の「2026年問題」により、大規模言語モデルの開発が困難になる可能性がある
  • インターネットからの収集元は枯渇し、著作権やボット操作による問題も指摘されている
  • 合成データや他の手法で解決策を模索しているが、機械学習の進歩は減速する可能性もある

💻

ITエンジニアなのにまだ投資やってないの?ChatGPTでクオンツシステム作って儲けようぜpart3 - Q..

  • 投資思考では技術力UPは悪手で、投資やマーケを学ぶ方がROIは高い
  • ChatGPTのCode Interpreterを使ってデータサイエンスし、株価データの解析が可能
  • 投資クオンツシステムとしての実用性は低いが、個別銘柄のバックテストには十分

2023年07月27日

|

このサイトについて

/

ニュースレター

/

@AINewsDev