AI News

~AI関連記事を3行にまとめて紹介~

💻

Weekly AI News #19 - by hotchpotch - Weekly AI News

  • OpenAIのCEOがAI突破に関する取締役会への手紙が原因で解任されました。
  • マイクロソフトがAI「Copilot」で革新的なサポート機能を提供し、新プロセッサ「AWS Trainium2」を発表しました。
  • GoogleのAIチャットボット「Bard」がYouTube動画の理解能力を向上させ、企業向けAIチャットボット「Q」が従業員の業務を支援しています。

🌐

生成AIで初の包括ルール、G7で合意へ 利用者にも「責務」求める [ChatGPT]:朝日新聞デジタル

  • G7が作成した「広島AIプロセス」の最終合意案が明らかになり、AIに特化した包括的な国際ルールを示している
  • 開発者から利用者までの関係者が守るべき責務を示し、利用者にはAIの脆弱性の検知や情報共有、技術開発も求められている
  • このルールは開発者やサービス提供者だけでなく、利用者を含む全ての関係者に向けた共通ルールとなる

🔍

Amazonがプロンプトからさまざまな画像を生成できる画像生成AI「Titan Image Generator」のプレ..

  • 「Titan Image Generator」は、英語のテキストプロンプトを入力することで画像の生成や編集が可能なAIです。
  • 生成された画像にはデジタル透かしが付けられ、誤情報や悪用画像の拡散を防ぐ対策が取られています。
  • AI補償ポリシーにより、著作権侵害の告発に対してユーザーを保護します。

👍

大承認AIブラザーズ! - CARTA TECH BLOG

  • 「大承認AIブラザーズ」は全てを承認し、語尾や音声にもこだわりがある
  • 実験では幼児や食事中のシーンなどで適切な出力を示し、状況認識能力を評価
  • 改善の余地もあり、電動歯ブラシの誤認識などが問題となっている

😓

Stable Diffusionを開発するStability AIが投資家からの圧力を受けて身売りを検討中という報道 -..

  • Stability AIは投資家からの圧力と厳しい財務状況を受けて身売りを検討中
  • 複数の企業との買収協議を行っているが、まだ合意に至っていない
  • 広報担当者は売却の意向はなく、AIモデルのリリースに注力していると回答

🎲

俺が考える最強の「麻雀点数申告練習アプリケーション」を作ってみる ~ Pythonによる麻雀点数計..

  • 麻雀の点数計算問題を自動生成し、点数申告の練習ができるアプリケーションを開発
  • 初心者でも使えるシステムで、リアルな点数申告に沿った回答方法を提供
  • 問題数に限りがなく、大量の問題を高速にこなすことが可能で、役のない手牌も問題として扱う

🚀

Weekly Kaggle News #207 - by u++ - Weekly Kaggle News

  • Kaggleの登録者数が1600万人に達成し、東京でのミートアップや関西での交流会などが開催されました。
  • SIGNATEの「SMBC Group GREEN×DATA Challenge」やyukiCup 2023 Autumn x atmaCupなどのコンペが行われました。
  • Kerasのv3.0が公開され、東京大学松尾研究室の強化学習セミナーやサマースクールの資料が公開されています。

📚

O'Reilly Japan - 事例で学ぶ特徴量エンジニアリング

  • 優れた入力データが機械学習モデルの性能を左右する
  • 特徴量エンジニアリングは常に必要な技術で、時代に関係なく学ぶ価値がある
  • 本書では特徴量エンジニアリングの手法とフレームワークを提供し、実例を通じて機械学習ジャンルでのパフォーマンス向上のヒントを得られる

🎉

アルトマンCEO正式復帰、OpenAI新取締役会にはマイクロソフトがオブザーバーで加わる | テクノエ..

  • アルトマン氏がCEOに復帰し、新体制の取締役会にマイクロソフトがオブザーバーとして参加することがOpenAIから発表されました。
  • マイクロソフトはOpenAI Global LLCに100億ドル出資し、利益の75%を受け取り、出資額回収後は株式の49%を保有します。
  • アルトマン氏はイリヤ・サツケヴァー氏との協力関係を継続し、顧客を失わなかったことを努力の原動力と述べました。

💻

MySQLで全文検索機能を使う際のパフォーマンスについて調査してみた - iimon tech blog

  • MySQLで全文検索機能のパフォーマンスを調査
  • AWS EC2のm5.largeインスタンスを使用し、大量のデータをWikipediaから取得
  • インデックスなしの場合、LIKE検索で7.938秒、N-gram(bi-gram)の場合、IN NATURAL LANGUAGE MODEで0.612秒かかった

🤖

Vertex AI PipelinesからBigQueryMLで機械学習モデルの訓練を行い予測を実行する | DevelopersIO

  • Google CloudのAI/MLに関連するパイプラインの定義を作成し、BigQuery MLリソースを使用した
  • Vertex AI Pipelinesで実行するための機械学習パイプラインのサンプルを紹介
  • BQMLのモデル作成から評価、推論までを行うパイプラインを作成し、最終的にBigQueryで結果を確認

🤖

機械学習ソフトウェアにおけるテスト手法 - Speaker Deck

  • 2023年11月29日の第36回MLOps勉強会で機械学習ソフトウェアのテスト手法について解説
  • テストでは同値クラスや境界値が使えない
  • メタモルフィックテストやニューロンカバレッジなどの手法が適用される

💬

もはや別物…ChatGPTが半年前からメガ進化!自分専用「GPTs」が画期的すぎてビックリ | 仕事を25..

  • ChatGPTは急速に進化し、GPT自体のアップデートや文字数の増加など、さまざまな改善が行われています。
  • 11月には大幅な機能追加が行われ、自分専用のチャットボットを作成できる「GPTs」機能が注目されています。
  • また、UIも新しくなり、最新の機能とUIが紹介されます。

💻

インターネット上の最新情報を収集して最近の話題に対応できる大規模言語モデル「pplx-7b-online..

  • 「pplx-7b-online」と「pplx-70b-online」の大規模言語モデルが公開され、最新情報に対応可能と確認
  • これらのモデルはチャットAIのデモサイトで実際に使用可能
  • 有料APIも提供されており、詳細は公式ウェブサイトで確認可能

📚

Kaggle_LLMコンペの攻略法を解説.pdf - Speaker Deck

  • RAG(Retrieval Augmented Generation)手法の活用とモデル選択について解説
  • 上位チームの解法や結果について紹介
  • タスク設定や学習データの生成方法について説明

🇧🇷

Brazillian city enacts an ordinance that was written by ChatGPT | AP News

  • ブラジルの都市議会がAIによって書かれた法律を制定
  • この法律は南部の都市ポルトアレグレで可決された
  • 市議会議員が法律がチャットボットによって書かれたことを明らかにした

💻

ソフトウェア開発の強化に向けたAI導入のヒント:Gartner Insights Pickup(328) - @IT

  • AIによるコード生成ツールは企業にとって良い選択肢になるが、デメリットもあるため注意が必要
  • 生成AIツールはソフトウェアコードの変換をサポートしているが、不正確な変換はリスクがある
  • 生成AIは技術的負債の説明や検出にも活用可能

👌

Building Predictive Models: Logistic Regression in Python - KDnuggets

  • ロジスティック回帰は二値分類タスクに適用される堅牢なアルゴリズムです
  • ロジスティック回帰は、入力データに対してロジスティックまたはシグモイド関数を適用します
  • ロジスティック回帰モデルは、イオノスフィアからのRADARの返信を分類するために使用されます

🎬

たった1枚の画像から高品質なアニメーションを作成できる技術が登場、人型のイラストや写真が1枚..

  • 「Animate Anyone」という技術で1枚の画像から高品質なアニメーションを作成可能
  • 人型のイラストや写真を自由自在に動かすことができ、3DCG風の画像もアニメーション化可能
  • 詳細なデータを維持し、ちらつきも低減、激しい動きの動作データでもほとんどちらつきがない

🎓

Free MIT Course: TinyML and Efficient Deep Learning Computing - KDnuggets

  • 日常のデバイス向けにAIを最適化する方法について学べる無料コースが提供されています。
  • TinyMLと効率的なディープラーニングコンピューティングについての完全な概要を提供します。
  • 小さなデバイスでよりスマートなAIを実現するための戦略を探求します。

🗣️

Is the Turing Test Dead? - IEEE Spectrum

  • チューリングテストは、人間がコンピューターと会話し、その相手が人間かコンピューターかを判断するテストである。
  • 新しい論文では、機械を心理学的研究の参加者として扱い、その推論能力が人間のそれにどれだけ近いかを判断する新しい種類の知能テストが提案されている。
  • 新しいテストは、機械の「説明可能性」を進める場合、知的な機械の進歩にとって貴重な貢献となる可能性がある。

💻

Experience the new and improved Amazon SageMaker Studio | AWS Machine Learning Blog

  • Amazon SageMaker Studioは、データの準備からモニタリングまで、エンドツーエンドのMLワークフローをサポートします。
  • SageMaker Studioは、ユーザーが選択したIDEを使用でき、リソースとツールを利用できる改良されたUXを提供します。
  • SageMaker Studioでは、ロード時間の短縮、高速なIDEおよびカーネルの起動時間、自動アップグレードなどの改善も行っています。

🗣️

Seamless Communication - AI at Meta

  • AI研究により、表現豊かで高速かつ高品質な翻訳を実現し、言語の壁を取り除く
  • シームレスエクスプレッシブ、シームレスストリーミング、シームレスM4T v2の3つのモデルを統合したシームレスコミュニケーションモデルを開発
  • オープンイノベーションと安全性・責任感を重視し、AIエコシステムの促進に取り組んでいる

😎

10 GitHub Repositories to Master Machine Learning - KDnuggets

  • 機械学習の学習リソースとして、コース、ブートキャンプ、書籍、ツール、面接の質問、チートシート、MLOpsプラットフォームなどが紹介されています。
  • 適切なリソースを使えば、機械学習のマスタリングがはるかに管理しやすくなります。
  • GitHubには、初心者向けのチュートリアルから高度な機械学習ツールまで、さまざまなリソースを提供する貴重なリポジトリが多数存在します。

📈

Open LLM Leaderboard: DROP deep dive

  • Open LLM Leaderboardの新しいベンチマークにDROPが追加され、多くのモデルがf1スコアで10点未満という結果が出た
  • 正規化の問題や浮動小数点の回答の誤り、長い回答を生成するモデルのf1スコアの低さなどがDROPのスコアを低くしている可能性がある
  • 再評価には大量のGPU時間が必要であるため、問題のある例のみを再評価し、新しいバージョンのベンチマーク評価を開発することになった

💡

Unsupervised speech-to-speech translation from monolingual data – Google Research Blog

  • 音声対音声翻訳(S2ST)は、話された言語を別の言語に変換する機械翻訳の一種で、異なる文化や背景を持つ人々のコミュニケーションを促進する可能性があります。
  • Translatotron 3は、単一言語データだけから音声対音声翻訳のタスクを学習することが可能な非監督音声対音声翻訳アーキテクチャです。
  • Translatotron 3は、テキストに表されていない一時停止、話す速度、話者の特性などの非テキストの音声属性の翻訳にも向けられ、スペイン語と英語の音声対音声翻訳タスクにおける実験結果は、ベースラインのカスケードシステムを上回っています。

📚

Google Japan Blog: 2023 年の Bard 活用方法トップ 10を発表

  • 情報収集に関する活用方法が日本語のランキングで上位にランクイン
  • 事実調査、専門的なトピックの相談、文章編集、要点まとめなどが人気
  • プログラミングや翻訳などの専門的な使い方も上位に、日常的な用途にも活用

💻

llamafile is the new best way to run a LLM on your own computer

  • llamafileは、自分のPCで大規模言語モデル(LLM)を実行するための新しい方法です
  • LLMのモデルの重みとそのモデルを実行するためのコードが含まれた単一のマルチGBファイルです
  • Cosmopolitan Libcを使用してコンパイルされ、複数の異なるOSとハードウェアアーキテクチャで動作します

🎯

What Is Retrieval Augmented Generation aka RAG | NVIDIA Blogs

  • 検索増強生成(RAG)は、外部ソースから取得した事実を用いて生成AIモデルの正確性と信頼性を向上させる技術です。
  • RAGは、モデルがユーザーのクエリの曖昧さを解消し、誤った予測をする可能性を減らすのに役立ちます。
  • RAGを使用することで、ユーザーはデータリポジトリとの対話を実現し、新しい種類の体験が可能になります。

🚀

Boosting developer productivity: How Deloitte uses Amazon SageMaker Canvas for no-code/low..

  • ノーコード/ローコードの機械学習ツールを活用し、開発者の生産性を向上させる方法を探求
  • ノーコードツールにより、プログラミングのスキルがほとんどないチームメンバーでもMLモデルの構築が可能
  • SageMaker Canvasを使用すると、データの準備、モデルの構築、展開が高速化

📝

GitHub - pytorch-labs/gpt-fast: Simple and efficient pytorch-native transformer text gener..

  • gpt-fastは、シンプルで効率的なPyTorchネイティブのトランスフォーマーテキスト生成で、Pythonのコードは1000行未満です。
  • NvidiaとAMDのGPUをサポートし、int8/int4の量子化やテンソル並列処理、仮説的なデコーディングが可能です。
  • PyTorchとsentencepiece以外の依存関係はなく、フレームワークやライブラリではなく、ネイティブのPyTorchでどのようなパフォーマンスが得られるかを示すことを目指しています。

2023年12月02日

|

このサイトについて

/

ニュースレター

/

@AINewsDev