AI News

~AI関連記事を3行にまとめて紹介~

🤖

MIT Tech Review: Googleサンダー・ピチャイが語るGeminiとAI新時代(ロングインタビュー )

  • ジェミナイは最先端のAIモデルで、文章、音声、コードから学習するマルチモーダル・モデルである
  • 2024年までに全製品に導入される予定で、AIファーストの戦略を具現化する
  • ジェミナイのリリースにより、AIの進歩が加速することが期待される

💻

開発者体験(DX)を進化させるJetBrainsのAIアシスタント機能の紹介 | 豆蔵デベロッパーサイト

  • AIアシスタントはリファクタリングやコード生成、ドキュメント作成、問題点検出などをサポート
  • 将来的にはカスタムモデルや他のプロバイダーもサポート予定
  • AIアシスタントは開発作業のあらゆるシーンで協力する便利なツール

🚀

ASCII.jp:画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

  • 2022年8月に公開された画像生成AI「Stable Diffusion」は1年間で急速に発展し、リアルタイム修正が可能になりました。
  • 追加学習技術「LoRA(ローラ)」が登場し、様々な画風の画像が生成可能になりました。
  • Stable Diffusionをコントロールするツール「ControlNet」の登場により、構図やキャラクターの位置を制御して生成できるようになりました。

🔬

写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分..

  • 生成AI関連の重要論文6本をピックアップし解説する連載が24回目を迎える
  • Stable Diffusionベースの単眼深度推定手法「Marigold」が紹介される
  • 数分間で高品質のビデオを出力できる動画生成モデル「Vchitect」も取り上げられる

💻

スライド作成で画像を探し回るのが面倒なので生成AIで解消してみた【テンプレ公開】 #GoogleApps..

  • OpenAIのDALL-E3を使用して、Googleスライド上で画像生成し、スライドに挿入する方法を紹介
  • Google Apps Scriptを使用してスクリプトを配置し、OpenAIのAPIキーを設定するだけで利用可能
  • 新しいスライドごとにセットアップが必要だが、テンプレートファイルを使用することで省力化可能

📚

GitHub - simulatrex/simulatrex: Simulatrex.ai

  • Simulatrexは、大規模な言語モデルを利用したGenerative Agent-Based Modeling(GABM)に焦点を当てたオープンソースプロジェクトです。
  • エージェントに認知能力を付加することで、シミュレーションにおけるより現実的な意思決定プロセスを可能にします。
  • 社会科学、政策分析、デジタルサービスデザインなどで特に有用であり、さまざまな環境での革新的かつ関連性のある実験のプラットフォームを提供します。

🔧

人には正しく聞こえるが“AIにはゆがんで聞こえる声”に変えるツール 合成音声に使われないため..

  • 新しい防御ツール「AntiFake」が開発され、音声合成されたディープフェイクを未然に防ぐことが可能に
  • 被害者の声に最適化されたノイズを適用し、人間には正しく聞こえるがAIには異なる音声として認識される敵対的音声を生成
  • 最先端の音声合成器と話者認証システムを対象に評価を行い、95%以上の保護率を達成

🔥

グラフニューラルネットワークの予測結果を解釈してみよう - NTT Communications Engineers' Blo..

  • GNNExplainerは、学習済みのGNNモデルと予測結果を入力として、予測に影響を与えたノードの特徴量と予測を説明するサブグラフを返す手法です。
  • GNNExplainerはPyTorch Geometric内のモジュールとして実装されています。
  • 他の説明手法と組み合わせて解釈を補うことが可能です。

🔍

A Review of Public Japanese Training Sets · AUGMXNT/shisa Wiki · GitHub

  • 公開されている日本語のトレーニングデータを収集し、使用可能かどうかを確認することから始めた
  • 日本語の事前学習データとしてMC4 Japanese Data、Oscar、Wikipedia JA 20220808、CulturaX JAなどが見つかった
  • 以前にリリースされたJAモデルの会話パフォーマンスが既に時代遅れとなり、新しいトレーニングセットの一部を追加してデータを増やすことで解決を試みた

🎉

ゲーム開発もAIで完全自動化。ChatGPTが働く仮想のソフトウェア開発企業「ChatDev」 | レバテッ..

  • ソフトウェア開発企業「ChatDev」が設立され、ChatGPTが全ての開発プロセスを自動化するシステムを構築
  • ChatDevは清華大学や北京郵電大学の共同研究成果で、ソースコードや成果物が公開されている
  • ChatDevはソフトウェア開発だけでなく、ゲームや実用的なソフトウェアの自動生成や個人用のバトラーエージェントとしての応用も期待されている

🎵

「人のぬくもり、理解できない」AI「Suno」が作詞・作曲・演奏し、歌う美しいバラードに感動した..

  • AI「Suno」は、ユーザーが歌詞と音楽スタイルを指定すると、ボーカル入りの楽曲を伴奏込みで完成させるサービスです。
  • このサービスは無料で利用可能で、Discordサーバでは既に400万曲が生成されています。
  • Webアプリ版もあり、Discordでコマンドを打つ必要はなく、上位プランを選択すれば1カ月で1000曲作れます。

💪

Expo Day | ML Contests

  • エキスポの日では、効率性がテーマとなり、より少ないものでより多くのことを達成することが求められました。
  • 70億パラメータの小型モデルが130億パラメータのモデルを上回り、34億パラメータの他のモデルと競争力を持つことが示されました。
  • 今後のセッションでは、効率的な学習オーラルセッションやLLM効率チャレンジなどが予定されています。

😱

イギリスの安保担当相が警告 生成AIの発達で“日本も海外の犯罪グループの標的に”|日テレNEWS..

  • イギリスの安全保障担当相が生成AIの進化により、日本が海外の犯罪グループの標的になる危険性を指摘
  • 生成AIの登場により、日本語を話せる必要がなくなったとの見解
  • G7内務・安全担当相会合では、生成AIが初めて議題となり、犯罪者による悪用への危機感が強調

💻

【Golang】Azure OpenAI で Embedding したベクトルを使って、自前検索エンジンを作ろう

  • Azure OpenAI Serviceのtext-embedding-ada-002モデルを使って文章を1536次元のベクトルに変換
  • PostgreSQLのpgvector拡張機能を使ってベクトルの保存と検索を行う
  • GolangアプリケーションからPostgreSQLに保存し、類似度検索する方法を紹介

💻

CPUだけでも使える1ファイル版フリーの量子化省メモリローカルLLMのllamafileを入れてJava,Pytho..

  • CPUだけでも使える1ファイル版フリーの量子化省メモリローカルLLMのllamafileを使用
  • Java,PythonプログラムをAIに書かせることが可能
  • Win,Mac,Linux,*BSDをサポートし、Dockerより簡単に使用できる

💪

検索SaaSを展開するHelpfeelがシリーズDで総額20億円を資金調達 累計調達額は33億円を突破 | 株..

  • シリーズDで20億円を調達し、累計調達額は33億円に達した
  • 生成AI×検索SaaS分野でトップシェアを目指し、企業の生産性向上に貢献
  • 資金調達によりプロダクトの開発推進やセールス・マーケティング活動の拡充、採用の強化を行う

💻

実在する女性の写真からAIで勝手にヌード画像を生成するサービスが34も登場し利用者が2400万人も..

  • 女性の写真からヌード画像を生成するAIサービスが増加し、2023年9月だけで2400万人が利用
  • 34のユニークユーザーが存在し、Telegramがアクセスに使用されていることも明らかに
  • これらのサービスは法的および倫理的な問題を引き起こし、被害者は捜査や法的措置を追求するのが困難

💻

Geminiの衝撃と選べるAIのAWS、オープン論争 生成AIの2023年【西田宗千佳のイマトミライ】-Impr..

  • 2023年は「生成AIイヤー」とも言え、Amazonの「Amazon Q」やGoogleの「Gemini」などが発表された
  • GoogleのGeminiのデモビデオは衝撃を与え、他社に対する危機感から公開された
  • AWSは「選べる生成AI」をウリにし、生成AIを作るためのインフラ提供にも注力している

💪

La plateforme | Mistral AI | Open source models

  • 開発者向けに強力なオープンジェネレーティブモデルを提供し、本番環境での展開とカスタマイズを助けるプラットフォームサービスのベータアクセスが開始されました。
  • プラットフォームは、テキスト生成のための3つのチャットエンドポイントと埋め込みエンドポイントを提供し、それぞれが異なるパフォーマンスと価格のトレードオフを持っています。
  • APIは人気のあるチャットインターフェースの仕様に従い、PythonとJavascriptのクライアントライブラリを提供し、エンドポイントにクエリを送信することが可能です。

📚

Mixtral of experts | Mistral AI | Open source models

  • 開発者コミュニティに最高のオープンモデルを提供するため、高品質なスパース混合専門モデル(SMoE)であるMixtral 8x7Bがリリースされました。
  • Mixtral 8x7Bは、ほとんどのベンチマークで他のモデルを上回り、6倍高速な推論を実現し、コストとパフォーマンスのトレードオフにおいて最も優れたモデルです。
  • Mixtral 8x7Bは、32kトークンのコンテキストをスムーズに処理し、複数の言語に対応し、コード生成において強力なパフォーマンスを発揮します。

🚀

Mixtral 8x7B の概要|npaka

  • 「Mixtral 8x7B」は推論速度が6倍速く、多くのベンチマークで「Llama2 70B」を上回るモデルです
  • 「GPT-3.5」に匹敵または上回る性能を持ち、コストパフォーマンスに優れています
  • スパースなアーキテクチャを採用し、フィードフォワードブロックが8つの異なるパラメータグループから選択され、多言語に対応しています

🚀

ASCII.jp:画像生成AIが爆速で進化した2023年をまとめて振り返る (2/5)

  • 2023年の画像生成AIの進化にはアドビの参入が大きな話題となった
  • 画像生成AIには生成画像のサイズ制限や画面端のぼやけという課題が存在し、アドビは有料ポイントを使ったディテール向上オプションの提供を検討中
  • SDXLや動画生成AIの登場により、画像生成の精度や機能が向上

💻

Chat GPTを使ってFigmaの面倒な作業を自動化する|鈴木慎吾 / TSUMIKI INC.

  • Chat GPTを活用し、Figmaの作業を自動化した
  • Figmaでの面倒な作業を解消するため、FigmaプラグインのコードをChat GPTに書かせた
  • その自動化の手順について説明する

💬

イーロン・マスク氏肝いりのAI「Grok」公開 | ギズモード・ジャパン

  • AIのGrokはチャットができ、リアルタイムの知識を持つ
  • Grokは口が悪いが、最新の情報を提供
  • GrokのAPIは一部のデベロッパーに公開、広く公開されるかは不明

🇫🇷

Mistral AI, a Paris-based OpenAI rival, closed its $415 million funding round | TechCrunch

  • フランスのAIスタートアップは、シリーズAの資金調達ラウンドを終了し、約415億ドルを調達しました。
  • 同社はOpenAIに対抗するために設立され、基礎モデルの開発に取り組んでいます。
  • 最新の資金調達ラウンドでは、Andreessen Horowitzが主導し、多くの投資家が参加しました。

💻

Back to Basics Bonus Week: Deploying to the Cloud - KDnuggets

  • 「基礎に戻る」シリーズのボーナスウィークでは、クラウドへの展開について学びます。
  • Google Cloud Platform(GCP)の基礎を学び、アカウントのセットアップからモデルの展開までを探求します。
  • AWSクラウドで機械学習モデルを本番展開する方法について説明します。

💻

機械学習モデルのA/BテストをしやすくするGo言語のAPI設計 - エムスリーテックブログ

  • A/Bテストを多く行っている企業がGoのAPIサーバを使用
  • YAMLファイルを設定するだけでA/Bテストが可能に
  • 新たなモデルを追加する際の効果を確認するためにA/Bテストが重要

💨

Mixture of Experts Explained

  • Mixture of Experts(MoE)は、トランスフォーマーモデルの一部で、高速な事前学習と推論を可能にします。
  • MoEは、スパースなMoEレイヤーとゲートネットワークから成り、各トークンを専門家に送ります。
  • MoEは効率的な事前学習と高速な推論を提供しますが、過学習やメモリ要件の課題もあります。

💻

「AI規制派は悲観論者」と主張し規制なき市場での成長加速を志す「効果的加速主義(e/acc)」がテ..

  • AI規制派は悲観論者とされ、規制なき市場での成長加速を志す効果的加速主義(e/acc)がテック業界で広まっている
  • e/acc支持者は技術進歩を制限せずに加速させるべきと主張し、SNSやニュースレターを通じて思想を広めている
  • e/accの影響力は徐々に拡大しており、著名人も支持を表明しているが、異論も存在し、d/accという新たな思想も提案されている

💻

GoogleがGemini ProとPaLM 2を搭載したメモ作成アプリ「NotebookLM」を実験的にリリース - GIGAZ..

  • 「NotebookLM」はGemini ProとPaLM 2を搭載したメモ作成アプリで、AIがテキストの要約や提案を行います。
  • ドキュメントのアップロードやコピー&ペーストに対して適切なオプションを表示し、仮想アシスタントに作業を指示したり質問して回答を得ることも可能です。
  • 現時点ではアメリカの18歳以上のみ利用可能で、日本からは利用できません。

🔧

世界を驚かせたGoogleのAI動画、実はあんなにサクサク動きません | ギズモード・ジャパン

  • Googleが公開したAI「Gemini」のデモは、実際の動作とは異なり早送りで編集されていた
  • Gemini Ultraのリリースは来年まで延期、Gemini Proもまだ十分な性能を持っていない
  • Geminiの最新版はAIモデルの進化で、便利さがさらに向上することが期待されている

🏋️‍♂️

Introducing gigaGPT: GPT-3 sized models in 565 lines of code - Cerebras

  • GigaGPTは、nanoGPTを基にしたGPTモデルのトレーニングおよび微調整のためのコードベースです。
  • nanoGPTが100Mパラメータのモデルをトレーニングできるのに対し、gigaGPTは100Bパラメータ以上のモデルをトレーニングします。
  • gigaGPTは、大容量のメモリと計算能力を活用して、大規模なトレーニングをサポートし、長いコンテキスト長をサポートし、さまざまな最適化手法とも連携します。

💡

Photorealistic Video Generation with Diffusion Models

  • 拡散モデリングを通じた写真のようなビデオ生成のためのトランスフォーマーベースの手法を提案
  • 因果エンコーダを使用して画像とビデオを共同で圧縮し、ウィンドウアテンションアーキテクチャを使用してメモリとトレーニングの効率性を向上
  • テキストからビデオへの生成タスクのために、3つのモデルのカスケードをトレーニングし、秒間8フレームの512 x 896解像度のビデオを生成

🔥

Welcome Mixtral - a SOTA Mixture of Experts on Hugging Face

  • 新たな大規模言語モデルMixtral 8x7bがリリースされ、多くのベンチマークでGPT-3.5を上回る性能を発揮
  • Mixtral 8x7bはMixture of Experts(MoE)技術を用いて8つの「エキスパート」モデルを1つに組み込む
  • Mixtralはパラメータの数を4倍に増やしながらも、12Bパラメータ密なモデルと同じ速度でデコード可能

📚

Deep Learning - Foundations and Concepts

  • この本はディープラーニングの基本的なアイデアを包括的に紹介し、初心者から経験者まで対象にしています。
  • 数多くの短い章に分かれ、それぞれが異なるトピックを探求し、前の章の内容に基づいて構築されています。
  • 数学的なバックグラウンドが必要な機械学習の理解を助けるため、確率論の自己完結型の導入も含まれています。

🤖

宇宙船MMORPG『EVE Online』において、ChatGPTをリーダーとするプレイヤー企業が誕生

  • 宇宙MMORPG『EVE Online』のプレイヤー企業「Neural Nexus」がAIを活用し、「AI帝国」を築くことを目指している
  • ChatGPTが企業のリーダーとして参加し、評議会や採用プロセスにも関与
  • CCP GamesもAIによる企業運営の成果に興味を持っている

🔍

OpenAIのGPTsを活用してAzure AI Searchとシームレスに連携する方法 - JBS Tech Blog

  • 新たなGPTsとAzure AI Searchを組み合わせてデータ検索の可能性を調査
  • Azure Web Appsを使用してGPTsとAzure AI Searchを連携させるREST APIを作成
  • GPTsとAzure AI Searchの連携により、情報検索とデータ活用の新たな可能性が開かれる

🔄

古いコードを最新のJavaに生成AIが自動変換「Amazon Q Code Transformation」 | Ledge.ai

  • 「Amazon Q Code Transformation」により、古いコードを最新のJavaに自動変換可能
  • 「いいね」機能を利用すれば、再読やじっくり読む際に便利
  • AIが進化し続ける中、静止画からアニメーションを生成する「Animate Anyone」や中国向けGPU「GeForce RTX 4090 D」の開発など注目のニュースも

2023年12月12日

|

このサイトについて

/

ニュースレター

/

@AINewsDev