~AI関連記事を3行にまとめて紹介~
💻
【西川和久の不定期コラム】340億パラメータのLLMは手元のPCで動く?Metaの「Code Llama 34B」を..
「Code Llama 34B」はプログラミングに特化したモデルで、パラメータ数は7B、13B、34Bが用意されている
ローカルPCで34Bを動かすために、RTX 3090を使用し、VRAMを24GBに増やした
VRAM 12GBから24GBに増やすことで、より大規模なモデルを扱うことができるようになった
📊
Weekly Kaggle News #198 - by u++ - Weekly Kaggle News
「関東Kaggler会」が23日に開催され、招待講演5件、ライトニングトーク6件が実施された
Nishikaの「生鮮野菜の価格予測2023秋」が27日に始まり、「Early Sharing Prize」が新設された
「AtCoder Heuristic Contest」での統計的手法の活用事例や、モデル圧縮と高速化を図る量子化手法などが紹介された
🎓
GitHub - sapientml/sapientml: Generative AutoML for Tabular Data
SapientMLは、既存のデータセットから学習し、新しいデータセットの予測タスクのためのパイプラインを生成するAutoML技術です。
インストールはPyPIリポジトリから、またはソースコードから行います。
生成されたパイプラインは、モデルのトレーニング、テストデータの予測、生成コードの保存などが可能です。
🔒
Google、WebサイトのコンテンツをAIトレーニングからオプトアウトするツールを提供 - ITmedia NE..
GoogleがWebパブリッシャー向けにAIモデルのトレーニングからコンテンツを除外する方法「Google-Extended」を提供開始
Google-Extendedは、コンテンツへのアクセスを制御する機能を持ち、robots.txtを介して利用可能
GoogleはプライバシーポリシーでAIのトレーニングに公開情報を利用していることを明記、OpenAIやMediumも同様の対策を実施
🔥
SEOは時代遅れになり「AIエンジン最適化」が最重要に。ビル・ゲイツ氏も注目の変革 |ビジネス+I..
SEOは時代遅れで、「AIエンジン最適化」が最重要となる
パーソナルAIアシスタントの開発競争が進行中で、勝者は未定
AIエンジン最適化はまだ完全ではないが、近い将来登場する可能性が高い
🎉
GoogleがLLMで「非構造化文書」高精度テキスト抽出するOCR『LMDX』発表。Bardを強化する可能性 |..
Googleが非構造化文書から高精度にテキストを抽出するOCR技術『LMDX』を発表
LMDXはレイアウトの柔軟性に対応し、未見のレイアウトに対しても性能低下が少ない
LMDXの潜在価値としては、サービスとの連携や大規模な言語モデルのマルチモーダル機能の向上が期待される
🎉
AWS提供の生成AIサービスが一般開放 新たにLlama 2も利用可能に - ITmedia NEWS
「Amazon Bedrock」の一般提供が開始されました
Amazon Titan、Claude 2、Jurassic-2、Stable DiffusionなどのAIをAPI経由で利用可能
新たにLlama 2のモデルにも対応予定で、Amazon CloudWatchとの連携も可能
🎨
Windows 11「ペイント」の画像生成AI「Cocreator」がInsider向けに実装開始 - PC Watch
Windows 11のペイントアプリにOpenAIの画像生成AI「DALL-E」を活用した「Cocreator」が導入されました。
Cocreatorはアートスタイルを選択し「生成」をクリックすると3つの画像が自動生成され、編集も可能です。
現時点では英語プレビュー版でのみ利用可能で、Microsoftアカウントでサインインし待機リストに参加すると利用可能になります。
💻
生成AIグラビアをグラビアカメラマンが作るとどうなる?第八回:シンプルで高機能なSDXL専用イン..
AIグラビアを作るためのツールとして、多機能なAUTOMATIC1111とその新しいインターフェースFooocusを紹介
Fooocusは簡単に使え、驚異的な絵が出力され、SDXL 1.0を使用しているためマシンリソースが増えるがGoogle Colabでも使用可能
Fooocus-MREも紹介し、より自由度の高い絵を出力でき、カフェの写真を出力した例も紹介
😎
Metaが28人の生成AIキャラクターを発表した理由。どこまでもFacebook的なAI戦略(本田雅一) | ..
Metaは開発者向けイベントMeta ConnectでAI技術やQuestシリーズを紹介
Llama 2とEmuというAIを組み合わせ、個性的なAIアシスタントを提供
AI Studioというツールを開発し、カスタムLLMの構築も可能になる予定
🤝
LeoLM: Igniting German-Language LLM Research | LAION
LeoLMは、HessianAIとの協力で訓練されたドイツ語の包括的なFoundation Language Modelsのスイートです。
LeoLMは、大規模で高品質なドイツ語のテキストコーパスで訓練され、ドイツ語とバイリンガルのチャットモデルのコレクションも提供します。
このリリースにより、ドイツのオープンソースおよび商業的なLLM研究が大幅に強化され、新たな機会が創出されます。
📞
ドコモ、電話の大量発信に対する確認機能を導入 - ケータイ Watch
音声通話の大量発信時に利用確認機能を導入
基地局の輻輳を防ぎ、通信サービスに悪影響を防止
音声ガイダンスで通話が切断される可能性を案内し、ランダムな数字の押下を求める
💪
本当にオープンソースのライセンスで利用&検証できる大規模言語モデル「Mistral 7B」が登場、「..
「Mistral 7B」は、Apache 2.0ライセンスでリリースされたオープンソースの大規模言語モデルで、自由に調整してチャットAI開発に利用可能です。
パラメーター数は73億個でありながら、「Llama 2 13B」や「Llama 1 34B」を上回る性能を持っています。
スライディング ウィンドウ アテンション(SWA)やGrouped-Query Attendance(GQA)を使用して、メモリの使用量や計算時間を削減しながら高速な推論を実現しています。
👩💻
遅延評価と機械学習
関数型プログラミングの遅延評価がプログラムのモジュール化を可能にし、生産性を高める
遅延評価を機械学習のパイプライン構築に適用した事例を紹介
遅延評価を使うと、機械学習の学習処理をうまくモジュール化できる
📚
O'Reilly Japan - Pythonではじめるオープンエンドな進化的アルゴリズム
「発散型」アルゴリズムは進化計算をベースにし、多様な解を求めることが可能なアプローチです。
本書では、発散型アルゴリズムの基礎や収束型アルゴリズムとの違いを解説しています。
さらに、NEATやCPPNなどの最新アルゴリズムについても詳しく説明しています。
😊
AWSの生成AIサービスである Amazon Bedrock がGAになったので早速使ってみた - Taste of Tech To..
Amazon BedrockはAWS上で利用可能な、大規模言語モデルの基盤モデルを提供する完全マネージド型サービスです。
Anthropic Claude V2を使用した結果、適切な返答が得られることが確認できました。
Amazon Bedrockは高精度でトークン数も多く、安価に利用できるため、多くの利点があります。
🚀
うおぉぉAmazon BedrockがついにGA!! 宇宙最速?で触ってみた - Qiita
AWSの生成系AIサービス「Amazon Bedrock」が一般公開され、シンガポールリージョンで利用可能となった
基盤モデルへのアクセスリクエストが必要で、用途申請のフォームを提出後、承認待ちとなる
プレイグラウンド機能の「Chat」では、高性能モデル「Claude v2」との対話が可能で、「Provisioned throughput」という機能も利用できる
💻
マイクロソフト、アップルにBing検索の売却を打診していた?2020年に交渉 | テクノエッジ Techno..
2009年から「Bing」を展開してきたが、2020年にアップルに売却しようとしていたと報じられている
アップルはGoogleをデフォルトの検索エンジンとして使用し、Bingに切り替えることは考えていなかった
アップルは以前、Bingを使用していたが、現在はGoogleをデフォルトとしている
🎨
人間が人間であることを出せ。表現しろ。それ以外は的確にプロンプトを書け。 | Books&Apps
画像生成AIの登場により、著作権や道徳的な問題が引き起こされている
AIの使用にはコツがあり、自分のPCのスペックも足りないため、オンラインの無料サービスを利用
AIは教科書的な情報を学習し、有用な文言を提供し、仕事のパートナーとして使える存在になっている
😮
【速報】AWSの生成AIサービスであるAmazon Bedrock がリリースされたので朝イチで触ってみた | D..
Amazon Bedrockは、AWS内で使用可能な生成AIサービスで、基盤モデルをAPIを通じて利用できる完全マネージド型サービスです。
生成AIの基盤モデルを使用してアプリケーションの構築・拡張が可能で、事前学習済み基盤モデルを拡張できます。
モデルの実行環境に関するスペック設定も可能で、オンデマンドでの実行には制限があります。
😲
ついに音声対話できるようになった ChatGPT が引くほど自然でなんか凄いし怖い「もうこれ人間じ..
ChatGPTが音声対話可能になり、その自然さに驚きの声が上がっている
Custom Instructionsを使えば、好きな俳優やアニメキャラクターとも会話可能
AIの進化により、オフラインの対面や体験が価値を持つようになる可能性がある
💻
A Comparative Overview of the Top 10 Open Source Data Science Tools in 2023 - KDnuggets
2023年のデータサイエンス分野で注目のオープンソースツールを比較
これらのツールはデータに基づく意思決定をサポート
ゲームチェンジャーとなるツールを見つけることが可能
🎥
【AIアニメ】ComfyUIでAnimateDiffをはじめよう!|Baku
「AnimateDiff」は2023年7月に公開されたオープンソースのAI動画生成ツールで、無償で利用可能です
「ComfyUI-AnimateDiff」は「ComfyUI」で使える拡張機能で、動画生成を簡単に共有できます
Google Colab Proでの導入方法や「ControleNet」を使ったワークフロー、さらに「Lineart」や「Tile」、「Vid2Vid」の機能も紹介しています
🤔
【ChatGPT】ベクトルデータベースによる企業内データの活用(RAG) - Qiita
企業はDXの一環として大規模言語モデルの活用方法を検討
LLMは学習データにない情報に対する推論ができないため、ファインチューニングやベクトルストアの活用が考えられる
ベクトルストアを使った実装サンプルを紹介
🖼️
米Microsoft、“ChatGPTの目と耳実装”の影で画像対応の生成AI「DeepSpeed-VisualChat」開発:In..
「DeepSpeed-VisualChat」は、複数枚の画像とテキストを処理できる大規模言語モデルを提案しています。
このフレームワークは、画像の視覚的特徴を捉えるシステム「MiniGPT4」を基盤としています。
新たに導入された「Multi-Modal Causal Attention Mechanism」(MMCA)は、異なる種類のデータ間の関連性を柔軟に捉えることができます。
💬
OpneAIのアルトマンCEO、ジョニー・アイブ氏と“生成AI端末”協議中との報道 孫氏が支援か - IT..
生成AIと対話する端末の開発について、元AppleのCDOジョナサン・アイブ氏と協議中
アイブ氏のデザイン会社と協力し、“AIのiPhone”を開発するベンチャーを立ち上げる計画
ソフトバンクGは10億ドル以上を投資し、孫正義CEOもこのベンチャーに参加するとされる
😉
Finetune Stable Diffusion Models with DDPO via TRL
DDPOを使用して安定した拡散モデルを微調整
TRLを通じてDDPOを活用
拡散モデルの安定性を高めるための手法
🔥
Googleが生成AIのトレーニングに自分のウェブサイトが使われないようにするオプションを発表、も..
Googleが新オプション「Google-Extended」を発表、生成AIモデルのトレーニングにウェブサイトが使われないよう設定可能に
ウェブサイト運営者はrobots.txtファイルに設定を追加し、利用を制御できる
GoogleはAIの原則と消費者プライバシーを重視し、透明性とコントロールを提供するためにこのオプションを導入
🎉
ChatGPT、ネットで調べて最新情報を答える機能が復活 - PC Watch
ChatGPTがネットで最新情報を提供する機能を復活
ChatGPT PlusおよびEnterpriseのユーザー向けに最新情報を取得して回答に反映する機能を提供開始
ChatGPTはBingを通じて最新情報を検索し、回答に反映することができる
🐍
Getting Started with PyTorch in 5 Steps - KDnuggets
PyTorchとその高レベルラッパーであるPyTorch Lightningを使用した機械学習の詳細な紹介が提供されています。
PyTorchはPythonをベースにしたオープンソースの機械学習フレームワークで、PyTorch LightningはPyTorchの上に構築された軽量なラッパーです。
PyTorchとLightningのインストールからモデルの構築までの手順が詳しく説明されています。
🧠
Ethics and Society Newsletter #5: Hugging Face Goes To Washington and Other Summer 2023 Mu..
AIの倫理は価値観と関係があり、透明性、安全性、公正さなどの価値観の語彙と、それらの優先順位を決めるための枠組みを提供します。
AIの価値観についての理解をEU、UK、USの立法者に伝え、AI規制の未来を形作るのに役立ちました。
AIの透明性、公正さ、安全性などについての議論を公開し、AIの世界で起こっていることを説明するためにジャーナリストとの対話を行いました。
💡
RealFill
生成画像の進歩により、アウトペインティングとインペインティングモデルが登場しましたが、これらのモデルは真のシーンに関する十分な文脈を持っていません。
新しい生成的アプローチ「RealFill」は、画像の欠落した領域を本来あるべきコンテンツで埋めるためのものです。
RealFillは、視覚的に魅力的なコンテンツで対象の画像を完成させ、オリジナルのシーンに忠実で、既存の手法を大幅に上回る性能を示しました。
🎓
Building the Foundation Model Ops Platform — with Raza Habib of Humanloop
Foundation Model Opsプラットフォームを構築中
AIアプリがプレイグラウンドから本番環境に移行する際の評価とフィードバックのステージについて語る
GPT-4が愚かになったかどうかについても触れる
🛰️
Build a crop segmentation machine learning model with Planet data and Amazon SageMaker geo..
Planetの衛星データとAmazon SageMakerの地理空間機能を組み合わせて作物のセグメンテーション機械学習モデルを構築
作物のセグメンテーションは、衛星画像を類似した作物の特徴を持つピクセルまたはセグメントの領域に分割するプロセス
作物領域の識別は、農業に関する洞察を得るための基本的なステップであり、地理空間データとMLの組み合わせにより、意思決定と行動を促す洞察を得ることができる
🎉
AWS上で生成AIを使用するためのツール「Amazon Bedrock」が正式リリースへ、日本語を話せるClaud..
生成AIを利用するためのツールが正式リリースされ、日本語を話せるAIや画像生成AIが利用可能に
サーバーレスで生成AIを利用でき、利用状況やAPIの状況を監視可能
利用料金はモデルごとに設定され、用途に合わせて選定可能
🔥
ChatGPTの10ヶ月と開発トレンドの現在地 - Speaker Deck
9/28のイベントで「ChatGPTの10ヶ月と開発トレンドの現在地」の登壇資料を公開
Prompt Engineering、RAG開発、Plugin開発、GPT-Vの登場についてまとめ
生成AI時代のこれからについても触れています
2023年09月30日
|
2023年09月28日
このサイトについて
/
ニュースレター
/
@AINewsDev