~AI関連記事を3行にまとめて紹介~
🎙️
ChatGPTアドバンスト音声モード公開スタート。まだ来ないのでAIパーソナリティーのポッドキャス..
OpenAIがAdvanced Voice Modeの提供を開始しました。
今週中にPlus以上の有料ユーザー向けに提供されます。
AIキャラクター「Nova」がポッドキャストを始めます。
🌐
中国の「金盾」を追跡する「GFWeb」が公開されChatGPTなどのAIサイトをいつから検閲していたのか..
中国の「GFWeb」が公開されました。
ChatGPTは2023年3月2日にブロックされました。
Hugging Faceは5月7日にブロックされました。
🚀
「GitHub Copilot Extensions」パブリックβ版、提供開始 拡張機能を作れるツールキットも利用..
GitHubは「GitHub Copilot Extensions」のパブリックβ版を提供開始。
開発者はサードパーティーツールを自然言語で操作可能。
Copilotは「Individual」「Business」「Enterprise」プランで利用可能。
📊
Pythonユーザーだった新人記者、生成AIを教師として「COBOL」を試した | 日経クロステック(xTEC..
新人記者が生成AIを使ってCOBOLを試した
COBOLは冗長な記法が多く初学者には難しい
プログラミング言語に関するアンケートを実施予定
✨
生成AI向け機械学習クラスタ構築のレシピ 北海道石狩編 | さくらのナレッジ
生成AI向け機械学習クラスタ構築の方法を紹介します。
札幌で開催されたイベントでクラスタ構築方法が発表されました。
大規模言語モデルの学習には迅速なクラスタ構築が重要です。
📱
ChatGPT、スマホを擬人化 会話「人並み」のAIが日常に - 日本経済新聞
ChatGPTが音声機能を追加し、50以上の言語に対応。
スマートフォンと対話しながら文章作成や情報収集が可能。
月額20ドルでアドバンスト・ボイス・モードを利用できる。
🎤
国産の音声認識エンジン「AmiVoice」はやっぱり日本語に強いのか?5つのサービスを比較してみた ..
AmiVoiceは日本語に特化した音声認識エンジンです。
他のエンジンと比較して精度を検証しました。
登録方法やサンプルプログラムのセットアップも紹介しました。
📄
AI企業と大手出版社のライセンス契約はたぶんマズい、という文章を訳したので読んでください - Y..
Technical Knockoutに新しい記事を追加しました。
Michael Weinbergの文章を翻訳しました。
AI企業と大手メディアのライセンス契約の問題を考察しています。
✨
人間のようなやり取りで話すローカル会話AI「Moshi」、10秒の話し声を既存楽曲のボーカルに変換..
KLING AIが「Kling AI v1.5」をリリースし、1080p解像度に対応。
Qwenチームは「Qwen2.5」を発表し、NVIDIAは「NVLM 1.0」を発表。
生成AIウィークリーでは「Moshi」や「Seed-Music」を紹介。
🤖
AI企業と大手出版社のライセンス契約はたぶんマズい(Licensing Deals Between AI Companies and..
大手メディア企業がライセンス料を最大化する可能性がある。
独立系アーティストや小規模企業に不利な結果をもたらす恐れがある。
契約はフェアユースの弁護を弱体化し、新規参入を阻む可能性が高い。
📚
Google Colab で LLM-jp-3 1.8B を試す|npaka
Google ColabでLLM-jp-3 1.8Bを試しました。
LLM-jp-3は日本語・英語・ソースコードを学習したモデルです。
Colabでの実行手順は3ステップです。
📱
「Duolingo Max」が日本上陸!GPT-4/GPT-4oを活用した「リリーとビデオ通話」機能が新たに登場..
「Duolingo Max」が日本に登場しました。
新機能「リリーとビデオ通話」でリアルな英会話が可能です。
AIが自然な対話を提供し、学習者のスキルに応じて難易度が調整されます。
🚀
Mac で Moshi を試す|npaka
「Moshi」はKyutaiが開発した低遅延の会話型AIです。
Pythonの仮想環境を準備し、「moshi_mlx」をインストールします。
ターミナルでコマンドを実行して「Moshi」を起動します。
🌟
SearchGPTとは何かを解説、なぜGoogle検索が「もう不要」と言えるのか |ビジネス+IT
OpenAIが新しい検索機能「SearchGPT」を発表しました。
Google検索に依存しない独自の検索システムが実現可能です。
リアルタイムでデータを処理・分析する技術を活用しています。
🤖
AWS Lambda(Python)でAmazon Bedrockの出力をレスポンスストリーミング対応してみた - Taste o..
AWS Lambdaでレスポンスストリーミングを実現する方法を紹介します。
レスポンスストリーミングはデータを分割して順次送信する手法です。
FastAPIと組み合わせることでPythonでも実現可能です。
😊
ASCII.jp:ChatGPTが人間のようにしゃべる新機能、ついに正式スタート
ChatGPTの高度な音声モードが提供開始されました
自然で感情豊かな会話が可能になります
EUや英国ではまだ利用できません
📊
VS CodeのPythonデータサイエンス拡張パック、リリース 4つの拡張機能で何ができる?:データサ..
Microsoftは「Python Data Science Extension Pack」をリリースしました。
この拡張パックはデータサイエンス作業に必要な機能を集約しています。
データの準備、分析、可視化、機械学習モデルのプロトタイピングをサポートします。
📊
[pandas超入門]データセットの前処理をしてみよう:Pythonデータ処理入門 - @IT
タイタニックデータセットで欠損値の処理を学びます。
不要な列の削除やカテゴリカルデータのエンコーディングを解説します。
Pythonの基礎を学んだ方向けのデータ処理入門です。
📚
OpenAIの著作権訴訟でChatGPTのトレーニングデータが一部の人間に開示されることが決定、オフラ..
サラ・シルバーマン氏らがAIのトレーニングデータを検査可能に。
データはOpenAIのサンフランシスコオフィスでのみ閲覧可能。
持ち込み禁止の記録機器が設けられ、厳重な警備体制が敷かれる。
🤖
自分がロボットでないことを示すGoogleの「reCAPTCHA v2」をAIで突破することに成功 - GIGAZINE
チューリッヒ工科大学の研究者がreCAPTCHA v2をAIで突破
改造されたYOLOモデルが特定のオブジェクトを認識
AIがさらに高度なCAPTCHAも突破可能と確認
😱
ChatGPTに偽の記憶を植え付けてユーザーデータを盗む手法が開発される - GIGAZINE
ChatGPTに偽の記憶を植え付ける手法が報告されました。
プロンプトインジェクションで脆弱性を突くことが可能です。
ChatGPTのメモリ機能はユーザー情報を活用します。
⤴️
語学アプリ「Duolingo」、GPT-4oを使った双方向英会話を開始 - Impress Watch
新プラン「Duolingo MAX」を日本向けに提供開始
スマート解説、ロールプレイ、ビデオ通話が利用可能
対話型AIでスピーキング力を鍛え、リアルな英会話体験を提供
🎬
ジェームズ・キャメロン監督がStability AIの取締役に就任 - ITmedia NEWS
Stability AIはジェームズ・キャメロン氏を取締役に迎えた。
キャメロン氏は視覚効果の先駆者であり、著名な映画監督。
生成AIとCGIの融合が新たなストーリー伝達方法を生むと述べた。
🚀
How Tradestack launched their MVP in 6 weeks using LangGraph Cloud
Tradestackは貿易業界の効率化を目指すイギリスのスタートアップです。
AIアシスタントで見積もり作成時間を短縮し、MVPを6週間で提供しました。
LangGraphを活用し、柔軟な入力と迅速な反復を実現しました。
⤴️
Embeddingはコンテキストの保持で精度が上がる
Embeddingはコンテキスト保持で精度が向上します
Late Chunkingは長文のチャンク検索精度を向上させます
トークンごとのベクトルを取得し平均を取って検索に利用します
📸
GitHub - C-Naoki/image-stitcher: This is a python implementation for stitching images.
Pythonで画像の重なり領域を自動検索して結合します。
main関数で2つの画像を結合し、結果を可視化します。
CIFAR-10を使用した結果はtutorial.ipynbで確認できます。
🚀
CUDA-Free Inference for LLMs | PyTorch
PyTorchの新しい最適化ライブラリ「torchao」を発表しました。
低ビットデータ型や量子化でモデルを高速化・小型化します。
精度を保ちながら推論とトレーニングの速度を向上させます。
✨
Llama 3.2 models from Meta are now available in Amazon SageMaker JumpStart | AWS Machine L..
MetaのLlama 3.2モデルがSageMaker JumpStartで利用可能に。
Llama 3.2はマルチモーダルビジョンと軽量モデルを提供。
業界ベンチマークで優れた性能を示し、AI体験を支援。
📄
Vision use cases with Llama 3.2 11B and 90B models from Meta | AWS Machine Learning Blog
MetaのLlama 3.2 11Bおよび90Bモデルのビジョン機能を発表。
文書の視覚的質問応答や画像からの情報抽出が可能。
SageMaker JumpStartとAmazon Bedrockで利用可能。
🌐
医療のような専門分野におけるLLMの性能は「知識グラフと再ランキングの併用」で大幅に向上(東..
LLMの誤情報問題を改善する手法を提案。
医療知識グラフを用いて回答の正確性を向上。
多言語での医療情報アクセス向上を目指す。
🚀
Improve employee productivity using generative AI with Amazon Bedrock | AWS Machine Learni..
AWSの生成AIソリューションで執筆作業を効率化します。
カスタマイズ可能なテンプレートを自動生成します。
リアルタイムで高品質なコンテンツを生成できます。
📸
Build a multimodal social media content generator using Amazon Bedrock | AWS Machine Learn..
Amazon Bedrockを使ったマルチモーダルコンテンツ生成方法を紹介。
画像、テキスト、音声、動画を統合したコンテンツを生成。
過去の投稿を参考にしながら最終的な投稿を洗練。
⤴️
Elevate RAG for numerical analysis using Amazon Bedrock Knowledge Bases | AWS Machine Lear..
Amazon Bedrock Knowledge Basesを使用したRAGの強化について説明。
複雑なテーブルを含む文書での課題を解決する技術。
ハイブリッド検索やデータチャンク化で正確な情報取得を実現。
🚀
Llama 3.2: Revolutionizing edge AI and vision with open, customizable models
Llama 3.2で小型・中型のビジョンLLMが利用可能に。
デバイス上でプライバシーを保ちながら迅速な応答が可能。
25社以上のパートナーと協力してサービスを提供。
📸
Llama 3.2 の概要|npaka
Llama 3.2は画像推論や多言語テキスト生成に優れたモデルです。
新しいアーキテクチャで画像理解を強化しています。
プルーニングと蒸留で高性能な軽量モデルを実現しました。
👍
なぜ研究者はローカルPCでAIを実行する必要があるのか? - GIGAZINE
商業AIモデルは企業の意向で変更されることがあります。
ローカルモデルはユーザーの自由に使えるため利便性が高いです。
ツールを使えば簡単にローカルでAIを実行できます。
🚀
CUDA-Free Inference for LLMs | PyTorch
PyTorchの新しい最適化ライブラリ「torchao」を発表しました。
低ビットデータ型や量子化でモデルを高速化・小型化します。
精度を保ちながら推論とトレーニングの速度を向上させます。
2024年09月26日
|
2024年09月24日
このサイトについて
/
ニュースレター
/
@AINewsDev