~AI関連記事を3行にまとめて紹介~
💻
ASCII.jp:AI、ついにパソコンを使えるようになってしまう Anthropic「Claude 3.5 Sonnet」新機..
Anthropicは「Claude 3.5 Sonnet」と「Claude 3.5 Haiku」を発表。
SonnetはAIがコンピューターを操作できる新機能を搭載。
デモで観光プランニングや業務自動化の実演が行われた。
🖥️
computer use モデルの開発|npaka
Claude 3.5 Sonnetはコンピュータ操作が可能なAIです。
ユーザーの指示でカーソル移動や情報入力ができます。
安全性の懸念があり、適切な対策が必要です。
🚀
Generative AI foundation model training on Amazon SageMaker | AWS Machine Learning Blog
AWSブログでSageMakerを使った生成AIモデルのトレーニングを解説。
企業は競争力維持のために基盤モデルを活用しています。
SageMakerはインフラ管理を簡素化し効率的なトレーニングを実現。
✨
Automate fine-tuning of Llama 3.x models with the new visual designer for Amazon SageMaker..
Amazon SageMakerの新しいデザイナーでLlama 3.xを自動化。
生成AIモデルのトレーニングとデプロイが簡素化されます。
SEC書類要約用のLlama 3モデルのカスタマイズ手順を解説。
✨
Introducing computer use, a new Claude 3.5 Sonnet, and Claude 3.5 Haiku \ Anthropic
コンピュータ利用の新機能でClaudeが人間のように操作可能に。
Claude 3.5 Sonnetはコーディングで大幅な改善を実現。
Claude 3.5 Haikuは前モデルと同等の性能を持つ。
😎
Meta、顔認識でなりすまし詐欺広告を検出する手法 - PC Watch
Metaは顔認識技術で詐欺広告を検出する新手法をテスト中。
広告審査システムで詐欺広告を特定し、顔データは削除される。
初期テストで有用性が確認され、今後多くのアカウントで導入予定。
😱
なんの気なしに旦那のPCを覗いててHDDがやたらパンパンだから確認したらAIで..
旦那のPCを確認したらHDDがいっぱいだった。
生成AIで未成年の姿を実験していた。
数百万枚の画像生成は普通に気持ち悪い。
💼
ウォール・ストリート・ジャーナルの親会社がAI検索サービス「Perplexity」を著作権違反で訴える..
News CorpがAI検索サービスPerplexityを著作権違反で訴えました。
Perplexityはライセンス契約提案を無視しコンテンツを使用しました。
Perplexityの評価額は80億ドルに達する見込みです。
📚
Google Colab で xAI API を試す|npaka
Google ColabでxAI APIを試した手順を紹介します。
xAI APIは現在grok-betaのみ提供されています。
APIキーはxAI Consoleで取得し、Colabで実行します。
😮
MicrosoftはVisual Studio Codeの拡張機能において自社だけが特別なAPIを使えるようにしている -..
Microsoftは自社製の拡張機能に特別なAPIを提供しています。
Visual Studio Codeは2015年に登場し、人気を集めています。
マーケットプレイスでは多様な拡張機能が利用可能です。
🤖
LangChain公式エキスパートによる『LangChainとLangGraphによるRAG・AIエージェント[実践]入門..
11月9日にAIエージェント本が技術評論社から発売されます。
内容は最新のRAGやLLMアプリケーションに関するものです。
輪読会やもくもく会を支援する企画も用意されています。
✨
自動化するLLMシステムの品質管理: LLM-as-a-judge の作り方 - Gaudiy Tech Blog
LLM-as-a-JudgeはLLMを用いて評価を行う手法です。
LLMは非構造化データを解釈し自動で判断を行います。
評価基準は実データを基にアノテーションすることが重要です。
📊
【比較表あり】GA4とLooker Studioの適切な使い分け方法を専門家がわかりやすく解説 - はてなビ..
GA4は多様なレポートと探索機能を提供しています。
Looker StudioはGA4のデータを可視化し共有する無料サービスです。
GA4は基本情報の確認に、Looker Studioはデータ共有に最適です。
✨
Diffusers welcomes Stable Diffusion 3.5 Large
DiffusersがStable Diffusion 3.5 Largeを発表しました。
8Bモデルと8Bタイムステップ蒸留モデルが含まれています。
量子化を用いた推論やLoRAのトレーニング方法も説明します。
🚀
Grok APIリリース:xAIがAI開発の新時代を開く – イーロン・マスクの野望と課題 - イノベトピア
2024年10月21日にxAIが初のAPI「grok-beta」をリリース。
APIは外部ツールと連携し、将来は画像分析機能も追加予定。
xAIは60億ドルを調達し、企業価値は240億ドルに達した。
🚀
まだLLM API呼び出しで消耗してるの?LiteLLMによるAPI呼び出し共通化のススメ
LiteLLMを使うと様々なLLM APIを統一して呼び出せます。
2023年8月に開発が始まり、急速に進化しています。
共通インターフェースでエラー処理も統一され、開発がスムーズです。
🎉
Metaがテキストと音声の入出力を統合できる初のオープンソースマルチモーダル言語モデル「Spirit..
Metaは2024年10月18日にSpirit LMを発表しました。
このモデルは音声入力に対して直接音声出力を行います。
音声とテキストの統合でAI研究に新たな刺激を与えます。
🤖
IBM Granite 3.0: open, state-of-the-art enterprise models
IBMはGranite 3.0を発表し、企業向けに最適化されたモデルを提供。
Granite 3.0 8B Instructは12兆トークンで訓練された強力なモデル。
すべてのモデルはApache 2.0ライセンスで公開され、安全性を重視。
🤖
意見の対立する社会問題に誰もが合意できる取りまとめを示すAI「ハーバーマス・マシン」をGoogle..
AI「ハーバーマス・マシン」は意見対立の社会問題で合意形成を支援。
移民や気候変動の議題でAIが生成した合意が56%の支持を得た。
AIは民主的な議論を助けると評価される一方で懸念もある。
✨
LLMOps : ΔMLOps - Speaker Deck
LLMと従来のMLの違いに基づくMLOpsの修正が紹介されます。
伊藤駿汰と栗田宗平がクラウドソリューションアーキテクトとして登壇。
v1.0は2024年10月21日にリリースされます。
🤔
Apple、SiriとChatGPTの性能を比較!Appleは業界に2年遅れ? - iPhone Mania
AppleのAI技術はChatGPTに比べて正確性で25%劣ります。
回答数も30%少なく、競合に大きく遅れをとっています。
AI分野での企業買収をAppleが検討している可能性があります。
📚
OpenAI o1の開発者がo1の仕組みなどについて語るインタビュー(日本語訳と感想)|IT navi
OpenAIのo1シリーズ開発者のインタビューを日本語訳で紹介。
ノーム・ブラウン博士はo1モデルの中心的役割を担う。
o1はSTEM分野でのAI推論能力を向上させる。
🚀
Sharing new research, models, and datasets from Meta FAIR
FAIRチームは先進的な機械知能を追求しています。
SAM 2.1やMeta Spirit LMなどの新モデルを発表しました。
Layer SkipやSalsa技術で効率的な訓練を支援しています。
📸
GitHub - NVlabs/Sana: SANA: Efficient High-Resolution Image Synthesis with Linear Diffusio..
Sanaは高解像度画像を効率的に生成するフレームワークです。
ノートPCのGPUで高品質な画像を迅速に生成できます。
Sana-0.6Bは従来モデルより20倍小さく100倍速く動作します。
📚
【読書の秋】これまでの常識を覆すAI読書術3選|ChatGPT研究所
AIを活用した新しい読書術で効率的に読書を楽しめます。
KindleとChatGPTを併用し、要約や専門用語の意味を調べます。
AIを使って、より深い理解を得ることが可能です。
🌍
Deploying Speech-to-Speech on Hugging Face Inference Endpoints with a Custom Docker Contai..
Hugging FaceのS2Sは音声応答システムです。
VAD、STT、LM、TTSモデルを組み合わせ多言語対応しています。
Inference EndpointsでGPU仮想マシンを利用可能です。
😅
AIにアプリを作らせ4日でリリースした話
AIを活用してアプリを4日でリリースした体験を共有。
AIに企画とコードを任せ、3日でアプリが完成。
デザインにこだわり、Appleの審査を通過しリリース。
🚀
Developing a computer use model \ Anthropic
Claudeはカーソル操作やクリックが可能になりました。
AIの進歩によりソフトウェアとの直接対話が実現しました。
安全性を維持しつつ、さらなる改善が期待されています。
😲
AI市場におけるOpenAIの優位性はすでに喪失 - State of AI Report 2024 | TECH+(テックプラス)
AI投資会社が「State of AI Report 2024」を公開しました。
OpenAIの影響力が低下し、他社が追いついています。
NVIDIAなどの企業価値が上昇しています。
🤖
Transformers.js v3 の概要|npaka
Transformers.js v3はHuggingFaceの機械学習ライブラリのJavaScript版です。
WebGPUサポートや量子化フォーマットの拡充が特徴です。
120以上のアーキテクチャと1200以上のモデルに対応しています。
😂
サイゼリヤのミックスグリルのカロリーを調べたらAIにこう言われた「そうなんだ AIくんすごいね ..
サイゼリヤのミックスグリルのカロリーをAIが「650円」と回答。
カロリーを「円」で表現するのは斬新だが正確性に欠ける。
AIの回答に疑問を持つ上司や疲れたAIの姿が描かれる。
🚀
Stable Diffusion 3.5 のご紹介 — Stability AI Japan
Stable Diffusion 3.5は複数のモデルを含んでいます。
一般ハードウェアで動作し、高いカスタマイズ性があります。
商業利用も無料で可能で、安全性にも配慮されています。
✨
Codestral Mamba:Mistral AIのMamba搭載次世代型大規模言語モデル / 開発者向けブログ・イベント..
フランスのMistral AIが2024年7月にCodestral Mambaを発表。
Mambaはコード生成に特化した大規模言語モデルです。
状態空間モデルを利用し長いコンテキストに効率的に対応。
🤔
AI検出器は人間の学生が書いた文章の1~2%をAI製と誤認、ぬれぎぬで試験を落とされる学生にとっ..
AI検出器は学生の文章を1~2%誤認し不正疑惑を招いています。
AI使用率は17%で、教師はAI検出器でカンニングを防ごうとしています。
誤検知はESLや発達障害の学生に特に影響を与えています。
🎉
グーグル、「Gemini Live」日本でスタート 自然な音声で会話できる - Impress Watch
グーグルは日本で「Gemini Live」を開始しました。
自然な会話が可能で、情報取得や追加質問ができます。
40以上の言語に対応し、最大2言語での会話が可能です。
🎉
Googleの会話AI「Gemini Live」日本語対応 - ITmedia AI+
GoogleはAI会話機能「Gemini Live」の日本語対応を発表。
Android版Geminiアプリで音声会話が可能になる。
アプリ画面右下のアイコンをタップして会話を開始。
✨
Anthropic、「Claude 3.5 Sonnet」更新と「Claude Haiku 3.5」リリースを発表 - ITmedia NEWS
AnthropicはClaude 3.5のアップデートを発表しました。
新機能「Computer Use」でコーディング能力が向上しました。
Haikuは有料版で、高速かつ低コストを実現しています。
🚀
ついにAIがPCを操作 Claude 3.5 Sonnetに作業自動化する「Computer use」 - Impress Watch
AnthropicはAIモデルClaude 3.5 Sonnetをアップデートした。
新機能「Computer use」でAIがPC操作を自動化する。
現在は初期段階で簡単な操作に課題がある。
🤖
Dawn of the Agent: New Claude AI can take over your computer
新しいClaude AIがコンピュータを完全に操作する能力を持ちます。
このAIはタスクを自動で処理し、ウェブサイトと連携します。
現在は実験段階で、開発者はAPIを通じて利用可能です。
🚀
画像生成AI「Stable Diffusion 3.5」提供開始 プロ用途、多様性も - Impress Watch
Stability AIが画像生成AI「Stable Diffusion 3.5」を発表。
3つのバリエーションがあり、プロ用途に最適。
「Large Turbo」は高速生成が特徴で、多様なスタイルに対応。
🌟
ノーベル賞が見逃したAI研究者、甘利俊一氏「ヒントンはよく粘った」:日経ビジネス電子版
2024年のノーベル物理学賞はAI研究者のヒントン氏らに授与。
甘利俊一氏はAI研究の先駆者として注目されています。
甘利氏はヒントン氏の粘り強さを評価し、AIの未来に期待。
🚀
生成AIの実践的導入に役立つ「7つの基準」「6つの展開パターン」を解説 PwC:「フライホイール..
生成AIの生産性向上に関する知見が発表された。
フライホイール方式で生成AIの効果的な拡張が可能。
慣性モーメントを利用し、ビジネスの生産性を向上させる。
😲
トム・ヨーク/ロバート・スミス/ジュリアン・ムーア/カズオ・イシグロなど1万人のクリエイタ..
トム・ヨークやロバート・スミスらがAIに関する声明に署名。
声明はAI企業による無許可使用が脅威と警告しています。
作品の無断使用が著作権侵害にあたると主張しています。
🎉
画像生成AI「Stable Diffusion 3.5」シリーズの3モデルがオープンリリースされる、高いカスタマ..
画像生成AI「Stable Diffusion 3.5」がオープンリリースされました。
3つのモデルが無料で利用可能で、高いカスタマイズ性があります。
「Stable Diffusion 3.5 Large」は80億パラメータで高品質です。
🛡️
Training a million models per day to save customers of all sizes from DDoS attacks
DDoS保護はグローバルネットワークの全サーバーで常時稼働しています。
悪意のあるトラフィックを動的に識別し、検出時に排除します。
マハラノビス距離を用いたモデルでトラフィックの異常を検出します。
✨
HuggingFace Diffusers v0.31.0の新機能|npaka
Stable Diffusion 3.5 Largeは最新のText-to-Imageモデルです。
Cogview3-plusは512~2048ピクセルの画像生成をサポートします。
ネイティブ量子化サポートが導入され、bitsandbytesを使用します。
🤖
ChatGPTでChatGPTの本を書く | gihyo.jp
本書はChatGPTの仕組みに焦点を当て、AI技術の民主化を目指します。
執筆、推敲、校正でChatGPTを活用し、特に推敲で効果的です。
文章の圧縮が重要で、短くすることで理解しやすくなります。
✨
CinePile 2.0 - making stronger datasets with adversarial refinement
CinePile 2.0は長編動画QAデータセットを大幅に改善しました。
敵対的データセット精練により既存データセットを強化しました。
約30万のトレーニングサンプルと5000のテストサンプルを含みます。
🚀
You Should Probably Pay Attention to Tokenizers - Cybernetist
友人の新しいアプリの立ち上げを手伝いました。
RAGが特定のクエリでうまく機能しない問題がありました。
トークン化はAIアプリの成功に重要な役割を果たします。
✨
チャットAI「Claude」にPCを自動操作する機能が追加される&「Claude 3.5 Sonnet」の性能向上版..
Anthropicが「Claude 3.5 Sonnet」の性能向上版を発表。
軽量モデル「Claude 3.5 Haiku」も同時に登場。
PCを自動操作する機能のベータテストが開始された。
✨
Introducing HUGS - Scale your AI with Open Models
HUGSはオープンモデルを用いたAI開発を簡素化するサービスです。
NVIDIAやAMDのGPU、AWS Inferentia、Google TPUに対応しています。
ゼロコンフィギュレーションで迅速なデプロイが可能です。
🎶
New generative AI tools open the doors of music creation - Google DeepMind
新しい生成AIツールが音楽制作の新たな可能性を提供します。
MusicFX DJはリアルタイムで音楽を生成し、直感的に操作可能です。
Music AI Sandboxは音楽制作を支援し、高品質な音楽を生成します。
✨
Introducing SynthID Text
SynthID TextはAI生成テキストの識別を支援します。
AI生成コンテンツの識別は情報の信頼性向上に重要です。
Google DeepMindとHugging Faceが新技術を発表しました。
✨
Boost post-call analytics with Amazon Q in QuickSight | AWS Machine Learning Blog
Amazon QとQuickSightでポストコール分析を強化します。
自然言語でデータを質問し、視覚化が可能です。
迅速な洞察と意思決定で顧客体験を向上させます。
🚀
Create a next generation chat assistant with Amazon Bedrock, Amazon Connect, Amazon Lex, L..
Amazon Bedrockを活用して次世代チャットアシスタントを作成します。
生成AIがユーザー体験を革新し、デジタル環境をナビゲートします。
AWSのセキュリティとスケーラビリティで迅速な展開が可能です。
🤖
Unlocking generative AI for enterprises: How SnapLogic powers their low-code Agent Creator..
SnapLogicはAmazon Bedrockを活用したAgent Creatorを紹介。
プログラミング知識不要で高度なアプリを迅速に作成可能。
データ統合とAIモデル活用を簡素化し生産性向上を支援。
🎓
Next-generation learning experience using Amazon Bedrock and Anthropic’s Claude: Innovati..
ClassworksはAIを活用した個別学習支援ツール「Wittly」を紹介。
Wittlyは生徒のニーズに応じた指導を行い、教師の負担を軽減。
データプライバシーを重視し、安全な学習環境を提供。
🛠️
Fine-tune a BGE embedding model using synthetic data from Amazon Bedrock | AWS Machine Lea..
Amazon Bedrockで合成データを生成しBGEモデルを調整します。
実データが不足する場合、合成データは有効な解決策です。
医療検索エンジン開発時にプライバシーの懸念を軽減します。
🎶
AIシティポップが現代社会に問う〈創作とは何か?〉 著作権問題など生成AI音楽の議論が抱える3つ..
生成AIによる音楽が注目を集めています。
AIシティポップのクオリティに驚く声が広がっています。
生成AIの進化で音楽の新たな試みが増えています。
📸
ASCII.jp:画像生成AI「Stable Diffusion 3.5」ついに登場 「FLUX」と対決へ
Stability AIが画像生成AI「Stable Diffusion 3.5」を発表。
「Large」モデルは80億パラメーターで高解像度画像に対応。
商用利用は小規模企業や個人に無料で提供される。
🚀
srcbook/README.md at main · srcbookdev/srcbook · GitHub
SrcbookはTypeScriptを中心にしたアプリ開発プラットフォームです。
AIを活用して迅速にウェブアプリを作成・編集できます。
オープンソースでローカルで動作し、APIキーが必要です。
🏆
eスポーツと生成AIが融合したらどうなる? 画像生成AIのプロンプトで戦うアーケードゲーム「VS ..
筆者は台湾の高雄市で開催された大会に参加しました。
「VS AI街頭對戰」はプロンプトで画像を生成するゲームです。
16歳の少年が優勝し、その作品は感動を呼びました。
2024年10月24日
|
2024年10月22日
このサイトについて
/
ニュースレター
/
@AINewsDev