~AI関連記事を3行にまとめて紹介~
🚀
機械学習基盤のアーキテクチャ特集 〜8社の設計意図と今後の展望〜 - Findy Tools
日本のIT企業8社が技術的挑戦と展望を共有します。
ABEJAは店舗データを分析し、小売業を支援します。
コミューンはGoogle Cloudを用いた推薦システムを構築します。
✨
FigmaがAIでさらに進化! Web制作はもはや完全自動化目前? 「Config APAC 2024」現地レポ | 進..
FigmaがAIを活用し、Web制作の自動化が進む。
新機能「Figma AI」でデザイン生成が簡単に。
UIが直感的に進化し、デザイナーと開発者の連携が強化。
📸
生成AIグラビアをグラビアカメラマンが作るとどうなる?第29回:知ってるとちょっと便利かも?な..
西川和久氏が生成AIグラビアの活用法を紹介。
ControlNet++で複数モデルを一つで扱え、精度向上。
ComfyUI-Easy-UseでIPAdapterの設定が簡単に。
🎥
Runway Gen-3でImage to Videoとリップシンク生成可能に。これは現時点最強のAI動画モデルなのか..
RunwayがGen-3 AlphaでImage to Video機能を実装しました。
画像をクロップし、プロンプトと秒数を指定して生成します。
リップシンク機能も追加され、自然な動画生成が可能です。
✨
Introducing SAM 2: The next generation of Meta Segment Anything Model for videos and image..
SAM 2は画像と動画のオブジェクトセグメンテーションをサポートします。
Apache 2.0ライセンスで公開され、誰でも利用可能です。
データセットSA-VもCC BY 4.0ライセンスで共有されます。
🎤
AIなのにCPUだけで動く! 無料のリアルタイムボイスチェンジャーで別人になってみたよ - やじう..
「Beatrice V2」はCPUのみで動作する軽量なAIボイスチェンジャーです。
約35MBの小サイズで低遅延を実現し、無料で使用可能です。
現在3つのエディションがあり、特定の利用規約があります。
✨
WEBデザイン制作の作業に役立ちそうなAIツールを列挙してみた
WEBデザイン制作の作業効率を向上させるAIツールを紹介します。
画像編集やWEBサイト制作に役立つツールをまとめました。
CanvaやMidjourneyなどの便利なツールを活用しましょう。
🚀
AIで2030年までに世界の半導体売上高は154兆円に拡大、エヌビディア牽引 | Forbes JAPAN 公式サ..
グプタは2024年と2025年に二桁成長を予測しています。
半導体生産能力は20年代末までに50%以上増加します。
AIが熟練労働者不足の問題解決に寄与しています。
🚀
Using Agents to Not Use Agents: How we built our Text-to-SQL Q&A system | Tech notes
Ask-a-MetricはWhatsAppを利用したAIデータアナリストです。
CrewAIを用いたエージェントアプローチを試みました。
擬似エージェントパイプラインでコストと速度を改善しました。
🤖
A Visual Guide to Quantization - by Maarten Grootendorst
大規模言語モデルは数十億のパラメータを持ちます。
モデルの小型化には量子化が重要な手法です。
本記事では量子化の概念や手法を紹介します。
🚗
Meta、動画内アイテム識別AIモデル「SAM 2」をApache 2.0で公開 - ITmedia NEWS
Metaは動画内アイテム識別AIモデルSAM 2を発表しました。
SAM 2のコードとモデルの重みがGitHubで公開されました。
SAM 2は自動運転車の視覚データ注釈に役立つ可能性があります。
📚
巷にあふれる情報を一括管理したい!|朝日新聞社 メディア研究開発センター
情報を一元管理するための方法を紹介します。
スキマ時間を活用して情報収集するツールです。
有償版はさらに多機能で便利です。
💼
生成AIを低コストで 小規模言語モデル「SLM」参入活発 - 日本経済新聞
小規模言語モデルの導入が進み、企業はコスト効率を重視している。
SLMは特定のタスクに特化し、デリケートなデータに適している。
10社以上のSLM開発プラットフォームが登場し、競争が激化している。
📈
画像生成AIの「模倣」に歯止め 対策技術、1万人が利用 - 日本経済新聞
生成AIの普及で著作権保護への関心が高まっている。
イラストレーターたちはAIによる作風の模倣を防ぐ対策を始めた。
国内スタートアップのサービス利用者は約1万人に達している。
📄
テキスト抽出不要のRAGを実現するColPali
ColPaliはPDF情報を画像としてベクトル化します。
テキスト抽出が不要で効率的な検索が可能です。
画像全般に応用でき、検索精度とコスト削減に貢献します。
😅
Hidden flaws behind expert-level accuracy of multimodal GPT-4 vision in medicine | npj Dig..
GPT-4Vは医療課題で人間の医師と同等の正確性を示す。
正しい選択肢でも誤った理由を提示することが多い。
臨床でのAIモデルの統合にはさらなる評価が必要。
😊
Intuit uses Amazon Bedrock and Anthropic’s Claude to explain taxes in TurboTax to million..
Amazon BedrockとAnthropicのClaudeを活用し税金の説明を提供。
複雑な税制を簡素化し納税者が自信を持って申告できるよう支援。
2024年の税シーズンに向けAIを活用した新しいソリューションを開発。
📹
Building a YouTube Video Summarizer with llm and yt-dlp – Shekhar Gulati
Pythonのyt-dlpツールとLLMを使って動画を要約します。
字幕から重要なポイントを抽出する方法を紹介します。
ツールのインストール方法やスクリプトの実行手順を説明します。
😡
AIで憧れの選手にファンレターを グーグルCMに視聴者反発 写真1枚 国際ニュース:AFPBB News
グーグルのAIを使ったファンレターCMが視聴者の反発を招いた。
少女がAI「ジェミニ」でシドニー・マクラフリンレブロンに手紙を書く。
専門家もこのCMを「不愉快」と非難している。
📉
AI開発に黄色信号? 市場急成長で“学習用データ枯渇”の懸念 解決策といわれる「合成データ」..
生成AIの市場規模は2024年に1840億ドルに達する見込み。
学習用データの枯渇が懸念されている。
合成データが解決策として注目されている。
🤖
ウォーターマークを公開作品の保護に使用する "CLIP STUDIO PAINTの新機能 #2" by ClipStudioOf..
ウォーターマークは公開作品の保護に有効です。
CLIP STUDIO PAINTで書き出し時にウォーターマークを追加できます。
ノイズパターンでAIの生成品質を低下させることも期待できます。
🤖
AI Studio
AIを作成し、Instagramプロフィールを拡張できます。
興味に基づいた会話型AIを誰でも作成可能です。
AI Studioは新しい関わり方を提供します。
🚀
アップル、AIインフラ構築でエヌビディアの半導体に依存せず | ロイター
アップルはAIインフラにグーグルのクラウドを使用
AIモデルの訓練にTPUチップを採用
ベータ版ユーザーにAI機能を提供開始
✨
Implement web crawling in Knowledge Bases for Amazon Bedrock | AWS Machine Learning Blog
Amazon Bedrockの知識ベースにウェブクロール機能を実装する方法を紹介。
企業データとウェブデータを用いたカスタマイズが可能。
最新情報を集約し、生成AIアプリの精度を向上。
✨
Quantization-Aware Training for Large Language Models with PyTorch | PyTorch
PyTorchでの量子化対応トレーニングフローを紹介します。
QATはPTQと比較して高い精度回復を実現します。
torchaoのQAT APIとtorchtuneでのファインチューニングをサポートします。
🚀
Introducing torchchat: Accelerating Local LLM Inference on Laptop, Desktop and Mobile | Py..
torchchatをリリースしました
ノートパソコンやモバイルで高性能に実行可能
PythonやC++のAPIとバイナリを提供
🚀
Monks boosts processing speed by four times for real-time diffusion AI image generation us..
MonksはAI画像生成の処理速度を4倍に向上させました。
コストを60%削減し、効率的なリソース利用を実現しました。
SageMakerとInferentia2で高速な深層学習推論を可能にしました。
✨
Apple Intelligence Foundation Language Models - Apple Machine Learning Research
Apple Intelligenceの基盤言語モデルを紹介します。
デバイス向けとクラウド用のモデルがあります。
効率的かつ正確に多様なタスクを実行します。
✨
Kagi LLM Benchmarking Project | Kagi's Docs
主要なLLMの推論、コーディング、指示遵守能力を評価します。
独自のベンチマークでモデルの能力を厳密に評価します。
精度、トークン数、コスト、応答時間などの指標を含みます。
📚
【StableDiffusion】VRoidからつくる衣装LoRA制作メモ【データセット付き】|カズヤ弟@ゲーム実..
SDXLのLoRAを作成中の方に向けたメモです。
衣装LoRAの作成に苦労している方に役立ちます。
データセットやキャプションの重要性を解説します。
🤖
An open-source auto-interpretability pipeline for Sparse Autoencoder Features | EleutherAI..
LLMの内部表現を解釈可能な特徴に分解することを目指しています。
スパースオートエンコーダーはLLMの活性化を解釈する有望な手法です。
SAE特徴の説明を生成・評価する技術を探求し、ライブラリを公開しました。
🤖
高性能動画生成AI「Vidu」の実力を試す。Character to Videoとは何か。KLINGやRunwayとはどこが..
中国の動画生成AI「Vidu」が一般利用可能になりました。
無料ユーザーには80クレジットが付与されます。
Proプランでは8秒生成やアニメーション機能が利用可能です。
2024年07月31日
|
2024年07月29日
このサイトについて
/
ニュースレター
/
@AINewsDev