AI News

~AI関連記事を3行にまとめて紹介~

🚀

機械学習基盤のアーキテクチャ特集 〜8社の設計意図と今後の展望〜 - Findy Tools

  • 日本のIT企業8社が技術的挑戦と展望を共有します。
  • ABEJAは店舗データを分析し、小売業を支援します。
  • コミューンはGoogle Cloudを用いた推薦システムを構築します。

FigmaがAIでさらに進化! Web制作はもはや完全自動化目前? 「Config APAC 2024」現地レポ | 進..

  • FigmaがAIを活用し、Web制作の自動化が進む。
  • 新機能「Figma AI」でデザイン生成が簡単に。
  • UIが直感的に進化し、デザイナーと開発者の連携が強化。

📸

生成AIグラビアをグラビアカメラマンが作るとどうなる?第29回:知ってるとちょっと便利かも?な..

  • 西川和久氏が生成AIグラビアの活用法を紹介。
  • ControlNet++で複数モデルを一つで扱え、精度向上。
  • ComfyUI-Easy-UseでIPAdapterの設定が簡単に。

🎥

Runway Gen-3でImage to Videoとリップシンク生成可能に。これは現時点最強のAI動画モデルなのか..

  • RunwayがGen-3 AlphaでImage to Video機能を実装しました。
  • 画像をクロップし、プロンプトと秒数を指定して生成します。
  • リップシンク機能も追加され、自然な動画生成が可能です。

Introducing SAM 2: The next generation of Meta Segment Anything Model for videos and image..

  • SAM 2は画像と動画のオブジェクトセグメンテーションをサポートします。
  • Apache 2.0ライセンスで公開され、誰でも利用可能です。
  • データセットSA-VもCC BY 4.0ライセンスで共有されます。

🎤

AIなのにCPUだけで動く! 無料のリアルタイムボイスチェンジャーで別人になってみたよ - やじう..

  • 「Beatrice V2」はCPUのみで動作する軽量なAIボイスチェンジャーです。
  • 約35MBの小サイズで低遅延を実現し、無料で使用可能です。
  • 現在3つのエディションがあり、特定の利用規約があります。

WEBデザイン制作の作業に役立ちそうなAIツールを列挙してみた

  • WEBデザイン制作の作業効率を向上させるAIツールを紹介します。
  • 画像編集やWEBサイト制作に役立つツールをまとめました。
  • CanvaやMidjourneyなどの便利なツールを活用しましょう。

🚀

AIで2030年までに世界の半導体売上高は154兆円に拡大、エヌビディア牽引 | Forbes JAPAN 公式サ..

  • グプタは2024年と2025年に二桁成長を予測しています。
  • 半導体生産能力は20年代末までに50%以上増加します。
  • AIが熟練労働者不足の問題解決に寄与しています。

🚀

Using Agents to Not Use Agents: How we built our Text-to-SQL Q&A system | Tech notes

  • Ask-a-MetricはWhatsAppを利用したAIデータアナリストです。
  • CrewAIを用いたエージェントアプローチを試みました。
  • 擬似エージェントパイプラインでコストと速度を改善しました。

🤖

A Visual Guide to Quantization - by Maarten Grootendorst

  • 大規模言語モデルは数十億のパラメータを持ちます。
  • モデルの小型化には量子化が重要な手法です。
  • 本記事では量子化の概念や手法を紹介します。

🚗

Meta、動画内アイテム識別AIモデル「SAM 2」をApache 2.0で公開 - ITmedia NEWS

  • Metaは動画内アイテム識別AIモデルSAM 2を発表しました。
  • SAM 2のコードとモデルの重みがGitHubで公開されました。
  • SAM 2は自動運転車の視覚データ注釈に役立つ可能性があります。

📚

巷にあふれる情報を一括管理したい!|朝日新聞社 メディア研究開発センター

  • 情報を一元管理するための方法を紹介します。
  • スキマ時間を活用して情報収集するツールです。
  • 有償版はさらに多機能で便利です。

💼

生成AIを低コストで 小規模言語モデル「SLM」参入活発 - 日本経済新聞

  • 小規模言語モデルの導入が進み、企業はコスト効率を重視している。
  • SLMは特定のタスクに特化し、デリケートなデータに適している。
  • 10社以上のSLM開発プラットフォームが登場し、競争が激化している。

📈

画像生成AIの「模倣」に歯止め 対策技術、1万人が利用 - 日本経済新聞

  • 生成AIの普及で著作権保護への関心が高まっている。
  • イラストレーターたちはAIによる作風の模倣を防ぐ対策を始めた。
  • 国内スタートアップのサービス利用者は約1万人に達している。

📄

テキスト抽出不要のRAGを実現するColPali

  • ColPaliはPDF情報を画像としてベクトル化します。
  • テキスト抽出が不要で効率的な検索が可能です。
  • 画像全般に応用でき、検索精度とコスト削減に貢献します。

😅

Hidden flaws behind expert-level accuracy of multimodal GPT-4 vision in medicine | npj Dig..

  • GPT-4Vは医療課題で人間の医師と同等の正確性を示す。
  • 正しい選択肢でも誤った理由を提示することが多い。
  • 臨床でのAIモデルの統合にはさらなる評価が必要。

😊

Intuit uses Amazon Bedrock and Anthropic’s Claude to explain taxes in TurboTax to million..

  • Amazon BedrockとAnthropicのClaudeを活用し税金の説明を提供。
  • 複雑な税制を簡素化し納税者が自信を持って申告できるよう支援。
  • 2024年の税シーズンに向けAIを活用した新しいソリューションを開発。

📹

Building a YouTube Video Summarizer with llm and yt-dlp – Shekhar Gulati

  • Pythonのyt-dlpツールとLLMを使って動画を要約します。
  • 字幕から重要なポイントを抽出する方法を紹介します。
  • ツールのインストール方法やスクリプトの実行手順を説明します。

😡

AIで憧れの選手にファンレターを グーグルCMに視聴者反発 写真1枚 国際ニュース:AFPBB News

  • グーグルのAIを使ったファンレターCMが視聴者の反発を招いた。
  • 少女がAI「ジェミニ」でシドニー・マクラフリンレブロンに手紙を書く。
  • 専門家もこのCMを「不愉快」と非難している。

📉

AI開発に黄色信号? 市場急成長で“学習用データ枯渇”の懸念 解決策といわれる「合成データ」..

  • 生成AIの市場規模は2024年に1840億ドルに達する見込み。
  • 学習用データの枯渇が懸念されている。
  • 合成データが解決策として注目されている。

🤖

ウォーターマークを公開作品の保護に使用する "CLIP STUDIO PAINTの新機能 #2" by ClipStudioOf..

  • ウォーターマークは公開作品の保護に有効です。
  • CLIP STUDIO PAINTで書き出し時にウォーターマークを追加できます。
  • ノイズパターンでAIの生成品質を低下させることも期待できます。

🤖

AI Studio

  • AIを作成し、Instagramプロフィールを拡張できます。
  • 興味に基づいた会話型AIを誰でも作成可能です。
  • AI Studioは新しい関わり方を提供します。

🚀

アップル、AIインフラ構築でエヌビディアの半導体に依存せず | ロイター

  • アップルはAIインフラにグーグルのクラウドを使用
  • AIモデルの訓練にTPUチップを採用
  • ベータ版ユーザーにAI機能を提供開始

Implement web crawling in Knowledge Bases for Amazon Bedrock | AWS Machine Learning Blog

  • Amazon Bedrockの知識ベースにウェブクロール機能を実装する方法を紹介。
  • 企業データとウェブデータを用いたカスタマイズが可能。
  • 最新情報を集約し、生成AIアプリの精度を向上。

Quantization-Aware Training for Large Language Models with PyTorch | PyTorch

  • PyTorchでの量子化対応トレーニングフローを紹介します。
  • QATはPTQと比較して高い精度回復を実現します。
  • torchaoのQAT APIとtorchtuneでのファインチューニングをサポートします。

🚀

Introducing torchchat: Accelerating Local LLM Inference on Laptop, Desktop and Mobile | Py..

  • torchchatをリリースしました
  • ノートパソコンやモバイルで高性能に実行可能
  • PythonやC++のAPIとバイナリを提供

🚀

Monks boosts processing speed by four times for real-time diffusion AI image generation us..

  • MonksはAI画像生成の処理速度を4倍に向上させました。
  • コストを60%削減し、効率的なリソース利用を実現しました。
  • SageMakerとInferentia2で高速な深層学習推論を可能にしました。

Apple Intelligence Foundation Language Models - Apple Machine Learning Research

  • Apple Intelligenceの基盤言語モデルを紹介します。
  • デバイス向けとクラウド用のモデルがあります。
  • 効率的かつ正確に多様なタスクを実行します。

Kagi LLM Benchmarking Project | Kagi's Docs

  • 主要なLLMの推論、コーディング、指示遵守能力を評価します。
  • 独自のベンチマークでモデルの能力を厳密に評価します。
  • 精度、トークン数、コスト、応答時間などの指標を含みます。

📚

【StableDiffusion】VRoidからつくる衣装LoRA制作メモ【データセット付き】|カズヤ弟@ゲーム実..

  • SDXLのLoRAを作成中の方に向けたメモです。
  • 衣装LoRAの作成に苦労している方に役立ちます。
  • データセットやキャプションの重要性を解説します。

🤖

An open-source auto-interpretability pipeline for Sparse Autoencoder Features | EleutherAI..

  • LLMの内部表現を解釈可能な特徴に分解することを目指しています。
  • スパースオートエンコーダーはLLMの活性化を解釈する有望な手法です。
  • SAE特徴の説明を生成・評価する技術を探求し、ライブラリを公開しました。

🤖

高性能動画生成AI「Vidu」の実力を試す。Character to Videoとは何か。KLINGやRunwayとはどこが..

  • 中国の動画生成AI「Vidu」が一般利用可能になりました。
  • 無料ユーザーには80クレジットが付与されます。
  • Proプランでは8秒生成やアニメーション機能が利用可能です。

2024年07月31日

|

このサイトについて

/

ニュースレター

/

@AINewsDev