AI News

~AI関連記事を3行にまとめて紹介~

🧠

Google Colab で RecurrentGemma を試す|npaka

  • Google Colabで新しいリカレントアーキテクチャを試行
  • 質問応答や要約に適したオープンモデル
  • メモリ使用量が少なく高速な推論が特徴

😤

「現状、人間はこの技術を制御しきれない」。読売新聞とNTTが生成AIのあり方に共同提言 - INTERN..

  • 生成AIは人間の制御が難しく、技術と法律で規律が必要
  • 誤情報や権利侵害などの課題を抱える
  • 健全な言論空間の確保と情報的健康の確立が急務

😍

AI文字起こしツールnottaがYouTube動画の文字起こし機能をリリース!【今日のライフハックツール..

  • YouTube動画をテキスト化する新機能をリリース
  • URL貼り付けで自動要約、タイムスタンプ表示も
  • 初回無料体験あり、月額8.25ドルで1800分利用可能

📸

OpenAIが画像読み取り可能なAI「GPT-4 Turbo with Vision」を一般公開開始、JSONモードや関数呼..

  • 画像読み取りAIが一般公開され、開発者がアプリ構築
  • 食品写真から栄養情報を提供するサービスが登場
  • 画像処理能力と数学機能が大幅に改善された新バージョン

🕒

生成AIで月10万時間を創出 GMOが業務で活用しているAIツールTOP10とは? - ITmedia NEWS

  • 生成AIにより月約10万6000時間の業務時間創出
  • 従業員の73.2%が生成AIを活用、57.7%が継続利用希望
  • AI活用には利用規定順守と個人情報の配慮が必要

🔄

Chain-of-table: Evolving tables in the reasoning chain for table understanding

  • テーブル理解タスクの新フレームワークを提案
  • LLMを用いてテーブルを反復的に更新
  • テーブルをシンプルで管理しやすいセグメントに変換

🎉

Mistral AIが突如として新しい大規模言語モデル「8x22B MOE」を発表、コンテキスト長65kでパラメ..

  • 新しい大規模言語モデル「8x22B MOE」が発表される
  • パラメーターサイズは1760億、コンテキスト長は65k
  • 性能はGPT-3.5やLlama 2 70Bを上回る可能性

👨‍⚕️

Googleが放射線科医向けに画像診断・病歴チェック・論文検索が可能なAIシステムをバイエルと提携..

  • 放射線科医向けAIアプリが画像データ分析を支援
  • AIによる異常検知や関連情報の提示で医療支援
  • 2024年後半にAIヘルスケアアプリの利用開始予定

📸

Googleが「消しゴムマジック」などのAI画像編集ツールをiPhoneも含めた全Googleフォトユーザーに..

  • AI画像編集ツールがGoogleフォトユーザーに無料で利用可能に
  • 「消しゴムマジック」などの機能で写真編集がさらに便利に
  • 無料ユーザーは月10枚まで編集データを保存可能

📱

Google、「Google フォト」の「消しゴムマジック」などのAI編集機能をAndroid/iOS/Chromebook Pl..

  • Android/iOS/Chromebook PlusユーザーにAI編集機能無料提供
  • 「消しゴムマジック」など複数の機能が順次開放
  • 「消しゴムマジック」保存回数に無料ユーザーには制限あり

📸

Raspberry PiがAIカメラモジュール発売へ、ソニーのAI処理機能搭載センサー採用:2024年夏頃登場..

  • 2024年夏、AI処理特化のセンサー搭載カメラモジュールを発売
  • エッジAIシステム実現に向けたDSPやメモリを内蔵
  • MobileNetやTensorflowのカスタムモデルに対応

💨

Google Cloud、AIワークロードに特化したストレージ「Hyperdisk ML」発表。競合となるAWSやAzure..

  • AIワークロード向けストレージ「Hyperdisk ML」を発表
  • 競合のAWSやAzureより100倍の高速性を実現
  • 「Google Cloud Next '24」での発表内容

🚀

IntelがAIアクセラレータ「Gaudi 3」を発表、NVIDIAのH100より高速かつ低消費電力で一部テストで..

  • AIアクセラレータ「Gaudi 3」が2024年に登場
  • NVIDIAのH100を上回る速度と省電力性を実現
  • 大規模言語モデルの学習・推論に最適化

🌐

GoogleがGemini 1.5 Proの一般プレビューを開始、音声理解・システム命令・JSONモードなどの新機..

  • 音声理解やファイルAPIなど新機能が追加されたGemini 1.5 Pro
  • 180カ国以上で利用可能になり、次世代モデル「gecko」もリリース
  • Google Cloud Platformで活用可能、エンタープライズ向けにも対応

📤

Gemini API の File API を試す|npaka

  • Gemini APIのFile APIでファイルをアップロード
  • ファイルは最大20GB、48時間保持可能
  • 無料で利用可能、Colabで実行手順を紹介

🔍

ベイズ統計でKaggleを解いてみる #R - Qiita

  • タイタニック問題をベイズ統計で分析
  • 欠損データは代入法で処理
  • MCMCで統計モデルを実行し予測値を算出

🧘‍♂️

Building an AI Coach to Help Tame My Monkey Mind

  • 瞑想や感謝の日記などの内省的手法に加え、AIをコーチとして活用
  • AIコーチは24時間365日利用可能で、判断される心配もなし
  • 声を通じたAIコーチとの対話が自然で、感情の整理に役立つ

😵‍💫

ChatGPTが一時ダウン、意味不明なエラーメッセージ吐く。GPT-4 Turbo導入と同時期 | テクノエッ..

  • ChatGPTが一時的にダウンしユーザーがエラー報告
  • 「GPT-4使用上限に達した」とのエラーメッセージが出現
  • OpenAIが約4時間で問題を解決しサービスを復旧

😊

scikit-learn入門&使い方 ― 機械学習の流れを学ぼう:機械学習入門 - @IT

  • 機械学習の基本的な流れをPythonライブラリで学習
  • データ読み込み、加工、可視化、機械学習手法を体験
  • あやめのデータセットを用いて種類予測の実践演習

🚀

生成AIの学習に用いた資料の公開を義務付ける「生成AI著作権開示法」案が提出される - GIGAZINE

  • AIモデル開発に使う著作権素材の公開が義務化
  • 法案には提出期限や罰金規定を設ける内容
  • クリエイター保護とイノベーション促進を目指す

🤖

Backlog APIとOpenAIを使ったタスク整理術 “情報の宝庫”を活用して、エンジニアを解き放つ -..

  • BacklogとOpenAIを組み合わせたタスク管理方法を提案
  • 過集約による課題の優先度判断の難しさを指摘
  • APIとAIを活用し、効率的なプロジェクト管理を実現

🤖

【連載】生成AIと著作権~文化審議会著作権分科会法制度小委員会「考え方」を踏まえて~第1回|..

  • AI生成物の生成・利用段階での著作権侵害の責任が異なる
  • AI開発者・サービス提供者・利用者の行為に注目
  • 著作権法とAIの関連性についての法的論点を整理

💡

クリエイターが求めてるAIによる自動化ってコレだよね。→賛同の声集まる「これはホントそう」→..

  • クリエイターは面倒な作業の自動化を望む
  • 画像認識でレイヤー名付けの自動化が好評
  • 創造性の自動化は求められていない

📻

Gemini API でラジオ番組の音声からの文字起こしを試す|npaka

  • Gemini 1.5 Proを用いてラジオ番組の音声データを入力
  • 音声からの要約や文字起こしを実施
  • 処理におけるトークン数も確認

🔍

ChatGPT以降の労働市場は本当にAIに置き換えられているのか? 500万人分のフリーランスの仕事を..

  • AIによる労働市場の変化を500万人のフリーランスデータで分析
  • リサーチ結果はクリップ機能で保存可能、便利に再読アクセス
  • AI技術やビジネス活用の最新情報を日々提供

🚀

Microsoftも出資するAI企業Mistral、オープンソースLLM「Mixtral 8x22B」リリース - ITmedia NEW..

  • フランスのAI企業が新LLM「Mixtral 8x22B」を公開
  • 先代モデルを超える性能の可能性
  • CEOはDeepMind、CTOはMeta出身者

🔍

Breaking news: Scaling will never get us to AGI

  • スケーリングはAGI達成に不十分との新研究
  • ニューラルネットはデータ外の一般化に問題あり
  • AGIにはデータ超える一般化能力が必要

🤖

LLMを活用した大規模商品カテゴリ分類への取り組み | メルカリエンジニアリング

  • 30億以上の商品カテゴリ分類に大規模言語モデルを活用
  • LLMとkNNを組み合わせた予測アルゴリズムを開発
  • OSSのEmbeddingモデル等を用いた処理高速化を実現

📈

Pythonを使った株価のデータ取得や分析・予測方法を徹底解説!|Udemy メディア

  • Pythonで株価分析・予測を行う方法を解説
  • NumPy、Pandas、Matplotlibなどのライブラリ紹介
  • データ取得から可視化、予測モデル構築まで説明

🆕

Humane’s $699 Ai Pin is now available | TechCrunch

  • ベイエリアのハードウェアスタートアップが初の製品を発表
  • 元Appleの創業者が設立し、2億3000万ドルを調達
  • 新デバイスは生成AIプラットフォームの力を活用

😎

GitHub - huggingface/parler-tts: Inference and training library for high-quality TTS model..

  • 高品質な音声を生成する軽量TTSモデル
  • 完全なオープンソースで推論・トレーニングコードを提供
  • 10.5K時間のデータでトレーニングされた600Mパラメーターモデル

🚀

AWS at NVIDIA GTC 2024: Accelerate innovation with generative AI on AWS | AWS Machine Lear..

  • NVIDIA GTCでAI革新を加速
  • AWSとNVIDIA、13年以上の協力関係
  • 次世代プロセッサーで言語モデルを強化

🚀

デロイト トーマツが「ファインチューニング付きLLM」の開発サービスを提供開始:オンプレミスで..

  • 2024年4月、特化型LLMの開発サービスがスタート
  • オンプレミス運用に対応し、特定業界のニーズに応える
  • 汎用LLMの限界を超え、専門用語理解を強化

🔧

Tool Calling with LangChain

  • AIMessageに新しいtool_calls属性を導入
  • 標準インターフェースでツール呼び出しを容易に
  • 機能利用にはlangchain_coreのバージョンアップ必須

🌟

Holodeck: Language Guided Generation of 3D Embodied AI Environments

  • 3D環境を言語ガイドで自動生成し、細かい要件に応じてカスタマイズ
  • GPT-4を活用し、Objaverseの3Dアセットでシーンに多様性を提供
  • 680人のユーザースタディで高品質な出力を達成し、新しいシーンでエージェントを訓練

😱

UK's antitrust enforcer sounds the alarm over Big Tech's grip on GenAI | TechCrunch

  • 英国の競争監視機関がAI市場のビッグテック支配に警鐘
  • GAMMAのAI価値連鎖全体への影響に「本当の懸念」を表明
  • 「勝者独占のダイナミクス」に対し、介入の可能性を示唆

🌐

An Interview with Google Cloud CEO Thomas Kurian About Google’s Enterprise AI Strategy –..

  • Google CloudのAI戦略は企業のデジタル変革を支援
  • オープンアーキテクチャと新技術でAIプラットフォームを提供
  • 企業の効率化、顧客体験変革、製品再構築にAIを活用

📄

Cost-effective document classification using the Amazon Titan Multimodal Embeddings Model ..

  • 異なる形式の文書から洞察を抽出しカテゴリ分けするニーズが高まる
  • 知的文書処理ソリューションで自動化しコスト効果の高い分類が可能
  • Amazon Titanモデルを用いてトレーニング不要で文書分類を実現

🤖

「Visual Studio 2022」に「Copilot」が統合、v17.10より提供 - 窓の杜

  • 「Visual Studio 2022」の次期バージョンに「GitHub Copilot」統合
  • AIがコーディング支援、コード提案や質問に対応
  • 有料サービスだが、30日間の無料トライアル提供

🤖

Weekly AI News #38 - by hotchpotch - Weekly AI News

  • AIモデルの性能向上に世界が注目
  • 新言語モデル「Command R+」が登場
  • 音楽創作をサポートする「Stable Audio 2.0」が進化

👨‍💻

PyTorchやPythonなしの純粋なC言語を使用した大規模言語モデルトレーニングツール「llm.c」がリ..

  • 純粋なC言語で大規模言語モデルのトレーニングが可能に
  • メモリ使用量が変動しない「llm.c」が登場
  • 将来的にはfp16や新アーキテクチャのサポートも計画

🎶

音楽生成AIサービス「Udio」の使い方 Suno AIの対抗馬になりそうな気配がする - KAI-YOU.net

  • 自動作曲AI「Udio」はテキスト入力で楽曲生成が可能
  • ジャンルや雰囲気の指定、歌詞や曲進行の細かい調整が可能
  • 生成曲はリミックス可能、自然な仕上がりで他AIと比較も

2024年04月12日

|

このサイトについて

/

ニュースレター

/

@AINewsDev