AI News

~AI関連記事を3行にまとめて紹介~

🔍

Imbue (Formerly Generally Intelligent) (YC S17) Is Hiring an Engineering Manager | Hacker ..

  • 人間レベルのAI構築を目指す研究会社が人材を募集中
  • エンジニアリングマネージャーを含む多岐にわたる職種がオープン
  • リモート勤務可のポジションもあり、柔軟な働き方が可能

🎉

音声・テキスト・画像・音楽の入出力に対応したマルチモーダル大規模言語モデル(LLM)「AnyGPT」..

  • 複数のデータ形式を処理する「AnyGPT」が新登場
  • 新しい言語やモダリティをデータレベルで統合
  • 音声・テキスト・画像・音楽のトークン化とマルチモーダル生成を実行

📷

無料の「Blender」で1枚の写真から3Dモデルを作る方法 最終章 - Blender ウォッチング - 窓の杜

  • 無料3Dモデリングツールで写真から3Dモデル作成
  • 「Marigold Depth Estimation」を利用した手順解説
  • ジオメトリノードとマテリアル設定がポイント

🚀

【Groq】一秒で500トークン、GPT-4の25倍のスピードで出力できるAIを使ってみた | WEEL

  • 言語生成AI「Groq」がGPTより高速でテキスト生成
  • 1秒で500トークン出力可能、計算能力がGPUやCPUを凌駕
  • 「Mixtral-8x7B」モデルで高精度な生成、商用利用も可能

🗣️

大規模言語モデルを作る、拡張する - Speaker Deck

  • 大規模言語モデルの作成方法を紹介
  • 事前学習、事後学習、モデル選定・評価の3段階
  • LLM、RAG、Agentsに焦点を当てる

🆕

Weekly AI News #31 - by hotchpotch - Weekly AI News

  • 新AIモデル「Gemma」が公開される
  • Gemini 1.5は最大100万トークン処理
  • Soraはテキストから動画生成が可能

🤖

Weekly Kaggle News #219 - by u++ - Weekly Kaggle News

  • Googleの新言語モデル「Gemma」の活用コンペが開始
  • 「Home Credit」コンペがデータ更新で中断・延期
  • 「SenNet + HOA」の上位解法記事が公開

📘

RAG構築のためのAzure OpenAI Serviceリファレンスアーキテクチャ詳解 | SIOS Tech. Lab

  • Azureで提供される設計パターンを解説
  • RAGを用いた企業内チャットと文書検索の向上
  • Azure Cognitive Search活用で迅速な質問応答システム構築

🙏

Geminiが「人種的に多様なナチス」を生成したことをGoogleが謝罪 - GIGAZINE

  • AIが歴史的画像で不正確な人種多様性を生成
  • 不適切な結果に対し、調整の方針を示す
  • AI原則に基づき、グローバルなユーザーを反映

😅

Geminiの画像生成機能が停止中 ダイバーシティ過剰適応問題対策で - ITmedia NEWS

  • 人物画像生成機能が一時停止
  • 不正確な歴史的描写の修正へ
  • 多様性過剰適応の問題指摘

👌

Ultimate guide to optimizing Stable Diffusion XL - FΓ©lix Sanz

  • SDXLを最適化し、低スペックのグラフィックスカードでも高品質な画像生成
  • 異なる最適化技術の活用方法を解説し、実用的なアドバイスを提供
  • 最適化の結果を比較し、推論時間やメモリ使用量を詳細に分析

🤗

πŸͺ† Introduction to Matryoshka Embedding Models

  • マトリョーシカ埋め込みの概念と有用性を解説
  • トレーニング方法とSentence Transformersの活用を説明
  • 実用的なガイダンスとモデル比較、デモを提供

😲

「AI独立国家(Sovereign AI)」時代に備えよ|NVIDIA:Jensen Huang CEO インタビュー - BRIDGE..

  • 2024年度第4四半期の売上高は前年比265%増の221億ドル
  • AIの成長に貢献し、市場価値は1兆6,670億ドルを超える
  • GPUの重要性を強調し、AI独立国家の概念を提唱

🎨

Stable Diffusion 3 — Stability AI Japan

  • 800Mから8Bのパラメータを持つモデルシリーズ
  • 拡張性と品質のオプションでクリエイティブなニーズに対応
  • 安全策を導入し、生成AIのオープンで安全なアクセスを保証

🛡️

Introducing the Red-Teaming Resistance Leaderboard

  • 最先端モデルの堅牢性を調査するベンチマークを発表
  • 極端な赤チーム活動に耐えるモデルの耐性をテスト
  • 問題のある出力の可能性が高い箇所を明らかに

😅

pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama

  • PDFからテキスト抽出はテキストマイニングにおいて重要
  • PyMuPDFは抽出性能が高いが、改行の問題が存在
  • ヘッダーやフッターの修正が抽出時に必要となることも

🚀

I Spent a Week With Gemini Pro 1.5—It’s Fantastic

  • コンテキストウィンドウのサイズが重要なポイントに
  • 新しいプライベートベータLLMで前モデルを超える性能
  • 個人データを活用し、より一貫した結果を提供

🚀

GitHub - google/gemma.cpp: lightweight, standalone C++ inference engine for Google's Gemma..

  • Gemmaモデル用C++推論エンジンの軽量実装
  • Gemma 2Bと7Bモデルの最小限の実装を提供
  • 開発はdevブランチ、安定版はmainブランチで進行

🌐

Tinder Owner Signs ChatGPT Deal. Enjoy the AI Dating Tidal Wave

  • 出会い系アプリ大手がAI企業と提携
  • 従業員の業務をAIがサポート
  • オンラインデートにAIを全面的に導入予定

💪

Mutale Nkonde's nonprofit is working to make AI less biased | TechCrunch

  • AI革命に貢献した女性の業績を強調するインタビューシリーズ開始
  • 非営利団体「AI For the People」創設者はテクノロジーで黒人の声を増加
  • 米国下院にアルゴリズム関連法案を導入に貢献し、現在は研究所フェロー

🐍

Mamba: The Easy Way

  • Transformerモデルは長いシーケンスで遅くなる問題を抱えている
  • Mambaは線形時間でスケーリングし、長いコンテキストを扱える新技術
  • S4に基づくMambaは、RNNとCNNの利点を組み合わせたアーキテクチャ

🖼️

Stable Diffusion 3発表 「画像内でのアルファベット表記」が可能に - Impress Watch

  • 新しいテキスト画像変換モデルが先行プレビューを開始
  • 画像内アルファベット表記が可能になる性能向上を実現
  • 800Mから8Bのパラメータで拡張性と品質を提供

💡

OK-Robot: What Really Matters in Integrating Open-Knowledge Models for Robotics

  • ロボティクス向けオープンナレッジモデルの統合の要点を解説
  • 2024年に発表された関連論文について言及
  • 著者にはLiu, Peiqiらが名を連ねる

🚀

AMD ROCm™ software blogs — ROCm Blogs

  • AMD GPUを活用した安定した拡散モデルの画像生成
  • LoRAを用いた大規模言語モデルのカスタマイズと効率化
  • 複数のAMD GPUで加速されるXGBoostとBERTの事前トレーニング

👾

AIが漫画を描いて、人間は確定申告に奔走――そうならないための付き合い方を考えてみた - ITmed..

  • AIがゲームや漫画を楽しむ一方で人間は確定申告に追われる
  • AIと人間の役割分担の重要性と導入時の注意点を指摘
  • DX推進と経営層の理解がAI活用の鍵として強調

👨‍💻

GemmaをGoogle ColabやローカルPCで動かす

  • Google Colabではブラウザがあれば実行可能
  • ローカルPCはLinux環境での実行が必要
  • Dockerセットアップ後、GitHub手順で動作

🤖

Treating a chatbot nicely might boost its performance -- here's why | TechCrunch

  • 礼儀正しいリクエストがAIのパフォーマンス向上に影響
  • 感情的プロンプトはセーフガードを無視するリスクも
  • プロンプト作成は専門職としての需要が高まっている

🙇‍♂️

'Embarrassing and wrong': Google admits it lost control of image-generating AI | TechCrunc..

  • GoogleがAIの画像生成モデルの問題で謝罪
  • 歴史的文脈を無視し多様性を強調した結果
  • トレーニングデータの偏りが原因と説明

🏠

Virtual Staging AI helps Realtors digitally furnish rooms within seconds | TechCrunch

  • 不動産のハウスステージングにAIを活用
  • 仮想的に物件をステージングするサービス
  • 月額サブスクリプションで業界変革を目指す

🤖

Fine-Tuning Gemma Models in Hugging Face

  • Gemma言語モデルはHugging Faceで利用可能
  • 20億と70億のパラメータサイズを持つ
  • 無料のGPUでColabを通じて実験が行える

😎

Generative Models: What do they know?

  • 生成モデルが画像の固有要素を学習する可能性について研究
  • I-LoRAを用いて生成モデルをシーン固有の予測器に変換
  • 新技術で生成モデルのパラメータの0.6%未満で高品質マップ抽出

2024年02月24日

|

このサイトについて

/

ニュースレター

/

@AINewsDev