AI News

~AI関連記事を3行にまとめて紹介~

📚

「面倒なことはChatGPTにやらせよう」を講談社から出版します。|カレーちゃん

  • 2024年1月29日頃、新刊「面倒なことはChatGPTにやらせよう」発売予定
  • 12月14日に著者と編集者がXで本の話をするイベント開催
  • ChatGPTの活用法を紹介し、自動化や省力化を目指す内容

🤔

The limitations of deep learning

  • ディープラーニングは単純な幾何学的変換の連鎖で構成される
  • 入力データはベクトル化され、幾何学的空間で処理される
  • 現在の技術では推論やアルゴリズム操作などには限界がある

🤖

テスラ、ヒト型ロボット「Optimus Gen 2」公開。手足の動作がよりなめらかに | テクノエッジ Tec..

  • 新型ヒト型ロボットの動作が前世代より自然に
  • 手の自由度は11DoFで生卵も扱える精度
  • 外観は10kg減量し、安心感のあるデザインに

🤖

ChatGPT: Everything you need to know about the AI chatbot

  • AIチャットボットは世界中で注目を集めている
  • 92%以上の大企業が利用し、業界に影響を与えている
  • 競合他社の動向やAIの将来性に関する議論が活発化

👌

Prompt Flowで評価Flowを自作してRAGのイケてるLLMOpsを実現してみた - ENGINEERING BLOG ドコモ..

  • RAGアプリ運用でLLMOpsが重要
  • Azure OpenAI ServiceのPrompt Flow活用
  • 評価Flow自作で回答内容の正確性向上

📸

生成AIグラビアをグラビアカメラマンが作るとどうなる?第14回:2023年下半期まとめ+α 13回分..

  • 連載開始から13回分のAIグラビアを振り返り
  • 生成AIの進化の速さと過去の内容の陳腐化に言及
  • SD 1.5やSDXL、OpenPoseなどの技術を解説

😎

これは21世紀の着せ替え人形か!?どんな服も着せられるAIが登場|shi3z

  • 指定モデルに任意の服を着せるAI「Outfit Anyone」が登場
  • アニメーションも可能で、忍者コスチュームなど多様な衣装に対応
  • 男女数名のモデル選択可能だが、モデル変更はできず

🆕

Vertex AI(Gemini API)でGemini Proを試す

  • 2023年12月にマルチモーダルモデル「Gemini Pro」が利用開始
  • テキスト生成やチャットに適したモデルで料金は1000文字ごと
  • Vertex AI StudioやSDKを通じて利用可能

🆓

Google新AIの「Gemini Pro」、Google Cloud開発者と大企業に無償プレビュー開始 - PC Watch

  • 「Gemini Pro」の無償プレビューを開始
  • 「Google AI Studio」と「Vertex AI」からアクセス可能
  • 2024年に一般提供開始予定で低価格化

🚀

社内業務の生産性を爆上げしたGPTs / 利用推進のための取り組み|little_hand_s

  • GPTsを活用し社内業務の生産性向上
  • ChatGPTの説明会やポリシー策定で推進
  • フェーズごとのアプローチでGPTs展開支援

🎨

Concept Sliders: LoRA Adaptors for Precise Control in Diffusion Models

  • 画像生成モデルにおけるコンセプトの微調整を可能にする「コンセプトスライダー」を提案
  • テキストや画像ペアを用いたトレーニングで、属性の強度を細かく調整
  • アーティストが創造的なビジョンを具現化するための新たな手法を開発

🤖

GitHub - microsoft/windows-ai-studio

  • 最新のAI開発ツールとモデルを統合
  • AIモデルカタログをローカルで微調整・テスト可能
  • 将来的には任意のWindowsハードウェアでAIモデル実行予定

🎶

テキストから歌を生成「Suno AI」使い方 作曲家 神前暁もクオリティに驚愕 - KAI-YOU.net

  • 自動作曲AIサービスがSNSで話題
  • 歌詞と音楽スタイル指定で楽曲生成
  • 日本語歌詞や音質に課題も

🌟

Google Gemini API: New developer and enterprise AI products

  • Gemini Proは開発者や企業向けに提供開始、多様な機能を搭載
  • 無料で利用可能なGoogle AI Studioで迅速なプロンプト開発が可能
  • Vertex AIを通じてエンタープライズレベルのAIプラットフォームを提供

😊

Quickstart: Use GPT-4 Turbo with Vision on your images and videos with the Azure Open AI S..

  • GPT-4 Turbo with Visionで画像をAIチャットに活用
  • Azure OpenAI Studioからデプロイメント作成
  • チャットで画像アップロード後、出力を確認

🚀

Azure OpenAI Service で GPT-4 Turbo with Vision を使う

  • GPT-4 Turboのプレビューが開始、機能改良が実施されている
  • テキストと画像のマルチモーダル入力に対応
  • 利用可能リージョンは4箇所、価格等の詳細は公式ドキュメント参照

🤖

Googleの新AI「Gemini Pro」がAPI経由で提供 ~無料で1分あたり60リクエストまで利用可能 - 窓の..

  • 新AI「Gemini Pro」がAPIで利用開始
  • 1分間に60リクエストまで無料
  • Web開発者ツール「Google AI Studio」提供

📸

Instagram introduces gen-AI powered background editing tool | TechCrunch

  • Instagramが生成AIを使った背景編集ツールを米国ユーザーに提供
  • 「赤いカーペット上で」などのプロンプトで背景変更可能
  • 他ユーザーは「試してみる」ステッカーで同ツールを体験

😮

単一画像から高品質3Dオブジェクトを生成できるAIモデル「Stable Zero123」 - PC Watch

  • 単一画像から3Dオブジェクトを生成するAIモデルを発表
  • 非商用・研究用に公開、高品質な3D生成を可能に
  • 立面コンディショニングにより物体の多角的理解を実現

😅

Shtetl-Optimized » Blog Archive » On being wrong about AI

  • AIに関する過去の見解に誤りがあったことを認める
  • AIの進歩を予測する原則が未だに不明瞭である
  • 将来のAIの影響についての不確実性を感じている

🎶

音楽生成AI「Suno AI」が話題、文章から楽曲を瞬時に作成 プロの音楽家も「これはヤバい」と驚..

  • 文章から楽曲を自動生成するAIが注目を集める
  • プロの音楽家も驚愕、Webブラウザで利用可能
  • 無料で1日5回音楽生成、有料プランも展開

🌐

AIを使って数分でホームページを作成&無料公開できる「Solo」をFirefox開発元のMozillaがリリー..

  • AIを活用したホームページ作成ツール「Solo」が登場
  • 文章入力やフォント選択で簡単に見栄えの良いページを制作
  • Soloアカウントで公開可能、将来的に日本語対応も予定

📚

Gemini のドキュメントと API リファレンス  |  Google AI for Developers

  • Googleの大規模言語モデルファミリー「Gemini」の利用方法を解説
  • ブラウザ上でプロトタイプを作成可能な「Google AI Studio」を紹介
  • Geminiは多言語対応で、安全性に関するガイダンスも提供

🤖

司法機関がAIをどのように用いるべきかを示すガイドラインが登場 - GIGAZINE

  • 司法府がAI利用のガイドラインを発表
  • AIの正確性とバイアスに注意し、セキュリティを確保
  • AIツール使用時の責任は個人にあり、問題事例も報告

😲

AIで作曲できるツールが想像以上にクオリティ高くて驚く→有名コピペに音を付けられる一方倫理的..

  • AI作曲ツールのクオリティに驚き
  • 有名コピペへの音付けに倫理的課題
  • アレンジやメロディ生成が高レベル

👨‍⚕️

Google、医療特化の大規模言語モデル「MedLM」の提供開始 - ITmedia NEWS

  • 医療業界向けの新言語モデル「MedLM」が登場
  • 医療研究や診断、文書作成に活用可能
  • 米国での提供はGoogle Cloudの「Vertex AI」経由

🤖

ASCII.jp:バイバイDiscord、Midjourneyのスタンドアロン型アプリが登場か?

  • 生成AIサービスがスタンドアロン型アプリを開発中
  • アルファ版は10k以上の画像生成ユーザーに公開
  • 直感的UIで画像制御・後処理が可能なアプリ

🆕

機械学習ベンチマークアプリ「Geekbench ML v0.6 for iOS/Android (Preview)」がmacOSとWindows..

  • 「Geekbench ML v0.6」がmacOS、Windows、Linuxにも対応
  • 機械学習ワークロードに新たなテストを追加
  • 2024年に正式リリース予定の「Geekbench ML v1.0」

🔍

Distributional wants to develop software to reduce AI risk | TechCrunch

  • AIリスク軽減のためのソフトウェア開発に注力
  • AIのテスト・評価をスケーリングし標準化する目標
  • 大規模な言語モデルの「害」を検出・診断する製品

😮

AI in Intimate Roles: Girlfriends and Therapists - KDnuggets

  • 感情AIが人間の感情を分析し、セラピーに応用される可能性
  • AIパートナーの普及が社会的相互作用や出生率に影響を与える恐れ
  • AIセラピストがメンタルヘルスケアのアクセス向上に貢献する展望

😅

AI isn't and won't soon be evil or even smart, but it's also irreversibly pervasive | Tech..

  • AIは人類を脅かす存在ではなく、誤情報の層として浸透
  • ChatGPTの人気は創造者の期待を超え、定着する影響を与える
  • AIによる誤りや不正確さは、デジタル層として無視できない

💢

How 3 Turing Awardees Republished Key Methods and Ideas Whose Creators They Failed to Cred..

  • ターリング賞受賞者がクレジットせずに手法を再発表
  • 音声認識・機械翻訳の功績、実際は別の研究室の成果
  • LeCunが挙げた5つのアイデア、古い研究からのもの

🚀

GitHub - S-LoRA/S-LoRA: S-LoRA: Serving Thousands of Concurrent LoRA Adapters

  • 多数のLoRAアダプタをスケーラブルに提供するシステムを提案
  • 統一ページングとカスタムCUDAカーネルで効率的なGPU利用を実現
  • 最大4倍のスループット向上と大量のアダプタ提供が可能

👩‍💻

Google、AIによるコード補完やコード生成を実現する「Duet AI for Developers」正式リリース。数..

  • AIによるコード補完・生成を実現する新サービスが登場
  • 20以上の言語に対応し、VSCodeなどで利用可能
  • 2024年2月1日まで無償提供、Geminiの組み込みも予定

🔒

AI規制の法制化を 自民党部会が提言 欧米念頭「企業に報告義務」:朝日新聞デジタル

  • AIの安全性確保のため新法を政府に提言
  • 欧米の動向を受け、情報開示の法的枠組みを検討
  • 来年の国会で立法化を目指すとの緊急提言

😉

大規模言語モデルを自作しよう!(Transformers+DeepSpeed+torch.compile+flash_attn2)

  • 自然言語処理ライブラリ「Transformers」でLLMの事前学習が可能
  • 300M規模のMistralモデルを使用した事前学習・ファインチューニング法を紹介
  • ソースコードは「japanese-mistral-300m-recipe」で公開、解説記事あり

🔬

OpenAI thinks superhuman AI is coming -- and wants to build tools to control it | TechCrun..

  • 人間を超えるAIの制御方法を研究するチームが活動中
  • AIが意図した通りに振る舞う保証の研究を発表
  • 弱いAIモデルを使い、強いAIの方向性を導くアプローチを採用

👩‍💻

How AWS Prototyping enabled ICL-Group to build computer vision models on Amazon SageMaker ..

  • 多国籍企業がAWSプロトタイピングでコンピュータビジョンモデルを開発
  • 鉱山機械の自動監視を目的とした内部能力の構築に成功
  • Amazon SageMakerを活用し、将来的に数千台のカメラにスケール可能

📄

Automate PDF pre-labeling for Amazon Comprehend | AWS Machine Learning Blog

  • PDFドキュメントの自動事前ラベリングを実現
  • AWS Step Functionsを活用したプレラベリングツールを構築
  • 手動注釈付けの労力を大幅に削減し効率化

👍

Improve your Stable Diffusion prompts with Retrieval Augmented Generation | AWS Machine Le..

  • RAGを使い文脈あるドキュメントでプロンプトを強化
  • テキストから画像生成に効果的なプロンプト作成法を紹介
  • 様々な産業でのRAG活用法を具体例を交えて解説

🤖

Spotify confirms test of prompt-based AI playlists feature | TechCrunch

  • AI技術を用いたプレイリスト作成機能がテスト中
  • 「Your Library」タブからアクセス可能な新オプション
  • ユーザーのプロンプト入力でカスタムプレイリストを生成

🤝

Streamlining ETL data processing at Talent.com with Amazon SageMaker | AWS Machine Learnin..

  • 求人リストを集約し、30,000,000以上の機会を提供
  • AWSと協力し、深層学習による推薦エンジンを開発
  • 1時間で500万件のレコードを処理するETLパイプライン実装

😱

The AI trust crisis

  • Dropboxの新AI機能に対する批判が高まる
  • ユーザーのプライベートデータがトレーニングに使われる懸念
  • OpenAIへの信頼が問題となる

🛡️

Superalignment Fast Grants

  • 超知能の到来に備え、AIシステムの安全な整列に向けた助成金プログラムを開始
  • 100,000ドルから2,000,000ドルの助成金を提供し、AIの解釈可能性やスケーラブルな監視を研究
  • 新しい研究者の参加を奨励し、AIの未来にとって重要な貢献を目指す

👏

Weak-to-strong generalization

  • 小さなモデルで大きなモデルを監督する研究を実施
  • GPT-2がGPT-4の機能を引き出し、GPT-3.5に近い性能を実現
  • 将来の超人工知能モデル整合化への新たな研究方向を提示

👨‍💼

Intel CEO attacks Nvidia on AI: 'The entire industry is motivated to eliminate the CUDA ma..

  • Intel CEOがNvidiaのCUDA技術に対し攻撃的な発言
  • AIの推論技術の重要性とPythonicプログラミングレイヤーへの移行を強調
  • OpenVINOを推進し、ミックスコンピューティングの世界を予測

🎉

グーグルの新AIモデル「Gemini Pro」、プレビュー提供開始 - Impress Watch

  • 新AIモデル「Gemini Pro」のプレビューが開始される
  • テキストと画像の入力に対応し38言語をサポート
  • Google AI Studioでは60リクエスト/分まで無料

🤖

Agility is using large language models to communicate with its humanoid robots | TechCrunc..

  • ロボットのコミュニケーション手段として生成型AIの活用が進む
  • 自然言語での指示により、ロボットが複雑なタスクを実行
  • 生成型AIを用いたロボットの学習加速や動作計画の解決に貢献

🤖

DeepMind AI outdoes human mathematicians on unsolved problem

  • AIが数学の未解決問題に新たな進展を遂げる
  • FunSearchは組合せ論の問題に対する解を生成
  • 数学者とAIの協力モードが新たな可能性を示唆

🤖

Practices for Governing Agentic AI Systems

  • エージェンティックAIシステムの安全性研究に助成金を提供
  • 責任ある統合のための基本的なベストプラクティスが重要
  • 運用化の不確実性解決と追加ガバナンスフレームワークが必要

🆕

GitHub - vitoplantamura/OnnxStream at c0cb4b3d7b419e4b10129904fbe16b850ca5d385

  • Stable Diffusion XL Turbo 1.0のサポートを追加
  • Raspberry Pi Zero 2で大規模モデルを実行
  • OnnxStreamはメモリ消費を最小化する推論ライブラリ

🚀

GitHub - microsoft/promptbase: All things prompt engineering

  • GPT-4などのモデル性能を最大化するリソース集
  • Medprompt手法を含むプロンプト技術の例示
  • 科学的プロンプトエンジニアリングに関するコンテンツ予定

🚀

Boost productivity on Amazon SageMaker Studio: Introducing JupyterLab Spaces and generativ..

  • SageMaker StudioがJupyterLab Spacesを導入
  • 柔軟なMLワークフローの構築を支援
  • 生成AIツールでコーディング効率を向上

📸

Introducing Stable Zero123: Quality 3D Object Generation from Single Images — Stability A..

  • 単一画像から高品質な3Dオブジェクト生成を実現
  • 改善されたトレーニングデータセットと高度な条件付けで品質向上
  • 非商用・研究目的でリリース、商用利用は問い合わせ必要

😎

GPT-4Vを使ってゲーム実況させる #ChatGPT - Qiita

  • GPT-4Vを使いゲーム実況スクリプトを自動生成
  • APIキー設定後、ゲーム動画を入力として使用
  • リアルタイムでの実況も可能、高い状況認識能力

2023年12月15日

|

このサイトについて

/

ニュースレター

/

@AINewsDev