~AI関連記事を3行にまとめて紹介~
📚
「面倒なことはChatGPTにやらせよう」を講談社から出版します。|カレーちゃん
2024年1月29日頃、新刊「面倒なことはChatGPTにやらせよう」発売予定
12月14日に著者と編集者がXで本の話をするイベント開催
ChatGPTの活用法を紹介し、自動化や省力化を目指す内容
🤔
The limitations of deep learning
ディープラーニングは単純な幾何学的変換の連鎖で構成される
入力データはベクトル化され、幾何学的空間で処理される
現在の技術では推論やアルゴリズム操作などには限界がある
🤖
テスラ、ヒト型ロボット「Optimus Gen 2」公開。手足の動作がよりなめらかに | テクノエッジ Tec..
新型ヒト型ロボットの動作が前世代より自然に
手の自由度は11DoFで生卵も扱える精度
外観は10kg減量し、安心感のあるデザインに
🤖
ChatGPT: Everything you need to know about the AI chatbot
AIチャットボットは世界中で注目を集めている
92%以上の大企業が利用し、業界に影響を与えている
競合他社の動向やAIの将来性に関する議論が活発化
👌
Prompt Flowで評価Flowを自作してRAGのイケてるLLMOpsを実現してみた - ENGINEERING BLOG ドコモ..
RAGアプリ運用でLLMOpsが重要
Azure OpenAI ServiceのPrompt Flow活用
評価Flow自作で回答内容の正確性向上
📸
生成AIグラビアをグラビアカメラマンが作るとどうなる?第14回:2023年下半期まとめ+α 13回分..
連載開始から13回分のAIグラビアを振り返り
生成AIの進化の速さと過去の内容の陳腐化に言及
SD 1.5やSDXL、OpenPoseなどの技術を解説
😎
これは21世紀の着せ替え人形か!?どんな服も着せられるAIが登場|shi3z
指定モデルに任意の服を着せるAI「Outfit Anyone」が登場
アニメーションも可能で、忍者コスチュームなど多様な衣装に対応
男女数名のモデル選択可能だが、モデル変更はできず
🆕
Vertex AI(Gemini API)でGemini Proを試す
2023年12月にマルチモーダルモデル「Gemini Pro」が利用開始
テキスト生成やチャットに適したモデルで料金は1000文字ごと
Vertex AI StudioやSDKを通じて利用可能
🆓
Google新AIの「Gemini Pro」、Google Cloud開発者と大企業に無償プレビュー開始 - PC Watch
「Gemini Pro」の無償プレビューを開始
「Google AI Studio」と「Vertex AI」からアクセス可能
2024年に一般提供開始予定で低価格化
🚀
社内業務の生産性を爆上げしたGPTs / 利用推進のための取り組み|little_hand_s
GPTsを活用し社内業務の生産性向上
ChatGPTの説明会やポリシー策定で推進
フェーズごとのアプローチでGPTs展開支援
🎨
Concept Sliders: LoRA Adaptors for Precise Control in Diffusion Models
画像生成モデルにおけるコンセプトの微調整を可能にする「コンセプトスライダー」を提案
テキストや画像ペアを用いたトレーニングで、属性の強度を細かく調整
アーティストが創造的なビジョンを具現化するための新たな手法を開発
🤖
GitHub - microsoft/windows-ai-studio
最新のAI開発ツールとモデルを統合
AIモデルカタログをローカルで微調整・テスト可能
将来的には任意のWindowsハードウェアでAIモデル実行予定
🎶
テキストから歌を生成「Suno AI」使い方 作曲家 神前暁もクオリティに驚愕 - KAI-YOU.net
自動作曲AIサービスがSNSで話題
歌詞と音楽スタイル指定で楽曲生成
日本語歌詞や音質に課題も
🌟
Google Gemini API: New developer and enterprise AI products
Gemini Proは開発者や企業向けに提供開始、多様な機能を搭載
無料で利用可能なGoogle AI Studioで迅速なプロンプト開発が可能
Vertex AIを通じてエンタープライズレベルのAIプラットフォームを提供
😊
Quickstart: Use GPT-4 Turbo with Vision on your images and videos with the Azure Open AI S..
GPT-4 Turbo with Visionで画像をAIチャットに活用
Azure OpenAI Studioからデプロイメント作成
チャットで画像アップロード後、出力を確認
🚀
Azure OpenAI Service で GPT-4 Turbo with Vision を使う
GPT-4 Turboのプレビューが開始、機能改良が実施されている
テキストと画像のマルチモーダル入力に対応
利用可能リージョンは4箇所、価格等の詳細は公式ドキュメント参照
🤖
Googleの新AI「Gemini Pro」がAPI経由で提供 ~無料で1分あたり60リクエストまで利用可能 - 窓の..
新AI「Gemini Pro」がAPIで利用開始
1分間に60リクエストまで無料
Web開発者ツール「Google AI Studio」提供
📸
Instagram introduces gen-AI powered background editing tool | TechCrunch
Instagramが生成AIを使った背景編集ツールを米国ユーザーに提供
「赤いカーペット上で」などのプロンプトで背景変更可能
他ユーザーは「試してみる」ステッカーで同ツールを体験
😮
単一画像から高品質3Dオブジェクトを生成できるAIモデル「Stable Zero123」 - PC Watch
単一画像から3Dオブジェクトを生成するAIモデルを発表
非商用・研究用に公開、高品質な3D生成を可能に
立面コンディショニングにより物体の多角的理解を実現
😅
Shtetl-Optimized » Blog Archive » On being wrong about AI
AIに関する過去の見解に誤りがあったことを認める
AIの進歩を予測する原則が未だに不明瞭である
将来のAIの影響についての不確実性を感じている
🎶
音楽生成AI「Suno AI」が話題、文章から楽曲を瞬時に作成 プロの音楽家も「これはヤバい」と驚..
文章から楽曲を自動生成するAIが注目を集める
プロの音楽家も驚愕、Webブラウザで利用可能
無料で1日5回音楽生成、有料プランも展開
🌐
AIを使って数分でホームページを作成&無料公開できる「Solo」をFirefox開発元のMozillaがリリー..
AIを活用したホームページ作成ツール「Solo」が登場
文章入力やフォント選択で簡単に見栄えの良いページを制作
Soloアカウントで公開可能、将来的に日本語対応も予定
📚
Gemini のドキュメントと API リファレンス | Google AI for Developers
Googleの大規模言語モデルファミリー「Gemini」の利用方法を解説
ブラウザ上でプロトタイプを作成可能な「Google AI Studio」を紹介
Geminiは多言語対応で、安全性に関するガイダンスも提供
🤖
司法機関がAIをどのように用いるべきかを示すガイドラインが登場 - GIGAZINE
司法府がAI利用のガイドラインを発表
AIの正確性とバイアスに注意し、セキュリティを確保
AIツール使用時の責任は個人にあり、問題事例も報告
😲
AIで作曲できるツールが想像以上にクオリティ高くて驚く→有名コピペに音を付けられる一方倫理的..
AI作曲ツールのクオリティに驚き
有名コピペへの音付けに倫理的課題
アレンジやメロディ生成が高レベル
👨⚕️
Google、医療特化の大規模言語モデル「MedLM」の提供開始 - ITmedia NEWS
医療業界向けの新言語モデル「MedLM」が登場
医療研究や診断、文書作成に活用可能
米国での提供はGoogle Cloudの「Vertex AI」経由
🤖
ASCII.jp:バイバイDiscord、Midjourneyのスタンドアロン型アプリが登場か?
生成AIサービスがスタンドアロン型アプリを開発中
アルファ版は10k以上の画像生成ユーザーに公開
直感的UIで画像制御・後処理が可能なアプリ
🆕
機械学習ベンチマークアプリ「Geekbench ML v0.6 for iOS/Android (Preview)」がmacOSとWindows..
「Geekbench ML v0.6」がmacOS、Windows、Linuxにも対応
機械学習ワークロードに新たなテストを追加
2024年に正式リリース予定の「Geekbench ML v1.0」
🔍
Distributional wants to develop software to reduce AI risk | TechCrunch
AIリスク軽減のためのソフトウェア開発に注力
AIのテスト・評価をスケーリングし標準化する目標
大規模な言語モデルの「害」を検出・診断する製品
😮
AI in Intimate Roles: Girlfriends and Therapists - KDnuggets
感情AIが人間の感情を分析し、セラピーに応用される可能性
AIパートナーの普及が社会的相互作用や出生率に影響を与える恐れ
AIセラピストがメンタルヘルスケアのアクセス向上に貢献する展望
😅
AI isn't and won't soon be evil or even smart, but it's also irreversibly pervasive | Tech..
AIは人類を脅かす存在ではなく、誤情報の層として浸透
ChatGPTの人気は創造者の期待を超え、定着する影響を与える
AIによる誤りや不正確さは、デジタル層として無視できない
💢
How 3 Turing Awardees Republished Key Methods and Ideas Whose Creators They Failed to Cred..
ターリング賞受賞者がクレジットせずに手法を再発表
音声認識・機械翻訳の功績、実際は別の研究室の成果
LeCunが挙げた5つのアイデア、古い研究からのもの
🚀
GitHub - S-LoRA/S-LoRA: S-LoRA: Serving Thousands of Concurrent LoRA Adapters
多数のLoRAアダプタをスケーラブルに提供するシステムを提案
統一ページングとカスタムCUDAカーネルで効率的なGPU利用を実現
最大4倍のスループット向上と大量のアダプタ提供が可能
👩💻
Google、AIによるコード補完やコード生成を実現する「Duet AI for Developers」正式リリース。数..
AIによるコード補完・生成を実現する新サービスが登場
20以上の言語に対応し、VSCodeなどで利用可能
2024年2月1日まで無償提供、Geminiの組み込みも予定
🔒
AI規制の法制化を 自民党部会が提言 欧米念頭「企業に報告義務」:朝日新聞デジタル
AIの安全性確保のため新法を政府に提言
欧米の動向を受け、情報開示の法的枠組みを検討
来年の国会で立法化を目指すとの緊急提言
😉
大規模言語モデルを自作しよう!(Transformers+DeepSpeed+torch.compile+flash_attn2)
自然言語処理ライブラリ「Transformers」でLLMの事前学習が可能
300M規模のMistralモデルを使用した事前学習・ファインチューニング法を紹介
ソースコードは「japanese-mistral-300m-recipe」で公開、解説記事あり
🔬
OpenAI thinks superhuman AI is coming -- and wants to build tools to control it | TechCrun..
人間を超えるAIの制御方法を研究するチームが活動中
AIが意図した通りに振る舞う保証の研究を発表
弱いAIモデルを使い、強いAIの方向性を導くアプローチを採用
👩💻
How AWS Prototyping enabled ICL-Group to build computer vision models on Amazon SageMaker ..
多国籍企業がAWSプロトタイピングでコンピュータビジョンモデルを開発
鉱山機械の自動監視を目的とした内部能力の構築に成功
Amazon SageMakerを活用し、将来的に数千台のカメラにスケール可能
📄
Automate PDF pre-labeling for Amazon Comprehend | AWS Machine Learning Blog
PDFドキュメントの自動事前ラベリングを実現
AWS Step Functionsを活用したプレラベリングツールを構築
手動注釈付けの労力を大幅に削減し効率化
👍
Improve your Stable Diffusion prompts with Retrieval Augmented Generation | AWS Machine Le..
RAGを使い文脈あるドキュメントでプロンプトを強化
テキストから画像生成に効果的なプロンプト作成法を紹介
様々な産業でのRAG活用法を具体例を交えて解説
🤖
Spotify confirms test of prompt-based AI playlists feature | TechCrunch
AI技術を用いたプレイリスト作成機能がテスト中
「Your Library」タブからアクセス可能な新オプション
ユーザーのプロンプト入力でカスタムプレイリストを生成
🤝
Streamlining ETL data processing at Talent.com with Amazon SageMaker | AWS Machine Learnin..
求人リストを集約し、30,000,000以上の機会を提供
AWSと協力し、深層学習による推薦エンジンを開発
1時間で500万件のレコードを処理するETLパイプライン実装
😱
The AI trust crisis
Dropboxの新AI機能に対する批判が高まる
ユーザーのプライベートデータがトレーニングに使われる懸念
OpenAIへの信頼が問題となる
🛡️
Superalignment Fast Grants
超知能の到来に備え、AIシステムの安全な整列に向けた助成金プログラムを開始
100,000ドルから2,000,000ドルの助成金を提供し、AIの解釈可能性やスケーラブルな監視を研究
新しい研究者の参加を奨励し、AIの未来にとって重要な貢献を目指す
👏
Weak-to-strong generalization
小さなモデルで大きなモデルを監督する研究を実施
GPT-2がGPT-4の機能を引き出し、GPT-3.5に近い性能を実現
将来の超人工知能モデル整合化への新たな研究方向を提示
👨💼
Intel CEO attacks Nvidia on AI: 'The entire industry is motivated to eliminate the CUDA ma..
Intel CEOがNvidiaのCUDA技術に対し攻撃的な発言
AIの推論技術の重要性とPythonicプログラミングレイヤーへの移行を強調
OpenVINOを推進し、ミックスコンピューティングの世界を予測
🎉
グーグルの新AIモデル「Gemini Pro」、プレビュー提供開始 - Impress Watch
新AIモデル「Gemini Pro」のプレビューが開始される
テキストと画像の入力に対応し38言語をサポート
Google AI Studioでは60リクエスト/分まで無料
🤖
Agility is using large language models to communicate with its humanoid robots | TechCrunc..
ロボットのコミュニケーション手段として生成型AIの活用が進む
自然言語での指示により、ロボットが複雑なタスクを実行
生成型AIを用いたロボットの学習加速や動作計画の解決に貢献
🤖
DeepMind AI outdoes human mathematicians on unsolved problem
AIが数学の未解決問題に新たな進展を遂げる
FunSearchは組合せ論の問題に対する解を生成
数学者とAIの協力モードが新たな可能性を示唆
🤖
Practices for Governing Agentic AI Systems
エージェンティックAIシステムの安全性研究に助成金を提供
責任ある統合のための基本的なベストプラクティスが重要
運用化の不確実性解決と追加ガバナンスフレームワークが必要
🆕
GitHub - vitoplantamura/OnnxStream at c0cb4b3d7b419e4b10129904fbe16b850ca5d385
Stable Diffusion XL Turbo 1.0のサポートを追加
Raspberry Pi Zero 2で大規模モデルを実行
OnnxStreamはメモリ消費を最小化する推論ライブラリ
🚀
GitHub - microsoft/promptbase: All things prompt engineering
GPT-4などのモデル性能を最大化するリソース集
Medprompt手法を含むプロンプト技術の例示
科学的プロンプトエンジニアリングに関するコンテンツ予定
🚀
Boost productivity on Amazon SageMaker Studio: Introducing JupyterLab Spaces and generativ..
SageMaker StudioがJupyterLab Spacesを導入
柔軟なMLワークフローの構築を支援
生成AIツールでコーディング効率を向上
📸
Introducing Stable Zero123: Quality 3D Object Generation from Single Images — Stability A..
単一画像から高品質な3Dオブジェクト生成を実現
改善されたトレーニングデータセットと高度な条件付けで品質向上
非商用・研究目的でリリース、商用利用は問い合わせ必要
😎
GPT-4Vを使ってゲーム実況させる #ChatGPT - Qiita
GPT-4Vを使いゲーム実況スクリプトを自動生成
APIキー設定後、ゲーム動画を入力として使用
リアルタイムでの実況も可能、高い状況認識能力
2023年12月15日
|
2023年12月13日
このサイトについて
/
ニュースレター
/
@AINewsDev