~AI関連記事を3行にまとめて紹介~
📝
LLMを用いたLLMの自動評価について 〜可能性と注意点〜 - NTT Communications Engineers' Blog
LLM-as-a-judgeは、実際のテキスト生成に即した評価が可能である
LLMの選択肢と評価の難しさ、LLM-as-a-judgeの勃興、具体的な方法論、利点について説明
従来の自然言語処理タスクによる評価とは異なり、注意点も存在
💻
ソフトウェア開発の真の問題点は、コードを書くことではなく、問題の複雑さの管理にある - YAMDA..
アプリケーションやツールのバージョンアップやセキュリティ要件は複雑さを増す要因となる
AIツールで生成されたコードも複雑さを解決するためには人間の理解とデバッグが必要
大規模言語モデルがエンタープライズ・プログラムを書ける日が来るかもしれないが、それを指示する人間が必要であり、複雑さを管理する問題に直面する
😲
Game of Thrones creator and other authors sue ChatGPT-maker for ‘theft’ | Technology New..
「ゲーム・オブ・スローンズ」の作者など17人の作家が、AI開発企業OpenAIを著作権侵害で訴えている。
OpenAIは、インターネットからスクレイピングしたトレーニングデータの使用は、米国の著作権法における合理的使用と主張。
作家たちは、ChatGPTプログラムが「大規模な商業活動」であり、「大規模な盗用に依存している」と主張している。
😲
Photoshopの正式版Fireflyを使ってみてビックリ! 今後にも超絶大期待ッ!!! - ケータイ Watch
2023年9月25日に公開されたAdobe Fireflyの正式版を使うと、Photoshopで簡単に画像生成が可能に
生成拡張や生成塗りつぶし機能を使えば、写真の周囲の風景を生成したり、写真にオブジェクトを追加できる
AIによる画像生成はまだ完璧ではないが、自然な画像生成には非常に優れている
💾
What is Two-Tower Embedding Model? - Hopsworks
二塔埋め込みモデルは、異なるモダリティの埋め込みを同じベクトル空間に配置するトレーニング方法です。
個別化推薦のための二塔モデルは、ユーザーの履歴とコンテキストを考慮して、数百万または数十億のアイテムのコーパスから候補アイテムを生成します。
二塔モデルの構築には、特徴データの収集と使用を管理するHopsworksプラットフォームが利用できます。
📚
【論文】Llama2 から学ぶ最新大規模言語モデル
Llama2は最新の大規模言語モデルで、英語におけるトップクラスの性能を誇る
指示と回答が含まれたデータセットを学習することで、タスクを解く能力を持つ
現時点では入出力がテキストに限られ、他の情報を含めることは難しい
🚫
動画に映る不要な物を自然に削除するソフト。GItHubで公開 - PC Watch
「ProPainter」は動画から不要な物を自然に消すことができるソフトウェアです
指定した物体を消すだけでなく、背景も生成し、その物体が存在しなかったかのような映像を出力します
既存の技術と比べて高品質でありながら、効率を向上させ、メモリ消費量を削減しています
🤖
AI搭載のロボットCEOは年中無休…「私は、組織の利益を最優先した偏りのない選択をする」 | Busi..
ポーランドの飲料会社がAIを搭載した人型ロボットのミカをCEOに任命
ミカは24時間365日働き、潜在的なクライアントの発掘やラム酒のボトルデザインなどを担当
ミカは組織の利益を最優先した偏りのない選択をすると述べている
😮
生成AIによる粗製乱造に対応か。KDPが1日あたりに出版できる本を上限3冊とするルールを追加【や..
Amazonの自費出版サービス「Kindle ダイレクト パブリッシング(KDP)」で、1日に出版できる本の冊数が3冊までに制限された
この制限は、生成AIによる粗製乱造に対応するための措置である
AIを利用して生成したアイデアをもとに自分自身でテキストや画像を作成した場合は申告は不要とされている
📚
生成AI・LLMのツール拡張に関する論文の動向調査 2023年8月版 - Platinum Data Blog by BrainPad
LLMにツールを使用することで、様々なタスクを実行可能に
RAGなどの検索した外部情報を利用した回答の生成や、コードの実行能力やAPIの使用能力を備えたアプリの開発が進行中
自律して動作するLLMの研究も盛んに行われている
🐍
Pythonプログラマからプロダクトオーナーへの道! Streamlitを利用した高速プロトタイピング入門..
Pythonを使ったアドホックな業務や研究経験者向けのセミナー
Streamlitを使ったアイディアや仮説からのプロトタイピング方法を学ぶ
Pythonの学生やエンジニアにおすすめ、無料参加
💻
ChatGPTにBlogを書かせる - ゆーすけべー日記
ワークショップでブログのWeb APIを作成
ChatGPTにAPIを使わせるプラグインを作成
ChatGPTがブログ記事を考えてWeb APIに投稿することに成功
📖
Webやアプリの日本語を読みやすく折り返す「BudouX」。GoogleがGitHubで公開 - PC Watch
「BudouX」はWebやアプリの日本語を読みやすく折り返すツールです
日本語と中国語をサポートし、20KB程度の軽量なマシンラーニングモデルを使用しています
単語の途中でテキストが折り返される問題に対応し、日本語では文節単位での折り返しも可能です
🎓
LLM Fine-Tuning (東大松尾研LLM講座 Day5資料) - Speaker Deck
東大松尾研サマースクール2023で使用した大規模言語モデルの講義資料
Fine-TuningのInstruction TuningとParameter Efficient Fine-Tuningについて解説
講座の詳細はリンクからご覧いただけます
😎
生成AIグラビアをグラビアカメラマンが作るとどうなる?第七回:自分で始める環境作りとお薦め機..
生成AIグラビアの制作に必要な環境や機材について解説
AUTOMATIC1111のインストール方法やリアルアジア系Modelのダウンロード方法を紹介
衣装やロケ地を自由に選べる無限のグラビア制作が可能
📊
30 Years of Data Science: A Review From a Data Science Practitioner - KDnuggets
データサイエンスの30年間の進化を実践者がレビュー
ニューラルネットワークから始まり、決定木、ランダムフォレスト、勾配ブースティングなどのアルゴリズムが登場
データの増加とコンピュータハードウェアの性能向上により、データサイエンスはエンジニアリングの問題となり、新しいツールとアルゴリズムが必要とされた
😮
実在の人物の3Dバーチャルヒューマン化、生成AIとの組み合わせでうまくいきそう(CloseBox) | ..
バーチャルヒューマン作成技術は進化し、生成AIやMetahuman Creatorなどが登場
Epic GamesのMetahuman Creatorはブラウザベースでリアルな人体モデルを制作可能
Character Creator + Headshotは顔写真から自動的に3Dモデルを作成し、パラメータの細かな調整も可能
📚
Azure OpenAI Service リファレンスアーキテクチャからみる本番システムレベルの LLM アプリに必..
ServerlessDays Tokyo 2023での講演内容を紹介
Azure OpenAI Serviceリファレンスアーキテクチャについて解説
本番システムレベルのLLMアプリに必要な検討項目を説明
🚀
生成AI基盤モデルの開発に係る事前調査を開始します (METI/経済産業省)
2023年9月22日から、生成AI基盤モデルの開発に関する事前調査が開始されます
NEDOが10月下旬から基盤モデル開発企業を公募する予定です
事前調査の概要や提出書類については、関連リンクをご確認ください
😎
ChatGPT、画像と音声使った会話が可能に。Plusユーザーはモバイルアプリでマルチモーダルに | テ..
ChatGPTのバージョンアップが発表され、音声や画像を含む会話が可能になる予定です
iOSとAndroidアプリでは音声や画像を含む会話が可能で、その他のプラットフォームでは画像を含んだ会話が可能に
自転車のサドルの高さを聞いて写真を提示すると、違うと返答し、ツールボックスの写真を見せるとアーレンキーを使えと指示が出ます
💡
Gartner Hype Cycle for AI in 2023 - KDnuggets
2023年のGartner Hype CycleによるAIの進化では、Generative AI技術の登場が注目されています。
Generative AIによって推進される革新は、人工汎用知能、AIエンジニアリング、自律システムなどの領域で革新をもたらします。
Generative AIの進歩を促進する領域は、AIシミュレーション、AIの信頼性、リスク、セキュリティ管理などです。
👔
データ分析の基礎 - Qiita
データ分析は、大量のデータから有用な情報を抽出するプロセスで、収集から知識の抽出までを含む
データ分析の目的は、ビジネスの意思決定をサポートし、新市場の発見、顧客理解、製品改善、予測モデリングなど
PythonのライブラリPandas、NumPy、Matplotlib&Seaborn、Scikit-learnを使用してデータの前処理、探索、可視化、統計的なデータ分析、機械学習が可能
💰
Amazon、生成AIのアンソロピックに5900億円出資 Microsoftに対抗 - 日本経済新聞
AmazonがAI新興企業に5900億円を出資
生成AIサービスの開発を強化
マイクロソフトやグーグルに対抗する戦略
🔊
ChatGPT can now see, hear, and speak
ChatGPTに音声と画像の機能が追加され、より直感的なインターフェースを提供します。
音声と画像の機能は、次の2週間以内にPlusおよびEnterpriseユーザー向けに導入されます。
新しい音声機能は、テキストと数秒のサンプル音声から人間らしい音声を生成する新しいテキスト読み上げモデルによって可能になりました。
📸
GPT-4V(ision) system card
GPT-4Vは、ユーザーが提供した画像入力を分析することが可能な最新の機能です。
マルチモーダルLLMは、新しいインターフェースと機能を持つことで、新しいタスクを解決し、ユーザーに新しい体験を提供します。
GPT-4Vの安全性については、特に画像入力に対する評価、準備、緩和作業について詳しく調査されています。
💰
Intel、AIソフトウェアにさらなる投資。コアIPを顧客への提供も示唆 - PC Watch
AIソフトウェアへの投資を強化し、顧客へのコアIP提供も示唆
AI PCやAIの大衆化に注力し、AI学習において競争相手と競争するためにAIソフトウェアの開発に投資
学習と推論の両方に市場を伸ばすことを目指し、ソフトウェアの開発にも注力
💻
ラスター画像をベクター変換するAIツール「Vectorizer.AI」が便利すぎた|企業で働くクリエイター..
「Vectorizer.AI」はビットマップデータをAIを使って自動でベクターデータに変換するサービスです
このツールの活用方法や特徴、メリット・デメリットについて解説されています
詳細は公式ウェブサイトをご覧ください
📈
【独占】生成AIカオスマップ2023、分野別調査でみえた「128の使えるツール」とは |ビジネス+IT
全国の企業のうち9.1%が生成AIを業務で活用し、52.0%が業務での活用を検討している。
生成AIは企業の生産性向上やコスト削減、顧客満足度の向上、クリエイティビティの促進、AIの民主化に寄与する。
生成AIツールはAI NativeとEmbedding AIの2つに区分され、それぞれが異なるアプローチで問題解決を行う。
😎
Google Colab で DeepSpeed によるLLMのフルパラメータの指示チューニングを試す|npaka
「DeepSpeed」を用いてLLMのフルパラメータの指示チューニングを「Google Colab」で試行
「OpenCALM-1B」と「databricks-dolly-15k-ja」を使用し、ファインチューニング前のLLM出力を確認
DeepSpeedの設定を追加し、ファインチューニングを実行し、その後のLLM出力も確認
💡
Building a Convolutional Neural Network with PyTorch - KDnuggets
PyTorchを使用した畳み込みニューラルネットワークの構築方法についてのチュートリアルが提供されています。
畳み込みおよびプーリング層を使用して特徴を抽出します。
完全接続層を使用して予測を行う画像分類のための畳み込みニューラルネットワークの構築方法を学びます。
🚀
ChatGPTのマルチモーダルな新機能|npaka
ChatGPTには音声による会話や画像についての質問が可能な新機能が追加されました。
画像認識も強化され、グリルのトラブル解決や食事の計画立案、データの分析などに役立ちます。
今後は、画像と音声の機能を段階的に導入し、全員が利用できるようにする考えです。
🔥
Getty made an AI generator that only trained on its licensed images - The Verge
Getty ImagesとNvidiaが提携し、Generative AI by Getty Imagesという新ツールを発売
このツールはGettyのライセンスされた写真のライブラリを使用して画像を作成可能
ユーザーは商業利用で作成した画像を公開する際に法的に保護され、著作権の免責を受けられる
🤖
Metaはさまざまな性格を持ったAIチャットボット「Gen AI Personas」を開発中、若者向けの「生意..
さまざまな性格のAIチャットボット「Gen AI Personas」を開発中で、2023年のイベントで発表予定
Instagramでは30人分の性格から選べるAIチャットボットのテストを実施中
新しいVRデバイス「Meta Quest 3」も2023年のイベントで発表予定
💪
Innovation for Inclusion: Hack.The.Bias with Amazon SageMaker | AWS Machine Learning Blog
Amazon SageMaker JumpStartを使用して、ハッカソンチームがバイアスを特定し除去するのを支援するアプリケーションを迅速に構築した。
アプリケーションは、ユーザーがテキストのバイアスを特定し除去することで、質の高い教育、ジェンダーに基づく差別の対象化、および格差の削減の3つの持続可能な開発目標に貢献している。
ユーザーがテキストを送信すると、アプリはAPIコールをトリガーし、バイアスが存在するかどうかを特定し、必要に応じてバイアスを特定し、位置を特定し、中和するための追加のクエリを展開する。
🧠
Improve throughput performance of Llama 2 models using Amazon SageMaker | AWS Machine Lear..
生成的AIは、新しいコンテンツやアイデアを作成することができ、大規模なモデルであり、膨大な量のデータでトレーニングされます。
大規模な言語モデル(LLM)は、膨大な計算能力を必要とし、利用可能な高帯域幅メモリ(HBM)と計算能力にアクセスするのが困難です。
LLMはメモリI/Oと計算制限によって制約され、利用可能なハードウェアリソースを最大限に活用することができません。
💡
Copyright Liability for Generative AI Pivots on Fair Use Doctrine
生成AI技術が創造産業の未来や著作権制度全体に与える影響について、著作権庁がコメントを求める要請を発表
一部の著者やクリエイターが生成AIの先駆者に対して訴訟を起こし、著作権法に基づく独占的な権利を侵害していると主張
判例が生成AIに関する法的問題の分析に使用される枠組みについて重要な手がかりを提供
🤖
Elicit - AI to accelerate science - Fifty Years News
年間200万以上の科学論文が発表され、その速度は人類の進歩を加速させていますが、製薬業界などでは突破的な製品や発明の急増にはつながっていません。
Elicitは、AIを使用して科学的発見のプロセスを自動化し、研究者を退屈な作業から解放することを目指しています。
ElicitのAIアシスタントは、ワンクリックの文献レビューを提供し、研究者がデータの抽出と分析の時間とコストを半分に削減することを可能にしました。
🚀
ChatGPT、“目”と“耳”の実装を発表 写真の内容を認識、発話機能でおしゃべりも可能に - ITme..
ChatGPTに画像認識、音声認識、発話機能が追加されました
画像認識では写真やテキストと画像を読み取り、グリルのトラブル解決や食事計画、データ分析などが可能です
音声認識はWhisperを使用し、スマホアプリの設定から利用可能で、人間のような声を生成します
2023年09月26日
|
2023年09月24日
このサイトについて
/
ニュースレター
/
@AINewsDev