AI News

~AI関連記事を3行にまとめて紹介~

💻

フリーライター、買いたたき懸念 「生成AIでもできる。報酬安くして」:朝日新聞デジタル

  • AIの登場により、フリーライターの報酬を安くするよう要求する依頼主が出現
  • 生成AIは文章や画像を自動的に作り出すため、「仕事を奪う」とも言われている
  • フリーランスなどの働き手にどのような影響を与えるのか、注目されている

👋

ジェネレーティブAIの進歩に大きな影響を与えた「Transformer」を開発した研究者らはなぜGoogle..

  • 「Transformer」の開発者たちはGoogleを退職し、AIスタートアップや競合他社で活動を行っています。
  • Google内部でのアイデア実現のハードルの高さや、AI部門の方向性の欠如に不満を持っていたと報告されています。
  • Googleは開発者たちの活動を誇りに思い、彼らの研究が生み出したAIの新たなエコシステムに活力を感じていると述べています。

📁

生成AIグラビアをグラビアカメラマンが作るとどうなる?第六回:Stable Diffusionの基本2 / LoRA..

  • LoRAは学習結果をCheckpointに保存せず、別のファイルに保存し、Checkpointと組み合わせて使用する
  • LoRAの使い方には注意が必要で、特定人物やキャラクターを生成するためのLoRAは権利侵害の可能性がある
  • LoRAは様々な用途に有効であり、場所や衣装、特殊効果などのLoRAも存在し、重みを指定することで効果をコントロールできる

💪

Udemyで夏のビッグセール開催! 話題の生成系AIからプロダクトマネジメントまで、新たな得意分野..

  • 2023年8月22日から夏のビッグセールが開催され、対象の講座は1,200円から購入可能です。
  • 生成AIや大規模言語モデルの入門や実装、アプリ開発やプロジェクトマネジメント、英語学習などの講座があります。
  • 新たな得意分野を見つけるために、気になる講座を試すか、周辺を深く学習するか、別の分野に手を広げるチャンスです。

🤖

搭乗できる巨大ロボ「アーカックス」の全貌を写真と動画でチェック “モードチェンジ”“コック..

  • 搭乗型ロボット「アーカックス」は、人が乗り込み操作でき、2種類の形態に変化する「モードチェンジ」も可能。
  • 重量は3.5t、最大高さは4.5mで、全ての動力は電気で賄われ、外装にはFRPを採用。
  • アーカックスは日本での先行販売を開始し、価格は1体4億円、数量は5体限定。

👏

ASCII.jp:自然言語の研究者でも、生成系AIの中でなにが起こっているのかがわからない (1/3)

  • 2023年秋には130億パラメータ、2023年度中には1750億パラメータの大規模言語モデルを構築予定
  • 新所長は生成AI分野に精通し、知識基盤の構築を目指す
  • AI基盤モデルを中核とし、学術分野を解釈し、異なる研究者同士を橋渡しすることで新たな知の創造や社会課題の解決を支援

💪

Repro Booster事業部におけるLookerを使ったデータ活用の取り組み - Repro Tech Blog

  • Lookerを活用し、データの可視化や意思決定の手助けを行い、定型業務の効率化やデータガバナンスの維持を実現
  • データモデリングと可視化を行い、共通言語となるダッシュボードを作成
  • 定例の会議でのデータドリブンな意思決定が可能になり、アドホックな分析や探索分析も手軽に行えるようになった

🚫

PIXTA「AI学習目的での使用禁止」を規約に明記 クリエイターの懸念に配慮 - ITmedia NEWS

  • ピクスタはストックフォトサービスの利用規約を改訂し、AI学習目的での使用を禁止行為に追加
  • 同社は機械学習用のデータ提供サービスも行っており、生成AIを含む機械学習の利用はそちらを利用するよう案内
  • クリエイターからは、画像生成AIの学習データとしての使用やイラスト素材の提供についての質問が寄せられ、ピクスタは透明性を持って対応

💻

AIが生成した作品は著作権で保護されない--米裁判所が判決 - CNET Japan

  • AIが生成した作品は著作権で保護されないとの判決が下された
  • 人間の創造性が著作物性の根幹であり、AIは人間の関与があっても実際の作品はすべてコンピューターによって生成されるため、著作権の保護対象外とされた
  • この判決は、AIによって生成された画像の著作権保護を求めた訴訟に対するものである

📚

個人情報保護委「生成AI利用に注意」 事業者・行政機関向けにポイント解説 - ITmedia NEWS

  • 個人情報保護委員会が生成AIサービスの利用に関する注意点をまとめたパンフレットを公開
  • 事業者や行政機関などに向けての情報提供
  • AIの学習データとして利用する予定の情報についての注意喚起

💻

Azure OpenAI Service 「on your data」 で独自データを使ったチャットを実現する - Taste of Te..

  • Azure OpenAIの「on your data」機能を利用すると、独自データを元にチャットの応答が可能になります。
  • デプロイされたモデルはgpt-35-turboまたはgpt-4を使用し、対応しているファイル形式はtxt、md、html、Microsoft Word、Microsoft PowerPointです。
  • データソースはAzure Cognitive Search、Azure Blob Storage、またはローカルのファイルを使用できます。

📤

Omoikane Embedを他のプロジェクトに入れるには - omoikane

  • ScrapboxからJSONをエクスポートし、OpenAIのEmbedding APIでベクトルインデックスを作成
  • 最小限バージョンと親切バージョンの2種類の導入方法があり、それぞれGithub Actionsを使用
  • Scrapboxからの自動エクスポート、OpenAI Embedding APIを使った埋め込み、Qdrantへのアップロード、Scrapboxへのレポート書き込みのステップが含まれる

👋

松尾研、公開したLLMの「オープンソース」記述を削除 X(Twitter)で指摘相次ぐ - ITmedia NEWS

  • 東京大学院工学系研究科・松尾研究室が公開した大規模言語モデル「Weblab-10B」のオープンソース記述を削除
  • Weblab-10Bは日本語と英語のデータセットを学習させ、精度を高めたモデルでパラメータサイズは100億
  • 商用利用は不可だが、商用利用可能なモデルの開発も今後検討している

🆕

Googleが「大規模言語モデルに視覚を与える仕組み」について解説、メルカリと協力して作成したデ..

  • 大規模言語モデルに「視覚」を持たせた大規模視覚モデルの仕組みを活用し、テキストから画像を検索するデモが公開されました。
  • 深層学習モデルを使用してテキストと画像のペアをトレーニングし、テキストと画像を共有埋め込み空間に配置することが可能です。
  • この技術は、インターネットオークションやセキュリティカメラの管理など、さまざまな応用が期待されています。

👍

GitHub - microsoft/azure-openai-design-patterns

  • Azure OpenAIサービスを使用したデザインパターンのセットが含まれているリポジトリ
  • 一般的なシナリオを実現するための基盤として、ビルドプロトタイプや本番用のソリューションを提供
  • パターンは網羅的ではなく、時間とともに進化し、コミュニティからの貢献を歓迎

📝

音声を文字起こしできるAIボイスレコーダ。OpenAIの技術も採用 - PC Watch

  • AIボイスレコーダ「AutoMemo R」は音声を高精度な文字起こしでき、録音した音声は自動でクラウドにアップロードされる
  • 文字起こしの結果はスマホアプリまたはWebアプリで確認可能で、バッテリは録音時約12時間、待機時約360時間持続する
  • 文字起こしは1カ月1時間まで無料で、その後はプランに応じて料金が発生し、月額1,480円のプランでは30時間、年額1万2,800円のプランもあり

🔥

Prompting, realized, and unrealized bias in generatvie AI

  • AIの生成に対する関心が高まり、その公正性と責任ある利用が重視されています。
  • プロンプティングにより、データセットのバイアスとシステムのパフォーマンスを切り離すことが可能です。
  • モデルが人為的または「未実現の」バイアスを示す能力は、バイアスのあるシステムパフォーマンスをもたらすモデルとは必ずしも同等ではありません。

Leveraging XGBoost for Time-Series Forecasting - KDnuggets

  • XGBoostは、勾配ブースティング木を実装したアルゴリズムで、高速で正確な予測が可能です。
  • XGBoostは通常、詐欺検出や住宅価格予測などの分類予測や回帰予測に使用されますが、時系列予測にも応用可能です。
  • XGBoostを使用した時系列予測では、トレンド、季節性、その他のパターンをデータから抽出して予測を作成します。

📚

Introducing IDEFICS: An Open Reproduction of State-of-the-art Visual Langage Model

  • IDEFICSは、画像とテキストのシーケンスを入力とし、テキストを出力するマルチモーダルモデルです。
  • 公開されているデータとモデルのみを使用して構築され、90億パラメータと800億パラメータの2つのバリアントがあります。
  • 大規模なプロプライエタリモデルと同等の性能を持ち、マルチモーダルAIシステムのオープンな研究のための基盤となることを目指しています。

🎩

Brewing a Domain-Specific LLM Potion - KDnuggets

  • AIは、ビジョンと言語(V&L)モデルや言語学習モデル(LLM)の導入により、魔法のような進化を遂げています。
  • ドメイン固有の専門知識を持つLLMを作成するためのレシピが提案されています。
  • LLMの評価については、科学的な合意がないため、ビジネスニーズに関連する評価パイプラインを構築する必要があります。

🤖

ムービーとテキストからフレーム間の一貫性を維持して実用性の高いムービーを生成するAI「Stable..

  • 「StableVideo」はムービーとテキストから一貫性のある実用的なムービーを生成するAIです。
  • 「Stable Diffusion」によって画像生成AIは進化し、ムービーの生成も可能になりました。
  • 「StableVideo」はテキスト駆動拡散モデルに時間の概念を導入し、フレーム間の一貫性を維持して安定したムービーを生成します。

💡

AI生成動画にありがちな「画面がチラチラする」という欠点を改善する「CoDeF」 - GIGAZINE

  • AI生成動画の欠点を改善する「CoDeF」が公開
  • オブジェクトが突然変わったり、映像が揺れる問題を解決
  • 入力された動画に自然な脚色を加えることが可能

🖼️

今から始めて追いつけるAI学習入門セット、画像生成・音声変換・AIチャット・英単語をわかりやす..

  • AI学習入門セットでは、画像生成・音声変換・AIチャット・英単語をムービー形式で学べます
  • AI技術は進歩し、イラスト生成や要約・作文などのタスクをこなすことが可能です
  • AIの基礎から学びたい初心者におすすめの講座が、夏のビッグセールで1200円~で受講可能です

🤖

Machine learning with decentralized training data using federated learning on Amazon SageM..

  • フェデレーテッドラーニングを用いて、分散トレーニングデータの機械学習が可能に
  • データが複数のアカウントや異なるリージョンに分散していても、フェデレーテッドラーニングを使用して一般化モデルを取得可能
  • フェデレーテッドラーニングの実装方法について説明

📚

Learn MLOps Basics with This Free eBook - KDnuggets

  • 無料のeBookでMLOpsの基礎を学び、機械学習モデルの効果的な構築、展開、管理を目指す方法を理解します。
  • MLOpsはDevOpsの原則を機械学習ワークフローに適用し、データサイエンティストとエンジニアの協力を促進します。
  • このeBookを通じて、組甔のプロダクション環境での機械学習モデルの構築、展開、管理のプロセスを効率化する方法を学びます。

👌

GitHub - opencopilotdev/opencopilot: πŸ•ŠοΈ Build and embed open-source AI Copilot..

  • OpenCopilotは、AIコパイロットを直感的に、迅速かつ信頼性を持って構築できるツールです。
  • 開発者ツールのコパイロット、SaaSコパイロット、Eコマースコパイロットなど、様々なコパイロットを構築することが可能です。
  • Python 3.8+とpipをインストールした後、Pythonパッケージをインストールし、最小のコパイロットを作成、実行することで、APIサービスとしてコパイロットが動作します。

🔒

Introducing SafeCoder

  • SafeCoderはエンタープライズ向けのコードアシスタントソリューションで、セキュリティとプライバシーを重視しています。
  • 顧客自身のインフラストラクチャ上で自己ホスティングが可能で、独自のコードベースに基づいてファインチューニングされたコードモデルを構築できます。
  • 法的リスクの最小化とコンプライアンスの確保を目指し、顧客のニーズに合わせたカスタマイズが可能です。

🗣️

Introducing SeamlessM4T, a Multimodal AI Model for Speech and Text Translations | Meta

  • SeamlessM4Tは、音声とテキストの翻訳を可能にするマルチモーダルおよびマルチリンガルAI翻訳モデルで、約100の言語をサポートしています。
  • SeamlessM4Tは、音声認識、音声からテキストへの翻訳、音声から音声への翻訳、テキストからテキストへの翻訳、テキストから音声への翻訳を可能にします。
  • SeamlessM4Tは、研究ライセンスで公開され、研究者や開発者がこの成果を基にさらなる開発を行えるようにしています。

🎉

GPT-3.5 Turbo fine-tuning and API updates

  • GPT-3.5 Turboのファインチューニングが利用可能になり、GPT-4のファインチューニングも今年の秋に登場予定。
  • 開発者はユースケースに合わせてパフォーマンスの向上したカスタムモデルを作成し、これらのカスタムモデルをスケールで実行できる。
  • ファインチューニングにより、ビジネスはモデルがより良い指示に従うようにし、モデルの応答を一貫してフォーマットする能力を向上させ、モデルの出力の質感(トーン)を調整することができる。

🤖

Language to rewards for robotic skill synthesis – Google Research Blog

  • ユーザーがロボットに新しいタスクを教える能力は、ロボットの成功にとって重要で、大規模な言語モデル(LLM)の進歩が有望な道筋を示しています。
  • 新しい研究では、報酬関数を言語とロボットアクションの橋渡しとして利用し、ユーザーが自然言語の入力を通じてロボットに新しいアクションを教える手法を提案しています。
  • このシステムは、報酬トランスレーターとモーションコントローラーの2つの主要なコンポーネントで構成され、ユーザーの自然言語の指示を報酬関数にマッピングし、それをロボットアクションに変換します。

🗣️

GitHub - innovatorved/whisper.api: This project provides an API with user level access sup..

  • Whisper APIは、音声からテキストへの変換を可能にする自己ホスト可能なAPIを提供
  • APIキーによるユーザーレベルのアクセスや、高速かつ効率的な推論のための量子化モデル最適化などの特徴がある
  • APIサーバーのデプロイに必要なコードや、ファインチューニングおよび量子化モデルが含まれている

💻

「Excel」にPythonを統合、データ分析と可視化のスムーズなワークフローを実現 | マイナビニュー..

  • 「Python」がExcelで扱えるようになり、データの整理や操作、分析が簡単に行えるようになる
  • 「Python in Excel」のプレビューテストが開始され、Windows用Excelから他のプラットフォームにも拡大予定
  • Python in ExcelにはPandasやStatsmodels、Matplotlib/SeabornなどのPythonライブラリが含まれ、共有も可能

🐱

急速進化する会話型AIを使えば「動物との会話」も可能になるのか? - ナゾロジー

  • 「キャットGPT」は動物との会話を可能にするAIで、人間と動物のコミュニケーションを可能にする
  • テルアビブ大学の研究者たちは、コウモリの鳴き声を学習させるAI「バットGPT」を開発
  • AIを介した動物との会話は文脈の問題もあり、完全な日常会話は難しいが、動物たちのコミュニケーションの複雑さを知ることにつながる

2023年08月23日

|

このサイトについて

/

ニュースレター

/

@AINewsDev