AI News

~AI関連記事を3行にまとめて紹介~

📷

写真1枚から、動かせる着衣3D人体モデルを高精度に生成する技術「TeCH」 DreamBoothなどで「見..

  • 浙江大学やMax Planck Institute for Intelligent Systemsの研究者らが「TeCH: Text-guided Reconstruction of Lifelike Clothed Humans」を発表
  • 1枚の写真から高精度の3D着衣人体モデルを生成し、見えない領域も一貫したテクスチャとジオメトリを持つ
  • この研究は、ゲームやソーシャルメディア、教育、eコマース、没入型テレプレゼンスなど、AR/VRのさまざまな応用において重要な役割を果たすことが期待されている

🤖

世界に存在しない「架空の料理」をAIに画像生成してもらった - メシ通 | ホットペッパーグルメ

  • AIは学習データを元にさまざまなコンテンツを生成する技術で、デスクワークの軽作業も代行可能
  • AIには常識がなく、無意識に発想を制限することもないため、架空の料理も描写可能
  • AIにプロンプトを投げると予想外の結果が出力され、新しいメニューのヒントも見つかるかもしれない

🚀

1790億パラメーターに挑戦…情通機構「大規模言語モデル」日本語を猛特訓!|ニュースイッチ by ..

  • 情報通信研究機構が1790億パラメーターの大規模言語モデルの開発を進めています
  • 高品質な日本語データを学習させ、日本社会の常識を備えたモデルになることが期待されています
  • 学習データを保有しており、データとモデルの両面から誤情報生成の対策を検証できます

👏

OpenAI APIを活用して、翻訳した内容をDiscordに通知する 情報収集源を集約するために考えたCha..

  • しょーれー氏がChatGPTとOpenAI APIを使って翻訳した内容をDiscordに通知する方法を提案
  • 具体的な流れは、GASでGitHub APIから情報を取得し、OpenAI APIで翻訳し、Discordに通知する
  • ChatGPTはコードのたたき台を作り、最終的にはDiscordに翻訳した内容を通知することができる

💽

Metaの大規模言語モデル「LLaMA」のトレーニングにも使用されたAIの学習用データセット「Books3..

  • デンマークの著作権侵害対策グループがAI学習用データセットの削除を要請
  • 該当データセットは大規模言語モデルのトレーニングに使用、約20万冊の書籍データを含む
  • データセットは完全には削除されていないが、対策グループはさらなる対応を求めている

🤖

「AIが生成した作品は著作権で保護される余地がない」との判決が下る - GIGAZINE

  • AIが生成した作品の著作権は認められず、その登録を求めた訴えが退けられた
  • AIによる作品の保護範囲やトレーニングの影響は今後の課題とされている
  • AIを使用した作品の著作権問題は複雑で、今後の裁判でさらなる議論が行われると予想される

💼

AI導入で労働者の40%はリスキリングが必要--IBM調査 - CNET Japan

  • AIモデル「ChatGPT」などは文章作成やコーディングなどの技術的作業を効率化する
  • AI導入により、従業員の40%がリスキリングが必要とされ、経営幹部の87%はAIがロールを補強することを期待
  • AIに注力する企業は売上成長率が高く、技術的スキルより対人スキルが重視される傾向に

👀

データマーケティングの強い味方!?BigQueryと大規模言語モデル(LLM)の統合で始める検索意図分..

  • ユーザーの行動を理解するためにML.GENERATE_TEXTを使用して検索意図分析を行った
  • ユーザーの要望やサービスの改善策を把握することができた
  • 分類結果を保存し、スケジュール化することで効率的に分析を行った

📊

LLMの普及で、ますます重要となるベクトルデータの活用 シチュエーション別「Pinecone」の3つの..

  • ベクトルデータの重要性が高まり、その活用が効果的であること
  • Pineconeはベクトルデータベースのサービスで、values、id、namespaces、metadataの4つの機能を持つ
  • シチュエーション別のプラクティスを活用することで、ベクトルデータの管理や効率的な検索が可能

📚

LINE、商用利用が可能な日本語大規模言語モデルをOSSで公開|CodeZine(コードジン)

  • 日本語の大規模言語モデル「japanese-large-lm」がOSSとして公開されました
  • 36億パラメータと17億パラメータのモデルが公開され、商用利用も可能です
  • 性能評価では、他のモデルと比較して優れた結果を示し、今後は指示文に適切な出力を行うモデルを公開予定です

🚀

GitHub Copilotを使いこなしてプログラミングの生産性を上げる大切なコツ|erukiti

  • GitHub Copilotはプログラミングの生産性を向上させるツールで、多くの人にとって欠かせない存在となっています。
  • しかし、Copilotを使いこなせていない人も多く、提案されるコードが微妙で役に立たないという声もあります。
  • Copilotはコードを生成する能力が非常に高く、パターンがある場合には特に効果的です。

📈

Learn Data Science and Business Analytics to Drive Innovation and Growth - KDnuggets

  • データサイエンスとビジネスアナリティクスは、企業の成長とイノベーションを推進する重要な要素です。
  • データサイエンスは、企業が不利なトレンドを緩和し、ビジネスの問題に対処するための積極的な措置を取るのに役立ちます。
  • ビジネスアナリティクスは、データを包括的に調査し解釈し、価値ある洞察を得て意思決定を行い、ビジネスプロセスを最適化するのに役立ちます。

🖼️

I Made Stable Diffusion XL Smarter by Finetuning it on Bad AI-Generated Images | Max Woolf..

  • Stability AIがリリースしたStable Diffusion XL 1.0(SDXL)は、1024x1024の解像度で画像を生成できる最初のオープンソースモデルの1つです。
  • SDXLはHugging Faceのdiffusers Pythonライブラリで完全にサポートされ、簡単に調整できます。
  • diffusersはプロンプトの重み付けとDreambooth LoRAのトレーニングと推論をサポートし、特定のキーワードからの「概念」を使用できます。

🎨

Don't Fire Your Illustrator | Sam Bleckley

  • 学術的なトレーニングは美術で、職業キャリアはソフトウェアエンジニアリングという著者が、AI画像生成について語っています。
  • AI画像生成の技術的な説明と、その技術が誰によってどのように使用されるかについての予測を2つのパートで述べています。
  • 色を名前付ける方法についての例を挙げ、物理空間の点を名前付けるために数値のリストを使用することについて説明しています。

🚀

LangChain 🤝 DemoGPT: New Era for Gen-AI Applications

  • DemoGPTは、大規模言語モデル(LLM)に基づくアプリケーション開発の限界を押し広げるオープンソースプロジェクトで、LangChainとStreamlitの上にプラットフォームを構築します。
  • DemoGPTのアーキテクチャは、計画、タスクの作成、コードスニペットの生成、コードスニペットの結合、およびDBの保存というコアステージをたどります。
  • DemoGPTのインストールは、最小限の手間で簡単に実行できるように設計された手順で、CLIまたはPythonインターフェースを使用して利用できます。

💡

Explain medical decisions in clinical settings using Amazon SageMaker Clarify | AWS Machin..

  • Amazon SageMaker Clarifyを使用して、医療の意思決定を説明する方法を紹介
  • 医療領域で使用される機械学習モデルの説明可能性は、医療、技術、法律、患者の視点から説明する必要がある
  • モデルの説明可能性を向上させることで、医療従事者が患者ごとに正しい選択をするために必要

💪

Apply fine-grained data access controls with AWS Lake Formation in Amazon SageMaker Data W..

  • Amazon SageMaker Data Wranglerを使用すると、データの選択、浄化、探索、可視化、スケールでの処理などを効率化できます
  • AWS Lake Formationによって管理されるデータレイクに頻繁に保持されており、細粒度のアクセス制御を実装することができます
  • SageMaker Data Wranglerは、Amazon EMRとの組み合わせでLake Formationを使用して細粒度のデータアクセス制限を提供することができるようになりました

🌐

Early days of AI - by Elad Gil - Elad Blog

  • AIの新時代として、LLM、トランスフォーマー、拡散モデルを過去との不連続性と考えるべきである
  • 以前のAIの波では、新しい市場を開拓するには十分に進化していなかったため、価値は主要企業にほとんど行き渡った
  • 新しいAIアーキテクチャの台頭により、機械学習スタートアップの失敗が減少し、AIの新しい波が始まった

😮

AIを使うとコーヒーショップの客が何分居座っているかが一発でわかるというムービー - GIGAZINE

  • AIを活用し、コーヒーショップの客の滞在時間や店員の勤務状況を追跡するムービーが公開されました。
  • このムービーは、コーヒーショップがAIを使ってバリスタと顧客を分析する方法を示しています。
  • このコンセプトにはプライバシーについての議論も起きています。

💡

“Not a replacement of journalists in any way”: AP clarifies standards around generative ..

  • APは、AIの報道における一般的な落とし穴について注意を喚起するために、基準を更新し、新しいスタイルブックのエントリーを公開しました。
  • APはOpenAIとの取引を結び、ChatGPTメーカーはAPのニュース記事をモデルのトレーニングに使用するために支払いをすることを約束しました。
  • しかし、APはジャーナリズムの最も重要な業務において生成AIの使用に懐疑的な姿勢を示しています。

📝

「わたしの話」を体系的に覚えてもらいながらLLMと会話する技術MemoChat登場 | AIDB

  • AIとの対話が一般的になってきているが、大規模言語モデル(LLM)のチャットボットで長い会話を一貫して維持するのは難しい
  • 新研究「MemoChat」では、人間のメモ取りのプロセスを模倣し、LLMが長い会話でも一貫性を保つ方法が提案されている
  • この技術は、カスタマーサポートや教育など、さまざまな分野での応用が期待されている

🖼️

Multimodal generative AI search | Google Cloud Blog

  • 大規模な言語モデル(LLM)が画像の意味を理解する「ビジョン」を持つことで、ビジネスに大きな影響を与える可能性がある
  • マルチモーダル埋め込みを抽出し、それらを使用して検索インデックスを構築するデモが公開されている
  • マルチモーダル検索は、テキスト、画像、音声などの意味のマップである埋め込み空間を構築することで機能する

2023年08月22日

|

このサイトについて

/

ニュースレター

/

@AINewsDev