AI News

~AI関連記事を3行にまとめて紹介~

🤔

AIを使う=盗作? 「AIに感じる気持ち悪さ」と「AI時代の作品の説得力」をプロカメラマンが整理..

  • AIを使うことが即ち盗作とは限らないという意見がある
  • 現行の著作権法では、AIによる画像生成による著作権侵害は類似性と依拠性が示されなければ認められない
  • 新たな作品を生み出すプロセスはクリエイティブそのものであり、心を込めて作られたものに価値を感じる

🚫

建設現場を360度ビューに ロボット断念が新事業生む | 日経クロステック(xTECH)

  • ロボット開発を断念し、建設業界向けのクラウドサービス「zenshot」を提供
  • 作業員が360度カメラで現場を撮影し、画像処理AIが現場ビューを作成
  • 現地に赴くことなく複数の現場を管理でき、100社以上で採用

💻

Azure ChatGPTの概要と使い方【導入方法を解説 | Private ChatGPT】

  • Azure ChatGPTは、ChatGPTをセキュアに利用するための法人向けウェブアプリケーションです
  • データの保護やネットワーク制御、カスタム性の高い機能開発などのメリットがあります
  • 導入方法については、GitHubからデプロイし、AzureとAzure OpenAI Serviceの登録が必要です

🚫

ニューヨーク・タイムズ AIによる記事などの学習を原則禁止に | NHK | AI(人工知能)

  • AI学習による記事や写真の利用が禁止されました
  • 著作権侵害の可能性が指摘されています
  • メディア各社の対応が注目されます

😂

LINEの3.6B言語モデルで遊んだら爆笑した|shi3z

  • LINEから36億パラメータの大規模言語モデルが公開され、文章の続きを生成する機能がある
  • 酒や女性へのプレゼントについての話題でも面白い回答が得られた
  • 若者の情報はテキスト化されず、YouTubeやTikTok、ニコ生を学習したモデルの登場が待たれる

😎

Five years of GPT progress

  • GPT-3はAIブームを牽引する大きな進化とされている
  • モデルの複雑さを増すことで性能が向上することが明らか
  • Jurassic-1やMegatron-Turing NLG、Gopher、Chinchillaなどの研究も紹介

🐕

Xiaomi、犬型ロボットCyberDog 2を中国で発売。約26万円 | テクノエッジ TechnoEdge

  • 四足歩行の犬型ロボット「CyberDog 2」が約26万円で中国で販売開始
  • 19のセンサーを搭載し、音声指示も可能で、3万頭の犬を同時にシミュレーション可能
  • オープンソース化されており、カスタマイズも可能で、一般家庭向きではないが興味がある人には面白い製品

🏷️

OpenAI、GPT-4の活用で人間のコンテンツモデレータの負担軽減が可能と主張 - ITmedia NEWS

  • GPT-4を使ったコンテンツモデレーションについてのブログを公開し、ラベル付けの一貫性向上やポリシー改善の迅速化、モデレータの負担軽減が可能と主張
  • 問題のあるコンテンツの判定やラベル付けには多数の人間が低賃金で長時間必要とされ、これに対処するためにLLMの使用を検討
  • 言語モデルの判断には注意が必要であり、人間の関与が必要としている

🔍

生成AIに“性格診断テスト”実施 GPTやLlamaに個性はある? 中国ByteDanceの研究者らが検証:I..

  • 大規模言語モデル(LLM)の個性を検証する研究が行われた
  • 人間の性格評価ツール「MBTI」を用いて性格を探った結果、異なる性格タイプが示された
  • 学習時のデータセットの違いが性格の違いに影響している可能性も示された

💡

ニック・ボストロム「意識を持っていようといまいと、AIが人類を滅ぼす危険性はある」 | 超絶知..

  • AIの開発には倫理的な観点を取り入れ、悪意のある行動を防ぐための制約が必要
  • AIの意識を理解し、その意識が人間にとって危険なものである場合は適切な制御を行うことが重要
  • AIの開発には国際的な協力が必要で、専門家や政府、企業が連携して対策を講じることが求められる

💻

企業の75%が「ChatGPT」利用を禁止する方向--BlackBerry調査 - ZDNET Japan

  • 企業の75%が生成型AIアプリの利用禁止を指示または検討している
  • 禁止理由としてはデータセキュリティやプライバシー、ブランドの評判へのリスクがある
  • 一方で、81%は生成型AIを活用したサイバーセキュリティ強化に前向き

📚

機械学習の評価指標覚え書き

  • 機械学習の評価指標の重要性と分類方法について解説
  • 回帰の評価指標としてMAE、MAPE、RMSE、RMSLEを紹介し、2値分類の混合行列や適合率、再現率、ROC曲線についても説明
  • 評価指標の意味合いは定義によって異なるため、関係者での明確な定義が重要と強調

💻

Google Colab + trl で Lineのjapanese-large-lm のQLoRA ファインチューニングを試す|npaka

  • 「Google Colab」+「trl」を使って「japanese-large-lm」のQLoRAファインチューニングを実施
  • モデルの準備から学習、推論の実行方法までを詳細に説明
  • ファインチューニングしたモデルで日本の首都や国歌に関する質問に適切な回答が得られることを確認

💻

Google、見ているページを生成AIで要約する新機能のテスト開始。長文記事も箇条書きとQA形式に変..

  • Googleがブラウジング中の長文記事を生成AIで箇条書きにまとめる「SGE while browsing」機能の初期テストを開始
  • 「Get AI-powered key points」オプションで要点が箇条書きで表示され、質問も生成され本文内の答えにリンク
  • AIが生成した回答内の特定の単語にカーソルを合わせると定義や関連する画像を見ることができ、初心者向けにはキーワードやコメント、文字列を色分けする機能も提供

⏱️

Using GPT-4 for content moderation

  • GPT-4を使用したコンテンツモデレーションシステムは、ポリシー変更の反復を数時間に短縮し、一貫したラベリングが可能です。
  • AIがプラットフォーム固有のポリシーに基づいてオンライントラフィックをモデレートし、人間モデレーターの精神的負担を軽減します。
  • OpenAI APIのアクセス権を持つ人は、このアプローチを使用して独自のAI支援モデレーションシステムを作成することができます。

🤖

AIの進化でボットの方が人間よりも高速かつ高精度でCAPTCHA認証を突破することが可能に - GIGAZI..

  • AIの進化により、ボットは人間よりも高速かつ高精度でCAPTCHA認証を突破できるようになった
  • ボットはゆがんだテキストを解読するタイプのCAPTCHAを99.8%の精度で1秒未満で解くことができる
  • CAPTCHAはボットと人間を区別するための簡単な方法ではなくなり、よりインテリジェントなアルゴリズムが必要とされている

🤖

「ChatGPT」が書いた文章を見分けることは可能か--5つの検出ツールをテスト - ZDNET Japan

  • AI生成の文章を見分けるためのツールをテストした結果、最も優れていたのは正解率66%の「GPT-2 Output Detector」だった
  • AIによって作成された文章を自分の作品だと主張する行為は、Websterの盗用の定義に該当する
  • ChatGPTなどの言語モデルは、人間が書いたテキストとの区別が難しく、盗用を行いやすくなる可能性がある

📚

LangChain Cheat Sheet - KDnuggets

  • LangChainは大規模な言語モデルを使用したアプリケーションの構築を簡素化するライブラリ
  • 初心者から経験豊富なユーザーまで、LangChainはすべてのレベルのユーザーが大規模言語モデルのパワーを引き出すことができるツール
  • 最新のチートシートでは、LangChainの主要な機能と簡単なコードの例を提供

💡

最近話題の音生成AIまとめ|npaka

  • 「AudioCraft」は深層学習を用いたオーディオ処理と生成のライブラリで、3つのモデルが含まれています
  • 「AudioLDM 2」はテキストから音声、音楽、効果音などを生成するAIで、高い汎用性を持っています
  • 「MusicLDM」は盗作音楽を生成しないText-to-Musicタスク用のAIで、コードと事前学習モデルは8月中旬に提供予定です

🤖

Microsoftが見解を公表 「AIは“現場仕事”をどう変えるか」 - ITmedia エンタープライズ

  • AIを活用したソリューションでフロントラインワーカーの生産性向上を提案
  • Dynamics 365やCopilot、Outlook、Teamsの統合機能で業務効率化を実現
  • AIによるイノベーションは効率性向上、顧客体験向上、迅速な意思決定を可能に

💼

コンサル業務はChatGPTによって駆逐される可能性がある “事実上のコンサル”がいる時代、勝負..

  • ChatGPTはコーディングや実装に大きな影響を与え、コンサルタント業務にも変化をもたらす可能性がある
  • コンサルタントの仕事が効率化され、小さなチームでも大きな仕事を引き受けることが可能になる
  • ファインチューニングが重要であり、Microsoftの提供するツールやプラットフォームとの連携が進むことで、さらなる進化が期待される

📚

LINE、36億パラメータの日本語言語モデルをオープンソースで公開--商用利用可 - CNET Japan

  • 日本語言語モデル「japanese-large-lm」がオープンソースとして公開され、商用利用も可能。
  • 1.7Bモデルと3.6Bモデルの2つが公開され、それぞれ17億と36億のパラメータを持つ。
  • 近日中にこれらのモデルをチューニングし、指示文に対して適切な出力を行うモデルを公開予定。

🤖

学校図書館が「ChatGPT」で書籍にセックス描写があるか確認したことが発覚、実際に19作品が禁書..

  • 学校図書館がAI「ChatGPT」を使用し、本にセックス描写があるか確認
  • 新法に対応するためにChatGPTを活用し、性行為の描写が含まれていないことを確認
  • 結果として、19冊の本が図書館から撤去された

📊

5 Ways You Can Use ChatGPT’s Code Interpreter For Data Science - KDnuggets

  • ChatGPTのコードインタプリターは、データタスクの自動化やPythonコードの実行、可視化生成などを可能にします。
  • ユーザーはデータファイルをアップロードし、結果を出力ファイルとして受け取ることができます。
  • データ分析、データクリーニング、数学、ファイルの変換、図表作成など、様々なタスクに対応可能です。

😎

How Thomson Reuters developed Open Arena, an enterprise-grade large language model playgro..

  • AIと機械学習を活用してきた企業が、ジェネレーティブAIの導入に注力
  • 大規模な言語モデルのプレイグラウンド「Open Arena」を開発
  • 非プログラマーもLLMを活用し、顧客サービスやドキュメントの要約などのタスクを行うことが可能

💻

Ask HN: If we train an LLM with “data” instead of “language” tokens | Hacker News

  • 従来の機械学習では、特定の問題領域から特徴抽出とエンジニアリングが行われます
  • 多様なデータ(天気、フライト、人口統計など)をスクレイピングし、これに対して十分な重みを持つモデルを構築すると、新たなユースケースが生まれる可能性があります
  • 以前、タブラーデータの基礎モデルに取り組んでいたスタートアップでは、CSVファイルのヘッダーとセルを見て、個々のセルに意味を割り当てるシステムを開発していました

📚

Train self-supervised vision transformers on overhead imagery with Amazon SageMaker | AWS ..

  • オーバーヘッドイメージで自己教師ありビジョン変換器をトレーニングする方法を紹介
  • DINOアルゴリズムに基づき、SageMaker分散データ並列ライブラリを使用してデータを複数のGPUインスタンスに分割
  • 事前トレーニングが完了すると、DINO画像表現をさまざまな下流のタスクに転送可能

🔚

The Tech Job Recession Is Over. When Will Hiring Reaccelerate?

  • 2023年上半期にテック企業は30万人以上の従業員を解雇しましたが、最近では解雇数が減少傾向にあります。
  • AIスタートアップは今年、数十億ドルを調達し、エンジニアや他のAI専門家の雇用にも資金を投入しています。
  • 大手テック企業も解雇を停止し、数ヶ月前に解雇したスタッフの一部を再雇用しています。

💻

The Mathematics of Training LLMs — with Quentin Anthony of Eleuther AI

  • 「Transformers Math 101」記事の解説とTransformersベースのアーキテクチャの高性能分散トレーニングの解説が行われます
  • GPUを使いこなす方法が価値あるスキルとされ、その知識を得るためには特定の企業で働く必要があった
  • トレーニングに関するNLPコミュニティの暗黙の知識は非常に多く、その知識を得るためには特定の企業で働く必要があった

🆙

ASCII.jp:ChatGPT向けライブラリ、LangChainを格段に使いやすくするtips

  • LangChainのプロンプトやラッパーは英語以外に対応しておらず、ChatGPT APIのトークン数制限に影響を与える
  • LangChainの問題を解決するためのtipsとして、自分でツールを作成することやプロンプトの変更方法、ログの取得方法などがある
  • LangChainは便利なライブラリだが、まだ改善の余地がある

💻

AIはどのような仕事ができるようになったのか?ChatGPTで変わる「優秀な人材」 - ところてん - M..

  • 機械学習技術の進歩により、ホワイトカラーの仕事がAIによって代替されつつある
  • 生成的AIの登場により、不定形な入力から不定形な出力が可能になり、プログラミングのスキルがなくてもAIを利用できるようになった
  • 優秀な人材は、AIに適切な指示を行い、学習済みのモデルを効果的に活用する能力を持つとされている

📰

New York Times considers legal action against OpenAI as copyright tensions swirl : NPR

  • ニューヨーク・タイムズがOpenAIに対して著作権問題で法的措置を検討
  • ライセンス契約の交渉が難航し、ChatGPTが記事を使用してAIツールを開発することに懸念
  • 裁判所はChatGPTのデータセットの破棄を命じる可能性がある

😱

Anti-Piracy Group Takes Prominent AI Training Dataset ''Books3' Offline * TorrentFreak

  • 生成型AIモデルの著作権問題が深刻化し、反海賊団体が具体的な行動を起こしています。
  • デンマークの反海賊団体Rights Allianceが、AIトレーニングデータセット「Books3」の削除を行いました。
  • 「Books3」は海賊版の書籍でトレーニングされたAIモデルで、その削除は著作権保護の一環として行われました。

🔐

Unlocking efficiency: Harnessing the power of Selective Execution in Amazon SageMaker Pipe..

  • MLOpsは、機械学習モデルの本番化の過程を監視し、複数の複雑なステップを含むプロセスを簡素化するツールです。
  • Amazon SageMaker Pipelinesは、MLのエンドツーエンドのワークフローを自動化するためのワークフローオーケストレーションサービスです。
  • SageMaker Pipelinesの新機能、Selective Executionにより、MLワークフローの特定の部分のみを選択的に実行することが可能になります。

📝

KDnuggets News, August 16: Use ChatGPT to Convert Text into a PowerPoint Presentation • B..

  • ChatGPTを使ってテキストをPowerPointプレゼンテーションに変換する方法が紹介されています
  • ジェネラティブAIアプリケーション開発のための最適なPythonツールについてのチートシートが提供されています
  • データサイエンティストがテックウィンターを生き抜くために専門化する必要性について語られています

🤖

漫画未経験のエンジニアが今のAIで漫画制作にトライしてみた記録2023年夏時点版|Anno Takahiro

  • 画像生成AIの進化に期待し、漫画未経験のエンジニアが漫画制作に挑戦
  • 半年以上の月日を経て、16ページの漫画を完成させることができた
  • AIに意図が伝わるように描くための工夫や、AIとの連携方法にはまだ改善の余地がある

🔍

類似画像検索にLLMを利用する。|tdual

  • 画像の類似度を測るためにLLMを使用し、野球画像の中で一番似ているのは画像1と画像4でした。
  • NLPのEmbeddingを使用して画像の類似度を測ることも可能で、今回はT5のSentence Embeddingを使用しました。
  • 状況や場面の画像の場合は、LLMに説明をさせてNLPで類似度を測ることが有効です。

2023年08月17日

|

このサイトについて

/

ニュースレター

/

@AINewsDev