AI News

~AI関連記事を3行にまとめて紹介~

💻

面倒な「ダミーデータ作成」をChatGPTに任せる〜Code Interpreterの限界までリアリティを追求し..

  • ChatGPTのCode Interpreterを使ってダミーデータを作成する方法を紹介
  • ダミーデータ作成は憂鬱な作業だが、Code Interpreterを使えば簡単に作成可能
  • 条件を追加しても凝ったデータが作成でき、データにはリアリティがある

💡

[人要らず]ChatGPTを使った一人議論やってますか? - Qiita

  • 一人議論はアイデア出しや壁打ちに便利な手法で、ChatGPTを使った議論のシミュレーションです。
  • エンジニアの役割が変わるかもしれないが、新たなチャンスや課題も生まれるという意見もあります。
  • 一人議論は強めの反論も可能で、自分の話したいテーマを選べるため便利です。

👍

ABCIの大規模言語モデル分散学習ハッカソンを振り返る

  • 大規模言語モデル分散学習ハッカソンは9日間にわたり開催され、参加者は大規模言語モデルの訓練を行った
  • 参加者はポイント制でABCIを利用し、チーム毎に1000ポイントが与えられた
  • チューター11名がサポートし、サンプルコードの提供や事前検証も行われ、参加者同士の議論や知見の共有が活発に行われた

😎

「ChatGPT」のカスタム指示、無料プランでも利用可能に - CNET Japan

  • 「ChatGPT」の「custom instructions」機能を使えば、自分の好みに合わせた回答を調整できる
  • この機能は無料プランのユーザーにも提供され、回答をカスタマイズするための追加フィールドが表示される
  • ChatGPTの応答を改善し、より満足のいく結果を得ることができる

💻

AIBunCho/japanese-novel-gpt-j-6b · Hugging Face

  • 2021年にリリースされたAIモデルは、GPT-J-6Bを使用し、TPUで2週間かけてトレーニングされました。
  • Google ColabのT4 High-RAMを使用してインストールし、transformersとsentencepieceを使用しています。
  • トレーニングデータは、cc100のWikipediaとWebから収集され、不適切なコンテンツが含まれている可能性があるため、使用には注意が必要です。

🎉

Kaggle Grandmaster になるまでの振り返り - tkの日記

  • 大阪の国公立大学の情報系M1のtkさんがKaggle Grandmasterになりました。
  • 初メダル獲得からGrandmaster昇格までの取り組み方を公開。
  • シンプルな手法でベースライン作成、信頼できるCV作成を最優先、チームマージの検討、差がつきそうな部分の調整などを行っています。

💻

Google Colab で LINE の japanese-large-lm を試す|npaka

  • 「Google Colab」でLINEの「japanese-large-lm」を試す方法を紹介
  • 「japanese-large-lm」は36億パラメータの日本語LLMで、任意のテキストの続きを作成可能
  • Colabのノートブックを開き、「GPU」を選択し、必要なパッケージをインストール後、トークナイザーとモデルを準備し、推論を実行

😎

36億パラメータの日本語言語モデルを公開しました

  • 日本語に特化した大規模言語モデル「HyperCLOVA」の研究開発を行ってきました
  • 複数の大規模言語モデルの研究開発プロジェクトも進行中です
  • 36億および17億パラメータの日本語言語モデルを訓練・公開しました

🤖

企業の75%がChatGPTなど生成AIの禁止を検討との調査結果 | TEXAL

  • 生成AIのChatGPTが急速に普及している一方で、多くの企業がその利用を禁止し始めていることが明らかになった
  • 75%の企業がChatGPTや生成AIの禁止を検討または既に禁止している
  • 禁止の理由は、データ保護とプライバシーのリスクへの懸念で、61%の企業がこの禁止を長期的な解決策と考えている

💦

AIによるレシピ考案アプリが塩素ガスを発生させる食事など不適切なメニューを生成することが報告..

  • AIによるレシピ考案アプリが不適切なメニューを生成することが報告されました。
  • アプリは漂白剤や塩素ガスを含むメニューを考案したことが判明し、問題視されています。
  • 今後、アプリの微調整を行い、安全性と有用性を向上させる予定です。

💻

OpenAIがインターネット上のコンテンツ収集に用いるウェブクローラー「GPTBot」をブロックする試..

  • ウェブクローラー「GPTBot」のブロック試みが進行中で、一部のウェブサイトは既に取り組んでいます
  • GPTBotは大規模言語モデルの学習に必要なデータセットを収集するために使用されています
  • GPTBotのブロックは今後のデータ収集を防ぐもので、既に収集されたデータには影響を与えません

😎

5 Things You Need to Know When Building LLM Applications - KDnuggets

  • LLMアプリケーション構築には幻覚、適切な文脈、信頼性、適切なエンジニアリング、セキュリティなどの課題が伴います。
  • LLMは非常に創造的であり、さまざまなドメインに使用および調整することができますが、未解決の重大な問題として幻覚が存在します。
  • LLMベースのアプリケーションを構築する際には、これらの問題に注意を払う必要があります。

💬

Chatwith

  • AIチャットボットはコンテンツとバックエンドデータに基づいてトレーニングされ、リアルタイムの在庫情報からドキュメント生成まで対応します。
  • チャットボットはウェブサイト、ナレッジベース、その他のリソースに基づいてトレーニングし、24時間365日、お客様の質問に対応します。
  • チャットボットは最新の在庫を確認したり、ドキュメントを生成したり、お客様からファイルを受け入れたりすることができます。

💻

「Azure OpenAI Service」は1日100の新規顧客を獲得――Microsoft、AIビジネスの現在地は:NVIDI..

  • Microsoftは企業のAI活用を支援するAzure AIインフラストラクチャおよびサービスの新展開を発表
  • 発表されたのは「ND H100 v5」仮想マシンの一般提供開始と「Azure OpenAI Service」のグローバル展開
  • Azure OpenAI Serviceは、OpenAIの大規模言語モデル「GPT-4」や「GPT-35-Turbo」などを利用できるサービス

👩‍💻

Build production-ready generative AI applications for enterprise search using Haystack pip..

  • HaystackパイプラインとFalcon-40b-instructモデルを使用して、Retrieval Augmented Generation(RAG)を実装し、エンドツーエンドのアプリケーションを構築します。
  • Haystackパイプラインを使用することで、モデルやベクトルデータベースなど、さまざまなコンポーネントからなるLLMアプリケーションを組み立てることができます。
  • SageMaker JumpStartは、LLMのデプロイを簡単にするためのワンクリックソリューションを提供し、OpenSearch Serviceはインデックスされたデータのベクトルデータベースとして使用されます。

🎉

How to Use ChatGPT to Convert Text into a PowerPoint Presentation - KDnuggets

  • ChatGPTを使用してテキストをパワーポイントプレゼンテーションに変換する方法を紹介
  • テキストの要約を作成し、それをPPTX形式に変換するPythonコードを書く2つのステップが必要
  • 明確で整理されたテキストを提供することで、最良の結果を得ることができる

😅

Following Pushback, Zoom Says It Won't Use Customer Data to Train AI Models

  • Zoomは、顧客のコンテンツをAIモデルのトレーニングに使用するという利用規約の変更を撤回しました。
  • この決定は、プライバシーの懸念を抱く顧客からの批判を受けてのものです。
  • この問題は、技術企業が顧客データをAIモデルのトレーニングに使用することに関するプライバシーとセキュリティの懸念についての議論をさらに加速させるでしょう。

🚀

Zero-shot and few-shot prompting for the BloomZ 176B foundation model with the simplified ..

  • BloomZ 176B foundationモデルを使用したゼロショットおよびフューショットのプロンプティングについて解説
  • BloomZ 176Bモデルは大規模なパラメータを持ち、インストラクションチューニングによりNLPタスクを実行
  • プロンプティングエンジニアリングにより、モデルの応答を誘導するための高品質なプロンプトを作成

🇯🇵

LINE、日本語の大規模言語モデル公開 オープンソースで 商用利用もOK - ITmedia NEWS

  • 日本語に特化した大規模言語モデル「japanese-large-lm」がオープンソースで公開され、商用利用も可能に
  • 公開されたLLMは36億パラメーターと17億パラメーターの2つで、HuggingFace Hubからアクセス可能
  • モデルの訓練には、大規模日本語Webコーパスを使用し、独自LLM「HyperCLOVA」の開発も進行中

😊

Label Studio x LangChain: From Foundation Models to Fine-Tuned Applications Using Label St..

  • Label StudioとLangChainの組み合わせにより、ファインチューニングされたアプリケーションを構築可能
  • Label Studioは、大規模な言語モデルのデータラベリングに柔軟性を提供し、カスタムトレーニングデータの準備、人間のフィードバックを通じた応答の収集と評価を可能にする
  • Label Studioは、大規模言語モデルとアプリケーションの改善において欠かせない役割を果たす

🚀

GitHub - normal-computing/outlines: Generative Model Programming

  • Outlines〰は、高速で信頼性のあるニューラルテキスト生成のためのライブラリで、transformersライブラリのgenerateメソッドの代替手段として機能します。
  • 正規表現に一致する出力やJSONスキーマに従う出力を保証する生成メソッドを提供し、開発者の支援を提供します。
  • プロンプトを実行ロジックから分離し、few-shot生成、ReAct、メタプロンプト、エージェントなどのシンプルな実装につながる堅牢なプロンプトの基本機能を提供します。

💻

Burnout because of ChatGPT? | Hacker News

  • ChatGPTの使用により生産性が向上したが、仕事とプライベートの境界が曖昧になりストレスや燃え尽き症候群に悩まされている
  • ChatGPTは常に利用可能で即座に動作するため、アイデアを試す際にすぐに取り組むことができる
  • AIが基準を高く設定し、平均的なデスクジョブを奪う可能性があるとの懸念がある

😱

AI Detection Tools Falsely Accuse International Students of Cheating – The Markup

  • AIによる盗作検出ツールTurnitinが、国際学生の論文を誤ってAI生成とラベル付けする問題が発生しています。
  • スタンフォード大学の研究者は、AI検出器が非英語母国語話者の執筆をAI生成としてフラグ付けすることが61%の割合であることを発見しました。
  • AI検出器は単語の選択が予測可能で文がより単純な場合にAI生成としてフラグ付けする傾向があり、非英語母国語話者の執筆はしばしばこのパターンに合致します。

👨‍💻

「古い言語やレガシーシステムに対してのインパクトは大きい」 ChatGPT時代における基幹システ..

  • 相野谷氏はScalebaseのシニアエンジニアで、インフラエンジニア・SREを担当し、開発基盤の構築やマネジメント、新しいチームの立ち上げなどを行っています。
  • R&D部門ではScalebaseに付加価値を提供するための技術を探求しています。
  • ChatGPTの使い方に衝撃を受け、APIを使って何ができるかを考えるようになり、開発効率も大幅に向上しました。

2023年08月15日

|

このサイトについて

/

ニュースレター

/

@AINewsDev