AI News

~AI関連記事を3行にまとめて紹介~

😎

Axolotl で マルチターンの対話データセットによるLoRAファインチューニングを試す |npaka

  • 「Axolotl」を用いてLoRAファインチューニングを行い、マルチターンの対話データセットを試した
  • 「Llama-2-7b」を「日本語日常対話コーパス」でファインチューニングし、Colabでのセットアップ手順やデータセットの準備方法、学習手順をまとめた
  • 学習後のモデルの動作確認を行い、日本の日常会話においてもうまく機能していることを確認した

😱

生成AIでニュース番組に似せた偽広告 日本テレビ“注意を” | NHK | 生成AI・人工知能

  • SNSで拡散されている偽動画は生成AIを使って作られ、女性アナウンサーが投資情報サイトへの登録を勧める内容です
  • 偽動画はニュース番組のように出演者の声や動きが再現されており、削除も行われたとみられます
  • 生成AIの進化により、偽物と見破るのが難しくなっているため、懸念が広がっています

🚀

問い合わせ0件→60件に 自社メディアの記事を“爆増”させた「ChatGPT研修」の実力:生成AIスタ..

  • 生成AIを活用した事業開発やマーケティング、コンテンツ記事制作支援を手掛ける
  • 生成AI活用研修を受講した企業では、Webサイトへの流入が3倍に増加
  • 研修受講企業の問い合わせも60件以上に伸びた

🔬

他人のSNS投稿を「GPT-4」に入力して個人情報を特定できるか? スイスの研究者らが検証:Innova..

  • 「Seamless」では山下裕毅氏がSNSのテキストから大規模言語モデル(LLM)を使って個人情報を推測する研究を行っています。
  • LLMの高度な推論能力を活用すれば、わずかな情報からも個人情報を容易に割り出せる可能性があります。
  • 最先端の9つの言語モデルを使用し、Redditのユーザープロフィールを基に個人情報を推測し、高い正確さで個人の属性を推測することができました。

💡

Human-like systematic generalization through a meta-learning neural network | Nature

  • 人間の言語と思考の力は、既知の要素から新しい組み合わせを理解し生成する代数的な能力によって生じるとされています。
  • 本研究では、組成能力を最適化するためのメタ学習アプローチを導入し、ニューラルネットワークが人間のような体系性を達成できることを証明しました。
  • MLCアプローチは、組成的なタスクのダイナミックなストリームを通じてトレーニングをガイドし、人間のような体系性と柔軟性を兼ね備えた唯一のモデルとなりました。

👨‍🏫

何でも微分する - Speaker Deck

  • 最適輸送は微分可能な変種が存在し、機械学習モデルに組み込むことが可能
  • シンクホーンアルゴリズムを用いて最適輸送の微分可能な変種を求める方法を紹介
  • 他の最適化問題を微分可能にする方法や機械学習への応用について議論

💻

二極化が進む企業の自動化推進 #AI - Qiita

  • APIを利用することで、データの取得や処理、システム間の連携を効率的に行うことが可能
  • データベースに直接アクセスし、必要なデータを取得したり、処理を行ったりすることで自動化を実現
  • BI(Business Intelligence)はデータを分析し、意思決定に活用するための手法やツール

🎉

Amazon Bedrock の Claude と Stable Diffusion を組み合わせて簡単に画像生成 - Taste of Tech ..

  • 新サービスAmazon Bedrockでは、AIモデルを利用して画像生成が可能です
  • BedrockのClaudeV2モデルとStable Diffusionを組み合わせて画像生成を行います
  • Stable Diffusionの利用料金はステップ数と画像解像度に応じて設定されています

🆕

GmailもGoogleドライブも連携で高速化! Google Bardの新機能を試したら期待しかなかった #Trend..

  • Bardの新機能「Extensions」はGoogleドライブやGmail、YouTubeなどと連携可能
  • 英語版ではチャット上で書類の内容を確認したり、特定のメールを見つけることができる
  • YouTubeと連携すれば目的の動画を探すことも可能

🚀

GitHub - huggingface/distil-whisper

  • Distil-WhisperはWhisperの蒸留版で、6倍高速で49%小さく、分布外評価セットで1%以内のWERを実現
  • 英語ASRのWhisperに対する代替モデルとして設計され、低信号対雑音比での強力なWER性能、少ない重複単語と挿入エラー率の向上が特徴
  • 18,000人以上の話者を含む10のドメインにわたる22,000時間の疑似ラベル付きオーディオデータでトレーニングされ、堅牢性を保証

🌏

NTTが大規模言語モデル「tsuzumi」、軽量&日本語に強い――商用化は24年3月予定 - ケータイ Wat..

  • 2024年3月に商用化予定の大規模言語モデル「tsuzumi」は、軽量でありながら世界トップレベルの日本語処理性能を持つ
  • パラメーターサイズは6億の超軽量版と70億の軽量版が用意され、学習コストや推論コストも抑えられる
  • 今後はマルチモーダルへの対応やサイバーセキュリティ分野への応用も予定されている

🤖

パルコも“AIモデル”起用、ファッション広告に 「AIと分かった時の驚きを追求した」 - ITmedia..

  • パルコは、生成AIを使ってモデル撮影せずにファッション広告を制作し、ホリデーシーズンのキャンペーンに活用する。
  • 広告では、グラフィック、動画、音楽、ナレーションまで全て生成AIで作成し、実在しないAIモデルを配置し、リアリティーを持たせた。
  • ムービーでは複数の生成AIを使用し、不思議な世界が広がる。AI作品展を主催した木之村美穂さんをクリエイティブディレクターに迎え、新しい才能を見いだし、新しい技術を取り入れることを重視している。

🎉

NTT、軽量で高機能な大規模言語モデル「tsuzumi」を発表。来年3月にサービス開始 - PC Watch

  • 軽量で高機能な大規模言語モデル「tsuzumi」が2024年3月に商用サービスを開始予定
  • パラメータサイズが6億の超軽量版と70億の軽量版を提供し、学習や推論に必要なコストを大幅に削減
  • 商用サービス開始時には3つのチューニング方法を提供し、特定の業界や用途に特化した言語表現や知識への対応を実現

💡

7 Machine Learning Algorithms You Can’t Miss - KDnuggets

  • 機械学習アルゴリズムの7つの必須モデルが紹介されています。
  • 線形回帰、ロジスティック回帰、決定木、ナイーブベイズ、K-meansクラスタリング、ランダムフォレスト、特異値分解が含まれます。
  • これらの基本モデルを理解することで、データサイエンスのキャリアをスタートさせ、より複雑なアルゴリズムを理解しやすくなります。

🤖

シンプルな「自律型運搬ロボット」は人型ロボットの目標を既に達成している - ナゾロジー

  • 人型ロボットは研究開発や商業用途で作られ、特に荷物運びに特化しています。
  • 荷物運びに特化したロボットの需要は高いとされています。
  • しかし、既に別のロボットが物を運搬することを達成しているため、人型ロボットにその仕事を任せる必要性は現実的ではないかもしれません。

💻

Windows 12搭載のCoPilotには高度なAIハードウェアが必須に。既存のノートPCはほぼ全滅?

  • Windows 12のAIアシスタント、CoPilotは高性能なAIハードウェアが必要で、既存のノートPCではほぼ使えない
  • 45~50 TOPsの性能が必要で、2023年末から2024年に発売予定の一部CPUでしか使えない
  • 性能要件を満たせなくてもCoPilotは使えるが、動作は遅くなる

👑

Kaggleで世界トップレベルになるための思考法。Grandmaster小野寺和樹の頭の中 - Findy Engineer..

  • Kaggleは機械学習・データ分析のコンペで、参加者は提供されたデータやテーマに基づいてモデルの精度を競います。
  • GrandmasterはKaggleの最高ランクで、ゴールドメダル5枚とソロゴールドメダル1枚が必要です。
  • 小野寺さんは自己分析を重視し、信頼できる情報源から学び、計算リソースが限られていた頃から成績を上げています。

🗓️

NTT 自社開発の国産生成AIサービス 来年3月から企業向け開始へ | NHK | 生成AI・人工知能

  • 来年3月から企業向けに国産の生成AI「tsuzumi」を提供開始
  • 日本語の処理性能を重視し、導入や運用のコストを大幅に抑える
  • 2027年に年間1000億円以上の売り上げを目指す

💬

amazon/MistralLite · Hugging Face

  • MistralLiteは、長い文脈(最大32Kトークン)の処理能力が向上したモデルです。
  • Rotary Embeddingとスライディングウィンドウを使用し、長い文脈の検索や回答のタスクで優れたパフォーマンスを発揮します。
  • Sagemaker Huggingface Text Generation Inference(TGI)エンドポイントを使用した単一のAWS g5.2xインスタンスに展開可能で、リソース制約のある環境で高いパフォーマンスが必要なアプリケーションに適しています。

💪

NTT、大規模言語モデル「tsuzumi」開発 24年3月に商用サービス提供へ - ITmedia NEWS

  • 大規模言語モデル「tsuzumi」が開発され、2024年3月に商用サービスが提供される予定です。
  • 「tsuzumi」は軽量でありながら世界トップレベルの日本語処理性能を持ち、学習コストと推論コストを大幅に軽減できます。
  • 今後は多言語やマルチモーダルへの対応も予定しており、商用サービスでは各業界に特化した領域にフォーカスする予定です。

🤖

AI detectors are destroying innocent writers' livelihoods

  • AI検出器による誤検知が、無実の作家の生計を脅かしています。
  • AI検出器は、作家の記事がAIによって生成された可能性が高いと誤って判断し、その結果、作家がクライアントを失う事例があります。
  • AI検出器の正確性は疑わしいとされ、誤検知が普通であると指摘されています。

😎

How Reveal’s Logikcull used Amazon Comprehend to detect and redact PII from legal documen..

  • 大量の法的文書から個人を特定するためのデータや情報(PII)を検出・削除する方法を紹介
  • PIIの検出と削除は、プライバシーの保護、データセキュリティの確保、法律や規制の遵守、顧客や関係者との信頼の維持に不可欠
  • Amazon Comprehendを使用して、顧客のメール、サポートチケット、製品レビュー、ソーシャルメディアなどでPIIを検出・削除することができる

📷

GitHub - radames/Real-Time-Latent-Consistency-Model: Demo showcasing ~real-time Latent Con..

  • リアルタイム潜在的一貫性モデル(LCM)のデモがMJPEGストリームサーバーで展示されています
  • デモを実行するにはウェブカメラ、CUDAとPythonまたはM1/M2/M3チップを搭載したMacが必要です
  • HTTPS経由でWebサーバーをテストする場合やDockerを使用する場合は、NVIDIA Container Toolkitが必要です

🇯🇵

NTTの新たな言語モデル「tsuzumi」は何がすごい? 島田社長らが語った展望とは - ケータイ Watc..

  • 新言語モデル「tsuzumi」は日本語に特化し、小型軽量でチューニングが容易な特長を持つ
  • すでに米OpenAIのGPT-3.5に匹敵する能力を持ち、GPT-4を目指して性能向上を図る
  • 医療やソフトウェア開発、コンタクトセンターなどで活用され、多言語対応も予定される

💻

大規模言語モデル「Phind」がコーディングにおいてGPT-4を上回る - GIGAZINE

  • PhindはAI検索エンジンで、コーディング能力に優れています
  • PhindはMetaの「Code Llama」を基にした独自のモデルを使用し、GPT-4よりも5倍高速です
  • PhindのDiscordコミュニティでは、有料のGPT-4よりもPhindを選ぶユーザーが多いとのことです

2023年11月02日

|

このサイトについて

/

ニュースレター

/

@AINewsDev