AI News

~AI関連記事を3行にまとめて紹介~

📞

[電話予約の無人化]Amazon Connect + GPT-4 Turboで、発話の「時刻と日付」の言い回しをどの程度..

  • Amazon ConnectとGPT-4 Turbo JSONモードを用いて電話予約の無人化を試みました
  • 予約の日付と時間の抽出を検証し、正しく抽出できることが確認できました
  • 予約情報の聞き取りの無人対応は現実的に可能だと考えられます

💻

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳す..

  • 「LightGaussian」を使用すると、高速かつ効率的に3Dシーンを生成可能
  • 大量のデータを必要とせずにシーンの質を維持できる
  • データ容量を大幅に削減し、ストレージの使用量も削減可能

💻

RAG用途に使える、Wikipedia 日本語の embeddings とベクトル検索用の faiss index を作った - A..

  • Wikipedia日本語の約550万文から検索可能なembeddingsとfaiss用のindexを作成
  • これにより、Wikipediaから該当の文を検索することが可能に
  • HuggingFace SpacesにRAGができるデモを作成し、Web-UIからRAG検索〜QAの応対を試すことができる

🌍

【AI倫理・法務に関わる人必見!】AIに関する国内外のルールメイキングの状況 (2023年12月版) - ..

  • EUではAI法案が重要で、2021年にリリースされ、その後修正案が出ています。
  • 修正内容は多く、AIの定義や禁止AIの範囲などが変更されています。
  • USではガイドライン等の拘束力のないルールで規制し、NISTのAIリスク管理フレームワークやバイデン大統領令が重要な取り組みです。

💬

ASCII.jp:速報!ChatGPTに「引用して質問」機能が実装されていた!

  • ChatGPTには、回答の一部を引用して質問を作成する機能が実装されている
  • 引用した部分に追加の質問を入力すると、詳しい回答が表示される
  • この機能は一部のユーザーに報告されているが、全てのユーザーには提供されていない

🐍

「最も使っている」プログラミング言語で異変、前年首位のJavaが王座陥落 | 日経クロステック(x..

  • 「最も使っている」プログラミング言語で、Pythonが首位を維持し、Javaが2位に上昇しました。
  • JavaScriptも3位にランクインし、PythonはAIやデータ分析、Javaはシステム開発、JavaScriptはWeb開発によく使われます。
  • また、Pythonが最も使われる言語となり、Javaが2位、C#が3位となり、JavaScriptは7位に順位を下げました。

🤖

Slackアプリ経由でChatGPTと連想ゲームをしてみた。 | GMOアドパートナーズ TECH BLOG byGMO

  • AIを使用した連想ゲームの社内イベントを開催
  • Slackアプリに連想ゲームを追加実装し、ユーザーがヒントを出すとChatGPTが答えを生成
  • ワークフロー形式で参加の難易度を下げ、多くの人が楽しめるようにした

📸

マルチモーダルLLMの応用動向の論文調査 - Speaker Deck

  • 画像の座標問題の解決策として、外部ツールの活用や特化型モデルの作成がある
  • 座標情報を生成する学習モデルや外部ツールの呼び出しにより問題を解決する
  • Florence-2やNExT-Chat、u-LLaVAなどのモデルやMM-ReAct、UnifiedVisionGPT、LLaVA-plusなどのツールを使用可能

💭

AmazonのAI「Amazon Q」は重度の幻覚によってAWSデータセンターの場所などの機密データを漏えい..

  • AI「Amazon Q」が幻覚により偽の情報を出力することがあると指摘
  • 出力される情報にはAWSデータセンターの場所や未リリース機能などが含まれる可能性がある
  • 企業側は機密情報の漏洩はないとコメントしているが、従業員の不安が示唆されている

📚

【まとめ】大学が公開している有益な資料 #Python - Qiita

  • 各大学が公開しているエンジニア向けの資料をまとめた
  • Pythonプログラミング入門、AWS入門、AI・データサイエンスの活用事例などが学べる
  • ハーバード大学ではアルゴリズムやPython、JavaScript、セキュリティーを学べる

😭

GPT-4のライバルと目されるGoogleの次世代マルチモーダルAI「Gemini」のリリースを延期するとス..

  • Googleの次世代マルチモーダルAI「Gemini」のリリースが延期されることが決定
  • GeminiはAlphaGoやAlphaGo Zeroの技術と大規模言語モデルを組み合わせたもの
  • テキストや音声、画像、動画などの複数のデータを扱うことができる次世代AI

🚀

ASCII.jp:これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)

  • 「Latent Consistency Models(LCM)」が大爆発し、「LCM-LoRA」が登場
  • リアルタイム生成のAI機能を組み入れたサービスやアプリの開発が進行中
  • 特に「Generative AI for Krita」はペイントソフトと生成AIの組み合わせが世界のデフォルトになる可能性がある

🔍

Google、生成AI「Bard」の活用法トップ10を発表。「新たな見解を得る」ってどんな使い方? - INT..

  • 生成AI「Bard」の活用法トップ10には、事実の調査や専門的な相談、プログラミングのコード生成などが含まれる
  • 質問の背景や目的を説明することで、より適切な回答が得られるとされている
  • 写真を使った質問も可能である

👍

初心者でも大丈夫!GitHub Copilot Chatで始めるKaggle画像系コンペ #初心者 - Qiita

  • Kaggleの画像系コンペに参加したいが進め方が分からない方への解決策を提案
  • 公開Notebookのコードが理解できない、自分でベースラインNotebookを作りたいが方法が分からない問題を解決
  • GitHub Copilot Chatを活用し、コーディング作業を補助するツールとして利用

🎉

Kaggle Tokyo Meetup 2023 参加記 - 俵言

  • Kaggle Tokyo Meetupが4年半ぶりに開催され、参加者は120人以上
  • Vesuvius Challengeの準優勝チームやIdentify Contrailsの3位チームの取り組み方が紹介
  • CommonLitの入賞チームの解法やEnsembleの可視化も紹介された

🚀

GitHub - pytorch-labs/segment-anything-fast: A batched offline inference oriented version ..

  • segment-anything-fastは、segment-anythingの高速な推論バージョンとして使用できます。
  • bfloat16を使用し、max-autotuneでtorch.compileを有効にし、長いシーケンス長の相対位置エンコーディングのためのカスタムTritonカーネルを使用します。
  • 初めてモデルを実行する場合、コンパイルに時間がかかる可能性があります。

🔍

画像を理解するGPT-4 Visionで、既存の画像認識モデルを説明可能にする ~ 新宿の特徴は"ビル群"..

  • 画像認識モデル全体の特徴を把握するために、複数の画像を分析します。
  • 頻出する単語や特徴を解析します。
  • モデルがどのようなオブジェクトや特徴に注目しているのかをより詳細に理解することができます。

🎥

生成AI 動画を認識し文章で表現する新技術 NECが開発 | NHK | 生成AI・人工知能

  • NECが動画の内容を認識し文章に表現するAI技術を開発
  • 複数のAIが協力して動画を認識し、生成AIが文章に整える
  • 交通事故の原因分析や作業記録作成などに活用される

💨

2023年末: ChatGPT / LLM とチャット UI と社会実装のカタチを考える|とりしま日記

  • 今年もあと1ヶ月を切り、スタートアップ案件の開発がまだ終わっていない
  • AIの進化がすごく、影響力も増えたが、自身はAIに詳しくなく、情報をシェアしているだけ
  • ローカルのAIも進化し、性能が向上しているが、まだまだ進化は続く

💫

「生成AIに仕事が奪われる」と焦ってから1年……あなたの仕事はどうですか?:NEWS Weekly Top10..

  • 2023年の「新語・流行語大賞」では「生成AI」がトップテン入りし、生成AI関連が盛り上がった1年だった。
  • 画像生成AI「Midjourney」と「Stable Diffusion」、文章生成AI「ChatGPT」が登場した。
  • 生成AIの発展による変化は限られており、多くの職種の業務内容はほとんど変わっていない。

🚀

Generative Recommendation : LLMを活用した推薦システム | Wantedly Engineer Blog

  • LLMは大規模言語モデルで、推薦の分野で積極的に研究されています。
  • 推薦システム内部でのLLMの活用や、LLMを推薦システム自体として使用する方法があります。
  • P5というパラダイムでは、LLMを活用したGenerative Recommendationが提案され、OpenP5モデルを使用して推薦結果を生成することができます。

🔍

生成系AIの画像添付を使って可能性を探ってみた。 | GMOアドパートナーズ TECH BLOG byGMO

  • ドラマ「トリリオンゲーム」の面白さやAIの花認識の試験結果について触れた
  • BardやBingの利点、娘との洋服点数比較、AIの進化についても言及
  • AIチャットの利便性やEC分野の可能性、生成系AI市場の成長率についても触れた

😎

もし明日、上司に「GPT-4を作れ」と言われたら? Stability AIのシニアリサーチサイエンティス..

  • 「GPT-4を作ってください」と言われたらどう答えますか?という問いに対する解像度を上げるための話が行われました。
  • LLMの作成は「Pretraining」と「Fine-Tuning」の2つのステップで行われます。
  • 急いでLLMを作る場合は、GPUを確保し、データセットを準備し、GPT-NeoXフレームワークを使用してPretrainingを行い、Fine-TuningではSFTを行います。

🤖

Mastering Data Science Workflows with ChatGPT - KDnuggets

  • データサイエンスの分野は絶えず進化し、データの流入が絶えず続くため、革新的な解決策が求められています
  • ChatGPTは自然言語理解と生成能力を持つ強力な言語モデルで、データサイエンティストのワークフローに活用可能です
  • ChatGPTの能力を最大限に活用するためのスキルが紹介されています

🔑

Generative AI Key Terms Explained - KDnuggets

  • 生成AIのキーワードと学習リソースを紹介する記事
  • ChatGPTの登場以来、生成AIモデルが急速に進化し、現実的なテキスト、画像、ビデオ、音声を作成
  • ニューラルネットワークのイノベーションと計算能力の向上により、多くの企業がこれらのモデルへのアクセスを提供

🚀

How Getir reduced model training durations by 90% with Amazon SageMaker and AWS Batch | AW..

  • Amazon SageMakerとAWS Batchを使用してモデルのトレーニング時間を90%削減した
  • 超高速の食料品配達の先駆者で、トルコ、イギリス、オランダ、ドイツ、アメリカに展開
  • エンドツーエンドの商品カテゴリ予測パイプラインを構築し、シナジー効果を生み出している

🚀

「Copilot in Windows」が正式提供開始 - PC Watch

  • 「Copilot in Windows」はMicrosoftが提供する生成AIによる一連の機能/サービスの名称です
  • GPTベースのチャット機能やテキスト/コードの作成および編集、スケジュールやタスクの管理、Web情報検索などが行えます
  • プレビュー版の提供後、12月から正式提供が開始され、Windows 10への提供も開始されています

😎

GPT-4 Turboにドキュメントのチャンク分けを任せてみる - EXPLAZA Tech Blog

  • 検索拡張生成(RAG)を使用して企業独自のデータを制御する際の課題として、ドキュメントのチャンクサイズをどの程度にするかが挙げられます。
  • チャンクサイズを決める方法としては、特定の文字数や区切り文字で分ける方法、前後の文脈を含める方法、セマンティッククラスタリングなどがあります。
  • 最大128,000トークンを扱えるGPT-4 Turboを使用して、ドキュメントを細かく分ける代わりに、PDF内のテキストをそのまま渡して適切に分けてもらう方法を試みました。

🎮

GitHub - KienTTran/ABMGPU: Agent Based Model on GPU using CUDA 12.2.1 and OpenGL 4.5 (CUDA..

  • CUDA 12.2.1とOpenGL 4.5を使用したGPU上でのエージェントベースモデルのデモが可能
  • GTX 3060では、500万〜1000万のエージェントを問題なくレンダリングできる
  • GLFW3ウィンドウマネージャーでのレンダリングやOpenGLでのダイナミックなカメラビューなどの特徴がある

💡

【GPT-4V APIのおすすめ活用事例】OpenAIの最新モデルを使ったヤバい使い方10選 | WEEL

  • GPT-4V APIを使ったアプリ開発では、ローコードツールやファッションアドバイスツールが登場
  • AIチャットボットでは物を指しながら会話が可能に
  • ゲーム実況や画像アノテーションの自動化、マルチモーダルRAGによるチャットボット開発も実現

2023年12月05日

|

このサイトについて

/

ニュースレター

/

@AINewsDev