AI News

~AI関連記事を3行にまとめて紹介~

🌈

Open challenges in LLM research

  • LLM研究のオープンな課題として10の主要な研究方向が浮かび上がった
  • 特に注目すべきは3番目の多様性、5番目の新しいアーキテクチャ、6番目のGPUの代替
  • 幻覚の削減と測定は既に議論されているトピックで、AIモデルがでっち上げをするときに起こる

😡

AI新時代:消された少女の“反AI”マーク 「無断改変したのは俺です」 | 毎日新聞

  • 関西の女性クリエーターが描いたAI反対のマークが入ったイラストが無断で改変され、ブログに掲載された
  • 女性はブログの運営会社に対応を求めたが、「表現の自由の範囲だ」と取り合ってもらえなかった
  • 改変画像を掲載したブログは削除されたが、別のウェブサイトに同じ改変画像が投稿され、投稿者は「絵を無断改変した人間というのは俺です」と自ら明かした

💻

ChatGPT、近日中に大幅更新か——プロンプト提案、複数ファイルアップロード機能など実装の可能..

  • ChatGPTの大規模アップデートが近日中に予定されています
  • 新機能にはプロンプトの例、返信とフォローアップ質問の提案、複数ファイルのアップロードサポートなどが含まれます
  • GPT-5の商標を申請中で、人工的な生成や翻訳などの機能が含まれる可能性もあります

💻

LINE が公開した日本語言語モデルを M2 Macbook Airで動かす

  • 日本語言語モデルをM2 Macbook Airで動かす手順を紹介
  • huggingfaceの変換モデルを使用し、GPUがなくても動作可能
  • 実行結果は速く、メモリ消費も少なく、iPhoneでも動作する可能性がある

💻

LLM with Vertex AI only using SQL queries in BigQuery | Google Cloud Blog

  • BigQueryを使用してテキスト生成のためのVertex AIモデルを使用するSQL専用LLMが登場
  • データのセキュリティ、プライバシー、コンプライアンスの問題を心配せずに迅速な生成AIを行うことが可能
  • Cloud SQLやSpannerなどの他のデータベースに格納されたデータに対しても、SQLのみのLLMベースの分析が可能

🐍

GitHub - mr-gpt/deepeval: PyTest For LLMs

  • DeepEvalは、LLMパイプラインのオフライン評価をPythonで行う手法を提供
  • LLMの本番環境へのスムーズな展開を可能にする
  • LLMの本番化と評価をソフトウェアエンジニアリングと同じくらい簡単にすることを目指す

🇺🇸

OpenAI、初の公開企業買収はInstagram出身者らの新興企業Global Illumination - ITmedia NEWS

  • 米OpenAIは、米新興企業Global Illuminationを買収し、8人のチームメンバー全員がOpenAIに参加することを発表した。
  • Global Illuminationは2021年創業のニューヨークの非公開企業で、創業メンバーは全員米Meta傘下のInstagramでのエンジニア経験を持つ。
  • 同社は自らを“デジタルプロダクト企業”と定義し、最近のプロジェクトは「Biomes」というゲームだとしている。

🧠

Learn as you search (and browse) using generative AI

  • 生成AI搭載の検索体験(SGE)は、科学、経済、歴史などのさまざまなトピックや質問に関連するAI生成の回答を改善し、定義をプレビューしたり、関連する図や画像を表示したりするアップデートを近日中に展開します。
  • SGEは、生成されたコードをより理解しやすくデバッグできるようにする新機能を追加します。
  • 「SGE while browsing」というSearch Labsの早期実験を開始し、生成AIがオンラインの情報をナビゲートし、より迅速に求めている内容に到達するのにどのように役立つかをテストします。

🤖

AI戦略策定のための人工知能・機械学習・生成系AIに関するAWSの新たなガイドライン | Amazon Web..

  • AI、機械学習、生成系AIに関する新しいガイドが提供されています。
  • 新しいガイドは、AI戦略の策定や機械学習サービスの選択をサポートします。
  • ガイドには、サービスの詳細や比較表も提供されています。

💪

Shazam for Singing

  • 音声認識ツールと大規模な言語モデルを組み合わせて、歌唱を認識し曲を特定するシステムを開発。
  • Whisperという音声認識ツールを使用し、歌詞をテキストとして識別。
  • GPT-4のチャット補完APIを使用して曲の識別を行い、歌唱から曲名を特定することに成功。

💥

New York Times considers legal action against OpenAI as copyright tensions swirl

  • ニューヨーク・タイムズがOpenAIに対して著作権問題で法的措置を検討中
  • ライセンス契約に関する交渉が激化し、新聞社が法的措置を検討
  • ChatGPTが新聞社の報道と執筆に基づいてテキストを生成し、直接競合する存在に

😮

ChatGPTのOpenAI、元Instagramの技術者設立の新興企業を買収 - 日本経済新聞

  • ChatGPTのOpenAIが新興企業を買収
  • 買収対象は元インスタ技術者が設立した企業
  • ChatGPTは自然な文章を生成し、質問に答えるAI

🔐

Dependabot alertをSlackに通知して、トリアージ運用に役立てる仕組みを作ってみた - freee Deve..

  • Dependabotはプロジェクトのライブラリ依存関係をチェックし、問題があるものをアラートするGitHubの公式機能
  • freeeでは、2023年1月からDependabotを本格運用し、ライブラリの脆弱性管理を行っている
  • Dependabotは高度な脆弱性対応フローに対応できないため、セキュリティチームでの確認とトリアージが必要

💻

Fooocusのインストール【web UIとComfyUI以外の選択肢】 | ジコログ

  • Fooocusは、オープンソースの画像生成ソフトウェアで、4GBのGPUでも動作可能です。
  • FooocusのインストールはWindowsでは3クリック未満、Linuxではpipコマンドを用いて行います。
  • Fooocusを利用すると、高画質の画像生成が可能で、ComfyUIやweb UIと併用する価値があります。

😱

SnapchatのMy AIが謎の動画を勝手に投稿し沈黙、ユーザーを怯えさせる。Snapは「一時的な障害」..

  • SnapchatのAIチャットボット機能「My AI」が突然、ユーザーのストーリーに1秒間の謎の動画を投稿
  • この現象は複数のユーザーで同時に起こり、Snapの広報担当者は一時的な障害が原因だと説明
  • 具体的な障害の内容については明かされておらず、My AIに画像や動画を生成する機能を計画している可能性もある

🖼️

Google Colab で Japanese InstructBLIP Alpha を試す|npaka

  • 「Japanese InstructBLIP Alpha」は、画像キャプション生成と質問応答が可能な日本語向け画像言語モデルです。
  • Colabでの実行手順は、GPUの設定、パッケージのインストール、モデルとプロセッサーとトークナイザーの準備、画像の準備、プロンプトの準備、推論の実行です。
  • 推論の実行後、生成されたテキストを表示します。

🎉

日本語画像言語モデル「Japanese InstructBLIP Alpha」をリリースしました — Stability AI Jap..

  • 「Japanese InstructBLIP Alpha」は画像に対して文字で説明を生成したり、質問に回答する機能を持つ
  • 日本特有の建造物を正しく認識することも可能
  • Hugging Face Hubで公開され、研究目的での利用に限定されている

🤖

性描写のある書籍を「ChatGPT」で特定--19作が学校の図書館から撤去される - CNET Japan

  • 米国アイオワ州の学区がAIを使い、性的な内容を含む書籍を特定し19作品を図書館から撤去
  • この手法には批判もあるが、学区は擁護可能な手続きと主張
  • 全ての本を読むことは現実的ではないため、ChatGPTを利用して削除すべき本を特定

🔍

MIT Tech Review: メタの大規模言語モデルが問う「オープンであること」の価値

  • 大規模言語モデル「Llama 2」は透明性があり、カスタマイズ可能で無料で利用できる
  • Llama 2は幅広いコミュニティに提供され、モデルの安全性や透明性を向上させる予定
  • オープンモデルはユーザーにより多くの権限とコントロールを与えるため、AIのオープン性に関する議論は重要

🔍

検索のリンク先に飛ぶ前に生成AIがページを要約。Google新機能 - PC Watch

  • Googleが検索体験向上のため新機能を実装開始
  • 生成AIによる要約や特定の用語の詳細表示、コードの強調表示、長い記事の要約表示が可能
  • テストは「Search Labs」で行われ、日本では利用できず、デスクトップ版Chromeにも実装予定

👀

Google提唱のE-E-A-Tとは? 経験, 専門性, 権威性, 信頼とSEO

  • E-E-A-TはGoogleのウェブページ評価基準で、経験、専門性、権威性、信頼を指す
  • YMYLトピックではE-E-A-Tが重要で、信頼性と安全性に厳しい基準が設けられている
  • E-E-A-Tを満たす高品質なコンテンツはGoogleのアルゴリズムにより評価される

📚

An Excellent Resource To Learn The Foundations Of Everything Underneath ChatGPT - KDnugget..

  • ChatGPTの基礎を学ぶためのリソースが提供されています。
  • このリソースでは、機械学習の基礎から深層ニューラルネットワークの理解までを学ぶことができます。
  • また、モデルの理解やニューラルネットワークの設計、関連する用語など、多くの内容がカバーされています。

🚀

HuggingFace Diffusers v0.20.0の新機能|npaka

  • 「Diffusers v0.20.0」ではSDXL ControlNetsやGLIGEN、Tiny Autoencoderなどの新機能が追加されました
  • 無料版ColabでDreamBoothとLoRAでSDXLをファインチューニングする機能や、モデル・スケジューラ・パイプラインのpush_to_hubサポートが提供されています
  • Kohyaで学習したLoRAチェックポイントの読み込みサポートが向上し、プロンプトの重み付けのためのドキュメントが改善されました

💻

LangChain + Streamlit + Llama: Bringing Conversational AI to Your Local Machine - KDnugget..

  • オープンソースのLLMとLangChainを統合し、生成型質問応答を無料で実現
  • 大規模言語モデル(LLM)は、人間の言語に非常に近いテキストを生成し、自然な方法でプロンプトを理解する機械学習モデル
  • LLMを利用することで、ドメイン固有のデータを効果的に取り扱うことができる

📚

Build ML features at scale with Amazon SageMaker Feature Store using data from Amazon Reds..

  • Amazon RedshiftのデータをSageMakerでオフラインで特徴量を開発し、保存する方法を紹介
  • 3つのオプションとして、AWS GlueインタラクティブセッションとAWS Glueジョブ、Amazon SageMaker ProcessingジョブまたはSageMaker Feature Processing、Amazon SageMaker Data Wranglerを使用
  • これらのオプションを使用することで、Amazon Redshiftのデータを効率的に処理し、SageMaker Feature Storeに特徴量を格納可能

🤖

Idiot Students Are Submitting Answers Saying "I Am an AI Language Model"

  • AIチャットボットChatGPTが学生の不正行為を誘発し、教育者との攻防戦が続いている
  • AI検出ツールの信頼性に欠け、教育者の判断に委ねられる状況
  • AIによる不正行為を防ぐためのアプローチとして、ChatGPTが答えられない質問をする方法や紙ベースのテストがある

🔬

抗がん剤の副作用をAIで予測する - エムスリーテックブログ

  • AI・機械学習チームが抗がん剤の副作用を予測する研究をサポートし、MASCC国際学会で発表されました
  • 足の画像と背景情報を組み合わせたアンサンブルモデルを作成し、AUC 0.7の結果を得ました
  • 今後はデータ量の増加と背景情報の見直しを行い、精度の向上を目指します

📝

生成AIに関する共同声明|著作権|声明・見解|日本新聞協会

  • 生成AIの利便性向上の一方で、偽情報拡散や個人情報漏洩、著作権侵害のリスクが指摘されています。
  • 生成AIは著作物データに依存しており、そのデータ収集方法や著作権法の解釈に問題があるとされています。
  • 著作権者の利益を守るため、著作権法の改正や著作権保護策の検討、生成AIの利用者の権利侵害リスクへの注意が必要とされています。

🔬

Gartner、「日本における未来志向型インフラ・テクノロジのハイプ・サイクル:2023年」を発表

  • 2023年の新技術では、生成AIと分散型アイデンティティが「過度な期待」のピークに位置しています。
  • メタバース、Web3、NFT、量子コンピューティング、イマーシブ・エクスペリエンスは2022年にピークを迎え、現在は幻滅期に入っています。
  • 生成AIは企業が積極的に試行・実験し、ほとんどのテクノロジ製品/サービスに組み込まれ、分散型アイデンティティはユーザーがDIDを使用し、自分自身でアイデンティティ情報を管理することが可能です。

😎

Langchain x Predibase: The easiest way to fine-tune and productionize OSS LLMs

  • LangchainとPredibaseの統合により、開発者はホストされたOSSモデルをシームレスにワークフローに統合できます
  • PredibaseはOSS LLMのための開発者プラットフォームで、事前学習済みまたはカスタムのオープンソースLLMを展開およびクエリすることが可能です
  • LangchainとPredibaseを使用して、シンプルなQ/Aシステムを構築することができます

📝

Text-2-Video Generation: Step-by-Step Guide - KDnuggets

  • テキストからビデオを生成するためのPythonを使用した手法について説明
  • 拡散ベースの画像生成モデルを使用し、Text-2-Videoモデルの開発に取り組む
  • HuggingFaceが提供するファインチューニングモデルを使用してビデオを生成する方法を解説

😱

高まる「生成AI失業」の脅威 リスキリング熱後押し - 日本経済新聞

  • 生成AIのスキルが注目され、eラーニングの教材が増加
  • 受講希望者が殺到している
  • 企業はリスキリングを求められている

📱

Adobe Express、生成AI機能搭載のオールインワンアプリに進化 - Impress Watch

  • AI機能搭載のオールインワンアプリが最新バージョンで進化
  • 画像生成AI「Firefly」を搭載し、日本語プロンプトでの画像生成に対応
  • 商業利用も可能で、安全なカスタム画像や効果を素早く利用できる

💻

Neural network pruning with combinatorial optimization – Google Research Blog

  • 現代のニューラルネットワークは大規模なアーキテクチャを使用し、多くの計算リソースを必要とする
  • リソース制約のある環境では、これらのモデルを提供することが困難
  • 事前学習済みネットワークの推論コストを軽減する手法の1つは、重みの一部を削除することによる剪定

📚

RWKVについて解説 | AGIRobots

  • RWKVはRNNとTransformerの利点と欠点を結合したモデルで、長い文章を扱い、計算コストを削減します
  • 長期の依存関係を捉えることが可能なRWKVは、Transformerの進化形として注目されています
  • Attention Free Transformerという手法を採用し、内積注意を代替することで計算コストを低減しています

🤖

RoboAgent: Towards Sample Efficient Robot Manipulation with Semantic Augmentations and Act..

  • 7500の軌跡のみで訓練されたRoboAgentは、多様なスキルを効率的に獲得し、未知のシナリオに一般化できます。
  • 12の操作スキルを38のタスクにわたって展示し、未知のオブジェクトやタスク、新しいキッチンにも対応可能です。
  • RoboAgentは新しい経験を通じて能力を進化させることも可能です。

🤖

Consensus - Evidence-Based Answers, Faster

  • AIを活用した検索エンジンで2億以上の科学論文を検索し、エビデンスに基づいた迅速な回答を提供
  • 研究者、学生、医師、専門家、エビデンスに敏感な消費者が利用
  • GPT4や他のLLMを活用した独自の機能により、結果を要約

😮

Weekly AI News #4 - by hotchpotch - Weekly AI News

  • AI学習による著作権侵害と日本語生成AIの進化が注目されている
  • ニューヨーク・タイムズがOpenAIに対して著作権問題で法的措置を検討中
  • 日本語生成AI「Japanese StableLM Alpha 7B」が公開され、日本語の言語モデリング性能とタスクパフォーマンスを最大化することに特化

📸

画像を説明できるAI「Japanese InstructBLIP Alpha」 Stability AI Japanが公開 - ITmedia NEWS

  • 画像を入力すると説明文を生成できるAIモデル「Japanese InstructBLIP Alpha」が公開された
  • このAIモデルは、ユーザーの指示に受け答えでき、日本特有の建造物を正しく認識できる機能を備えている
  • 画像について質問することも可能で、例えば速度制限が描かれた道路の画像に対して質問すると回答する

🤖

MultiOn x LangChain: Powering Next-Gen Web Automation & Navigation with AI

  • MultiOnは次世代のパーソナルAIアシスタントで、Webと対話し、情報の検索やフォームの入力などの日常のWebタスクを代わりに処理します。
  • MultiOnはLangChain内に直接統合されており、日常のWebタスクを自動化し、Web上でアクションを実行できるカスタムエージェントやアプリケーションを簡単に構築できます。
  • LangChainユーザーはAIパワードのツールを利用して、情報の取得からWebサービスとの対話まで、さまざまな日常のWebタスクを自動化することができます。

🏢

GoogleのトップAI研究者2人、東京でAI企業Sakana.ai立ち上げ - ITmedia NEWS

  • 元Googleの研究者、リオン・ジョーンズ氏とデビッド・ハー氏が新AI企業を設立
  • 新会社Sakana AIは自然からインスピレーションを得た新しい基礎モデルを開発し、環境変化に適応することを目指す
  • 東京を拠点に選んだ理由は、研究者獲得競争を避けるためと高度な教育を受けた労働力があること

💭

メタ認知をさせてLLMの能力を上げる手法「メタ認知プロンプティング」 | AIDB

  • メタ認知プロンプティングは、大規模言語モデル(LLM)の理解を深める新手法です。
  • 人間の「思考についての思考」を模倣するメタ認知プロセスを導入します。
  • 入力テキストの理解から最終的な推理の説明までの5つの段階を通じて、LLMのタスク処理を強化し、文脈認識と内省を向上させます。

😊

Googleが「AIが人生相談や個別指導、計画立案などをしてくれるツール」を開発中 - GIGAZINE

  • AIが人生相談や個別指導、計画立案などを行うツールが開発中で、少なくとも21種類のタスクをこなせると報じられています。
  • AIソフトウェアのトレーニングと検証に特化した新興企業と契約し、一連のツールをテストしています。
  • このツールはユーザーに人生上のアドバイスやアイデア、計画の提案、個別指導などのヒントを与えることができます。

😎

ASCII.jp:ChatGPTがさらに楽に! 会話設定を記憶「カスタム指示」無料化

  • ChatGPT Plusユーザー向けに提供していた「カスタム指示」機能が無料版ユーザーにも公開されました。
  • この機能では、ChatGPTに知っておいてほしいことや応答の傾向を事前に設定できます。
  • 今後、他の有料プランのユーザー向けの機能も公開されるかは未定です。

2023年08月18日

|

このサイトについて

/

ニュースレター

/

@AINewsDev