~AI関連記事を3行にまとめて紹介~
😮
相手の名前や予定を覚え、文脈を共有して話せる「MemGPT」で、AIエージェントの未来を体験する【..
「MemGPT」はAIエージェントの未来を体験でき、相手の名前や予定を覚え、文脈を共有して話すことが可能
大規模言語モデル(LLM)の長期記憶として階層的なメモリを使い、重要な情報を会話に役立てる
自宅PCでMemGPTを試すことも可能で、会話中に記憶した情報を確認したり、会話の保存や復元もできる
🤖
xAI、“全人類に利益をもたらすAIツール”を目指す「Grok」正式発表 - ITmedia NEWS
初のAIモデル「Grok」が発表され、ほぼすべてのことに答えることを目的としています。
Grokはウィットに富んだ質問にも答えることができ、人々の情報アクセスやアイデアの支援を行います。
現在はまだトレーニング中のβ版で、将来的にはさらなる研究を進める予定です。
💼
「生成AIを仕事で使い倒す人たち」に取材して回ったら「自分の10年後の失業」が見えてしまった |..
ChatGPTの利用状況は全体の5%程度で、積極的に仕事で利用している人は1%程度と推測される
生成AIはコンサルティングやマーケティング、文書生成、プログラムコード生成などの仕事において高いパフォーマンスを発揮し、利用が増えている
10年後には、多くの職業が生成AIに代替され、業務量は減少する見込み
👌
NTT版LLM「tsuzumi」に見る国産LLMの意義と戦略【西田宗千佳のイマトミライ】-Impress Watch
「tsuzumi」は2024年3月より商用展開予定で、パラメータサイズが小さくても高い精度の日本語処理が可能です。
パラメータ数の少ないLLMは省エネルギーや学習速度の向上につながり、学習コストや導入コストも低くなります。
日本語処理の効率化やヘルプデスク業務など、デジタルトランスフォーメーションに必要な要素を備えたLLMは、企業向けの展開に適しています。
👨🔬
ChatGPTでデータベースに侵入 機密情報を漏えいさせるコードを生成 英国と中国の研究者らが実..
英国のシェフィールド大学と中国の北方工業大学の研究者らがAIツールの脆弱性を発表
自然言語処理(NLP)アルゴリズムの脆弱性を悪用し、オンラインデータベースからの機密情報流出や攻撃が可能と指摘
Text-to-SQLシステムや商用アプリケーションでも同様の脆弱性が確認され、修正が行われた
🤖
生成AIが“わざと”間違えてる? デタラメ回答が“ただの誤り”ではない大問題とは 連載:野口悠..
生成AI「大ちゃんと話す」が大阪万博について誤った回答をしたことが話題になっている
生成AIが誤った答えを出すのはハルシネーション(幻覚)と呼ばれる現象で、一般的なことである
ChatGPTが大阪万博について答えた理由は、事前学習しているデータが2021年9月までのものであるため、最新の情報については答えられない
💬
イーロンマスクのxAI、新AIモデル「Grok」開始 「リアルタイムな知識」を持つ - Impress Watch
新しいAIモデル「Grok」が発表されました
Grokは対話型のAIチャットサービスで、不適切な質問にも答えることができます
現在は初期バージョンであり、GPT-3.5を超える能力を持つGrok-1に向けてトレーニングを行っています
🗣️
rinna、Llama 2の日本語継続事前学習モデル「Youri 7B」を公開|rinna株式会社
Llama 2の日本語継続事前学習モデル「Youri 7B」が公開された
対話形式でユーザーの指示に応える「Youri 7B Instruction」と複数ターンの対話データを用いた「Youri 7B Chat」も開発
省メモリのGPUでも利用できるように4bit量子化されたモデルも公開
💬
ChatGPTはこれまでの対話システムと何が違う? 対話システムの言語理解を探る:対話システムの..
対話システムの言語理解技術にはパターンマッチ、構文解析、意味解析、深層学習による大規模言語モデルが使われます。
ELIZAやA.L.I.C.E.などの対話システムでは、パターンマッチを使ってテキストの照合や応答文の作成が行われます。
パターンマッチだけでユーザーの発話内容を理解するわけではありませんが、興味深い対話が続きます。
👀
GitHub - lxe/llavavision: A simple "Be My Eyes" web app with a llama.cpp/llava backend
LLaVaVisionは、ChatGPT、Copilot、そして開発者の助けを使って約1時間で作成されたウェブアプリです。
llama.cpp/llavaバックエンドを備え、SkunkworksAI BakLLaVA-1モデルを使用して視覚情報を説明します。
Web Speech APIを使用してテキストをナレーションし、Fuzzy-Search/realtime-bakllavaに触発されたアプリです。
📚
Retrieval-based LM (RAG system) ざっくり理解する - Speaker Deck
RAGはRetrieval-Augmented Generationの略で、知識集約型タスクやオープンドメイン質問応答に利用される
外部知識源としてWikipediaから情報を検索し、応答を生成する
RAGの推論フレームやクエリ拡張のモチベーションも紹介されている
😱
AIが生成した「クラスメイトの女子高生の偽ヌード写真」を男子高生がグループチャットで共有した..
AIが生成した女子高生の偽ヌード写真を男子高生が共有し、警察が捜査を開始
被害者の一人は怒りと恐怖を感じ、母親は娘の未来に影響を心配
AIによるディープフェイクの作成が容易になり、社会的な懸念を引き起こしている
🤖
AIに「それがファイナルアンサーなの?」「全力を尽くして」といった感情的な命令文を伝えるとパ..
AIのパフォーマンス向上には感情的な命令文が効果的であることが研究で明らかになった
肯定的な単語や自信を示す言葉を使用すると、真実味や誠実さ、品質のスコアが向上する
感情プロンプトを使用すると、GPT-4やT5、Vicunaなどの大規模言語モデルに質問を投げかけ、精度が向上する
🗣️
「どうやってChatGPTと一緒にコードを設計するの?」深津貴之さんによるAIとのペアプログラミン..
AIとのペアプログラミングは「磯野〜、ペアプロしようぜ!」と誘って、会話しながら行うと安定する
入門版のサンプルだけでなく、仕事ではもっとエグい命令やフレームワークを使う
性能を上げたバージョンのノウハウもあるが、論文を書く方法がわからない
👨💻
GitHub - 01-ai/Yi: A series of large language models trained from scratch by developers @0..
Yiシリーズのモデルは大規模な言語モデルで、開発者によってゼロからトレーニングされています。
初公開版には、6Bと34Bの2つのバイリンガル(英語/中国語)のベースモデルが含まれています。
モデルは4Kのシーケンス長でトレーニングされ、推論時には32Kまで拡張可能で、Yi-34Bモデルは特に高い性能を示しています。
💼
「アレクサで特許権侵害」とアマゾンを提訴、岐阜県の開発企業 過去にはLINEに勝訴 - ITmedia N..
岐阜県の開発企業が、AIアシスタント「Alexa」が自社の特許を侵害しているとして米Amazon.comなど4社を提訴
ライセンス契約の締結を求めていたが、応じなかったため提訴に至った
同社は以前にもLINEに対して特許侵害を訴え、支払いを命じられた経験がある
📝
1つの HTML ファイルだけで完結する校正支援ツールの作り方
Yahoo!デベロッパーネットワークのテキスト解析Web APIがCORS対応し、ブラウザから直接アクセス可能に
「校正支援」機能は日本語文章の品質チェックを支援し、入力ミスや誤用、わかりにくい表記、不適切な表現などをチェック
校正支援ツールはHTMLファイル1つで完結し、ブラウザさえあればすぐに使える
💡
Stability AI Japanが公開した30億パラメーターの日本語向けLLMを動かしてみた - 生成AIストリー..
30億パラメーターの日本語向けLLMが公開され、日本語タスクにおいて最高水準の性能を発揮
商用利用可能なApache 2.0ライセンスで公開され、Google Colabで実行可能
次回は70億パラメーターの「Japanese Stable LM Gamma 7B」を使用した実験を解説予定
🎯
イーロン・マスクがChatGPTのライバルAI「Grok」を発表 - GIGAZINE
「Grok」はリアルタイムで情報にアクセス可能な言語モデル
他のモデルよりも優れたスコアを示し、難しい質問にも対応
現在は早期アクセスプログラムとして提供、将来的には月額約2400円で利用予定
🎓
言語指示でWebサービスとやりとりするAI 香港大学などが開発 買い物、フォームに入力、SNS投稿..
香港大学などの研究者が「OpenAgents」というオープンソース・フレームワークを提案
このフレームワークを使うと、一般ユーザーもプログラマー向けのツールを使わずにAIエージェントと対話可能
オンラインのWebインタフェースを通じてAIとやりとりできる
🎮
AIのみで『アングリーバード』を“コピー”したユーザーあらわる。コードは1行も書かず、実際に..
AIを使って『Angry Birds』に似たゲーム『Angry Pumpkins』が制作され、大きな反響を呼んでいます。
ゲームコードはGPT-4、グラフィックはMidjourneyおよびDALL·E 3に出力させて制作されました。
AIがゲーム開発に役立つ時代が来ることを期待しています。
🎯
Why Prompt Engineering is a Fad - KDnuggets
プロンプトエンジニアリングはAIモデルを誘導し、特定の出力を生成するための入力の戦略的な作成を中心としています。
プロンプトエンジニアは、LLMの振る舞いの論理、推論、知識を利用して、自分が望む出力を思いのままに生み出すプロフェッショナルです。
プロンプトエンジニアリングの批判者は、それが基本的な理解力を欠いたAIシステムの洗練された操作に過ぎないと主張しています。
👀
5 Free University Courses on Data Analytics - KDnuggets
データ分析の初心者向けに、Pythonを使ったデータサイエンスの基礎を学べるコースがある
大規模データセットから情報を抽出する方法を学べるコースも提供されている
データ分析の基本から技術的な側面までをカバーするコースが揃っている
🔧
PromptIDE
PromptIDEは、プロンプト技術の実装と分析を行う統合開発環境で、Grokの開発に活用されています。
IDEはプロンプトの自動保存やバージョン管理、分析情報の永久保存など、使いやすさを向上させる機能を備えています。
PromptIDEを通じてプロンプトを公開し、コミュニティを築くことも可能です。
📄
Customize Amazon Textract with business-specific documents using Custom Queries | AWS Mach..
Amazon Textractは、ビジネス固有の非標準ドキュメントに対してクエリ機能をカスタマイズできるカスタムクエリを提供します。
カスタムクエリを使用すると、一意の用語、構造、キー情報を認識し、高い精度と最小限の人間の介入でダウンストリーム処理のニーズを満たすことができます。
カスタムクエリは、既存のTextractパイプラインに簡単に統合でき、MLの専門知識やインフラストラクチャ管理に投資することなく、完全に管理されたインテリジェントドキュメント処理機能の恩恵を受け続けることができます。
🕒
Stream large language model responses in Amazon SageMaker JumpStart | AWS Machine Learning..
Amazon SageMaker JumpStartでは、大規模な言語モデルの推論応答をリアルタイムで確認できるストリーミング機能が利用可能になりました。
ストリーミング機能を使用すると、エンドユーザーに対して低遅延の印象を与え、ユーザーエクスペリエンスの向上に役立ちます。
現時点では、SageMaker JumpStartでストリーミングをサポートしている大規模な言語モデルが複数利用可能です。
💬
Introducing GPTs
特定の目的に合わせてChatGPTをカスタマイズできるGPTを展開
GPTストアが今月後半に開設予定で、作成したGPTを公開可能
エンタープライズのお客様は、内部専用のGPTを展開できる
🤖
New models and developer products announced at DevDay
新しいGPT-4 Turboモデルは、より高い能力を持ち、128Kのコンテキストウィンドウをサポートし、価格も引き下げられました。
新しいAssistants APIは、開発者が独自の支援AIアプリを構築しやすくします。
新しいマルチモーダル機能は、ビジョン、画像生成(DALL·E 3)、テキスト読み上げ(TTS)などを含みます。
🚀
High-Performance Llama 2 Training and Inference with PyTorch/XLA on Cloud TPUs | PyTorch
Llama 2は、PyTorch/XLAとGoogle Cloud TPUを組み合わせて動作し、最新のAIスーパーコンピュータであるCloud TPU v5eも利用可能です。
Llama 2の70Bパラメータでは、53%のトレーニングMFU、17ミリ秒/トークンの推論レイテンシ、42トークン/秒/チップのスループットを実現しています。
推論スループットとトレーニングモデルのFLOPs利用率(MFU)の向上に向けて使用される計算技術と最適化手法についても説明しています。
💻
NVIDIA L40S is the NVIDIA H100 AI Alternative with a Big Benefit
NVIDIAのH100 80GB PCIeは、約6ヶ月待ちで32,000ドルで販売されています
NVIDIAのトップエンドのGPUは非常に高価で需要も高いです
NVIDIAのL40Sは、AIのベストキープトシークレットになりつつある、グラフィックス指向のL40のバリアントです
👍
OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka
GPT-4 Turboは、GPT-4より高性能で、知識とコンテキストウィンドウが増え、価格も安くなり、機能も向上しました。
Assistants API・Retrieval・Code Interpreterは、開発者がエージェントのようなエクスペリエンスを構築できるAPIです。
マルチモーダルAPIでは、GPT-4 Turbo with VisionやDALL-E 3、Text-to-speechなどの機能があります。
🌐
世界的な生成AI技術者が日本を選んだワケ | NHK | ビジネス特集 | 生成AI・人工知能
世界的な生成AI技術者が日本で起業を選択
日本のビジネス環境が生成AI技術者に魅力的
生成AI・人工知能の分野で日本が注目されている
🤖
Use generative AI to increase agent productivity through automated call summarization | AW..
生成AIを活用して通話の要約を自動化し、エージェントの生産性を向上させる方法が紹介されています。
生成AIは大規模な機械学習モデルで動作し、人間のような文脈に即した要約を生成します。
この技術を利用することで、コンタクトセンターは顧客に優れた体験を提供し、エージェントの文書作業の負担を軽減できます。
💪
GitHub - imoneoi/openchat: OpenChat: Advancing Open-source Language Models with Imperfect ..
OpenChatは、C-RLFTによってファインチューニングされた革新的なオープンソースの言語モデルライブラリです。
このモデルは、優れたパフォーマンスを発揮し、ChatGPTと同等の結果を達成しています。
7Bモデルでも高性能を発揮し、シンプルなアプローチで大規模なオープンソースの言語モデルの開発に取り組んでいます。
💻
GitHub - IST-DASLab/QUIK: Repository for the QUIK project, enabling the use of 4bit kernel..
QUIKはトレーニング後の重みと活性化を4ビットに量子化する手法です
QUIKのコードはリポジトリに含まれ、詳細は論文で確認できます
インストール方法や依存関係、QUIKの適用手順はリポジトリ内のREADMEに記載されています
😲
「☆→@に変更」などのメールアドレス難読化手法はChatGPTで簡単に突破できてしまう - GIGAZINE
メールアドレスの難読化手法がChatGPTによって簡単に突破されることが明らかになった
SNSのプロフィール欄などでメールアドレスを難読化することでスクレイピングから保護する試みが無意味になる可能性がある
AIツールの開発者が、ChatGPTを使えばメールアドレスの難読化を回避できることを指摘
2023年11月07日
|
2023年11月05日
このサイトについて
/
ニュースレター
/
@AINewsDev