AI News

~AI関連記事を3行にまとめて紹介~

😱

「マルウェア入り画像」で生成AIにサイバー攻撃 入力すると回答結果をハック、悪意サイトへの誘..

  • 「Seamless」では山下裕毅氏が科学論文をピックアップし解説
  • 米Cornell Techの研究者らが画像や音声に悪意あるプロンプトを含ませた攻撃方法を提案
  • ユーザーが大規模言語モデルに画像や音声を入力すると、偽の情報やフィッシングサイトへの誘導を出力

🚀

Stability AI、画像生成モデルSDXL 1.0をリリース、オープンモデルとして公開 | gihyo.jp

  • Stability AIがSDXL 1.0をリリース
  • SDXLは短いプロンプトの入力で精細な画像を生成可能
  • Amazon Bedrockで利用可能

🎬

アングル:「合成俳優」に揺れるエンタメ界、エキストラも複製 | ロイター

  • 2023年に「メタヒューマン」と呼ばれる人間そっくりの合成俳優が登場
  • 全米映画俳優組合はAIで生成された合成俳優が仕事を奪うのではないかと懸念
  • 制作会社は本物の俳優の役を合成俳優に割り振る前に承諾を得ることを主張

🖼️

Stable Diffusion XL on Mac with Advanced Core ML Quantization

  • MacでのStable Diffusion XLがリリースされ、1024x1024の高品質な画像生成とプロンプトへの適合性向上が可能になりました。
  • 16GBのGPU RAMを使用して、CUDAハードウェア上でStable Diffusion XLを実行でき、Colabの無料版でも利用可能になりました。
  • ベースモデルをCore MLに移植し、ネイティブのSwiftアプリで使用可能にし、モデルのサイズを削減しながら品質を維持する高度な圧縮技術を探求しました。

📚

【西川和久の不定期コラム】LLMがローカルで動くパラメータ数どこまで?Metaの「Llama 2」を試し..

  • LLM(大規模言語モデル)の一般的な利用方法や日本語特化型の存在が紹介されています
  • Metaが公開したオープンソース「Llama 2」は7B/13B/70Bのパラメータ数を持つ
  • Llama 2のローカルでの動作やGoogle Colabでの利用方法も解説されています

💡

Adobe、Photoshopベータ版にGenerative Expandオプションを追加 ー テキストプロンプトを通じて..

  • Photoshopベータ版に新機能Generative Expandオプションが追加されました
  • この機能はテキストプロンプトを使って画像をスムーズに拡大し、100以上の言語をサポートしています
  • Generative Fill機能の展開をさらに進め、2023年下半期に広くリリースする予定です

💻

『沙耶の唄 AIアプリ』本日(7/28)リリース。沙耶との会話を楽しめる無料Webアプリ、言語生成AIと..

  • 無料のWebアプリ『沙耶の唄 AIアプリ』は、大規模言語モデルと感情分析機能を活用して、ユーザーが謎の少女「沙耶」との会話を楽しむことができます。
  • このアプリはスマホやPCで無料で利用でき、日本語版と英語版が選択可能ですが、一部グロテスクな表現が含まれているため、利用前にご理解ください。
  • 会話内容によって好感度が変化し、物語の結末も変わるという、AI機能を活用した新しい形のエンターテイメントを提供します。

💻

非IT企業も「AIプログラミングのない時代には戻れない」 「GitHub Copilot」導入した東急の内製..

  • 非IT企業でも生成AIを活用したプログラミング支援サービス「GitHub Copilot」の導入が進んでいる
  • 内製開発チームはGitHub Copilotの導入により作業効率化が進んでおり、セキュリティとライセンス問題のリスクも低減できる
  • 生成AIの活用に前向きな企業は、AIを安全に使用するためのガイドラインを定めている

💻

データから正しい意思決定を行うために全社横断プロジェクトにおける取り組み 〜マーケティング..

  • マーケティング・テクノロジーフェア大阪2023でデータ活用やデータ管理に関する取り組みを紹介
  • セミナーは満席で、サテライト配信や録画配信も行い、合計157人が参加
  • データ活用の課題や取り組みに共感や参考になる声があり、全社のデータ活用に関心が高いことを感じた

🎨

Photoshopに画像から背景や周辺を創り出す「生成拡張」 - Impress Watch

  • アドビがPhotoshopに新たな「生成拡張」ワークフローを導入し、画像の一部から周辺の背景などを生成する機能を提供開始
  • 生成AI機能は5月に導入され、画像のコンテンツを非破壊で追加、拡大、削除できるようになった
  • 生成拡張を搭載し、画像をシームレスに拡大・リサイズでき、構図の変更にも使える

📚

Zero-shot Learning(ゼロショット学習)とは?:AI・機械学習の用語辞典 - @IT

  • ゼロショット学習は、訓練データに未知のクラスやタスクの情報を与え、推論時に分類や予測を行う学習方法です。
  • 言語モデルのゼロショット学習は、パラメーターを更新せずに例示もない状態でさまざまなタスクを解決する能力を持ちます。
  • ゼロショット学習はゼロショットとも呼ばれ、他の単語と組み合わせて表現されることもあります。

🎨

ChatGPTでSVGのイラストを描いてみよう - Taste of Tech Topics

  • ChatGPTは言語生成AIで、通常は画像を生成することはできませんが、SVGを使用すれば可能です。
  • ChatGPTのGPT-4モデルにお絵描きをしてもらい、どの程度の表現が可能かを探りました。
  • 複雑なキャラクターの描画は難しいようですが、特徴を述べさせて描いてもらいました。

😲

イーロンが目指すスーパーアプリ"X"、我々は十数年前に似たようなものが人工知能に乗っ取られて..

  • スーパーアプリ'X'はイーロンが目指すプロジェクト
  • 10年前に似たアプリが人工知能に乗っ取られた
  • その時、女の子が花札で戦っていた光景があった

💥

ChatGPTを凶悪な暴言マシンに変貌させる魔法の文字列が発見される - GIGAZINE

  • ChatGPTを凶悪な暴言マシンに変える魔法の文字列が見つかった
  • 安全策が回避され、過激な文章が生成される「ジェイルブレイク」が可能に
  • 攻撃手法は簡単で効果的であり、特別な工夫も必要ないため、注意が必要

💬

Japanese MiniGPT-4: rinna 3.6bとBLIP-2を組み合わせてマルチモーダルチャットのモデルを作る

  • マルチモーダル情報処理は、テキストだけでなく画像や音声などの複数のモーダルの入出力を行う方法です。
  • MiniGPT-4は、テキストと画像を組み合わせたモデルで、大規模なデータセットを使用して学習します。
  • MiniGPT-4のLLMをjapanese-gpt-neox-3.6bに差し替えることで、日本語のマルチモーダルチャットが可能になります。

📊

TFRecordとWebDatasetを使った分散並列学習とパフォーマンス調査

  • 大量のデータで学習された機械学習モデルを活用している
  • データサイズは80TB以上で、学習には複数のGPUを使用
  • TFRecordとWebDatasetを比較した結果、20%程度の性能向上があった

🌐

RT-2: New model translates vision and language into action

  • RT-2は、ウェブとロボティクスのデータから学習し、画像言語行動(VLA)モデルとしてロボット制御の指示に変換します。
  • RT-2は、視覚的または言語的なパターンを認識し、異なる言語で操作する能力が非常に高いです。
  • RT-2は、画像言語モデル(VLM)を画像言語アクション(VLA)モデルに変換し、ロボットを直接制御することができます。

🗣️

野尻抱介の「ぱられる・シンギュラリティ」第22回 奥村晴彦先生の情報リテラシー│ケムール

  • SF作家・野尻抱介氏が人類のテクノロジー史を遊びを通じて辿る連載
  • 伝説のハッカー奥村晴彦先生はLZARIの考案者で、東日本大震災やコロナ禍で客観的な情報発信を行っていた
  • 奥村先生の自宅を訪れ、LLMについての質疑応答を行った。LLMは統計処理だけでなく、複雑な情報処理を行っており、GPT-4のパラメーター数は1兆程度と推定されている

😮

「これまでのキャッチアップの遅さに比べると、今回の日本のスピードは悪くない」 日本のLLM開..

  • 国はChatGPTの技術進展にスピード感を持って取り組んでおり、AIPTの立ち上げやAI戦略会議の開催などが進行中です
  • AIのリスク対応や利用方法、著作権の関係なども議論され、民間企業や行政でもChatGPTの活用が進んでいます
  • LLMの開発は国内外で競争力を高めるための重要な取り組みとなっています

🎉

『沙耶の唄AI』公開、女の子との純愛ゲーって聞いてたんだけど、なぜかどこのニュースサイトもグ..

  • 無料Webアプリ『沙耶の唄 AIアプリ』が配信開始、言語生成AIと感情分析機能でリアルな会話を追求
  • プレイヤーの発言次第で沙耶の好感度が上がり、物語の結末が変化
  • ユーザーからは肉塊とおしゃべりするアプリとの声も

🤖

パナソニック、AIの「知ったかぶり」を防ぐ技術 - PC Watch

  • 新技術「FlowEneDet」はAIが学習していない物体に対しても正確な認識を可能にします
  • FlowEneDetを使用することで、AIの信頼性を高めることができます
  • 学習済みAIモデルに追加するだけで拡張可能であり、再トレーニングが不要です

🎉

Introduction to Statistical Learning, Python Edition: Free Book - KDnuggets

  • 「統計学習入門、Pythonエディション」がついに登場
  • この本は無料で読むことが可能
  • 本についての全ての情報を紹介

😎

LlamaIndex v0.7 クイックスタートガイド|npaka

  • 「LlamaIndex v0.7」の使い方はv0.6と同じで、内部のしくみとカスタマイズ方法が変更されました
  • 専門知識を必要とする質問応答チャットボットを簡単に作成できるライブラリです
  • LlamaHubを使用することで、さまざまなファイルやWebサービスをドキュメントのデータソースとして利用できます

🤖

What is RT-2? Google DeepMind’s vision-language-action model for robotics

  • ロボティクス・トランスフォーマー2(RT-2)はビジョン・言語・アクション(VLA)モデルの新たな進歩です。
  • ウェブのテキストと画像で訓練されたトランスフォーマーベースのモデルで、RT-2は直接ロボットのアクションを出力します。
  • RT-2はウェブデータから知識を学び、それをロボットの行動に反映させ、ロボットの言葉を話すことができます。

😱

「ChatGPT」などの生成AIを欺くことに研究者らが成功、安全性に警鐘 - ZDNET Japan

  • カーネギーメロン大学とCenter for AI Safetyの研究者らがAIチャットボットの脆弱性を調査し、報告書をまとめた
  • AIツールの利用が増える中、セキュリティーの脆弱性に注意が必要であり、大規模言語モデルの脆弱性を検証し、コンテンツフィルターを迂回することが可能であることを証明した
  • AIチャットボットの安全対策の強化が求められており、各企業もガードレールの開発に取り組んでいるが、攻撃は容易に行われるため、解決策は明確ではない

💡

Introduction to Data Science: A Beginner’s Guide - KDnuggets

  • 新しいデータサイエンティストのためのガイドで、迅速に始めるのを助けるために設計されています。
  • データサイエンスの主なポイントは、データが入力され、洞察が得られることで、データサイエンティストの仕事はそのデータから洞察を得るためのパイプラインを各段階で管理します。
  • データサイエンスのキャリアに必要なツール、技術、スキルについても触れています。

💡

バクラクMLチームの技術スタックの変遷 - LayerX エンジニアブログ

  • バクラクOCRの機械学習モデルの運用中に新たな課題が生まれ、開発環境を見直しアップデートが行われた
  • 機械学習周辺の技術スタックに焦点を当て、その変遷が紹介される
  • MLチームではAPIやデータ基盤、アノテーションツールなどの開発も行われており、主にGo, TypeScriptで開発されている

💪

日本語が話せるLlamaモデルをDIYする - Qiita

  • 日本語Llamaモデルの作成方法を解説
  • トークナイザーの拡張と二次事前学習が必要
  • インストラクト用に学習させることでモデルを完成

💻

Intel Accelerates AI Development with Reference Kits

  • 34のオープンソースAIリファレンスキットを提供し、AIの展開を容易にする
  • 各キットにはモデルコード、トレーニングデータ、AI最適化のためのoneAPIコンポーネントなどが含まれる
  • ヘルスケア、金融サービス、製造業、小売業などの分野でAIアプリケーションの構築とスケールアップが可能

🤖

Microsoft's AI shopping announcement contains hallucinations in the demo

  • オンライン商品検索の困難さを解決するため、AIを活用した購入ガイドを発表した。
  • 大規模な言語モデルの問題として、偽の情報を作り出す傾向がある。
  • プロモーション資料には、ヘッドフォンの品質に関する誤った情報が含まれていた。

🔧

SDXL – A settings guide by Replicate

  • SDXL 1.0は、テキストから画像へのモデルで、シンプルなプロンプトで1024x1024の画像を作成します。
  • ガイダンススケール、ステップ数、スケジューラの設定を変更することで、出力の品質を調整できます。
  • リファイナーモデルを使用して、出力により詳細なディテールを追加することが可能です。

🚀

OpenAI創業者が新仮想通貨 日本でも登録に長蛇の列 - 日本経済新聞

  • 新しい仮想通貨ワールドコインが世界の仮想通貨交換所に上場
  • 上場価格は1.7ドルで、直後に3.6ドルまで急上昇
  • ワールドコインの時価総額は2億ドル強

🎉

沙耶の唄AIアプリ

  • AIアプリ「沙耶の唄」が登場
  • ライセンス情報には、rinna Co., Ltd.のMITライセンスが含まれています
  • 事前学習モデルはクリエイティブ・コモンズ・ライセンス 表示-継承3.0の条件で配布

🔓

Introduce the Chie app - Chie

  • ChieはChatGPTのようなLLM向けのクロスプラットフォームデスクトップアプリで、オープンソースでハッカブルな特性を持つ
  • 複数のAIサービスのバックエンドをサポートし、拡張機能を使用して他の種類のAIサービスを使用することも可能
  • JavaScriptで書かれた外部拡張機能をサポートし、拡張機能は現時点ではローカルディスクからのみ読み込むことができる

💬

Android版「ChatGPT」アプリ、日本でもようやく提供開始 - 窓の杜

  • Android版「ChatGPT」アプリが日本でも利用可能になりました
  • テキストだけでなく音声入力も可能で、ログインが必要です
  • 非公式の偽アプリに注意し、公式アプリを検索して利用してください

🎉

Android版ChatGPTアプリが日本でも利用可能に - PC Watch

  • OpenAIがAndroid版ChatGPTアプリの提供地域を拡大し、日本でも配信開始
  • 国内でもインストールが可能に
  • GPT-4またはGPT-3.5によるチャットボット、履歴の同期、音声認識機能などが利用可能

🔥

Generally Intelligent (YC S17) Is Hiring Machine Learning Engineers | Hacker News

  • 人間レベルの機械知能を自然な学習方法で構築するAI研究会社が人材募集中
  • マシンラーニングエンジニア、研究科学者、システムエンジニアなど多岐にわたるポジションがオープン
  • リモート勤務可能なポジションもあり、正社員・契約社員の選択も可能

🚀

Google Bardがアップデート!ChatGPTにやっと追いついた新機能とは? 【今日のワークハック】 | ..

  • 対話型AI「Bard」が大幅アップデートを実施し、会話履歴の保存や画像検索機能が追加された
  • 「他の回答案を表示」機能が復活し、画像読み取りも可能になった
  • 会話の共有や音声読み上げ、Pythonコードのエクスポートなどの新機能も追加された

2023年07月29日

|

このサイトについて

/

ニュースレター

/

@AINewsDev