~AI関連記事を3行にまとめて紹介~
🏠
Transforming Mortgage Ops with LangChain & LangSmith
AIプラットフォーム「InstaAI」は、住宅ローン業界の手動手続きと古いシステムを改革するために開発されました。
InstaAIは、複雑なデータとガイドラインをナビゲートし、即座に正確なガイダンスを提供する「モーゲージAI」、明確で簡潔なマルチメディアコンテンツの作成を可能にする「コンテンツAI」、ポリシー、雇用慣行、福利厚生、コンプライアンス、およびコミュニケーション基準を明確にする「ポリシーAI」の3つのコアモジュールで構成されています。
InstaAIの導入により、ローンオフィサーの仕事は単調なタスクから意味のある関係を育むことへと進化し、解決までのスピードが平均で67%向上し、エラー率も大幅に減少しました。
🔊
Amazon Transcribeが新しい音声基盤モデルによって精度向上を発表したので、日本語で確認してみ..
AWS re:Invent 2023で、次世代の音声基盤モデルを搭載した自動音声認識 (ASR)が発表されました。
バッチモードで使用する場合、APIエンドポイントや入力パラメータを変更することなく、100以上の言語で精度向上が可能です。
日本語に関しては、精度は変わっていませんでした。
💥
【Starling-LM-7B-alpha】小型なのにGPT-4と張り合うLLMを使ってみたら日本語対応力が凄かった |..
【Starling-LM-7B-alpha】はGPT-4と競合する小型LLMで、日本語対応力が非常に高い
Nectarデータセットと新しい報酬モデルを用いて学習・ポリシーチューニングを行い、一部のベンチマークスコアがGPT-4に迫る性能を発揮
性能は高いが、推論や数学タスクに苦労し、出力の正しさを保証できない問題点がある
😲
オタ恋のカップル、動く 公式が“AI動画”投稿 「今後は動画広告も展開していく」 - ITmedia N..
恋愛マッチングアプリ「オタ恋」がAI動画広告を掲載し、SNS上で人気を集めている
AIで生成した「絵面が濃いオタクカップル」の画像を広告に活用
今後もAIで作成した動画を広告として展開し、長尺な動画にもチャレンジ予定
🖼️
キャラクター画像をアニメに 中国アリババなど「Animate Anyone」開発 ボーンの動きを反映:In..
「Animate Anyone」は、1枚の画像とポーズシーケンスを入力に、キャラクターのモーションアニメーションを生成する新モデルです。
外観の一貫性を維持し、フレーム間のチラつきを軽減し、服や髪の動きも再現できます。
UBCファッションビデオデータセットとTikTokデータセットでの評価結果は、この手法の優れた成果を示しています。
📝
生成AIの活用事例 10選|masa_kazama
生成AIは、コンテンツ作成のレビューや文字起こしと要約、社内用チャットツールなどに活用されています。
非エンジニアによるGAS作成やJiraの検索効率化、ギャル語による分かりやすい説明などにも生成AIが使われています。
外部資料の調査・整理、英語IDの提案、BigQueryでの活用など、生成AIは様々な領域で生産性の向上や業務の効率化に貢献しています。
💻
プレスリリースからニュース記事を生成する「プレスリリース記事変換AI」、ユーザーローカルが提..
プレスリリースをニュース記事に自動変換するAIサービスが提供開始
会員登録不要で無料利用可能、手動入力やURL読み取りにも対応
未確認の最上級表現を含むプレスリリースにはアラートを表示、公開前の確認を推奨
🔍
ハイブリッド検索で必ずしも検索性能が上がるわけではない - Ahogrammer
ハイブリッド検索は、複数の検索技術を組み合わせて性能を改善する手法です。
全文検索とベクトル検索の組み合わせが注目されていますが、その性能に差がある場合、ハイブリッド検索の性能も低下する可能性があります。
日本語のQAデータセットを用いた検証結果、全文検索の改善によってハイブリッド検索の性能も向上することが示されました。
💪
Google at EMNLP 2023 – Google Research Blog
EMNLP 2023のダイヤモンドスポンサーとして活動している
65以上の論文と11のワークショップやチュートリアルへの積極的な参加を行っている
Widening NLPワークショップ(WiNLP)のメジャースポンサーでもある
🚀
Microsoft’s Copilot is getting OpenAI’s latest models and a new code interpreter - The V..
Copilotサービスは、OpenAIの最新モデルGPT-4 Turboに対応し、更新されたDALL-E 3モデルと新しいコードインタプリタ機能もサポートします。
GPT-4 Turboモデルの導入により、Copilotは128Kのコンテキストウィンドウを介してより多くのデータを「見る」ことが可能になり、クエリの理解と応答の質が向上します。
新しいコードインタプリタ機能により、CopilotユーザーはAIチャットボットからより正確な計算、データ分析、コードを取得でき、Bingの「Deep Search」機能もサポートします。
🍎
GitHub - ml-explore/mlx: MLX: An array framework for Apple silicon
MLXは、Appleシリコン上での機械学習のための配列フレームワークで、NumPyやPyTorchに密接に従うAPIを持つ
自動微分、自動ベクトル化、計算グラフの最適化のための組み合わせ可能な関数変換が特徴で、計算は遅延評価され、配列は必要な時にのみ具現化される
MLXの配列は共有メモリに存在し、データを移動せずにサポートされているデバイスで操作を実行することができ、ユーザーフレンドリーで効率的なモデルのトレーニングと展開が可能
🤖
AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い | テ..
生成AIの出力画像を元にCGで作った新聞風のフェイク画像を投稿し、反響があった
画像生成AIのStable Diffusionで写真風画像を生成し、Photoshopで加工
文章は一部AIで生成し、一部は人力で、フェイク新聞としてはありえない内容にした
💪
ruby-openaiでAIの力を体感!ソースコード解説&簡単ハンズオン | 株式会社divx(ディブエックス..
ruby-openaiはRubyで自然言語処理モデルを扱うためのライブラリで、OpenAIの機能を利用できます。
ChatGPTやEmbeddings、Files、Finetune、Imageなどの機能があり、高度な自然言語処理を簡単に実現できます。
ハンズオン形式で、ChatGPTを使用して会話形式でテキストを生成する方法を紹介しています。
🤖
架空のおじさん新聞と「普通」の生成 – 技術の手帖
生成AIの出力画像を元に新聞風のフェイク画像を作成し、Xに投稿したところ大きな反響があった
フェイク画像の作成は30分程度で、目的はフェイクが作れる可能性の提示
写真風画像はStable Diffusionで生成し、文章は人力で作成、一部はChatGPTで生成
💪
GoogleがGmailのスパムフィルターをアップグレードして「人間にしか判読できないスパム」を自動..
Gmailのスパムフィルターがアップグレードされ、「人間にしか判読できないスパム」を自動検出可能になった
新たなフィルターは敵対的テキスト操作にも対応し、計算コストも削減
スパム検出率は38%向上し、誤検知率は19.4%減少
💪
AIの文章を添削しまくった作家が見出した「絶望」と「希望」 | 無意味な時間の浪費の果てに学ん..
中国に勝つためにはいくつかの課題をクリアする必要がある
提出した内容はチェックを受け、48時間以内にフィードバックが送られてくる
データはAI戦争における弾薬であり、中国が勝つと中国の価値観がまかり通る
🆙
MicrosoftがBingやCopliotのアップデートを発表、「Deep Search」機能の追加や「DALL-E 3」の改..
Bingには「Deep Search」機能が追加され、ユーザーの検索クエリを拡張し関連する答えを提供
Copilotでは「DALL-E 3」の改良版が導入され、より高品質な画像生成が可能に
GPT-4 Turboのサポートやコードインタープリター機能も近日中に提供予定
🎉
マネーフォワード、大規模言語モデル「houou」公開 理研との共同研究 日本語の指示データ2900..
大規模言語モデル「houou」が公開され、日本語の指示データを追加学習に活用して出力精度を向上させた
ライセンスは「LLAMA 2 Community License」で、研究や商業目的で利用可能
特定分野に特化したAIモデルの精度向上のため、インストラクションチューニングを採用し、2024年3月までAIモデルを継続的にリリースする方針
🏛️
生成AI(Stable Diffusion)による生成画像の著作物性を認めた北京インターネット裁判所判決の日..
2023年12月1日、北京インターネット裁判所は生成AIによる画像の著作物性を認める判決を下しました
原告は被告に対し、謝罪声明の発表と経済的損失の賠償を求めて提訴しました
被告はオリジナルの詩の挿絵として画像を使用したが、著作権の所有者が不明であり、意図的な侵害はなかったと主張しています
📱
ChatGPT、スマホ充電できるほどのエネルギーを消費してた | ギズモード・ジャパン
AIの質問はスマートフォンの充電と同じくらいのエネルギーを消費することが明らかになりました。
生成AIモデルは環境に影響を与え、車の走行よりも多くの二酸化炭素を排出することが示唆されています。
AIの利用には意識が必要であり、エネルギーのコストと利益を比較し、使い方について考えるべきです。
💥
EfficientSAM
EfficientSAMは、複雑さを大幅に削減しながら優れたパフォーマンスを発揮する軽量なSAMモデルです。
EfficientSAMは、マスク画像の事前トレーニングであるSAMIを活用し、特徴を再構築することを学習します。
EfficientSAMは、画像分類、物体検出、インスタンスセグメンテーションなど、複数のビジョンタスクで一貫して優れたパフォーマンスを発揮します。
🤖
サイバーエージェント、生成AIで広告画像 ロケ不要に - 日本経済新聞
生成AIは広告制作を効率化し、ロケ不要で複雑な表現にも対応可能
2024年1月から広告制作に活用予定
化粧品や食品などの広告主の需要に応える
📚
Techniques for automatic summarization of documents using language models | AWS Machine Le..
情報を簡潔で意味のある形にまとめる要約技術は、効率的なコミュニケーションの基盤となっています。
要約の方法は、ニュースの集約、法的文書の要約、学術研究、ブログやウェブサイトのコンテンツキュレーション、財務報告書や市場分析など、さまざまな目的に応じて幅広いアプリケーションがあります。
自然言語処理(NLP)、言語モデル、生成型AIの進歩により、さまざまな長さのテキストの要約がよりアクセスしやすくなりました。
📊
Boosting RAG-based intelligent document assistants using entity extraction, SQL querying, ..
RAGは、内部のドキュメントから情報を取得し、特定のドメインに特化したアシスタントを作成する手法です。
RAGのセマンティックサーチに基づくデザインパターンでは、すべてのドキュメントに対して分析的な推論を行うことはできません。
メタデータとエンティティ抽出、SQLクエリ、LLMエージェントを組み合わせたソリューションにより、複雑なドメイン固有の質問に答えるインテリジェントなドキュメントアシスタントを構築できます。
🗿
How Q4 Inc. used Amazon Bedrock, RAG, and SQLDatabaseChain to address numerical and struct..
Q&Aチャットボットの構築における数値および構造化データセットの課題に対処するために、Amazon Bedrock、RAG、およびSQLDatabaseChainを活用
数値とテキストデータの混在、構造化、非構造化、または半構造化のデータセットの性質から生じる課題に対応
Amazon BedrockとSQLDatabaseChainを使用してRAGベースのSQL生成ソリューションを実装
🔬
Introducing Gemini: Google’s most capable AI model yet
AIの進歩により、科学的な発見が進み、人間の進歩が加速し、生活が向上する可能性がある
AIを中心とした会社としての旅路が始まってから約8年が経ち、進歩のペースはますます加速している
新たなAIモデル「Gemini」は、最も能力が高く、最も一般的なモデルで、3つの異なるサイズに最適化されている
🤖
Gemini - Google DeepMind
ジェミニは、テキスト、画像、ビデオ、音声、コードなど、複数のモードで推論するAIモデルです。
ジェミニウルトラは、MMLUで人間の専門家を上回る最初のモデルで、さまざまなタスクにおいてSOTAのパフォーマンスを超えています。
ジェミニは、ウルトラモデル、プロモデル、ナノモデルの3つのサイズで提供され、任意の入力を任意の出力に変換する柔軟なモデルです。
💪
Introducing Cloud TPU v5p and AI Hypercomputer | Google Cloud Blog
最も強力でスケーラブルかつ柔軟なAIアクセラレータであるCloud TPU v5pが発表されました。
AIハイパーコンピュータも発表され、パフォーマンス最適化されたハードウェア、オープンソフトウェア、主要なMLフレームワーク、柔軟な利用モデルを統合したスーパーコンピュータアーキテクチャを採用しています。
TPU v5pは、大規模なLLMモデルを、前世代のTPU v4よりも2.8倍高速にトレーニングすることができます。
💥
テスラ元従業員が「自動運転はハード・ソフトともに準備不足」で公道での使用は実験同然だと告発..
元従業員が「自動運転はハード・ソフトともに準備不足」と告発
「オートパイロット」の安全性に疑問を呈し、公道での使用は実験同然と指摘
解雇されたことに対する補償を求めて提訴する意向
🤖
高度な生成AI「GPT-4 Turbo」と「新DALL-E 3」、Microsoft Copilotに実装へ - PC Watch
高度な生成AI「GPT-4 Turbo」がより複雑で長いタスクに対応し、数週間以内にCopilotに統合される予定
新DALL-E 3モデルの更新により、より正確な高品質なイメージの生成が可能に
コードインタプリタやBingにもDeep Searchが実装され、より正確な計算や検索が可能に
💪
「Meta」「IBM」「ソニー」「東京大学」「慶應義塾大学」など50以上の団体がAI開発推進コミュニ..
50以上の団体が共同でAI開発推進コミュニティ「AI Alliance」を設立
AI AllianceはAIの研究開発を支援するオープンソースコミュニティで、世界中の団体が参加
参加団体の研究開発資金は800億ドルを超え、学生数は40万人、従業員数は100万人以上
💖
SetFitABSA: Few-Shot Aspect Based Sentiment Analysis using SetFit
SetFitABSAはテキスト内の特定の側面に対する感情を検出する技術
ABSAは製品やサービスの顧客フィードバックを分析し、組織に洞察を提供
SetFitABSAはLlama2やT5などの生成モデルを上回る競争力を持つ
🎉
Multi-modal RAG on slide decks
マルチモーダルLLM(GPT-4V)を用いて、スライドデッキの視覚的なコンテンツを活用したRAG(Retrieval Augmented Generation)が可能になりました。
マルチモーダル埋め込みとマルチベクトルリトリーバーの2つのアプローチがあり、それぞれにトレードオフが存在します。
マルチモーダルRAGはテキストのみのRAGよりも高いパフォーマンスを示し、視覚的なコンテキストの保持が重要であることが示されました。
🗣️
AI英会話アプリ「スピーク」の野望…すでに有料会員10万超、創業者はハーバード×スタンフォード..
AI英会話アプリ「スピーク」はOpenAIから出資を受け、ChatGPTを活用したAI技術を使い、会話に特化したレッスンを提供
現在、韓国、日本、メキシコ、台湾でサービスを提供し、ダウンロード数は460万を突破、有料会員は10万人以上
レベル別コース、AI会話、ミニコースの3つのコンテンツがあり、ユーザーは自分のレベルやニーズに合わせて学習できる
🎓
KDnuggets News, December 6: GitHub Repositories to Master Machine Learning • 5 Free Cours..
GitHubリポジトリを利用して機械学習をマスターする方法を紹介
機械学習コース、ブートキャンプ、書籍、ツール、面接の質問、チートシート、MLOpsプラットフォームなどを活用して夢の仕事を手に入れる
データエンジニアはデータ駆動型企業においてデータワークフロー全体に必要なインフラとツールを準備・管理する
⏱️
Introducing the OpenAI Switch Kit: Move from closed to open-source AI in minutes – Postgr..
OpenAI Switch Kitを使えば、数分でクローズドソースAIからオープンソースAIに移行可能です。
オープンソースモデルの利点は、パフォーマンス、信頼性、セキュリティ、柔軟性などがあります。
OpenAIの制約に縛られず、さまざまなモデルを利用できます。
😎
四元数ニューラルネットワークとGHR微積分
ニューラルネットワークでは数値拡張に実数以外の数値体系を導入することがある
Binalized Neural Networksでは値を±1に制限し、メモリ効率の良い実装が可能
複素数はニューラルネットワークに利用可能だが、正則関数の制約があるため、実数のみを取る関数に限られる
👻
Mitigate hallucinations through Retrieval Augmented Generation using Pinecone vector datab..
Amazon SageMaker JumpStartのLlama-2とPineconeベクトルデータベースを使用して幻覚を軽減する方法がAWS Machine Learning Blogで紹介されています。
Retrieval Augmented Generation(RAG)を使用すると、外部データソースから関連情報を取得し、それをLLMに入力することが可能です。
Amazon SageMakerを使用してLLMを展開し、Pineconeベクトルデータベースを使用して関連情報を取得することで、AIの幻覚を防ぎます。
💪
Lume AI
Lume APIを使用して、AIパワーのデータマッピングをシステムに統合し、データを手間なく活用できます
Lume Platformでデータパイプラインとマッピングを管理し、データマッパーのレビュー、編集、展開を数秒で行えます
IntegrAI PlatformとIntegrAI Mobileを使用して、ビルド、テスト、展開のワークフローを自動化し、AI統合を手軽に管理できます
💻
電撃発表、グーグルが「全力開発」した生成AI「Gemini」の全貌…ChatGPT超えするか | Business I..
2023年末に新たな生成AI向けの大規模言語モデル「Gemini」を発表
声や画像、立体物に動画など、複数の情報を同時に扱い、論理的な回答が可能
新しいデータセンター向け半導体「Cloud TPU v5p」を使用して開発
🚗
CUDAによる局所特徴量計算の高速化とソースコード公開 - Fixstars Tech Blog /proc/cpuinfo
自動運転関連のオープンソースプロジェクトに携わるエンジニアが、局所特徴量計算の高速化に取り組みました。
その成果としてlibSGMやcuda-bundle-adjustmentを公開しています。
高速化した局所特徴量計算のソースコードをcuda-efficient-featuresという名前でGitHubに公開しました。
🔄
米ガートナー「ソフトウェアエンジニアリングのハイプサイクル2023年」を発表。「生成AI」や「プ..
「ソフトウェアエンジニアリングのハイプサイクル2023年」ではAIコーディングアシスタント、AIで拡張されたソフトウェアエンジニアリング、プラットフォームエンジニアリングが注目されている
AIコーディングアシスタントは開発者の生産性向上、AIASEは定型的なタスクの自動化、プラットフォームエンジニアリングは一貫性のあるプラットフォーム提供を目指す
2027年までに50%の開発者がAIコーディングツールを使用し、2026年までに80%の組織がプラットフォームチームを設立すると予測されている
🤖
グーグルがGPT-4超えの最新AI「Gemini」発表、Pixel 8 Proで動作する「Gemini Nano」も - ケータ..
新AI「Gemini」は3つのモデルがあり、「Gemini Nano」は「Pixel 8 Pro」で利用可能
「Gemini Ultra」はGPT-4を超える能力を持ち、テキストや画像、音声を認識・理解できる
「Gemini 1.0」は数学や物理学の説明が得意で、プログラミングも可能
💨
AI半導体の開発企業はどこ?業界地図で総覧 | 日経クロステック(xTECH)
AI半導体市場は米NVIDIAがけん引していますが、AI処理専用チップ(ASIC)の開発が急速に進んでいます。
GAFAMは各社の製品やサービスに最適化した効率的なプロセッサーを開発しています。
世界中のスタートアップは、GPUよりも高速で電力効率の優れたASICでNVIDIAの覇権に挑戦しています。
💪
Google、新AIモデル「Gemini」発表。動画もネイティブに理解するマルチモーダル、Pixel 8 Proに..
新AIモデル「Gemini」は、モバイル機器からデータセンターまで対応し、テキストだけでなく画像、オーディオ、ビデオも理解可能
Geminiは3つのバージョン(Ultra、Pro、Nano)を提供し、Nanoはモバイルデバイス向けでオフラインでも実行可能
Geminiはマルチモーダルなインタラクションに真価があり、例えば子供の算数の宿題の写真を入力し間違いを教えるなどの利用方法が可能
🤖
Google、高性能な新AI「Gemini」。Pixel 8 Proにも搭載へ - PC Watch
新AI「Gemini」はテキスト処理でGPT-4を上回る性能を持ち、テキスト、画像、音声、動画、コードなどを一般化して理解、操作可能
生成AI「Bard」と組み合わせることで強化され、エッジデバイス用モデル「Gemini Nano」はPixel 8 Proに搭載予定
Geminiの開発は今後も進み、さまざまなサービスに展開予定で、新AIアクセラレータ「TPU v5p」も導入
💻
1枚の静止画からAIが人やキャラが動く動画を生成する「MagicAnimate」が公開 - 窓の杜
「MagicAnimate」は1枚の静止画から人やキャラが動く動画を生成するAIモデルです
ソースコードとデモページが公開され、Webブラウザー上で動作確認が可能です
複数人の画像をベースにした動画生成も可能で、ショート動画や動画CMなどに活用が期待されています
2023年12月07日
|
2023年12月05日
このサイトについて
/
ニュースレター
/
@AINewsDev