~AI関連記事を3行にまとめて紹介~
😎
グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第3回)参加者募集。過去回ア..
生成AIグラビア実践ワークショップ第3回が開催され、講師は西川和久さん
参加者は無料の「生成AI GO」を使い、西川さんの最新テクニックを学べる
参加者は高性能GPUを追加料金なしで利用可能で、作成した画像は保存できる
💻
JetBrains、GitHub Copilot対抗の「JetBrains AI Assistant」提供開始。AIによるコード生成やリ..
「JetBrains AI Assistant」が提供開始され、AIによるコード生成やリファクタリングなどの機能を備えています。
月額1000円から利用可能で、AIは「Codey」という生成AIを採用しています。
開発者の主要言語はJavaScriptだが、Javaも広く使われており、半数の開発者がまだJava 8を日常的に使用しているとの調査結果が出ています。
🤖
「もう広告がメインコンテンツだろこれ」生成AIを使った広告で有名なマッチングアプリのオタ恋、..
マッチングアプリのオタ恋が、生成AIを使ったパロディ画像や動画生成に進出
広告がメインコンテンツとなっていることに対し、一部からは批判の声も
AI技術の先端性が評価されつつも、その使い道については賛否両論
👥
本当にわかりやすいAI入門 - Speaker Deck
AIは「人工知能」の略で、人間のようなことをする仕組みのこと
AIの方法は「人間が考えたルール」を実行させる方法と、「ルール自体を考えること」まで実行させる方法の2つがある
脳の仕組みを理解することで、人間のように思考できるAIが完成する可能性がある
💻
GoogleがAI向けチップ「TPU v5p」を発表、前世代から最大2.8倍の性能向上で「Gemini」のトレーニ..
AI向けチップ「TPU v5p」が発表され、前世代から最大2.8倍の性能向上を達成
TPU v5pは合計8960個のチップで構成され、メモリやメモリ帯域も大幅に強化
TPU v5pは「Gemini」のトレーニングに使用され、高性能なAIモデルの研究やエンジニアリングに不可欠
🤖
Googleが突如発表した新しいAI、Geminiがすごい - orangeitems’s diary
新AI「Gemini」は音声での会話が可能で、カメラで手書きや動画を見せると反応します
Geminiはドキュメント作成の助けになり、カメラとマイクを使って物事を伝えることができます
Geminiの初版「Gemini 1.0」には高性能版「Gemini Ultra」、多くのユーザー向け「Gemini Pro」、スマホ向け「Gemini Nano」があり、NanoはAI文字起こしや要約機能に活用されます
🖼️
Metaが画像生成AI「Imagine」を無料で使えるウェブアプリをリリース、Emuモデルを利用しプロンプ..
画像生成AI「Imagine」が無料でリリースされました
Emuモデルを利用し、プロンプトごとに4つの画像を生成可能
日本での利用は現在不可能ですが、トップページには「ログインして生成」というボタンが設置されています
💻
【OpenGPT】GPTsのリスクを全て克服した無料オープンソース版GPTsを実際に使ってみた | WEEL
OpenGPTは、ChatGPTアプリケーションを簡単に作成できる無料のオープンソースプラットフォームです。
OpenGPT.appでは、「Productivity Tools」や「Code Assistant」などの10000を超えるChatGPTアプリケーションを利用できます。
OpenGPTは、ユーザーログイン機能や好みに応じて並べ替える機能など、今後さまざまな機能を追加する予定です。
💻
Meta、AIで写真の上下を生成して縦長にする機能・画像生成AIのウェブサービスなど公開。見えない..
Meta AIが新機能を発表し、画像生成AI「Imagine」のウェブ版も公開されました。
MessengerとInstagramのグループチャットには「Reimagin」という新機能が追加され、他の人が画像にテキストを追加すると新しい画像が生成されます。
AI生成画像の精度も上がっており、透かしを追加する予定で、さらにReelsのサポートやFacebookへの投稿時の画像変換、Instagram DMの返信をAIが下書きする機能なども追加されます。
📚
人だと正解率92%なのに、GPT-4だと15%になる新型テスト集「GAIA」 米Metaなどが開発:Innovat..
「GAIA: a benchmark for General AI Assistants」という論文で、人間にとって簡単なタスクを達成するための大規模言語モデル(LLM)の評価を目的としたベンチマークが提案されています。
このベンチマークは、人間が日常で実行するタスクを正確にこなすLLMの構築を目指しており、466の質問とその解答が含まれています。
しかし、最先端のLLMであるGPT-4は低い成績を収め、人間の回答者に比べて成功率が低かったという結果が出ています。
😱
Google's best Gemini demo was faked | TechCrunch
Googleの新しいGemini AIモデルのデモがほぼ偽物であるとの指摘が出ています。
デモビデオは「待ち時間が短縮され、Geminiの出力が短縮されています」と注意を促しています。
ビデオで示されている対話は、実際には選択され、短縮された静止画像とテキストの一連の注意深く調整されたプロンプトであり、実際の対話の様子を誤って表現しています。
🖼️
How it’s Made: Interacting with Gemini through multimodal prompting - Google for Develope..
マルチモーダルモデルのジェミニは、画像とテキストの組み合わせを解析し、次に何が起こるかを予測します。
ジェミニはじゃんけんのパターンを見つけ出し、戦略のアドバイスも提供します。
近々、Google AI Studioでジェミニを試すことができるようになります。
📢
Microsoft Copilotに“沼った”企業が7割超 Ignite 2023でのアップデート情報ダイジェスト - キ..
「Microsoft Copilot」は2023年11月1日から一般提供が開始され、多くの大手企業やパートナーが採用
CopilotはBing ChatやBing Chat Enterpriseと統合され、基本的な機能を提供し、独自のCopilotを構築可能
CopilotはTeams会議やOutlook、Loopなどでも活用され、効率化や情報共有を促進
🧠
How to think about the OpenAI Q* rumors - by Timothy B Lee
OpenAIが開発した新しいモデルQ*は、数学の問題を解決する能力を持つと報告されています。
Q*は従来のAIモデルよりも高度な数学の問題を解くことが可能とされています。
この研究は、AIの一般的な推論能力に向けた重要な一歩となる可能性があります。
🗣️
Amazon QをVSCodeでつかってみた - NRIネットコムBlog
Amazon Qは生成型AIアシスタントで、AWSのエコシステム内で開発者やIT専門家をサポートします
Amazon Qは自然言語処理を使用して、ユーザーの質問や要求に迅速かつ効果的な解決策を提供します
VSCodeでAmazon Qを使用するには、AWS Toolkitという拡張機能をインストールする必要があります
💪
Elasticsearch(OpenSearch)を活用した採用候補者検索の同義語辞書整備の取り組み - Sansan Tec..
Eight Career Designの候補者検索機能の検索ヒット件数改善に取り組みました。
同義語辞書の導入を決定し、共起単語の抽出とword2vecを使用した類似語の抽出を行いました。
同義語辞書の追加により検索結果のヒット数が+13%増加しましたが、検索ノイズの増加にも注意が必要です。
💻
Appleの機械学習チームがAppleシリコンで機械学習モデルをトレーニング・デプロイするためのフレ..
機械学習フレームワーク「MLX」は、効率的で柔軟な機械学習を実現するために設計され、NumPyに厳密に従っています。
MLXは共有メモリに存在するため、データのコピーなしにCPUやGPUなどのデバイスで実行可能です。
MLXを使用することで、Llamaの実行、Transformer言語モデルのトレーニング、LoRAによる微調整、Mistralによるテキスト生成、Stable Diffusionによる画像生成、Whisperによる音声認識などが可能です。
🔬
マルチモーダルAI「Gemini」を軸に「デジタルエージェント」「検索エンジン」「Chromeとの統合」..
マルチモーダルAI「Gemini」は2023年12月6日にリリースされ、科学アシスタントや検索エンジンとしての活用が期待されています。
Geminiはウェブブラウザの中でも活用され、ユーザーの質問に答えたり作業を手伝ったりすることが可能です。
Geminiの開発は現在も進行中であり、Gemini 2.0ではさらなる革新が期待されています。
😱
マルチモーダルAI「Gemini」の性能をアピールするGoogleの公式ムービーはフェイクだったという指..
Googleの公式ムービーでアピールされていたマルチモーダルAI「Gemini」の性能がフェイクだと指摘されています。
ムービーではGeminiが映像や画像を見て応答しているように見えますが、実際には映像の静止画を見てテキストプロンプトでやり取りしていました。
Geminiの実際の機能とは異なるものをデモムービーで公開したことに対して批判が集まっています。
😎
ASCII.jp:俺のChatGPTこと「GPTs」で最高の英語教師を作り込んだ。題して「冴子先生強化計画」 ..
パーソナル英語教師「冴子先生」をChatGPTの「GPTs」機能で作成し、毎日使用することでその効果を実感。
「冴子先生」の授業を受けることで改善点やアイデアが出てきたため、さらにカスタマイズを進めることに。
「GPTs」のカスタマイズは「My Gpts」画面から行い、「Instruction」ウィンドウにGPTにやらせたいことを自然言語で記述することで可能。
💬
Agents for Amazon Bedrock でEC2インスタンス作成エージェントを作ってみた - Taste of Tech To..
Agents for Amazon BedrockはAIアプリ作成を支援するシステムで、自然言語でタスクを入力すると、推論モデルを用いてタスクを分割し、実行結果をまとめて返すAIアプリを生成します。
AgentsのGA版では、各ステップの詳細を確認したり、Lambdaを定義したりすることも可能です。
今回はEC2インスタンスを作成するエージェントを作成しました。Agentsは生成AIアプリ作成を容易にし、Lambdaを利用したオリジナルタスクの作成も可能です。
💡
ChatGPT’s New Rival: Google’s Gemini - KDnuggets
Googleが新しいAIモデル、Geminiを公開。これはGoogleの最大の言語モデルで、さまざまなバリエーションがあり、多様な要求に対応しています。
Geminiはテキスト、コード、画像、音声、動画など、さまざまなタイプの情報を処理でき、マルチモダリティに優れています。
Geminiは、大規模マルチタスク言語理解(LLM)の現在の最先端の結果を30の32の広く使用されている学術ベンチマークで上回り、驚異的なスコア90.0%を記録しました。
👤
Gaussian Head Avatar's Project Page
軽量な疎な視点設定下での高精度な3Dヘッドアバターの作成について研究
制御可能な3Dガウス分布と完全に学習されたMLPベースの変形フィールドを最適化し、複雑な表情を捉える
暗黙のSDFとDeep Marching Tetrahedraに基づいた設計されたジオメトリガイドの初期化戦略を開発し、トレーニング手順の安定性と収束性を確保
😮
Personalized AI Made Simple: Your No-Code Guide to Adapting GPTs - KDnuggets
オープンAIは、カスタムChatGPTの作成にコーディング不要のアプローチを提供し、パーソナライズされたAIのカスタマイズを可能にしています。
新しいGPTの機能は、「探索」ボタン内にあり、自分自身のGPTを作成するDIYの旅に出かけることができます。
ChatGPTを設定することは、単に名前を付けること以上のもので、行動、目的、外観などを個人のニーズに合わせてカスタマイズするための多くのオプションが提供されています。
💥
Google DeepMind at NeurIPS 2023 - Google DeepMind
NeurIPS 2023での研究成果を発表する
180以上の論文を発表し、最先端のAIモデルのデモを披露する
最大かつ最も能力のあるAIモデルGeminiの開発チームからのプレゼンテーションも行う
💡
5 Super Cheat Sheets to Master Data Science - KDnuggets
データサイエンスの基本的な概念、確率・統計、SQL、機械学習、ディープラーニングに関する5つのチートシートを紹介
これらのチートシートは初心者やテクニカルインタビューの準備、キーコンセプトの復習に役立つ
統計の基礎から機械学習やディープラーニングの微妙なニュアンスまで、理解を確認し強化するための簡潔で効果的な方法を提供
🤖
The real research behind the wild rumors about OpenAI’s Q* project | Ars Technica
OpenAIが開発した新しいAIモデル「Q*」は、未見の数学の問題を解く能力があるとされています。
Q*の開発は、一般的な推論能力を持つAIへの重要な一歩となる可能性があります。
ステップバイステップの推論技術は、AIが複雑な問題を解くための有効な手段となり得ます。
🤝
AMD + 🤗: Large Language Models Out-of-the-Box Acceleration with AMD GPU
AMDとHugging FaceはAIモデルの加速化を実現するためのパートナーシップを発表
AMDは最新のサーバーグレードのGPU、AMD Instinct™ MI300シリーズアクセラレータを発表
AMD GPU向けの優れたサポートと相互運用性の向上、そして最新のイノベーションと機能の統合を提供
📸
ReconFusion
ReconFusionは、NeRFベースの3D再構築パイプラインを正規化し、新しいカメラポーズで視点を超えることが可能です。
ReconFusionは、制約の少ない領域でリアルなジオメトリとテクスチャを合成し、観測された領域の外観を保持します。
ReconFusionは、少数ビューおよび多数ビューの再構築の両方を改善し、以前の少数ビューNeRF再構築手法に比べて大幅な性能向上を実証します。
🎯
LLMの根幹「Transformer」とは?並列処理に最適なワケ | 日経クロステック(xTECH)
「ChatGPT」は大規模言語モデル(LLM)「GPT」をベースにしており、その根幹は「Transformer」である
「Transformer」はエンコーダーとデコーダーで構成し、アテンション機構を中心としている
「Transformer」は大規模並列処理に向いたモデルで、GPUでの処理を想定して設計されている
🔐
Sparsity-preserving differentially private training – Google Research Blog
大規模な埋め込みモデルの訓練において、プライバシー保護と効率性を両立する新しいアルゴリズム「DP-AdaFEST」を提案。
DP-AdaFESTは、各イテレーションでノイズが追加される特徴行のサブセットのみを選択し、勾配の疎性を維持。
DP-AdaFESTは、勾配サイズを105倍以上削減し、同等の精度を維持、ウォールクロック時間の20倍の改善が可能。
👩🏫
ASCII.jp:俺のChatGPTこと「GPTs」で最高の英語教師を作り込んだ。題して「冴子先生強化計画」 ..
「冴子先生強化計画」では、人間らしい要素を追加し、最高の英語教師を作り上げた
「終了」と入力されたら単語帳を作成し、ダウンロードリンクを提供する
GPTsは英語学習アシスタントだけでなく、自分の目的に合わせて作成可能で、パーソナルなGPTと汎用的なChatGPTを使い分けるスタイルが主流に
💧
強いAIが登場して何ができるようになるのか?
AIの進化についての学生の反応は冷淡で、ビジネスへの直接的な影響は疑問視されています。
AIの店員の増加や監視カメラのアップデートなど、AIの進歩が必ずしも喜ばしいものではないとの意見もあります。
一方で、スマートフォンはドラえもんの道具よりも便利との見方もあり、AIの進歩に対する評価は分かれています。
💡
OpenAIアルトマン騒動で急浮上の「Q*」とは何なのか? | ギズモード・ジャパン
OpenAIのCEO更迭劇の背景には、AIの開発が関与していたという噂が広まっています。
このAIの開発プログラムは「Q*(Qスター)」と呼ばれ、小学生レベルの数学問題を解くことができると言われています。
しかし、専門家の間ではこの報道に懐疑的な声もあり、更迭劇の真相は未解決のままです。
2023年12月09日
|
2023年12月07日
このサイトについて
/
ニュースレター
/
@AINewsDev