~AI関連記事を3行にまとめて紹介~
😊
LangChainのパートナーパッケージ langchain-huggingface の概要|npaka
HuggingFace関連クラスはコミュニティ主導で開発
多用途な「Pipeline」ツールがRAGやエージェントに対応
「sentence-transformers」の埋め込みモデルを活用
🆕
[速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開 - Publickey
新WebIDE「Project IDX」がオープンベータで利用可能に
複数のフレームワークと言語に対応し開発効率を向上
AndroidエミュレータとiOSシミュレータでのWebプレビュー対応
🎬
グーグル、入力文で1分超の高解像度動画を生成するAI「Veo」発表…映画関係者らに提供 : ..
1分以上の高解像度動画を生成するAIを発表
映画関係者への提供を開始
YouTubeへの機能搭載も予定
🆕
ASCII.jp:画像生成AIとしても超進化したChatGPT「GPT-4o」
新しい大規模言語モデルが画像生成機能を強化
AIコミックや3Dアニメーション生成の進化が話題に
GPT-4oとDALL-E 3の統合で画像生成AIが革命的変化の可能性
🤖
Introduction to gpt-4o | OpenAI Cookbook
GPT-4oはテキスト、ビジョン、オーディオを統合
現在APIはテキストと画像入力に対応
テキスト、画像、ビデオ理解の使用法を紹介
🤔
AI時代にSEOをうまく進めるには? WixのSEO責任者が贈る6つのアドバイス(前編) | Moz - SEOと..
AI時代のSEOの重要性を掘り下げる
SERPにおけるAIの活用が鍵
SEOの進め方についてのアドバイス提供
💡
圧倒的な読書量を誇るからあげ氏が実践・読書との向き合い方 | レバテックラボ(レバテックLAB)
読書記録をグラフ化し公開
読書は気楽に楽しむことを推奨
本選びは口コミを重視し電子書籍を利用
🖼️
PaliGemma の概要|npaka
画像とテキストの両方を理解するビジョン言語モデル
異なる解像度のモデルがあり、HuggingFaceと互換性を持つ
キャプション付けや質問応答など多様なタスクに対応
🎉
グーグルのAI祭り「Google I/O 2024」基調講演を総まとめ - ケータイ Watch
「Google I/O 2024」でGeminiによる新機能「Ask Photos」発表
「Project Astra」公表、Geminiを活用したアプリ強化が進行
検索機能に「AI Overview」追加、日常生活への応用も
😍
グーグル、独自生成AI「Gemini 1.5 Pro」新機能と高速版「Gemini 1.5 Flash」を発表 - ケータイ ..
「Google I/O」でAI新機能と高速版を発表
Gemini 1.5 Proは100万トークンのコンテキストウィンドウ搭載
Gemini 1.5 Flashは35セントから利用可能、6月に一般提供予定
🌐
人間に近づいた「GPT-4o」3つの進化のポイント あえて人間ぽくした?広がる「擬人化トレンド」 |..
AIの応答速度が向上し、自然な会話が実現
50言語に対応し、多様なデバイスで利用可能
AI同時通訳機能も搭載し、GPT-5への準備進行中
🤖
GPT-4o発表!課金すべきかVS無料でいくか - paiza times
新AIモデル「GPT-4o」が発表され、無料機能が拡充
無料ユーザーはWeb検索やデータ分析が可能に
課金ユーザーに特化機能ありも無料でも多機能利用可
🤖
大実験!ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog
GPT-4oは音声や画像のリアルタイム処理が可能に
競技プログラミングには高度な問題解決能力が必要
ChatGPTが競プロ問題10問に挑戦、結果は後日発表
🤖
MIT、軟体ロボットシミュレータ「DittoGym」開発。由来はメタモン | テクノエッジ TechnoEdge
ソフトロボットの研究が医療や産業用途に向けて進行中
身体を自在に変形させる制御アルゴリズムが開発される
汎用ロボットの可能性を示す研究成果が発表
😍
Google I/O 2024基調講演まとめ AI一色、GPT-4oのような機能も:Google I/O 2024 - ITmedia NEW..
AIを中心にした基調講演で多数のアップデート発表
Gemini Advancedのコンテキストウィンドウが200万トークンに
「かこって検索」やGemini Nanoの機能強化も進行中
🌐
パソコン向けChromeに生成AI「Gemini Nano」を搭載、翻訳や要約をオンデバイスで実現 - ケータイ..
2024年5月、デスクトップ向けChromeにAI「Gemini Nano」搭載
Webサイトの翻訳や要約をオンデバイスで処理可能に
プライバシー保護とデバイススペックに配慮したAIモデル
👀
GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる
GPT4oで訓練なしの物体検出を試行
2024年5月の発表で画像認識精度に注目
BBoxを用いてGPT4oの性能を検証
🎥
Google、動画生成AIモデル『Veo』発表。高解像度で一分超、撮影用語などプロンプト再現性と高い..
AIによる1080p解像度で1分以上の動画生成が可能
長いプロンプトに忠実で被写体の一貫性を保つ技術
特定の被写体の編集や除去が可能なクリエイティブコントロール
🎥
Google、Gemini AIのビデオ検索デモで早速やらかす。カメラのフィルム巻き上げレバーが動かない..
「Ask with Video」で映像に合わせ質問に回答
フィルムカメラの操作に誤った情報を提示
AI利用時は誤情報に注意が必要
🤖
AIで「先生」を生成しました。YouTubeすら教材になる「LearnLM」 #GoogleIO | ギズモード・ジャ..
AIモデル「LearnLM」が学習支援を実現
YouTubeを含む教材で「理解」を深める
学習効率の向上に貢献するAI先生
🙏
Google検索にAI新機能導入へ――動画検索や「AIによる検索結果まとめ」など - ケータイ Watch
2024年5月15日にAI新機能が検索サービスに導入される
検索語に対する「AIによる概要」が検索結果ページに表示
AIが整理した検索結果で情報探索の効率化が期待される
👍
ASCII.jp:新しい「ChatGPT」はココがすごい 解説「GPT-4o」 (1/3)
新しい大規模言語モデル「GPT-4o」がお披露目された
テキスト理解力が過去最高で、多言語に対応している
画像認識能力も向上し、マルチモーダルな理解力が高い
🍎
OpenAI公式のChatGPT for MacアプリはElectronやCatalystなどを利用せず、macOSネイティブアプリ..
macOSネイティブアプリとしてChatGPT for Macが開発
Apple Silicon MacのmacOS 14 Sonoma以降に対応
ChatGPT Plusユーザー向けにロールアウト開始、一般公開は数週間後
🤖
Google、テキストや画像から動画を生成するAI「Veo」発表 OpenAIの「Sora」対抗 - ITmedia Mobi..
新AIモデル「Veo」、1080pの動画生成が可能に
ウェイティングリスト公開、プライベートプレビューへ参加募集
自然言語理解と一貫性のある映像生成を特徴とする
😲
OpenAIのAIモデル「GPT-4o」がチェスパズルで従来モデルの2倍以上の好成績をたたき出しランキン..
新AIモデルがチェスパズルで従来の2倍以上の成績を達成
テキストや音声、視覚情報の高速処理とリアルタイム応答が可能
数学問題にも強く、計算問題に対応する能力を持つ
🚀
スタンフォード大学の研究グループがGPUを高速に動作させるAI用のドメイン固有言語「ThunderKitt..
GPUのAI演算を高速化するDSL「ThunderKittens」をリリース
H100使用しWGMMA命令等で演算量を最大化
GitHubでオープンソースとして公開、性能向上に貢献
🚀
AndroidはAIで進化する。「かこって検索」で数式解説 - Impress Watch
2024年5月、AndroidのAI「Gemini」が数式解説に活用
「かこって検索」機能強化、視力ハンディカバーも予定
詐欺対策機能開発中、詐欺電話をリアルタイム検出
🤖
グーグル、「Google フォト」にAI新機能「Ask Photos」を発表 - ケータイ Watch
2024年5月15日にAI新機能「Ask Photos」を発表
質問に応じて関連写真を探し出し提示
アメリカで今週リリース、他国も近々予定
👀
米Google、オープンな視覚言語モデル「PaliGemma」公開 「Gemma 2」の登場も予告:Google I/O 2..
視覚言語モデル「PaliGemma」が公開される
「Gemma 2」は270億パラメータで近々公開予定
「PaliGemma」はHugging FaceやGitHubで利用可能
💡
Adobeのシャンタヌ・ナラヤン会長兼CEOはAIをどう捉えているのか? - GIGAZINE
AIの重要性を強調し、生成AIの可能性に言及
ビジネスモデルへの影響や非効率作業の自動化に注目
AIコンテンツの氾濫とクリエイティブの差別化が課題
🤖
実用的なLLMアプリケーションを作るための大規模アップデート 「LangChain 0.1」「LlamaIndex 0..
LangChain 0.1ではパッケージ分離し、LCELとLangGraphを導入
LlamaIndex 0.10はServiceContext廃止、Geminiアーキテクチャを採用
AIエージェントとRAG構築に特化した両フレームワークの進化に注目
🔍
Googleフォトに保存した大量の写真から「欲しい1枚」をピンポイントで検索できるようになる #Goo..
GoogleのAI新機能「Ask Photo」が発表
写真内の目的画像をAIが分析し検索
手間のかかるタグ付けやアルバム作成不要
🔍
グーグル 検索サービスに生成AI「Gemini」発表 単語で区切らず文章入力で調べられる機能盛り込む..
生成AI「Gemini」を検索サービスに導入
文章入力での検索が可能に
技術進化に専門家から慎重な配慮の呼びかけ
😲
GNN の最新動向 (ICLR 2024) - ジョイジョイジョイ
ICLR 2024でGNNの解釈性・同変性に関する研究が発表
GNNExplainerやGNNX-BENCHなどの解釈性ツールが注目
メタネットワークの研究が進展し、新たなモデル提案へ
🌊
Weka raises $140M as the AI boom bolsters data platforms | TechCrunch
AI投資増加に伴い、多くの企業がデータ管理に課題
組織の77%がデータ品質に懸念、整理・最適化の必要性
データパイプライン構築プラットフォームが資金調達で成長予定
🤖
We have to stop ignoring AI’s hallucination problem - The Verge
AIの「幻覚」問題は技術革新の障害となっている
大手企業のAIは事実を誤認し、ユーザーに誤情報を提供
AIの正確性を犠牲にして利便性を追求する傾向に懸念
🚀
Mac用ChatGPTクライアント「MacGPT」がGPT-4oに対応。
MacGPTがGPT-4oに対応し反応速度アップ
グローバルチャットやインライン回答が可能に
macOS 12以降対応、€20で購入、既存ユーザーは無料アップデート
🤖
Googleが映像と音声を理解して質問に答えるGPT-4oっぽいAIエージェント「Project Astra」を発表 ..
映像や音声を理解し質問に答えるAI「Project Astra」が登場
スマホやスマートグラスで撮影した映像をリアルタイム解析
Geminiアプリやウェブエクスペリエンスに搭載予定
😊
GitHub、生成AIソリューション「GitHub Copilot」と、その社会への影響に関してCOOらが説明 - ク..
AIがソフトウェア開発に与える影響について説明
開発者の創造性向上と定型作業の自動化に焦点
AI規制整備の重要性と政策による保護の必要性を強調
👌
Pairwise Evaluations with LangSmith
LLMアプリ開発ではモデル出力の評価が重要
人間の好みをルールにするのは困難
ペアワイズ評価がLLMに好みを教える効果的手法
🚀
Accelerate NLP inference with ONNX Runtime on AWS Graviton processors | AWS Machine Learni..
ONNXランタイムでNLP推論の高速化を実現
Graviton3プロセッサーのML最適化命令を活用
最大65%の推論性能向上をデモンストレーション
🤖
Learn how Amazon Ads created a generative AI-powered image generation capability using Ama..
Amazon Adsが画像生成機能を開発
消費者の購入過程に合わせた広告提供
AIと応用科学で20年間ビジネス支援
💡
The top AI announcements from Google I/O | TechCrunch
Googleが開発者会議でAIに注力
「AI」の言葉を基調講演で120回以上使用
新しいAI製品や機能を発表
😍
Google TV to launch AI-generated movie descriptions | TechCrunch
Google TVがAIモデル「Gemini」を導入し映画説明を生成
視聴者の好みに合わせたカスタマイズされた推薦を提供
映画や番組の発見を迅速化し、検索時間の短縮を目指す
📚
Build a serverless exam generator application from your own lecture content using Amazon B..
講義コンテンツから試験問題を自動生成するソリューション提案
多肢選択や真偽問題作成には時間と注意が必要
Amazon Bedrockを活用し、教育者の負担を軽減
💪
Viking 7B: The first open LLM for the Nordic languages
北欧言語向けの初の多言語大規模言語モデルがリリース
地域の文化に敏感な新しいアプローチでLLMを訓練
ヨーロッパの言語多様性促進に向けた重要なマイルストーン
💪
Google I/O 2024: Here's everything Google just announced | TechCrunch
Google I/Oで新たなセキュリティ機能を発表
Androidにリアルタイム脅威検出など追加
Google TVやマップの新機能、AI技術も披露
🌍
Achieving Sustainability Goals with PyTorch and Intel AI | PyTorch
国連グローバルコンパクトがSDGs達成にデジタル技術の重要性を強調
Linux FoundationのSustainability InitiativeがプロジェクトをSDGsに調整
PyTorchとIntel AIでSDGに沿った課題に取り組むユースケースを発表
😅
Google still hasn't fixed Gemini's biased image generator | TechCrunch
GoogleのAIチャットボットが歴史的な画像生成で偏見を示す
CEOが謝罪し、修正は「非常に短期間で」到着予定と発言
約束された修正は数ヶ月経過しても未実施の状態
👏
もはやデジタル後進国ではない、意外と進んでいる日本の生成AI活用 | 日経クロステック(xTECH)
生成AIの業務活用で日本が主要国に先行
CEOの半数が業務でのAI受け入れを実感
RAG使用など生成AI手法が広く採用されている
🌐
PaliGemma: Open Source Multimodal Model by Google
オープンソースのマルチモーダルモデルが幅広い能力を持つ
画像とテキストを入力に、テキスト出力を行う複合モデル
複数の言語に対応し、カスタムデータでの微調整が可能
🖼️
多すぎて悩む生成AI、最新注目ツールはこの3つ! お手軽で画像や音楽の作成に強力な性能を発揮 |..
生成AIツールが多数登場し選択に迷う声が多い
画像・音楽作成に特化した最新AIツールが注目される
生成AIは「魔法」のように進化、一般人もその力を実感
🤖
gpt-4oを試す
GPT-4oはテキスト、オーディオ、ビデオ入力に対応
APIはテキストとイメージ入力をサポート
Colaboratoryで動作し、動画処理にffmpeg等を使用
🚀
【風吹けば名無し】GPT-4o が獲得した日本語の語彙を調べる
GPT-4oは日本語処理が改善
新トークナイザo200k_baseで日本語語彙を調査
挨拶・ネット用語・外来語などの獲得が確認
🤖
ãðå®å ¨çãä¸çãéæ¼ããOpenAIæ..
GPT-4がAIの会話をよりリアルにする技術を搭載
ChatGPTの機能が強化され、高度な会話が可能に
新機能の詳細は公式ウェブサイトで確認可能
🇯🇵
NVIDIA主導で日本が「ソブリンAI」先進国に、AI立国に必須とNVIDIAが提唱するソブリンAIとは一体..
日本のAIインフラ構築を経済産業省が支援
ソブリンAIは国内経済効果の環流に必須
NVIDIAがGPU供給で日本のAI立国を後押し
2024年05月16日
|
2024年05月14日
このサイトについて
/
ニュースレター
/
@AINewsDev