AI News

~AI関連記事を3行にまとめて紹介~

😊

LangChainのパートナーパッケージ langchain-huggingface の概要|npaka

  • HuggingFace関連クラスはコミュニティ主導で開発
  • 多用途な「Pipeline」ツールがRAGやエージェントに対応
  • 「sentence-transformers」の埋め込みモデルを活用

🆕

[速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開 - Publickey

  • 新WebIDE「Project IDX」がオープンベータで利用可能に
  • 複数のフレームワークと言語に対応し開発効率を向上
  • AndroidエミュレータとiOSシミュレータでのWebプレビュー対応

🎬

グーグル、入力文で1分超の高解像度動画を生成するAI「Veo」発表…映画関係者らに提供 : ..

  • 1分以上の高解像度動画を生成するAIを発表
  • 映画関係者への提供を開始
  • YouTubeへの機能搭載も予定

🆕

ASCII.jp:画像生成AIとしても超進化したChatGPT「GPT-4o」

  • 新しい大規模言語モデルが画像生成機能を強化
  • AIコミックや3Dアニメーション生成の進化が話題に
  • GPT-4oとDALL-E 3の統合で画像生成AIが革命的変化の可能性

🤖

Introduction to gpt-4o | OpenAI Cookbook

  • GPT-4oはテキスト、ビジョン、オーディオを統合
  • 現在APIはテキストと画像入力に対応
  • テキスト、画像、ビデオ理解の使用法を紹介

🤔

AI時代にSEOをうまく進めるには? WixのSEO責任者が贈る6つのアドバイス(前編) | Moz - SEOと..

  • AI時代のSEOの重要性を掘り下げる
  • SERPにおけるAIの活用が鍵
  • SEOの進め方についてのアドバイス提供

💡

圧倒的な読書量を誇るからあげ氏が実践・読書との向き合い方 | レバテックラボ(レバテックLAB)

  • 読書記録をグラフ化し公開
  • 読書は気楽に楽しむことを推奨
  • 本選びは口コミを重視し電子書籍を利用

🖼️

PaliGemma の概要|npaka

  • 画像とテキストの両方を理解するビジョン言語モデル
  • 異なる解像度のモデルがあり、HuggingFaceと互換性を持つ
  • キャプション付けや質問応答など多様なタスクに対応

🎉

グーグルのAI祭り「Google I/O 2024」基調講演を総まとめ - ケータイ Watch

  • 「Google I/O 2024」でGeminiによる新機能「Ask Photos」発表
  • 「Project Astra」公表、Geminiを活用したアプリ強化が進行
  • 検索機能に「AI Overview」追加、日常生活への応用も

😍

グーグル、独自生成AI「Gemini 1.5 Pro」新機能と高速版「Gemini 1.5 Flash」を発表 - ケータイ ..

  • 「Google I/O」でAI新機能と高速版を発表
  • Gemini 1.5 Proは100万トークンのコンテキストウィンドウ搭載
  • Gemini 1.5 Flashは35セントから利用可能、6月に一般提供予定

🌐

人間に近づいた「GPT-4o」3つの進化のポイント あえて人間ぽくした?広がる「擬人化トレンド」 |..

  • AIの応答速度が向上し、自然な会話が実現
  • 50言語に対応し、多様なデバイスで利用可能
  • AI同時通訳機能も搭載し、GPT-5への準備進行中

🤖

GPT-4o発表!課金すべきかVS無料でいくか - paiza times

  • 新AIモデル「GPT-4o」が発表され、無料機能が拡充
  • 無料ユーザーはWeb検索やデータ分析が可能に
  • 課金ユーザーに特化機能ありも無料でも多機能利用可

🤖

大実験!ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog

  • GPT-4oは音声や画像のリアルタイム処理が可能に
  • 競技プログラミングには高度な問題解決能力が必要
  • ChatGPTが競プロ問題10問に挑戦、結果は後日発表

🤖

MIT、軟体ロボットシミュレータ「DittoGym」開発。由来はメタモン | テクノエッジ TechnoEdge

  • ソフトロボットの研究が医療や産業用途に向けて進行中
  • 身体を自在に変形させる制御アルゴリズムが開発される
  • 汎用ロボットの可能性を示す研究成果が発表

😍

Google I/O 2024基調講演まとめ AI一色、GPT-4oのような機能も:Google I/O 2024 - ITmedia NEW..

  • AIを中心にした基調講演で多数のアップデート発表
  • Gemini Advancedのコンテキストウィンドウが200万トークンに
  • 「かこって検索」やGemini Nanoの機能強化も進行中

🌐

パソコン向けChromeに生成AI「Gemini Nano」を搭載、翻訳や要約をオンデバイスで実現 - ケータイ..

  • 2024年5月、デスクトップ向けChromeにAI「Gemini Nano」搭載
  • Webサイトの翻訳や要約をオンデバイスで処理可能に
  • プライバシー保護とデバイススペックに配慮したAIモデル

👀

GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる

  • GPT4oで訓練なしの物体検出を試行
  • 2024年5月の発表で画像認識精度に注目
  • BBoxを用いてGPT4oの性能を検証

🎥

Google、動画生成AIモデル『Veo』発表。高解像度で一分超、撮影用語などプロンプト再現性と高い..

  • AIによる1080p解像度で1分以上の動画生成が可能
  • 長いプロンプトに忠実で被写体の一貫性を保つ技術
  • 特定の被写体の編集や除去が可能なクリエイティブコントロール

🎥

Google、Gemini AIのビデオ検索デモで早速やらかす。カメラのフィルム巻き上げレバーが動かない..

  • 「Ask with Video」で映像に合わせ質問に回答
  • フィルムカメラの操作に誤った情報を提示
  • AI利用時は誤情報に注意が必要

🤖

AIで「先生」を生成しました。YouTubeすら教材になる「LearnLM」 #GoogleIO | ギズモード・ジャ..

  • AIモデル「LearnLM」が学習支援を実現
  • YouTubeを含む教材で「理解」を深める
  • 学習効率の向上に貢献するAI先生

🙏

Google検索にAI新機能導入へ――動画検索や「AIによる検索結果まとめ」など - ケータイ Watch

  • 2024年5月15日にAI新機能が検索サービスに導入される
  • 検索語に対する「AIによる概要」が検索結果ページに表示
  • AIが整理した検索結果で情報探索の効率化が期待される

👍

ASCII.jp:新しい「ChatGPT」はココがすごい 解説「GPT-4o」 (1/3)

  • 新しい大規模言語モデル「GPT-4o」がお披露目された
  • テキスト理解力が過去最高で、多言語に対応している
  • 画像認識能力も向上し、マルチモーダルな理解力が高い

🍎

OpenAI公式のChatGPT for MacアプリはElectronやCatalystなどを利用せず、macOSネイティブアプリ..

  • macOSネイティブアプリとしてChatGPT for Macが開発
  • Apple Silicon MacのmacOS 14 Sonoma以降に対応
  • ChatGPT Plusユーザー向けにロールアウト開始、一般公開は数週間後

🤖

Google、テキストや画像から動画を生成するAI「Veo」発表 OpenAIの「Sora」対抗 - ITmedia Mobi..

  • 新AIモデル「Veo」、1080pの動画生成が可能に
  • ウェイティングリスト公開、プライベートプレビューへ参加募集
  • 自然言語理解と一貫性のある映像生成を特徴とする

😲

OpenAIのAIモデル「GPT-4o」がチェスパズルで従来モデルの2倍以上の好成績をたたき出しランキン..

  • 新AIモデルがチェスパズルで従来の2倍以上の成績を達成
  • テキストや音声、視覚情報の高速処理とリアルタイム応答が可能
  • 数学問題にも強く、計算問題に対応する能力を持つ

🚀

スタンフォード大学の研究グループがGPUを高速に動作させるAI用のドメイン固有言語「ThunderKitt..

  • GPUのAI演算を高速化するDSL「ThunderKittens」をリリース
  • H100使用しWGMMA命令等で演算量を最大化
  • GitHubでオープンソースとして公開、性能向上に貢献

🚀

AndroidはAIで進化する。「かこって検索」で数式解説 - Impress Watch

  • 2024年5月、AndroidのAI「Gemini」が数式解説に活用
  • 「かこって検索」機能強化、視力ハンディカバーも予定
  • 詐欺対策機能開発中、詐欺電話をリアルタイム検出

🤖

グーグル、「Google フォト」にAI新機能「Ask Photos」を発表 - ケータイ Watch

  • 2024年5月15日にAI新機能「Ask Photos」を発表
  • 質問に応じて関連写真を探し出し提示
  • アメリカで今週リリース、他国も近々予定

👀

米Google、オープンな視覚言語モデル「PaliGemma」公開 「Gemma 2」の登場も予告:Google I/O 2..

  • 視覚言語モデル「PaliGemma」が公開される
  • 「Gemma 2」は270億パラメータで近々公開予定
  • 「PaliGemma」はHugging FaceやGitHubで利用可能

💡

Adobeのシャンタヌ・ナラヤン会長兼CEOはAIをどう捉えているのか? - GIGAZINE

  • AIの重要性を強調し、生成AIの可能性に言及
  • ビジネスモデルへの影響や非効率作業の自動化に注目
  • AIコンテンツの氾濫とクリエイティブの差別化が課題

🤖

実用的なLLMアプリケーションを作るための大規模アップデート 「LangChain 0.1」「LlamaIndex 0..

  • LangChain 0.1ではパッケージ分離し、LCELとLangGraphを導入
  • LlamaIndex 0.10はServiceContext廃止、Geminiアーキテクチャを採用
  • AIエージェントとRAG構築に特化した両フレームワークの進化に注目

🔍

Googleフォトに保存した大量の写真から「欲しい1枚」をピンポイントで検索できるようになる #Goo..

  • GoogleのAI新機能「Ask Photo」が発表
  • 写真内の目的画像をAIが分析し検索
  • 手間のかかるタグ付けやアルバム作成不要

🔍

グーグル 検索サービスに生成AI「Gemini」発表 単語で区切らず文章入力で調べられる機能盛り込む..

  • 生成AI「Gemini」を検索サービスに導入
  • 文章入力での検索が可能に
  • 技術進化に専門家から慎重な配慮の呼びかけ

😲

GNN の最新動向 (ICLR 2024) - ジョイジョイジョイ

  • ICLR 2024でGNNの解釈性・同変性に関する研究が発表
  • GNNExplainerやGNNX-BENCHなどの解釈性ツールが注目
  • メタネットワークの研究が進展し、新たなモデル提案へ

🌊

Weka raises $140M as the AI boom bolsters data platforms | TechCrunch

  • AI投資増加に伴い、多くの企業がデータ管理に課題
  • 組織の77%がデータ品質に懸念、整理・最適化の必要性
  • データパイプライン構築プラットフォームが資金調達で成長予定

🤖

We have to stop ignoring AI’s hallucination problem - The Verge

  • AIの「幻覚」問題は技術革新の障害となっている
  • 大手企業のAIは事実を誤認し、ユーザーに誤情報を提供
  • AIの正確性を犠牲にして利便性を追求する傾向に懸念

🚀

Mac用ChatGPTクライアント「MacGPT」がGPT-4oに対応。

  • MacGPTがGPT-4oに対応し反応速度アップ
  • グローバルチャットやインライン回答が可能に
  • macOS 12以降対応、€20で購入、既存ユーザーは無料アップデート

🤖

Googleが映像と音声を理解して質問に答えるGPT-4oっぽいAIエージェント「Project Astra」を発表 ..

  • 映像や音声を理解し質問に答えるAI「Project Astra」が登場
  • スマホやスマートグラスで撮影した映像をリアルタイム解析
  • Geminiアプリやウェブエクスペリエンスに搭載予定

😊

GitHub、生成AIソリューション「GitHub Copilot」と、その社会への影響に関してCOOらが説明 - ク..

  • AIがソフトウェア開発に与える影響について説明
  • 開発者の創造性向上と定型作業の自動化に焦点
  • AI規制整備の重要性と政策による保護の必要性を強調

👌

Pairwise Evaluations with LangSmith

  • LLMアプリ開発ではモデル出力の評価が重要
  • 人間の好みをルールにするのは困難
  • ペアワイズ評価がLLMに好みを教える効果的手法

🚀

Accelerate NLP inference with ONNX Runtime on AWS Graviton processors | AWS Machine Learni..

  • ONNXランタイムでNLP推論の高速化を実現
  • Graviton3プロセッサーのML最適化命令を活用
  • 最大65%の推論性能向上をデモンストレーション

🤖

Learn how Amazon Ads created a generative AI-powered image generation capability using Ama..

  • Amazon Adsが画像生成機能を開発
  • 消費者の購入過程に合わせた広告提供
  • AIと応用科学で20年間ビジネス支援

💡

The top AI announcements from Google I/O | TechCrunch

  • Googleが開発者会議でAIに注力
  • 「AI」の言葉を基調講演で120回以上使用
  • 新しいAI製品や機能を発表

😍

Google TV to launch AI-generated movie descriptions | TechCrunch

  • Google TVがAIモデル「Gemini」を導入し映画説明を生成
  • 視聴者の好みに合わせたカスタマイズされた推薦を提供
  • 映画や番組の発見を迅速化し、検索時間の短縮を目指す

📚

Build a serverless exam generator application from your own lecture content using Amazon B..

  • 講義コンテンツから試験問題を自動生成するソリューション提案
  • 多肢選択や真偽問題作成には時間と注意が必要
  • Amazon Bedrockを活用し、教育者の負担を軽減

💪

Viking 7B: The first open LLM for the Nordic languages

  • 北欧言語向けの初の多言語大規模言語モデルがリリース
  • 地域の文化に敏感な新しいアプローチでLLMを訓練
  • ヨーロッパの言語多様性促進に向けた重要なマイルストーン

💪

Google I/O 2024: Here's everything Google just announced | TechCrunch

  • Google I/Oで新たなセキュリティ機能を発表
  • Androidにリアルタイム脅威検出など追加
  • Google TVやマップの新機能、AI技術も披露

🌍

Achieving Sustainability Goals with PyTorch and Intel AI | PyTorch

  • 国連グローバルコンパクトがSDGs達成にデジタル技術の重要性を強調
  • Linux FoundationのSustainability InitiativeがプロジェクトをSDGsに調整
  • PyTorchとIntel AIでSDGに沿った課題に取り組むユースケースを発表

😅

Google still hasn't fixed Gemini's biased image generator | TechCrunch

  • GoogleのAIチャットボットが歴史的な画像生成で偏見を示す
  • CEOが謝罪し、修正は「非常に短期間で」到着予定と発言
  • 約束された修正は数ヶ月経過しても未実施の状態

👏

もはやデジタル後進国ではない、意外と進んでいる日本の生成AI活用 | 日経クロステック(xTECH)

  • 生成AIの業務活用で日本が主要国に先行
  • CEOの半数が業務でのAI受け入れを実感
  • RAG使用など生成AI手法が広く採用されている

🌐

PaliGemma: Open Source Multimodal Model by Google

  • オープンソースのマルチモーダルモデルが幅広い能力を持つ
  • 画像とテキストを入力に、テキスト出力を行う複合モデル
  • 複数の言語に対応し、カスタムデータでの微調整が可能

🖼️

多すぎて悩む生成AI、最新注目ツールはこの3つ! お手軽で画像や音楽の作成に強力な性能を発揮 |..

  • 生成AIツールが多数登場し選択に迷う声が多い
  • 画像・音楽作成に特化した最新AIツールが注目される
  • 生成AIは「魔法」のように進化、一般人もその力を実感

🤖

gpt-4oを試す

  • GPT-4oはテキスト、オーディオ、ビデオ入力に対応
  • APIはテキストとイメージ入力をサポート
  • Colaboratoryで動作し、動画処理にffmpeg等を使用

🚀

【風吹けば名無し】GPT-4o が獲得した日本語の語彙を調べる

  • GPT-4oは日本語処理が改善
  • 新トークナイザo200k_baseで日本語語彙を調査
  • 挨拶・ネット用語・外来語などの獲得が確認

🤖

【📍完全版】世界が震撼したOpenAIæœ..

  • GPT-4がAIの会話をよりリアルにする技術を搭載
  • ChatGPTの機能が強化され、高度な会話が可能に
  • 新機能の詳細は公式ウェブサイトで確認可能

🇯🇵

NVIDIA主導で日本が「ソブリンAI」先進国に、AI立国に必須とNVIDIAが提唱するソブリンAIとは一体..

  • 日本のAIインフラ構築を経済産業省が支援
  • ソブリンAIは国内経済効果の環流に必須
  • NVIDIAがGPU供給で日本のAI立国を後押し

2024年05月16日

|

このサイトについて

/

ニュースレター

/

@AINewsDev