AI News

~AI関連記事を3行にまとめて紹介~

🧠

オープンソースAIとは何か? – Open Source AI Definition策定経緯とドラフト版概説 – Shuji S..

  • オープンソースAIはオープンソースの状態にあるAIシステムを指します。
  • 2023年からOSIがオープンソースAIの定義策定を開始しました。
  • AI法制への対応やOpen Washingへの対処が理由です。

🤖

社内用AIアシスタント「おっさんずナビ」を作った話、そして人間らしく振る舞う重要性を認識した..

  • 社内AIアシスタント「おっさんずナビ」を開発しました。
  • LLMを活用し、社内事情に基づいた回答を提供します。
  • 人間らしく振る舞うことの重要性を学びました。

🧠

A Model of a Mind

  • 心の機能を説明するシンプルなモデルを紹介します。
  • デジタル心の未来とその可能性を考察します。
  • エージェンシー、学習、思考、内省の特徴を説明します。

📄

Document Layout Analysisに物体検出を利用したDocument Object Detectionのすゝめ - LayerX エ..

  • Document Layout Analysisは文書のレイアウトを解析するタスクです。
  • Detectron2とMMdetectionを使用して物体検出モデルを構築します。
  • PubLayNetとDocLayNetのデータセットを利用しています。

🚀

今LayerXのバクラク事業部 機械学習グループに入るべき理由(2024年版) - LayerX エンジニアブロ..

  • LayerXの機械学習グループは急成長中です。
  • AI-OCRの開発や新機能のリリースを進めています。
  • 組織の変化速度が速く、今後10倍の拡大を予定しています。

🤖

バクラクのAI-OCRが扱う問題の複雑さ - LayerX エンジニアブログ

  • AI-OCRは経理業務に必要な項目を抽出します。
  • 帳票の種類や使われ方に深いドメイン理解が必要です。
  • 取引先名の抽出には正確さが求められます。

🤖

AWSで生成AI入門!LLMの基本からRAG、Agentまで | ドクセル

  • LLMの基本を説明し、Amazon Bedrockの使い方を紹介します。
  • APIの使い方からRAG、エージェントの作成まで解説します。
  • SFとコンピュータが好きな山崎拓也氏によるセッション資料です。

🤖

機械学習とビジネスゴールのはざまで - LayerX エンジニアブログ

  • 機械学習モデルのオフライン評価とビジネスKPIのギャップを感じたことはありませんか?
  • LayerXでAI-OCR機能の開発に携わり、ビジネス課題に対処してきました。
  • 複数のモデルやルールを組み合わせ、AI-OCR機能の内部を改善しました。

🤖

AIデータセンターの1万5000個のGPUを相互接続する技術をAlibaba Cloudの研究者が発表、NVIDIA技..

  • Alibaba Cloudが1万5000個のGPUをイーサネットで接続する技術を発表
  • 独自のハイパフォーマンスネットワークで3.2Tbpsの通信を実現
  • 2024年8月にSIGCOMMで技術を発表予定

🚀

【Copilot for Microsoft 365】思い付きを最速で企画書に! イメージを伝えて高速生成 - 残業を..

  • Copilotを使って企画書作成を効率化しましょう。
  • 箇条書きを表形式に変換する機能が便利です。
  • 自動生成で手動編集を省略し、時間短縮が可能です。

🤖

GPT-4oは無料でどこまで使える? 検証して分かったこと:その悩み、生成AIが解決(1/2 ページ)..

  • AI研究者が生成AIとデジタル戦略の未来を語る無料イベント開催
  • 最新モデルGPT-4oは無料プランでも利用可能だが一部機能に制限あり
  • AI技術の進化について知りたい方は要チェック

2024年度 第38回人工知能学会全国大会(JSAI2024)参加レポート - Insight Edge Tech Blog

  • 2024年5月にInsight Edgeにジョインした市川です。
  • 人工知能学会(JSAI2024)に参加し、3500人超が集まりました。
  • 金融分野の大規模言語モデルや不動産とAIの研究が興味深かったです。

🚀

Google launches Gemma 2, its next generation of open models

  • Gemma 2は研究者や開発者向けに利用可能です。
  • 9Bおよび27Bのパラメーターサイズで提供されます。
  • Hugging FaceやNVIDIAなどのパートナーと統合されています。

📊

Alex Strick van Linschoten - My finetuned models beat OpenAI’s GPT-4

  • ファインチューニングされたLLMの評価メトリックを概説しました。
  • 精度を中心に他の評価メトリックも詳しく説明しました。
  • データセットはHugging Face Hubのパブリックリポジトリで利用可能です。

😱

ChatGPTでのカンニングは94%が検出不能でチェックを素通りし人間よりも成績が良いことが名門大..

  • ChatGPTのカンニングは94%が検出不能と判明
  • AI検出ツールの精度が低く、試験を通過
  • AI対策として対面式試験の復活を提案

ASCII.jp:AI動画の品質が仕事に使えるレベルになってきた (1/4)

  • AI動画の品質が仕事に使えるレベルに達した話題が紹介されました。
  • Luma AIの「Dream Machine」は無料で30回まで試せます。
  • 高品質な動画生成には多くの試行が必要です。

🎤

GitHub - ShaShekhar/aaiela

  • 音声コマンドで画像編集が可能なプロジェクトです。
  • オープンソースのAIモデルを活用しています。
  • 音声と視覚変換のギャップを埋める編集体験を提供します。

🤖

ネコ型配膳ロボットに大型ディスプレイ搭載の新モデル - PC Watch

  • 18.5型ディスプレイでメニューや広告を表示可能
  • AI搭載で自然な接客を実現
  • PUDU VSLAM+で障害物回避と安全性向上

機械学習にはどれくらいのデータが必要ですか? #Python - Qiita

  • 特徴量の数の10倍がデータ量の目安とされる。
  • 問題やモデルの複雑さによって必要なデータ量は異なる。
  • 実験的に調査し、最低限必要なデータ数を見積もることが重要。

👍

DeepLearning系の将棋AIがRyzenのiGPUで簡単に動いた(ふかうら王編) - シンギュラリティ実験ノ..

  • ふかうら王はdlshogi互換エンジンで、GitHubからダウンロード可能。
  • ORT-CPUとORT-DMLの導入はシンプルで、NVIDIAのGPUは複雑。
  • Windows+onnxruntime+DirectMLでAMDのiGPUを簡単に動かせる。

AMD ROCmを使うことで何ができるのか - シンギュラリティ実験ノート

  • AMD ROCmを使うことでUM790 ProでAIソフトが動作可能。
  • ROCmでMNISTやdlshogi、StableDiffusionが期待できる。
  • 正式サポート外のGPUもチャレンジしてみたい。

📸

Meta changes its label from 'Made with AI' to 'AI info' to indicate use of AI in photos | ..

  • メタは写真に「AI製」ラベルを付け始めました。
  • 写真家たちは基本的な編集ツール使用写真にラベルが適用されると苦情を言いました。
  • ユーザーフィードバックに基づき、ラベルを「AI情報」に変更しました。

🤖

Build a self-service digital assistant using Amazon Lex and Knowledge Bases for Amazon Bed..

  • Amazon Lexは高度な会話インターフェースを提供します。
  • Amazon Bedrockは生成的AIアプリケーションの開発を簡素化します。
  • QnAIntentを使用してFAQを自動化できます。

💡

Identify idle endpoints in Amazon SageMaker | AWS Machine Learning Blog

  • Amazon SageMakerはMLソリューションの開発と展開を加速します。
  • 未使用のSageMakerエンドポイントが運用コストを上昇させる可能性があります。
  • CloudWatchメトリクスでアイドルエンドポイントを自動特定する方法を紹介します。

🌟

Indian language RAG with Cohere multilingual embeddings and Anthropic Claude 3 on Amazon B..

  • メディア企業は多言語の観客に幅広いコンテンツを提供しています。
  • 従来のアプローチはドキュメントの意味的コンテキストを捉えきれません。
  • CohereとAnthropic Claude 3でインド言語RAGアプリを実現します。

エンジニアにも知ってほしいChatGPT基本テクニック #Python - Qiita

  • エンジニアがChatGPTを活用する基本テクニックを紹介。
  • プロンプトの記法にはMarkdownを使用し、指示内容を明確にする。
  • ChatGPTのパラメータやパフォーマンスチューニングについても解説。

Sora世代の高性能動画生成AIがRunwayからも。一般公開された「Gen-3 Alpha」にできること、でき..

  • Soraのワールドモデルに触発された新しい動画生成AIが登場。
  • RunwayのGen-3 Alphaは有料のStandardプラン以上で利用可能。
  • 生成された動画は1280×768、24FPS、H.264エンコードで提供。

2024年07月02日

|

このサイトについて

/

ニュースレター

/

@AINewsDev