~AI関連記事を3行にまとめて紹介~
🌟
Lotus
Lotusは密な予測タスクでゼロショット一般化を向上させます。
ノイズ予測ではなく注釈を直接予測するモデルです。
効率的で高品質な予測を実現し、実用的な応用に対応します。
📄
ニューヨーク・タイムズがAIスタートアップのPerplexityにコンテンツへのアクセスと利用を停止す..
ニューヨーク・タイムズはPerplexityにコンテンツ利用停止を要求。
PerplexityはAI検索エンジンで著作権侵害の疑いがある。
CEOは協力の意向を示すも著作権主張で対立中。
✨
MetaがAI向けのオープンなハードウェアについての現状と展望について語る - GIGAZINE
MetaはAI向けオープンハードウェアのビジョンを発表しました。
クラスターを16倍に拡大し、ネットワーク能力を10倍以上に増強します。
新たなラックやプラットフォームを通じてオープンハードウェアを強調します。
📷
YouTubeに「映像と音声が編集されていないもの」であることを保証する「カメラで撮影」ラベルが..
YouTubeに「カメラで撮影」ラベルが導入されました。
このラベルはC2PA標準に基づいています。
生成AIと現実の映像を区別しやすくなります。
🎤
わずか10秒の元音声でもリアルな「なりきりボイチェン」できる無料ソフト『Seed-VC』は過去最高..
Seed-VCは短い音源で高音質なボイチェンが可能なソフトです。
RVCやVocoflexと併用して音楽制作に活用されています。
Seed-VCは簡単に使え、音声の表現を忠実に再現します。
✨
[2409.02529] Sample what you cant compress
オートエンコーダはぼやけた画像を生成しがちである。
拡散モデルは高品質な結果を生成する能力がある。
SWYCCはGANベースのオートエンコーダより優れた品質を提供する。
🚀
リンガーハットの工場で「餃子の具が多すぎる」「パッケージの印字がズレている」といった問題を..
AI画像認識システム「ディアマ」は異物検査に使用されます。
小型カメラと画像処理装置で生産ラインに導入可能です。
印字ミスや餃子の異常を200ミリ秒以内に検出します。
✨
拡散(Diffusion)モデルは実は進化計算だった|shi3z
生成AIの中心は拡散モデルで、StableDiffusionが最初の例です。
拡散モデルの学習過程は進化的アルゴリズムと等価です。
拡散進化計算は効率的に最適解に到達する可能性があります。
🚀
NVIDIA新AIモデル「Llama-3.1-Nemotron-70B-Instruct」が業界トップの性能を示す:AI開発競争が..
NVIDIAの新AIモデルが業界トップの性能を示しました。
このモデルはMetaの技術を基に強化学習を活用しています。
無料ホスティングと互換APIでAI技術の普及を促進しています。
😟
OpenAI、幹部の大量離職はなぜ起こった? CTOや技術者が抱いていた「懸念」 - ITmedia ビジネス..
OpenAIから幹部が次々と退職している。
AI安全性への懸念が退職理由の一つである。
リサーチと製品チームの対立が深刻化している。
😮
X(旧Twitter)社、利用規約変更で「ユーザーのコンテンツをAIの学習に利用しうる」ことを明記。..
X社は11月15日から利用規約を変更すると発表した。
ユーザーのコンテンツがAIの学習に利用される可能性がある。
プライバシーポリシーも変更され、情報共有の懸念が高まっている。
🤔
「9.11 > 9.9」から始めるLLMの計算間違い探索 / 開発者向けブログ・イベント | GMO Developers
LLMが「9.11と9.9はどちらが大きいか?」に誤答しました。
数値計算の理解不足がトークナイゼーションに影響される可能性があります。
生成AIを効果的に活用するには得意・不得意を理解することが重要です。
🚉
JR大宮駅、エスカレーターで歩く人を「声」で注意する実験 - Impress Watch
JR東日本は大宮駅でAIを使った実証実験を実施します。
カメラとスピーカーで歩行者を検知し音声で注意喚起します。
実験結果を基にエスカレーター事故防止策を拡大予定です。
🤖
From Documentation Chaos to Terminal Clarity: Last CLI you will need
DocsGPT-cliはドキュメントと対話するCLIツールです。
kubectlのドキュメントをアップロードして最新情報を取得可能です。
brewで簡単にインストールでき、詳細はGitHubで確認できます。
🚶♂️
エスカレーターを歩くと「ずんだもん」に注意されるのだ JR大宮駅でAIを使った実証実験 - ITmed..
JR東日本は大宮駅でエスカレーターの安全実験を開始。
AI技術で歩行者を検知し、「ずんだもん」の声で注意喚起。
実験は10月28日から12月4日まで、北側エスカレーターで実施。
✨
驚異のLLMテクノロジーentropixを8Bに拡張するとどうなったか?|shi3z
entropixを1Bから8Bに拡大し、Llama3.1を使用した。
8Bは賢いが、間違った回答をすることもある。
日本語の脚本生成はSwallowに変更すると改善された。
🤖
Boston Dynamics、ロボット開発でトヨタと提携 - PC Watch
ボストン・ダイナミクスがトヨタのTRIとロボット開発で提携。
Atlasの物理能力とTRIのAI技術を組み合わせる。
汎用ヒューマノイドロボットの開発を加速するプロジェクト。
😱
RAGベースのAIシステムを狙う新たなサイバー攻撃「ConfusedPilot」とは?:セキュリティニュース..
RAGベースのAIシステムに新たな攻撃「ConfusedPilot」が登場。
悪意のあるコンテンツでAIの応答を誤情報に変える手法。
大規模企業でのリスクが高く、長期的影響が懸念される。
📄
「EmEditor」の強力な生成AI活用機能を解説したPDFが無償公開 - Book Watch/ニュース - 窓の杜
Emurasoftは生成AI機能を解説したPDFを無償公開しました。
PDFは文書作成やコーディングの効率化方法を網羅しています。
AIツールバーのテキスト処理や予測提案機能を詳しく説明しています。
📞
Summarize call transcriptions securely with Amazon Transcribe and Amazon Bedrock Guardrail..
AWSブログで通話文字起こしの安全な要約方法を紹介。
音声記録の自動化で手間を省き迅速に洞察を得る。
プライバシーを保護しつつ効率的なプロセスを実現。
🎶
MusicAny: Free AI Music Generator
MusicAnyは音楽知識不要で高品質なMP3を作成可能なAIツールです。
多様なスタイルに対応し、コンテンツ制作者に最適です。
シンプルとカスタムモードで数分で楽曲を生成できます。
🔍
AI Image Filter for Search Results | Kagi's Docs
AI画像フィルターで本物の画像を見つけやすくします。
AI生成画像を自動で低評価し、ラベルを付けます。
特定のウェブサイトをブロックする機能もあります。
🩺
Using Amazon Q Business with AWS HealthScribe to gain insights from patient consultations ..
AWS HealthScribeで診療記録を自動生成し効率化します。
Amazon Q Businessでデータに基づく質問応答を行います。
患者の症状や治療法のトレンドを把握できます。
✨
Use Prolog to improve LLM's reasoning - Shchegrikovich LLM
LLMは推論能力を持つが、理想的ではない。
Prologはルールに基づく推論に適した言語である。
Prologを使うことでLLMの推論能力が向上する。
😲
GitHub - google-deepmind/searchless_chess: Grandmaster-Level Chess Without Search
このリポジトリは検索なしでチェスを学習する実装を提供します。
270Mパラメータのモデルで1000万のチェスゲームを学習しました。
モデルはElo2895を達成し、AlphaZeroを超える性能を示しました。
🚀
Introducing the prompt() Function: Use the Power of LLMs with SQL!
LLMの運用コストが低下し、技術が身近になりました。
SLMをSQL関数に統合することが可能になりました。
prompt()関数でテキスト生成や要約が簡素化されます。
🎧
OpenAI の Chat Completions API のオーディオ入出力を試す|npaka
Chat Completions APIのオーディオ入出力を試しました。
特定のモデルはトーンや抑揚を検出可能です。
Google Colabでのセットアップ手順を紹介します。
2024年10月18日
|
2024年10月16日
このサイトについて
/
ニュースレター
/
@AINewsDev