今日のHuggingFaceトレンド rhymes-ai/Aria このリポジトリはAriaモデルに関する情報を提供します。 ベンチマーク結果や関連論文、ブログ記事へのリンクなどを掲載しています。 モデルの使用方法に関する詳細は、リンク先を参照してください。
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
今日のHuggingFaceトレンド black-forest-labs/FLUX.1-dev 本リポジトリは、120億パラメータの画像生成モデルFLUX.1 [dev]を提供します。 サンプルコードや使用方法が記載されており、ComfyUIやdiffusersライブラリにも対応しています。 ライセンスに同意の上、個人、研究、商用利用が可能です。
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
今日のHuggingFaceトレンド nvidia/NVLM-D-72B このリポジトリは、最先端のマルチモーダル大規模言語モデルNVLM-1.0-D-72Bの重みとコードを提供します。 Hugging FaceとMegatron両方のコードベースでの推論コードとベンチマーク結果を含みます。 論文と関連リソースへのリンクも掲載しています。
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
今日のHuggingFaceトレンド rain1011/pyramid-flow-sd3 このリポジトリは、Flow Matchingに基づく効率的な自動回帰ビデオ生成モデルPyramid Flowを提供します。 conda環境構築後、Hugging Faceからモデルをダウンロードし、`video_generation_demo.ipynb`のコードに従って実行することで、テキストまたは画像から高画質ビデオを生成できます。 10秒(768p)または5秒(384p)のビデオ生成に対応しています。
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
今日のHuggingFaceトレンド openai/whisper-large-v3-turbo このリポジトリは、高速な音声認識モデルWhisper large-v3-turboを提供しています。 Hugging Face Transformersライブラリを用いて、簡単に音声データのテキスト化が可能です。 必要なライブラリをインストール後、pipelineクラスを使って音声ファイルを処理できます。
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
今日のHuggingFaceトレンド stepfun-ai/GOT-OCR2_0 このリポジトリは、Hugging Face Transformersを用いたOCRモデルを提供します。 NVIDIA GPU上で動作し、画像からテキストを抽出する推論を実行できます。 `transformers`ライブラリを用いた簡単なPythonコードで利用可能です。
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
今日のHuggingFaceトレンド meta-llama/Llama-3.2-11B-Vision-Instruct このリポジトリはLlama 3.2の大規模言語モデルと関連ドキュメントを提供します。 利用にはMetaのプライバシーポリシーとライセンス契約への同意が必要です。 詳細なライセンス条項と使用方法については、READMEと提供されているドキュメントをご確認ください。
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
今日のHuggingFaceトレンド jxm/cde-small-v1 このリポジトリは、MTEBベンチマークの結果を格納しています。 AmazonレビューやArguAnaデータセットを用いた分類タスクの評価指標が記録されています。 各タスクの構成、モデル、評価指標を確認できます。
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
今日のHuggingFaceトレンド apple/DepthPro このリポジトリは、高速で高精度な単眼深度推定モデルDepth Proを提供します。 Huggingface Hubからモデルをダウンロードし、付属のスクリプトを用いて画像への深度推定を実行できます。 詳細はREADMEと論文を参照してください。
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
今日のHuggingFaceトレンド ostris/OpenFLUX.1 このリポジトリは、FLUX.1-schnellモデルを改良したテキストから画像を生成するモデルを提供します。 蒸留済みモデルではないため、自由に微調整できます。 `open_flux_pipeline.py`を用いて、CFG値(例:3.5)を指定することで画像生成が可能です。
We’re on a journey to advance and democratize artificial intelligence through open source and open science.