GitHub 中文社区

回车: Github搜索 Shift+回车: Google搜索

©2025 GitHub中文社区论坛 GitHub官网网站地图 GitHub官方翻译

GitHub on X
GitHub on Facebook
GitHub on LinkedIn
GitHub on YouTube
GitHub on Twitch
GitHub on TikTok
GitHub’s organization on GitHub

集合主题趋势排行榜

#

multimodal-models

Website
Wikipedia

uncbiag / Awesome-Foundation-Models

A curated list of foundation models for vision and language tasks

foundation-models vision-transformer large-language-models transformer-models multimodal-models

973

5 天前

YingqingHe / Awesome-LLMs-meet-Multimodal-Generation

#大语言模型#🔥🔥🔥 A curated list of papers on LLMs-based multimodal generation (image, video, 3D and audio).

aigc large-language-models large-vision-language-models multimodal-generation multimodal-large-language-models multimodal-models multimodality text-to-3d text-to-audio text-to-image text-to-speech text-to-video 大语言模型 mllm

HTML 453

9 天前

thaoshibe / awesome-personalized-lmms

#Awesome#A curated list of Awesome Personalized Large Multimodal Models resources

Awesome Lists large-language-models large-multimodal-models multimodal-models personalization personalized-generation

17

17 天前

pokarats / LAP-final-project

Multimodal Bi-Transformers (MMBT) in Biomedical Text/Image Classification

bert image-classification text-classification transfer-learning biomedical-image-processing transformer attention-mechanism multimodal-models huggingface-transformers

Jupyter Notebook 3

4 年前

antonio-f / Phi-3-Vision

#计算机科学#Phi-3-Vision model test - running locally

人工智能机器视觉 hugging-face Jupyter Notebook llms 机器学习 multimodal-learning multimodal-models phi-3-vision image-to-text

Jupyter Notebook 0

10 个月前

sitamgithub-MSIT / videollama3-litserve

#计算机科学#Leverage VideoLLaMA 3's capabilities using LitServe.

人工智能深度学习 FastAPI multimodal-models Python PyTorch transformers video-understanding

Python 0

2 个月前

sitamgithub-MSIT / gemma3-litserve

#计算机科学#Leverage Gemma 3's capabilities using LitServe.

人工智能深度学习 FastAPI gemma3 multilingual multimodal-models Python transformers

Python 0

1 个月前