”vision-language“ 的搜索结果

moondream

@vikhyat

tiny vision language model

Python8.44 k

2 天前

Google Bing GitHub

sglang

@sgl-project

#大语言模型#SGLang is a fast serving framework for large language models and vision language models.

CUDA inference llama llava 大语言模型

Python18.03 k

1 小时前

LAVIS

Salesforce@salesforce

#计算机科学#LAVIS - A One-stop Library for Language-Vision Intelligence

深度学习 deep-learning-library image-captioning salesforce vision-and-language

Jupyter Notebook10.91 k

10 个月前

awesome-vision-language-pretraining-papers

@yuewang-cuhk

Recent Advances in Vision and Language PreTrained Models (VL-PTMs)

vision-and-language pretraining multimodal-deep-learning bert

1.16 k

3 年前

VLM_survey

@jingyi0000

#计算机科学#Collection of AWESOME vision-language models for vision tasks

机器视觉深度学习 knowledge-distillation survey transfer-learning

2.93 k

4 个月前

DeepSeek-VL

@deepseek-ai

DeepSeek-VL: Towards Real-World Vision-Language Understanding

vision-language-model vision-language-pretraining foundation-models

Python3.96 k

1 年前

DeepSeek-VL2

@deepseek-ai

DeepSeek-VL2: Mixture-of-Experts Vision-Language Models for Advanced Multimodal Understanding

Python5.05 k

7 个月前

vilbert-multi-task存档

@facebookresearch • Meta

Multi Task Vision and Language

Jupyter Notebook818

4 年前

awesome-vision-and-language

@sangminwoo

#Awesome#A curated list of awesome vision and language resources (still under construction... stay tuned!)

Awesome Lists vision-and-language multimodal-learning

549

10 个月前

BLIP

Salesforce@salesforce

PyTorch code for BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation

vision-language vision-and-language-pre-training image-text-retrieval image-captioning visual-question-answering

Jupyter Notebook5.49 k

1 年前

BriVL

@BAAI-WuDao

Bridging Vision and Language Model

Python276

2 年前

awesome-vlm-architectures

@gokayfem

#Awesome#Famous Vision Language Models and Their Architectures

clip llava vlm

Markdown1.01 k

7 个月前

VSA

@cnzzx

#计算机科学#Vision Search Assistant: Empower Vision-Language Models as Multimodal Search Engines

ai-search-engine 人工智能深度学习大语言模型 search

Python126

10 个月前

CONCH

@mahmoodlab

Vision-Language Pathology Foundation Model - Nature Medicine

foundation-model

Python409

6 个月前

LongVA

@EvolvingLMMs-Lab

Long Context Transfer from Language to Vision

Python393

6 个月前

ml-fastvlm

苹果公司@apple

This repository contains the official implementation of "FastVLM: Efficient Vision Encoding for Vision Language Models" - CVPR 2025

Python6.49 k

4 个月前

Awesome_Prompting_Papers_in_Computer_Vision

@ttengwang

A curated list of prompt-based paper in computer vision and vision-language learning.

prompt-learning adapter few-shot-learning prompt-tuning zero-shot-learning

923

2 年前

tirg

谷歌公司@google

deep learning, image retrieval, vision and language

Python305

4 年前

dots.ocr

@rednote-hilab

Multilingual Document Layout Parsing in a Single Vision-Language Model

Python4.36 k

11 天前

NaVILA-Bench

@yang-zj1026

Vision-Language Navigation Benchmark in Isaac Lab

Python239

22 天前

VLM-Visualizer

@zjysteven

Visualizing the attention of vision-language models

attention attention-mechanism llava multi-modal vision-language

Jupyter Notebook230

7 个月前

VL-RLHF

@TideDra

#大语言模型#A RLHF Infrastructure for Vision-Language Models

dpo 大语言模型 lmm mllm rlhf

Python183

10 个月前

MobileVLM

@Meituan-AutoML

Strong and Open Vision Language Assistant for Mobile Devices

Python1.27 k

1 年前

编程语言

”vision-language“ 的搜索结果

相关主题