”vision-and-language“ 的搜索结果

sglang

@sgl-project

#大语言模型#SGLang is a fast serving framework for large language models and vision language models.

CUDA inference llama llava 大语言模型

Python15.93 k

1 小时前

Google Bing GitHub

awesome-vision-and-language

@sangminwoo

#Awesome#A curated list of awesome vision and language resources (still under construction... stay tuned!)

Awesome Lists vision-and-language multimodal-learning

540

8 个月前

vilbert-multi-task存档

@facebookresearch • Meta

Multi Task Vision and Language

Jupyter Notebook813

3 年前

BLIP

Salesforce@salesforce

PyTorch code for BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation

vision-language vision-and-language-pre-training image-text-retrieval image-captioning visual-question-answering

Jupyter Notebook5.38 k

1 年前

ViLT

@dandelin

Code for the ICML 2021 (long talk) paper: "ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision"

vision-and-language

Python1.48 k

1 年前

awesome-Vision-and-Language-Pre-training

@phellonchen

Recent Advances in Vision and Language Pre-training (VLP)

vision-and-language-pre-training vision-and-language pretraining multimodal-deep-learning

292

2 年前

Pretrain-Vision-and-Large-Language-Models-in-Python

Packt@PacktPublishing

Pretrain Vision and Large Language Models in Python, Published by Packt

Jupyter Notebook88

2 年前

tirg

谷歌公司@google

deep learning, image retrieval, vision and language

Python305

4 年前

MobileVLM

@Meituan-AutoML

Strong and Open Vision Language Assistant for Mobile Devices

Python1.24 k

1 年前

awesome-vlm-architectures

@gokayfem

#Awesome#Famous Vision Language Models and Their Architectures

clip llava vlm

Markdown921

5 个月前

BriVL

@BAAI-WuDao

Bridging Vision and Language Model

Python276

2 年前

moondream

@vikhyat

tiny vision language model

Python8.19 k

21 天前

VLM_survey

@jingyi0000

#计算机科学#Collection of AWESOME vision-language models for vision tasks

机器视觉深度学习 knowledge-distillation survey transfer-learning

2.83 k

2 个月前

Awesome_Prompting_Papers_in_Computer_Vision

@ttengwang

A curated list of prompt-based paper in computer vision and vision-language learning.

prompt-learning adapter few-shot-learning prompt-tuning zero-shot-learning

921

2 年前

awesome-vision-language-navigation

@eric-ai-lab

A curated list for vision-and-language navigation. ACL 2022 paper "Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions"

vision-and-language navigation embodied-agent

514

1 年前

vilmedic

@jbdel

ViLMedic (Vision-and-Language medical research) is a modular framework for vision and language multimodal research in the medical field

Python168

6 个月前

awesome-vision-language-pretraining-papers

@yuewang-cuhk

Recent Advances in Vision and Language PreTrained Models (VL-PTMs)

vision-and-language pretraining multimodal-deep-learning bert

1.15 k

3 年前

VLN-CE

@jacobkrantz

#计算机科学#Vision-and-Language Navigation in Continuous Environments using Habitat

人工智能机器视觉 Robotics 深度学习 research

Python459

6 个月前

Thinking-VLN

@YicongHong

Ideas and thoughts about the fascinating Vision-and-Language Navigation

234

2 年前

VLP

@LuoweiZhou

Vision-Language Pre-training for Image Captioning and Question Answering

Python419

3 年前

Awesome-Foundation-Models

@uncbiag

A curated list of foundation models for vision and language tasks

foundation-models vision-transformer large-language-models transformer-models multimodal-models

1.05 k

18 天前

LAVIS

Salesforce@salesforce

#计算机科学#LAVIS - A One-stop Library for Language-Vision Intelligence

深度学习 deep-learning-library image-captioning salesforce vision-and-language

Jupyter Notebook10.73 k

8 个月前

DeepSeek-VL

@deepseek-ai

DeepSeek-VL: Towards Real-World Vision-Language Understanding

vision-language-model vision-language-pretraining foundation-models

Python3.91 k

1 年前

编程语言

”vision-and-language“ 的搜索结果

相关主题