visual-prompting · GitHub Topics

[CVPR2024] ViP-LLaVA: Making Large Multimodal Models Understand Arbitrary Visual Prompts

聊天机器人 clip foundation-models gpt-4 gpt-4-vision llama llama2 llava multi-modal vision-language visual-prompting cvpr2024

Python 318

9 个月前

hjbahng / visual_prompting

Exploring Visual Prompts for Adapting Large-Scale Models

pre-trained-model prompt-tuning PyTorch visual-prompting transfer-learning

Python 277

3 年前

ZhangYuanhan-AI / NOAH

#计算机科学#[TPAMI] Searching prompt modules for parameter-efficient transfer learning.

prompt-tuning transfer-learning domain-generalization visual-prompting pre-trained-model PyTorch 深度学习

Python 228

1 年前

JieShibo / PETL-ViT

[ICCV 2023 & AAAI 2023] Binary Adapters & FacT, [Tech report] Convpass

PyTorch transfer-learning visual-prompting parameter-efficient-tuning

Python 181

2 年前

ZhangYuanhan-AI / visual_prompt_retrieval

[NeurIPS2023] Official implementation and model release of the paper "What Makes Good Examples for Visual In-Context Learning?"

in-context-learning prompt visual-prompting

Python 173

1 年前

changdaeoh / BlackVIP

Official implementation for CVPR'23 paper "BlackVIP: Black-Box Visual Prompting for Robust Transfer Learning"

foundation-models parameter-efficient-tuning prompt-tuning transfer-learning visual-prompting

Python 110

2 年前

WisconsinAIVision / visii

👀 Visual Instruction Inversion: Image Editing via Visual Prompting (NeurIPS 2023)

diffusion-models image-editing visual-prompting image-manipulation neurips

Python 89

1 年前

yu-rp / apiprompting

[ECCV 2024] API: Attention Prompting on Image for Large Vision-Language Models

large-multimodal-models large-vision-language-model large-vision-language-models prompting vision-language-model visual-prompting

Python 82

6 个月前

bighuang624 / VoP

[CVPR 2023] VoP: Text-Video Co-operative Prompt Tuning for Cross-Modal Retrieval

parameter-efficient-tuning prompt-tuning transfer-learning visual-prompting cvpr2023

2 年前

IBM / AutoVP

[ICLR24] AutoVP: An Automated Visual Prompting Framework and Benchmark

efficient-inference finetuning visual-prompt visual-prompting foundation-models

Python 18

1 年前

JinhaoLee / WCA

#计算机科学#[ICML 2024] Visual-Text Cross Alignment: Refining the Similarity Score in Vision-Language Models

vision-language-model 深度学习 image-text-matching large-language-models visual-prompting zero-shot-classification

Python 17

7 个月前

gaotiexinqu / V2P-Bench

V2P-Bench: Evaluating Video-Language Understanding with Visual Prompts for Better Human-Model Interaction

large-vision-language-models mme multimodal-large-language-models Video visual-prompting

24 天前

MSchnei / visprompt

A simple GUI for experimenting with visual prompting

sam seggpt segmentation visual-prompting

Python 3

1 年前

olivesgatech / PointPrompt

[IEEE BigData'24] Code used in Paper "Benchmarking Human and Automated Prompting in the Segment Anything Model"

dataset segment-anything visual-prompting

Python 2

5 个月前

afondiel / Prompt-Engineering-for-Vision-Models-DeepLearningAI

These notes and resources are compiled from the crash course Prompt Engineering for Vision Models offered by DeepLearning.AI.

diffusion-models prompt-engineering visual-prompting vit cnn large-vision-language-models vision-language-model 图像处理 video-processing 机器视觉 fine-tuning generative-models

Jupyter Notebook 1

8 个月前