cross-modality · GitHub Topics

#计算机科学#🏄 Scalable embedding, reasoning, ranking for images and sentences with CLIP

翻译 - 使用BERT模型将可变长度句子映射到固定长度向量

bert sentence-encoding 深度学习 clip-model clip-as-service bert-as-service cross-modal-retrieval multi-modality neural-search openai PyTorch onnx cross-modality

Python 12.63 k

1 年前

THUDM / CogVLM

a state-of-the-art-level open visual language model | 多模态预训练模型

cross-modality language-model multi-modal pretrained-models visual-language-models

Python 6.47 k

10 个月前

KimMeen / Time-LLM

#计算机科学#[ICLR 2024] Official implementation of " 🦙 Time-LLM: Time Series Forecasting by Reprogramming Large Language Models"

cross-modal-learning cross-modality 深度学习 language-model large-language-models 机器学习 multimodal-deep-learning multimodal-time-series prompt-tuning time-series time-series-analysis time-series-forecasting

Python 1.93 k

5 个月前

hangzhaomit / Sound-of-Pixels

Codebase for ECCV18 "The Sound of Pixels"

翻译 - ECCV18“像素之声”的代码库

cross-modality 机器视觉 sound-separation self-supervised-learning

Python 378

3 年前

layumi / Image-Text-Embedding

TOMM2020 Dual-Path Convolutional Image-Text Embedding with Instance Loss 🐾 https://arxiv.org/abs/1711.05535

MATLAB person-reidentification image-search image-retrieval cross-modal-retrieval cross-modality

MATLAB 290

3 个月前

movienet / movienet-tools

#计算机科学#Tools for movie and video research

movie 机器视觉 video-understanding action-recognition 深度学习 vision-language cross-modality

C++ 289

3 年前

haofanwang / awesome-conditional-content-generation

#Awesome#Update-to-data resources for conditional content generation, including human motion generation, image or video generation and editing.

aigc Awesome Lists controllable-generation cross-modality diffusion-models

268

9 个月前

sail-sg / ptp

[CVPR2023] The code for 《Position-guided Text Prompt for Vision-Language Pre-training》

cross-modality vision-language-pretraining

Python 152

2 年前

bismex / Awesome-cross-modality-person-re-identification

#Awesome#Awesome Cross-modality Person Re-identification

person-reidentification person-reid Awesome Lists reid cross-modality

147

3 年前

ZYK100 / LLCM

[CVPR 2023] Diverse Embedding Expansion Network and Low-Light Cross-Modality Benchmark for Visible-Infrared Person Re-identification

cross-modality cvpr2023 dataset

Python 120

1 年前

AnjanDutta / sem-pcyc

PyTorch implementation of the paper "Semantically Tied Paired Cycle Consistency for Zero-Shot Sketch-based Image Retrieval", CVPR 2019.

zero-shot-learning cross-modality cycle-gan generative-model

Python 110

2 年前

Event-AHU / EventVOT_Benchmark

[CVPR-2024] The First High Definition (HD) Event based Visual Object Tracking Benchmark Dataset

cross-modality high-definition multi-modal single-object-tracking visual-object-tracking visual-tracking

Python 109

1 个月前

rhgao / co-separation

Co-Separating Sounds of Visual Objects (ICCV 2019)

audio-visual-learning sound-separation cross-modality

Python 94

2 年前

mangye16 / Visible-Thermal-Person-Re-Identification

Demo code for visible thermal (cross-modality) person re-identification

person-reidentification cross-modality

Python 90

6 年前

JDAI-CV / CM-NAS

CM-NAS: Cross-Modality Neural Architecture Search for Visible-Infrared Person Re-Identification (ICCV2021)

nas reid cross-modality neural-architecture-search

Python 48

4 年前

chenjingong / DN-ReID

#计算机科学#[CVPR2024]Day-Night Cross-domain Vehicle Re-identification

cross-modality cvpr2024 dataset 深度学习 re-identification

Python 38

6 个月前

workingcoder / MCJA

A New Strong and Simple Baseline Method for VI-ReID (Bridging the Gap: Multi-level Cross-modality Joint Alignment for Visible-infrared Person Re-identification)

cross-modality baseline person-reid person-reidentification re-identification reid

Python 37

1 年前

ZYK100 / MMN

Pytorch code for Towards a Unified Middle Modality Learning for Visible-Infrared Person Re-Identification

re-identification cross-modality

Python 34

9 个月前

M-3LAB / awesome-multimodal-brain-image-systhesis

#计算机科学#

cross-modality image-synthesis image-to-image-translation medical-image-processing survey 深度学习

2 年前

GuiyuZhao / VRHCF

[ICME 2024] VRHCF: Cross-Source Point Cloud Registration via Voxel Representation and Hierarchical Correspondence Filtering

cross-modality lidar

Python 26

1 年前