编程语言

”textvqa“ 的搜索结果

A Pytorch implementation of CVPR 2020 paper: Multi-Modal Graph Neural Network for Joint Reasoning on Vision and Scene Text

gnn vqa PyTorch

Python50

2 年前

Google Bing GitHub

sam-textvqa

@yashkant

Official code for paper "Spatially Aware Multimodal Transformers for TextVQA" published at ECCV, 2020.

eccv textvqa vision language

Python64

4 年前

TextVQA存档

@facebookresearch • Meta

Website for TextVQA dataset.

JavaScript28

2 年前

mmf

@facebookresearch • Meta

#计算机科学#A modular framework for vision & language multimodal research from Facebook AI Research (FAIR)

PyTorch vqa pretrained-models multimodal 深度学习

Python5.58 k

3 个月前

textvqa_grounding_task_qwen2.5-vl-ft

@828Tina

Jupyter Notebook29

2 个月前

ssbaseline

@ZephyrZhuQi

Simple is not Easy: A Simple Strong Baseline for TextVQA and TextCaps[AAAI2021]

Python57

3 年前

SMA

@ChenyuGAO-CS

内容违规，已屏蔽

Python11

4 年前

Awesome-MLLM-TextVQA

@zhousheng97

✨✨Latest Research on Multimodal Large Language Models on Scene-Text VQA Tasks

3 个月前

mlci

@zhangshengHust

mlci model for textvqa

Jupyter Notebook4

4 年前

stvqa_amazon_ocr

@furkanbiten

STVQA and TextVQA OCR results from Amazon Text in Image pipeline

Jupyter Notebook11

3 年前

编程语言

”textvqa“ 的搜索结果

相关主题