Official code for BEVDepth.
All-in-one Toolbox for Computer Vision Research.
End-to-End Object Detection with Fully Convolutional Network
翻译 - End-to-End Object Detection with Fully Convolutional Network
实时目标检测 - YOLOv9 论文实现:Learning What You Want to Learn Using Programmable Gradient Information
Detectron2 is a platform for object detection, segmentation and other visual recognition tasks.
翻译 - Detectron2是FAIR的下一代对象检测和分割平台。
Open-Sora: 完全开源的高效复现类Sora视频生成方案
#计算机科学#YOLOv3 in PyTorch > ONNX > CoreML > TFLite
翻译 - PyTorch中的YOLOv3> ONNX> CoreML> iOS
#IOS#YOLOv5 🚀 是在 COCO 数据集上预训练的一系列对象检测架构和模型,代表 Ultralytics 对未来视觉 AI 方法的开源研究,结合了经过数千小时研究和开发的经验教训和最佳实践。
Industry leading face manipulation platform
#计算机科学#DAMO-YOLO: a fast and accurate object detection method with some new techs, including NAS backbones, efficient RepGFPN, ZeroHead, AlignedOTA, and distillation enhancement.
Garnet 是一个微软开源的高性能的缓存服务器,可兼容现有的Redis Client
The #1 open-source voice interface for desktop, mobile, and ESP32 chips.
MMDetection3D 是一个基于 PyTorch 的目标检测开源工具箱, 下一代面向3D检测的平台. 它是 OpenMMlab 项目的一部分,这个项目由香港中文大学多媒体实验室和商汤科技联合发起.
#大语言模型#Open Interpreter(开放解释器) 可以让大语言模型(LLMs)在本地运行代码(比如 Python、JavaScript、Shell 等)。安装后,在终端上运行 $ interpreter 即可通过类似 ChatGPT 的界面与 Open Interpreter 聊天。
Zero-Shot Speech Editing and Text-to-Speech in the Wild
[CVPR 2024] Real-Time Open-Vocabulary Object Detection
#计算机科学#PyTorch implementation of the U-Net for image semantic segmentation with high quality images
翻译 - U-Net的PyTorch实现,用于高质量图像的图像语义分割
Python bindings for llama.cpp
#自然语言处理#RAGFlow 是一款基于深度文档理解构建的开源 RAG(Retrieval-Augmented Generation)引擎