OpenAI Whisper语音识别模型,C++移植版本。
#计算机科学#DeepSpeech 是一款开源嵌入式(离线、设备上)语音识别引擎,最低可以在树莓派上运行
🧠 Leon is your open-source personal assistant.
翻译 - 🧠Leon是您的开源个人助理。
#计算机科学#Faster Whisper transcription with CTranslate2
kaldi-asr/kaldi is the official location of the Kaldi project.
翻译 - 这是Kaldi项目的正式所在地。
WhisperX: Automatic Speech Recognition with Word-level Timestamps (& Diarization)
Translate the video from one language to another and add dubbing. 将视频从一种语言翻译为另一种语言,同时支持语音识别转录、语音合成、字幕翻译。
#计算机科学#A PyTorch-based Speech Toolkit
翻译 - 基于Pytorch的语音工具包
#安卓#Vosk 是一个离线的语言识别工具。支持 Python, Java, Node.JS, C#, C++ ,能识别20+种语言,包括中文、英语、法语等。
Speech recognition module for Python, supporting several engines and APIs, online and offline.
翻译 - 适用于Python的语音识别模块,支持在线和离线的多个引擎和API。
A Deep-Learning-Based Chinese Speech Recognition System 基于深度学习的中文语音识别系统
💬 Speech recognition for your site
翻译 - :speech_balloon:您网站的语音识别
A robust, efficient, low-latency speech-to-text library with advanced voice activity detection, wake word activation and instant transcription.
#安卓#Sherpa-ONNX 是一个轻量级语音识别框架, 基于 Kaldi 和 onnxruntime,无需联网即可实现语音转文本、文本转语音、说话人分离以及语音活动检测(VAD)。支持嵌入式系统、安卓、iOS、鸿蒙系统、树莓派、RISC-V、x86_64 服务器、WebSocket 服务器 / 客户端,以及 C/C++、Python、Kotlin、C#、Go、NodeJS、Java、Swift、Dart、JavaScript、Flutter、Object Pascal、Lazarus、Rust 等编程语言。
Silero Models: pre-trained speech-to-text, text-to-speech and text-enhancement models made embarrassingly simple
翻译 - Silero模型:经过预先训练的STT模型和基准测试非常简单
#大语言模型#Multilingual Voice Understanding Model
#计算机科学#JAX implementation of OpenAI's Whisper model for up to 70x speed-up on TPU.
#大语言模型#Open-source, accurate and easy-to-use video speech recognition & clipping tool, LLM based AI clipping intergrated.
Automatic Speech Recognition with Speaker Diarization based on OpenAI Whisper
#计算机科学#Speech To Speech: an effort for an open-sourced and modular GPT4-o