Loading

关于

视频硬字幕提取,生成srt文件。无需申请第三方API,本地实现文本识别。基于深度学习的视频字幕提取框架,包含字幕区域检测、字幕内容提取。A GUI tool for extracting hard-coded subtitle (hardsub) from videos and generating srt files.

创建时间
是否国产

  修改时间

2025-04-24T23:47:40Z


语言

  • Python94.6%
  • Jupyter Notebook5.3%
  • Shell0.1%


该仓库已收录但尚未编辑。项目介绍及使用教程请前往 GitHub 阅读 README


0 条讨论

登录后发表评论

YaoFANGUK 的其他开源项目

基于AI的图片/视频硬字幕去除、文本水印去除,无损分辨率生成去字幕、去水印后的图片/视频文件。无需申请第三方API,本地实现。AI-based tool for removing hard-coded subtitles and text-like watermarks from videos or Pictures.

Python6.33 k
5 天前

视频音频生成字幕,生成srt文件。无需申请第三方API,本地实现音频转文本。基于Transformer的视频字幕生成框架。A GUI tool for generating subtitle from videos and generating srt files.

Python995
1 年前🇨🇳

clash / clashX Premium 配置文件,新版clash配置教程

Shell83
6 个月前

您可能感兴趣的

基于AI的图片/视频硬字幕去除、文本水印去除,无损分辨率生成去字幕、去水印后的图片/视频文件。无需申请第三方API,本地实现。AI-based tool for removing hard-coded subtitles and text-like watermarks from videos or Pictures.

Python6.33 k
5 天前

大模型Grok-1开源

Python50.24 k
8 个月前

Open-Sora: 完全开源的高效复现类Sora视频生成方案

Python26.3 k
1 个月前

小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫、百度贴吧帖子 | 百度贴吧评论回复爬虫 | 知乎问答文章|评论爬虫

Python22.18 k
10 天前

#大语言模型#利用AI大模型,一键生成高清短视频 Generate short videos with one click using AI LLM.

Python26.42 k
3 天前

强大的少样本语音转换与语音合成Web用户界面。

Python45.67 k
5 天前

Translate the video from one language to another and add dubbing. 将视频从一种语言翻译为另一种语言,同时支持语音识别转录、语音合成、字幕翻译。

Python12.61 k
4 天前

视频音频生成字幕,生成srt文件。无需申请第三方API,本地实现音频转文本。基于Transformer的视频字幕生成框架。A GUI tool for generating subtitle from videos and generating srt files.

Python995
1 年前🇨🇳

A sound cloning tool with a web interface, using your voice or any sound to record audio / 一个带web界面的声音克隆工具,使用你的音色或任意声音来录制音频

Python8.47 k
5 个月前

上传截图通过GPT生成HTML/Tailwind/JavaScript代码

Python69.77 k
6 天前

whisper 是一个通用语音识别模型

Python80.88 k
4 个月前
krahets/hello-algo

#算法刷题#《Hello 算法》:动画图解、一键运行的数据结构与算法教程。支持 Python, Java, C++, C, C#, JS, Go, Swift, Rust, Ruby, Kotlin, TS, Dart 代码。简体版和繁体版同步更新,English version ongoing

Java112.05 k
3 天前🇨🇳

A modern GUI client based on Tauri, designed to run in Windows, macOS and Linux for tailored proxy experience

TypeScript56.52 k
2 天前

Devika is an Agentic AI Software Engineer that can understand high-level human instructions, break them down into steps, research relevant information, and write code to achieve the given objective. D...

Python18.77 k
7 个月前

#计算机科学#🐸💬 - 一个深度学习的 TTS 语言合成库

Python39.7 k
8 个月前
fastapi/full-stack-fastapi-template

#前端开发#现代化、全栈 Web 应用模板。使用FastAPI、React, SQLModel, PostgreSQL, Docker, GitHub Actions 等技术。

TypeScript32.31 k
18 小时前

High-performance GPGPU inference of OpenAI's Whisper automatic speech recognition (ASR) model

C++9.22 k
9 个月前

#大语言模型#本地化搭建和运行 Llama2 和其他大模型

Go139.05 k
4 小时前
openai-translator/openai-translator

#大语言模型#基于 ChatGPT API 的划词翻译浏览器插件和跨平台桌面端应用 - Browser extension and cross-platform desktop application for translation based on ChatGPT API.

TypeScript24.38 k
5 个月前
comfyanonymous/ComfyUI

The most powerful and modular diffusion model GUI, api and backend with a graph/nodes interface.

Python75.62 k
5 小时前