GitHub 中文社区

回车: Github搜索 Shift+回车: Google搜索

©2025 GitHub中文社区论坛 GitHub官网网站地图 GitHub官方翻译

GitHub on X
GitHub on Facebook
GitHub on LinkedIn
GitHub on YouTube
GitHub on Twitch
GitHub on TikTok
GitHub’s organization on GitHub

集合主题趋势排行榜

#

OCR

OCR(Optical Character Recognition，光学字符识别) 是指对包含文本内容的图像或视频进行处理和识别，并提取其中所包含的文字及排版信息的过程。例如，一个常见的应用是将包含文档图像的不可编辑状态的 PDF 文档通过 OCR 技术识别后，转换为可编辑状态的 Word 格式文档。

Website
Wikipedia: 维基百科

tesseract-ocr / tesseract

#计算机科学#ORC 文字识别引擎。

tesseract tesseract-ocr OCR lstm 机器学习 ocr-engine Hacktoberfest

C++ 66.07 k

16 天前

PaddlePaddle / PaddleOCR

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力使用者训练出更好的模型，并应用落地。

OCR crnn ocrlite 数据库 chineseocr

Python 48.24 k

10 天前

naptha/tesseract.js

naptha / tesseract.js

#计算机科学#纯JavaScript OCR（文字识别），能识别超过100种语言文字

tesseract WebAssembly OCR JavaScript 深度学习

JavaScript 36.34 k

5 天前

siyuan-note/siyuan

siyuan-note / siyuan

#大语言模型#思源笔记是一款隐私优先的个人知识管理系统，支持细粒度块级引用和 Markdown 所见即所得。

note-taking local-first knowledge-base Markdown s3 OCR ChatGPT openai Notion Obsidian evernote pdf webdav 自托管 Anki notes-app Electron deepseek ollama

TypeScript 33.82 k

5 小时前

ShareX/ShareX

ShareX / ShareX

#效率工具集合#ShareX 是一个截图、录屏工具。同时支持文件上传、共享等功能

screen-capture screen-recorder file-sharing file-upload url-shortener color-picker region-capture imgur dropbox gif gif-recorder OCR productivity image-annotation ftp share screenshot ShareX capture C#

C# 31.92 k

12 天前

hiroi-sora/Umi-OCR

hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片，PDF文档识别，排除水印/页眉页脚，扫描/生成二维码。内置多国语言库。

paddleocr OCR ocr-python umi-ocr qml Qt screenshot

Python 31.88 k

17 天前

opendatalab / MinerU

A high-quality tool for convert PDF to Markdown and JSON.一站式开源高质量数据提取工具，将PDF转换成Markdown和JSON格式。

extract-data layout-analysis OCR Parser pdf pdf-converter Python document-analysis pdf-parser pdf-extractor-llm pdf-extractor-pretrain pdf-extractor-rag ai4science

Python 30.4 k

8 小时前

ocrmypdf/OCRmyPDF

ocrmypdf / OCRmyPDF

为扫描的 PDF 文件添加 OCR 文本层，以方便文本搜索和复制粘贴

Python OCR pdf 图像处理 tesseract

Python 27.07 k

6 天前

paperless-ngx / paperless-ngx

#计算机科学#Paperless-ngx 是一个文档管理系统，将您的纸质文件转化为可搜索的在线存档

Angular archiving Django dms document-management document-management-system 机器学习 OCR optical-character-recognition pdf

Python 26.31 k

6 小时前

JaidedAI / EasyOCR

#计算机科学#Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc.

翻译 - 支持40种以上语言的即用型OCR，包括中文，日文，韩文和泰文

OCR 深度学习 crnn PyTorch lstm 机器学习 scene-text scene-text-recognition optical-character-recognition cnn data-mining 图像处理 Python easyocr information-retrieval

Python 26.3 k

7 个月前

lukas-blecher/LaTeX-OCR

lukas-blecher / LaTeX-OCR

#计算机科学#pix2tex: Using a ViT to convert images of equations into LaTeX code.

翻译 - pix2tex：使用 ViT 将方程图像转换为 LaTeX 代码。

机器学习 transformer im2latex 深度学习 image2text LaTeX dataset PyTorch im2markup OCR latex-ocr vit math-ocr vision-transformer 图像处理 Python im2text

Python 14.09 k

3 个月前

DayBreak-u / chineseocr_lite

超轻量级中文ocr，支持竖排文字识别, 支持ncnn、mnn、tnn推理 ( dbnet(1.8M) + crnn(2.5M) + anglenet(378KB)) 总模型仅4.7M

ncnn OCR PyTorch

C++ 12.07 k

2 年前

pot-app/pot-desktop

pot-app / pot-desktop

🌈一个跨平台的划词翻译和OCR软件 | A cross-platform software for text translation and recognition.

translation pot Tauri translate pot-app OCR Linux macOS Windows recognize tts

JavaScript 11.93 k

3 个月前

sml2h3 / ddddocr

带带弟弟通用验证码识别OCR pypi版

OCR ddddocr captcha

Python 11.47 k

3 个月前

getomni-ai / zerox

OCR & Document Extraction using vision models

TypeScript 10.89 k

12 天前

Unstructured-IO / unstructured

#自然语言处理#Open source libraries and APIs to build custom preprocessing pipelines for labeling, training, or production machine learning pipelines.

深度学习 document-parsing 机器学习自然语言处理 OCR information-retrieval data-pipelines preprocessing pdf-to-text pdf pdf-to-json document-image-analysis donut document-image-processing document-parser docx langchain 大语言模型

HTML 10.85 k

4 天前

#大语言模型#Bob 是一款 macOS 平台的翻译和 OCR 软件。

bobapp macOS OCR translate ChatGPT openai translation translator deepseek doubao ernie gemini groq kimi qwen zhipuai

9.24 k

3 个月前

tisfeng/Easydict

tisfeng / Easydict

一个简洁优雅的词典翻译 macOS App。开箱即用，支持离线 OCR 识别，支持有道词典，🍎 苹果系统词典，🍎 苹果系统翻译，OpenAI，Gemini，DeepL，Google，Bing，腾讯，百度，阿里，小牛，彩云和火山翻译。A concise and elegant Dictionary and Translator macOS App for looking up words and...

dictionary translate App macOS baidu deepl Google translator OCR shortcuts bing tencent gemini openai

Objective-C 9.04 k

4 天前

dataelement / bisheng

#大语言模型#一个大模型应用开发平台，赋能和加速大模型应用开发落地，帮助用户以最佳体验进入下一代应用开发模式。

agent 人工智能聊天机器人 rag workflow enterprise genai gpt langchian llama 大语言模型 llmdevops llmops OCR openai orchestration Python React finetune sft

Python 8.01 k

1 天前

the-paperless-project / paperless

Scan, index, and archive all of your paper documents

翻译 - 扫描，索引和存档所有纸质文档

documents Bukkit OCR archiving search

Python 7.88 k

4 年前

loading...