A high-quality tool for convert PDF to Markdown and JSON.一站式开源高质量数据提取工具,将PDF转换成Markdown和JSON格式。
#计算机科学#A Unified Toolkit for Deep Learning Based Document Image Analysis
翻译 - 用于文档布局理解的Python库
Read and extract text and other content from PDFs in C# (port of PDFBox)
翻译 - 在C#(PdfBox的端口)中读取和提取PDF中的文本和其他内容