# pdfocr **Repository Path**: icefairy/pdfocr ## Basic Information - **Project Name**: pdfocr - **Description**: 这是一个利用目前最新ppocr内核封装实现的一款主要实现将图片类型pdf转换成文本内容pdf的工具。 本程序主要用来快速的将一些影印电子书籍转换为文本,方便阅读与修改,根据输入文件的清晰度不同识别效果不同,如果识别出来的结果有误请自行校正。 基于python开发,理论上支持所有系统; 本程序ocr过程调用cpu进行运算,不依赖gpu,支持完全离线模式运行。 - **Primary Language**: Unknown - **License**: GPL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2025-03-07 - **Last Updated**: 2025-05-03 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # pdfocr 这是一个利用目前最新ppocr内核封装实现的一款主要实现将图片类型pdf转换成文本内容pdf的工具。 本程序主要用来快速的将一些影印电子书籍转换为文本,方便阅读与修改,根据输入文件的清晰度不同识别效果不同,如果识别出来的结果有误请自行校正。 基于python开发,理论上支持所有系统; 本程序ocr过程调用cpu进行运算,不依赖gpu,支持完全离线模式运行。 ## 其他 默认字体采用的文泉驿的雅黑字体,如需更换可以直接替换fonts文件夹中的字体文件即可。