# cv21b-ocr **Repository Path**: ykxixi/cv21b-ocr ## Basic Information - **Project Name**: cv21b-ocr - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-06-12 - **Last Updated**: 2021-06-13 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README cv21b.programming05 光学字符识别练习 【数据集】 - 共65014张手写签名图片 - 下载链接:链接:https://pan.baidu.com/s/1Mzfaju7zq1Jk6zVYBp6O-g (提取码:qbow) - 训练集 - 图像数量:51950 - 图像位置:train/ - 标注文件:train.json - 用途:训练OCR模型 - 验证集 - 图像数量:6540 - 图像位置:val/ - 标注文件:val.json - 用途:使用eval.py进行本地测试 - 测试集 - 图像数量:6524 - 图像位置:test/ - 用途:用于最终测试,因此没有提供标注文件 【评测指标】 每张图片输出给定数量的预测字符,与真实结果按序匹配 Accuracy=正确预测字符数量/所有真实字符数量 【标注文件格式】 {:} 【任务说明】 1. 使用训练集中的数据训练模型; 2. 使用验证集中的数据调优模型; 3. 采用模型对测试集中的所有图像进行物体检测,提交zip格式,包括: - 结果文件命名为“学号.json”,格式同标注文件 - 汇报幻灯片,命名为“汇报人学号+姓名” - 小组构成:小组成员的学号和姓名(包括代码下载链接) * labels = Input(name='the_labels', shape=[None], dtype='float32') * label里包含空格:6331.jpg:林瑞 文 * 默认tensorflow不是gpu,卸载tensorflow,安装tensorflow-gpu * 第一次输出的diff:发现有标点,过滤非中文