# cv21b-ocr

**Repository Path**: ykxixi/cv21b-ocr

## Basic Information

- **Project Name**: cv21b-ocr
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2021-06-12
- **Last Updated**: 2021-06-13

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

cv21b.programming05 光学字符识别练习

【数据集】
- 共65014张手写签名图片
- 下载链接：链接：https://pan.baidu.com/s/1Mzfaju7zq1Jk6zVYBp6O-g (提取码：qbow)
- 训练集
  - 图像数量：51950
  - 图像位置：train/
  - 标注文件：train.json
  - 用途：训练OCR模型
- 验证集
  - 图像数量：6540
  - 图像位置：val/
  - 标注文件：val.json
  - 用途：使用eval.py进行本地测试
- 测试集
  - 图像数量：6524
  - 图像位置：test/
  - 用途：用于最终测试，因此没有提供标注文件

【评测指标】
每张图片输出给定数量的预测字符，与真实结果按序匹配
Accuracy=正确预测字符数量/所有真实字符数量

【标注文件格式】
{<image_name>:<text>}

【任务说明】
1. 使用训练集中的数据训练模型；
2. 使用验证集中的数据调优模型；
3. 采用模型对测试集中的所有图像进行物体检测，提交zip格式，包括：
   - 结果文件命名为“学号.json”，格式同标注文件
   - 汇报幻灯片，命名为“汇报人学号+姓名”
   - 小组构成：小组成员的学号和姓名（包括代码下载链接）


* labels = Input(name='the_labels', shape=[None], dtype='float32')
* label里包含空格：6331.jpg：林瑞 文
* 默认tensorflow不是gpu，卸载tensorflow，安装tensorflow-gpu
* 第一次输出的diff：发现有标点，过滤非中文