基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。
AiLearning: 机器学习 - MachineLearning - ML、深度学习 - DeepLearning - DL、自然语言处理 NLP
最近更新: 接近4年前一、 建立首个包含60000个藏文手写字母的开源数据库。 二、 基于深度学习的可识别手写藏文字母的模型研究,为手写输入和OCR识别提供理论支持。
最近更新: 接近4年前## 基本介绍 ``` 该工程为语种识别实现,主要用于语种识别接口发布。 开发环境python3 共支持97国语言,语种缩略说明(常见): zh 汉语 en 英语 fr 法语 ar 阿拉伯语 mn 蒙古语 de 德语 ru 俄语 es 西班牙语 ko 韩语 ja 日语 th 泰语 it 意大利语 ``` ## 开发原则 ``` * 日志规则参见utils/log.py,使用:from utils.log import * * api.py为接口实现文件,可直接运行测试,内部可指定端口 * utils/confPaser.py 配置文件读取,使用:from utils.confPaser import * * utils/result.py 返回结果定义 ``` ## 目录结构 ``` ├─ bin # 启停目录 ├─ language │ └─ lang_recognition.py # 语种识别实现 ├─ utils # 常用函数定义目录 │ └─ log.py # 日志定义 │ └─ confPaser.py # 配置文件解析 │ └─ result.py # 返回
最近更新: 4年多前