[01431403]THOCR-90实用多字体多字号混合版面印刷体汉字识别系统
交易价格:
面议
所属行业:
印刷
类型:
非专利
交易方式:
资料待完善
联系人:
所在地:
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
该系统采用基于汉字微结构特征及动态匹配方法,有效地解决了单一字库识别多种字体(宋、仿宋、黑、楷四大字体及其长宽粗细等多变形字体)的识别问题。它采用无级归一化方法,解决了所有字号汉字的混排识别;采用二次回切割法,初步解决了汉字、字符、标点的切割;采用二次扫描的自动搜索版面分析,使系统实现了杂志、报纸版面的自动分割、链接和属性标准,提出了二维表格分割算法,使简单二维表格数据库能自动录入。该系统还扩大了扫描输入的方式,提供了友好的人机界面,具有实用价值。
该系统采用基于汉字微结构特征及动态匹配方法,有效地解决了单一字库识别多种字体(宋、仿宋、黑、楷四大字体及其长宽粗细等多变形字体)的识别问题。它采用无级归一化方法,解决了所有字号汉字的混排识别;采用二次回切割法,初步解决了汉字、字符、标点的切割;采用二次扫描的自动搜索版面分析,使系统实现了杂志、报纸版面的自动分割、链接和属性标准,提出了二维表格分割算法,使简单二维表格数据库能自动录入。该系统还扩大了扫描输入的方式,提供了友好的人机界面,具有实用价值。