[00374593]数学公式图像的结构分析、理解与重现
交易价格:
面议
所属行业:
软件
类型:
非专利
交易方式:
资料待完善
联系人:
所在地:
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
该研究成果来源于天津市自然科学基金应用基础计划面上项目的资助,其研究内容覆盖了印刷体/手写体表达式识别,表达式结构描述与重现,基于表达式的复杂应用等多个难点,实现了以下创新性的工作。1.建立了针对印刷体数学公式图像的完整识别流程,针对数学公式定位、符号切分、符号识别、结构理解、格式转化等技术难点进行了科研攻关,实现了完整的核心技术体系和应用软件解决方案。2.建立了较为通用的表达式结构描述与分析理解方法模型,针对数学公式、化学方程式两类最常用的表达式进行了大量实验研究,并搭建了数学公式和中学教育中化学方程式的两类大规模底层知识库,为表达式的自动处理和广泛应用积累经验。3.设计并实现了针对表达式编辑、结构重现、自动检索等应用方法,已经能够实现针对数学公式和化学方程式的半结构化查询,实现了符号-子表达式-表达式多级内容查询与检索的技术机制。该项目的研究工作带动了其他相关领域的发展,针对表达式符号识别方法的研究推动了ANN分类器的研究工作,针对手写体表达式符号识别方法的研究带动了化学方程式自动处理方法的研究,针对表达式结构查询与应用的研究推动了DeepWeb搜索以及半结构化数据存储与查询方法的研究工作。立足于该项目的研究成果,课题组成功获得微软亚洲研究院两期项目资助,先后获得资金16万元用于表达式识别的研究工作。正在申请专利1项,软件著作权1项。已经培养硕士毕业生10人,本科毕业生6人,正在培养硕士生5人,博士生1人。该项目的研究成果正在进行产业化工作,主要分为两个方面:1)将印刷体数学公式的自动识别与结构分析中间件以独立产品的形式进行销售,或集成到成熟的OCR软件产品中;2)针对手写公式的研究成果将转化为支撑科研、教育的新型辅助软件工具,在国内教育市场推广。
该研究成果来源于天津市自然科学基金应用基础计划面上项目的资助,其研究内容覆盖了印刷体/手写体表达式识别,表达式结构描述与重现,基于表达式的复杂应用等多个难点,实现了以下创新性的工作。1.建立了针对印刷体数学公式图像的完整识别流程,针对数学公式定位、符号切分、符号识别、结构理解、格式转化等技术难点进行了科研攻关,实现了完整的核心技术体系和应用软件解决方案。2.建立了较为通用的表达式结构描述与分析理解方法模型,针对数学公式、化学方程式两类最常用的表达式进行了大量实验研究,并搭建了数学公式和中学教育中化学方程式的两类大规模底层知识库,为表达式的自动处理和广泛应用积累经验。3.设计并实现了针对表达式编辑、结构重现、自动检索等应用方法,已经能够实现针对数学公式和化学方程式的半结构化查询,实现了符号-子表达式-表达式多级内容查询与检索的技术机制。该项目的研究工作带动了其他相关领域的发展,针对表达式符号识别方法的研究推动了ANN分类器的研究工作,针对手写体表达式符号识别方法的研究带动了化学方程式自动处理方法的研究,针对表达式结构查询与应用的研究推动了DeepWeb搜索以及半结构化数据存储与查询方法的研究工作。立足于该项目的研究成果,课题组成功获得微软亚洲研究院两期项目资助,先后获得资金16万元用于表达式识别的研究工作。正在申请专利1项,软件著作权1项。已经培养硕士毕业生10人,本科毕业生6人,正在培养硕士生5人,博士生1人。该项目的研究成果正在进行产业化工作,主要分为两个方面:1)将印刷体数学公式的自动识别与结构分析中间件以独立产品的形式进行销售,或集成到成熟的OCR软件产品中;2)针对手写公式的研究成果将转化为支撑科研、教育的新型辅助软件工具,在国内教育市场推广。