[00298894]基于统计与模板匹配的领域概念自动抽取精化方法及系统
交易价格:
面议
所属行业:
分析仪器
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201610307269.3
交易方式:
技术转让
技术转让
技术入股
联系人:
华东师范大学
进入空间
所在地:上海上海市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
摘要:本发明公开了一种基于统计与模板匹配的领域概念自动抽取与精化方法,该方法包括:对领域文档中的内容进行分类;针对分类的标题和摘要,通过匹配得到符合“是一个”模式的匹配内容;对匹配内容进行预处理,并提取文档内容中的术语抽取规则和术语词性构成规则;根据术语抽取规则,抽取匹配内容中的知识点,并根据术语词性构成规则对知识点进行初步过滤,加入领域知识点;计算领域知识点中各知识点的词频以及术语领域相关程度,并根据词频和相关程度进行二次过滤,输出结果。本发明在保证一定准确率的前提下最大程度的实现了此过程的自动化,很大程度上提高了知识点抽取的效率,能最大限度的节约人力成本。本发明公开了领域概念自动抽取与精化系统。
摘要:本发明公开了一种基于统计与模板匹配的领域概念自动抽取与精化方法,该方法包括:对领域文档中的内容进行分类;针对分类的标题和摘要,通过匹配得到符合“是一个”模式的匹配内容;对匹配内容进行预处理,并提取文档内容中的术语抽取规则和术语词性构成规则;根据术语抽取规则,抽取匹配内容中的知识点,并根据术语词性构成规则对知识点进行初步过滤,加入领域知识点;计算领域知识点中各知识点的词频以及术语领域相关程度,并根据词频和相关程度进行二次过滤,输出结果。本发明在保证一定准确率的前提下最大程度的实现了此过程的自动化,很大程度上提高了知识点抽取的效率,能最大限度的节约人力成本。本发明公开了领域概念自动抽取与精化系统。