[00298897]一种基于多层次的微博查询扩展方法
交易价格:
面议
所属行业:
分析仪器
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201510294437.5
交易方式:
技术转让
技术转让
技术入股
联系人:
华东师范大学
进入空间
所在地:上海上海市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
摘要:本发明公开了一种基于多层次的微博查询扩展方法,其特点是将原微博查询词对应的语料库PRF层和外部源的web层中提取关键词作为候选查询扩展词,将候选查询扩展词与原始微博查询语句合并作为标签集对PRF层中的文档进行标注,并利用Labeled LDA对标注的PRF文档进行语义建模,然后将来自不同源的候选查询扩展词和微博查询词映射到统一的语义层,挖掘出它们潜在的语义,并根据它们之间的语义相似度,过滤掉与微博查询词语义无关的候选扩展词,组成新的微博查询词进行更为精准的查询和检索。本发明与现有技术相比具有查询漂移少,检索效率高,准确性好,尤其将扩展词进行有效的整合,以达到最优的扩展效果,使查询结果能符合用户真实的信息需求。
摘要:本发明公开了一种基于多层次的微博查询扩展方法,其特点是将原微博查询词对应的语料库PRF层和外部源的web层中提取关键词作为候选查询扩展词,将候选查询扩展词与原始微博查询语句合并作为标签集对PRF层中的文档进行标注,并利用Labeled LDA对标注的PRF文档进行语义建模,然后将来自不同源的候选查询扩展词和微博查询词映射到统一的语义层,挖掘出它们潜在的语义,并根据它们之间的语义相似度,过滤掉与微博查询词语义无关的候选扩展词,组成新的微博查询词进行更为精准的查询和检索。本发明与现有技术相比具有查询漂移少,检索效率高,准确性好,尤其将扩展词进行有效的整合,以达到最优的扩展效果,使查询结果能符合用户真实的信息需求。