X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
关于我们
欢迎来到科易网(仲恺)技术转移协同创新平台,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
成果 专家 院校 需求
当前位置: 首页 >  科技成果  > 详细页

[00272941]一种面向大数据的信息补全方法

交易价格: 面议

所属行业: 分析仪器

类型: 发明专利

技术成熟度: 正在研发

专利所属地:中国

专利号:CN201710156391.X

交易方式: 技术转让 技术转让 技术入股

联系人: 南京邮电大学

进入空间

所在地:江苏南京市

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述
|
收藏
|

技术详细介绍

本发明公开了一种面向大数据的信息补全方法,该方法充分利用缺失数据的特点缺失数据的取值和它所在元组中其他属性或者属性组合取值即证据链有关,通过挖掘每条有缺失数据的元组中缺失数据所有的相关证据,综合这些相关证据成为估计缺失属性取值的证据链,最后通过证据链来估计缺失数据的取值。由于直接从原有的数据集中计算缺失数据相关证据链来预测缺失值得取值,所以本发明在填充缺失值时不仅拥有高的填充准确率和抗缺失率,而且简单易行,不需要掌握数据集中数据的分布,领域知识,也不需要在数据集上训练估计模型,为补全数据节省大量的时间。本分明可以基于Map‑Reduce分布式编程框架运行,可以分布式补全大规模数据集。
本发明公开了一种面向大数据的信息补全方法,该方法充分利用缺失数据的特点缺失数据的取值和它所在元组中其他属性或者属性组合取值即证据链有关,通过挖掘每条有缺失数据的元组中缺失数据所有的相关证据,综合这些相关证据成为估计缺失属性取值的证据链,最后通过证据链来估计缺失数据的取值。由于直接从原有的数据集中计算缺失数据相关证据链来预测缺失值得取值,所以本发明在填充缺失值时不仅拥有高的填充准确率和抗缺失率,而且简单易行,不需要掌握数据集中数据的分布,领域知识,也不需要在数据集上训练估计模型,为补全数据节省大量的时间。本分明可以基于Map‑Reduce分布式编程框架运行,可以分布式补全大规模数据集。

推荐服务:

Copyright © 2015 科易网 版权所有 闽ICP备07063032号-5