当前位置：首页 > 科技成果 > 详细页

[00287966]一种MapReduce并行化大数据文本分类方法

交易价格： 面议

所属行业： 网络

类型： 发明专利

技术成熟度： 正在研发

专利所属地：中国

专利号：201510297189.X

交易方式： 技术转让

联系人：刘姣姣

进入空间

所在地：陕西西安市

服务承诺: 产权明晰; 资料保密
对所交付的所有资料进行保密; 如实描述

登录后向技术服务商咨询

发布技术需求服务免费，交易还可领红包哦

技术详细介绍

一种MapReduce并行化大数据文本分类方法，包括如下步骤：第一步：建立用于文本分类的基准测试数据集，进行数据预处理，包括分词、去停用词、词根还原；将该基准测试数据集随机划分为训练文本和测试文本，将所述基准测试数据集采用向量空间模型建立文本表示模型；第二步：根据上述文本表示模型采用CDMT对所述基准测试数据集进行特征选择；第三步：采用贝叶斯分类器对所述基准测试数据集进行训练学习，得到分类结果。本发明提供一种分类性能良好、区分度较高的MapReduce并行化大数据文本分类方法。

[00287966]一种MapReduce并行化大数据文本分类方法

技术详细介绍

推荐服务：