[00249849]基于K邻域相似性的数据聚类方法、装置和存储介质
交易价格:
面议
所属行业:
硬件/数码
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201810037867.2
交易方式:
技术转让
技术转让
技术入股
联系人:
科小易
进入空间
所在地:福建厦门市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明公开了一种基于K邻域相似性的数据聚类方法,基于待聚类数据点的K邻域最大半径即按密度对待聚类数据点进行排序,对升序排序后的数据点进行第一遍循环,以符合统计相似性的数据点并入到同个聚类中;根据聚类所需规模对聚类密度较小的数据点进行第二遍循环,找出所有噪声点以及将非噪声点合并到最近的大密度聚类中,从而实现数据聚类。利用本发明实施例提供的基于K邻域相似性的数据聚类方法进行数据聚类带有如下技术效果:无需预先设定聚类的个数,无需知道数据的概率分布;参数容易设置,且各个参数的设置都与数据的密度分布和距离尺度无关;聚类的形成是由高密度到低密度逐渐合并而成的,在产生聚类的同时给出了聚类之间的层次关系。
本发明公开了一种基于K邻域相似性的数据聚类方法,基于待聚类数据点的K邻域最大半径即按密度对待聚类数据点进行排序,对升序排序后的数据点进行第一遍循环,以符合统计相似性的数据点并入到同个聚类中;根据聚类所需规模对聚类密度较小的数据点进行第二遍循环,找出所有噪声点以及将非噪声点合并到最近的大密度聚类中,从而实现数据聚类。利用本发明实施例提供的基于K邻域相似性的数据聚类方法进行数据聚类带有如下技术效果:无需预先设定聚类的个数,无需知道数据的概率分布;参数容易设置,且各个参数的设置都与数据的密度分布和距离尺度无关;聚类的形成是由高密度到低密度逐渐合并而成的,在产生聚类的同时给出了聚类之间的层次关系。