首页热点资讯中小学知识大学知识出国留学考研考公

数据挖掘里面最简单的算法是什么

发布网友发布时间：2022-04-23 14:17

共1个回答

热心网友时间：2022-05-02 21:04

鄙人认为k-means算法不怎么难，不论是一维的还是二维的，用c或c++实现都不十分复杂，这方面的代码也很多。

算法描述:
K均值聚类算法:
给定类的个数K，将N个对象分到K个类中去，
使得类内对象之间的相似性最大，而类之间的相似性最小。

基本算法的步骤：
输入：k, data[n];
（1）选择k个初始中心点，例如c[0]=data[0],…c[k-1]=data[k-1];
（2）对于data[0]….data[n], 分别与c[0]…c[n-1]比较，假定与c[i]差值最少，就标记为i;
（3）对于所有标记为i点，重新计算c[i]={ 所有标记为i的data[j]之和}/标记为i的个数；
（4）重复(2)(3),直到所有c[i]值的变化小于给定阈值或者前后两次的中心不再发生变化。

声明：本网页内容为用户发布，旨在传播知识，不代表本网认同其观点，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。E-MAIL:11247931@qq.com

全部栏目

数据挖掘里面最简单的算法是什么