您现在的位置是:首页 >教育 > 2021-11-15 16:43:37 来源:

聚类和分类的区别

导读 聚类是指计算机根据样本之间的相似性将整个样本集聚类成若干类的过程。目标是使属于同一类的样本尽可能相似,而属于不同类的样本明显不同。

聚类是指计算机根据样本之间的相似性将整个样本集聚类成若干类的过程。目标是使属于同一类的样本尽可能相似,而属于不同类的样本明显不同。系统聚类法和k-Means算法是目前聚类分析中应用最广泛的两种方法。分类是基于每个类别中若干样本的数据信息,总结分类的规律性,建立判别公式和规则。

以及聚类和分类当遇到新的样本时,只需要根据判别公式和判别规则来判断样本所属的类别。分类技术包括统计学、模式识别、人工智能、神经网络等领域。目前常用的分类方法包括贝叶斯判别法、K近邻法、支持向量机(SVM)法、决策树法等。聚类是一个无监督的学习过程,而分类是一个有指导的学习过程。

聚类和分类的区别在于事先没有类表,完全根据样本之间的相似度进行聚类,即类前有样本;分类是基于一个预先确定的类表,将类表中的项目分配给样本,即样本之前有类。