博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
聚类算法——KMEANS算法
阅读量:4709 次
发布时间:2019-06-10

本文共 289 字,大约阅读时间需要 1 分钟。

聚类概念

  无监督问题:我们手里没有标签

  聚类:相似的东西分到一组

  难点:如何评估,如何调参

    

基本概念

  要得到簇的个数,需要指定K值

  质心:均值,即向量各维取平均即可

  距离的度量:常用欧几里得距离和余弦度(先标准化)

  优化目标:

        

  工作流程:

        

  优势:

    简单、快速、适合常规数据集

  劣势:

    K值难确定

    复杂度与样本呈线性关系

    很难发现任意形状的簇

      

 

转载于:https://www.cnblogs.com/hellojack/p/7771758.html

你可能感兴趣的文章
sql server 2008学习8 sql server存储和索引结构
查看>>
Jquery radio选中
查看>>
memcached 细究(三)
查看>>
RSA System.Security.Cryptography.CryptographicException
查看>>
[解题报告] 100 - The 3n + 1 problem
查看>>
Entity Framework 学习高级篇1—改善EF代码的方法(上)
查看>>
Mybatis逆向工程配置文件详细介绍(转)
查看>>
String类的深入学习与理解
查看>>
OnePage收集
查看>>
yahoo的30条优化规则
查看>>
[CCF2015.09]题解
查看>>
[NYIST15]括号匹配(二)(区间dp)
查看>>
json_value.cpp : fatal error C1083: 无法打开编译器生成的文件:No such file or directory
查看>>
洛谷 P1101 单词方阵
查看>>
Swift DispatchQueue
查看>>
C#和JAVA 访问修饰符
查看>>
小甲鱼OD学习第1讲
查看>>
HDU-1085 Holding Bin-Laden Captive-母函数
查看>>
php提示undefined index的几种解决方法
查看>>
LRJ
查看>>