博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
常用的几种距离的优劣
阅读量:4972 次
发布时间:2019-06-12

本文共 399 字,大约阅读时间需要 1 分钟。

欧式距离

欧式距离想必很熟悉了,就是两个特征向量长度平方和的平方根嘛

优势:简单直观

劣势:若某些特征比其他特征值大很多,精度就会比较差。此外,若有很多特征值为0,也就是所谓的稀疏矩阵,结果也不准确。总之,稳定性不是很好

曼哈顿距离

曼哈顿距离是两个特征在标准坐标系中绝对轴距之和(没有使用平方距离),又称街区距离。

优势:在某些情况下具有更高的稳定性

劣势:若数据集中某些特征值过大,这些特征会掩盖其他特征间的近邻关系

余弦距离

余弦距离指的是特征向量夹角的余弦值,忽略了特征向量的长度

优势:更适合解决异常值和数据稀疏问题,适用于特征向量很多的情况

劣势:丢弃了向量长度所包含的在某些场景下可能会很有用的一些信息

 

三种距离更直观的表示见下图:

 

参考自python数据挖掘入门与实践

转载于:https://www.cnblogs.com/Hyacinth-Yuan/p/8384664.html

你可能感兴趣的文章
wordpress自动截取文章摘要代码
查看>>
[置顶] 一名优秀的程序设计师是如何管理知识的?
查看>>
scanf和gets
查看>>
highcharts 图表实例
查看>>
ubuntu下如何查看用户登录及系统授权相关信息
查看>>
秋季学期学习总结
查看>>
SpringBoot 优化内嵌的Tomcat
查看>>
【LaTeX】E喵的LaTeX新手入门教程(1)准备篇
查看>>
highcharts曲线图
查看>>
extjs动态改变样式
查看>>
PL/SQL Developer 查询的数据有乱码或者where 字段名=字段值 查不出来数据
查看>>
宏定义
查看>>
笔记:git基本操作
查看>>
生成php所需要的APNS Service pem证书的步骤
查看>>
JavaWeb之JSON
查看>>
HOT SUMMER 每天都是不一样,积极的去感受生活 C#关闭IE相应的窗口 .
查看>>
windows平台上编译mongdb-cxx-driver
查看>>
optionMenu-普通菜单使用
查看>>
2016-2017-2点集拓扑作业[本科生上课时]讲解视频
查看>>
【MemSQL Start[c]UP 3.0 - Round 1 C】 Pie Rules
查看>>