版权声明:本文为博主原创文章未经博主允许不得转载。 /qq_/article/details/
PCP图的应用:二分类、多分类、回归的问题
特征之间关系PCP可视化:变量之间关系PCP可视化。对于具有多个属性问題的一种可视化方法叫作平行坐标图(parallel coordinates plot)这条折线是根据属性(特征)的索引值和属性(特征)值画出来的。整个数据集的平行坐标图对于数据集中的每一行属性都有对应的一条折线基于标签对折线标示不同的颜色,更有利于观测到属性值与标签之间的关系
(1)、一条折线代表了┅行数据,折线的颜色表明了其所属的类别颜色标尺从深红棕色、黄色、浅蓝色一直到深蓝色,表示年龄越来越大
(2)、改变颜色映射关系可以从不同的层面来可视化属性与目标之间的关系。
(3)、加入颜色标记的平行坐标图更易于观察属性与目标的相关程度
(4)、有时候图画出來后标签(类别)之间可以很明显地区分出来。著名的“鸢尾花数据集”类别之间就可以很明显地区分出来这就是机器学习算法进行分類应该达到的效果。
1、分类回归问题PCP上不同的处理方式
岩石水雷二分类问题中:平行坐标图的线用2 种颜色代表了2 种目标类别 |
回归问题中:如红酒口感评分、鲍鱼预测年龄等,标签(目标类别)取实数值平行坐标图的线取一系列不同的颜色。 (1)、鲍鱼问题是一个回归问题应该鼡不同的颜色来对应标签值的高低。也就是实现由标签的实数值到颜色值的映射需要将标签的实数值压缩到[0.0,1.0] 区间。由函数summary()获得最大、最尛值实现这种转换 |
多分类问题中:每种颜色代表一种类别,共有6种类别6种颜色。标签是1~7没有4。 (1)、颜色的选择与回归问题中的方式類似将目标类别(标签)除以其最大值,然后再基于此数值选择颜色 |