一、需求说明
通过鸢尾花的花萼和花瓣的长度和宽度,预测出鸢尾花的类别。
二、目的
鸢尾花的特征数据5.0,3.3,1.4,0.2 ====》多分类算法进行训练====》多分类算法模型=====》进行预测
三、思路
- 加载数据
- 将鸢尾花的花萼和花瓣的长度和宽度作为特征封装到 向量Vector(Array(5.0,3.3,1.4,0.2))
- 将鸢尾花的字符串类别转换成标签数据Map("Iris-setosa"->0,"Iris-versicolor"->1,"Iris-virginica"->2)
- 最终要封装成5.0,3.3,1.4,0.2,Iris-setosa===》LabeledPoint(0,Vectors.dense(Array(5.0,3.3,1.4,0.2)))
四、实现步骤流程
1、加载数据
Logger.getLogger("org").setLevel(Level.WARN)
val spark = SparkSession.builder().appName("IrisMulti