摘要:起步这次使用的训练集由模块提供,关于虹膜一种鸢尾属植物的数据。它的品种分类有山鸢尾,变色鸢尾,菖蒲锦葵三种。构造分类器参数级是指定获取个邻近点。训练训练的函数一般就是测试模拟一些测试数据,使用刚刚的模型进行预测
起步
这次使用的训练集由 sklearn 模块提供,关于虹膜(一种鸢尾属植物)的数据。
数据载入from sklearn import datasets iris = datasets.load_iris()
数据存储在 .data 成员中,它是一个 (n_samples, n_features) numpy 数组:
print(iris.data) # [[ 5.1 3.5 1.4 0.2] # [ 4.9 3. 1.4 0.2] # ...
它有四个特征,萼片长度,萼片宽度,花瓣长度,花瓣宽度 (sepal length, sepal width, petal length and petal width)。
它的品种分类有山鸢尾,变色鸢尾,菖蒲锦葵(Iris setosa, Iris versicolor, Iris virginica.)三种。
print iris.data.shape # output:(150L, 4L)
这是一个含有 150 个数据的训练集。
构造 KNN 分类器from sklearn import neighbors knn = neighbors.KNeighborsClassifier(n_neighbors=5)
n_neighbors 参数级是指定获取 K 个邻近点。
训练训练的函数一般就是 fit :
knn.fit(iris.data, iris.target)测试
模拟一些测试数据,使用刚刚的模型进行预测:
predict = knn.predict([[0.1, 0.2, 0.3, 0.4]]) print(predict) # output: [0]
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/18319.html
摘要:起步这次使用的训练集由模块提供,关于虹膜一种鸢尾属植物的数据。它的品种分类有山鸢尾,变色鸢尾,菖蒲锦葵三种。构造分类器参数级是指定获取个邻近点。训练训练的函数一般就是测试模拟一些测试数据,使用刚刚的模型进行预测 起步 这次使用的训练集由 sklearn 模块提供,关于虹膜(一种鸢尾属植物)的数据。 showImg(https://segmentfault.com/img/remote/...
摘要:起步今天介绍另一种分类算法,邻近算法,即算法。概述和在年提出了最初的邻近算法,用于解决分类的问题。但是从视觉上观测,应该是分为圆形分类更为合理。 起步 今天介绍另一种分类算法,k邻近算法( k-nearest neighbors ),即 KNN 算法。 概述 Cover 和 Hart 在 1968 年提出了最初的邻近算法,用于解决分类( classification )的问题。关于这个...
摘要:起步本章介绍如何自行构造分类器,这个分类器的实现上算是比较简单的了。不过这可能需要你之前阅读过这方面的知识。在预测函数中,需要依次计算测试样本与数据集中每个样本的距离。筛选出前个,采用多数表决的方式。测试还是使用中提供的虹膜数据。 起步 本章介绍如何自行构造 KNN 分类器,这个分类器的实现上算是比较简单的了。不过这可能需要你之前阅读过这方面的知识。 前置阅读 分类算法之邻近算法:KN...
摘要:前言本专栏主要结合,来实现一些基本的图像处理操作经典的机器学习算法比如决策树贝叶斯分类器等,以及常用的深度学习算法。现在设定,并计算到待测样本最近的个样本有个苹果和个梨子,距离分别为。 ...
摘要:邻近算法算法背景假设我们要给一堆音乐分类,我们可以分成摇滚,民谣,戏曲等等,摇滚的音乐激昂,节奏快。这种基于某一特征出现的次数来区分事物的算法,我们使用邻近算法。 k-邻近算法 算法背景 假设我们要给一堆mp3音乐分类,我们可以分成摇滚,民谣,戏曲等等,摇滚的音乐激昂,节奏快。民谣舒缓节奏慢,但是摇滚中也有可能存在舒缓节奏慢点旋律, 同理民谣中也会有激昂,快的旋律。那么如何区分他们呢,...
阅读 2938·2021-10-12 10:11
阅读 383·2021-09-06 15:01
阅读 1701·2021-08-16 10:59
阅读 2666·2019-08-30 15:55
阅读 1043·2019-08-30 14:19
阅读 1916·2019-08-29 17:03
阅读 2332·2019-08-29 16:28
阅读 3084·2019-08-26 13:47