资讯专栏INFORMATION COLUMN

机器学习实战

617035918 / 1689人阅读

摘要:一的实现预测电影的种类返回数组值的从小到大的索引值字典的,返回键的值,如果不在返回,这里是返回的数字,字典本来就是空的,当检查到没有该元素的时候,就加一,这正是为何这里的之后需要加一距离公式如下对于代码值得注意的地方有的使用字典的使用

一、KNN的实现 1.预测电影的种类
import numpy as np
import operator
def createDataSet():
    group = np.array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])
    labels = ["A","A","B","B"]
    return group, labels
def classify(inx, dataSet, labels, k):
    dataSetsize = dataSet.shape[0]
    diffMat = np.tile(inx, (dataSetsize,1)) - dataSet
    sqDiffMat = diffMat**2
    sqDistances = sqDiffMat.sum(axis=1)
    distances = sqDistances**0.5
    sortedDistIndicies = distances.argsort()            #argsort返回数组值的从小到大的索引值
    classCount = {}
    for i in range(k):
        voteIlabels = labels[sortedDistIndicies[i]]
        #dict.get(key, default=None)
        #字典的get,返回键的值,如果不在返回None,这里是返回的数字0,
        #字典本来就是空的,当检查到没有该元素的时候,就加一,这正是为何这里的get之后需要加一
        classCount[voteIlabels] = classCount.get(voteIlabels,0)+1 
    sortedClassCount = sorted(classCount.items(),key=operator.itemgetter(1),reverse=True)
    return sortedClassCount[0][0]
if __name__ == "__main__":
    group, labels = createDataSet()
    test = [1,2]
    test_class = classify(test, group, labels, 3)
    print(test_class)

tips:

KNN距离公式如下:

$$ L{p}(X{i},Y{i})=(sum_{i=1}^{n}left | X{i}^{(l)}-X{j}^{(l)} ight |^{p})^{frac{1}{p}} $$

对于代码值得注意的地方有 1.np.tile的使用

​ 2.字典get的使用

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/43917.html

相关文章

  • ApacheCN 人工智能知识树 v1.0

    摘要:贡献者飞龙版本最近总是有人问我,把这些资料看完一遍要用多长时间,如果你一本书一本书看的话,的确要用很长时间。为了方便大家,我就把每本书的章节拆开,再按照知识点合并,手动整理了这个知识树。 Special Sponsors showImg(https://segmentfault.com/img/remote/1460000018907426?w=1760&h=200); 贡献者:飞龙版...

    刘厚水 评论0 收藏0
  • Python入门深度学习完整指南

    摘要:通过书籍学习,比如除了上述的先学知识,你还应该了解一些流行的深度学习库和运行他们的语言。你也可以查看查看的中的第讲,概要性的了解一些深度学习库。 作者:chen_h微信号 & QQ:862251340微信公众号:coderpai简书地址:https://www.jianshu.com/p/cd0... 原文:https://www.analyticsvidhya.c... 介绍 ...

    ztyzz 评论0 收藏0
  • ApacheCN 编程/大数据/数据科学/人工智能学习资源 2019.5

    摘要:请回复这个帖子并注明组织个人信息来申请加入。版笔记等到中文字幕翻译完毕后再整理。数量超过个,在所有组织中排名前。网站日超过,排名的峰值为。主页归档社区自媒体平台微博知乎专栏公众号博客园简书合作侵权,请联系请抄送一份到赞助我们 Special Sponsors showImg(https://segmentfault.com/img/remote/1460000018907426?w=1...

    zhonghanwen 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<