资讯专栏INFORMATION COLUMN

数据挖掘复习笔记---01.概述

lewinlee / 1969人阅读

摘要:为什么需要信息技术的发展,计算机存储和处理信息,网络传播信息,物联网收集信息,移动互联网更加便捷地收集和传播信息问题数据总量爆炸式增加,如何从中提取真正有价值的信息产生了新的领域什么是数据挖掘知识发现机器学习理解从数

Chp1

DM, Data Mining

为什么需要 Data Mining

信息技术的发展,计算机---存储和处理信息,网络---传播信息,物联网---收集信息,移动互联网---更加便捷地收集和传播信息

问题:数据总量爆炸式增加,如何从中提取真正有价值的信息

产生了新的领域(DM)


什么是 DM

Data Mining, 数据挖掘

Knowledge Discovery, 知识发现

Machine Learning, 机器学习

Knowledge Discovery in Database, KDD


理解 DM

KDD, 从数据库获取数据---数据清洗---放入数据仓库(warehouse)---选出可能相关的感兴趣的信息---数据挖掘---评估---知识


BI, Business Intelligence, 商业智能


ML, 机器学习


从 4 个不同的角度理解 DM

待挖掘数据的种类: 文本,图像,视频,音频,...


挖掘方法: 统计学,机器学习,可视化,...


挖掘出的知识: 特征,类别,趋势,区别,关联,...


应用领域: 互联网,销售,银行,股票,生物,...


DM 和 ML 的区别

DM: 发现规律,填补单个空缺

ML: 预测一整行



DM 的历史


DM 面临的主要挑战

用户交互

效率和可扩展性

数据类型的多样性

挖掘方法和技术

社会问题


Big Data, 大数据

定义: 4V

Volume, 数据体量巨大,PB 级别

Velocity, 要求处理速度快,1 秒定律,可从各种类型的数据中快速获得高价值的信息

Variety, 数据类型繁多

Value, 只要合理利用数据并对其进行正确、准确的分析,将会带来很高的价值回报


应用

Google Flu Trends Prediction

Promotion of pregnant women products in Target supermarket


文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/8623.html

相关文章

  • Libev 官方文档学习笔记 - 01概述和 ev_loop

    摘要:注意这个函数并不是线程安全的。等于新事件的数量。暂停当前的,使其刮起当前的所有工作。两个值均默认为,表示尽量以最小的延迟调用。系列篇官方文档学习笔记概述和本文官方文档学习笔记基础官方文档学习笔记常用接口使用构建响应服务器的简单流程 请注意这是 libev 而不是 libevent 的文章! 自从接触到 libev 之后,就深深赞同作者精简的设计理念,于是就爱上了 libev 这样简单的...

    codeKK 评论0 收藏0
  • 前端复习笔记

    摘要:一基本结构设置字符编码集格式网页头部二文本标记加粗倾斜下划线删除线上标下标三引用样式表的方式内联样式在元素的开始标签里,设置一个属性,并设置对应的属性名及属性值例使用场景里,使用给元素添加样式内部样式表在标签里加上一对标签,并且在标签设置对一、基本结构 //设置字符编码集格式 // //网页头部 二、文本标记1.加粗 b2...

    yhaolpz 评论0 收藏0
  • TP5实现支付宝电脑网站支付学习笔记

    摘要:第一次做支付宝的支付,踩了点小坑,还算顺利。第一步当然是在支付宝开放平台申请公钥私钥等,支付宝关官方文档都有详细介绍,这里就省略。就是那个支付宝二维码的页面。支付宝支付成功后会执行这两个方法,系统会把你支付的信息用方式异步传给你的方法。 这两天在公司做一个小型WEB项目,需要有支付功能。第一次做支付宝的支付,踩了点小坑,还算顺利。激动的我赶紧记下实现的流程。第一步当然是在支付宝开放平台...

    TNFE 评论0 收藏0
  • (黑马)C++提高编程笔记(未完)

    摘要:文章目录模板模板的概念函数模板函数模板语法函数模板注意事项函数模板案例普通函数与函数模板的区别普通函数与函数模板的调用规则模板的局限性类模板类模板语法类模板与函数模板区别类模板中成员函数创建时机类模板对象做函数参数类模 ...

    Jenny_Tong 评论0 收藏0
  • AI开发书籍分享

    摘要:编程书籍的整理和收集最近一直在学习深度学习和机器学习的东西,发现深入地去学习就需要不断的去提高自己算法和高数的能力然后也找了很多的书和文章,随着不断的学习,也整理了下自己的学习笔记准备分享出来给大家后续的文章和总结会继续分享,先分享一部分的 编程书籍的整理和收集 最近一直在学习deep learning深度学习和机器学习的东西,发现深入地去学习就需要不断的去提高自己算法和高数的能力然后...

    huayeluoliuhen 评论0 收藏0

发表评论

0条评论

lewinlee

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<