Python数据分析：简单统计量的计算

li21 发布于2019-07-30 18:45 / 2927人阅读

摘要：表示从负无穷积分到时的返回值，可以得到个随机的符合正态分布的数字。

1.这些操作都要确保已经在电脑中安装好了Anaconda集成库，如果安装好后运行出错误，可以将原来电脑中的python卸载重新安装Anaconda，建议安装时直接将添加环境变量打勾，否则以后得自己添加环境变量，在Pycharm中的编译器选择Anaconda安装文件夹中的python。在Pycharm中新建一个data文件夹用来存放数据文件。

2.打开Python Console。

3.首先在用python读取数据，需要先输入import pandas as pd引入pandas包，再输入df=pd.read_csv("./data/CityData.csv")读取数据，最后输入df显示数据。

4.分别输入type(df)和type(df["cid"])可以发现两种数据类型不同。

5.计算平均值：df.mean()或df["xid"].mean()

6.计算中位数：输入df.median()或df["yid"].median

7.求四分位数：输入df.quantile(q=0.25)

8.求众数：输入df.mode()或df["xid"].mode()

9.求标准差：输入df.std()或df["yid"].std()

10.计算方差：df.var()或df["xid"].var()

11.求和：df.sum()或df["xid"].sum()

12.计算偏态系数：df.skew()或df["yid"].skew()

13.计算峰态系数：df.kurt()或df["yid"].kurt()

14.生成正态分布函数，pandas无法直接生成，需要先引入scipyimport scipy.stats as ss，再输入ss.norm，这时生成的是一个正态分布的对象，我们输入ss.norm.stats(moments="mvsk")查看一下，mvsk分别代表的是均值、方差、偏态系数、峰态系数。

这时我们可以看到生成四个值，分别对应正态分布的mvsk分别为0、1、0、0。

15.ss.norm.pdf(0.0)表示横坐标为0时的纵坐标的值。ss.norm.ppf(0.9)表示从负无穷累积到返回值时得到的值为0.9，其中ppf后的值必须在0-1之间。ss.norm.cdf(2)表示从负无穷积分到2时的返回值，ss.norm.rvs(size=10)可以得到10个随机的符合正态分布的数字。

16.类似的，我们可以分别输入ss.chi2和ss.t得到卡方分布和T分布。

17.此外我们还可以进行抽样，输入df.sample(n=10)从数据中抽取10个样本，输入df.sample(frac=0.1)从数据中抽取10%的样本。

云服务器 GPU云服务器 python简单计算简单的统计数据简单的数据统计软件大数据量的存储

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/43006.html

Django 博客开发教程 16 - 统计文章阅读量

如何精确地记录一篇文章的阅读量是一个比较复杂的问题，不过对于我们的博客来说，没有必要记录的那么精确。因此我们使用一种简单但有效的方式来记录博客文章的阅读量：文章每被浏览一次，则其阅读量 +1，即所谓的文章页面 PV（Page View）数。虽然简单粗暴，但却高效实用。增加新字段为了记录文章的浏览量，需要在文章的数据库表中新增一个用于存储阅读量的字段。因此给博客文章的模型新增一个 views 字...

edgardeng 2019-07-31 10:58 评论0 收藏0

发表评论

登陆后可评论

0条评论

li21

男|高级讲师

我要关注我要私信

TA的文章

有关hc-12的使用经验

阅读 3411·2021-11-15 11:37
傲游主机(aoyoyun)，全新荷兰/美国联通CU2 VPS(AS10099+AS9929)

阅读 2557·2021-09-29 09:48
机箱和主机有什么区别-迷你主机和台式主机有什么区别？

阅读 4218·2021-09-22 15:55
用一根网线连接电脑和Manifold（树莓派）

阅读 3087·2021-09-22 10:02
CloudCone：控制台域名恢复正常访问，附便宜VPS促销方案，$12.95/年起

阅读 2717·2021-08-25 09:40
HostMem：1核/512M/10G SSD/500G流量/1Gbps/洛杉矶CN2 GT/年付$

阅读 3324·2021-08-03 14:03
如何用 js 获取虚拟键盘高度？（适用所有平台）

阅读 1776·2019-08-29 13:11
CSS规范--BEM入门

阅读 1650·2019-08-29 12:49

资讯专栏INFORMATION COLUMN

上云采购季！| 2核2G4M爆款云服务器低至59元/年，更有多台、长期优惠，快来选购！

Python数据分析：简单统计量的计算

相关文章

Django 博客开发教程 16 - 统计文章阅读量

发表评论

0条评论

li21

男|高级讲师

TA的文章

有关hc-12的使用经验

傲游主机(aoyoyun)，全新荷兰/美国联通CU2 VPS(AS10099+AS9929)

机箱和主机有什么区别-迷你主机和台式主机有什么区别？

用一根网线连接电脑和Manifold（树莓派）

CloudCone：控制台域名恢复正常访问，附便宜VPS促销方案，$12.95/年起

HostMem：1核/512M/10G SSD/500G流量/1Gbps/洛杉矶CN2 GT/年付$

如何用 js 获取虚拟键盘高度？（适用所有平台）

CSS规范--BEM入门

最新活动