资讯专栏INFORMATION COLUMN

[book_python]利用python进行数据分析(data analysis)

Atom / 1619人阅读

摘要:文件内容格式为的数据如何解析得到当前目录中,后缀为的数据文件从中取出第一个文件名出现频率统计查看所有水果出现的次数运行结果如下在里出了次重新加载的方法中包含了哪些等效于下面的导入语句的相关内容标准差

1:文件内容格式为json的数据如何解析
import json,os,sys
current_dir=os.path.abspath(".")

filename=[file  for file in os.listdir(current_dir) if ".txt" in file]#得到当前目录中,后缀为.txt的数据文件
fn=filename[0] if len(filename)==1 else "" #从list中取出第一个文件名

if fn: # means we got a valid  filename
    fd=open(fn)
    content=[json.loads(line) for line in fd]
    
else:
    print("no txt file in current directory")
    sys.exit(1)
for linedict in content:
    for key,value in linedict.items():
        print(key,value)
    print("
")
2:出现频率统计
import random
from collections import Counter
fruits=[random.choice(["apple","cherry","orange","pear","watermelon","banana"]) for i in  range(20)]
print(fruits) #查看所有水果出现的次数

cover_fruits=Counter(fruits)
for fruit,times in cover_fruits.most_common(3):
    print(fruit,times)

########运行结果如下:apple在fruits里出了5次
apple 5   
banana 4
pear 4
3:重新加载module的方法py3
import importlib
import.reload(modulename)
4:pylab中包含了哪些module
   from pylab import *
等效于下面的导入语句:
   from numpy import *
   from scipy import *
   import matplotlib
5:pandas的相关内容
data=pandas.read_xx() #pandas.read_excel()
data.head() # data of first 5 rows
data.describe()#标准差
p=data.boxplot()

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/38349.html

相关文章

  • Python工具分析风险数据

    摘要:小安分析的数据主要是用户使用代理访问日志记录信息,要分析的原始数据以的形式存储。下面小安带小伙伴们一起来管窥管窥这些数据。在此小安一定一定要告诉你,小安每次做数据分析时必定使用的方法方法。 随着网络安全信息数据大规模的增长,应用数据分析技术进行网络安全分析成为业界研究热点,小安在这次小讲堂中带大家用Python工具对风险数据作简单分析,主要是分析蜜罐日志数据,来看看一般大家都使用代理i...

    Berwin 评论0 收藏0
  • 宜信开源|数据库审核软件Themis的规则解析

    摘要:导语是宜信公司团队开发的一款数据库审核产品,可帮助开发人员快速发现数据库质量问题,提升工作效率。此平台可实现对数据库进行多维度对象结构文本执行计划及执行特征的审核,用以评估对象结构设计质量及运行效率。阀值阀值,代表违反规则的扣分上限。 导语 Themis是宜信公司DBA团队开发的一款数据库审核产品,可帮助DBA、开发人员快速发现数据库质量问题,提升工作效率。 此平台可实现对Oracle...

    longmon 评论0 收藏0
  • ❤️大佬都在学什么?Python爬虫分析C站大佬收藏夹,跟着大佬一起学, 你就是下一个大佬❤️!

    ❤️大佬都在学什么?Python爬虫分析C站大佬收藏夹,跟着大佬一起学,你就是下一个大佬❤️! 前言程序说明数据爬取获取 CSDN 作者总榜数据获取收藏夹列表获取收藏数据爬虫程序完整代码爬取数据结果 数据分析及可视化 前言 计算机行业的发展太快了,有时候几天不学习,就被时代所抛弃了,因此对于我们程序员而言,最重要的就是要时刻紧跟业界动态变化,学习新的技术,但是很多时候我们又不知道学什么好,万...

    Yang_River 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<