资讯专栏INFORMATION COLUMN

Python 爬取 baidu 股票市值数据

MadPecker / 927人阅读

摘要:年月日总市值亿匹配换行总市值亿时间时间代码摘选转码匹配换行时间不换行正则替换总市值亿时间已休市

Code:
"""
Created on 2018年2月11日

python 3.6

@author: Livon

"""

import urllib.request

import re

url = "https://gupiao.baidu.com/stock/sz002633.html"

print( "url: " + url )

htmlResponse = urllib.request.urlopen( url )
html = htmlResponse.read()
html = html.decode("utf8")

marketCaps = re.findall("
总市值
(.*?)亿
",html) # 匹配换行 dates = re.findall("(.*?)s+",html) for i in range( 0, len( marketCaps )): print( "总市值:" + marketCaps[i] + " 亿" ) for i in range( 0, len( dates )): # print("时间:", end="" ) date = re.sub( " ", "", dates[i] ) print("时间:" + date )
代码摘选

html = html.decode("utf8") # 转码

dates = re.findall("(.*?)s+",html) # 匹配换行

print("时间:", end="" ) # 不换行

date = re.sub( " ", "", dates[i] ) # 正则替换

output
url: https://gupiao.baidu.com/stock/sz002633.html
总市值:12.69 亿
时间:已休市 2018-02-09 15:00:03

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/41391.html

相关文章

  • 爬虫框架Scrapy实战一——股票数据爬取

    摘要:技术路线爬虫框架语言由于在上一篇博客中已经介绍了股票信息爬取的原理,在这里不再进行过多介绍,如需了解可以参考博客链接描述,在本篇文章中主要讲解该项目在框架中如何实现。 简介 目标: 获取上交所和深交所所有股票的名称和交易信息。输出: 保存到文件中。技术路线:Scrapy爬虫框架语言: python3.5由于在上一篇博客中已经介绍了股票信息爬取的原理,在这里不再进行过多介绍,如需了解可以...

    Ilikewhite 评论0 收藏0
  • python做投资--多因子策略

    摘要:如果我们把这三个因子都加进去会怎样呢收益率为倍,没有刚才那么好了,还是刚才的和净利润环比增长率这两个因子比较好,那就保留两个吧。因此,我们可以考虑使用排名的方法,对这些因子进行排名。 导语:每一位宽客都相信,影响股票涨跌的因素不胜枚举,而这些因素就是因子!本文作为一篇合格的入门教程,提供代码当做框架,各路宽客可以自己测试,查看收益率,亦可利用聚宽python平台自行构建代码。 规范源码...

    zilu 评论0 收藏0
  • 从互联网获取股票数据(历史数据Python + MySQL)

    摘要:目标从互联网网易数据接口获取股票历史数据,包括开盘价最高价最低价收盘价等等环境记录数条,以该表为基础,制作清单。 目标 从互联网(网易数据接口)获取股票历史数据,包括开盘价、最高价、最低价、收盘价等等 环境 Python 3.6MySQL 5.6.34 table: stock_list showImg(https://segmentfault.com/img/bV3XbB?w=755...

    weapon 评论0 收藏0
  • python爬虫实战二——股票数据定向爬虫

    摘要:选取方法打开网页,查看源代码,搜索网页的股票价格数据是否存在于源代码中。将上述的代码封装成一个函数,对东方财富网页面解析的完整代码如下所示接下来是获得百度股票网链接描述单只股票的信息。 功能简介 目标: 获取上交所和深交所所有股票的名称和交易信息。输出: 保存到文件中。技术路线: requests---bs4--re语言:python3.5 说明 网站选择原则: 股票信息静态存在于ht...

    icattlecoder 评论0 收藏0

发表评论

0条评论

MadPecker

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<