资讯专栏INFORMATION COLUMN

selenium用XPATH直接获取属性值 需要使用.get_attribute(“属性名”)

tommego / 3405人阅读

摘要:在使用进行抓取的时候,试图使用来获取。最后的解决办法就是,这里只取到标签级,想要获取元素在之后再获取如下对,就是加,同理想要获得其他属性值,也可以通过他来获取。同时我还发现,使用也可以取到属性值,暂时未发现这个方法得区别。

在使用selenium进行抓取url的时候,试图使用find_elements_by_xpath来获取。
因此想当然的直接使用XPATH的语法进行获取属性
事例缩略后xml结构如下

按照XPATH正常的语法,想要获取a标签的url也就是href的属性应该写作

//div[@class="qg-limit-list"]/a/@href

然而在使用find_elements_by_xpath一直报错,显示只能存放element而不是object。
最后的解决办法就是,这里只取到标签级,想要获取元素在之后再获取如下

xpath_urls = "//div[@class="qg-limit-list"]/a"
urls_pre = browser.find_elements_by_xpath(xpath_urls)
url = urls_pre[0].get_attribute("href")

对,就是加.get_attribute(“href”),同理想要获得其他属性值,也可以通过他来获取。
同时我还发现,使用.get_property(“href”)也可以取到属性值,暂时未发现这2个方法得区别。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/42414.html

相关文章

  • ❤️爬虫+自动化利器 selenium 之自学成才篇(一)❤️

    文章目录 selenium 简介selenium安装安装浏览器驱动确定浏览器版本下载驱动 定位页面元素打开指定页面id 定位name 定位class 定位tag 定位xpath 定位css 定位link 定位partial_link 定位 浏览器控制修改浏览器窗口大小浏览器前进&后退浏览器刷新浏览器窗口切换常见操作 鼠标控制单击左键单击右键双击拖动鼠标悬停 键盘控制 seleni...

    james 评论0 收藏0
  • Python3网络爬虫实战---37、动态渲染页面抓取:Selenium

    摘要:不过动态渲染的页面不止这一种。再有淘宝这种页面,它即使是获取的数据,但是其接口含有很多加密参数,我们难以直接找出其规律,也很难直接分析来抓取。我们用一个实例来感受一下在这里们依然是先打开知乎页面,然后获取提问按钮这个节点,再将其 上一篇文章:Python3网络爬虫实战---36、分析Ajax爬取今日头条街拍美图下一篇文章:Python3网络爬虫实战---38、动态渲染页面抓取:Spla...

    zhjx922 评论0 收藏0
  • Selenium方法(Python)

    摘要:概述是一款开源的自动化框架,模拟用户操作浏览器的行为,主要用于界面自动化浏览器兼容性测试。将浏览器原生的封装成,作为编程语言与浏览器通信的桥梁,从而达到操作浏览器的目的。 ...

    Aceyclee 评论0 收藏0
  • 【Python爬虫】4万字,详解selenium从入门到实战【错过再无】

    摘要:难在哪里根据上面的标签需要定位最后一行标签,以下列出了四种方式,定位的方式多样并不唯一,使用时根据情况进行解析即可。加入每日一练我们使用并指明标签内全部文本即可定位。 ...

    shiyang6017 评论0 收藏0
  • xpath实际应

    摘要:是一门在文档中查找信息的语言。可用来在文档中对元素和属性进行遍历。在主要应用于无,且属性值不唯一的元素定位。 xpath XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。 xpath在selenium主要应用于无id,且属性值不唯一的元素定位。 1、表格(节点、文本) showImg(https://segmentfault...

    Meathill 评论0 收藏0

发表评论

0条评论

tommego

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<