chromedriver之"此类型文件可能会损害您的计算机"提示的处理

wupengyu 发布于2019-07-31 10:11 / 1560人阅读

摘要：最后在谷歌上找到一篇相关文章，大意是说这个是无解的，可能是系统安全的问题，对于这个解释我还是比较认可的，所以在上就不会提示。

背景

最近在使用selenium进行自动文件下载时，突然出现了一个报错：

下载进行不下去了。

思路

经过各种谷歌、百度，均告诉我在要增加params，关闭浏览器安全选项，配置如下：

chromeOptions = webdriver.ChromeOptions()
prefs = {"profile.default_content_settings.popups": 0,
          "download.default_directory": path,
          "download.prompt_for_download": False,
          # "download.directory_upgrade": "true",
          "safebrowsing.enabled": True}
chromeOptions.add_experimental_option("prefs", prefs)

事实证明，可能以前的版本是可行的，现在的真心不行。

上面配置重点是"safebrowsing.enabled": True。在MacOS的环境下，哪怕不配也是没有问题的，Windows就不行了。

最后在谷歌上找到一篇相关文章，大意是说这个是无解的，可能是windows系统安全的问题，

对于这个解释我还是比较认可的，所以在mac上就不会提示。

Let’s start frankly: you can’t disable this feature. You can merely tweak the download settings in order to avoid it.

https://windowsreport.com/typ...

那么问题来了，既然这样，有什么曲线救国的办法呢？

当chromedriver弹出这个提示的时候，其实文件已经下载完成，如下图：

我们只需要将文件名修改为正确的名字和后缀即可(比如test.txt)，直接无视警告提醒。思路如下：

找到最新下载的文件：通过对下载目录的文件按照创建时间排序，找到最新的

判断是否该文件是否已下载完成：通过判断时间间隔前后该文件是否有大小的变化

结论

根据上面思路，实现的关键代码如下：

def sort_file():
    global path
    dir_lists = os.listdir(path)
    dir_lists.sort(key=lambda fn: os.path.getmtime(os.path.join(path, fn)))
    return dir_lists[-1]
  
def changeName(path, oldname, newname):
    old_path = os.path.join(path, oldname)
    new_path = os.path.join(path, newname + ".txt")
    if os.path.exists(old_path):
        if os.path.exists(new_path):
            os.remove(new_path)
        os.rename(old_path, new_path)
        print ("rename done!" + newname)
    else:
        print ("no file found!")
  
def download():
  ...
  temp_filename = sort_file()
      if u"未确认" in temp_filename:
          temp_filesize_old = os.path.getsize(os.path.join(path, temp_filename))
          while True:
              time.sleep(1)
              temp_filesize_new = os.path.getsize(os.path.join(path, temp_filename))
              if temp_filesize_old == temp_filesize_new:
                  changeName(path, temp_filename, ip)
                  return
              else:
                  temp_filesize_old = temp_filesize_new
      else:
          print(u"下载失败")

需要注意的是，在文件重命名的时候，先检查下文件是否已经存在，先删除，在创建。

以上。

如果有更好的思路，欢迎分享。

云服务器 GPU云服务器星云&quot超级计算机 Quote quoted quot

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/43401.html

变革！Perplexica：AI驱动的问答搜索引擎

Perplexica是一个开源的人工智能搜索工具，也可以说是一款人工智能搜索引擎，它深入互联网以找到答案。受Perplexity AI启发，它是一个开源选择，不仅可以搜索网络，还能理解您的问题。它使用先进的机器学习算法，如相似性搜索和嵌入式技术，以精细化结果，并提供附有来源的清晰答案。利用SearxNG保持最新和完全开源，Perplexica确保您始终获取最新的信息，而不会损害您的隐私。特点本地L...

UCloud小助手 2024-04-29 18:49 评论0 收藏0
WAF-UWAFWeb安全防护报告

摘要：部署地域分布客户在业务部署区域的选择上也有不同，从客户业务部署地域分布来看，主要集中在国内的北京和上海，客户通常会选择购买业务部署区域的，也有客户采用多地域部署以提高业务的可用性，总体来看客户的需求集中在防御攻击防攻击以及满足合规需求。2021年UWAF累积为各个行业的客户提供了1117个域名的高质量访问服务，并提供安全防护，有效的保护了客户的数据信息与资产安全。2021年Web安全形势依然...

ernest.wang 2022-07-15 11:21 评论0 收藏0
OpenAI开发ChatGPT“反作弊神器”，99.9%超高命中率，好消息：还没上线

检查内容是否用了ChatGPT，准确率高达99.9%！OpenAI又左右互搏上了，给AI生成的文本打水印，高达99.9％准确率抓「AI枪手」作弊代写。其能够精准识别出论文或研究报告是否由ChatGPT撰写，甚至能追溯其使用的具体时间点。它能专门用来检测是否用ChatGPT水了论文/作业。早在2022年11月（ChatGPT发布同月）就已经提出想法了。但是！这么好用的东西，却被内部雪藏了2年，现在都...

UCloud小助手 2024-08-08 16:39 评论0 收藏0
python+selenium实现扫码免密登录，代码如下

　　小编这篇文章，就给大家传授一招技术，python+selenium实现扫码免密登录，第一步是扫码登录，获取cookies，然后保存到本地，为后面的免密登录做准备，那么具体操作步骤是什么呢？请各位读者继续往下看。　　一、需求描述　　web自动化测试/python爬虫往往会遇到扫码登录的情况，不是所有的网站都支持用户密码登录，遇到这种扫码登录的情况会阻碍我们自动化测试/爬虫的进行，所有为了可以...

89542767 2022-09-06 22:26 评论0 收藏0
Python+Selenium实现在Geoserver批量发布Mongo矢量数据

　　小编写这篇文章的一个主要目的，主要是来给大家做一个解答，解答的内容是Python+Selenium，具体的一个内容解释是什么呢？比如，我们可以实现Geoserver批量发布Mongo矢量数据，具体的一个内容，下面就给大家详细解答下。　　首先，声明一下，这里我完成的脚步属于半自动化的，我戏称它为有监督的半自动化脚本。具体原因后面会详细说明。　　一、安装Selenium和ChromeDriver　...

89542767 2022-12-19 21:56 评论0 收藏0