资讯专栏INFORMATION COLUMN

验证码破解技术四部曲之环境搭建篇(一)

Null / 1256人阅读

摘要:最容易破解的验证码直接使用库识别。验证码使用卷积神经网络训练识别。说明项目源码可以帮我点个开发语言编写爬虫编写图像处理部分以及机器学习算法开发环境依赖库环境搭建安装安装安装安装的库安装的库下载项目源码

前言

转眼就变成大四狗了,大学期间做的比较深入的技术是爬虫,但是爬虫也有很多高级的技术没有涉及,比如说验证码的破解便是其中之一,再加上我对其非常感兴趣,于是乎,开始苦学图像处理、学习机器学习,验证码破解也有了些眉头。

以下是我破解的几种验证码。

1、最容易破解的验证码



直接使用tesseract库识别。

2、download.csdn的验证码



使用K近邻算法识别。

3、weibo.cn验证码



使用卷积神经网络训练识别。

说明

项目源码:https://github.com/nladuo/cap... (可以帮我点个star(^__^))
开发语言:python(编写爬虫),c++(编写图像处理部分以及机器学习算法)
开发环境:ubuntu 14.04
依赖库:
Python:PIL、BeautifulSoup4、requests
C++:boost、opencv2、tesseract-ocr

环境搭建 安装opencv 2.4.12
sudo apt-get install build-essential cmake libgtk2.0-dev pkg-config python-dev python-numpy libavcodec-dev libavformat-dev libswscale-dev 
wget https://codeload.github.com/Itseez/opencv/zip/2.4.12
unzip opencv-2.4.12.zip
cd opencv-2.4.12 ; mkdir release  ; cd release  
cmake -D CMAKE_BUILD_TYPE=RELEASE -D CMAKE_INSTALL_PREFIX=/usr/local ..  
make -j8
sudo make install
安装tesseract-ocr
sudo apt-get install tesseract-ocr tesseract-ocr-dev
安装boost
sudo apt-get install libboost-all-dev
安装python的PIL库
sudo apt-get install python-imaging
安装python的BeautifulSoup4、requests库
sudo apt-get install python-pip
sudo pip install bs4
sudo pip install requests
下载项目源码
git clone https://github.com/nladuo/captcha-break.git

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/18127.html

相关文章

  • 验证破解技术部曲使用卷积神经网络(四)

    摘要:前言在这节,我将用卷积神经网络简称破解新浪微博手机端的验证码,验证码如下。字符下载字符下载和上节差不多,这里需要注意的是新浪微博的验证码下载下来是格式的,不支持读取的读取,需要用把验证码转换成格式。 前言 在这节,我将用卷积神经网络(简称:CNN)破解新浪微博手机端的验证码(http://login.weibo.cn/login/),验证码如下。showImg(https://segm...

    Zachary 评论0 收藏0
  • 验证破解技术部曲使用K近邻算法(三)

    摘要:做机器学习的第一个步骤就是采集数据,构建训练样本。机器学习虽然牛逼,但是也需要对样本进行预处理,这里的预处理就是把字母分割出来,并且分割成同样的尺寸。 前言 在上一节中,我们使用了google的开源OCR库来对字符进行识别,这一节以及下一节我们将要使用机器学习算法来识别验证码。本节的代码都在https://github.com/nladuo/captcha-break/tree/mas...

    Dr_Noooo 评论0 收藏0
  • 首次公开,整理12年积累的博客收藏夹,零距离展示《收藏夹吃灰》系列博客

    摘要:时间永远都过得那么快,一晃从年注册,到现在已经过去了年那些被我藏在收藏夹吃灰的文章,已经太多了,是时候把他们整理一下了。那是因为收藏夹太乱,橡皮擦给设置私密了,不收拾不好看呀。 ...

    Harriet666 评论0 收藏0
  • 网易易盾高洪亮:纵深检测防御体系,企业内容安全问题的解决

    摘要:网易易盾企业安全高级解决方案工程师高洪亮安全开发者峰会是国内开发者与安全人才的年度盛事,受众包括开发者安全人员及高端技术从业人员。 由中国最早的安全人员交流学习社区看雪学院主办、CSDN协办的安全开发者峰会(SDC),于2019年7月20日在北京国家会议中心举行。 showImg(https://segmentfault.com/img/bVbvC7u);网易易盾企业安全高级解决方案工...

    sixgo 评论0 收藏0
  • Android-自定义View

    摘要:自定义简单实现凹凸优惠券效果自定义属性的简单使用,继承重写方法使用来绘制,简单实现凹凸优惠券效果图文并茂自定义之切换标签自定义实现一个简单好用的切换标签自定义滑动确认控件自定义控件,用来进行滑动确认等操作。 Android 之自定义 View 的死亡三部曲之 Measure 我还不知道你的三围呢(你要占多少屏幕),我怎么能轻易让你出场呢? Android 自定义 View,ViewGr...

    UnixAgain 评论0 收藏0

发表评论

0条评论

Null

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<