摘要:概要应同学邀请,演示如何使用内嵌浏览器浏览网页,并注入脚本实现自动化操作。在默认配置中植入内容,这样脚本会在所有打开的网页中执行,不论跳转到哪个网址。脚本使用网址中的路径名,判断当前网页位置,从而决定执行哪种操作。
概要
应同学邀请,演示如何使用 PyQt5 内嵌浏览器浏览网页,并注入 Javascript 脚本实现自动化操作。
sg 原贴地址: 如何在Python利用runJavaScript模拟鼠标移动页面的某个元素
https://segmentfault.com/q/10...
下面测试的是一个廉价机票预订网站(http://www.flyscoot.com/),关键点如下
使用 QWebEngineView 加载网页,并显示进度。
在默认配置(QWebEngineProfile)中植入 Javascript 内容,这样脚本会在所有打开的网页中执行,不论跳转到哪个网址。
Javascript 脚本使用网址中的路径名,判断当前网页位置,从而决定执行哪种操作。
python 代码示例</>复制代码
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""使用 PyQt5 内嵌浏览器浏览网页,并注入 Javascript 脚本实现自动化操作。"""
import os
import sys
from datetime import datetime
from PyQt5.QtWidgets import (
QWidget, QApplication, QVBoxLayout, QHBoxLayout,
QDesktopWidget, QTextEdit, QLabel, QLineEdit, QPushButton,
QFileDialog, QProgressBar,
)
from PyQt5.QtCore import QUrl, pyqtSlot
from PyQt5.QtWebEngineWidgets import QWebEngineView, QWebEngineProfile, QWebEngineScript, QWebEnginePage
class Browser(QWidget):
def __init__(self):
super().__init__()
self.init_ui()
# 脚本
self.profile = QWebEngineProfile.defaultProfile()
self.script = QWebEngineScript()
self.prepare_script()
def init_ui(self):
self.webView = QWebEngineView()
self.logEdit = QTextEdit()
self.logEdit.setFixedHeight(100)
self.addrEdit = QLineEdit()
self.addrEdit.returnPressed.connect(self.load_url)
self.webView.urlChanged.connect(
lambda i: self.addrEdit.setText(i.toDisplayString()))
self.jsEdit = QLineEdit()
self.jsEdit.setText("inject.js")
loadUrlBtn = QPushButton("加载")
loadUrlBtn.clicked.connect(self.load_url)
chooseJsBtn = QPushButton("选择脚本文件")
chooseJsBtn.clicked.connect(self.choose_js_file)
# 导航/工具
top = QWidget()
top.setFixedHeight(80)
topBox = QVBoxLayout(top)
topBox.setSpacing(0)
topBox.setContentsMargins(5, 0, 0, 5)
progBar = QProgressBar()
progBox = QHBoxLayout()
progBox.addWidget(progBar)
topBox.addLayout(progBox)
naviBox = QHBoxLayout()
naviBox.addWidget(QLabel("网址"))
naviBox.addWidget(self.addrEdit)
naviBox.addWidget(loadUrlBtn)
topBox.addLayout(naviBox)
naviBox = QHBoxLayout()
naviBox.addWidget(QLabel("注入脚本文件"))
naviBox.addWidget(self.jsEdit)
naviBox.addWidget(chooseJsBtn)
topBox.addLayout(naviBox)
self.webView.loadProgress.connect(progBar.setValue)
# 主界面
layout = QVBoxLayout(self)
layout.addWidget(self.webView)
layout.addWidget(top)
layout.addWidget(self.logEdit)
self.show()
self.resize(1024, 900)
self.center()
def center(self):
qr = self.frameGeometry()
cp = QDesktopWidget().availableGeometry().center()
qr.moveCenter(cp)
self.move(qr.topLeft())
@pyqtSlot()
def load_url(self):
url = self.addrEdit.text().strip()
if not url.lower().startswith("http://")
and not url.lower().startswith("https://"):
url = "http://{}".format(url)
self.load(url)
@pyqtSlot()
def choose_js_file(self):
f, _ = QFileDialog.getOpenFileName(filter="Javascript files(*.js)")
if os.path.isfile(f):
self.jsEdit.setText(f)
self.prepare_script()
def prepare_script(self):
path = self.jsEdit.text().strip()
if not os.path.isfile(path):
self.log("invalid js path")
return
self.profile.scripts().remove(self.script)
with open(path, "r") as f:
self.script.setSourceCode(f.read())
self.profile.scripts().insert(self.script)
self.log("injected js ready")
def log(self, msg, *args, **kwargs):
m = msg.format(*args, **kwargs)
self.logEdit.append("{} {}".format(
datetime.now().strftime("%H:%M:%S"), m))
def load(self, url):
self.log(f"loading {url}")
self.addrEdit.setText(url)
self.webView.load(QUrl(url))
if __name__ == "__main__":
app = QApplication(sys.argv)
b = Browser()
b.load("http://www.flyscoot.com/")
sys.exit(app.exec_())
Javascript 脚本示例
</>复制代码
// 简单起见,这里只演示部分页面,脚本内容摘自 Heng丶原贴文。
function handle(path) {
// 首页
if (path == "/zh") {
document.getElementsByClassName("radio-inline")[1].click();
document.getElementById("oneway_from").value="广州 (CAN)";
document.getElementById("oneway_to").value="新加坡 (SIN)";
document.getElementById("oneway_departuredate").value="2018年9月10日";
document.getElementsByClassName("btn--booking")[1].click();
return;
}
// 选择航班
if (path == "/Book/Flight") {
document.getElementsByClassName("price--sale")[0].click();
document.getElementsByClassName("heading-4")[0].click();
document.getElementsByClassName("btn-submit")[0].click();
return;
}
// 乘客信息
if (path == "/BookFlight/Passengers") {
document.getElementsByClassName("fname1")[0].value = "匿名";
}
}
let host = document.location.hostname;
if (host.endsWith(".flyscoot.com")) {
handle(document.location.pathname);
}
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/42341.html
摘要:跨域请求跨域问题,是开发中一直以来需要注意的问题。则发送通道的发送给监听此消息的外部扩展。完整方法此处,为必选参数,为回调函数。回调函数接收到的参数有三个,分别是和,即消息内容,消息发送者相关信息和相应函数。是发起消息的标签。 第二章简介 第二章较第一章复杂许多。书中虽寥寥21页,内容却也不少。涵盖了8个小节。 2.1 操作用户正在浏览的页面 2.2 跨域请求 2.3 常驻后台 2....
摘要:在浏览区中的性能,可以认为是开发者所面临的最严重的可用性问题。优化这个问题的第一步从它的加载和执行开始。这意味着在对象的事件触发后再下载脚本。属性指明本元素所含的脚本不会修改,因此代码能够安全地执行,但是浏览器的支持情况不理想。 JavaScript在浏览区中的性能,可以认为是开发者所面临的最严重的可用性问题。 优化这个问题的第一步从它的加载和执行开始。 霸道的script标签scr...
摘要:是代替用户完成指定的动作,需要知道其他用户页面的代码和数据包。 常见web安全及防护原理 sql注入原理 就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串,最终达到欺骗服务器执行恶意的SQL命令 总的来说有以下几点 永远不要信任用户的输入,要对用户的输入进行校验,可以通过正则表达式,或限制长度,对单引号和双-进行转换等 永远不要使用动态拼装SQL,可以...
阅读 2731·2021-10-14 09:47
阅读 5047·2021-09-22 15:52
阅读 3435·2019-08-30 15:53
阅读 1514·2019-08-30 15:44
阅读 753·2019-08-29 16:41
阅读 1752·2019-08-29 16:28
阅读 511·2019-08-29 15:23
阅读 1723·2019-08-26 12:20