【网站可用性自动化监测】python+seleium

2023-11-26 19:50

本文主要是介绍【网站可用性自动化监测】python+seleium,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

【网站可用性自动化监测】python+seleium

    • 前倾提要:做了网络安全后重保期间需要对用户系统每日进行监测,相关监测脚本网上其实也有很多,但能自己个性化做一下也挺好,太久没做小程序需要写下代码巩固。
    • 本次程序开发目的是重保期间每天分三个时间点对多个网站进行访问监测可用性,并截图,如发现异常把异常站点推送至微信助手并记录
    • 分三大功能函数:网站访问、网站列表读取、定时执行函数

前倾提要:做了网络安全后重保期间需要对用户系统每日进行监测,相关监测脚本网上其实也有很多,但能自己个性化做一下也挺好,太久没做小程序需要写下代码巩固。

本次程序开发目的是重保期间每天分三个时间点对多个网站进行访问监测可用性,并截图,如发现异常把异常站点推送至微信助手并记录

分三大功能函数:网站访问、网站列表读取、定时执行函数

第一部分网站列表读取 代码片.

def get_page_png(urls, browser,now_folder):die_domain = []'''从一个地址列表里,逐个访问,可以访问的地址就截图'''for url in urls:png_namea = url.replace('//', '_').replace('.', '_').replace('/', '_').replace(':',"_")png_name = png_namea + '.png'try:# 屏蔽requests的ssl warning警告信息urllib3.disable_warnings()response = requests.get(url=url, headers=headers, timeout=10, verify=False)if response.status_code == 200:# 访问url# print('url:',url)browser.get(url)# 保存截图browser.save_screenshot(f"./{now_folder}/{png_name}")print(f"{png_name} 保存成功")except:now_404 = f"{url} 无法访问!"print(now_404)mychat(now_404)die_domain.append(url)passnow_die_domain(die_domain)

第二部分网站访问 代码片.

def main():'''主函数'''# 构造urlprint(time.strftime("%Y-%m-%d %H:%M"))urls = []with open("domain_list.txt", "r") as f:for domain in f.readlines():urls.append(domain.strip())# 选项设置options = webdriver.ChromeOptions()# 指定chrome浏览器路径# options.binary_location = r"C:\\Program Files\\Google\\Chrome\\Application"# 终端不显示日志options.add_experimental_option('excludeSwitches', ['enable-logging'])# # 设置无头模式# chrome_options = Options()# chrome_options.add_argument('--headless')# chrome_options.add_argument('--disable_gpu')# 设置无头模式options.add_argument('--headless')options.add_argument('--disable_gpu')# 实例化一个浏览器对象# browser = webdriver.Chrome(executable_path='./chromedriver.exe', options=options)# s = Service("chromedriver.exe")browser = webdriver.Chrome(options=options)# 设置屏幕最大化browser.maximize_window()# 执行浏览器访问now_folder = new_folder()get_page_png(urls, browser,now_folder)# 访问结束后退出browser.quit()

第三部分定时执行 代码片.

def mytime():schedule.every().day.at("10:00").do(main)#里面时间进行修改schedule.every().day.at("13:00").do(main)schedule.every().day.at("16:00").do(main)while True:try:schedule.run_pending()time.sleep(1)except Exception as e:print('报错:',e)

完整代码 代码片.

#!/usr/bin/env python
# -*- coding:utf-8 -*-import requests
import os
import time
import urllib3
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
import schedule
#import itchat#此库是调用网页版微信,可自动化使用微信,但测试中发现大部分用户在扫描二维码阶段出现异常,排查结果说是微信安全屏蔽了此接口调用,运气好的可以试试(我可以使用)#根据时间创建保存网站截图的文件夹
def new_folder():s = time.strftime("%Y%m%d%H%M")os.mkdir("http_pic" + s)f = "http_pic" + sreturn fdef get_page_png(urls, browser,now_folder):die_domain = []'''从一个地址列表里,逐个访问,可以访问的地址就截图'''for url in urls:png_namea = url.replace('//', '_').replace('.', '_').replace('/', '_').replace(':',"_")png_name = png_namea + '.png'try:# 屏蔽requests的ssl warning警告信息urllib3.disable_warnings()response = requests.get(url=url, headers=headers, timeout=10, verify=False)if response.status_code == 200:# 访问url# print('url:',url)browser.get(url)# 保存截图browser.save_screenshot(f"./{now_folder}/{png_name}")print(f"{png_name} 保存成功")except:now_404 = f"{url} 无法访问!"print(now_404)#mychat(now_404)#发送无法网站站点给微信助手die_domain.append(url)passnow_die_domain(die_domain)#导出无法访问站点.txt文件
def now_die_domain(die_domain):if die_domain:f = open("无法访问的站点.txt", "a")f.write(time.strftime(f"%Y-%m-%d %H:%M") + "\n")for domain in die_domain:f.write(domain + "\n")f.close()def main():'''主函数'''# 构造urlprint(time.strftime("%Y-%m-%d %H:%M"))urls = []with open("domain_list.txt", "r") as f:for domain in f.readlines():urls.append(domain.strip())# 选项设置options = webdriver.ChromeOptions()# 指定chrome浏览器路径# options.binary_location = r"C:\\Program Files\\Google\\Chrome\\Application"# 终端不显示日志options.add_experimental_option('excludeSwitches', ['enable-logging'])# # 设置无头模式# chrome_options = Options()# chrome_options.add_argument('--headless')# chrome_options.add_argument('--disable_gpu')# 设置无头模式options.add_argument('--headless')options.add_argument('--disable_gpu')# 实例化一个浏览器对象# browser = webdriver.Chrome(executable_path='./chromedriver.exe', options=options)# s = Service("chromedriver.exe")browser = webdriver.Chrome(options=options)# 设置屏幕最大化browser.maximize_window()# 执行浏览器访问now_folder = new_folder()get_page_png(urls, browser,now_folder)# 访问结束后退出browser.quit()#把无法访问站点发送给微信助手,可以用腾讯短信功能代替,但需要开发对应小程序并申请(https://cloud.tencent.com/search/%E7%9F%AD%E4%BF%A1/1_1)
def mychat(now_404):a = now_404itchat.send(a, toUserName='filehelper')# print('已发送',a)def mytime():schedule.every().day.at("10:00").do(main)schedule.every().day.at("13:00").do(main)schedule.every().day.at("16:00").do(main)while True:try:schedule.run_pending()time.sleep(1)except Exception as e:print('报错:',e)if __name__ == '__main__':#itchat.auto_login(hotReload=True)#微信二维码headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.81 Safari/537.36",}mytime()

程序运行效果 代码片

在这里插入图片描述
.在这里插入图片描述

在这里插入图片描述
备注:seleium需要指定浏览器和匹配driver文件,本脚本使用的是chrome及对应版本driver(driver下载链接http://chromedriver.storage.googleapis.com/index.html)

这篇关于【网站可用性自动化监测】python+seleium的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/426228

相关文章

Python结合PyWebView库打造跨平台桌面应用

《Python结合PyWebView库打造跨平台桌面应用》随着Web技术的发展,将HTML/CSS/JavaScript与Python结合构建桌面应用成为可能,本文将系统讲解如何使用PyWebView... 目录一、技术原理与优势分析1.1 架构原理1.2 核心优势二、开发环境搭建2.1 安装依赖2.2 验

一文详解如何在Python中从字符串中提取部分内容

《一文详解如何在Python中从字符串中提取部分内容》:本文主要介绍如何在Python中从字符串中提取部分内容的相关资料,包括使用正则表达式、Pyparsing库、AST(抽象语法树)、字符串操作... 目录前言解决方案方法一:使用正则表达式方法二:使用 Pyparsing方法三:使用 AST方法四:使用字

Python列表去重的4种核心方法与实战指南详解

《Python列表去重的4种核心方法与实战指南详解》在Python开发中,处理列表数据时经常需要去除重复元素,本文将详细介绍4种最实用的列表去重方法,有需要的小伙伴可以根据自己的需要进行选择... 目录方法1:集合(set)去重法(最快速)方法2:顺序遍历法(保持顺序)方法3:副本删除法(原地修改)方法4:

Python运行中频繁出现Restart提示的解决办法

《Python运行中频繁出现Restart提示的解决办法》在编程的世界里,遇到各种奇怪的问题是家常便饭,但是,当你的Python程序在运行过程中频繁出现“Restart”提示时,这可能不仅仅是令人头疼... 目录问题描述代码示例无限循环递归调用内存泄漏解决方案1. 检查代码逻辑无限循环递归调用内存泄漏2.

Python中判断对象是否为空的方法

《Python中判断对象是否为空的方法》在Python开发中,判断对象是否为“空”是高频操作,但看似简单的需求却暗藏玄机,从None到空容器,从零值到自定义对象的“假值”状态,不同场景下的“空”需要精... 目录一、python中的“空”值体系二、精准判定方法对比三、常见误区解析四、进阶处理技巧五、性能优化

使用Python构建一个Hexo博客发布工具

《使用Python构建一个Hexo博客发布工具》虽然Hexo的命令行工具非常强大,但对于日常的博客撰写和发布过程,我总觉得缺少一个直观的图形界面来简化操作,下面我们就来看看如何使用Python构建一个... 目录引言Hexo博客系统简介设计需求技术选择代码实现主框架界面设计核心功能实现1. 发布文章2. 加

python logging模块详解及其日志定时清理方式

《pythonlogging模块详解及其日志定时清理方式》:本文主要介绍pythonlogging模块详解及其日志定时清理方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录python logging模块及日志定时清理1.创建logger对象2.logging.basicCo

Python如何自动生成环境依赖包requirements

《Python如何自动生成环境依赖包requirements》:本文主要介绍Python如何自动生成环境依赖包requirements问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑... 目录生成当前 python 环境 安装的所有依赖包1、命令2、常见问题只生成当前 项目 的所有依赖包1、

如何将Python彻底卸载的三种方法

《如何将Python彻底卸载的三种方法》通常我们在一些软件的使用上有碰壁,第一反应就是卸载重装,所以有小伙伴就问我Python怎么卸载才能彻底卸载干净,今天这篇文章,小编就来教大家如何彻底卸载Pyth... 目录软件卸载①方法:②方法:③方法:清理相关文件夹软件卸载①方法:首先,在安装python时,下

python uv包管理小结

《pythonuv包管理小结》uv是一个高性能的Python包管理工具,它不仅能够高效地处理包管理和依赖解析,还提供了对Python版本管理的支持,本文主要介绍了pythonuv包管理小结,具有一... 目录安装 uv使用 uv 管理 python 版本安装指定版本的 Python查看已安装的 Python