python 360 社区 监控 爬虫 in not in 问题

2024-08-31 21:08

本文主要是介绍python 360 社区 监控 爬虫 in not in 问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

发生个特别奇怪的情况,最近老是收到重复邮件,检查爬虫里面有个地方竟然走了两个分支,
如果用in,元素存在的情况下,竟然会走到else里面,用notin,就不会,实在是太奇怪了,写简单的demo的时候不会出现这个情况,不知道是python的问题还是我的问题

#*-coding:utf-8-*-
import urllib2
import re
import smtplib
import time
from email.mime.text import MIMETextretries1=30
_to = "XXXXXXXXXXXXX@360.cn"class SendQqMail:def getqqmail(self, retries):_user = "XXXXXXXXXXXXXX@qq.com"_pwd = "XXXXXXXXXXXXXXXXXXX"msg = MIMEText(listitem1[74:-4])msg["Subject"] = listitem1[0:42]msg["From"] = _usermsg["To"] = _totry:time.sleep(30)s = smtplib.SMTP_SSL("smtp.qq.com", 465)s.login(_user, _pwd)s.sendmail(_user, _to, msg.as_string())s.quit()print "Send QQ Email Success!"except smtplib.SMTPException, e:print "retry.QQ mail.........,%s" % eif retries > 0:return self.getqqmail(retries - 1)else:print "Send QQ Email Falied,%s" % eclass Send163Mail:def get163mail(self, retries):_user = "python_smtp_test@163.com"_pwd = "zk199245qqq"msg = MIMEText(listitem1[74:-4])msg["Subject"] = listitem1[0:42]msg["From"] = _usermsg["To"] = _totry:time.sleep(30)s = smtplib.SMTP_SSL("smtp.163.com", 465)s.login(_user, _pwd)s.sendmail(_user, _to, msg.as_string())s.quit()print "Send 163 Email Success!"except smtplib.SMTPException, e:print "retry.163mail..........,%s" % eif retries > 0:return self.get163mail(retries - 1)else:print "Send 163 Email Falied,%s" % e#卫士板块
req1 = urllib2.Request("http://bbs.360.cn/forum-140-1.html")class openurlrequest:def tryopenurlrequest(self, req, retries):try:time.sleep(30)response = urllib2.urlopen(req)bufferread = response.read()except Exception, what:#print what, reqif retries > 0:return self.tryopenurlrequest(req, retries - 1)else:print 'open url request Failed', reqreturn bufferreadbuff = openurlrequest()
buffer = buff.tryopenurlrequest(req1, retries1)
getarticlelist = re.compile(r'http://bbs.360.cn/thread-.+-1-1.html" \s?target="_blank" class="s xst".*\s*</a>')
pagemsg = re.findall(getarticlelist,buffer)print ("卫士板块监控系统已启动,如果监控到新的信息将会自动发送到您的邮箱").decode("utf-8")
print 'ready variables of num: %s' %len(pagemsg)allurllist = []
for eveurllist in pagemsg:allurllist.append(eveurllist[0:42])
print len(allurllist)while True:time.sleep(30)buff1 = openurlrequest()buffer1 = buff.tryopenurlrequest(req1, retries1)getarticlelist1 = re.compile(r'http://bbs.360.cn/thread-.+-1-1.html" \s?target="_blank" class="s xst".*\s*</a>')pagemsg1 = re.findall(getarticlelist1,buffer1)for listitem1 in pagemsg1:#奇怪的地方就在这里,用in的时候取到的最后一条listitem1[0:42]在allurllist里面,应该不会走到else里面,但是测试的时候,会把两种情况都打印出来,而用not in就不会,这他妈的是因为啥啊if (listitem1[0:42] not in allurllist):allurllist.append(listitem1[0:42])try:qqsendmailer = SendQqMail()time.sleep(30)qqsendmailer.getqqmail(30)except:print "QQ mail try five times fail,change 163mail"neteasysendmailer = Send163Mail()time.sleep(30)neteasysendmailer.get163mail(30)else:pass

这篇关于python 360 社区 监控 爬虫 in not in 问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1124997

相关文章

Kotlin Map映射转换问题小结

《KotlinMap映射转换问题小结》文章介绍了Kotlin集合转换的多种方法,包括map(一对一转换)、mapIndexed(带索引)、mapNotNull(过滤null)、mapKeys/map... 目录Kotlin 集合转换:map、mapIndexed、mapNotNull、mapKeys、map

nginx中端口无权限的问题解决

《nginx中端口无权限的问题解决》当Nginx日志报错bind()to80failed(13:Permissiondenied)时,这通常是由于权限不足导致Nginx无法绑定到80端口,下面就来... 目录一、问题原因分析二、解决方案1. 以 root 权限运行 Nginx(不推荐)2. 为 Nginx

python生成随机唯一id的几种实现方法

《python生成随机唯一id的几种实现方法》在Python中生成随机唯一ID有多种方法,根据不同的需求场景可以选择最适合的方案,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习... 目录方法 1:使用 UUID 模块(推荐)方法 2:使用 Secrets 模块(安全敏感场景)方法

解决1093 - You can‘t specify target table报错问题及原因分析

《解决1093-Youcan‘tspecifytargettable报错问题及原因分析》MySQL1093错误因UPDATE/DELETE语句的FROM子句直接引用目标表或嵌套子查询导致,... 目录报js错原因分析具体原因解决办法方法一:使用临时表方法二:使用JOIN方法三:使用EXISTS示例总结报错原

Windows环境下解决Matplotlib中文字体显示问题的详细教程

《Windows环境下解决Matplotlib中文字体显示问题的详细教程》本文详细介绍了在Windows下解决Matplotlib中文显示问题的方法,包括安装字体、更新缓存、配置文件设置及编码調整,并... 目录引言问题分析解决方案详解1. 检查系统已安装字体2. 手动添加中文字体(以SimHei为例)步骤

SpringSecurity整合redission序列化问题小结(最新整理)

《SpringSecurity整合redission序列化问题小结(最新整理)》文章详解SpringSecurity整合Redisson时的序列化问题,指出需排除官方Jackson依赖,通过自定义反序... 目录1. 前言2. Redission配置2.1 RedissonProperties2.2 Red

nginx 负载均衡配置及如何解决重复登录问题

《nginx负载均衡配置及如何解决重复登录问题》文章详解Nginx源码安装与Docker部署,介绍四层/七层代理区别及负载均衡策略,通过ip_hash解决重复登录问题,对nginx负载均衡配置及如何... 目录一:源码安装:1.配置编译参数2.编译3.编译安装 二,四层代理和七层代理区别1.二者混合使用举例

使用Python删除Excel中的行列和单元格示例详解

《使用Python删除Excel中的行列和单元格示例详解》在处理Excel数据时,删除不需要的行、列或单元格是一项常见且必要的操作,本文将使用Python脚本实现对Excel表格的高效自动化处理,感兴... 目录开发环境准备使用 python 删除 Excphpel 表格中的行删除特定行删除空白行删除含指定

prometheus如何使用pushgateway监控网路丢包

《prometheus如何使用pushgateway监控网路丢包》:本文主要介绍prometheus如何使用pushgateway监控网路丢包问题,具有很好的参考价值,希望对大家有所帮助,如有错误... 目录监控网路丢包脚本数据图表总结监控网路丢包脚本[root@gtcq-gt-monitor-prome

Spring Boot集成Druid实现数据源管理与监控的详细步骤

《SpringBoot集成Druid实现数据源管理与监控的详细步骤》本文介绍如何在SpringBoot项目中集成Druid数据库连接池,包括环境搭建、Maven依赖配置、SpringBoot配置文件... 目录1. 引言1.1 环境准备1.2 Druid介绍2. 配置Druid连接池3. 查看Druid监控