Python爬取网站HTML代码

2024-06-17 12:58

文章标签 python 爬取 html 代码网站 frontend

本文主要是介绍Python爬取网站HTML代码，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

# -*- coding:UTF-8 -*-
import os
import os.path
import requests
def download(url):req = requests.get(url)req.encoding = 'utf-8'if req.status_code == 404:print("404错误")with open('String.txt','wb') as filename:filename.write(req.text.encode())print("下载完成")
if __name__ == '__main__':url = input("请输入URL: ")download('http://'+ url)

其中的重点是：

req.encoding = "utf-8" 如果没有这行代码，爬取下来的HTML将会是乱码

req.text.encode() 后面的这个 encode()是为了把bytes转为str

这篇关于Python爬取网站HTML代码的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/1069509。 23002807@qq.com

uniapp接入微信小程序原生代码配置方案（优化版）

uniapp项目需要把微信小程序原生语法的功能代码嵌套过来，无需把原生代码转换为uniapp，可以配置拷贝的方式集成过来 1、拷贝代码包到src目录 2、vue.config.js中配置原生代码包直接拷贝到编译目录中 3、pages.json中配置分包目录，原生入口组件的路径 4、manifest.json中配置分包，使用原生组件 5、需要把原生代码包里的页面修改成组件的方

公共筛选组件（二次封装antd）支持代码提示

如果项目是基于antd组件库为基础搭建，可使用此公共筛选组件使用到的库 npm i antdnpm i lodash-esnpm i @types/lodash-es -D /components/CommonSearch index.tsx import React from 'react';import { Button, Card, Form } from 'antd'

vue, 左右布局宽，可拖动改变

1：建立一个draggableMixin.js 混入的方式使用 2：代码如下draggableMixin.js export default {data() {return {leftWidth: 330,isDragging: false,startX: 0,startWidth: 0,};},methods: {startDragging(e) {this.isDragging = tr

17.用300行代码手写初体验Spring V1.0版本

1.1.课程目标 1、了解看源码最有效的方式，先猜测后验证，不要一开始就去调试代码。 2、浓缩就是精华，用 300行最简洁的代码提炼Spring的基本设计思想。 3、掌握Spring框架的基本脉络。 1.2.内容定位 1、具有1年以上的SpringMVC使用经验。 2、希望深入了解Spring源码的人群，对 Spring有一个整体的宏观感受。 3、全程手写实现SpringM

Python 字符串占位

在Python中，可以使用字符串的格式化方法来实现字符串的占位。常见的方法有百分号操作符 % 以及 str.format() 方法百分号操作符 % name = "张三"age = 20message = "我叫%s，今年%d岁。" % (name, age)print(message) # 我叫张三，今年20岁。 str.format() 方法 name = "张三"age

vue项目集成CanvasEditor实现Word在线编辑器

CanvasEditor实现Word在线编辑器官网文档：https://hufe.club/canvas-editor-docs/guide/schema.html 源码地址：https://github.com/Hufe921/canvas-editor 前提声明：由于CanvasEditor目前不支持vue、react 等框架开箱即用版，所以需要我们去Git下载源码，拿到其中两个主

React+TS前台项目实战（十七）-- 全局常用组件Dropdown封装

文章目录前言Dropdown组件1. 功能分析2. 代码+详细注释3. 使用方式4. 效果展示总结前言今天这篇主要讲全局Dropdown组件封装，可根据UI设计师要求自定义修改。 Dropdown组件 1. 功能分析（1）通过position属性,可以控制下拉选项的位置（2）通过传入width属性, 可以自定义下拉选项的宽度（3）通过传入classN

代码随想录算法训练营：12/60

非科班学习算法day12 | LeetCode150:逆波兰表达式，Leetcode239: 滑动窗口最大值目录介绍一、基础概念补充： 1.c++字符串转为数字 1. std::stoi, std::stol, std::stoll, std::stoul, std::stoull（最常用） 2. std::stringstream 3. std::atoi, std

js+css二级导航

效果 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml"><head><meta http-equiv="Con

记录AS混淆代码模板

开启混淆得先在build.gradle文件中把 minifyEnabled false改成true,以及shrinkResources true//去除无用的resource文件这些是写在proguard-rules.pro文件内的指定代码的压缩级别 -optimizationpasses 5 包明不混合大小写 -dontusemixedcaseclassnames 不去忽略非公共

Python爬取网站HTML代码

相关文章