本文主要是介绍爬虫系列一:十天python爬虫基础学习实战第七天——python字符串及列表,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
知识回顾:
1.python字符串
2.python列表
"""
案例1:如何定义一个字符串
"""
a = 'hello'
a1 = "hello"
a2 = """hello"""
a3 = '''hello'''"""
案例2:如何定义一个列表
"""
a1_list = []
Python转义字符
在需要在字符中使用特殊字符时,python用反斜杠(\)转义字符。如下表:
转义字符 | 描述 |
---|---|
\(在行尾时) | 续行符 |
\\ | 反斜杠符号 |
\' | 单引号 |
\" | 双引号 |
\a | 响铃 |
\b | 退格(Backspace) |
\e | 转义 |
\000 | 空 |
\n | 换行 |
\v | 纵向制表符 |
\t | 横向制表符 |
\r | 回车 |
\f | 换页 |
\oyy | 八进制数,yy代表的字符,例如:\o12代表换行 |
\xyy | 十六进制数,yy代表的字符,例如:\x0a代表换行 |
\other | 其它的字符以普通格式输出 |
"""
案例3:字符串的转义\
\n:换行符合
\t:制表符Tab
"""
a_str = 'hello I\'m Liudehua'
a_str1 = "hell\'o I\"m Liudehua"
a_str2 = "hello I\\\\'m Liudehua"
a_str3 = 'https://mbd.baidu.com/newspage/data/landingsuper?context=%7B%22nid%22%3A%22news_9220683932666622769%22%7D&' \'n_type=1&p_from=4super?context=%7B%22nid%22%3A%22news_9220683932666622769%22%7D&n_type=1&p_from=4super?conte' \'xt=%7B%22nid%22%3A%22news_9220683932666622769%22%7D&n_type=1&p_from=4super?context=%7B%22nid%22%3A%22news_92' \'20683932666622769%22%7D&n_type=1&p_from=4'
a_str4 = 'hello 哈哈\nhello 呵呵'
a_str5 = 'hello哈哈\thello呵呵'
# print(a_str)
# print(a_str1)
# print(a_str2)
# print(a_str3)
print(a_str4)
print(a_str5)
Python字符串运算符
下表实例变量 a 值为字符串 "Hello",b 变量值为 "Python":
操作符 | 描述 | 实例 |
---|---|---|
+ | 字符串连接 | >>>a + b 'HelloPython' |
* | 重复输出字符串 | >>>a * 2 'HelloHello' |
[] | 通过索引获取字符串中字符 | >>>a[1] 'e' |
[ : ] | 截取字符串中的一部分 | >>>a[1:4] 'ell' |
in | 成员运算符 - 如果字符串中包含给定的字符返回 True | >>>"H" in a True |
not in | 成员运算符 - 如果字符串中不包含给定的字符返回 True | >>>"M" not in a True |
r/R | 原始字符串 - 原始字符串:所有的字符串都是直接按照字面的意思来使用,没有转义特殊或不能打印的字符。 原始字符串除在字符串的第一个引号前加上字母"r"(可以大小写)以外,与普通字符串有着几乎完全相同的语法。 | >>>print r'\n' \n >>> print R'\n' \n |
% | 格式字符串 | 请看下一章节 |
"""
案例4:
+,* ,[ : ] ,in ,not in ,r/R
"""
a1 = 'hello'
a2 = 'python'
a3 = r'哈哈\t呵呵'
print(a1 + a2) # + hellopython
print(a1 * 3) # + hellohellohello
print(a1[2:]) # [ : ]
print(a1[1:3]) # [ : ]
print('thon' in a2)
print(a3)
Python 字符串格式化
Python 支持格式化字符串的输出 。尽管这样可能会用到非常复杂的表达式,但最基本的用法是将一个值插入到一个有字符串格式符 %s 的字符串中。
在 Python 中,字符串格式化使用与 C 中 sprintf 函数一样的语法。
python字符串格式化符号:
符 号 | 描述 |
---|---|
%c | 格式化字符及其ASCII码 |
%s | 格式化字符串 |
%d | 格式化整数 |
%u | 格式化无符号整型 |
%o | 格式化无符号八进制数 |
%x | 格式化无符号十六进制数 |
%X | 格式化无符号十六进制数(大写) |
%f | 格式化浮点数字,可指定小数点后的精度 |
%e | 用科学计数法格式化浮点数 |
%E | 作用同%e,用科学计数法格式化浮点数 |
%g | %f和%e的简写 |
%G | %f 和 %E 的简写 |
%p | 用十六进制数格式化变量的地址 |
Python2.6 开始,新增了一种格式化字符串的函数 str.format(),它增强了字符串格式化的功能。
"""
案例5:
需求: 根据用户输入的名字进行问候语打印
尽量不要使用+连接字符串
"""
name = input('請輸入你的名字:')
place = '清华大学'
print('hello %s, welcome to %s!' % (name, place))
"""
案例5:
需求: 根据用户输入的名字进行问候语打印
使用str.format(),建议使用.format函数的方式
"""
name = input('請輸入你的名字:')
place = '清华大学'
print('hello {a1}, welcome to {a2}!'.format(a2=place, a1=name))
Python 列表(List)
序列是Python中最基本的数据结构。序列中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0,第二个索引是1,依此类推。
Python有6个序列的内置类型,但最常见的是列表和元组。
序列都可以进行的操作包括索引,切片,加,乘,检查成员。
此外,Python已经内置确定序列的长度以及确定最大和最小的元素的方法。
列表是最常用的Python数据类型,它可以作为一个方括号内的逗号分隔值出现。
列表的数据项不需要具有相同的类型创建一个列表,只要把逗号分隔的不同的数据项使用方括号括起来即可。
1.访问列表中的值
2.查看列表元素个数
len(list)
3.更新列表
4.删除列表元素
list.pop([index=-1])
del list[index]
list.remove(obj)
5.Python列表截取
6.列表的部分函数
list.append(obj)list.count(obj)list.extend(seq)list.index(obj)list.insert(index, obj)list.reverse()list.sort(cmp=None, key=None, reverse=False)
"""
案例6:
访问列表的值:根据索引访问
1.访问列表中的值
2.查看列表元素个数len(list)
3.更新列表
4.删除列表元素
list.pop([index=-1])默认删除最后一个,如果指定index,就删除这个索引的值,建议使用
del list[index]
list.remove(obj)
5.Python列表截取
[:]
6.列表的部分函数list.append(obj) 在列表末尾追加元素list.count(obj) 统计某个元素在列表里面出现的次数list.extend(seq) 将一个列表的元素追加到另一个列表里面list.index(obj) 获取列表里面某个元素的索引list.insert(index, obj)往列表指定索引位置插入一个元素list.reverse() 列表反转list.sort(cmp=None, key=None, reverse=False)
"""
a_list = ['劉德華', '周星馳', '成龍', '黄家驹', '赵丽颖', '成龍', '刘亦菲', '成龍', 12, 29.8, '成龍', ]
a_list1 = [1, 23, 4, 5, 7, 8]
# print(a_list[1])
# print(len(a_list))# print(a_list)
# a_list[1] = '周润发'
# print(a_list)
# print(a_list)
# name = a_list.pop(1)
# del a_list[1]
# a_list.remove('周星馳')
# print(a_list)# print(a_list[1:4])# print(a_list)
# a_list.append('周润发')
# print(a_list)# print(a_list.count('成龍'))# print(a_list)
# a_list.extend(a_list1)
# print(a_list)# print(a_list.index('赵丽颖'))# print(a_list)
# a_list.insert(3, '周润发')
# print(a_list)# print(a_list)
# a_list.reverse()
# print(a_list)print(a_list1)
a_list1.sort()
# a_list1.sort(reverse=True)
print(a_list1)
这篇关于爬虫系列一:十天python爬虫基础学习实战第七天——python字符串及列表的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!