Day12文件操作
1.迭代器、生成式补充
- 迭代器
获取元素:next()、for in
iter1 = iter('hello')
print(next(iter1)) # 第一种
print(iter1.__next__()) # 第二种
for x in iter1: # 第三种
print(x)
- 生成器
def func1(num, pre=''):
width = len(str(num))
for x in range(1, num + 1):
yield pre+str(x).zfill(width)
id_stu = func1()
print(next(id_stu))
print(next(id_stu))
# 这样写的话,每次都会创建新的生成器,必须要把函数赋给一个变量
# print(next(func1(100)))
# print(next(func1(100)))
- 生成式
生成式本质还是生成器,只是写法更简洁
1)生成式的写法
语法1:
(表达式 for 变量 in 序列)
展开:
def func1():
for 变量 in 序列:
yield 表达式
func1()
说明:
() -- 固定写法
表达式 -- 除了赋值以外的任何语句,比如:数据、赋值过的变量、运算表达式、函数调用表达式等
这个表达式一般都和后面的变量有联系
gen1 = (10*x for x in range(5))
print(gen1) # 0
print(next(gen1))
for x in gen1:
print(x) # 10 20 30 40
gen2 = ('str'+str(x) for x in range(6))
for str1 in gen2:
print(str1)
dict1 = {'a': 1, 'b': 2, 'c': 3}
gen3 = ((value, key) for key, value in dict1.items())
print(next(gen3))
print(dict(gen3))
- 一句话实现交换一个字典的key和value()
print('----------------------------')
dict1 = dict(((value, key) for key, value in dict1.items()))
print(dict1)
- 练习:实现自己的dict函数,可以将序列转换成字典(面试题)
def lcx_dict(seq):
dict1 = {}
for item in seq:
list1 = list(item)
dict1[list1[0]] = list1[1]
return dict1
dict2 = lcx_dict([(1, 2), (3, 4), (5, 6)])
print(dict2)
2)语法二:
a.语法
(表达式 for 变量 in 序列 if 条件语句)
b.展开
def func():
for 变量 in 序列:
if 条件语句:
yield 表达式
gen = func()
print('=============语法二==============')
gen1 = ('str%d' % x for x in range(15) if x % 2)
for item in gen1:
print(item)
3)补充:python的三目运算符
C语言 -- 条件语句?值1:值2 (如果条件语句为真整个便殴打时的结果是值1,否则是值2)
python语法 -- 值1 if 条件语句 else 值2
print('=============补充==============')
a = 10
b = 20
result = a if a > b else b
print(result)
展开
if a > b:
result = a
else:
result = b
print(result)
2. 文件
- 数据持久化
程序中产生的数据默认是保存在内存中,程序结束数据会自动销毁,如果希望程序结果数据不销毁,那么需要对这个数据做数据持久化
数据持久化:将数据保存到文件中,然后将文件保存在磁盘/硬盘中 - 文件操作(对文件内容进行操作)
基本操作:打开文件 -> 操作文件(读/写) -> 关闭文件(f.close())
open(file,mode='r',encoding=None) -- 以指定的方式打开文件,并且返回文件对象
1)打开文件
说明:
file -- 文件路径,可以写绝对路径也可以写相对路径
a.绝对路径 - 完整路径,例如:E:/python_笔记/text.txt
b.相对路径(需要先将文件保存在工程目录下)
./ -- 代表当前目录(./可以省略)
../ -- 代表当前目录的上层目录
.../ -- 代表当前目录的上层目录的上层目录
以此类推
注意:当前目录指的是当前代码所在文件对应的目录
mode -- 字符串,文件的打开方式(决定打开文件后能够进行的操作,和操作方式)
'r' -- 以只读的方式打开文件,读出来的数据是字符串
'w' -- 以只写的方式打开文件,写入的数据是字符串(覆盖原文件内容)
'rb'/'br' -- 以只读的方式打开文件,读出来的数据是二进制数据
'wb'/'bw' -- 以只写的方式打开文件,写入的数据是二进制数据
'a' -- 以写的方式打开文件,写入的数据是字符串(在原文件的最后添加内容)
注意:如果是以读的方式打开文件,文件不存在会报错()
如果是以写的方式打开文件,文件不存在不会报错,并且会自动创建文件对象(不会创建文件夹)
encoding -- 字符,文本编码方式
'utf-8'(mac) -- 支持中文
'gbk'(windows) -- 只支持英文
注意:只有文本文件才能设置encoding,二进制操作不能设置encoding
print('===============打开文件=================')
# 使用绝对路径打开test.txt文件
open('./test.txt')
open('./files/test2.txt')
# f保存文件对象,只有打开文件才能得到文件对象
f = open('test.txt', 'r', encoding='utf-8')
print(type(f))
f.close()
2)操作文件
1.读操作:
文件对象.read() -- 返回文件中的内容(从读写位置获取到文件结尾)
文件对象.readline() -- 读一行内容(从读写位置开始到一行结尾)
print('============读所有===============')
f = open('test.txt', 'r', encoding='utf-8')
content = f.read() # 读所有
print(type(content))
print(content)
# 设置读写位置在文件开头(1个中文汉字在python中的utf-8占3个字节)
f.seek(0)
print('===:', f.read())
f.close()
print('============读一行===============')
f1 = open('test.txt', 'r', encoding='utf-8')
print(f1.readline())
print(f1.readline())
print(f1.readline())
print(f1.readline())
# 读不到内容的时候返回空串
content = f1.read()
print('===:', content, type(content))
f1.close()
- 练习:读一个本地txt文件中的内容,一行一行的读,读完为止
f2 =open('test1.txt', 'r',encoding='utf-8')
while True:
content = f2.readline()
print(content)
if not content: # 为假
break
f2.close()
2.写操作
文件对象.write(内容) -- 将内容写入指定文件
'w'/'a' -- 内容要求是字符串类型
'bw'/'wb' -- 内容要求是二进制(bytes)
f = open('test.txt', 'a', encoding='utf-8')
f.write('hello python')
f.close()
3.字节类型(bytes)
1)数据来源:
a. 将其他类型转换成bytes类型
整形和字符串都可以转换成bytes
b. 以'rb'/'br' 的方式读文件
- 整形转bytes
print(bytes(10))
print(bytes(True))
- 字符串转bytes(两种方法)
b1 = bytes('你好', encoding='utf-8')
print(b1)
b1 = '你好!'.encode()
print(b1) # 字符串本身有一个方法encode(),可以将字符串转换成二进制
- 将bytes转字符串(两种方法)
str1 = str(b1, encoding='utf-8')
print('str1:', str1)
str1 = b1.decode(encoding='utf-8')
print('str1:', str1)
- 二进制文件的读写
图片、视频、音频等都是二进制文件,这些文件只能以带'b'的方式打开然后操作
二进制读操作
image_f =open('files/2.png', 'rb')
image_data = image_f.read()
print(type(image_data), image_data)
import requests
# 下载网络图片
response = requests.get('https://www.baidu.com/img/bd_logo1.png?qua=high')
# 二进制写操作
n_f = open('new.jpeg', 'wb')
n_f.write(response.content)
- 结合
1)打开文件
with open() as 文件对象:
文件的操作
2)数据持久化
0)要为这个数据创建对应的本地文件
1)程序中需要这个数据的时候,从文件中去读这个数据的值
2)这个数据的值发生改变后要将最新的数据更新到本地文件中
- 练习:统计程序启动次数(将当前程序的启动次数打印出来)
# 1.将数据从文件中读出来
with open('files/count.txt', encoding='utf-8') as f:
count = int(f.read())
# 2.更新数据
count += 1
print(count)
# 3.更新文件
with open('files/count.txt', 'w', encoding='utf-8') as f:
f.write(str(count))
3. json
- 什么是json数据(特别重要,实用性!!)
满足json格式要求的数据就是json数据;文件内容满足json格式要求,就是json文件
1.json格式要求:1)一个json中有且只有一个数据
2)这个数据必须是json支持的数据类型的数据
2.json支持的数据类型
数字类型(number) -- 包含所有的数字(整数和小数),并且支持科学计数法,例如:10, 23.12
字符串(string) -- 使用双引号""引起来的字符串,支持转义字符,例如:"abc", "\n123", "12小红", "\u4e00"
布尔(boolean) -- 只有true和false两个值
数组(array) -- 相当于python中的列表,[12, 'acb', true, [1, 3]]
字典(dictionary) -- 相当于python中的字典,{"name": "张三", "age": 18},键只能是字符串,值任意
null -- 相当于None,空值
- python数据和json数据的相互转换
python中内置了一个json模块,用来支持json相关操作
1)json转python
json数据 (转) python数据
数字 int/float
字符串 str,有可能将双引号变成单引号
布尔 bool,true -> True, false -> False
数组 list
字典 dict
null None
2)
json.loads(字符串, encoding=编码方式) -- 将字符串转换成python对应的数据
注意:这儿的字符串要求字符串中的内容必须是json格式数据(去掉字符串最外面的引号,本身就是一个json数据)
result = json.loads('"abc"', encoding='utf-8')
print([result]) # ['abc']
result = json.loads('true', encoding='utf-8')
print([result]) # [True]
result = json.loads('[12, true, "abc", null]', encoding='utf-8')
print(result, type(result)) # [12, True, 'abc', None] <class 'list'>
3) python转json
python数据 (转) json数据
int/float 数字
bool 布尔,True -> true, False -> false
str 字符串, 单引号会变成双引号
list/tuple 数组
dict 字典
None null
4)
json.dumps(数据) - 将python数据转换成json格式的字符串
result = json.dumps(100)
print([result]) # ['100']
result = json.dumps('hello python')
print([result]) # ["'hello python"']
result = json.dumps(True)
print([result]) # ['true']
result = json.dumps({'abc': 23, 'name': '小明', 'gender': True, 'score': None})
print([result]) # ['{"abc": 23, "name": "\\u5c0f\\u660e", "gender": true, "score": null}']
