Day 12-note_file_json_generator

Day12文件操作

1.迭代器、生成式补充

迭代器
获取元素：next()、for in

iter1 = iter('hello')
print(next(iter1))         # 第一种
print(iter1.__next__())   # 第二种
for x in iter1:           # 第三种
    print(x)

生成器

def func1(num, pre=''):
    width = len(str(num))
    for x in range(1, num + 1):
        yield pre+str(x).zfill(width)


id_stu = func1()
print(next(id_stu))
print(next(id_stu))
# 这样写的话，每次都会创建新的生成器,必须要把函数赋给一个变量
# print(next(func1(100)))
# print(next(func1(100)))

生成式
生成式本质还是生成器，只是写法更简洁
1）生成式的写法
语法1：

(表达式 for 变量 in 序列)

展开：

def func1():
    for 变量 in 序列：
        yield 表达式
func1()

说明：

()  --  固定写法
表达式  --  除了赋值以外的任何语句，比如：数据、赋值过的变量、运算表达式、函数调用表达式等
            这个表达式一般都和后面的变量有联系

gen1 = (10*x for x in range(5))
print(gen1)       # 0
print(next(gen1))
for x in gen1:
    print(x)      # 10   20   30   40

gen2 = ('str'+str(x) for x in range(6))
for str1 in gen2:
    print(str1)

dict1 = {'a': 1, 'b': 2, 'c': 3}
gen3 = ((value, key) for key, value in dict1.items())
print(next(gen3))
print(dict(gen3))

一句话实现交换一个字典的key和value（）

print('----------------------------')
dict1 = dict(((value, key) for key, value in dict1.items()))
print(dict1)

练习：实现自己的dict函数，可以将序列转换成字典(面试题)

def lcx_dict(seq):
    dict1 = {}
    for item in seq:
        list1 = list(item)
        dict1[list1[0]] = list1[1]
    return dict1


dict2 = lcx_dict([(1, 2), (3, 4), (5, 6)])
print(dict2)

2）语法二：
a.语法

(表达式 for 变量 in 序列 if 条件语句)

b.展开

def func():
    for 变量 in 序列：
        if 条件语句：
            yield 表达式

gen = func()

print('=============语法二==============')
gen1 = ('str%d' % x for x in range(15) if x % 2)
for item in gen1:
    print(item)

3）补充：python的三目运算符
C语言 -- 条件语句?值1:值2 （如果条件语句为真整个便殴打时的结果是值1，否则是值2）
python语法 -- 值1 if 条件语句 else 值2

print('=============补充==============')
a = 10
b = 20
result = a if a > b else b
print(result)

 展开
if a > b:
    result = a
else:
    result = b
print(result)

2. 文件

数据持久化
程序中产生的数据默认是保存在内存中，程序结束数据会自动销毁，如果希望程序结果数据不销毁，那么需要对这个数据做数据持久化
数据持久化：将数据保存到文件中，然后将文件保存在磁盘/硬盘中
文件操作(对文件内容进行操作)
基本操作：打开文件 -> 操作文件（读/写） -> 关闭文件（f.close()）
open(file,mode='r',encoding=None) -- 以指定的方式打开文件，并且返回文件对象
1）打开文件
说明：

file  --  文件路径，可以写绝对路径也可以写相对路径
          a.绝对路径 - 完整路径，例如：E:/python_笔记/text.txt
          b.相对路径（需要先将文件保存在工程目录下）
          ./  --  代表当前目录（./可以省略）
          ../  --  代表当前目录的上层目录
          .../  --  代表当前目录的上层目录的上层目录
          以此类推
          
          注意：当前目录指的是当前代码所在文件对应的目录
mode  --  字符串，文件的打开方式(决定打开文件后能够进行的操作，和操作方式)
          'r'  --  以只读的方式打开文件，读出来的数据是字符串
          'w'  --  以只写的方式打开文件，写入的数据是字符串（覆盖原文件内容）
          'rb'/'br'  --  以只读的方式打开文件，读出来的数据是二进制数据
          'wb'/'bw'  --  以只写的方式打开文件，写入的数据是二进制数据
          'a'  --  以写的方式打开文件，写入的数据是字符串（在原文件的最后添加内容）
          
          注意：如果是以读的方式打开文件，文件不存在会报错（）
                如果是以写的方式打开文件，文件不存在不会报错，并且会自动创建文件对象(不会创建文件夹)

encoding  --  字符，文本编码方式
              'utf-8'(mac)  --  支持中文
              'gbk'(windows)  --  只支持英文
              
              注意：只有文本文件才能设置encoding，二进制操作不能设置encoding

print('===============打开文件=================')
# 使用绝对路径打开test.txt文件
open('./test.txt')
open('./files/test2.txt')

# f保存文件对象,只有打开文件才能得到文件对象
f = open('test.txt', 'r', encoding='utf-8')
print(type(f))
f.close()

2）操作文件

1.读操作：
文件对象.read()  --  返回文件中的内容(从读写位置获取到文件结尾)
文件对象.readline()  --  读一行内容（从读写位置开始到一行结尾）

print('============读所有===============')
f = open('test.txt', 'r', encoding='utf-8')
content = f.read()     # 读所有
print(type(content))
print(content)
# 设置读写位置在文件开头（1个中文汉字在python中的utf-8占3个字节）
f.seek(0)
print('===:', f.read())
f.close()

print('============读一行===============')
f1 = open('test.txt', 'r', encoding='utf-8')
print(f1.readline())
print(f1.readline())
print(f1.readline())
print(f1.readline())
# 读不到内容的时候返回空串
content = f1.read()
print('===:', content, type(content))
f1.close()

练习：读一个本地txt文件中的内容，一行一行的读，读完为止

f2 =open('test1.txt', 'r',encoding='utf-8')
while True:
    content = f2.readline()
    print(content)
    if not content:     # 为假
        break
f2.close()

2.写操作
文件对象.write(内容)  --  将内容写入指定文件

'w'/'a'  --  内容要求是字符串类型
'bw'/'wb'  --  内容要求是二进制(bytes)

f = open('test.txt', 'a', encoding='utf-8')
f.write('hello python')
f.close()

3.字节类型(bytes)
1）数据来源：
a. 将其他类型转换成bytes类型
整形和字符串都可以转换成bytes
b. 以'rb'/'br' 的方式读文件

整形转bytes

print(bytes(10))
print(bytes(True))

字符串转bytes(两种方法)

b1 = bytes('你好', encoding='utf-8')
print(b1)
b1 = '你好！'.encode()
print(b1)       # 字符串本身有一个方法encode(),可以将字符串转换成二进制

将bytes转字符串(两种方法)

str1 = str(b1, encoding='utf-8')
print('str1:', str1)
str1 = b1.decode(encoding='utf-8')
print('str1:', str1)

二进制文件的读写
图片、视频、音频等都是二进制文件，这些文件只能以带'b'的方式打开然后操作
二进制读操作

image_f =open('files/2.png', 'rb')
image_data = image_f.read()
print(type(image_data), image_data)

import requests
# 下载网络图片
response = requests.get('https://www.baidu.com/img/bd_logo1.png?qua=high')
# 二进制写操作
n_f = open('new.jpeg', 'wb')
n_f.write(response.content)

结合
1）打开文件

with open() as 文件对象：
    文件的操作

2）数据持久化

0）要为这个数据创建对应的本地文件
1）程序中需要这个数据的时候，从文件中去读这个数据的值
2）这个数据的值发生改变后要将最新的数据更新到本地文件中

练习：统计程序启动次数（将当前程序的启动次数打印出来）

# 1.将数据从文件中读出来
with open('files/count.txt', encoding='utf-8') as f:
    count = int(f.read())
# 2.更新数据
count += 1
print（count）
# 3.更新文件
with open('files/count.txt', 'w', encoding='utf-8') as f:
    f.write(str(count))

3. json

什么是json数据（特别重要，实用性！！）
满足json格式要求的数据就是json数据；文件内容满足json格式要求，就是json文件

1.json格式要求：1）一个json中有且只有一个数据
                2）这个数据必须是json支持的数据类型的数据
2.json支持的数据类型
数字类型(number)  --  包含所有的数字(整数和小数),并且支持科学计数法，例如：10， 23.12
字符串(string)  --  使用双引号""引起来的字符串，支持转义字符，例如："abc", "\n123", "12小红", "\u4e00"
布尔(boolean)  --  只有true和false两个值
数组(array)  --  相当于python中的列表，[12, 'acb', true, [1, 3]]
字典(dictionary)  --  相当于python中的字典，{"name": "张三", "age": 18}，键只能是字符串，值任意
null  --  相当于None，空值

python数据和json数据的相互转换
python中内置了一个json模块，用来支持json相关操作

1）json转python
json数据          （转）             python数据
数字                                  int/float
字符串                                str，有可能将双引号变成单引号
布尔                                  bool，true -> True,  false -> False
数组                                  list
字典                                  dict
null                                  None

2）
json.loads(字符串, encoding=编码方式)  --  将字符串转换成python对应的数据  
注意：这儿的字符串要求字符串中的内容必须是json格式数据(去掉字符串最外面的引号，本身就是一个json数据)

result = json.loads('"abc"', encoding='utf-8')
print([result])                                  # ['abc']
result = json.loads('true', encoding='utf-8')
print([result])                                  # [True]
result = json.loads('[12, true, "abc", null]', encoding='utf-8')
print(result, type(result))                      # [12, True, 'abc', None]  <class 'list'>

3) python转json
python数据         （转）      json数据
int/float                      数字
bool                           布尔，True -> true, False -> false
str                            字符串， 单引号会变成双引号
list/tuple                     数组
dict                           字典 
None                           null

4)
json.dumps(数据)   -  将python数据转换成json格式的字符串

result = json.dumps(100)
print([result])                           # ['100']
result = json.dumps('hello python')
print([result])                           # ["'hello python"']
result = json.dumps(True)
print([result])                           # ['true']
result = json.dumps({'abc': 23, 'name': '小明', 'gender': True, 'score': None})
print([result])                           # ['{"abc": 23, "name": "\\u5c0f\\u660e", "gender": true, "score": null}']