Python中对open读取文件内容时的mode模式解析-阿里云开发者社区

Python中对open读取文件内容时的mode模式解析

2023-07-22 123

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

全局流量管理 GTM，标准版 1个月

云解析 DNS，旗舰版 1个月

公共DNS（含HTTPDNS解析），每月1000万次HTTP解析

简介： Python中对open读取文件内容时的mode模式解析

1.Python可以使用open函数来实现文件的打开，关闭，读写操作；

Python3中的open函数定义为：

open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True)

其中mode列表为：

'r' #open for reading (default)
'w' #open for writing, truncating the file first
'x' #create a new file and open it for writing，python3新增
'a' #open for writing, appending to the end of the file if it exists
'b' #binary mode
't' #text mode (default)，python3新增
'+' #open a disk file for updating (reading and writing)
'U' #universal newline mode (deprecated)

这里我们主要关心一下'r', 'w', 'a', 'r+', 'w+', 'a+', 'x'，很多人容易混淆不同模式的读写操作

2.'r'

只读模式，open函数中mode参数的默认模式，文件不存在的话，报FileNotFoundError(python2是IOError)；
文件打开后，初始游标位置为0；
每次读都是从游标位置开始读；
如果进行了写操作，会报如下异常：
io.UnsupportedOperation: not writable

3.'w'

只写模式，文件不存在的话，创建文件；文件存在的话，首先清空文件，然后开始写；
文件打开后，初始游标位置为0；
每次写都是从游标位置开始写；
如果进行了读操作，首先文件也会被清空，会报如下异常：
io.UnsupportedOperation: not readable

4.'a'

追加模式，文件不存在话，创建文件；文件存在的话，不会清空文件；
文件打开后，初始游标位置为文件结尾；
每次写都是从结尾开始写；
如果进行了读操作，同时报如下异常：
io.UnsupportedOperation: not readable

上面的比较好理解，下面就有点绕了

5.'r+'

读写模式，文件不存在的话，报FileNotFoundError(python2是IOError)；
文件打开后，初始游标位置为0；
每次读写都是从游标位置开始；但是对于写操作，类似于替换操作；
看如下代码：
文件内容为：

abcdefg

代码内容为：

f = open('open_mode.txt', 'r+')
f.write('xyz')
f.close()

运行代码后，文件内容变为：

xyzdefg

6.'w+'

只写模式，文件不存在的话，创建文件；文件存在的话，首先清空文件；
文件打开后，初始游标位置为0；
每次读写都是从游标位置开始；写操作，类似于替换操作；

7.'a+'

追加模式，文件不存在话，创建文件；文件存在的话，不会清空文件；
文件打开后，初始游标位置为文件结尾；
每次写都是从结尾开始写；
读操作从游标位置开始；

8.'x'

python3新加
创建文件并写操作，操作必须是不存在的文件，如果操作的文件已存在，则报错FileExistsError
不可读，如果进行了读操作，同时报如下异常：

io.UnsupportedOperation: not readable

9.'b'

二进制形式读写文件；
写数据时，写入的数据类型必须为字符串类型，其他类型必须通过json(就是符合json格式的字符串)写入
python2与python3对于'b’ mode的行为不同，这和python2与python3的字符串类型有关；事实上，python的字符串类型有两种；
Python2的两种字符串类型，分别叫做str和Unicode，str实例包含原始的8位值；而unicode的实例，则包含Unicode字符。
Python2的两种字符串类型，分别叫做byte和str，与python2不同的是，byte实例包含原始的8位值；而str的实例，则包含Unicode字符。
当读写文件采用'b'的模式时，要求必须以二进制形式读写，在python2中，字符串必须为str字符串，python3中必须为byte字符串；所以在python3，'b'模式下这样读写字符串

s = b'hello world!' #注意是byte字符串
f = open('open_mode.txt','wb')
f.write(s)

或：

s = 'hello world!'f= open('open_mode.txt','wb')
f.write(s.encode(encoding='utf-8'))

不然会报如下错误：

Traceback (most recent call last):
File"C:/Users/Desktop/Python/cnblogs/数据类型.py", line 125, in f.write(s)
TypeError: a bytes-like object is required, not 'str'

read文本的相关方法

准备测试数据 test.txt

富强、民主、文明、和谐，
自由、平等、公正、法治，
爱国、敬业、诚信、友善。

python 读取文件的常用方法open()
读取的方法，有read(),readline(),readlines()

1.read()

read()方法是读取整个文件,将整个文件的内容放在一个字符串变量中.
这个方法的缺点就是当文件过大尤其是大于内存时,方法就失效了.

with open("test.txt", "r", encoding='UTF-8')as f:
    res = f.read()
    print(res)

直接输出文件里的所有内容

富强、民主、文明、和谐，
自由、平等、公正、法治，
爱国、敬业、诚信、友善。

2.readline()

readline()方法是每次只读取一行,并将读取的内容放在一个字符串变量中,缺点是这种方法比较慢.

with open("test.txt", "r", encoding='UTF-8')as f:
    res = f.readline()
    print(res)

执行的效果为

富强、民主、文明、和谐，

要想获取全部的内容,就需要自己手动循环了

#学习中遇到问题没人解答？小编创建了一个Python学习交流群：711312441
with open("test.txt", "r", encoding='UTF-8')as f:
    while True:
        line = f.readline()
        if line:
            print(type(line), line)
        else:
            break

结果为

<class 'str'> 富强、民主、文明、和谐，
<class 'str'> 自由、平等、公正、法治，
<class 'str'> 爱国、敬业、诚信、友善。

3.readlines()

readlines()方法一次性读取整个文件,并自动将内容分析成一个行的列表:

with open("test.txt", "r", encoding='UTF-8')as f:
    res = f.readlines()
    print(res)

结果为

['富强、民主、文明、和谐，\n', '自由、平等、公正、法治，\n', '爱国、敬业、诚信、友善。']

去掉/n及分割

with open("test.txt", "r", encoding='UTF-8')as f:
    res = f.read()
    print(res)
    list = res.replace('\n', '，').split('，')
    print(list)

# 循环lines
with open("test.txt", "r", encoding='UTF-8')as f:
    lines = f.readlines()
    for line in lines:
        print(line)