Python 文件操作与路径

简介: 假如在根目录的 Users 文件夹下有一个文件夹 xiaoaoquan, 其中有一个 Documents 文件夹,存储了 report.docx 文件。路径指明了文件在计算机中存储的位置。函数创建文件对象赋值给 file1 后, 直接查看其内容可以看到该 对象打开的物理文件(含路径和文件名),打开模式和编码。码只能表示英文字母和符号的限制, 为每种语言的每个字符设定了唯一的编码,以满足跨语言、跨平台进行文本转换和处理的要求。方法返回指 定目录中包含的文件和子目录列表,默认情况下返回当前工作目录中的信息。
✅作者简介:人工智能专业本科在读,喜欢计算机与编程,写博客记录自己的学习历程。
🍎个人主页: 小嗷犬的博客
🍊个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。
🥭本文内容:Python 文件操作与路径

1.文件与路径

在计算机中,文件指的是存储在磁盘上的数据序列,它可以包含任何数据内容。

文件名是文件的一个重要属性。文件名通常由文件主名和扩展名构成。一般来说, 主名和扩展名之间用一个圆点“.”隔开。 扩展名由 1 ~ 4 个字符组成,用于表示文件的类型。 例如:report.docx 是主名为report、扩展名为docx 的word文档,searchGoods.py 是主名为searchGoods、扩展名为 py 的 Python 源文件。

计算机中使用文件夹(也常常称为目录)来组织文件。文件夹可以包含文件和其他文件夹。

路径指明了文件在计算机中存储的位置。路径中包含了存储文件的各级文件夹。文件夹之间用斜线隔开。在 Windows 中使用倒斜杠\来分隔,在 Mac OS 和 Linux 中使 用正斜杠/作为路径分隔符。有两种方式表示文件路径。

  • 绝对路径:从根目录开始的路径。
  • 相对路径:从当前工作目录开始的路径。

还有点.和点点..文件夹。它们不是真正的文件夹,而是可以在路径中使用的特殊名称。单个的句点(“点”)用作文件夹目名称时,是“这个目录”的缩写。两个句点(“点点”)意思是父文件夹。

每个运行在计算机上的程序, 都有一个“当前工作目录”。 在 Python 中, 可以用 os 模块中的 getcwd() 方法获取当前工作目录:

import os
os.getcwd()
假如在根目录的 Users 文件夹下有一个文件夹 xiaoaoquan, 其中有一个 Documents 文件夹,存储了 report.docx 文件。

用绝对路径描述这个文件的位置为:

/Users/xiaoaoquan/Documents/report.docx
如果当前工作目录是 /Users/xiaoaoquan,用相对路径描述这个文件的位置为:
Documents/report.docx
os 模块中还包含大量文件相关操作的方法。 例如, listdir(path=None) 方法返回指 定目录中包含的文件和子目录列表,默认情况下返回当前工作目录中的信息。
os.listdir()

2.文本文件与二进制文件

计算机上存储的文件都是以二进制存储的,一般可以采取以下两种方式读取:

  • 文本文件:文件内容是常规的字符, 不会包含字体、大小和颜色等信息, 例如带 有 .py 扩展名的 Python 源文件。
  • 二进制文件:文件内容是特殊的字节数据, 例如 Word 文档、PDF 文档、图像文件 和编译后的可执行文件。

计算机中使用字符集表示字符。最常用的美国标准信息交换代码(American Standard Code for Information Interchange,ASCII 码)定义了从 0 到 127 的整数对应的字符。

print(ord('a'))
print(chr(97))
Unicode 突破了 ASCII 码只能表示英文字母和符号的限制, 为每种语言的每个字符设定了唯一的编码,以满足跨语言、跨平台进行文本转换和处理的要求。
print(ord('嗷'))
Unicode 字符按照特定编码规则(例如 UTF8 编码)翻译为原始字节形式的过程被称为 编码。反过来,把原始字节翻译为 Unicode 字符串的过程则被称为 解码

3.操作文件

在 Python 中,操作文件包含 3 个步骤:

  1. 调用 open() 函数打开物理文件,返回一个文件对象。
  2. 调用文件对象的 read()write() 方法读写文件。
  3. 调用文件对象关闭文件。

3.1 打开文件

Python 通过内置的 open() 函数打开文件并创建该对象。

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
file1 = open('test.txt')
print(type(file1))
print(file1)
利用内置 open() 函数创建文件对象赋值给 file1 后, 直接查看其内容可以看到该 对象打开的物理文件(含路径和文件名),打开模式和编码。

参数 mode 是打开文件的模式,如表所示,默认值为 'rt':

模式 说明
'r' 只读模式,如果文件不存在,返回异常FileNotFoundError,默认值
'w' 覆盖写模式,文件不存在则创建,存在则完全覆盖源文件
'x' 创建写模式,文件不存在则创建,存在则返回异常FileExistsError
'a' 追加写模式,文件不存在则创建,存在则在原文件最后追加内容
'b' 二进制文件模式
't' 文本文件模式,默认值
'+' 与r/w/x/a一同使用,在原功能基础上增加同时读写功能
参数 encoding 是指定文本文件读取数据时解码或写入数据时编码所用的规则, 为默认值 None 时使用的规则取决于操作系统。通过 sys 模块的方法可以查看当前默认编码。
import sys
sys.getdefaultencoding()

3.2 关闭文件

在操作完文件后,必须将文件关闭,这点非常重要。

调用文件对象的 close() 方法可以关闭文件, 终止文件对象与磁盘物理文件的连接、 释放操作系统资源。在写入和追加写入模式下,暂存于内存中的文件内容会输出到磁盘中永久保存。

file1 = open('test.txt')
file1.close()

3.3 写入文本文件

当指定 open() 函数的 mode 参数值为 ' w' ' x' 和 ' a' 时,可以向创建的文件对象中写入数据。使用文件对象的 write() 方法就可以将文本写入文件中。
file_obj.write(text)
file1 = open('test.txt', 'w', encoding='utf-8')
file1.write('我是小嗷犬。\n')
file1.close()

3.4 读取文本文件

在 Python 中, 使用 open() 函数打开文件时, mode 参数的默认值是“ rt”, 即以文本文件的形式读取文件。

3.4.1 使用文件内置方法读取

对于可读的文件对象,可以使用表的四种方法读取内容:
方法 说明
.readall() 以字符串形式返回整个文件内容
.read(size=-1) 默认读入从当前位置至文件末尾的内容;当size参数为大于0的正整数n时, 从文件中读入最多n个字符
.readline(size = -1) 默认从文件中读入一行内容;当size参数为大于0的正整数n时, 从当前行读入最多n个字符
.readlines(hint=-1) 默认返回以文件中所有行为元素构成的列表;当hint参数为大于0的正整数n时,读入的所有行字符数不超过 n行
当打开文本文件时,会有一个指针指向文件开头的字符。每次读取数据后,指针会往后移动到相应位置。 例如,在使用 readline() 读入一行内容时, 指针会移动到下一个换行符的后面,直到指向文件尾部标记 EOF(end of file)

3.4.2 使用 for 循环逐行读取

在绝大多数情况下,对于文本文件的读取都是逐行读取。文件对象本身是一个可迭代对象。 因此,通常情况下,推荐使用 for 循环来逐行读取文本文件内容。
file1 = open('test.txt', 'w', encoding='utf-8')
file1.write('我是小嗷犬。\n喜欢嗷嗷嗷。\n')
file1.close()
file2 = open('test.txt', encoding='utf-8')
for line in file2:
    print(line)
file2.close()

3.4.3 使用列表推导式和 map() 函数逐行处理

文件作为可迭代对象, 可以使用列表推导式和 map() 函数对每行进行相应处理, 生成新的列表。
file1 = open('test.txt', 'w', encoding='utf-8')
file1.write('我是小嗷犬,\n喜欢嗷嗷嗷。\n')
file1.close()
file2 = open('test.txt', encoding='utf-8')
lines1 = [line.rstrip() for line in file2]
print(lines1)
lines2 = list(map(lambda line: line.rstrip(), file2)
print(lines2)
file2.close()

3.5 使用 with 语句自动管理

Python 中的 with 语句适用于对资源进行访问的场合, 确保不管使用过程中是否发生异常都会释放资源,比如文件使用后自动关闭。
file1 = open('test.txt', 'w', encoding='utf-8')
file1.write('我是小嗷犬。\n喜欢嗷嗷嗷。\n')
file1.close()
with open('test.txt', encoding='utf-8') as file2:
    for line in file2:
        print(line)

目录
相关文章
|
23天前
|
计算机视觉 Windows Python
windows下使用python + opencv读取含有中文路径的图片 和 把图片数据保存到含有中文的路径下
在Windows系统中,直接使用`cv2.imread()`和`cv2.imwrite()`处理含中文路径的图像文件时会遇到问题。读取时会返回空数据,保存时则无法正确保存至目标目录。为解决这些问题,可以使用`cv2.imdecode()`结合`np.fromfile()`来读取图像,并使用`cv2.imencode()`结合`tofile()`方法来保存图像至含中文的路径。这种方法有效避免了路径编码问题,确保图像处理流程顺畅进行。
122 1
|
3天前
|
数据挖掘 Python
🚀告别繁琐!Python I/O管理实战,文件读写效率飙升的秘密
在日常编程中,高效的文件I/O管理对提升程序性能至关重要。Python通过内置的`open`函数及丰富的库简化了文件读写操作。本文从基本的文件读写入手,介绍了使用`with`语句自动管理文件、批量读写以减少I/O次数、调整缓冲区大小、选择合适编码格式以及利用第三方库(如pandas和numpy)等技巧,帮助你显著提升文件处理效率,让编程工作更加高效便捷。
16 0
|
23天前
|
安全 项目管理 Python
使用Python shutil库进行文件和目录操作
使用Python shutil库进行文件和目录操作
使用Python shutil库进行文件和目录操作
|
8天前
|
监控 安全 Java
文件操作不再难!Python系统编程实战,带你轻松驾驭文件系统与I/O
【9月更文挑战第13天】在Python系统编程中,文件操作与I/O管理至关重要。本文通过五个实战案例分享最佳实践:高效遍历文件系统、优雅处理文件读写、利用缓冲机制优化性能、并行处理文件加速任务以及异常处理确保程序稳健。使用pathlib、上下文管理器及concurrent.futures等工具,助你轻松掌握Python文件系统与I/O操作,提升编程效率和项目质量。 示例代码展示了如何使用pathlib遍历目录、with语句安全读写文件、控制缓冲区大小、并行处理多个文件以及捕获异常保证程序稳定运行。通过这些技巧,你将能够在实际项目中更加高效地管理和操作文件。
27 6
|
11天前
|
Java 数据安全/隐私保护 Python
Python案例分享:如何实现文件的解压缩
Python案例分享:如何实现文件的解压缩
37 8
|
11天前
|
存储 缓存 安全
Python案例分享:如何实现文件的上传下载
Python案例分享:如何实现文件的上传下载
51 6
|
26天前
|
数据挖掘 数据处理 数据格式
Python读取.nc文件的方法与技术详解
通过上述方法,用户可以根据需求选择合适的库来读取.nc文件,并根据实际情况进行必要的数据操作,这是科学数据处理和分析中的一个重要技能。
49 10
|
19天前
|
机器学习/深度学习 数据采集 TensorFlow
使用Python实现智能物流路径优化
使用Python实现智能物流路径优化
39 1
|
23天前
|
Python
像导入Python模块一样导入ipynb文件
像导入Python模块一样导入ipynb文件
|
23天前
|
Ubuntu Linux 数据安全/隐私保护
使用Cython库包对python的py文件(源码)进行加密,把python的.py文件生成.so文件并调用
本文介绍了在Linux系统(Ubuntu 18.04)下将Python源代码(`.py文件`)加密为`.so文件`的方法。首先安装必要的工具如`python3-dev`、`gcc`和`Cython`。然后通过`setup.py`脚本使用Cython将`.py文件`转化为`.so文件`,从而实现源代码的加密保护。文中详细描述了从编写源代码到生成及调用`.so文件`的具体步骤。此方法相较于转化为`.pyc文件`提供了更高的安全性。
33 2