Python 程序设计入门(024)—— Python 的文件操作

为了能够长期保存程序中的数据,需要将其保存到磁盘文件中。Python 提供了内置的文件对象和对文件、目录进行操作的内置模块。

一、文件对象

Python 中内置了文件(file)对象,使用文件对象时,需要先通过内置的 open() 函数创建一个文件对象,然后通过该对象提供的方法进行操作。

使用 open() 函数一定要保证关闭文件对象,即调用 close() 函数。open() 函数的语法格式如下:

file = open(filename, mode = "r", buffering = -1, encoding = None)

说明:

(1)filename:要创建或打开的文件名(必须),使用单引号或双引号括起来。如果要打开的文件和当前文件在同一目录下,可以不带路径,否则需要指定完整路径。

(2)mode:指定文件的打开模式(可选),默认的打开模式为只读(r),mode 的取值如下表所示:

mode 参数的用法如下:

常用的 mode 取值组合如下:
(1)r 或 rt:默认模式,文本模式、只读模式
(2)rb:二进制模式
(3)w 或 wt:文本模式、只写模式,打开之前文件被清空
(4)wb:二进制模式、写模式,打开之前文件被清空
(5)a:追加模式,只能写在文件末尾
(6)a+:可读写模式,写操作只能写在文件末尾
(7)w+:可读写模式,与 a+ 的区别就是写之前先清空文件内容
(8)r+:可读写模式,写之前先清空文件内容

说明:
(1)r(只读模式)、w(只写模式)、a(追加模式)为打开文件的基本模式。
(2)b(二进制模式)、t(文本模式)、+(读写模式) 与以上三个模式可以混合使用。
(3)r、rb、r+,rb+ 模式要求文件必须存在。r 与 rb 表示只读模式。r+ 与 rb+ 表示可读写,写入的新内容会替换文件中的原有内容。
(4)w、wb、w+、wb+ 模式下,如果文件已创建,则覆盖原文件,如果文件不存在,则创建新文件。w 与 wb 表示只能写入,不能读取。w+ 与 wb+ 表示可读写,但写入的内容会替换文件中的原有内容。
(5)a、ab、a+、ab+ 模式下,如果文件已创建,则将新内容追加到原文件的结尾,如果文件不存在,则创建新文件并写入新内容。a 和 ab 表示以追加模式打开文件,无法读取文件内容。a+ 和 ab+ 表示以读写方式打开文件。

(3)buffering:用于指定读写文件的缓冲模式(可选),取值为 0 时表示不缓存;取值为 1 时表示缓存;如果取值大于 1,则表示缓冲区的大小。如果取负值,缓冲区的大小则为系统默认。默认值为 -1。

(4)encoding:编码方式。Windows 系统默认是 gbk 编码,所以桌面生成的 TXT 之类的文件都是gbk 编码的。

例如:

file1 = open("d:\stu.txt",mode = "r",encoding='utf-8')
print(file1.read())
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415

二、读取文件内容的方法

读取文件内容通常使用 file 对象的 3 个方法:(1)使用 read() 方法读取全部或部分内容;(2)使用 readline() 方法逐行读取文件内容;(3)使用 readlines() 方法读取所有内容。

也可以使用 for 循环读取文件内容。

1、read() 方法

read() 方法用于读取文件的全部或部分内容。read() 方法的语法格式如下:

file.read([size]) 

说明:

(1)size 为可选参数,用于指定要读取文件内容的字符数(所有字符 size 均为 1,包括汉字)。如果省略,则返回文件的所有内容。

(2)使用 read() 方法读取文件内容时,如果文件大于可用内存,则不能实现对文件的读取,返回空字符串。

例如:

(1)读取文件的全部内容

file1 = open("d:\stu.txt",mode = "r",encoding='utf-8')
print(file1.read())
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415

(2)读取 25 个字符

file1 = open("d:\stu.txt",mode = "r",encoding='utf-8')
print(file1.read(25))
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,

2、readline() 方法

readline() 方法用于每次读取一行数据。readline() 方法的语法格式如下:

file.readline() 

例如:

(1)读取一行数据

file1 = open("d:\stu.txt",mode = "r",encoding='utf-8')
print(file1.readline())
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号

(2)读取 5 行数据

file1 = open("d:\stu.txt",mode = "r",encoding='utf-8')
for i in range(5):
    print(file1.readline(),end="")
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654

(3)读取全部数据

file1 = open("d:\stu.txt",mode = "r",encoding='utf-8')
while True:
    line = file1.readline()
    if line == "":
        break
    print(line,end="")
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415

3、readlines() 方法

readlines() 方法返回一个列表,列表中每个元素为文件中的行数据。readlines() 方法的语法格式如下:

file.readlines()

例如:

file1 = open("d:\stu.txt",mode = "r",encoding='utf-8')
list1 = file1.readlines()
print("类型",type(list1))
print("列表长度:",len(list1))
print("列表内容如下:")
print(list1)
print("遍历列表内容:")
for item in list1:
    print(item,end="")
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
类型 <class 'list'>
列表长度: 13
列表内容如下:
['姓名,性别,出生日期,院系,班级,手机号\n', '张平,女,2002-12-5,经济与管理学院,信管201班,13603735216\n', '刘涛,男,2002-10-15,经济与管理学院,信管201班,13603733334\n', '张静静,女,2003-8-6,经济与管理学院,信管212班,13603734243\n', '王强,男,2003-6-25,经济与管理学院,信管212班,13603736654\n', '张海洋,男,2002-7-9,机电学院,机制211班,13603737778\n', '刘思雨,女,2001-8-30,机电学院,机制211班,13603736538\n', '王彦强,男,2002-7-31,机电学院,机制212班,13603736528\n', '刘朝辉,男,2001-7-6,机电学院,机制201班,13603736235\n', '王鹏,男,2002-9-27,机电学院,机制201班,13603734215\n', '刘燕燕,女,2001-8-22,文法学院,法学201班,13603733685\n', '王芸,女,2002-6-30,文法学院,法学201班,13603733322\n', '刘云飞,男,2002-9-21,文法学院,法学201班,13603733415']
遍历列表内容:
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415

4、使用 for 循环读取文件内容

使用 for 循环读取文件内容格式如下:

file1 = open(filename, mode)
for line in file:
    print(line)

或:
file1 = open(filename, mode)
for line in file.readlines():
    print(line)

例如:

import os
if os.path.exists("d:\\stu.txt"):
    with open("d:\\stu.txt", mode = "r", encoding = 'utf-8') as file1:
        for line in file1:
            print(line,end="")
else:
    print("要打开的文件不存在!")
    
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415

或者:

import os
if os.path.exists("d:\\stu.txt"):
    with open("d:\\stu.txt", mode = "r", encoding = 'utf-8') as file1:
        for line in file1.readlines():
            print(line,end="")
else:
    print("要打开的文件不存在!")
        
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415

三、文件指针的操作

除了文件读取操作,有时还需要进行获取或移动指针位置的操作。

1、tell() 方法

tell() 方法返回一个整数,表示文件指针的当前位置,即在二进制模式下距离文件头的字节数。tell() 方法的语法格式如下:

file.tell()
说明:使用 tell() 方法返回的位置与 read() 中 size 参数不同。read() 方法中的 size 参数为字符数,tell() 方法返回的是字节数。汉字所占的字节数和字符编码有关,如果采用 GBK 编码,一个汉字占 2 个字节,如果采用 UTF-8 编码,一个汉字占 3 个字节。

修改放表称为单链表。

file1 = open("d:\stu.txt",mode = "r",encoding='utf-8')
file1.readlines()
print("readlines()方法把指针移动到文件结尾:",file1.tell())
file1.seek(0)  # 把指针移动到文件头
file1.readline()
print("readline()方法把指针移动到下一行的开头:",file1.tell())
file1.seek(0)  # 把指针移动到文件头
file1.read(25)
print("read(25)方法把指针移动到第25个字符:",file1.tell())
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
readlines()方法把指针移动到文件结尾: 825
readline()方法把指针移动到下一行的开头: 52
read(25)方法把指针移动到第25个字符: 62

2、seek() 方法

seek() 方法用于将文件的指针移动到新的位置,位置通过字节数指定。这里的数值与 tell() 方法返回的数值计算方法一致。seek() 方法的语法格式如下:

file.seek(offset [,whence])
说明:
(1)offset:用于指定移动的字节数。具体位置与 whence 参数有关。
(2)whence:指定从什么位置开始计算。值为 0 表示从文件头开始计算(默认),为 1 表示从当前位置开始计算,为 2 表示从文件尾开始计算。默认值为 0

例如:

file1 = open("d:\stu.txt",mode = "rb")
file1.seek(0)  # 把指针移动到文件头
print(file1.tell())

file1.seek(10)  # 把指针移动到离文件头10个字节的位置
print(file1.tell())

file1.seek(20,1)  # 再向后移动20个自节
print(file1.tell())

file1.seek(0,2)  # 把指针移动到文件尾
print(file1.tell())

file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
0
10
30
825

四、文件的写入操作

利用文件对象的 write() 方法,可以向文件中写入内容。write() 方法的语法格式如下:

file.write(string)

对于一个文件来说,能不能写入数据、数据的写入方式与打开文件的模式有关。

(1)如果一个文件以只读方式(r)打开,则无法写入

代码如下:

file1 = open("d:\stu.txt",mode = "r")
file1.write("新增一条记录:")
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
Traceback (most recent call last):
  File "C:\Python\Python38\First.py", line 2, in <module>
    file1.write("新增一条记录:")
io.UnsupportedOperation: not writable

(2)如果一个文件以只写方式打开,则无法读取内容

代码如下:

file1 = open("d:\stu.txt",mode = "w")
file1.readlines()
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
Traceback (most recent call last):
  File "C:\Python\Python38\First.py", line 2, in <module>
    file1.readlines()
io.UnsupportedOperation: not readable

(3)文件以只写方式打开,写入内容

代码如下:

file1 = open("d:\\test123.txt", mode = "w")
file1.write("Hello Python!")
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
>>> 

(4)文件以可读写(r+)方式打开,写入内容

代码如下:

file1 = open("d:\\test123.txt", mode = "r")
print(file1.read())
print(file1.tell())
file1.close()

file1 = open("d:\\test123.txt", mode = "r+")
file1.write("New!")
print(file1.tell())
file1.close()

file1 = open("d:\\test123.txt", mode = "r")
print(file1.read())
print(file1.tell())
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
Hello Python!
13
4
New!o Python!    # r+ 模式在写入时,并不清空文件,而是从第一个字符开始替换原有的内容
13

(5)文件以可读写(w+)方式打开,写入内容

代码如下:

file1 = open("d:\\test123.txt", mode = "r")
print(file1.read())
print(file1.tell())
file1.close()

file1 = open("d:\\test123.txt", mode = "w+")
file1.write("New!")
print(file1.tell())
file1.close()

file1 = open("d:\\test123.txt", mode = "r")
print(file1.read())
print(file1.tell())
file1.close()

程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
Hello Python!
13
4
New!    # w+ 模式在写入时,先清空原有文件,再写入新内容
4

(6)文件以追加方式打开,写入内容

代码如下:

file1 = open("d:\\test123.txt", mode = "r")
print(file1.read())
print(file1.tell())
file1.close()

file1 = open("d:\\test123.txt", mode = "a")
file1.write("New!")
print(file1.tell())
file1.close()

file1 = open("d:\\test123.txt", mode = "r")
print(file1.read())
print(file1.tell())
file1.close()

程序运行结果如下:
>>> 
===================== RESTART: C:\Python\Python38\First.py =====================
Hello Python!
13
17
Hello Python!New!
17

五、使用 with 语句处理文件

文件使用完要及时关闭。如果忘记关闭文件,可能出现一些意想不到的结果。另外,如果在打开文件时出现了异常,将导致文件不能被及时关闭。为了避免这些问题的产生,可以使用 with 语句实现在处理文件时,无论是否抛出异常,都能保证 with 语句执行完后关闭已经打开的文件。

with 语句的语法格式如下:

with expression as target:
    with-body

说明:

(1)expression:指定一个表达式,可以是打开文件的 open() 函数。

(2)with-body:指定 with 语句体,其中可以是执行 with 语句后相关的一些操作。如果不想执行任何操作,可以用 pass 语句代替。

例如:

with open("d:\\stu.txt", mode = "r" ,encoding = "utf-8") as file1:
    while True:
        line = file1.readline()
        if line == "":
            break
        print(line,end="")
        
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415

六、打开文件之前先判断文件是否存在

使用 open() 函数打开文件时,如果要打开的文件不存在,则会出现异常。可以使用 os.path 模块提供的 exists() 函数判断文件是否存在。

例如:

(1)以只读(r)方式打开一个不存在的文件时出现异常

代码如下:

with open("d:\\stu001.txt", mode = "r" ,encoding = "utf-8") as file1:
    while True:
        line = file1.readline()
        if line == "":
            break
        print(line,end="")
                
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
Traceback (most recent call last):
  File "C:\Python\Python38\First.py", line 1, in <module>
    with open("d:\\stu001.txt", mode = "r" ,encoding = "utf-8") as file1:
FileNotFoundError: [Errno 2] No such file or directory: 'd:\\stu001.txt'

(2)打开之前先判断文件是否存在

代码如下:

import os
if os.path.exists("d:\\stu001.txt"):
    with open("d:\\stu001.txt", mode = "r" ,encoding = "utf-8") as file1:
        while True:
            line = file1.readline()
            if line == "":
                break
            print(line,end="")
else:
    print("要打开的文件不存在!")
                    
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
要打开的文件不存在!

七、文件的编码问题

由于文件保存格式不同,在读取文件时如果格式不正确,将会出现乱码或抛出异常。

例如:

import os
if os.path.exists("d:\\stu.txt"):
    with open("d:\\stu.txt", mode = "r") as file1:
        while True:
            line = file1.readline()
            if line == "":
                break
            print(line,end="")
else:
    print("要打开的文件不存在!")
                        
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
Traceback (most recent call last):
  File "C:\Python\Python38\First.py", line 5, in <module>
    line = file1.readline()
UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 36: illegal multibyte sequence

可以使用如下三种方法解决文件的编码格式问题:

1、打开文件时指定文件的编码格式

例如,在打开文件时,指定编码格式为 【utf-8】,代码如下:

import os
if os.path.exists("d:\\stu.txt"):
    with open("d:\\stu.txt", mode = "r", encoding = "utf-8") as file1:
        while True:
            line = file1.readline()
            if line == "":
                break
            print(line,end="")
else:
    print("要打开的文件不存在!")
                            
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415

2、以二进制方式打开文件,然后对读取的内容进行编码

读取文件时如果出现字符编码错误,用二进制方式打开文件就不会出现错误了,但需要在读取文件时进行编码。先使用 isinstance() 函数判断读取的内容是否为 str 类型,如果是,则直接读取文件内容。如果不是,则使用异常处理程序尝试使用 utf-8 方式解码,否则使用 GBK 解码。

代码如下:

import os
if os.path.exists("d:\\stu.txt"):
    with open("d:\\stu.txt", mode = "rb") as file1:
        for line in file1.readlines():
            if isinstance(line,str):
                print(new,end="")
            else:
                try:
                    new = line.decode("utf-8")
                    print(new,end="")
                except:
                    try:
                        new = line.decode("GBK")
                        print(new,end="")
                    except:
                        pass
else:
    print("要打开的文件不存在!")
                                
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415

3、强制以某种模式读取文件,忽略编码错误

例如:以二进制方式读取文件的内容,然后用 GBK 编码强制读取该文件。

代码如下:

import os
if os.path.exists("d:\\stu.txt"):
    with open("d:\\stu.txt", mode = "rb") as file1:
        text = file1.read()
        new = text.decode("GBK",errors = "ignore")
        print(new)
else:
    print("要打开的文件不存在!")
                                    
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
濮撳悕,鎬у埆,鍑虹敓鏃ユ湡,闄㈢郴,鐝绾,鎵嬫満鍙
寮犲钩,,2002-12-5,缁忔祹涓庣$悊瀛﹂櫌,淇$201,13603735216
鍒樻稕,,2002-10-15,缁忔祹涓庣$悊瀛﹂櫌,淇$201,13603733334
寮犻潤闈,,2003-8-6,缁忔祹涓庣$悊瀛﹂櫌,淇$212,13603734243
鐜嬪己,,2003-6-25,缁忔祹涓庣$悊瀛﹂櫌,淇$212,13603736654
寮犳捣娲,,2002-7-9,鏈虹數瀛﹂櫌,鏈哄埗211,13603737778
鍒樻濋洦,,2001-8-30,鏈虹數瀛﹂櫌,鏈哄埗211,13603736538
鐜嬪溅寮,,2002-7-31,鏈虹數瀛﹂櫌,鏈哄埗212,13603736528
鍒樻湞杈,,2001-7-6,鏈虹數瀛﹂櫌,鏈哄埗201,13603736235
鐜嬮箯,,2002-9-27,鏈虹數瀛﹂櫌,鏈哄埗201,13603734215
鍒樼嚂鐕,,2001-8-22,鏂囨硶瀛﹂櫌,娉曞201,13603733685
鐜嬭姼,,2002-6-30,鏂囨硶瀛﹂櫌,娉曞201,13603733322
鍒樹簯椋,,2002-9-21,鏂囨硶瀛﹂櫌,娉曞201,13603733415

以二进制方式读取文件的内容,然后用 utf-8 编码强制读取该文件。

import os
if os.path.exists("d:\\stu.txt"):
    with open("d:\\stu.txt", mode = "rb") as file1:
        text = file1.read()
        new = text.decode("utf-8",errors = "ignore")
        print(new)
else:
    print("要打开的文件不存在!")
                                        
程序运行结果如下:
===================== RESTART: C:\Python\Python38\First.py =====================
姓名,性别,出生日期,院系,班级,手机号
张平,,2002-12-5,经济与管理学院,信管201,13603735216
刘涛,,2002-10-15,经济与管理学院,信管201,13603733334
张静静,,2003-8-6,经济与管理学院,信管212,13603734243
王强,,2003-6-25,经济与管理学院,信管212,13603736654
张海洋,,2002-7-9,机电学院,机制211,13603737778
刘思雨,,2001-8-30,机电学院,机制211,13603736538
王彦强,,2002-7-31,机电学院,机制212,13603736528
刘朝辉,,2001-7-6,机电学院,机制201,13603736235
王鹏,,2002-9-27,机电学院,机制201,13603734215
刘燕燕,,2001-8-22,文法学院,法学201,13603733685
王芸,,2002-6-30,文法学院,法学201,13603733322
刘云飞,,2002-9-21,文法学院,法学201,13603733415
08-19 02:29