在开发系统的过程中,经常会用到XML存储和传输数据,XML是一种用于标记电子文件使其具有结构性的标记语言,在博客中经常会见到。
JSON是一种轻量级的数据交换格式,常被用在后端和前端的数据交互上,如你用Python提供后端WebService数据接口,App在调用这个接口时,收到的数据就是JSON文件。
txt是最常见的一种文件格式 ,主要存文本信息,即为文字信息,现在的操作系统大多使用记事本等程序保存,大多数软件可以查看,如记事本,浏览器等。
10.1 XML文件
XML指可扩展标记语言(eXtensible Markup Language)。由成对标签如<book></book>或闭环标签<book/>组成,最外部标签称为根节点。在根节点里面,可以包含很多子节点,子节点有自己的属性和文本。如下样例:book为根节点,name有自己的属性name,author的文本值为老陈,price为闭环标签。
<book> <name name="书名">12天搞定Python</name> <author>老陈</author> <price price="0.00元" /> </book>
在自带的标准库中,Python提供了大量可以用于处理XML语言的包和工具,经我和同事测试、比较,发现ElementTree模块是最好用的,所有我推荐你也用它来处理XML文件。
1. 创建XML
XML文件,从创建节点(book)开始,之后创建里面的子节点,并对子节点进行属性和内容添加。
import xml.etree.ElementTree as ET # 创建根节点 book = ET.Element("book") # 创建子节点,并添加属性和数据 title = ET.SubElement(book, "name") title.attrib = {"name": "书名"} title.text = "12天搞定Python" # 创建子节点,并添加数据 author = ET.SubElement(book, "author") author.text = "老陈" price = ET.SubElement(book, "price") # 创建子节点,并添加数据 price.attrib = {"price": "0.00元"} # 创建tree对象,写文件 tree = ET.ElementTree(book) tree.write("book.xml", encoding="UTF-8")
输出结果(book.xml文件)
<book> <name name="书名">12天搞定Python</name> <author>老陈</author> <price price="0.00元" /> </book>
2. 修改XML
修改book.xml文件,新增创建日期,修改name的属性名为arr,价格调整为0.01元。
import xml.etree.ElementTree as ET tree = ET.parse("book.xml") # 读取待修改文件 book = tree.getroot() # 创建新节点并添加为root的子节点 createDate = ET.Element("createDate") createDate.attrib = {"name": "创建日期"} createDate.text = "2020-10-01" book.append(createDate) # 修改书名的属性 name = book.find("name") name.attrib = {"name": "arr"} # 修改价格 price = book.find("price") price.text = "0.01元" # 写回原文件 tree.write("book.xml", encoding="UTF-8")
输出结果(book.xml文件)
<book> <name name="arr">12天搞定Python</name> <author>老陈</author> <price price="0.00元">0.01元</price> <createDate name="创建日期">2020-10-01</createDate> </book>
3. 删除XML节点
删节点,先找到,再用remove()方法进行删除。
import xml.etree.ElementTree as ET tree = ET.parse("book.xml") # 读取待修改文件 book = tree.getroot() for price in book.findall('price'): book.remove(price) tree.write('book.xml', encoding="UTF-8")
输出结果(book.xml文件)
<book> <name name="arr">12天搞定Python</name> <author>老陈</author> <createDate name="创建日期">2020-10-01</createDate> </book>
4. 读取XML
循环读取节点内容,输出不为None的节点。
import xml.etree.ElementTree as ET tree = ET.parse("book.xml") # 读取待修改文件 book = tree.getroot() for node in book.iter(): if node.text is not None: print(node.tag, ":", node.text)
10.2 JSON文件
JSON文件数据由一系列键值对组成并用逗号隔开和我们学过的字典可进行化互相转换。Python 中可以使用json模块对JSON 数据进行编解码。
1. 创建JSON文件
json.dumps()对字符串数据进行编码, json.dump()对文件数据进行编码。
import json # 字典转换为JSON对象 book = { 'name': "12天搞定Python", 'author': '老陈', 'price': 0.00 } # 生成json格式 json_str = json.dumps(book, ensure_ascii=False) # 写入 JSON 数据 with open('book.json', 'w') as f: json.dump(json_str, f)
输出结果(book.json文件内容)
"{"name": "12天搞定Python", "author": "老陈", "price": 0.0}"
2. 读取JSON文件
....