一、xml格式介绍
XML(eXtensible Markup Language)是一种标记语言,它的设计目的是为了存储和传输数据,而不是用于显示数据,这一点与HTML(HyperText Markup Language)不同。以下是XML的一些关键特点和用途的介绍:
-
自我描述性:
XML文档使用标签(tags)来描述数据的结构和含义,这些标签是自定义的,不同于HTML中的预定义标签。
例如, < e m p l o y e e > 、 < n a m e > 、 < a g e > <employee>、<name>、<age> <employee>、<name>、<age>等都是用户定义的标签,用于表示员工信息的不同部分。 -
可扩展性:
用户可以根据需要定义自己的标签集,这使得XML能够适应各种各样的数据模型。
标签的命名不受限制,只要遵循一定的命名规则即可。 -
结构化数据:
XML文档通常具有层次结构,即元素(elements)可以嵌套在其他元素内,形成树状结构。
这种结构使得解析和处理XML数据变得相对容易。 -
平台和语言无关:
XML是跨平台的,可以在任何支持XML解析器的系统上使用。
它也是语言无关的,可以被多种编程语言处理。 -
数据交换的标准:
由于其结构化和自我描述的特性,XML成为不同系统间交换数据的常见格式。
许多API和Web服务都使用XML作为数据传输的格式。 -
XML Schema 和 DTD:
XML文档可以使用XML Schema(XSD)或Document Type Definitions(DTD)来定义文档的结构和数据类型,从而保证数据的一致性和有效性。 -
与CSS和XSLT的结合:
尽管XML不关心数据的显示,但它可以与CSS(Cascading Style Sheets)结合来控制文档的外观。
XSLT(XSL Transformations)则用于将XML转换成其他格式,如HTML或PDF。 -
配置文件:
XML常用于应用程序的配置文件,因为它提供了清晰的数据组织方式。 -
解析和验证:
存在多种库和工具(如Java的DOM, SAX, StAX等)用于解析XML文档,验证其结构和内容是否有效。 -
缺点:
相比于二进制格式,XML文档通常较大,占用更多存储和传输资源。
解析和生成XML也需要更多的计算资源。
总之,XML是一种灵活且广泛使用的数据表示和交换格式,特别是在需要结构化数据和跨系统集成的场景下。
xml格式示例:
<?xml version="1.0" encoding="UTF-8"?>
<catalog>
<!-- 书籍条目 -->
<book id="bk101">
<author>Gambardella, Matthew</author>
<title>XML Developer's Guide</title>
<genre>Computer</genre>
<price>44.95</price>
<publish_date>2000-10-01</publish_date>
<description>An in-depth look at creating applications with XML.</description>
</book>
<!-- 另一本书条目 -->
<book id="bk102">
<author>Ralls, Kim</author>
<title>Midnight Rain</title>
<genre>Fantasy</genre>
<price>5.95</price>
<publish_date>2000-12-16</publish_date>
<description>A former architect battles corporate zombies.</description>
</book>
<!-- 更多书籍条目可以继续添加... -->
</catalog>
在这个示例中,catalog是根元素,它包含了两个book元素,每个book元素都有自己的属性(如id)和子元素(如author、title等)。属性值放在引号中,并且紧跟在元素名之后,使用空格分隔。元素内容可以是纯文本,或者进一步包含其他元素。此外,注释以 包裹,用来提供非结构化的文本信息。
二、json格式介绍
JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,它以文本形式存储和交换数据,易于人阅读和编写,同时也易于机器解析和生成。JSON是基于JavaScript的一个子集,但它是语言无关的,可以被多种编程语言支持。以下是JSON格式的关键特点和组成部分:
- 对象(Object):
- 对象在JSON中用花括号 {} 包裹。
- 对象由零个或多个键值对(key-value pairs)组成,键值对之间用逗号 , 分隔。
- 键(key)是字符串,用双引号 " " 包围,值(value)可以是各种数据类型,包括字符串、数字、布尔值、数组、null,甚至是另一个JSON对象。
- 键和值之间用冒号 : 分隔,如:“key”: value。
- 数组(Array):
- 数组在JSON中用方括号 [] 包裹。
- 数组由零个或多个值组成,值之间用逗号 , 分隔。
- 数组中的值可以是任意数据类型,包括其他JSON对象或数组。
- 数据类型:
- 字符串(String): 使用双引号包围,如 “example string”。
- 数字(Number): 可以是整数或浮点数,如 42 或 3.14。
- 布尔值(Boolean): true 或 false。
- null: 代表空值,只有一种形式:null。
- 空值(Empty): JSON没有单独的空值,通常用 null 表示。
- 语法规范:
- 所有的键必须是字符串,且必须用双引号包围,不能用单引号。
- JSON数据必须有正确的缩进和换行,以保持良好的可读性,但不是必需的。
- JSON不允许包含注释,与JavaScript不同。
- JSON与JavaScript对象的关系:
- 在JavaScript中,JSON格式可以直接转换为JavaScript对象,反之亦然。
- JavaScript对象与JSON对象的区别在于JSON是字符串形式,而JavaScript对象是实际的对象实例。
- JSON与XML比较:
- JSON通常比XML更紧凑,因此在网络传输中更高效。
- JSON解析和生成通常更快,因为其语法更简单。
- JSON更适合人类直接阅读和编写,而XML更适合机器解析和验证。
- JSON-LD:
JSON-LD(JSON for Linked Data)是JSON的一个扩展,用于在Web上表示语义数据,它允许将JSON数据与RDF(Resource Description Framework)框架结合,增强了数据的互操作性。
简单数据示例:
{
"name": "John Doe",
"age": 35,
"isStudent": false,
"hobbies": ["reading", "gaming"],
"address": {
"street": "123 Main St",
"city": "New York",
"country": "USA"
}
}
三、解析工具类代码
import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.JSONArray;
import com.alibaba.fastjson.JSONObject;
import com.alibaba.fastjson.parser.Feature;
import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import java.util.Iterator;
import java.util.List;
import java.util.Map;
import java.util.regex.Pattern;
/**
* fastjson工具类(需要引入fastjson和dom4j的pom依赖)
* @author hulei
* @Date 2023/3/15 17:18
*/
public class FastJsonUtil {
/**
* xml转fastjson
* @param xml 待转换数据xml字符串
* @return JSONObject对象
*/
public static JSONObject xmlToFastJson(String xml){
JSONObject jsonObject = null;
try {
jsonObject = new JSONObject();
Document document = DocumentHelper.parseText(xml);
// 获取根节点元素对象
Element root = document.getRootElement();
iterateNodes(root, jsonObject);
}catch (Exception e){
return jsonObject;
}
return jsonObject;
}
/**
* fastjson转xml
* @param jsonStr 待转换json字符串
* @param escape 是否忽略特殊字符(即特殊字符转xml后追加CDATA)
* @return
*/
public static String fastJsonToXml(String jsonStr,Boolean escape) {
try {
StringBuffer buffer = new StringBuffer();
//带顺序
JSONObject json = JSONObject.parseObject(jsonStr, Feature.OrderedField);
jsonToXmlStr(json,buffer, escape != null && escape);
return buffer.toString();
} catch (Exception e) {
e.printStackTrace();
return "";
}
}
/**
* object转JSONObject
* @param t
* @param <T>
* @return
*/
public static <T> JSONObject objectToJSONObject(T t){
return JSONObject.parseObject(JSON.toJSONString(t));
}
/**
* json字符串转实体对象
* @param jsonString
* @param clazz
* @param <T>
* @return
*/
public static <T> T jsonStrToEntity(String jsonString,Class<T> clazz){
return JSONObject.parseObject(jsonString,clazz);
}
public static void iterateNodes(Element node, JSONObject json) {
// 获取当前元素的名称
String nodeName = node.getName();
// 判断已遍历的JSON中是否已经有了该元素的名称
if (json.containsKey(nodeName)) {
// 该元素在同级下有多个
Object Object = json.get(nodeName);
JSONArray array;
if (Object instanceof JSONArray) {
array = (JSONArray) Object;
}
else {
array = new JSONArray();
array.add(Object);
}
// 获取该元素下所有子元素
List<Element> listElement = node.elements();
if (listElement.isEmpty()) {
// 该元素无子元素,获取元素的值
String nodeValue = node.getTextTrim();
array.add(nodeValue);
json.put(nodeName, array);
return;
}
// 有子元素
JSONObject newJson = new JSONObject();
// 遍历所有子元素
for (Element e : listElement) {
// 递归
iterateNodes(e, newJson);
}
array.add(newJson);
json.put(nodeName, array);
return;
}
// 该元素同级下第一次遍历
// 获取该元素下所有子元素
List<Element> listElement = node.elements();
if (listElement.isEmpty()) {
// 该元素无子元素,获取元素的值
String nodeValue = node.getTextTrim();
json.put(nodeName, nodeValue);
return;
}
// 有子节点,新建一个JSONObject来存储该节点下子节点的值
JSONObject object = new JSONObject();
// 遍历所有一级子节点
for (Element e : listElement) {
// 递归
iterateNodes(e, object);
}
json.put(nodeName, object);
return;
}
private static void jsonToXmlStr(JSONObject json,StringBuffer buffer,Boolean isEscape){
Iterator<Map.Entry<String,Object>> it = json.entrySet().iterator();
Map.Entry<String,Object> en;
while(it.hasNext()){
en = it.next();
if(en.getKey().startsWith("-")){
continue;
}
if(en.getKey().equals("#text")){
//直接输出文本
buffer.append(en.getValue());
continue;
}
if(en.getValue() instanceof JSONObject){
buffer.append("<").append(en.getKey()).append(getAttr((JSONObject) en.getValue())).append(">");
JSONObject jo = json.getJSONObject(en.getKey());
jsonToXmlStr(jo,buffer,isEscape);
buffer.append("</").append(en.getKey()).append(">");
}else if(en.getValue() instanceof JSONArray){
JSONArray jsonArray = json.getJSONArray(en.getKey());
for (int i = 0; i < jsonArray.size(); i++) {
JSONObject jsonobject = jsonArray.getJSONObject(i);
buffer.append("<").append(en.getKey()).append(getAttr(jsonobject)).append(">");
jsonToXmlStr(jsonobject,buffer,isEscape);
buffer.append("</").append(en.getKey()).append(">");
}
}else{
buffer.append("<").append(en.getKey()).append(">").append(isEscape ? escape(String.valueOf(en.getValue())) : String.valueOf(en.getValue())).append("</").append(en.getKey()).append(">");
}
}
}
/**
* 拼当前节点属性
* @param json
* @return
*/
private static String getAttr(JSONObject json){
StringBuilder sb = new StringBuilder();
for(Map.Entry<String,Object> entity:json.entrySet()){
if(entity.getKey().startsWith("-")){
sb.append(" ").append(entity.getKey().substring(1)).append("=\"").append(entity.getValue().toString()).append("\"");
}
}
return sb.toString();
}
/**
* 特殊字符pattern
*/
private static Pattern pattern = Pattern.compile("[<>&\"',]");
/**
* json转xml中遇到特殊字符对内容追加![CDATA[]]
* @param string
* @return
*/
private static String escape(String string) {
return pattern.matcher(string).find() ? "<![CDATA[" + string + "]]>" : string;
}
/**
* 判断是否是JSON数组
* @param str
* @return
*/
public static boolean isJsonArray(String str) {
if (str.isBlank()) {
return false;
}
return isWrap(str.trim(), '[', ']');
}
public static boolean isWrap(CharSequence str, char prefixChar, char suffixChar) {
if (null == str) {
return false;
}
return str.charAt(0) == prefixChar && str.charAt(str.length() - 1) == suffixChar;
}
}