参考:https://github.com/dotnet/roslyn/wiki/Getting-Started-C%23-Syntax-Analysis
语法分析过程主要用到以下类或结构:
- SyntaxTree类:编译器分析源代码时,将源代码作为一个字符串处理,并将其转换成一个语法树。所以语法树总是与一段源代码对应,既可以从源代码生成语法树也可以从语法树还原出源代码。SyntaxTree类是一个抽象类,不同的语言(C#或VB)会实现相应的语法树类进行源代码的分析。SyntaxTree类是immutable的,也就是说生成后就不能再修改,如果要修改语法树,就需要创建一个新的语法树实例。
- SyntaxNode类:语法树中的结点,与源代码中的语句、表达式等内容对应。一般不会是语法树中的叶结点。
- SyntaxToken结构:语法树中的叶结点,与源代码中的关键字,运算符等内容对应。
- SyntaxTrivia结构:代表了源代码中与语法无关的内容,如空格、换行、注释等
参考代码:
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using Microsoft.CodeAnalysis;
using Microsoft.CodeAnalysis.CSharp;
using Microsoft.CodeAnalysis.CSharp.Syntax; namespace GettingStartedCS
{
class Program
{
static void Main(string[] args)
{
// 从源代码生成语法树
SyntaxTree tree = CSharpSyntaxTree.ParseText(
@"using System;
using System.Collections;
using System.Linq;
using System.Text; namespace HelloWorld
{
class Program
{
static void Main(string[] args)
{
Console.WriteLine(""Hello, World!"");
}
}
}");
// 获得语法树的根结点root,root.KindText为CompliationUnit。注意Using语句通过root.Usings属性返回,而不是作为root的子节点
var root = (CompilationUnitSyntax)tree.GetRoot();
// root只有一个namespace子节点,代表了整个namespace语句,也就是从namespace开始到最后的反大括号之间所有代码,KindText属性值为NamespaceDeclaration
var firstMember = root.Members[];
// Members列表的默认类型为MemberDeclarationSyntax,这里转换为NamespaceDeclarationSyntax
var helloWorldDeclaration = (NamespaceDeclarationSyntax)firstMember;
// namespace节点只有一个class子节点,代表了整个类型声明语句
var programDeclaration = (ClassDeclarationSyntax)helloWorldDeclaration.Members[];
// class节点也只有一个method子节点,代表了整个Main方法
var mainDeclaration = (MethodDeclarationSyntax)programDeclaration.Members[];
// main方法节点的子节点不再通过Members属性获得,ParameterList返回参数节点列表,Body属性返回方法体节点
var argsParameter = mainDeclaration.ParameterList.Parameters[];
}
}
}