CsvHelper文档-2读
这个库默认不需要做任何设置就可以很容易的使用它。如果你的类属性名称直接匹配csv的标题名称,那么可以按照下面的实例来用:
(以下所有的代码都需要引用using csvhelper
命名空间)
var csv=new CsvReader(textReader);
var records=csv.GetRecords<MyClass>();
读取全部记录
最常用的场景是使用GetRecords方法。你可以指定任何你要想要返回的对象类型,然后它会返回一个能够让你迭代IEnumerable类型结果。也就是说,每次迭代的时候,内存当中每次都会是一个值,而不是一下子把整个文件全部读进来。在你实际开始迭代读取之前,数据并不会都被拉进来。
如果你想要是使用一个匿名对象类型作为你的记录,你可以提供一个类型定义来获得记录。值类型使用default(type),引用类型使用new;
GetRecords
返回IEnumerable类型;
// By type
var records = csv.GetRecords<MyClass>();
//下面这种返回的是IEmuerable<object>
//所以需要在使用的时候as一下
var records = csv.GetRecords( typeof( MyClass ) );
// Dynamic
//动态类型对象没有智能提示
var records = csv.GetRecords<dynamic>();
// Using anonymous type for the class definition
//下面是原来的代码,其实这个匿名类型有问题,正确的结果如下
//var anony=new {Id=0,Name="",MyClass=new MyClass()};
var anonymousTypeDefinition =
{
Id = default( int ),
Name = string.Empty,
MyClass = new MyClass()
};
var records = csv.GetRecords( anonymousTypeDefinition );
迭代记录
可以通过一个可以重复使用的类的实例来迭代记录。每次迭代都会hydrate所提供的记录,但是只有被映射的成员。如果你提供了一个没有映射成员的映射,成员将不会hydrate当前行的数据(如果类中有没有和csv文件对应的属性,那么就会抛出异常)。所以要小心,投射的时候你调用的任何方法,会强制IEnumerable的评估,比如ToList(),最后你将会得到一个所有记录都是来自hydratec csv文件中最后一个记录相同记录集合。
原文用的是hydrate,本意是水合,我不清楚这里的意思是不是指将简单字符串包装成对象
var record = new MyClass();
var records = csv.EnumerateRecords( record );
//下面的records如果使用tolist()的方法,就会得到相同的最后一个记录。
foreach( var r in records )
{
// r is the same instance as record.
}
读取记录
为了获得单个记录甚至字段,你需要在记录当中通过Read
方法进行迭代。Read
方法会将reader移动到下一条记录,在你实际读取任何记录前,比如先调用Read
方法。在GetRecords
方法中,Read会被自动调用。
Read
移动reader到下一个记录;
csv.Read();
ReadAsync
异步版本,当TextReader是来自网络或者非常慢的时候会是个好主意。
await csv.ReadAsync();
ReadHeader
csv文件中的header是另外一个记录,有特殊含义,如果文件有一个header记录的话,你需要再第一次读取的时候先读取header,之后开始循环读取记录,这样就可以读取不同行上的header,甚至各种header。
csv.Read();
csv.ReadHeader();
while( csv.Read() )
{
var record = csv.GetRecord<MyClass>();
}
获取一个单独的记录
有时候你可能会想自己循环访问记录,你可以获得一个单独的记录,就像获得一些记录一样
GetRecord
// Don't forget to read the data before getting it.
csv.Read();
// By type
var record = csv.GetRecord<MyClass>();
var record = csv.GetRecord( typeof( MyClass ) );
// Dynamic
var record = csv.GetRecord<dynamic>();
// Using anonymous type for the class definition
//这里和上面有同样的问题
var anonymousTypeDefinition =
{
Id = default( int ),
Name = string.Empty,
MyClass = new MyClass()
};
var record = csv.GetRecord( anonymousTypeDefinition );
获取字段
如果你需要更细度的获取记录,你可以尝试获取单独的字段;
Indexer
如果你需要用indexer来获取位置和名称,将会返回这个字段的字符串值;
// Don't forget to read the data before getting it.
csv.Read();
// By position
var field = csv[0];
// By header name
var field = csv["HeaderName"];
GetField
可以把字段转换为特定类型
// Don't forget to read the data before getting it.
csv.Read();
// Gets field by position returning string
var field = csv.GetField( 0 );
// Gets field by position returning int
var field = csv.GetField<int>( 0 );
// Gets field by header name returning bool
var field = csv.GetField<bool>( "IsTrue" );
// Gets field by header name returning object
var field = csv.GetField( typeof( bool ), "IsTrue" );
TryGetField
如果数据不是确定的,有时候可能无法转换,所以需要使用TryGetField。
// Don't forget to read the data before getting it.
csv.Read();
var success = csv.TryGetField<int>( 0, out string field );
错误格式字段的处理
如果字段的格式错误,意味着它不是标准的RFC4180.RFC4180.如果使用一些修正策略的话还是可以读取的,通常来说,当一个格式错误的文件用Excel打开的时候会自动恢复好。
\r or \n is used instead of \r\n
Both \r and \n are handled as a line ending, just like \r\n.
No \r\n at the end of the file
The last row and field is read as if there was a \r\n.
Escaped field has space before first quote.
The field is treated as a non escaped field.
, "field", -> ][ "field"][
Escaped field has characters after second quote.
Characters after second quote aren't modified.
,"field" , -> ][field ][
,"field" "s, -> ][field "s][
,"field "" s", -> ][field " s"][
Escaped field has no ending quote.
The field will go to the end of the file.
a,b,"c\r\nd,e,f\r\n -> [a][b][c\r\nd,e,f\r\n]
读取上下文
读取的时候,所有系统中信息会包含在一个上下文对象当中,如果你因为某种原因需要得到原始的系统信息,可以从它里面获取。当一个异常被抛出的时候,上下文会被包含在异常当中,你可以检查当前reader的状态;