学习ILNumerics HDF5 API。我真的很喜欢使用C#对象初始化程序在一个表达式中设置复杂的HDF5文件的选项。我创建了以下文件:
using (var f = new H5File("myFile.h5")) {
f.Add(new H5Group("myTopNode") {
new H5Dataset("dsNo1", ILMath.vec<float>(1,200)), // no attributes
new H5Group("myGroup") {
new H5Dataset("dsYes", ILMath.rand(100,200)) { // matching dataset
Attributes = {
{ "att1", 1 },
{ "att2", 2 }
}
},
new H5Dataset("dsNo2") { // attributes but wrong name
Attributes = {
{ "wrong1", -100 },
{ "wrong2", -200 }
}
}
}
});
}
现在,我正在寻找一种聪明的方法来遍历文件并筛选具有特定属性的数据集。我想查找所有至少具有一个名称中带有“ att”属性的数据集,收集并返回其内容。这是我到目前为止所做的:
IList<ILArray<double>> list = new List<ILArray<double>>();
using (var f = new H5File("myFile.h5")) {
var groups = f.Groups;
foreach (var g in groups) {
foreach (var obj in g) {
if (obj.H5Type == H5ObjectTypes.Dataset && obj.Name.Contains("ds")) {
var ds = obj as H5Dataset;
// look for attributes
foreach (var att in ds.Attributes) {
//ds.Attributes["att"].
if (att.Name.Contains("att")) {
list.Add(ds.Get<double>());
}
}
}
}
}
}
return list;
但这不是递归的。我可以采用它,但是ILNumerics声称很方便,因此必须有更好的方法吗?类似于python中的h5py吗?
最佳答案
H5Group
提供Find<T>
方法,该方法可以完成您要查找的内容。遍历整个子树,并考虑任意谓词:
var matches = f.Find<H5Dataset>(
predicate: ds => ds.Attributes.Any(a => a.Name.Contains("att")));
为什么不让您的函数返回“ ILCell”而不是“ List”?这可以更好地集成到ILNumerics内存管理中(不会有存储设备在等待垃圾收集器通过):
using (var f = new H5File("myFile.h5")) {
// create container for the dataset contents
ILCell c = cell(size(1, 1)); // one element init
// retrieve datasets filtered
var matches = f.Find<H5Dataset>(predicate: ds => {
if (ds.Attributes.Any(a => a.Name.Contains("att"))) {
c[end + 1] = ds.Get<double>();
return true;
}
return false;
});
return c;
}
一些链接:
http://ilnumerics.net/hdf5-interface.html
http://ilnumerics.net/Cells.html
http://ilnumerics.net/GeneralRules.html