我有一个HTML,我需要按类获取一些节点。所以我做不到,因为
我不知道XML路径
所需项目没有ID,只有类别
HtmlAgilityPack不允许获取所有元素(例如XDocument
允许),但是doc.Elements()
仅当我有ID时才有效,但我没有。所以我也不知道XML路径,所以我不能使用SelectNodes
方法
我不能使用正则表达式
我的代码是
public static class HapHelper
{
private static HtmlNode GetByAttribute(this IEnumerable<HtmlNode> htmlNodes, string attribute, string value)
{
return htmlNodes.First(d => d.HasAttribute(attribute) && d.Attributes[attribute].ToString() == value);
}
public static HtmlNode GetElemenyByAttribute(this HtmlNode parentNode, string attribute, string value)
{
return GetByAttribute(parentNode.Descendants(), attribute, value);
}
public static bool HasAttribute(this HtmlNode d, string attribute)
{
return d.Attributes.Contains(attribute);
}
public static HtmlNode GetElementByClass(this HtmlNode parentNode, string value)
{
return parentNode.GetElemenyByAttribute("class", value);
}
}
但它不起作用,因为
Descendants()
仅返回最近的节点。我能做什么?
最佳答案
学习XPath! :-)非常简单,可以很好地为您服务。在这种情况下,您想要的是:
SelectNodes("//*[@class='" + classValue + "']") ?? Enumerable.Empty<HtmlNode>();