我有一个HTML,我需要按类获取一些节点。所以我做不到,因为


我不知道XML路径
所需项目没有ID,只有类别
HtmlAgilityPack不允许获取所有元素(例如XDocument允许),但是doc.Elements()仅当我有ID时才有效,但我没有。所以我也不知道XML路径,所以我不能使用SelectNodes方法
我不能使用正则表达式


我的代码是

public static class HapHelper
{
    private static HtmlNode GetByAttribute(this IEnumerable<HtmlNode> htmlNodes, string attribute, string value)
    {
        return htmlNodes.First(d => d.HasAttribute(attribute) && d.Attributes[attribute].ToString() == value);
    }

    public static HtmlNode GetElemenyByAttribute(this HtmlNode parentNode, string attribute, string value)
    {
        return GetByAttribute(parentNode.Descendants(), attribute, value);
    }

    public static bool HasAttribute(this HtmlNode d, string attribute)
    {
        return d.Attributes.Contains(attribute);
    }

    public static HtmlNode GetElementByClass(this HtmlNode parentNode, string value)
    {
        return parentNode.GetElemenyByAttribute("class", value);
    }
}


但它不起作用,因为Descendants()仅返回最近的节点。

我能做什么?

最佳答案

学习XPath! :-)非常简单,可以很好地为您服务。在这种情况下,您想要的是:

SelectNodes("//*[@class='" + classValue + "']") ?? Enumerable.Empty<HtmlNode>();

10-02 03:23