我正在使用jsoup解析html文档。我需要提取所有子div元素。这基本上是没有嵌套div标签的div标签。我在Java中使用了以下代码来提取div标签,

Elements bodyTag = document.select("div:not(div>div)");

这是一个例子:
<div id="header">
     <div class="container">
         <div id="header-logo">
         <a href="/" title="mekay.com">
             <div id="logo">
             </div> </a>
        </div>
        <div id="header-banner">
            <div data-type="ad" data-publisher="lqm.j2ee.site" data-zone="ron">
            </div>
        </div>
     </div>
</div>

我只需要提取以下内容:
 <div id="logo">
 </div>
 <div data-type="ad" data-publisher="lqm.j2ee.site" data-zone="ron">
 </div>

相反,以上代码片段返回了所有div标签。所以,请您帮我弄清楚此选择器有什么问题

最佳答案

这是一个完美的工作

Elements innerMostDivs = doc.select("div:not(:has(div))");

试试online
  • 添加您的html文件
  • 将CSS查询添加为div:not(:has(div))
  • 检查结果元素
  • 关于javascript - 如何使用jsoup选择html文档的叶子标签,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/27497507/

    10-12 13:10
    查看更多