我需要从一组文本信息中提取http链接。具有图像扩展功能的特定短语(.jpg,.png)
例如,我要一个“ http://www.mywedding.com/blog/wp-content/gallery/p_867/bridal-party-white-flowers-40306.jpg”
从下面的东西
<p><a href="http://www.mywedding.com/blog/wp-content/gallery/p_867/bridal-party-white-flowers-40306.jpg" target="_blank"><a href="http://www.mywedding.com/blog/wp-content/gallery/p_867/bridal-party-white-flowers-40306.jpg">http://www.mywedding.com/blog/wp-content/gallery/p_867/bridal-party-white-flowers-40306.jpg</a></a> (from <a href="http://cameroningalls.com/emily-meeko-tiburon/" target="_blank">this wedding by Cameron Ingalls</a>)</p>
如果这些是img标签,我可以从简单的方法中获取
String s="<img src="https://i.stack.imgur.com/SUSRH.jpg"/>
s=s.replace("<img src=", "");
s=s.replace("/>", "");
但是我很困惑要解决第一种情况,对此有什么建议吗?
最佳答案
您是否已经在一个字符串中包含原始信息?这看起来像是正则表达式的经典工作。我会检查这个网站,
9:HTML标签正则表达式模式
http://www.mkyong.com/regular-expressions/10-java-regular-expression-examples-you-should-know/
这里有一个关于如何使用它的很好的解释:
http://www.mkyong.com/regular-expressions/how-to-extract-html-links-with-regular-expression/