本文主要是介绍jsoup对于html的解析-爬虫,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
依赖
<!-- jsoup--><dependency><groupId>org.jsoup</groupId><artifactId>jsoup</artifactId><version>1.11.3</version></dependency>
代码
//从URL加载HTML// Document document = Jsoup.connect("https://baijiahao.baidu.com/s?id=1678670461780276039&wfr=spider&for=pc").get();Document document = Jsoup.connect("http://stock.10jqka.com.cn/20210517/c629417284.shtml").get();String title = document.title();//获取html中的标题System.out.println("title :"+title);//获得span标签的所有文本String strings=document.select("span").html();System.out.println(strings);
参考:https://www.jianshu.com/p/69b395bee43a
这篇关于jsoup对于html的解析-爬虫的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!