洛庚的gravatar头像
洛庚 2014-07-22 10:28:38

java抓取html网页数据内容demo

产生背景:公司有文员要从互联网上录入一些信息,效率低,费时费力,准确度不高。 我没事就做了个小小的demo ,设置相关参数,就可以快速抓取网站上的信息。

流程(此 demo抓取对象是赶集):此信息展示列表的展示页的链接URL作为参数,首先抓取所有信息列表的链接,获得每条信息的链接后,依次打开链接,获得信息的源码,此时分析此html的文本就可以了。当然用了正则匹配。获得信息后,你想干嘛就干嘛吧

为了快速上传,我删除了SSH 整合的jar 包 . jar包查找地址http://www.findjar.com 

运行效果图,随便写的,有点丑。

java抓取html网页数据内容demo


最代码官方编辑于2014-8-4 12:13:05


打赏

文件名:zhaopin.rar,文件大小:58.676K 下载
最代码最近下载分享源代码列表最近下载
朱俪的邮件及存储  LV8 3月11日
sunlea  LV20 2022年9月8日
moomin709  LV24 2022年7月25日
1798672867  LV21 2021年8月6日
benbosn  LV15 2020年9月11日
aaa最代码  LV14 2020年7月30日
921117  LV4 2020年4月26日
Marcos  LV1 2020年1月31日
tyyeng  LV18 2020年1月31日
2392975497  LV1 2019年10月17日
最代码最近浏览分享源代码列表最近浏览
朱俪的邮件及存储  LV8 3月11日
微信网友_5992582549164032  LV6 2022年12月12日
xiaoxiexie  LV13 2022年11月13日
qwertyuiopzxc  LV1 2022年10月14日
sunlea  LV20 2022年9月8日
moomin709  LV24 2022年7月25日
流眼泪  LV1 2022年3月24日
小熊专属  LV3 2021年12月15日
13798956075  LV1 2021年10月8日
1798672867  LV21 2021年8月6日
顶部 客服 微信二维码 底部
>扫描二维码关注最代码为好友扫描二维码关注最代码为好友