洛庚
2014-07-22 10:28:38
原
java抓取html网页数据内容demo
产生背景:公司有文员要从互联网上录入一些信息,效率低,费时费力,准确度不高。 我没事就做了个小小的demo ,设置相关参数,就可以快速抓取网站上的信息。
流程(此 demo抓取对象是赶集):此信息展示列表的展示页的链接URL作为参数,首先抓取所有信息列表的链接,获得每条信息的链接后,依次打开链接,获得信息的源码,此时分析此html的文本就可以了。当然用了正则匹配。获得信息后,你想干嘛就干嘛吧
为了快速上传,我删除了SSH 整合的jar 包 . jar包查找地址http://www.findjar.com
运行效果图,随便写的,有点丑。
由最代码官方编辑于2014-8-4 12:13:05
猜你喜欢
- java通过java.net.HttpURLConnection类抓取网页源码工具类分享
- apache HttpClient 4.3.4自动登录并抓取中国联通网页用户基本信息和账单数据
- 百度云java抓取(内含jar包可直接运行)
- java使用jsoup实现网页抓取---案例智联招聘求职信息抓取
- java抓取特定网站图片并下载
- java通过jsoup框架抓取网易云音乐歌手信息数据
- 使用java将bing的每日壁纸设置为ubuntu壁纸
- 用java将bing每日壁纸设置为win7壁纸
- 利用java线程实现数据上传demo
- java html向image进行转换
- Java代码打开一个浏览器
- java自动检测获取http请求URL地址的网页内容编码工具类
请下载代码后再发表评论
文件名:zhaopin.rar,文件大小:58.676K
下载
- /
- /zhaopin
- /zhaopin/.classpath
- /zhaopin/.myhibernatedata
- /zhaopin/.mymetadata
- /zhaopin/.project
- /zhaopin/.settings
- /zhaopin/.settings/org.eclipse.core.resources.prefs
- /zhaopin/.settings/org.eclipse.jdt.core.prefs
- /zhaopin/src
- /zhaopin/src/applicationContext.xml
- /zhaopin/src/com
- /zhaopin/src/com/Action
- /zhaopin/src/com/Dao
- /zhaopin/src/com/Dao/Impl
/zhaopin/src/com/Dao/zrdpDao.java
- /zhaopin


朱俪的邮件及存储 LV8
2024年3月11日
sunlea LV20
2022年9月8日
moomin709 LV24
2022年7月25日
1798672867 LV21
2021年8月6日
benbosn LV15
2020年9月11日
aaa最代码 LV14
2020年7月30日
921117 LV4
2020年4月26日
Marcos LV1
2020年1月31日
tyyeng LV18
2020年1月31日
2392975497 LV1
2019年10月17日

dane168 LV8
2月21日
652654393 LV5
2024年12月15日
朱俪的邮件及存储 LV8
2024年3月11日
微信网友_5992582549164032 LV6
2022年12月12日
xiaoxiexie LV13
2022年11月13日
qwertyuiopzxc LV1
2022年10月14日
sunlea LV20
2022年9月8日
moomin709 LV24
2022年7月25日
流眼泪 LV1
2022年3月24日
小熊专属 LV3
2021年12月15日