洛庚
2014-07-22 10:28:38
原
java抓取html网页数据内容demo
产生背景:公司有文员要从互联网上录入一些信息,效率低,费时费力,准确度不高。 我没事就做了个小小的demo ,设置相关参数,就可以快速抓取网站上的信息。
流程(此 demo抓取对象是赶集):此信息展示列表的展示页的链接URL作为参数,首先抓取所有信息列表的链接,获得每条信息的链接后,依次打开链接,获得信息的源码,此时分析此html的文本就可以了。当然用了正则匹配。获得信息后,你想干嘛就干嘛吧
为了快速上传,我删除了SSH 整合的jar 包 . jar包查找地址http://www.findjar.com
运行效果图,随便写的,有点丑。
由最代码官方编辑于2014-8-4 12:13:05
猜你喜欢
- java通过java.net.HttpURLConnection类抓取网页源码工具类分享
- java抓取网页中的电子邮件demo
- java使用jsoup实现网页抓取---案例智联招聘求职信息抓取
- jsoup简单的图片抓取demo
- apache HttpClient 4.3.4自动登录并抓取中国联通网页用户基本信息和账单数据
- 百度云java抓取(内含jar包可直接运行)
- java实现html网页转excel文件
- java抓取特定网站图片并下载
- 使用jsoup抓取指定网站地址的class的html内容
- 在线聊天静态网页模板html Demo
- java WebSocket最好的入门demo(实现简易的网页多人聊天)
- java通过jacob插件将word,excel转换成html网页源代码下载
请下载代码后再发表评论
文件名:zhaopin.rar,文件大小:58.676K
下载
- /
- /zhaopin
- /zhaopin/.classpath
- /zhaopin/.myhibernatedata
- /zhaopin/.mymetadata
- /zhaopin/.project
- /zhaopin/.settings
- /zhaopin/.settings/org.eclipse.core.resources.prefs
- /zhaopin/.settings/org.eclipse.jdt.core.prefs
- /zhaopin/src
- /zhaopin/src/applicationContext.xml
- /zhaopin/src/com
- /zhaopin/src/com/Action
- /zhaopin/src/com/Dao
- /zhaopin/src/com/Dao/Impl
/zhaopin/src/com/Dao/zrdpDao.java
- /zhaopin
相关代码
最近下载
朱俪的邮件及存储 LV8
3月11日
sunlea LV20
2022年9月8日
moomin709 LV24
2022年7月25日
1798672867 LV21
2021年8月6日
benbosn LV15
2020年9月11日
aaa最代码 LV14
2020年7月30日
921117 LV4
2020年4月26日
Marcos LV1
2020年1月31日
tyyeng LV18
2020年1月31日
2392975497 LV1
2019年10月17日
最近浏览
朱俪的邮件及存储 LV8
3月11日
微信网友_5992582549164032 LV6
2022年12月12日
xiaoxiexie LV13
2022年11月13日
qwertyuiopzxc LV1
2022年10月14日
sunlea LV20
2022年9月8日
moomin709 LV24
2022年7月25日
流眼泪 LV1
2022年3月24日
小熊专属 LV3
2021年12月15日
13798956075 LV1
2021年10月8日
1798672867 LV21
2021年8月6日