JAVA小说站点爬虫-spring-mybatis-jsoup-http-client
项目初衷:
国庆穷逼一个宅在家里没事看小说,可是wap端的小说站点简直太没节操了,那些广告真是实在是不堪忍受。所以想做一个没有任何广告的自己的小说站点(果然,做出的站点也够简单的!)。
然后就付诸实践了!
闲话少说,介绍一下如何运行这(几)个项目:
第一个项目:novel.spider(姑且叫他为spider吧)-jsoup,http-client
提供了三个最为底层的方法:
ChapterFactory.getChapterSpider(NovelSiteEnum novelSiteEnum).getChapters(NovelSpiderUtil.getRelativeUrl(NovelSiteEnum novelSiteEnum, url)) 获取一个爬取对应网站的章节的实体,并执行爬取任务
ContentFactory.getContentSpider(NovelSiteEnum novelSiteEnum).getContent(NovelSpiderUtil.getRelativeUrl(NovelSiteEnum novelSiteEnum,url)) 获取一个爬取对应网站的内容的实体,并执行爬取任务
NovelDownloaderObserver observer = new NovelDownloaderObserver(url) 下载小说...
这三个都依赖于一个方法:NovelSpiderUtil.setRootPath(path) 该方法用来指定爬取规则的配置文件存放的路径,以及下载的小说存放在哪个文件夹下
该项目下有个测试类,可以参考一下使用方式:NovelSpiderTest.java
第二个项目:novel.book.storage(用来爬取某个网站的所有书列表)-mybatis
唯一的难点就是指定好配置文件,以及配置好数据库的连接信息。config目录下还有一个sql文件,该文件用来创建数据库和表,没有库爬到的数据没地方存呀。
这个项目很简单,总共2个类+1个接口,就不细说了!
第三个项目:novel (这是一个web站点)-spring,mybatis
稍微重要点的类是NovelController和NovelServiceImpl(写这个实现类的是才发现之前给自己挖的坑有多么的深,所以在spider项目里面多了一个抽象...)
稍微要注意的是,NovelServiceImpl中也调用了NovelSpiderUtil.setRootPath(path)方法来指定配置文件的位置。
数据库截图
这个是三个项目组合起来的,最代码好像只能上传一个,我整合在一起了,有问题可以问我。谢谢
util-0.0.1-SNAPSHOT.jar百度网盘下载地址:
地址1 https://pan.baidu.com/s/1i5f6SWt 密码:252o
地址2 https://pan.baidu.com/s/1bBtarW
github地址 https://github.com/ArvinZhangX/novel
猜你喜欢
- ssm(spring+spring mvc+mybatis)开发java web小说网站,只支持手机端浏览
- ssm+maven+spring tool suit开发关于大学生优秀项目网站 没有后台管理
- ssm+apache shiro实现按钮级别的网站权限控制项目实例
- ssm(spring+spring mvc+mybatis+maven)高仿bilibili视频网站项目实例
- ssm开发的博客、分享、问答三个模块的java技术交流网站
- SSM开发小型人事管理项目
- 基于经典架构SSM+LayUI的CRUD示例程序(已配置好,可做脚手架)
- SSM(spring+springmvc+mybatis),SSH(struts+spring+hibernate),SSI(struts+spring+ibatis)常用java web框架搭建教程
- struts2+mybatis+spring项目整合实例
- 基于ssm框架开发简单的婚恋相亲网站,包括前台和后台管理系统
- ssm框架简单实例
- Spring+Spring MVC+MyBatis整合java开源框架BigFrame开发的文章系统
- /
- /com.ifengxue.novel.book.storage.zip
- /com.ifengxue.novel.spider.zip
- /com.ifengxue.novel.zip

- 证精 SSM开发小型人事管理项目
- 原精 ssm开发的博客、分享、问答三个模块的java技术交流网站
- 原证 ssm进销存流程管理系统
- SSM+Layui开发员工部门管理系统
- 证精 Maven+SSM+shiro+idea+mysql+tomcat+jdk1.8开发java cms面向内部的内容管理系统
- 原证精 基于SSM框架搭建的java web商家进销存网站系统
- 证 ssm整合easyui实现简单的进销存管理系统(适合新手学习easyui)
- 原证 spring+spring mvc+mybatis+ajax+jquery实现简单的问答系统
- 原精 ssm百货商城销售管理系统
- 精 全站功能最佳UI体验最好的一套基于SpringMVC+Spring+Mybatis的商户管理系统,值得学习!
- 精 基于SSM人事管理系统(可做期末答辩)
- 原 基于经典架构SSM+LayUI的CRUD示例程序(已配置好,可做脚手架)

