import com.pga.MyCrawler.Crawler_Regular_run; import com.pga.crawler.Crawler_Regular_funtion; /** * Filename: Crawler_Regular_example.java * Create at: 2015年11月10日 下午12:33:18 * Description: * Modification History: * Author Version Description * ----------------------------------------------------------------- * Garfield 1.0 1.0 Version */ public class Crawler_Regular_example { private static final String pjpath = System.getProperty("user.dir"); public static void main(String[] args) throws Exception { String urls = "http://www.oistc.com"; //测试URL String Ecode = "UTF-8"; //编码 String path = pjpath+"/data/cw_crawlermain.txt"; //URL列表 String importfile = pjpath+"/input/"; //输出路径 String regular = "\\w+@\\w+(\\.\\w+)+"; //正则匹配 Crawler_Regular_run.GetEmail(urls, Ecode); //获取Email 测试类 // Crawler_Regular_run.GetEmail_Save(urls, path, Ecode); //获取Email 测试类 在有的时候保存会出现权限不足的情况 // Crawler_Regular_run.GETDOM(path, Ecode, importfile); //path URL列表 ,Ecode 编码 ,importfile 输出文件目录 // Crawler_Regular_run.Crawler(path, regular, Ecode); //Regular 正则表达式 // Crawler_Regular_run.Crawler_Save(path, regular, importfile, Ecode); } }
最近下载更多
212600 LV7
2022年9月6日
刘卫国 LV6
2021年12月1日
Sean_admin LV7
2021年4月23日
liangge2115 LV27
2020年10月24日
senint LV6
2020年5月14日
wei112233 LV15
2020年2月2日
zdjljty LV9
2019年12月13日
1602177575 LV14
2019年11月25日
newhaijun LV15
2019年11月14日
付晨雨 LV6
2019年9月10日