fanlinjie
2015-04-10 10:39:17
java上传本地文件到Hadoop的文件系统的入门教程详解
第一步:首先搭建java的编译环境。创建一个Java Project工程,名为upload。
第二步:选中所需的Jar包。
选中JRE System Library 选择BuildPath Configure Build Path 选择hadoop相应的jar包。
通过Add External JARS --〉Hadoop-0.20.2下所有的jar包以及lib下所有的jar包。OK。操作步骤如图:
Hadoop-0.20.2下所有的jar包。
lib下的所有jar包。
第三步:创建class 名为UploadFile.
第四步:编写代码。
package upload; import java.io.BufferedInputStream; import java.io.FileInputStream; import java.io.InputStream; import java.io.OutputStream; import java.net.URI; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IOUtils; public class UploadFile { public static void main(String[] args) { try { String localStr = args[0]; String dst = args[1]; //in对应的是本地文件系统的目录 InputStream in = new BufferedInputStream(new FileInputStream(localStr)); Configuration conf = new Configuration(); //获得hadoop系统的连接 FileSystem fs = FileSystem.get(URI.create(dst),conf); //out对应的是Hadoop文件系统中的目录 OutputStream out = fs.create(new Path(dst)); IOUtils.copyBytes(in, out, 4096,true//4096是4k字节 System.out.println("success"); } catch (Exception e) { System.out.println(e.toString()); } } }
第五步:在Run Configuration里面设置两个参数,并执行。
点击 Run Configuration
在Java Application中 设置 Project和MainClass
Arguments 加两个参数/home/cui/xxxx hdf://cui:9000/xxx
Applay Run
第六步:查看结果。
显示运行成功。
在hadoop文件系统中已经看到了hadoop-0.20.2.tar.gz了。
至此文件通过代码上传成功!
将代码打包成jar文件,并测试。
1. 在Run Configurations里面命名为uploadfile。
2. 右击工程,执行Export,选择Runnable JAR file。点击下一步。
3. 选择刚才的configuration uploadfile,选择导出路径/home/cui。命名为upload.jar
点击下一步,导出成功。
4. 通过java命令执行。
5. 通过浏览器查看。
upload_hdfs.jar 已经存在。
猜你喜欢
请下载代码后再发表评论
相关代码
最近下载
最近浏览
hlFDGd LV1
6月11日
mengmeng12323423 LV4
2023年6月19日
雨后不归 LV4
2023年6月8日
asa566 LV10
2023年4月3日
2716804680 LV9
2023年3月23日
sunlzh888888 LV29
2023年3月3日
1690356080 LV37
2023年2月13日
微信网友_6230349887393792
2022年11月22日
暂无贡献等级
wwwwwjiawen LV1
2022年5月3日
sanjiu
2022年4月20日
暂无贡献等级