hadoop入门之通过java代码实现将本地文件上传到hadoop的文件系统

所属分类: 软件教程 / 编程开发 阅读数: 1202
收藏 0 赞 0 分享

第一步:首先搭建java的编译环境。创建一个Java Project工程,名为upload。

第二步:选中所需的Jar包。
选中JRE System Library 选择BuildPath Configure Build Path 选择hadoop相应的jar包。
通过Add External JARS --〉Hadoop-0.20.2下所有的jar包以及lib下所有的jar包。OK。操作步骤如图:

Hadoop-0.20.2下所有的jar包。

lib下的所有jar包。

第三步:创建class名为UploadFile

第四步:编写代码。


复制代码
代码如下:

package upload;</p> <p>import java.io.BufferedInputStream;
import java.io.FileInputStream;
import java.io.InputStream;
import java.io.OutputStream;
import java.net.URI;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;</p> <p>
public class UploadFile {</p> <p> public static void main(String[] args) {
try {
String localStr = args[0];
String dst = args[1];
//in对应的是本地文件系统的目录
InputStream in = new BufferedInputStream(new FileInputStream(localStr));
Configuration conf = new Configuration();
//获得hadoop系统的连接
FileSystem fs = FileSystem.get(URI.create(dst),conf);

//out对应的是Hadoop文件系统中的目录
OutputStream out = fs.create(new Path(dst));
IOUtils.copyBytes(in, out, 4096,true//4096是4k字节
System.out.println("success");
} catch (Exception e) {
System.out.println(e.toString());
}
}
}

第五步:在Run Configuration里面设置两个参数,并执行。

点击 Run Configuration

在Java Application中设置 Project和MainClass

Arguments 加两个参数/home/cui/xxxx hdf://cui:9000/xxx Applay Run

第六步:查看结果。

显示运行成功。

在hadoop文件系统中已经看到了hadoop-0.20.2.tar.gz了。

至此文件通过代码上传成功!

将代码打包成jar文件,并测试。

1. 在Run Configurations里面命名为uploadfile。

2. 右击工程,执行Export,选择Runnable JAR file。点击下一步。

3. 选择刚才的configuration uploadfile,选择导出路径/home/cui。命名为upload.jar

点击下一步,导出成功。

4. 通过java命令执行。

5. 通过浏览器查看。

upload_hdfs.jar 已经存在。

更多精彩内容其他人还在看

JetBrains DataGrip2019如何安装激活?数据库ide工具安装激活教程

JetBrains DataGrip是一款实用的数据库ide软件,想知道怎么安装激活的朋友一起看看吧
收藏 0 赞 0 分享

VB6.0怎么使用文件对话框控件?

VB6.0怎么使用文件对话框控件?VB6.0中想要添加一个对话框,该怎么添加对话框控件呢?下面我们就来看看详细的教程,需要的朋友可以参考下
收藏 0 赞 0 分享

JetBrains GoLand 2019.1怎么安装激活?Go语言编程软件安装激活教程

JetBrains GoLand怎么安装使用,想知道的朋友一起看看吧
收藏 0 赞 0 分享

Eclipse工具在当前类窗口怎么显示面包屑导航?

Eclipse工具在当前类窗口怎么显示面包屑导航?Eclipse编写代码的世欧,想要显示面包屑导航,该怎么设置呢?下面我们就来看看详细的教程,需要的朋友可以参考下
收藏 0 赞 0 分享

scratch怎么创建聚光灯舞台背景?

scratch怎么创建聚光灯舞台背景?scratch中想要创建一个有聚光灯的舞台背景,该怎么创建这个背景呢?下面我们就来看看详细的教程,
收藏 0 赞 0 分享

EditPlus调用Scanner无法输出数据显示正在运行怎么办?

EditPlus调用Scanner无法输出数据显示正在运行怎么办?EditPlus编程开发的时候,需要调用Scanner来输出数据,但是Scanner一直显示正在运行,该怎么办呢?下面我们就来看看详细的教程,需要的朋友可以参考下
收藏 0 赞 0 分享

VS怎么清理程序? VS2019清理ConsoleApp1的教程

VS怎么清理程序?vs编程开发的时候,发现有无用的程序,想要清理,该怎么清理呢?下面我们就来看看VS2019清理ConsoleApp1的教程,需要的朋友可以参考下
收藏 0 赞 0 分享

VS2019解决方案怎么自定义项目位置?

VS2019解决方案怎么自定义项目位置?VS2019编程开发的时候,想要设置解决方案的项目位置,该怎么设置呢?下面我们就来看看详细的教程,需要的朋友可以参考下
收藏 0 赞 0 分享

VS怎么使用NuGet第三方插件? VS引用NuGet的方法

VS怎么使用NuGet第三方插件?VS中自带了很多第三方插件,NuGet就是其中之一,该怎么使用NuGet?下面我们就来看看VS引用NuGet的方法,需要的朋友可以参考下
收藏 0 赞 0 分享

VisualStudio各版本有什么区别?vs2010/2012的区别

VisualStudio各版本有什么区?VisualStudio有很多版本,这些版本之间有哪些区别呢?下面我们就来看看vs2010/2012的区别,需要的朋友可以参考下
收藏 0 赞 0 分享
查看更多