网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

Hadoop开发环境搭建（linux）

浏览数：35 / 时间：2015年06月20日

Hadoop开发环境搭建（linux）

零、安装xwindows

apt-get install ubuntu-desktop

一、安装Eclipse

下载Eclipse，解压安装，例如安装到/usr/local，即/usr/local/eclipse

二、在eclipse上安装hadoop插件

1、下载hadoop插件

下载地址：http://pan.baidu.com/s/1mgiHFok

此zip文件包含了源码，我们使用使用编译好的jar即可，解压后，release文件夹中的hadoop.eclipse-kepler-plugin-2.6.0.jar就是编译好的插件。

2、把插件放到eclipse/plugins目录下

3、重启eclipse，配置Hadoop installation directory

如果插件安装成功，打开Windows—Preferences后，在窗口左侧会有Hadoop Map/Reduce选项，点击此选项，在窗口右侧设置Hadoop安装路径。

4、配置Map/Reduce Locations

打开Windows—Open Perspective—Other

选择Map/Reduce，点击OK

在右下方看到如下图所示

点击Map/Reduce Location选项卡，点击右边小象图标，打开Hadoop Location配置窗口：

输入Location Name，任意名称即可.配置Map/Reduce Master和DFS Mastrer，Host和Port配置成与core-site.xml的设置一致即可。

点击"Finish"按钮，关闭窗口。

点击左侧的DFSLocations—>myhadoop（上一步配置的location name)，如能看到user，表示安装成功

如果如下图所示表示安装失败，请检查Hadoop是否启动，以及eclipse配置是否正确。

三、新建WordCount项目

File—>Project，选择Map/Reduce Project，输入项目名称WordCount等。

在WordCount项目里新建class，名称为WordCount，代码如下：

import java.io.IOException;

import java.util.StringTokenizer;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.util.GenericOptionsParser;

public class WordCount {

public static class TokenizerMapper extends Mapper<Object, Text, Text, IntWritable>{

　　private final static IntWritable one = new IntWritable(1);

　　private Text word = new Text();

　　public void map(Object key, Text value, Context context) throws IOException, InterruptedException {

　　　　StringTokenizer itr = new StringTokenizer(value.toString());

　　　　　　while (itr.hasMoreTokens()) {

　　　　　　　　word.set(itr.nextToken());

　　　　　　　　context.write(word, one);

　　　　　　}

　　}

}

public static class IntSumReducer extends Reducer<Text,IntWritable,Text,IntWritable> {

　　private IntWritable result = new IntWritable();

　　public void reduce(Text key, Iterable<IntWritable> values,Context context) throws IOException, InterruptedException {

　　　　int sum = 0;

　　　　for (IntWritable val : values) {

　　　　　　sum += val.get();

　　　　}

　　　　result.set(sum);

　　　　context.write(key, result);

　　}

}

public static void main(String[] args) throws Exception {

　　Configuration conf = new Configuration();

　　String[] otherArgs = new GenericOptionsParser(conf, args).getRemainingArgs();

　　if (otherArgs.length != 2) {

　　　　System.err.println("Usage: wordcount <in> <out>");

　　　　System.exit(2);

　　}

　　Job job = new Job(conf, "word count");

　　job.setJarByClass(WordCount.class);

　　job.setMapperClass(TokenizerMapper.class);

　　job.setCombinerClass(IntSumReducer.class);

　　job.setReducerClass(IntSumReducer.class);

　　job.setOutputKeyClass(Text.class);

　　job.setOutputValueClass(IntWritable.class);

　　FileInputFormat.addInputPath(job, new Path(otherArgs[0]));

　　FileOutputFormat.setOutputPath(job, new Path(otherArgs[1]));

　　System.exit(job.waitForCompletion(true) ? 0 : 1);

}

}

四、运行

1、在HDFS上创建目录input

hadoop fs -mkdir input

2、拷贝本地README.txt到HDFS的input里

hadoop fs -copyFromLocal /usr/local/hadoop/README.txt input

3、运行

点击WordCount.java，右键，点击Run As—>Run Configurations，配置运行参数，即输入和输出文件夹

hdfs://localhost:9000/user/hadoop/input hdfs://localhost:9000/user/hadoop/output

点击Run按钮，运行程序。

4、运行完成后，查看运行结果

方法1：

hadoop fs -ls output

可以看到有两个输出结果，_SUCCESS和part-r-00000

执行hadoop fs -cat output/*

方法2:

展开DFS Locations，如下图所示，双击打开part-r00000查看结果

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

Hadoop开发环境搭建（linux）

标签： des class style com 代码使用 http si java des class style com 代码使用 http si java

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

刘雯秀场新造型太震撼，两条带子做衣服太时髦，肩部“凹凸不平”

刘雯秀场新造型太震撼，两条带子做衣服太时髦，肩部“凹凸不平”

普京政敌、俄罗斯前副总理遭枪杀

普京政敌、俄罗斯前副总理遭枪杀

特斯拉入门两厢车新车预览

特斯拉入门两厢车新车预览

深圳地铁站附近发生恶性砍人事件

深圳地铁站附近发生恶性砍人事件

米兰时装周火辣上演美模抱萌娃走秀场面温馨

米兰时装周火辣上演美模抱萌娃走秀场面温馨

青岛旅行海滩试拍

青岛旅行海滩试拍

中戏艺考美女PK传媒艺考美女都百里挑一

中戏艺考美女PK传媒艺考美女都百里挑一

李敏镐图片精选

李敏镐图片精选

启功书法部分欣赏

启功书法部分欣赏

沈阳零下16度下模特比基尼走秀

沈阳零下16度下模特比基尼走秀

您可能还喜欢

更多

印度火车出轨已致34死150伤

印度火车出轨已致34死150伤

巴西男子头颈颠倒身残志坚

巴西男子头颈颠倒身残志坚

传说中的汗血宝马

传说中的汗血宝马

海滩试拍

海滩试拍

叶梓萱最新比基尼泳装写真玲珑曲线迷倒人

叶梓萱最新比基尼泳装写真玲珑曲线迷倒人

你见过这种饥荒吗？

你见过这种饥荒吗？

杨幂变黑衣人现身酒店

杨幂变黑衣人现身酒店

毛泽东和蒋介石的书法，你能区分不？

毛泽东和蒋介石的书法，你能区分不？

特斯拉 MODEL S 图集

特斯拉 MODEL S 图集

英国男子走遍非洲拍摄土著面孔

英国男子走遍非洲拍摄土著面孔