HadoopµÄ¼òµ¥µ¥´ÊÍ³¼Æ°¸Àý

>> »¶ÓÄú ¿ÍÈË: µÇÂ¼ | ×¢²á | ÔÚÏß | ËÑË÷ | ·ç¸ñ | °ïÖú | Í³¼Æ | ÎÄÕÂ

·µ»ØÊ×Ò³

>>·ÖÏíSPSS,HadoopµÈ´óÊý¾Ý´¦Àí¼¼Êõ£¬ÒÔ¼°·Ö²¼Ê½¼Ü¹¹ÒÔ¼°¼¯ÈºÏµÍ³µÄ¹¹½¨

Êé¼®Ö§³Ö

Java¼¼ÊõÍøÕ¾ ¡ú ¡º Java¿ª·¢¼¼Êõ ¡» ¡ú ¡º ´óÊý¾Ý´¦ÀíºÍ·Ö²¼Ê½¼Ü¹¹×¨Ìâ ¡» ¡ú HadoopµÄ¼òµ¥µ¥´ÊÍ³¼Æ°¸Àý

ÄúÊÇ±¾ÎÄÕÂµÚ 30924 ¸öÔÄ¶ÁÕß

* Ìù×ÓÖ÷Ìâ: HadoopµÄ¼òµ¥µ¥´ÊÍ³¼Æ°¸Àý

µãÔÞ(0) ÊÕ²Ø

×÷Õß:ÈÕÔÂ¹â»ª ·¢±íÊ±¼ä£º2019-12-31 18:12:54

ÏûÏ¢

²é¿´

ËÑË÷

ºÃÓÑ

ÓÊ¼þ

¸´ÖÆ

ÒýÓÃ

HadoopµÄ¼òµ¥µ¥´ÊÍ³¼Æ°¸Àý

ÔÚHadoopÑ§Ï°¹ý³ÌÖÐ£¬µ¥´ÊÍ³¼Æ×÷ÎªÒ»¸ö×î»ù±¾µÄ°¸Àý£¬·Ç³£¼òµ¥ÊµÓÃ£¬ÊÇÃ¿Ò»¸öÈëÃÅ²ËÄñ±ØÐëÒªÕÆÎÕµÄÒ»¸öÀý×Ó£¬¿ÉÒÔÍ¨¹ýÕâ¸ö¼òµ¥µÄÐ¡°¸ÀýÁË½âHadoopµÄ»ù±¾ÔËÐÐÔÀíºÍMapReduce³ÌÐòµÄ¿ª·¢Á÷³Ì

ÒýÈëÏà¹ØHadoopÄ¿Â¼Ïà¹ØJarÎÄ¼þ£º

£¨hdfs(±ØÐë),common£¨±ØÐë£©£¬mapreduce£¨±ØÐë£©£©

µã»÷ÔÚÐÂ´°¿ÚÖÐä¯ÀÀÔÍ¼
CTRL+Êó±ê¹öÂÖ·Å´ó»òËõÐ¡

µã»÷ÔÚÐÂ´°¿ÚÖÐä¯ÀÀÔÍ¼
CTRL+Êó±ê¹öÂÖ·Å´ó»òËõÐ¡

ÒýÈëÅäÖÃÎÄ¼þ£º

core-site.xml£»hdfs-site.xml£»¡¡

±àÐ´Map³ÌÐò£º

package cn.guyouda.hadoop.mapreduce.wordcount;
import java.io.IOException;
import org.apache.commons.lang.StringUtils;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

/** *  * @author Youda * MapÐèÒªËÄ¸ö·ºÐÍ²ÎÊý * KEYIN:ÊäÈë²ÎÊý£ºÄ¬ÈÏÊÇÒª´¦ÀíµÄÎÄ±¾ÖÐµÄÄ³Ò»ÐÐµÄÆ«ÒÆÁ¿ * VALUEIN£ºÊäÈë²ÎÊý£ºÒª´¦ÀíµÄÄ³Ò»ÐÐÎÄ±¾ÄÚÈÝ * VALUEOUT£ºÊä³ö¸øReduceµÄÊý¾ÝÀàÐÍ * KEYOUT£ºÊä³ö¸øReduceµÄÆ«ÒÆÁ¿ *  * ÓÉÓÚÐèÒªÍøÂç´«Êä£¬¹Ê²ÎÊýÐèÒªÐòÁÐ»¯ * µ«ÊÇJava×Ô´øµÄÐòÁÐ»¯»áÐ¯´øÒ»Ð©ÈßÓàÐÅÏ¢£¬²»ÀûÓÚ´óÁ¿µÄÍøÂç´«Êä * ËùÒÔHadoop¶ÔLong£¬String½øÐÐÁË·â×°,±äÎªLongWritable,Text *  */

public class WordCountMapper  extends Mapper<LongWritable, Text, Text, LongWritable>{
@Override  protected void map(LongWritable key, Text value, Mapper<LongWritable, Text, Text, LongWritable>.Context context)
                           throws IOException, InterruptedException {
// ´¦Àí¾ßÌåµÄÒµÎñÂß¼
                String text = value.toString();
String[] words = StringUtils.split(text," |,|\\.");
for(String word:words){
context.write(new Text(word), new LongWritable(1)); }
} }

±àÐ´Reduce³ÌÐò£º

package cn.guyouda.hadoop.mapreduce.wordcount;
import java.io.IOException;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
/** *  * @author Youda * */
public class WordCountReducer extends Reducer<Text, LongWritable, Text, LongWritable>{
@Override
protected void reduce(Text arg0, Iterable<LongWritable> arg1,Reducer<Text, LongWritable, Text, LongWritable>.Context arg2) throws IOException, InterruptedException {
  Long value = 0L;
          for(LongWritable num:arg1){
    value += num.get();
           }
            arg2.write(arg0, new LongWritable(value));
          }
}

±àÐ´¿ØÖÆ³ÌÐò£º

package cn.guyouda.hadoop.mapreduce.wordcount;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
/** * * @author Youda *Ö¸¶¨MapºÍReduceÀà *Ö¸¶¨×÷ÒµÐèÒª´¦ÀíµÄÊý¾ÝÎ»ÖÃ *»¹¿ÉÒÔÖ¸¶¨Êý¾ÝÊä³öµÄ½á¹ûÂ·¾¶ */

public class WordCountRunner {

public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
Configuration conf = new Configuration();
Job job = Job.getInstance(conf);
job.setJarByClass(WordCountRunner.class);
//Ö¸¶¨MapºÍReduceÀà
job.setMapperClass(WordCountMapper.class);
job.setReducerClass(WordCountReducer.class);
//Ö¸¶¨ReduceµÄÊä³öÀàÐÍ
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(LongWritable.class);
//Ö¸¶¨MapµÄÊä³öÀàÐÍ
job.setMapOutputKeyClass(Text.class);
job.setMapOutputValueClass(LongWritable.class);
//Ö¸¶¨Ô´ÎÄ¼þ¼ÐºÍÊä³öÎÄ¼þ¼Ð
FileInputFormat.setInputPaths(job, new Path("/wordcount/srcdata/"));
.setOutputPath(job, new Path("/wordcount/output/"));
//Ìá½»£º²ÎÊý£ºÊÇ·ñÏÔÊ¾´¦Àí½ø¶È
System.exit(job.waitForCompletion(true)?0:1);
}
}

ÔÚHadoopÖÐ´´½¨ÎÄ¼þ¼ÐÐèÒªÍ³¼ÆµÄµ¥´ÊËùÔÚÎÄ¼þ¼Ð²¢ÉÏ´«

hadoop fs -mkdir /wordcont
hadoop fs -mkdir /wordcount/srcdata

hadoop fs -put XXXX.txt /wordcount/srcdata

×¢£ºÔÚ´´½¨ÎÄ¼þ¼ÐºÍÉÏ´«ÎÄ¼þÖ®Ç°ÐèÒªÆô¶¯HDFS£¨start-dfs.sh£©Êä³öÎÄ¼þ¼Ð²»ÄÜ×Ô¼º´´½¨£¬·ñÔò³ÌÐòÔËÐÐÊ±»á±¨´í

ÔËÐÐ³ÌÐò£º
hadoop jar Count.jar cn.guyouda.hadoop.mapreduce.WordCountRunner

ÔËÐÐ½áÊøÒÔºó»áÔÚÊä³öÎÄ¼þ¼Ð´´½¨½á¹ûÎÄ¼þ

µã»÷ÔÚÐÂ´°¿ÚÖÐä¯ÀÀÔÍ¼
CTRL+Êó±ê¹öÂÖ·Å´ó»òËõÐ¡

×¢£ºÔËÐÐ³ÌÐòÇ°±ØÐëÆô¶¯YARN£¨start-yarn.sh£©

ÏÔÊ¾Í³¼Æ½á¹û£º

hadoop fs -cat /wordcount/output/part-r-00000

µã»÷ÔÚÐÂ´°¿ÚÖÐä¯ÀÀÔÍ¼
CTRL+Êó±ê¹öÂÖ·Å´ó»òËõÐ¡

¡ª¡ª¡ª¡ª¡ª¡ª¡ª¡ª¡ª¡ª¡ª¡ª¡ª¡ª¡ª¡ª
°æÈ¨ÉùÃ÷£º±¾ÎÄ×ñÑ CC 4.0 BY-SA °æÈ¨ÐÒé£¬×ªÔØÇë¸½ÉÏÔÎÄ³ö´¦Á´½Ó¼°±¾ÉùÃ÷¡£
ÔÎÄÁ´½Ó£ºhttps://blog.csdn.net/G_Youda/article/details/77989412

³ÌÐòÔ³µÄ¼¼Êõ´ó¹ÛÔ°£ºwww.javathinker.net

[Õâ¸öÌù×Ó×îºóÓÉ admin ÔÚ 2020-01-01 17:00:47 ÖØÐÂ±à¼]

Java¾«Æ·Êé¼®ÍÆ¼ö

Java×îÐÂÊÓÆµ½Ì³ÌÍÆ¼ö

JavaÃæÏò¶ÔÏó±à³Ì-->ÀàµÄÉúÃüÖÜÆÚ

JavaWeb¿ª·¢-->JavaWebÓ¦ÓÃÈëÃÅ£¨¢ñ£©

JSPÓëHibernate¿ª·¢-->Ó³Éä×é³É¹ØÏµ

JavaÍøÂç±à³Ì-->ÓÃSwing×é¼þÕ¹Ê¾HTMLÎÄµµ

¾«Í¨Spring-->¼ÆËãÊôÐÔºÍÊý¾Ý¼àÌý

Vue3¿ª·¢-->Í¨¹ýAxios·ÃÎÊ·þÎñÆ÷

±¾Õ¾ÆäËûÏà¹ØÎÄÕÂ

Ò»ÎÄ¿´¶®Zookeeper

springbootµÄ»º´æ¼¼Êõ

flume+spark streaming+redisÍêÕûÆª

SparkÑ§Ï°Ö®Redis

kafka+spark-streamingÊµÊ±ÍÆ¼öÏµÍ³ÐÔÄÜÓÅ»¯±Ê¼Ç

kubernetesÖ®Ingress²¿Êð

K8SÊ¹ÓÃdashboard¹ÜÀí¼¯Èº

Hadoop°²×°¹ý³Ì

Spark RDD×ª»»³ÉDataFrameµÄÁ½ÖÖ·½Ê½

Í¨¹ýSpark StreamingµÄforeachRDD°Ñ´¦ÀíºóµÄÊý¾ÝÐ´ÈëÍâ²¿´æ´¢...

HadoopÈëÃÅ¡ª¡ª³õÊ¶Hadoop

hadoopÏê½â

HadoopÉè¼ÆË¼Â·ºÍÄ¿±ê

HadoopÆðÔ´¼°ÆäËÄ´óÌØÐÔÏê½â

Hive»ù´¡½Ì³Ì

¸ü¶à...

IP: ÒÑÉèÖÃ±£ÃÜ

Â¥Ö÷

¹²1Ò³ 0Ìõ¼ÇÂ¼ µ±Ç°µÚ1Ò³

ÖÐÎÄ°æÈ¨ËùÓÐ£º JavaThinker¼¼ÊõÍøÕ¾ Copyright 2016-2026 »¦ICP±¸16029593ºÅ-2
ÜöÝÍJava³ÌÐòÔ±ÖÇ»ÛµÄ½á¾§£¬·ÖÏí½»Á÷JavaÇ°ÑØ¼¼Êõ¡£ ÁªÏµÎÒÃÇ
ÈçÓÐ¼¼ÊõÎÄÕÂÉæ¼°ÇÖÈ¨£¬ÇëÓë±¾Õ¾¹ÜÀíÔ±ÁªÏµ¡£