优点:海量数据离线处理&易开发&易运行。

缺点:无法实时流式计算。


编程模型之执行步骤

  • 准备map处理的输入数据
  • Mapper处理
  • Shuffle
  • Reduce处理
  • 结果输出

编程模型之核心概念

  • Split
  • InputFormat
  • OutputFormat
  • Combiner
  • Partitioner
Last modification:August 29th, 2020 at 03:31 pm
坚持技术分享,您的支持将鼓励我继续创作!