客服咨询

意见反馈

浅谈大数据分布式计算框架
数据库应用//
0.0
48
视频
1.3
课时
介绍
目录

课程概述

为了介绍大数据分布式计算,我们可以从讨论所涉及的基本概念和原理开始。分布式计算是指使用多台计算机或节点一起处理单个任务或问题。分布式计算的关键优势之一是可伸缩性。通过向系统中添加更多的节点,可以根据需要增加处理能力和存储容量。分布式计算中的另一个重要概念是容错。因为系统由多个节点组成,所以如果一个节点出现故障或离线,其他节点可以继续工作,系统仍然可以运行。

课程目标

学习大数据分布式计算技术能够理解分布式计算中涉及的基本概念和原则,如可伸缩性和容错性。能处理和分析单台计算机或服务器无法处理的大量数据。通过利用多节点和容错系统的能力,可以高效地实时处理和分析大量数据。了解几个流行的框架和平台通常用于大数据分布式计算系统,包括Apache Hadoop、Apache Spark和Apache Flink。

考核评价

章节练习题辅助知识点学习,认证考试检验学习成果。

讲师介绍

详细介绍

浅谈大数据分布式计算框架
1、分布式计算概述

(553s)

2、MapReduce架构

(611s)

3、MapReduce编程模型

(621s)

4、MapReduce操作实例

(671s)

5、Spark概述

(667s)

6、Spark架构

(535s)

监督管理单位:江苏省人力资源和社会保障厅     运营服务单位:杭州沃土教育科技股份有限公司     技术支持单位:浙江浙大网新软件产业集团有限公司