... | @@ -4,7 +4,7 @@ |
... | @@ -4,7 +4,7 @@ |
|
|
|
|
|
```
|
|
```
|
|
Spark是一个通用的分布式数据处理引擎。
|
|
Spark是一个通用的分布式数据处理引擎。
|
|
通用:通用指的是Spark可以做很多事情。包括机器学习、数据流传输、交互分析、ETL、批处理、图计算等等都是Spark可以做到的。
|
|
通用:通用指的是Spark可以做很多事情。包括机器学习、数据流传输、交互分析、ETL、批处理、流计算、图计算等等都是Spark可以做到的。
|
|
甚至可以说,你需要用数据实现的任何事情,你都可以用Spark试试看。
|
|
甚至可以说,你需要用数据实现的任何事情,你都可以用Spark试试看。
|
|
分布式:指的是Spark处理数据的能力是建立在许多机器上的,是可以和分布式的存储系统对接的,是可以做横向扩展的(简单点说就是电脑越多,能力越大)
|
|
分布式:指的是Spark处理数据的能力是建立在许多机器上的,是可以和分布式的存储系统对接的,是可以做横向扩展的(简单点说就是电脑越多,能力越大)
|
|
引擎:所谓引擎,说的就是Spark自己不会存储数据,它就像实体的机械引擎一样,会将燃料(对Spark来说是数据)转化成使用者需要的那种形式——例如驱动汽车,
|
|
引擎:所谓引擎,说的就是Spark自己不会存储数据,它就像实体的机械引擎一样,会将燃料(对Spark来说是数据)转化成使用者需要的那种形式——例如驱动汽车,
|
... | | ... | |