您是第位访问嘉宾!
当前位置: 首页 > 新闻中心 > 综合新闻

Apache Spark大数据计算环境实例试运行

  • 发布者:user 发布时间:2017-11-24 15:51:06.0

2017年11月,我中心机房进行Spark大数据计算环境试运行工作。Spark是专为大规模数据处理而设计的快速通用的计算引擎,是一个能够对大数据进行分布式处理的软件框架,它以一种可靠、高效、可伸缩的方式进行大数据处理。Spark得以在大数据处理应用中广泛应用得益于其自身在数据提取、转换和加载(ETL)方面上的优势,而且它还可在可用的计算机集簇间分配数据并完成计算任务,这些集簇可以方便地扩展到数以千计的节点中。目前Spark已在业界形成了一个高速发展应用广泛的生态系统,其诸多的优点使其一出现就受到众多用户者的关注。