܄

数人云CTO肖德时:如何提升资源利用率成为大数据部署最大的挑战

【数据猿导读】 以Hadoop、Spark为核心的大数据生态圈正在快速发展,层出不穷的大数据工具方便了企业处理海量数据,但也给大数据平台的部署和维护带来了挑战。肖德时指出,大数据部署最大的挑战在于如何提升资源利用率,以及如何用一套标准的解决方案去部署和升级大数据工具

数人云CTO肖德时:如何提升资源利用率成为大数据部署最大的挑战

4月28日,由工业和信息化部指导、中国信息通信研究院主办的“2016大数据产业峰会”在北京国际会议中心召开。数人云CTO肖德时应邀出席并做《容器化大数据应用部署实践》主题演讲,向与会者分享了如何用容器化的方式解决大数据的快速部署问题。

以Hadoop、Spark为核心的大数据生态圈正在快速发展,层出不穷的大数据工具方便了企业处理海量数据,但也给大数据平台的部署和维护带来了挑战。不同的大数据工具之间往往需要搭配使用,同时,随着大数据平台的集群规模越来越大,大数据工具组件越来越多,相互依赖越来越复杂,如何保证大数据平台的稳定性,保证高可用性?

肖德时指出,大数据部署最大的挑战在于如何提升资源利用率,以及如何用一套标准的解决方案去部署和升级大数据工具。

具体来讲,容器化大数据应用部署实现在统一平台上进行资源的混合部署,简化管理并消除重复数据,使资源的利用率从过去的30%提升到90%。此外。所有的大数据工具都是基于容器分发的,大大降低对底层技术的依赖。容器技术给大数据部署提供了更多的选择,用户可以选择更多的解决方案,而不仅仅是局限于用Hadoop建立集群。

容器化应用部署实践 – Hadoop Cluster

肖德时说道,“原来部署一个Hadoop,一定要到Apache的网站或者第三方网站下载一套Apache软件,再把它解压、安装,非常的繁琐。而通过采用容器技术部署大数据应用,只需到Docker仓库就可以拿到Hadoop Cluster,它是一个用容器包起来的Hadoop安装包,你要做的就是下载这个安装包。”

肖德时指出,容器化大数据有三个显著的好处:第一,可以快速安装大数据组件;第二,开发、QA、生产环节使用同一套镜像和流程;第三,一个节点到多个节点,步骤都是一样的启动服务。

作为基于Docker技术的轻量级PaaS平台,数人云可以合理分配和调度容器资源,利用 Mesos 技术在集群中混合部署 Hadoop、Spark、Kafka、Hbase、Storm 等大数据应用,提高集群计算资源利用率,按需为各种大数据应用分配资源。

数人云以 Docker 形式进行应用分发,每个大数据应用打包成 Docker,轻松实现快速部署。通过 Mesos 技术,数人云面向数据中心对计算资源进行统一管理和调度,为应用提供弹性伸缩能力,轻松实现大数据平台的一键扩容。


来源:比特网

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

我要评论

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

返回顶部