hadoop 代表大数据 体系, k8s 代表云原生体系, 两个体系所倡导的理念也不一样。比如 K8s 提倡的是存算分离,但是大数据讲究的是数据存在哪里计算就在哪里。这些矛盾都增加了融合难度。
现在 Hive、Spark 只能支持某一版本的 K8s,而 Kafka 对 K8s 的支持现在并没有开源,这些都说明大数据组件对 K8s 的支持还处于跑通的早期阶段。
大数据平台的云原生
节省资金:由于维护、购买和多服务器操作,运行和管理容器化应用程序可能会迅速增加成本。使用Kubernetes可以组合资源,自动化昂贵的扩展计划,并通过自我修复和滚动更新功能降低维护成本。