因此,未来的几年,我们会继续见证“后Hadoop时代”的下一代企业大数据平台:
1. 内存计算时代的来临。随着高级分析和实时应用的增长,对处理能力提出了更高的要求,数据处理重点从IO重新回到CPU。以内存计算为核心的Spark将代替以IO吞吐为核心的MapReduce成为分布式大数据处理的缺省通用引擎。做为既支持批处理有支持准实时流处理的通用引擎,Spark将能满足80%以上的应用场景。Cloudera公司近日公布了One Platform的倡议,推动Spark成为Hadoop的默认数据处理引擎。为了最终取代MapReduce,Cloudera集中力量推动解决Spark现在企业大规模应用时在四个关键领域仍然存在的短板:管理,安全,规模和流。
【免责声明】本文仅代表作者个人观点,与中国数码招商网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。您若对该稿件内容有任何疑问或质疑,请联系本网将迅速给您回应并做处理。