数字经济时代,数据成为新的生产资料,数据驱动体验、数据驱动决策、数据驱动流程的各种应用正不断上演。5g、云、ai加速行业数字化转型,海量数据时代已经到来。海量数据促使企业从数据管理走向数据运营,目前,正面临三大挑战:一是成本高、存不下;二是效率低、流不动;三是自动化差、管不好。
hadoop1.0时代,计算和存储是高度融合,仅能处理单一的mapreduce分析业务;hadoop2.0时代,计算层与数据开始解耦,通过yarn实现了独立的资源管理,并开始支持spark等更多的计算引擎;而如今来到hadoop3.0时代,计算存储已分开演进,通过hadoop ec来支持冷数据的存储,同时引入外置存储,如s3,增强其存储底座能力,逐步向数据湖架构演进。hadoop3.0时代,计算正向轻量化和容器化方向发展,计算存储分离演进已成为事实。计算存储分离后,我们用企业级的存储基座替代原来的原生大数据存储基座,好处是可以把当前企业级存储的先进技术带入到大数据里面来,如高可靠、高利用率、多协议融合等,更好地释放数据的价值。
举个例子来说,2018年,华为创新性推出基于oceanstor pacific系列的大数据存算分离方案。在成本方面,华为大数据存算分离方案实现存算分离,资源按需独立扩展,弹性ec、冷热数据分级,存储成本大幅降低。在数据应用效率方面,华为oceanstor pacific系列采用全对称分布式namenode,集群性能和支持文件数随节点数目增加线性提升,单一命名空间支持文件数达百亿级。在实际操作运维方面,华为oceanstor pacific系列提供的原生hdfs接口提供了更佳性能和使用体验。通过viewfs或hbase元数据网关方式可实现新老共存,实现存算一体向存算分离的平滑演进,保护用户已有投资。
成立8个月估值过亿,轻松斩获千万天使轮融资,迪韵科技是如何做到的?
ALD技术工艺原理、优势及应用
常见的模拟量IO都有哪些种类?
【解决方案】Acrel-6000电气火灾监控系统解决方案
CAD图块使用必须注意的几个问题
大数据时代数据存储技术的发展
解码智造,耐用可靠 优博讯CODEK系列有线工业扫描枪——K200重磅发布
智能电网建设将为线缆行业提供广阔的市场需求
中科院青藏高原研究所研发海斗一号”全海深自主遥控水下机器人
红魔首款智能手表 首创足球运动模式
中国联通5G CPE重磅推出 搭载紫光展锐5G芯片
什么是有线端子?什么是无线端子?
十年深耕甲醇 吉利成就自身实力
队列Queue的常用方法有哪些
离心泵工作原理图
2020年存储行业趋势预测
交流220V并网光伏发电系统解决应用方案
SPM刻蚀工艺优化的详细说明
热空气消毒箱GRX-9013A的产品特点是什么
隐形冠军:中国芯片产业的明日之星