未存储的的数据是丢弃的数据,就是这么简单。丢弃的数据是失去的价值和机会。这并不是一个新观点。我们生活在一个信息时代,数据就是驱动时代前行的动力。如果不能成功地存储这种珍贵的巨量资源,那将会直接影响你的业务竞争力和创新能力。

但是,什么使对象存储变得如此重要?传统存储产品的成本每年都在下降。与此同时,每台设备存储越来越多信息的能力在不断地提高。虽然维持现状看起来更有效率,但是,我们要澄清一下,事实上,不是这样的。存储数据的“能力”和“实际”存储数据是不一样的。关于对象存储的争论不是跟“为什么”去存储数据有关,而是跟数据“如何”存储、扩展以及最终的访问有关。

存储选项

有 4 种主要的存储介质:文件、块、对象和磁带。磁带不是我们今天要讨论的内容,因为它主要用于存档,需要巨大的容量和极低的价格,性能远不是最重要的因素。这样就剩下文件和块存储这两个主力了,“块”(双关语)的新成员对象存储正在使用它。

文件存储

多年来,大多数软件应用程序被设计成基于文件存储进行数据读写。它总是和文件系统有关,其目录结构和文件命名结构非常适合本地存储用例。把你的计算机、笔记本、平板电脑和移动设备看作是基于文件的存储的经典用法。文件存储的唯一缺点是无法轻松扩展容量。要存储更多的信息,就需要添加物理的存储介质。多年来,这一直是 IT 行业的祸根,直到网络支持的块存储开始进入市场。

块存储

现在要澄清一下,块存储一直都存在。比如,文件存储通常是由块存储支持,其文件系统的抽象位于顶部。相对较新的是,当大家在提到块存储时,想到的是其网络方面(如 NAS 和 SAN),是连接很多远程“原始”存储设备来扩展容量的能力。多年以来,一些应用程序,像数据库、电子邮件服务器和现在的虚拟机,已经使用“原始地址访问”来读取、写入和分割存储。但是,在涉及存储、组织和访问当今大量的数据时,文件系统是主要的接口。文件系统的抽象是文件和块存储(即使已联网)满足其限制的地方。

对象存储

对象存储是存储块的新成员。换句话说,它是一个类似于文件系统的抽象,通常还使用网络支持的块存储。然而,它是一个具有非常简单接口的新存储范式。和文件存储不同(在文件存储中,数据在复杂的层次目录中和名称关联),对象存储使用唯一标识符名称(必须是全局唯一的)来关联不透明值。这种架构和接口带来的好处是,能够动态地大规模实现扩展。我们可以把对象存储看作一种“平面”结构和命名约定。由于每个对象及相关的名字都和其他对象没有关联,因此,添加额外存储容量就变得很简单。规模几乎是无限的。

“为什么对象存储……”的论点是,从来没有出现过这种情况,对象存储是存储数据的推动力。换句话说,无法存储数据的经典原因(成本、限制、复杂性)都被简单地删除了。像 Amazon 的 S3(云原生对象存储)这样的服务简单、便宜、耐用并且有弹性。其他替代存储解决方案(如文件和块)的总体拥有成本(Total Cost of Ownership,简称 TCO)通常是导致数据被扔掉的原因,就是因为存储所有数据的成本太高了。

然而,这些数据可能包含巨大的价值,通过对象存储以低成本保留它们,有助于企业把之前的成本下降转换为价值驱动。

优 缺 点

跟任何架构选择一样,每种类型的存储都有其优缺点。对象存储的无限扩展也有一些缺陷。对象存储是任何类型(结构化、半结构化或非结构化)数据存储的好地方。甚至可以添加元数据来描述不透明值中的内容(称为对象标记)。但是,当涉及到索引和 / 或分析这些具有成本效益的数据时,似乎总是出现性能问题。

对象存储不像磁带存储那么慢,但是,高性能随机访问总是和数据库有关,并且,SSD 当然不是整体对象存储价值的一部分。通常,对象存储被看作是数据湖转储场,把数据转移到应用程序进行实际分析。但是,跟所有事情一样,“这是一个变化的时代”。新的应用程序开始使用对象存储,作为新分析解决方案进入市场的主要接入点。

勇敢的新应用程序

把对象存储作为主要存储库(也即数据湖)的趋势日益增长。Gartner 已经提出,到 2021 年,80% 的企业数据将以某种形式的对象存储方式存储。涉及到云时,很可能很多云数据已经存储为对象了。

数据存储的地方就是创新萌芽和成长的地方。今天,对象存储是用来存储正在生成的海量数据的最佳场所。创新将来自新的应用程序和服务,它们也把使用对象存储作为主要的接入点,甚至是经过尝试和真正的数据库解决方案。

作者简介

Thomas Hazel 是 CHAOSSEARCH 的创始人、CTO 和首席科学家,CHAOSSEARCH 是一家针对 AWS S3 的数据管理和分析服务公司。他是一位位于通信、虚拟化和数据库科学及技术前沿的连续创业家。Thomas 是多个流行开源项目的作者,并已经获得了分布式算法、虚拟化和数据库科学领域的多项发明专利。他拥有新罕布什尔州大学计算机科学的理学学士学位,并成立了计算机器协会(Association for Computing Machinery,简称 ACM)的学生和专业人士分会。


©著作权归作者所有:来自51CTO博客作者mb5fdb0a1b25659的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. 【JS基础入门】JavaScript基础之值与引用传递、模板字面量、解构
  2. OLAP引擎这么多,麻袋财富为什么选择用Kylin做自助分析?
  3. 外媒:谷歌Dragonfly项目仍在推进,6-9个月内推出中国版搜索引擎
  4. 挑战谷歌英伟达?华为披露芯片+AI解决方案!
  5. 数十亿用户的Facebook如何进行贝叶斯系统调优?
  6. 9月份最热门的机器学习开源项目TOP 5
  7. 6大最常用的Java机器学习库一览
  8. 耗时3年,Dropbox史上最大规模Python 3迁移
  9. 抛开炒作看知识图谱,为什么现在才爆发?

随机推荐

  1. 谈谈dom方式的用法
  2. 推荐10款连接类型实例教程
  3. XDocument函数定义与用法汇总
  4. 谈谈减少垃圾的现状、前景与机遇
  5. 浅谈选单连动实例
  6. 关于XML元素的10篇课程推荐
  7. 方式性能函数定义与用法汇总
  8. XML交互入门教程
  9. XmlTextWriter函数定义与用法汇总
  10. DTD详解的内容推荐