MongoDB是什么
MongoDB 是一个开源的、可扩展的、跨平台的、面向文档的非关系型数据库,它由 C++ 语言编写,旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。
在 MongoDB 中支持以类似 json 的 bson(一种计算机数据交换格式)格式来存储数据,因此可以存储比较复杂的数据类型。MongoDB 最大的特点是它支持的查询语言非常强大,其语法有点类似于面向对象语言中函数调用,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还可以对数据建立索引。
MongoDB 官网:https://www.mongodb.com/
2009 年 12 月发布了 MongoDB 1.2 版本,其中引入了 map-reduce(一种编程模型,用于大规模数据集(大于 1TB)的并行运算),让 MongoDB 拥有了支持大规模数据处理的能力。
2010 年 3 月发布了 MongoDB 1.4 版本,该版本中引入了创建后台索引的功能。
2010 年 8 月发布了 MongoDB 1.6 版本,该版本种引入了一些主要特性,比如用于水平伸缩的分片、具备自动故障转移能力的副本集以及对 IPv6 的支持。
2012 年 8 月发布了 MongoDB 2.2 版本,该版本引入了聚合管道功能,可以将多个数据处理步骤组合成一个操作链。
2013 年 3 月发布了 MongoDB 2.4 版本,并在 Mongo Shell(一个与 MongoDB 交互的组件)中引入了文本搜索和谷歌的 V8 JS 引擎等增强功能。另外,还发布了 MongoDB 的企业版,企业版中另外提供了监控和安全集成等附加功能。
2015 年 3 月发布了 MongoDB 3.0 版本,该版本中引入了新的 WiredTiger 存储引擎、可插拔存储引擎 API 并增加了 50 个副本集限制和安全改进。同年晚些时候又发布了 MongoDB 3.2 版本,该版本增加了文档验证、部分索引的功能。
2017 年 11 月发布了 MongoDB 3.6 版本,该版本为多集合连接查询、变更流和使用 JSON 模式进行文档验证提供了更好的支持。MongoDB 3.6 是微软 Azure CosmosDB(截止到 2020 年 8 月)能够支持的最新版本。
2018 年 6 月发布了 MongoDB 4.0 版本,该版本提供了跨文档处理事务的能力。
2019 年 8 月发布了 MongoDB 4.2 版本,该版本中引入分布式事务处理的能力。
说了这么多 MongoDB 的好处,但它也不是万能的,比如以下这几个地方就不适合使用 MongoDB:
在 MongoDB 中支持以类似 json 的 bson(一种计算机数据交换格式)格式来存储数据,因此可以存储比较复杂的数据类型。MongoDB 最大的特点是它支持的查询语言非常强大,其语法有点类似于面向对象语言中函数调用,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还可以对数据建立索引。
MongoDB 官网:https://www.mongodb.com/
MongoDB 发展史
MongoDB 最初由一个名为 10gen 的组织在 2007 年开发的,并在 2009 年 2 月发布了 MongoDB 1.0 版本,其中提供了大部分基本的查询功能。2009 年 12 月发布了 MongoDB 1.2 版本,其中引入了 map-reduce(一种编程模型,用于大规模数据集(大于 1TB)的并行运算),让 MongoDB 拥有了支持大规模数据处理的能力。
2010 年 3 月发布了 MongoDB 1.4 版本,该版本中引入了创建后台索引的功能。
2010 年 8 月发布了 MongoDB 1.6 版本,该版本种引入了一些主要特性,比如用于水平伸缩的分片、具备自动故障转移能力的副本集以及对 IPv6 的支持。
2012 年 8 月发布了 MongoDB 2.2 版本,该版本引入了聚合管道功能,可以将多个数据处理步骤组合成一个操作链。
2013 年 3 月发布了 MongoDB 2.4 版本,并在 Mongo Shell(一个与 MongoDB 交互的组件)中引入了文本搜索和谷歌的 V8 JS 引擎等增强功能。另外,还发布了 MongoDB 的企业版,企业版中另外提供了监控和安全集成等附加功能。
2015 年 3 月发布了 MongoDB 3.0 版本,该版本中引入了新的 WiredTiger 存储引擎、可插拔存储引擎 API 并增加了 50 个副本集限制和安全改进。同年晚些时候又发布了 MongoDB 3.2 版本,该版本增加了文档验证、部分索引的功能。
2017 年 11 月发布了 MongoDB 3.6 版本,该版本为多集合连接查询、变更流和使用 JSON 模式进行文档验证提供了更好的支持。MongoDB 3.6 是微软 Azure CosmosDB(截止到 2020 年 8 月)能够支持的最新版本。
2018 年 6 月发布了 MongoDB 4.0 版本,该版本提供了跨文档处理事务的能力。
2019 年 8 月发布了 MongoDB 4.2 版本,该版本中引入分布式事务处理的能力。
为什么要使用 MongoDB
市面上的数据库软件众多,我们为什么要选择 MongoDB 呢?换句话说就是 MongDB 有什么优势呢?下面列举了几点原因。1) 面向文档
由于 MongoDB 是 NoSQL 类型的数据库,它不是像关系类型数据库那样以固定的格式存储数据,而是将数据存储在文档中,这使 MongoDB 非常灵活,可以适应实际的商业环境和需求;2) 临时查询
MongoDB 支持按字段、范围和正则表达式查询并返回文档中的数据;3) 索引
可以创建索引以提高 MongoDB 中的搜索性能,文档中的任何字段都可以建立索引;4) 复制
MongoDB 支持高可用性的副本集。副本集由两个或多个 MongoDB 数据库实例组成,每个副本集成员可以随时充当主副本或辅助副本的角色,主副本是与客户端交互并执行所有读/写操作的主服务器。辅助副本使用内置复制维护主副本种的数据。当主副本失败时,副本集将自动切换到辅助副本,然后将辅助副本作为主服务器;5) 负载平衡
MongoDB 可以在多台服务器上运行,以平衡负载或复制数据,以便在硬件出现故障时保持系统正常运行。适用场景
MongoDB 的主要目标是在键/值存储方式和传统的 RDBMS(关系型数据库)系统之间架起一座桥梁,它集两者的优势于一身。根据官方网站的描述,MongoDB 适用于以下场景。1) 网站数据
MongoDB 非常适合实时的插入、更新与查询数据,并具备网站实时存储数据所需的复制及高度伸缩的特性;2) 缓存
由于性能很高,MongoDB 也适合作为信息基础设施的缓存层,在系统重启之后,由 MongoDB 搭建的持久化缓存层可以避免下层的数据源过载;3) 庞大的、低价值的数据
使用传统的关系型数据库存取大量数据时,数据库的运行效率往往并不尽人意,而 MongoDB 的出现使这个问题迎刃而解,MongoDB 非常适合庞大数据的存储;4) 高伸缩性的场景
MongoDB 内置了 MapReduce 引擎,因此非常适合由数十或数百台服务器组成的数据库;5) 用于对象及 JSON 数据的存储
MongoDB 的 BSON 数据格式非常适合文档化格式的存储及查询。说了这么多 MongoDB 的好处,但它也不是万能的,比如以下这几个地方就不适合使用 MongoDB:
- 高度事务性的系统:例如银行或会计系统,传统的关系型数据库目前还是更适用于需要大量原子性复杂事务的应用程序;
- 传统的商业智能应用:针对特定问题的 BI(全称“Business Intelligence”,中文意思为“商业智慧或商务智能”,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值)数据库会产生高度优化的查询方式,对于此类应用,数据仓库可能是更合适的选择;
- 需要复杂 SQL 查询的应用。