每个数据库大神要了解的NoSQL数据库

MrLee2月前 222

术语NoSQL数据库是指非关系数据库。尽管“ NoSQL”一词的含义令人困惑,但有人说它代表“非SQL”,而大多数人说它代表“不仅是SQL”。但是我们知道NoSQL数据库是那些与其他关系数据库相比以某种格式存储或保存数据的数据库。 

每个数据科学家都应该知道的顶级NoSQL数据库

误解是NoSQL数据库无法存储关系数据,但事实并非如此,因此它们可以以其他形式存储关系数据,然后关系数据库可以存储关系数据。  

在过去的几年中,对数据科学家的需求增加了。随着对数据科学家的需求增加,对NoSQL数据库的需求也增加了。如果您是解决方案架构师,那么选择合适的数据库并非易事。您需要对所有类型的NoSQL数据库都友好。这是2020年趋势前5名数据库的列表。

1. ElasticSearch

这是一个用java编写的开源NoSQL数据库系统它由Shay Banon创建,并于2010年2月8日向公众发布。它提供了超文本传输协议接口和免费的模式JSON文档。Lucene称,它是Apache Solr背后最著名的搜索引擎它基于Lucene库。



与其他数据库相比,它更加一致和可扩展。它也被称为分析引擎,因为它可以存储,轻松分析和搜索大量数据。它用于搜索各种文档。它支持可扩展搜索,支持多租户并有助于实时搜索。它是分布式的,它表明索引被分为多个分片,每个分片具有0个或多个副本。每个节点具有一个或多个1个或多个  

该数据库主要用于全文搜索。目前,有2500多家公司正在使用它,包括medium,Stackoverflow和Udemy等。也可以使用此数据库来构建聊天机器人。

2. MongoDB

它是最常用的文档-部署NoSQL数据库。它用C ++GoJavaScriptPython编写它于2009年2月11日发布。仅在2009年以英语发布。其操作系统是Windows Vista,后来又更改为Linux,现在终于是Solaris。它是一个跨平台的数据库程序。 

它将数据保存在平面文件中自己的二进制存储对象中,并以非常紧凑和有效的方式帮助存储数据,非常适合保留大量数据。它将文档或数据保留在JSON对象中。它是一个无模式的数据库,使其可与其他传统数据库保持灵活。减少架构的主要原因是它具有许多内容,字段和大小,与其他文档不同。 

它是一个高度可扩展的可用数据库。由于具有复制和索引之类的功能,它可以帮助加快查询速度。在MongoDB中,借助二级索引和一级索引,可以将文档用于索引。它可以帮助使用节点复制数据。它使用主节点和辅助节点复制数据。 

主-从体系结构主要用于此复制过程中。如果您打算合并数百个不同的数据源,MongoDB将是最佳选择,因为它将对数据进行统一查看。

它还可用于保存点击流数据,并将其用于消费者行为分析。它已在3500多家公司中使用,其中包括eBay,Coinbase,Google,Uber和Nokia。

3. Amazon DynamoDB

该数据库由Amazon Web Services完全拥有和管理它适用于小型应用程序,而对于大型应用程序则有一些限制。它每天可以轻松处理10万亿条指令。它是一致的,并且其响应时间小于一毫秒。它会在AWS的所有区域中复制数据,以便您可以从所需的任何位置快速本地访问数据。 

它因其可伸缩性而广受欢迎。它用于构建具有实时更新和脱机数据访问的Web和移动应用程序。公司还在游戏行业中广泛使用它来构建游戏平台和构建实时记分板。 

如果您的需求是一个可以管理大量键值问题的数据库,那么DynamoDB是最佳选择。如果您正在使用OLTP工作负载,那么DynamoDB也是最佳选择。包括Lyft,Snapchat和Samsung在内的800多家公司都在使用它。

4.Cassandra

这是一个由Facebook构建并受Google大表启发的开源数据库系统它是可扩展的,并且广泛可用。它每秒可以管理PB级数据和数千个同时请求。此数据库的最佳用途是编写任务多于读取任务。它被Netflix,Facebook,Spotify,Instagram和Coursera等450多家公司使用。 

5. HBase

它是一个开源且高度可扩展的数据库系统。它用Java编写,可在Hadoop分布式文件系统(HDFS)上运行。如果要处理的数据量超过PB,则此数据库是最合适的。它还有助于实时和随机许可或访问数据。它可以轻松地存储来自数百万人的消息或数据。包括Pinterest,HubSpot和Hike在内的75多家公司都在使用它。


本文链接:https://www.it72.com/12663.htm

推荐阅读
最新回复 (0)
    返回