在互联网诞生初期,数据库主要的类型是关系型数据库,这是一种采用了关系模型来组织数据的数据库。这是在1970年由IBM研究员埃德加·弗兰克·科德(E.F.Codd)博士首先提出的,在之后的几十年中,关系模型的概念得到了充分的发展并逐渐成为主流数据库结构的主流模型。简单来说,关系模型指的就是二维表格模型,而一个关系型数据库就是由二维表及其之间的联系所组成的一个数据组织。
随着互联网Web2.0网站的兴起,传统的关系数据库在应对Web2.0网站,特别是超大规模和高并发的SNS类型的Web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,而NoSQL的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL泛指非关系型的数据库,它的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。
以谷歌为例,谷歌公司大数据三篇著名论文(GFS,Bigtable,MapReduce)奠定了谷歌大数据的基础,而谷歌的Pagerank算法实现了当时几乎最先进的数据搜索算法。PageRank通过网络浩瀚的超链接关系来确定一个页面的等级。谷歌把从A页面到B页面的链接解释为A页面给B页面投票,谷歌根据投票来源(甚至来源的来源,即链接到A页面的页面)和投票目标的等级来决定新的等级。简单地说,一个高等级的页面可以使其他低等级页面的等级得到提升。而这个技术正是本章所指的数据第二阶段,通过复杂的设计网络和算法进行重新整理和归纳,将原本看似并无关联的数据变为可以分级分类的高质量数据,让大数据和复杂网络模型成为可能。
Loading...
未加载完,尝试【刷新】or【退出阅读模式】or【关闭广告屏蔽】。
尝试更换【Firefox浏览器】or【Chrome谷歌浏览器】打开多多收藏!
移动流量偶尔打不开,可以切换电信、联通、Wifi。
收藏网址:www.finalbooks.work
(>人<;)