站长网 大数据 数据暴增 分析那些“巨型”数据仓库

数据暴增 分析那些“巨型”数据仓库

你能想象一个企业的数据仓库究竟有多大吗?虽然下面的数据来自于两年前,但是还是挺震撼的。相信目前,这些巨型的数据仓库怪物的体积又增大了几倍。行业分析师Curt Monash曾经见过许多非常大型的数据仓库,并进行了总结,其中用到的数据管理软件工具更是多

  你能想象一个企业的数据仓库究竟有多大吗?虽然下面的数据来自于两年前,但是还是挺震撼的。相信目前,这些巨型的数据仓库“怪物”的体积又增大了几倍。行业分析师Curt Monash曾经见过许多非常大型的数据仓库,并进行了总结,其中用到的数据管理软件工具更是多种多样,有传统的Teradata数据仓库,也有Greenplum这样的MPP数据库,还有许多开源的技术,比如Hadoop/Hive等。

 

 

 

  1、ebay:公司有超过6.5 PB的数据库运行在Greenplum上,另外2.5 PB的企业数据仓库运行在Teradata上。

 

 

 

  2、Facebook:脸书公司刚刚完成IPO,它们是着名的互联网数据巨鳄,也以使用开源技术着称。它们有2.5 PB的数据运行在Hadoop/Hive集群上。

 

 

 

  3、沃尔玛、美国银行都有非常大的数据仓库,与戴尔公司一起使用了大型的Teradata

 

 

 

  4、雅虎公司的网络日志数据库运行在私有软件上,据说大小是eBay Greenplum系统的六分之一。

 

 

 

  5、福克斯/Myspace有几百TB的数据库运行在Greenplum和AsterData的nCluster上。

 

 

 

  6、TEOCO公司有100多TB数据运行在DATAllegro上。

 

 

 

  7、戴尔公司除了Teradata之外,也有大量的数据运行在DATAllegro上。

 

 

 

  8、有多家公司还选择使用Vertica,其数据量也超过了200 TB。

 

 

 

  随着国内互联网等行业的飞速发展,包括淘宝、京东等电商的数据量也是达到了非常恐怖的程度,据了解京东正在测试Oracle Exadata,像Teradata在国内的各大银行中也有很广泛的应用。以后可以考虑写一写国内的几个大型数据仓库系统,只不过国内用户是否愿意透露数据量还存在疑问。

本文来自网络,不代表站长网立场,转载请注明出处:https://www.tzzz.com.cn/html/shuju/2021/0717/13697.html

作者: dawei

【声明】:站长网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。
联系我们

联系我们

0577-28828765

在线咨询: QQ交谈

邮箱: xwei067@foxmail.com

工作时间:周一至周五,9:00-17:30,节假日休息

返回顶部