源码先锋

源码先锋

12 个大数据定义:您的定义是什么?

admin 48 197

伯克利大学的研究人员估计,1999年世界上产生了大约15亿G字节的信息,2003年的一项重复研究发现,这一数字在三年内翻了一番。数据已经变得越来越大,大约在2001年,行业分析师DougLaney将“3v”——数量、种类和速度——描述为企业面临的关键“数据管理挑战”,在过去四年中,几乎所有试图定义或描述大数据的人都使用了同样的“3v”。

“大数据”一词的首次使用出现在1997年美国国家航空航天局(NASA)科学家的一篇论文中,描述了他们在可视化(即计算机图形)方面遇到的问题,“这给计算机系统带来了一个有趣的挑战:数据集通常相当大,占用主存储器、本地磁盘甚至远程磁盘的容量。我们称之为大数据问题。当数据集不适合主存,或者当它们甚至不适合本地磁盘时,最常见的解决方案是获取更多的资源。

2008年,一些杰出的美国计算机科学家推广了这个术语,他们预测“大数据计算”将“改变公司、科研人员、医疗从业者以及我们国家的国防和情报行动的活动”。然而,“大数据计算”一词从未在论文中定义。

(2)“一个包罗万象的术语,指的是任何数据集的集合,这些数据集非常庞大和复杂,以至于难以使用现有的数据管理工具或传统的数据处理应用程序进行处理。”

(4)“社会以新颖的方式利用信息以产生有用的见解或具有重要价值的商品和服务的能力”和“什么东西可以在大规模上做而不能在小规模上做的事情,以提取新的见解或创造新的价值形式。”

TomDavenport总结道,由于大数据的“定义问题”,“我(和我咨询过的其他专家)预测这个术语的寿命相对较短。”不过,Davenport给出了这样的定义:

(6)新工具帮助我们找到相关数据并分析其含义。

(8)对企业来说,从处理内部数据到挖掘外部数据的转变。

(10)奥利姆・马克西姆夫人(代表魔法的力量)和数据中校(代表科技的实力)的融合体。

我喜欢最后两个。第11条是对为了收集更多数据而盲目收集更多数据的警告。第12条是承认将数据存储在“数据孤岛”中一直是让数据为我们服务、改善我们的工作和生活的关键障碍。

本文转载自12个大数据定义:您的定义是什么?-雪兽软件

更多精彩推荐请访问雪兽软件