您现在的位置是:LG博客 > 大数据 >

大数据提升了学习曲线

2020-01-03 16:45:34125人已围观

本月将有几场以大数据为主题的活动——其中包括全球多城市大数据周系列活动——围绕这一主题的社交媒体讨论可能会激增。DataSift是一个很好的跟踪热点的供应商,它的日常工作就是分析Twitter的数据来确定趋势。为了准备EuroCloud英国公司明天的大数据会议(详情见我之前的帖子),DataSift的Tim Barker发给我下面的信息图表(点击图片放大)。这是该机构对2012年提到大数据的每条推文进行分析后得出的几项发现。

分析的主要信息是,世界仍在学习大数据,这可能意味着我们正处于早期采用者阶段,还没有达到臭名昭著的炒作周期的顶峰。以下是一些最惊人的发现:

DataSift维护着它所声称的欧洲最大的Hadoop集群(如果你知道不同,请在下面的反馈中评论)。它表示,每条推文都与平均72个与之相关的数据项一起存储,它每天存储大约4tb的数据。在2012年对大数据推文的分析中,它发现超过200万的互动涉及不到100万作者。峰值是每小时3000条推文——几乎是每秒一条——但这只是DataSift总共监控的每秒8000多条推文的沧海一粟。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

-