大数据提升了学习曲线

本月将有几场以大数据为主题的活动——其中包括全球多城市大数据周系列活动——围绕这一主题的社交媒体讨论可能会激增。DataSift是一个很好的跟踪热点的供应商,它的日常工作就是分析Twitter的数据来确定趋势。为了准备EuroCloud英国公司明天的大数据会议(详情见我之前的帖子),DataSift的Tim Barker发给我下面的信息图表(点击图片放大)。这是该机构对2012年提到大数据的每条推文进行分析后得出的几项发现。

分析的主要信息是,世界仍在学习大数据,这可能意味着我们正处于早期采用者阶段,还没有达到臭名昭著的炒作周期的顶峰。以下是一些最惊人的发现:

DataSift维护着它所声称的欧洲最大的Hadoop集群(如果你知道不同,请在下面的反馈中评论)。它表示,每条推文都与平均72个与之相关的数据项一起存储,它每天存储大约4tb的数据。在2012年对大数据推文的分析中,它发现超过200万的互动涉及不到100万作者。峰值是每小时3000条推文——几乎是每秒一条——但这只是DataSift总共监控的每秒8000多条推文的沧海一粟。

(0)
上一篇 2022年4月6日
下一篇 2022年4月6日

相关推荐