您的位置: 网界网 > 大数据 > 正文

大数据分析助阵世界杯球迷狂欢月

2014年07月21日 14:27:57 | 作者:网界网 于翔 | 来源: | 查看本文手机版

摘要:刚刚结束的巴西世界杯足球赛不仅仅是一场体育赛事的盛宴,也是一次网上社交的狂欢。球迷们在微博、微信朋友圈的评论、吐槽和讨论都成为了大数据分析实战的绝佳素材。

标签
腾讯
社交
大数据
世界杯
IBM

大数据[注]和云鼎力支持

世界杯期间,球迷们通过腾讯网所获得了观赛新体验仰仗于大数据和云计算[注]的鼎力支持。针对球迷社交数据的分析是建立在IBM大数据分析平台之上。据IBM中国研究院信息分析研究部研发总监苏中介绍,IBM大数据分析平台内置有超级数据引擎(+微信关注网络世界),IBM中国研究院的工程师们在其上针对世界杯期间社交数据的分析需求进行数据建模,构建起一套定制化的大数据分析体系。

IBM中国研究院信息分析研究部研发总监  苏中

“在世界杯期间,系统从微博等社交媒体采集了大概10亿条的赛事相关数据,其中与64场具体比赛相关的超过1亿条。我们将其中的那些具有推广营销等性质的数据噪音去除,每天用于分析处理的数据量在百万条至千万条之间。”苏中说。这些数据被注入定制开发的数据模型之中,因为融合了机器学习和自然语言分析等技术,系统能够像人一样地去理解球迷在微博中所表达的想法。苏中表示,经过测试,这一系统可以进行深入的球迷情感挖掘,对模糊语言有90%的正确判断力。

庞大的数据量和实时分析的需求,无疑需要消耗大量的计算资源。但这一应用需求的时限仅仅是赛事举办的30余天,为此建设长期的物理计算体系并不现实。IBM的技术专家用云端部署的方式解决了这一问题。2014年6月,IBM Softlayer公有云[注]服务在香港的数据中心正式投入运营,球迷社交数据分析平台随即入驻这一公有云平台。据IBM大中华区全球信息服务部云计算服务总经理余忠宁介绍,球迷社交大数据分析项目共使用了10台Softlayer虚拟机,SoftLayer公有云服务平台很好地满足了系统在海量数据分析时对弹性计算能力的要求。他透露,IBM Softlayer公有云服务在大陆的数据中心有望在2014年年底、或2015年年初正式投入运营。

1 2

参考资料

1.大数据:(Big Data),研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 ...详情>>

2.云计算:(Cloud Computing)描述了一种基于互联网的新的IT服务增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展而且经常是虚拟化的资源。云计算是继1980年代大型计算机到...详情>>

3.公有云:(Public Cloud)是第三方提供一般公众或大型产业集体使用的云端基础设施,拥有它的组织出售云端服务,系统服务提供者借由租借方式提供客户有能力部署及使用云端服务。它能...详情>>

[责任编辑:于翔 yu_xiang@cnw.com.cn]