您的位置: 网界网 > 大数据 > 正文

Splunk:实时分析机器数据

2013年08月07日 15:35:15 | 作者:网界网 于翔 | 来源: | 查看本文手机版

摘要:在大数据的分类中,由机器生成的数据是发展最快、最为复杂,同时也极具商业价值的大数据组成形式。IT应用程序、系统和基础设施每时每刻都在生成数据,这些机器数据包含有关用户处理、客户行为、机器行为、安全威胁、欺诈活动等...

标签
大数据
机器数据
Splunk
Hadoop

【CNW.com.cn 专稿】大数据[注]的分类中,由机器生成的数据是发展最快、最为复杂,同时也极具商业价值的大数据组成形式。IT应用程序、系统和基础设施每时每刻都在生成数据,这些机器数据包含有关用户处理、客户行为、机器行为、安全威胁、欺诈活动等的明确记录,这部分数据具有动态、非结构化和非标准的特点。

数据引擎供应商Splunk是一家擅长从海量机器数据中提取有价值信息,并进行实时分析和展现的企业,目前在这一领域已经发展了十年的时间。Splunk产品营销副总裁Sanjay Mehta表示,在传统的应用环境中,机器数据的利用面临严峻挑战,商业智能和数据仓库的解决方案并不是面向这些大量、动态和非结构化的数据而设计的。而新兴的开源技术可以部分解决问题,但涉及的系统集成的工作却又十分耗时。

“Splunk Enterprise解决方案能够收集非结构化的时间序列机器数据,并编制索引加以利用。它能够读取来自网络流量、Web服务器、自定义应用程序、应用服务器、虚拟机管理程序、GPS系统、股市源、社交媒体和已经存在的结构化数据库中的信息,深入分析IT系统和基础设施的运营状况,帮助企业从系统运维数据中获取业务决策参考,并实现端到端的运维可见性。”Mehta说。

据介绍,目前Splunk已经在全球90个国家拥有超过5000家客户。企业可在大规模生产部署中使用Splunk对高达1PB的数据进行历史搜索。Splunk还支持快速部署(+微信关注网络世界),用户在5分钟内可以将其下载到一个服务器上,并开始运行。同一软件可以在大规模基础设施中横向扩展,每天检索数十TB的数据。

Mehta表示,Splunk的数据引擎技术也在与Hadoop等新兴大数据技术相互融合。2013年6月,Splunk发布了Hunk(即Splunk Analytics for Hadoop)测试版。Hunk让企业用户能够更加快速、简单地探索、分析、可视化和分享存储在Hadoop中的数据。另外,Splunk还向用户提供Splunk Hadoop Connect和Splunk App for HadoopOps。其中,Splunk Hadoop Connect提供与Splunk Enterprise的双向集成,Splunk App for HadoopOps则从Splunk Enterprise中监测整个Hadoop部署。

参考资料

1.大数据:(Big Data),研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 ...详情>>

[责任编辑:于翔 yu_xiang@cnw.com.cn]