您的位置: 网界网 > 大数据 > 正文

靠大数据打仗,没那么美、那么简单

2015年07月04日 21:24:47 | 作者:企业网D1Net | 来源:论坛 | 查看本文手机版

摘要:大数据现在是个热门词汇。许多人相信,随着大数据在军事领域的高效开发和全面运用,战争将步入大数据时代。未来战场上,“任何人都必须用数据说话”,只有具备大数据优势的一方,才能在战场上立于不败之地。但事实上,依靠大数...

标签
大数据
数据安全
数据搜集

核心提示

大数据[注]时代,要依靠大数据来打仗,目前还没有看起来那么美。必须具备以下几个条件:一是要破解数据搜集的难题。要有丰富、有价值的数据。二是要有能用数据真正说话的程序模式。必须有过硬的软件设计,分析程序。三是要有适应“秒杀”的决策机制。指挥信息系统很关键。四是要注重打好法律战,否则大数据泄露将成为巨大隐患。五是解决人才问题。

大数据现在是个热门词汇。许多人相信,随着大数据在军事领域的高效开发和全面运用,战争将步入大数据时代。未来战场上,“任何人都必须用数据说话”,只有具备大数据优势的一方,才能在战场上立于不败之地。但事实上,依靠大数据打仗,并没有看起来那么美。

不破解数据搜集难题,大数据只能是空中楼阁

大数据通常是指规模远远超过传统数据库软件处理能力的海量数据集合。据美国政府估计,全球每年由各类设备产生的数据约达1.2ZB,其中1ZB=12亿TB。若用1粒沙代表1B数据,1PB(相当于1000T)约等于1英里长、100码宽的沙滩,而1.2ZB的数据就如同一片浩瀚的沙漠。维克托·迈尔·舍恩伯格和肯尼斯·库克耶在《大数据时代》中所称的大数据四大特点,即大量、高速、多样、真实,也是说其大新多等等。

从数据分析的角度看,海量数据有一定的积极意义。因为只有当数据达到一定的量且足够大,才能提供可信的规律分析。海量数据能带给人们视角上的宏观与高远,可以使人们站在更高层级全面看待问题,发现曾经被淹没的数据价值,注意藏匿在整体中有用的细节。但海量不等于全量,也不等于恰好足量。海量数据可能并非你希望的数据,并非对你有用的数据。收集数据是为了发现其背后隐藏的信息,而不是不管有没有价值随意收集。然而现实中,所谓的海量数据对分析某一特定问题,绝大部分都可能是没有价值、毫无意义的。在军事领域,尤其如此。军事领域之所历来有“战争迷雾”,根本的原因还是其强烈的对抗性,敌对双方或多方拼命隐真示假,决定了情报搜集之难。而有了大数据技术,就能解决情报搜集问题吗?显然,二者之间并没有必然的因果关系。要成功运用大数据技术,最重要的前提是必须破解数据搜集难题,真正回答谁来收集数据,怎样收集数据?

如果没有丰富的有价值的数据搜集为前提,大数据技术就是好看不好用的“花架子”,再中看也不中用。在平时训练中,如果采集到的数据不准、质量不高,就无法确保评估结果的真实性和有效性;在战时,如果不能及时拦截、获取敌方数据信息,以及不能准确辨别敌方的干扰、迷惑或欺骗数据信息,将其引入己方作战部署,都会造成误判,导致作战行动的失败。美军虽然强调大数据的实战化运用,注重提高“从数据到决策的能力”,但更注重数据的搜集及其真实性,强调在情报获取上要实现对陆、海、空、天、电、网等多维空间的全覆盖。由此可见,应用大数据打仗就要在数据汇总、数据深度挖掘、异常数据识别与检测等一系列关键技术上进行攻关,真正为大数据运用做好铺垫,然后才谈得上盖起大数据支持战争的高楼。

没有能用数据真正说话的程序模式之前,大数据只能是个传说

很多推崇大数据的人认为,“有了足够的数据,数据就可以自己说话”。似乎在一行行的代码和庞大数据库背后,存在着有关人类行为模式客观、普遍的有价值的见解,不管是消费者的支出规律、犯罪或恐怖主义行动、健康习惯,还是雇员的生产效率,以及战争规律。但要让庞大的数据自己说话,必须有过硬的软件设计,分析程序,要真正做到这一点,谈何容易。

有资料显示,2014年,国际资本市场相继推出一系列大数据产品,颇为引人关注。但在当年末中国爆发的牛市行情中,大数据产品或是满仓踏空,或是原地踏步,有的还略有下跌,其表现与市场散户相差无几。原因何在?就是因为软件设计不过硬,分析程序不到位,导致大数据产品选股原则、调整机制等跟不上市场脉络。究其根本,还是在于以简单思维模式去思考“新兴加转轨的股票市场”这样复杂的动态系统,难以摆脱“盲人摸象”的困窘。很明显,没有符合实际善于沥尽黄沙见真金的分析程序,空有大数据也不能得出正确的结论。而美国《外交政策》杂志则指出,即使有大数据分析程序也要对其分析结果保持一定的谨慎,因为只要是人为设计的东西,都难免有偏见,并不能使人们摆脱曲解、隔阂和错误的成见。当大数据试图反映我们所生活的社会化世界时,探索“战争迷雾”背后的真相时,这些因素变得尤其重要。偏见和盲区存在于大数据中,就像它们存在于个人的感觉和经验中一样。

世界著名科学网站“边缘”曾就“哪些科学概念该退休了,以便为科学进步让道”问题,对175位著名学者进行调查。其中,认知科学家加里·马尔库塞说:“科学的核心仍然是寻找描述宇宙的法则,而大数据并不擅长识别法则。”大数据重混杂性轻精确性、重相关性轻因果性,能够发现“是什么”而不探究“为什么”。大数据验证人们对社会和战争的分析结论,有时比提供分析结论更为适合。回想二战之际,日本大和级战列舰可谓空前绝后,让人叹为观止,但面临战争格局突变时却又显得大而不当、大而无用,成为愚不可及的垃圾工程,其根子还是作战需求和设计出现偏差。大数据建设同样如此,如果对未来作战研究不深入、不具体,对作战需求把握不准确、不到位,程序设计不到位,大而化之、想当然为之,差之毫厘,将谬以千里。

没有适应“秒杀”的决策机制,大数据也于事无补

信息化战争已经进入读秒时代,“秒杀”往往在一瞬间发生。而大数据有其分析的快速性,能在很短的时间进行问题分析、关联推荐、决策等,应该说有其适应快速反应的优势。但如果没有与之相对应的指挥决策机制,大数据的这一优势也可能被人为削弱,甚至荡然无存。

美军从事大数据研发任务的重要承包商DRC公司高级技术主管帕特里·德伦赫就指出,如何使人们更有效地跨机构协作,提高决策效率,是当前大数据技术需着力研究解决的问题。换句话说,让大数据真正进入“秒杀”时代,功夫在诗外。目前,许多国家尤其是一些新兴国家的军队,军兵种之间的壁垒仍然很高,各作战系统都在生产自己的数据,并将其存储在数据竖井中,从而形成一座座混乱成堆的数据“通天塔”。如果这种人为的数据壁垒和隔阂不解决,想要大数据助军事指挥一臂之力,只能是一厢情愿。

与之类似的是,如果指挥体制不能融合各种作战力量,仍然让各军兵种各行其是,那么大数据即使分析出正确的结论,也会因为在冗长的周转中耗费掉最佳作战时机。因此要想真正利用大数据打仗,必须突出“网链聚能”,强化信息系统综合集成,充分利用高度融合、互联互通、资源共享的指挥信息系统,有效发挥信息流对物质流和能量流的支配作用,实现作战力量的高度聚合、作战资源的合理分配和作战效能的精确释放。加强数据资源建设,实现数据资源的统一化、规范化、交互化、标准化,为信息系统综合集成提供一个稳定规范的数据环境。

不注重打好法律战,大数据泄露将成为巨大隐患

大数据从出现以来,就一直受更有财富、更有技术能力者的把持和操纵。世界在使用大数据上存在着不平等,由此将导致许多问题。

目前在美国国内,已经有人发现大数据容易产生歧视。美国《外交政策》杂志称:由于大数据可以发现有关群体不同于其他人的行为方式,因此很容易被拿来作为歧视特定群体的依据。也就是说,大数据分析某一特定群体的数据结果,反而可能被心怀歧视者拿来散布,指指点点,说三道四。

同时,大数据也容易加剧某一国家内的贫富分化。因为大数据的价值不言而喻,在社会各个领域如金融、制造、能源、商贸、物流、农业、气象等方面(+微信关注网络世界),都可能带来潜在的巨大价值。正因为这种价值吸引力,当前许多行业、企业都在竭尽力量采集数据、占有数据和利用数据。但出于各自利益的考虑,这些或公或私收集的数据往往只有限地开放,大部分数据没有开放,于是所有企业都挖空心思采集数据、占有数据。这就产生了一个严重的问题:数据的割裂和数据垄断出现了。大数据垄断所造成的大数据资源的贫富差距太大,大数据的交易就还是富人之间的游戏,普通人只能享受很微不足道的数据红利。长此以往,大数据鸿沟会越来越深。

大数据强调搜集分析海量数据,必然会涉及到窃取他人隐私。美国窃听全球的“棱镜门”事件,就是一例,连其最亲密的盟国领导人都未能幸免。一项对欧洲150万手机用户大数据研究表明,只需要4项参照因素就足以挨个确认其中95%的人的身份。研究人员指出,人们在城市中走过的路径存在唯一性,而鉴于利用大量公共数据集可以推断很多信息,这使个人隐私泄露成为“日益严重的担忧”。高度个人化的大数据即将成为黑客或泄露者觊觎的主要目标。因此这就提出一个问题,在将大数据应用于社会领域或军事领域时,如何通过法律保护一个公民或国家最基本的权利。

大数据虽然有其优势,但如果管理不好,则会助长对公民隐私和对一国秘密的窃取。在一国之内会累积产生社会矛盾,肆无忌惮的骚扰电话与此就有着直接关系;在国际上则会助长霸权主义,因为大数据可能被利用来窃取他国秘密。因此,要利用好大数据服务于战争或国家安全,首先必须打好法律战。尤其要从安全上,加强对大数据搜集和应用的管理,加强对大数据窃密的防范。其一是使大数据管理更加规范,减少公民对隐私被随意泄露传播的担忧。其二是对于硬件或者基础设施建设、数据存储、终端运用等,加强安全管理,防止类似“棱镜门”事件的发生。其三是加强军事大数据安全建设,尽量杜绝他国对本国军事消息的刺探侦察等等。

不解决人才和思维引领,大数据举步维艰

不可否认,大数据如果运用得当确实能发挥其应有的作用。但大数据不是主导,主导大数据的仍然是人才及其思维方式、战略取向。就像维克托在《大数据时代》中谈到的,大数据时代并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代,大数据为我们提供的不是最终答案,更好的方法和答案还在不久的将来。麻省理工学院数字商业中心首席科学家埃里克·布林约尔森也指出,支撑大数据的数学模型只是一种简化模式,大数据无法取代思想、范例、组织以及人们思考世界的方式。言外之意,人仍然是大数据背后的主导者,不能把一切希望都寄托在大数据上。

理论与数据,始终是两张皮。实际上无论何时应用数据作战,都要注重发挥人的主观能动性。美国南北战争时期,林肯手下的谢尔曼将军率大军攻进南方的中心城市亚特兰大后,准备挥师东进、横穿佐治亚州,攻打沿海重镇萨凡纳。为此,谢尔曼特别询问了阿拉巴马州鲍德温郡的情况,以确定行军路线。他的参谋们则提供信息说:“鲍德温郡,优质农田43982英亩、普通农田115844英亩、农场总价值1110163美元,家禽总价值314300美元,年产小麦13475蒲式耳、土豆63077蒲式耳……”听着这一连串的数据,谢尔曼要求参谋根据农作物、牲畜等在各地的分布,计算这些资源够一支队伍支撑几天,并以确保在当地完成补给、遭遇敌方抵抗最少为前提,从中确定最佳的行军路线。这次用数据远征的突袭,成了南北战争后期的一个重要转折点,不久便以北方军队的完胜而告终。

试想,如果没有谢尔曼的运筹帷幄,有关鲍德温郡的各种数据,又有何用?当然,现代战争需要抓紧培养的重点是能够适应信息化战争需要的大数据人才,以保证真正使大数据进入未来战争并发挥作用。而这些人才最重要的品种,至少要包括两条。一是必须有前瞻思维,能够始终站在军事变革前沿,展望新一代信息技术发展,提高技术认知力。突出海量数据分析、分布式计算、数据可视化等关键技术研发,以及与云计算[注]、无线网络技术的集成应用,加强独创性设计与运用,着力提高数据分析挖掘能力。要瞄准明天的战争,提升大数据信息分析处理质量层次。注重跟踪掌握发达国家高新技术、军事理论、作战训练最新发展,尽早发现、深入研究有可能带来颠覆性改变的新技术、新理论,下大力挖掘隐藏其中的深刻洞见,以敏锐把握新军事变革发展脉搏,抢占打赢未来信息化战争的制高点。二是有坚持真理的实事求是态度。毫无疑问,大数据能够为人们呈现出新的深刻洞见和释放出巨大价值。但问题是,当真正从大数据中发现有价值的规律和信息时,也要敢于坚持真理,不能随领导的好恶而随意更改数据依据,修改结论,否则就会使应用大数据研究完全失去意义。

参考资料

1.大数据:(Big Data),研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 ...详情>>

2.云计算:(Cloud Computing)描述了一种基于互联网的新的IT服务增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展而且经常是虚拟化的资源。云计算是继1980年代大型计算机到...详情>>

[责任编辑:行云之路 yu_xiang@cnw.com.cn]