您的位置: 网界网 > 大数据 > 正文

机器能识别出讽刺含义吗?

2014年07月30日 13:49:13 | 作者:CNW.com.cn | 来源: | 查看本文手机版

摘要:将分析法应用到社交媒体之中?不是所有的词都可以根据字面意思进行判断。自然语言处理程序可以提供协助,但是它们也不是万能的。

标签
大数据
讽刺分析
机器学习
自然语言处理

【CNW.com.cn 专稿】将分析法应用到社交媒体之中?不是所有的词都可以根据字面意思进行判断。自然语言处理程序可以提供协助,但是它们也不是万能的。

自然语言非常神奇。就如同优美的诗歌,我们日常所说的话常常除了字面意思之外还有引申含义。从最基本的角度来说,组织、理解和辨识这些引申含义的语言机制已经深深地刻在了我们的脑海里。同时我们所处的文化背景也在对它们不断地进行修订。这种思维过程具有有意识性和无意识性,就如同虽然每天我们的嘴都在动,大部分人几乎意识不到它们在动一样。

讽刺是一种典型的多层半意识语言现象。从本质上说,它们是一种双重目的的表达方式,即说话者内心想表达的意思与他们所说的话的表面意思完全相反。例如,有人会说“我想知道这是哪些天才想出来的?”这并不是建议提名某人应该获得诺贝尔奖。

当(实际或潜在)客户对你的公司进行讽刺时,这几乎从来都不是什么好事情。这意味着他们不再尊敬你,无论事情是好是坏,他们都不再认真向你准确地表达他们的真实想法。不仅如此,他们可能还会在你背后说一些你的坏话。在这一过程中,他们可能正在暗示即将远离你,如果他们并不是你的客户或刚刚远离你,那么他们可能会要求其他公司停止与你进行业务合作。如果你希望与他们保持合作,那么这显然是一个需要积极主动去解决的问题。

如果你没有与说话者相同的文化背景,即便你有,如果你没有意识到说话人的场景语境,那么将讽刺从真诚表达中辨别出来将是一件非常棘手的事情。即便你尝试着不断了解你所关注群体的最新隐语,但是文化的变化速度非常之快,并且方式也难以琢磨,一些熟识的短语还是会在你没有察觉的情况下被赋予新的含义。搞清楚一句无伤大雅的话背后有多少讽刺意味,并不是一件容易的事情。

出于这些原因,讽刺分析几乎肯定无法实现百分之百的自动化。在将重点放在特定环境中的特定人所做的陈述时,通常需要一定程度的人为判断,而你的评估中存在着大量的不确定性。确定某个人的真实意图的最佳方式是通过谈话对他们进行试探。当然,我们不可能在询问中让被询问人停止撒谎和欺骗,让他们表达出他们的真实意图。不过,你至少可以自由地使用讽刺发现工具来分析。

如果你正在尝试以讽刺陈述的增加作为证据来评估客户情绪的变化,那么讽刺分析技术可能正是你所需要的东西。近期有一篇文章讨论了关于自然语言处理(NLP)和机器学习应用是如何支持品牌管理创新的。据作者Erin Carson称,讽刺分析为用户提供了一个机会(+微信关注网络世界),他们可以借此了解到一些产品和服务的问题,产品的一些意想不到的用途,品牌在哪里浪费了过多时间,或者在哪里花费时间不足,以及客户与潜在客户的总体感觉。

自动讽刺分析是无法达到完美程度的。这篇文章引述行业分析师的话称,关键词分析的准确度通常只能达到60%至65%,自然语言处理(NLP)可将准确度提升至80%至85%。尽管如此,还是有15%的内容需要依靠人去辨别。此外,某些人的判断是不值得信任的;部分人在阅读他人的意图时可能根本找不到线索。

在你尝试着从别人的语言表达中衡量他们的意图时,评估值是否达到百分之百无关紧要。如果你评估出客户85%的表达是真诚的,那么你基本可以认为,他们言语中所隐晦的部分并没有包藏祸心。虽然他们力图直白和坦率地表达自己的意图,但是毕竟大多数人在15%的表达中对双重含义的词汇并不敏感。

讽刺并不等同于背叛。通常情况下也是如此,它们所表达的只是对本应令人满意的关系中出现令人恼火事情的不满。(范范编译)

[责任编辑:于翔 yu_xiang@cnw.com.cn]