【如何辨别僵尸粉】信息熵、图灵测试和数字化社会网络的未来

发布网友发布时间：2022-04-23 13:20

共1个回答

热心网友时间：2023-10-15 09:21

在“僵尸粉”的围攻下，新浪微博似乎正在被僵尸占领、并逐渐失去对普通用户的吸引力，在微博平台、广告商、品牌主、普通网民复杂的利益纠缠当中，“微博大战僵尸”一触即发。这场战争中的制胜武器是算法——识别算法vs.伪装算法的能力与进化速度决定了最终的成败得失。那么，在打击“僵尸粉”的未来道路上，会不会出现一劳永逸的识别算法使僵尸永无出头之日，抑或是加速了机器算法的进化、并最终从根本上改变我们对社会网络的基本定义？【正文】媒体的价值来源于其所提供的信息的价值，微博作为国内社会化媒体的代表，其价值在于它能够以最便捷的形式传达给每个用户他/她个人最关心的信息（这是微博的即时性和高可定制性决定的）。这样来看，僵尸粉的危害主要是产生无用信息——虚假的粉丝数、误导性的评论和转发。需要强调的是，本文中的“僵尸粉”指所有受控制的社会网络帐号，包括受外部操控的机器人（bot）和半机器人（cyborg），这个定义也许与目前国内的主流定义略有不同，后者主要强调“僵”，而忽略了“受控”——其实活动的僵尸、即微博营销界cyborg性质的“水军”，才是微博生态圈的主要危害来源。微博的信息价值可以用信息熵表示（介绍见这里，和这里）。如果将微博全部信息看作一个“*场”系统的话，高价值的信息能够降低总信息熵（信息熵是负值）；而低质量的信息增加总信息熵（值得一提的是，“信息熵”在国内存在着广泛的误读与误用，例如这个误导性的言论、这篇文章记录的中国学术界曾经的乱象，特别是这个针对社会网络结点价值的疑似伪理论）。微博用户言论的信息熵能够在一定程度上反映他/她的言论质量，这个思想已经体现在辨别僵尸粉的学术文章中（Zi Chu et al，2010）。当然，单纯使用信息熵不足以判断僵尸身份，还需要结合其他方法，如语义网络结构、社会网络结构、以特殊目的为线索（文中所附链接地址、发送信息的终端类型）等。这些方法无外乎分为三大类：（1）计算语言学范畴（从说什么入手），（2）社会网络分析范畴（从社会关系入手），以及（3）其他类。目前已经出现了辨别僵尸粉的*应用，爱影响团队也在开发适应国内微博环境的类似应用，所用方法基本可归为以上三类。将这些方法合理组合，以现阶段僵尸粉的伪装技术水平，基本上能实现通吃。问题是现在用类似工具扫除僵尸粉的行动还属于个案——而一旦开始全网范围的大规模行动会发生什么？僵尸粉也就会开始加速进化——本质上，上述方法都是基于样本的统计差异识别僵尸粉，“僵尸”的伪装算法具有巨大的提升空间：在一次次的剿灭与幸存中，通过更新语义库、构建更完善的社会网络等方法，僵尸将更好地模仿“自然人”的行为模式。例如，自从这个僵尸粉统计器小小地出名了一把之后，5个粉丝、5条发言就成为了僵尸粉的新标配，因为该统计器的三条判断标准当中两条就是“粉丝数低于5”、“微博数低于5”。那么，当识别算法升级到“用户发言的语义网络与所属群组统计偏离度”、“用户的社会网络结构-传播网络互动记录与群组统计偏离度”…等等更为“高端”的标准之后，会发生什么？这种挑战的本质属于图灵测试（Turing Test）。辨别僵尸粉就是一种在网络的社会化、也即我称之为数字化社会网络时代的“基于社会网络的图灵测试”。图灵测试用于判断机器是否能够思考，这涉及到自然语言处理、机器学习等若干种基础性人工智能课题，R M French写了一篇重要的历史回顾（Robert M. French，2000）。微博数据记录了人的过往言论，以及这些言论在社会网络中的传播路径，因此“僵尸军团”实际上是在发展一种基于一切社会网络过往行为记录的伪装算法。考虑到未来技术将记录和保存人一生中全部经历，为语义库、机器学习等人工智能算法提供海量数据的支持，“微博大战僵尸”还提供了算法的实战训练场，“伪装算法”最终战胜“识别算法”就是最有可能的未来了。这是微博版本的“机器的反击”？差不多。僵尸粉生存的目的就是与真实人类互动从而（在多种意义上）实现营销目标。所以僵尸粉最有力的反击就是用高质量信息创造高质量用户体验。现在，一些没什么人关注的僵尸粉会转发知名教授学术观点等高质量内容——这很好理解，这就是僵尸在“吃饭”，用富营养内容武装自己——据我猜测，现阶段基于内容的识别算法基本上和垃圾邮件算法无甚区别，所以内容本身就是解药。现在这种方式仍然很低端，没错，但是未来会怎样呢？如果对用户来说，一个僵尸粉发的信息比他的朋友转发的无聊八卦还有价值——如果他们成为用户的媒体过滤器和社交助手，不是默默无言、不是整天转发促销打折信息、也不再在评论中留下一堆无意义的编码，而是每天和你互动，讲笑话，为你推荐餐馆、娱乐场所，参与到你和朋友的讨论并明确支持其中一方的言论，甚至作为倾诉对象，你是否会关注他？成为朋友？进化的“僵尸粉”，或者说cyborg，将会与人类长期共存。其实这并不稀奇，与很多习以为常的人机互动并无本质不同。这种图景很适合用“行动者网络理论”（Actor-network theory）描述。僵尸粉提高了社会系统的整体智慧，人类的社会网络在与之互动的过程中也会改变——就像google改变人脑的记忆方式一样，由人和机器组成的网络将在社群级别上改变人类的社会互动方式：机器人朋友围绕在我们周围，模拟出与真实的社会交流无异的社会环境，抑或，帮我们解决“人类的孤独”这类终极命题？这种技术与社会的互动构成了人类社会的过去，现在和未来。作者：@高济禾任职于宣亚集团，任研究员，2010年进入传播行业，热衷于研究社会化营销理论，最近开始写博客。之前做过财务分析员、投资咨询、*咨询等。

热心网友时间：2023-10-15 09:21