问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

【如何辨别僵尸粉】信息熵、图灵测试和数字化社会网络的未来

发布网友 发布时间:2022-04-23 13:20

我来回答

1个回答

热心网友 时间:2023-10-15 09:21

在“僵尸粉”的围攻下,新浪微博似乎正在被僵尸占领、并逐渐失去对普通用户的吸引力,在微博平台、广告商、品牌主、普通网民复杂的利益纠缠当中,“微博大战僵尸”一触即发。这场战争中的制胜武器是算法——识别算法vs.伪装算法的能力与进化速度决定了最终的成败得失。那么,在打击“僵尸粉”的未来道路上,会不会出现一劳永逸的识别算法使僵尸永无出头之日,抑或是加速了机器算法的进化、并最终从根本上改变我们对社会网络的基本定义?【正文】媒体的价值来源于其所提供的信息的价值,微博作为国内社会化媒体的代表,其价值在于它能够以最便捷的形式传达给每个用户他/她个人最关心的信息(这是微博的即时性和高可定制性决定的)。这样来看,僵尸粉的危害主要是产生无用信息——虚假的粉丝数、误导性的评论和转发。需要强调的是,本文中的“僵尸粉”指所有受控制的社会网络帐号,包括受外部操控的机器人(bot)和半机器人(cyborg),这个定义也许与目前国内的主流定义略有不同,后者主要强调“僵”,而忽略了“受控”——其实活动的僵尸、即微博营销界cyborg性质的“水军”,才是微博生态圈的主要危害来源。微博的信息价值可以用信息熵表示(介绍见这里,和这里)。如果将微博全部信息看作一个“*场”系统的话,高价值的信息能够降低总信息熵(信息熵是负值);而低质量的信息增加总信息熵(值得一提的是,“信息熵”在国内存在着广泛的误读与误用,例如这个误导性的言论、这篇文章记录的中国学术界曾经的乱象,特别是这个针对社会网络结点价值的疑似伪理论)。微博用户言论的信息熵能够在一定程度上反映他/她的言论质量,这个思想已经体现在辨别僵尸粉的学术文章中(Zi Chu et al,2010)。当然,单纯使用信息熵不足以判断僵尸身份,还需要结合其他方法,如语义网络结构、社会网络结构、以特殊目的为线索(文中所附链接地址、发送信息的终端类型)等。这些方法无外乎分为三大类:(1)计算语言学范畴(从说什么入手),(2)社会网络分析范畴(从社会关系入手),以及(3)其他类。目前已经出现了辨别僵尸粉的*应用,爱影响团队也在开发适应国内微博环境的类似应用,所用方法基本可归为以上三类。将这些方法合理组合,以现阶段僵尸粉的伪装技术水平,基本上能实现通吃。问题是现在用类似工具扫除僵尸粉的行动还属于个案——而一旦开始全网范围的大规模行动会发生什么?僵尸粉也就会开始加速进化——本质上,上述方法都是基于样本的统计差异识别僵尸粉,“僵尸”的伪装算法具有巨大的提升空间:在一次次的剿灭与幸存中,通过更新语义库、构建更完善的社会网络等方法,僵尸将更好地模仿“自然人”的行为模式。例如,自从这个僵尸粉统计器小小地出名了一把之后,5个粉丝、5条发言就成为了僵尸粉的新标配,因为该统计器的三条判断标准当中两条就是“粉丝数低于5”、“微博数低于5”。那么,当识别算法升级到“用户发言的语义网络与所属群组统计偏离度”、“用户的社会网络结构-传播网络互动记录与群组统计偏离度”…等等更为“高端”的标准之后,会发生什么?这种挑战的本质属于图灵测试(Turing Test)。辨别僵尸粉就是一种在网络的社会化、也即我称之为数字化社会网络时代的“基于社会网络的图灵测试”。图灵测试用于判断机器是否能够思考,这涉及到自然语言处理、机器学习等若干种基础性人工智能课题,R M French写了一篇重要的历史回顾(Robert M. French,2000)。微博数据记录了人的过往言论,以及这些言论在社会网络中的传播路径,因此“僵尸军团”实际上是在发展一种基于一切社会网络过往行为记录的伪装算法。考虑到未来技术将记录和保存人一生中全部经历,为语义库、机器学习等人工智能算法提供海量数据的支持,“微博大战僵尸”还提供了算法的实战训练场,“伪装算法”最终战胜“识别算法”就是最有可能的未来了。这是微博版本的“机器的反击”?差不多。僵尸粉生存的目的就是与真实人类互动从而(在多种意义上)实现营销目标。所以僵尸粉最有力的反击就是用高质量信息创造高质量用户体验。现在,一些没什么人关注的僵尸粉会转发知名教授学术观点等高质量内容——这很好理解,这就是僵尸在“吃饭”,用富营养内容武装自己——据我猜测,现阶段基于内容的识别算法基本上和垃圾邮件算法无甚区别,所以内容本身就是解药。现在这种方式仍然很低端,没错,但是未来会怎样呢?如果对用户来说,一个僵尸粉发的信息比他的朋友转发的无聊八卦还有价值——如果他们成为用户的媒体过滤器和社交助手,不是默默无言、不是整天转发促销打折信息、也不再在评论中留下一堆无意义的编码,而是每天和你互动,讲笑话,为你推荐餐馆、娱乐场所,参与到你和朋友的讨论并明确支持其中一方的言论,甚至作为倾诉对象,你是否会关注他?成为朋友?进化的“僵尸粉”,或者说cyborg,将会与人类长期共存。其实这并不稀奇,与很多习以为常的人机互动并无本质不同。这种图景很适合用“行动者网络理论”(Actor-network theory)描述。僵尸粉提高了社会系统的整体智慧,人类的社会网络在与之互动的过程中也会改变——就像google改变人脑的记忆方式一样,由人和机器组成的网络将在社群级别上改变人类的社会互动方式:机器人朋友围绕在我们周围,模拟出与真实的社会交流无异的社会环境,抑或,帮我们解决“人类的孤独”这类终极命题?这种技术与社会的互动构成了人类社会的过去,现在和未来。作者:@高济禾 任职于宣亚集团,任研究员,2010年进入传播行业,热衷于研究社会化营销理论,最近开始写博客 。之前做过财务分析员、投资咨询、*咨询等。

热心网友 时间:2023-10-15 09:21

在“僵尸粉”的围攻下,新浪微博似乎正在被僵尸占领、并逐渐失去对普通用户的吸引力,在微博平台、广告商、品牌主、普通网民复杂的利益纠缠当中,“微博大战僵尸”一触即发。这场战争中的制胜武器是算法——识别算法vs.伪装算法的能力与进化速度决定了最终的成败得失。那么,在打击“僵尸粉”的未来道路上,会不会出现一劳永逸的识别算法使僵尸永无出头之日,抑或是加速了机器算法的进化、并最终从根本上改变我们对社会网络的基本定义?【正文】媒体的价值来源于其所提供的信息的价值,微博作为国内社会化媒体的代表,其价值在于它能够以最便捷的形式传达给每个用户他/她个人最关心的信息(这是微博的即时性和高可定制性决定的)。这样来看,僵尸粉的危害主要是产生无用信息——虚假的粉丝数、误导性的评论和转发。需要强调的是,本文中的“僵尸粉”指所有受控制的社会网络帐号,包括受外部操控的机器人(bot)和半机器人(cyborg),这个定义也许与目前国内的主流定义略有不同,后者主要强调“僵”,而忽略了“受控”——其实活动的僵尸、即微博营销界cyborg性质的“水军”,才是微博生态圈的主要危害来源。微博的信息价值可以用信息熵表示(介绍见这里,和这里)。如果将微博全部信息看作一个“*场”系统的话,高价值的信息能够降低总信息熵(信息熵是负值);而低质量的信息增加总信息熵(值得一提的是,“信息熵”在国内存在着广泛的误读与误用,例如这个误导性的言论、这篇文章记录的中国学术界曾经的乱象,特别是这个针对社会网络结点价值的疑似伪理论)。微博用户言论的信息熵能够在一定程度上反映他/她的言论质量,这个思想已经体现在辨别僵尸粉的学术文章中(Zi Chu et al,2010)。当然,单纯使用信息熵不足以判断僵尸身份,还需要结合其他方法,如语义网络结构、社会网络结构、以特殊目的为线索(文中所附链接地址、发送信息的终端类型)等。这些方法无外乎分为三大类:(1)计算语言学范畴(从说什么入手),(2)社会网络分析范畴(从社会关系入手),以及(3)其他类。目前已经出现了辨别僵尸粉的*应用,爱影响团队也在开发适应国内微博环境的类似应用,所用方法基本可归为以上三类。将这些方法合理组合,以现阶段僵尸粉的伪装技术水平,基本上能实现通吃。问题是现在用类似工具扫除僵尸粉的行动还属于个案——而一旦开始全网范围的大规模行动会发生什么?僵尸粉也就会开始加速进化——本质上,上述方法都是基于样本的统计差异识别僵尸粉,“僵尸”的伪装算法具有巨大的提升空间:在一次次的剿灭与幸存中,通过更新语义库、构建更完善的社会网络等方法,僵尸将更好地模仿“自然人”的行为模式。例如,自从这个僵尸粉统计器小小地出名了一把之后,5个粉丝、5条发言就成为了僵尸粉的新标配,因为该统计器的三条判断标准当中两条就是“粉丝数低于5”、“微博数低于5”。那么,当识别算法升级到“用户发言的语义网络与所属群组统计偏离度”、“用户的社会网络结构-传播网络互动记录与群组统计偏离度”…等等更为“高端”的标准之后,会发生什么?这种挑战的本质属于图灵测试(Turing Test)。辨别僵尸粉就是一种在网络的社会化、也即我称之为数字化社会网络时代的“基于社会网络的图灵测试”。图灵测试用于判断机器是否能够思考,这涉及到自然语言处理、机器学习等若干种基础性人工智能课题,R M French写了一篇重要的历史回顾(Robert M. French,2000)。微博数据记录了人的过往言论,以及这些言论在社会网络中的传播路径,因此“僵尸军团”实际上是在发展一种基于一切社会网络过往行为记录的伪装算法。考虑到未来技术将记录和保存人一生中全部经历,为语义库、机器学习等人工智能算法提供海量数据的支持,“微博大战僵尸”还提供了算法的实战训练场,“伪装算法”最终战胜“识别算法”就是最有可能的未来了。这是微博版本的“机器的反击”?差不多。僵尸粉生存的目的就是与真实人类互动从而(在多种意义上)实现营销目标。所以僵尸粉最有力的反击就是用高质量信息创造高质量用户体验。现在,一些没什么人关注的僵尸粉会转发知名教授学术观点等高质量内容——这很好理解,这就是僵尸在“吃饭”,用富营养内容武装自己——据我猜测,现阶段基于内容的识别算法基本上和垃圾邮件算法无甚区别,所以内容本身就是解药。现在这种方式仍然很低端,没错,但是未来会怎样呢?如果对用户来说,一个僵尸粉发的信息比他的朋友转发的无聊八卦还有价值——如果他们成为用户的媒体过滤器和社交助手,不是默默无言、不是整天转发促销打折信息、也不再在评论中留下一堆无意义的编码,而是每天和你互动,讲笑话,为你推荐餐馆、娱乐场所,参与到你和朋友的讨论并明确支持其中一方的言论,甚至作为倾诉对象,你是否会关注他?成为朋友?进化的“僵尸粉”,或者说cyborg,将会与人类长期共存。其实这并不稀奇,与很多习以为常的人机互动并无本质不同。这种图景很适合用“行动者网络理论”(Actor-network theory)描述。僵尸粉提高了社会系统的整体智慧,人类的社会网络在与之互动的过程中也会改变——就像google改变人脑的记忆方式一样,由人和机器组成的网络将在社群级别上改变人类的社会互动方式:机器人朋友围绕在我们周围,模拟出与真实的社会交流无异的社会环境,抑或,帮我们解决“人类的孤独”这类终极命题?这种技术与社会的互动构成了人类社会的过去,现在和未来。作者:@高济禾 任职于宣亚集团,任研究员,2010年进入传播行业,热衷于研究社会化营销理论,最近开始写博客 。之前做过财务分析员、投资咨询、*咨询等。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
我小弟要当兵,这几天在等家访,我想问一下需要拿钱之类的吗?_百度知 ... 怎样治好气管炎 怎么治好气管炎 气管炎能彻底治好吗 分手后再遇见前男友是什么感受? 分手后与前任再相遇 指弹怎么练 用吉他练指弹有什么快速入门的办法 皖西学院新生住哪里 皖西学院的宿舍条件好吗? 你们觉得机械姬这部电影想不想一个图灵测试 你是如何看待图灵测试和中文房间论证之间的关系 Siri 可以通过图灵测试吗 人类距离人工智能还有多远 图灵测试能够判断高等智慧的存在吗 1单选(1分) 以下哪种属于图灵测试? A. 对于文件夹加密后备份密钥的过程 B. 判定用于登 建设银行公积金提取可以取多少 如果我的住房公积金有三万,一次最多能取多少 “图灵测试”是什么意思? 贷款买了房住房公积金每年最多能取现多少 江西代取公积金能提取多少 住房公积金提取可以让别人代取吗 公积金可以提取几次? 关于审计抽样的问题,帮忙解答下 商业贷款,第一次提取公积金能提多少 国标NS312(相当于美标Inconel600)无缝管制作标准。 外网访问ftp问题 住房公积金贷款提取可以提取多少 EXCEL如何将表1中筛选B列满足条件的A列内容自动显示在表2中 一五粮液系列干一杯金世豪情45°C多少钱? 计算机能够思维的观点是谁提出的 理论上讲,计算机能不能给自己编程序? 图灵测试与中文屋子在哲学上可视作可知论与不可知论的具体矛盾事例? 谷歌能够自动打电话的AI,被称赞通过图灵测试的Duplex,为什么背后却是真人在伪装? 科技术语有哪些呀? 数学有关的电影 OPPO账户密码锁屏密码全忘了怎么解锁? OPPO手机锁屏密码忘了怎么用电脑解锁? oppo手机6位数密码忘记了怎么办? 锁屏密码忘了,OPPO账号密码也忘了怎么办? OPPO手机忘记密码了怎么办? 怎么才能改? oppo手机密码忘了,但是刷机要密码怎么办? OPPO手机本机原密码忘记了如何改新密码? oppo手机忘记密码怎么改密码 ??? OPPO账号密码忘记了怎么办 oppo账号的密码忘了怎么办? oppok1屏幕密码忘了怎么从电脑上解开? 苹果7p信号不稳定,有4G网确用不了,别人打电话打不进来有时候_百度知 ... iPhone7puls缺点是什么 iPhone 7p有和我一样信号很差的吗?