什么是商业帖
发布网友
发布时间:2022-10-12 06:06
我来回答
共1个回答
热心网友
时间:2023-10-19 06:49
标签为 ‘商业帖’
28
12
小论商业帖识别
IWOM 于 2009-12-28,12:06 评论 (1)
小论商业帖识别
by Denis Yu
新年新气象,作为笔者所处的承担了通过技术手段为网络口碑研究和咨询提供支持重任的技术部门来讲,在新的一年我们也要开始新的征程。特别是技术部门中的核心技术研发团队,也早早地开始了对新的一轮技术难题的攻坚战。
记得去年在广州参加第四届网址年会发表关于博客内容的挖掘与分析演讲之后,有位现场的朋友问了一个很好的问题:现在很多的博客内容存在大量的商业信息,会不会对基于博客内容进行互联网口碑分析的结果产生影响。在***过去几年对网络口碑的研究中,发现除了在博客中存在这种现象之外,其实在BBS上这种现象可能更为严重,例如*手文章,转载帖,报价贴。“网络讨论本身作为一种信息存在,不同类别的帖子其实反应了不同的网络沟通现象,由此,*手文章, 转载帖, 报价贴等也可以被看成一种沟通现象加以分析。虽然这类帖子的比例在千百万的网络讨论中依然很低,但是当需要更加精准地甄别消费者对品牌,产品真实感想和体验的时候,剔除*手文章, 转载帖,报价贴等的影响也成为了网络口碑分析技术需要探索的问题之一,这里就列举两类可以用技术手段自动识别的商业贴:
“…帕萨特1.8T豪华轿车 转让!帕萨特1.8T豪华轿车、8成新、售价3.8万,5挡自动变速器,直列四缸1.8升排量发动机,原车原配置,个人私家车,05年03月上牌使用,车况良好,行驶3.5万公里,无任何事 故,保险到年底,手续齐全,可过户。另有宝马745li/12万,奔驰s500/10万,丰田佳美2.4/4万,奥迪A61.8T/6万,本田雅阁2.4/3万,帕萨特1.8T/3.8万…”
此帖是一个典型报价帖, 一般此类帖子中包含了大量对品牌和产品的提及, 可以考虑通过对于同类关键字超常频次的统计将这些帖子识别出来。
“…最近我的车贴了膜,是强生玄武石的,感觉确实不错,没有以前热了,阳光也没有以前刺眼了…”
这个帖子在某个时间段中在各大论坛上共出现了一百多次,虽然在每个论坛出现的时候不一定所有的文字全部一样,但是使用技术手段还是可以将其识别出来。具体识别的一些算法,可以参考我们技术博客中的文章对大量转载贴识别算法的研究。
通过我们的实验,发现用技术来识别这类性质文章还是有不错的准确率。当然如果要把这套技术使用到商业系统中,还需要考虑到大规模计算的消耗,信息的存储,以及如何和后期分析系统相结合等等问题。如果这些问题都能够得到解决,相信这个技术的很多价值就能得到体现,比如:
* 能够排除网络口碑中的商业信息,让分析的结果更加贴近于网民真实的声音。
* 对于BBS来讲,很多BBS都有专门的网管,他们的工作内容之一可能就是甄别商业信息,而这样的引擎能够给他们一个强有力的工具,提高他们的工作效率。
* 对于品牌来讲,也可以通过专门针对商业信息的研究了解竞争对手的动向,以便及时采取应对措施。
另外,我相信规避被技术识别成商业帖的方法也会不断的发展,而技术因为这样的原因也会不断的进行改进。就类似于有些人为了提高搜索引擎的排名,而不断的通过一些不合理的手段进行网页优化,而搜索引擎又不断的提高自己的技术,将这种问题逐个解决的过程一样。 魔高一尺,道高一丈,这个不断克服和发展的过程可能也会在个领域体现出来。
http://blog.it.sohu.com/iwom/archives/tag/%E5%95%86%E4%B8%9A%E5%B8%96