发布网友 发布时间:2022-04-23 05:45
共1个回答
热心网友 时间:2023-08-13 05:13
数据挖掘手段就目前来说,大概分为两种,一种是以搜索引擎为代表的利用爬虫技术进行整个页面的抓取,优点是量大,缺点是只是泛采,不能对数据进行深入挖掘。另一类是以数据采集,舆情监测为代表的利用类爬虫技术进行一个网页中对信息的时间,地点,任务等细节进行抓取,优点是准确,缺点是对服务器和自身技术的要求较高。下面举例子说明一下你的问题。
8月19日,“准女大学生被骗学费”事件一开始澎湃新闻和沂蒙晚报进行相关报道,主流媒体掌握着发声话筒,引导着*的发展。21日,被骗女大学生徐玉玉离世,一时间各大新闻媒体、贴吧群组、微博微信先后报道“准女大学生被骗学费后伤心猝死”事件。*关注度达到了顶峰,统计数据共达25,150条。
这就是第二种技术的成功实践。分析要基于对理论的深入研究和实际的应用,希望这样的回答能让你得到体会。