问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

自然语言、描述性文本能够挖掘吗?

发布网友 发布时间:2022-04-23 15:17

我来回答

1个回答

热心网友 时间:2023-07-02 19:48

有人告诉我自然语言和描述性文本不能做数据挖掘。我总觉得有点不对劲。昨天读《计算机世界》,似乎找到了答案。摘录如下: 一种更好的方式是让机器能从相关文章中自动地找出这些关键词。这种自动抽取的过程如何实现呢?简单可行的方法是借助奇异值分解(SDV)技术来完成。奇异值分解(SDV)是线性代数中一种重要的矩阵分解方法,用于将任意矩阵分解为三个具有良好性质的矩阵的乘积(即酉矩阵、对角阵、酉矩阵)并广泛应用于最优化问题、特征值问题、广义逆矩阵等问题中。在进行关键词抽取时,基于词在句子中出现的频数或TF-IDF可以生成“词-句子”关联矩阵,它描述了所有的词与句子的关联性,通过对其进行SDV分解,可以实现词在语义类空间上的投影,投影的坐标值描述了词与相应的语义类之间的相关性,值越大,相关性也就越强。通过对这些相关性进行分析与处理,最终可以得到词的权重并实现关键词的自动抽取。 大数据的应用远远不止于这些,其中应用于自然语言处理。可以实现 很多功能,如自动文本摘要、信息传播可视化、情绪化。 之所以能够操纵大数据,是同时具备算法和平台分布式计算两方面核心能力,,前者帮助我们聪明地思考和组织数据,后者帮助我们大规模处理这些碎片化信息,将稀释的数据价值汇聚加工成新的生产力。——“豆粕 口罩 禽流感——大数据告诉你H7N9背后的故事”计算机世界2013.17因为我没有理工科出身背景,对奇异值分解(SDV)技术、矩阵分解方法等还弄不明白。但我相信这些绝不是空穴来风。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
流量保险是什么 会计的基本常识是什么 我奶奶这几天总是拉肚子,而且只能躺着一站起来眼睛就发黑,医生说她贫血... win7c盘里找不到users,用户里也没有c:usersadministrator... C盘里没有users文件夹 pvc天然气管能用多久 PVC天然气管的寿命是多久?  请教大神这怎么搞?天然气排烟管怎么弄? ...时不用在手机确认电脑登陆微信如何不用手机确认 急性胰腺炎护理 急性胰腺炎非手术治疗的护理措施 如何巧抓重点词句理解课文内容 什么是关键词? excel中 如何将含有关键词的单元格以及左右单元格的内容自动抽取出来 谢谢大家 论文关键词怎么写 为什么有些导师会要求学生从科学论文中自动抽取关键词? 常见百度关键词挖掘方法分别是什么请列举? 写作中关键词的写法怎样写 PPT怎么制作抽关键词的啊? 什么是自动标引系统 如何对文本型数据进行抽样?如下图:从下面的文本数据中随机抽10个样本。 非常感谢! 急问,C++关于关键词抽取特征的代码 simhash中如何抽取文本关键字及权重 如何抽取相同关键词文本? 如何进行中文新闻网页关键词抽取 “关键词”提取都有哪些方案? 用蟹笼捉螃蟹要用什么饵?笼子扔到河中间还是河靠边的位置? 钓螃蟹用什么饵料? 现在抓螃蟹用什么方法好 抓螃蟹用什么诱饵 抓螃蟹用哪些工具? 关键词论文格式 《塞尔达传说》剑之试炼必须一次过吗? 《塞尔达传说 荒野之息》剑之试炼一共多少层? 《塞尔达传说》剑之试炼一共多少层? 塞尔达传说 大师剑怎么获得 塞尔达大师剑怎么开光? 谁知道塞尔达传说荒野之息剑之试炼初阶无伤打法? 《塞尔达》大师剑怎么开光? 《荒野之息》剑之试炼奖励是什么? 塞尔达传说荒野之息大师剑试炼怎么过 大师剑试炼通关攻略说明 塞尔达传说荒野之息剑之试炼攻略 真大师剑怎么拿攻略 《塞尔达》大师剑开光区别是什么? 《塞尔达传说》大师剑开光后耐久是无限的吗? 塞尔达传说荒野之息剑之试炼模式介绍 剑之试炼攻略分享 《塞尔达》大师之剑坏了怎么办? 华为荣耀10悬浮窗从哪打开,设置好了,就是不知道怎么打开? 塞尔达传说大师模式剑之试炼怎么过 剑之试炼过关方法 塞尔达传说 荒野之息剑之试炼怎么开启 请问一下两个月前删除的照片,怎样才能找回他? (塞尔达传说荒野之息)大师剑在哪得?还有怎样才能快速提升到13颗心?_百...