问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

什么时候用回归分析,什么时候用时间序列

发布网友 发布时间:2022-04-26 03:42

我来回答

4个回答

热心网友 时间:2022-05-01 23:08

两者的核心区别在于对数据的假设回归分析假设每个数据点都是独立的,而时间序列则是利用数据之间的相关性进行预测。
本文会先说明两者对数据的具体假设差异,再说明AR模型为什么虽然看上去像回归分析但还是有差别,最后也提到一个常见的混淆两者后在金融方向可能出现的问题。
回归分析对数据的假设:独立性在回归分析中,我们假设数据是相互独立的。这种独立性体现在两个方面:一方面,自变量(X)是固定的,已被观测到的值,另一方面,每个因变量(y)的误差项是独立同分布,对于线性回归模型来说,误差项是独立同分布的正态分布,并且满足均值为0,方差恒定。
这种数据的独立性的具体表现就是:在回归分析中,数据顺序可以任意交换。在建模的时候,你可以随机选取数据循序进行模型训练,也可以随机选取一部分数据进行训练集和验证集的拆分。也正因为如此,在验证集中,每个预测值的误差都是相对恒定的:不会存在误差的积累,导致预测准确度越来越低。
时间序列对数据的假设:相关性但对于时间序列分析而言,我们必须假设而且利用数据的相关性。核心的原因是我们没有其他任何的外部数据,只能利用现有的数据走向来预测未来。因此,我们需要假设每个数据点之间有相关性,并且通过建模找到对应的相关性,利用它去预测未来的数据走向。这也是为什么经典的时间序列分析(ARIMA)会用ACF(自相关系数)和PACF(偏自相关系数)来观察数据之间的相关性。
ACF和PACF分别用两种方式衡量数据点与数据点之间的相关性时间序列对相关性的假设直接违背了回归分析的独立性假设。在多段时间序列预测中,一方面,对于未来预测的自变量可能无法真实的观察到,另一方面,随着预测越来越远,误差会逐渐积累:你对于长远未来的预测应该会比近期预测更不确定。因此,时间序列分析需要采用一种完全不同的视角,用不同的模型去进行分析研究。
AR模型和线性回归模型的“相似”和区别时间序列分析中一个基础模型就是AR(Auto-Regressive)模型。它利用过去的数据点来预测未来。举例而言,AR(1)模型利用当前时刻的数据点预测未来的值,它们的数学关系可以被表示为:
它的表达形式的确和线性回归模型非常类似,甚至连一般的AR(n)模型都和线性回归有很高的相似性。唯一的差别就是等式右边的自变量(X)变成了过去的因变量(y)
而正是因为这一点微小的差异,导致两者的解完全不同。在AR模型中,由于模型自变量成为了过去的因变量,使得自变量与过去的误差之间有相关性。而这种相关性使得
利用线性模型得到的AR模型的解会是有偏估计(biased)。对于上述结论的实际证明需要引入过多的概念。在此我们只对AR(1)模型作为一个特例来分析。不失一般性,我们可以通过平移数据将AR(1)模型表示成如下的形式:
对于这类模型,线性回归会给出以下的估计值:对于一般的线性回归模型而言,由于所有的自变量都会被视为已经观测到的真实值。所以当我们取均值的时候,我们可以把分母当作已知,通过过去观测值和未来误差无关的性质得到无偏的结论。
利用回归模型预测AR模型的数据模拟结果:参数估计会是有偏估计事实上,我们会用线性回归模型去近似求解AR模型。因为虽然结果会是有偏的,但是却是一致估计。也就是说,当数据量足够大的时候,求解的值会收敛于真实值。这里就不再做展开了。
忽视独立性的后果:金融方向的常见错误希望看到这里你已经弄懂了为什么不能混淆模型的假设:尤其是独立性或相关性的假设。接下来我会说一个我见过的
因为混淆假设导致的金融方向的错误随着机器学习的发展,很多人希望能够将机器学习和金融市场结合起来。利用数据建模来对股票价格进行预测。他们会用传统的机器学习方法将得到的数据随机的分配成训练集和测试集。利用训练集训练模型去预测股票涨跌的概率(涨或跌的二维分类问题)。然后当他们去将模型应用到测试集时,他们发现模型的表现非常优秀——能够达到80~90%的准确度。但是在实际应用中却没有这么好的表现。
造成这个错误的原因就是他们没有认识到数据是高度相关的。对于时间序列,我们不能通过随机分配去安排训练集和测试集,否则就会出现“利用未来数据”来预测“过去走向”的问题。这个时候,即使你的模型在你的测试集表现出色,也不代表他真的能预测未来股价的走向。
总结时间序列和回归分析的主要区别在于对数据的假设:回归分析假设每个数据点都是独立的,而时间序列则是利用数据之间的相关性进行预测。虽然线性回归和AR模型看上去有很大的相似性。但由于缺失了独立性,利用线性回归求解的AR模型参数会是有偏的。但又由于这个解是一致的,所以在实际运用中还是利用线性回归来近似AR模型。忽视或假设数据的独立性很可能会造成模型的失效。金融市场的预测的建模尤其需要注意这一点。

热心网友 时间:2022-05-02 00:26

方法不同。回归分析是研究变量之间的统计相关关系的一种统计方法。它从自变量和因变量的一组观测数据出发,寻找一个函数式,将变量之间的统计相关关系近似地表达出来。这个能够近似表达自变量与因变量之间关系的函数式。而时间序列更加偏向去有明显的以时间为分割点,某个变量随着时间的推移产生变化。近似于自变量与时间之间的关系。

热心网友 时间:2022-05-02 02:00

时间序列是自己对自己回归,而回归分析是量与量之间的回归。

热心网友 时间:2022-05-02 03:52

可以说得详细点吗??不同的题目选择不同。两种方法各有优劣。根据情况选择
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
国家对腾讯已经作出解除音乐版权处罚,为什么网易云还是很 市场监管总局依法对腾讯控股有限公司作出责令解除网络音乐 腾讯放弃音乐独家版权,绝大部分独家协议已按期解约 高级BEC和中级口译哪个难? 三级口译是什么样的水平 高级日语口译大概是什么水平 高级口译常用谚语 品牌型号怎么填写 送刀剑是什么风水 送礼送菜刀是什么意思 左丘明的后世纪念 “屈原放逐,乃赋《离骚》;左丘失明,厥有《国语》。”翻译 《左传》的作者是谁? 应用统计学的刘春英 左丘明是子夏么? 工作中有没有什么好的文件分类和整理方法 左丘明姓左还是左丘? 时间序列模型和神经网络模型有何区别? 左丘明的研究考证 MATLAB在时间序列建模预测及程序代码 左丘失明,厥有《国语》的故事 左丘明有哪两部文学著作《左传》和《 》 学习综述是什么 左丘明姓丘名明,他为什么要叫左丘明? 左丘明生平 时间序列的各个模型有什么区别和应用 左丘明有没有钱 时间序列数据怎样划分训练集,测试集和验证集 左丘明详细介绍 依据指标值的时间特点,绝对数时间序列分为()。 除了左丘明之外还有谁讲述了春秋 《曹刿论战》中“又何间焉”的"间"是什么意思? 罕闻卓绝的《左传》到底是谁写的? 左丘明有眼无珠,不辨黑黄却认家兄;赵子龙一身是胆,但见孔方即是乃父 跑步很安全吗?有什么风险? 哪些人不适合跑步锻炼身体,会有什么危害? 什么问题不可以跑步? 有人说跑步会让身体素质变差,该如何避免这种情况? 为什么城市道路那么危险,人们还坚持在上面跑步 跑步时心率170危险吗 跑步时要注意这些危险信号 跑步时有哪些注意事项需要我们谨记的呢? 智能手机照片误删怎么恢复软件 体育运动中,你认为有哪些运动的危险系数比较小? 冬季早晨跑步对身体有益还是有害? 智能手机删除的照片怎么恢复? 校园奔跑有什么危险 马拉松比赛身体对外界环境的适应很重要,为什么长跑时失温很危险? 智能手机不小心删除的照片怎么恢复? 跑步心率160有危险吗 体育运动中,有哪些运动的危险系数比较小?