多变量时间序列分类综述 (一)
发布网友
发布时间:2024-05-09 17:11
我来回答
共1个回答
热心网友
时间:2024-05-13 02:12
近年来,多变量时间序列分类(Multi-Variable Time Series Classification, MTSC)的研究引起了广泛关注,尤其是[1]《The great multivariate time series classification bake off》这篇综述性文章,为工程师和研究人员提供了丰富的实践指导。与单变量时间序列分类(Single-Variable Time Series Classification, SVTSC)相比,MTSC涉及跨维度特征的处理和海量数据的高效分析。其中,ROCKET算法[3]因其卓越的精度和快速训练速度,被推荐用于初步评估[2]。
MTSC的挑战在于如何有效融合不同维度的信息,如通过Distance Measures(如欧氏距离)衡量向量间的相似性。Adaptive warping策略采用阈值选择,如Shokoohi-Yekta的方法,通过信息增益来确定依赖还是独立的动态时间规整(DTW),这一过程依赖于训练数据集的特性[4]。
Ensemble methods如HIVE-COTE[3]通过集成单变量分类器,如STC和TSF,实现MTSC的提升。HIVE-COTE v1.0通过加权概率集成,实现了多变量数据的高效处理。Shapelets作为可解释的特征,如gRFS算法通过随机形状和决策树策略,利用bagging方法引入多样性[5]。
学习阶段,如Shapelet Learning,通过梯度下降优化形状片段的选择,通过欧氏距离进行分类。单一形状片段可能效果有限,但在组合使用时能提升分类性能[6]。例如,滑动窗口方法如Histograms over a dictionary通过SFA转换和卡方检验,再配合逻辑回归进行分类,如WEASEL+MUSE[7]方法。
Interval summarizing策略,如TSF和CIF,聚焦于时间间隔特征的提取和组合。TSF通过计算平均值、标准差和斜率等特征,结合随机森林和Entrance指标[8]。CIF在此基础上引入了Canonical Time-Series Characteristic (Catch22)特征,扩展到多变量场景,而CIF的实现细节通常需要借助CSTSA工具箱中的22个特征[9]。
值得注意的是,尽管这些算法最初设计为处理单变量,但在MTSC中,通常需要对多维度数据进行预处理。如CIF选取特征时,对每个维度进行随机选择,以适应多维度的复杂性[10]。综上所述,多变量时间序列分类是一个充满挑战和创新的领域,不断有新的方法和技术被提出,以应对不断增长的数据复杂性和多样性。