
写在前面的话:本文描述了一个名为 FTS-Diffusion 的全新生成架构,旨在对金融时间序列内的不规则与尺度不变模式加以模拟。此类模式因其独有的时间动态特质(也就是模式在持续时长和幅度方面的变化重复性),致使现有方式难以精准捕捉。FTS-Diffusion 架构涵盖了三个模块,分别是尺度不变模式的识别算法、基于扩散的生成网络以及模式的时间演变建模。经由大量的实验操作,成功证实了 FTS-Diffusion 能够塑造出与观测数据极度相似的合成金融时间序列,并且在股票市场预测的下游实验里,将错误率大幅降低了多达 17.9%。据作者所了解,这属于针对金融范畴中具备不规则和尺度不变特性的复杂时间序列数据生成问题展开的首次探究。
金融经济领域的研究人员已经展现出深度学习在化解金融环境中繁杂问题方面的潜能。然而,数据的短缺以及金融数据较低的信噪比,成为了制约深度学习在金融领域深入发展的两大关键阻碍。与自然科学有所不同,金融研究人员无法借助实验来获取更多的数据,所以金融时间序列受到既有历史的限制。另外,价格和回报数据受到高水平噪声的干扰,这让从有限的数据集合中提取有用信息变得更为艰难。在数据不充足的情况下训练的深度学习模型,很容易出现过拟合的情况,不能期望其在未曾见过的数据上稳定且可靠地发挥作用。

一、相关研究:
论文对深度生成建模在多个领域中生成时间序列数据的进展予以了回顾,特别是变分自编码器(VAEs)、生成对抗网络(GANs)以及基于扩散的模型。不过,这些方法在应对具有不规则性和尺度不变性的复杂金融时间序列时面临着挑战。

二、问题描述:
金融时间序列里的不规则和尺度不变模式,对于那些假定具有规律性和均匀性的现有模型而言,难以准确捕捉。论文构建了一个全新的框架来模拟这些模式,并将其拆解为模式识别、生成和演变这三个流程。
FTS-Diffusion 框架:
FTS-Diffusion 框架是为了塑造具有不规则和尺度不变模式的金融时间序列而精心设计的。此框架通过把金融时间序列生成问题分解为三个主要步骤:模式识别、模式生成以及模式演变。

- 模式识别模块 (Pattern Recognition Module)
此模块的目的在于从金融时间序列中识别出不规则和尺度不变的模式。为此,论文提出了一种全新的算法,称作尺度不变子序列聚类(Scale-Invariant Subsequence Clustering, SISC)。该算法运用动态时间规整(Dynamic Time Warping, DTW)来处理不同长度和幅度的子序列,并通过贪婪策略来明确最优化的分段长度。SISC 算法首先通过一个初始化流程来准备候选的聚类中心,接着使用 DTW 距离来对比候选长度的子序列与聚类中心的距离,进而找出最优的分段。这个过程会不断迭代,一直到聚类分配趋于稳定或者达到预先设定的迭代次数。 - 模式生成模块 (Pattern Generation Module)
此模块的目标是合成模式的片段。它由两个特定的网络构成:一个扩散网络和一个缩放自编码器(Scaling Autoencoder, AE)。
扩散网络:基于去噪扩散概率模型(Denoising Diffusion Probabilistic Model, DDPM),通过逐步添加噪声(扩散过程)和逐步去除噪声(去噪过程)来模拟模式的生成。去噪过程由一个神经网络近似,该网络学习每一步的去噪梯度。
缩放 AE:用于学习可变长度序列与固定长度表示之间的转换。编码器将可变长度的序列拉伸成固定长度的表示,而解码器则从固定长度的表示重构出可变长度的序列。
这两个网络共同训练,将在模式识别模块中识别出的序列当作训练数据。
- 模式演变模块 (Pattern Evolution Module)
这个模块承担着模拟连续生成的序列片段之间时间演变的职责。它运用一个马尔可夫链来对模式之间的转换状态进行建模,涵盖了模式本身、持续时长和幅度。为了捕捉这些状态的时序动态,论文引入了一个模式演变网络,该网络学习在给定当前状态的情况下下一个模式的概率以及相应的持续时长和幅度的缩放因子。
合成整个金融时间序列 (Synthesizing Entire Financial Time Series)
FTS-Diffusion 把模式视作生成的基础构件,并基于模式逐个生成合成时间序列。给定一个从历史数据中采样获取的初始片段,它通过反复地运用模式生成模块和模式演变模块来生成连续的片段。在每个位置,模式演变网络预测下一个模式及其持续时长和幅度的缩放因子。然后,模式生成模块依据这些状态生成下一个片段。随着更多片段的生成和附加,合成时间序列逐步延展。这个过程不断重复,直至整个时间序列达到所需的总长度。

三、数值实验:
作者通过数值实验对 FTS-Diffusion 的性能进行了评估,并和其他方法展开了对比。实验结果表明,FTS-Diffusion 生成的合成金融时间序列在分布上和观测数据高度近似,并且在下游任务中具备实用性。
四、相关结论:
论文构建了 FTS-Diffusion 框架,用于合成具有不规则和尺度不变模式的金融时间序列。通过将金融时间序列生成分解为模式识别-生成-演变过程,并设计了三个专属的模块来达成这一过程。实验结果证实了 FTS-Diffusion 在合成与观测数据相似的金融时间序列方面的有效性,并为下游任务提供了有价值的数据。这是首次在金融领域中针对具有不规则和尺度不变特性的复杂时间序列数据生成问题展开的研究。
本文内容仅仅是技术探讨和学习,并不构成任何投资建议。
Be First to Comment