原创不易,转载请标明出处及原作者。

写在前面的话:价格走势预测旨在根据当前市场信息预测金融资产趋势,目前大多数现有的机器学习方法都与极低的信噪比和金融数据的随机性作斗争,经常将噪声误认为真实的交易信号,而没有仔细选择潜在的优质的样本。本文提出了一个新的价格运动预测框架LARA,它有两个主要组成部分:位置感知注意(LA-Attention)和迭代细化标记(RA-Labeling)。在三个现实世界金融市场:股票、加密货币和etf的一系列实验中,LARA在的表现明显优于几种基于机器学习的方法。
“Trade When Opportunity Comes: Price Movement Forecasting via Locality-Aware Attention and Iterative Refinement Labeling”

一、简介
价格运动预测在量化金融中是一个关键且具有挑战性的任务。传统的有效市场假说认为市场信息效率高,价格变动应该是不可预测的。然而,实践中完美的效率是不可能实现的,因为存在信息不对称和交易者之间的“噪音”行为。机器学习在寻求“击败市场”和获得超额回报方面变得越来越流行,并取得了令人期待的结果。
利用机器学习技术进行金融预测的两个主要步骤:挖掘与资产回报相关/预测的有效因素,并将这些因素作为特征输入到机器学习算法中生成交易信号。然而,金融时间序列数据的信噪比极低,容易出现过拟合的情况。因此,本文提出了一种更加有效和稳健的方法,即专注于具有潜在可预测性和盈利性的特定样本。
在高噪声数据下进行价格运动预测的两个技术挑战,本文针对这两个挑战提出了对应的解决方案。
挑战1:如何有效提取潜在有利可图的样本?
局部感知注意力(LA-Attention)包括度量学习模块和定位模块。度量学习模块用于构建更好的度量,定位模块则用于明确提取潜在有利样本。度量学习模块通过学习更兼容的距离度量来辅助定位模块。定位模块旨在通过局部整合标签信息来提取潜在有利样本。
挑战2:如何自适应地优化潜在盈利样本的标签?
有两种方法来提高金融市场预测模型的性能。第一种是LA-Attention方法,通过关注标签信息来提取潜在的有利样本,并构建更准确的分类器。第二种是RA-Labeling方法,通过多个预测器迭代地细化潜在有利样本的噪声标签,并将多个预测器结合起来提高模型的泛化能力。实验结果表明,LARA方法在三个真实金融市场上显著优于其他机器学习方法。
二、相关工作
价格走势预测。基于机器学习方法的价格走势预测有两个主要的研究方向。(1)专注于通过引入额外的财务数据源来改进预测。(2)开发专门的预测模型以提高预测精度。尽管在价格运动预测方面做出了越来越多的努力,但在一个极其嘈杂的市场中,很少有人明确地将辅助标签信息纳入其中。我们提出了两步LA-Attention来有效地提取潜在的有利可图的样本。
处理标签噪音。在许多现实世界的应用中,使用噪声标签进行学习是一个共同的挑战。SEAL(自进化平均标签)旨在解决实例依赖的标签噪声。除了标记方法外,还可以通过特征向量(FINE)过滤噪声实例,或者通过分析两个模型之间的预测值来动态选择训练样本。然而,在量化投资的背景下,由于极端的噪声水平,这些方法可能不够。简单的标签修改或噪声样品去除可能会无意中增加不确定性或消除潜在的盈利机会。相比之下,我们的RA-Labeling方法旨在自适应地细化潜在有利可图样本的噪声标签,以构建噪声-robsut模型。

预备知识
问题的设置。考虑资产交易价格在T时间步长的时间序列Price t。我们采用固定时间范围的方法来定义资产价格趋势。标签yt表示资产价格在一段时间内的回报∆是否超过某个预定义的阈值λ。对于长期预测。

对于短期预测,如果Price t+∆/Price t-1 < -λ,我们设标签1,否则设标签0。在训练步骤t,基于截至时间t的价格和量的信息计算特征向量x,其标签y={0,1}。我们将训练集表示为X与它的标签y。
目标。价格走势预测旨在建立一个(二元)参数化分类器fθ,其中fθ(Xt)=Pr(Yt=1)表示价格趋势Yt是否超过预定义阈值λ的概率。为了防止金融数据的数据泄露问题,fθ(xt)仅根据截至t的价格信息对前∆步(t+∆)的资产价格趋势yt进行预测。
高px样本。我们假设预测标签yt~Bernoulli(p xt)的条件是已知信息xt在第t个时间步长。这意味着我们以基于当前市场条件的概率p xt观察到正类。p xt越大,表明资产价格的趋势越强,不确定性越低,因此在这个时间步长的预测更可靠。为了做出更准确的预测,我们收集具有高p xt的样本,其中p xt大于给定阈值(thres)。然而,不可能从输入数据中获得确切的潜在概率p xt,因为我们只能在一个特定的时间步长观察到分布yt~Bernoulli(p xt)的一个样本。因此,我们引入位置感知注意来给出p xt的近似估计。
三、LARA
LARA框架包括两个主要组件:局部感知注意力(LAAttention)和迭代细化标记(RALabeling)。LARA的关键思想是从嘈杂的市场中提取潜在有利样本。LAAttention提取具有高潜力的样本,而RALabeling则细化嘈杂样本的标签,以提升预测器的性能。

3.1 位置感知注意力(LA-Attention)

LA-Attention方法分为训练和测试两个阶段。在训练阶段,我们首先提取具有高p xt的样本,满足p xt > thres(thres表示一个样本产生正类的期望概率)。然后根据相应的监督损失在这些选择的样本上训练一个更鲁棒的模型。在测试阶段,我们首先根据p xt > thres的准则收集高p xt的样本,然后只对这些选择的样本进行预测。

3.2 定位模块
我们设计了一个针对数据集中其他观测样本的定位模块,以获得px的近似估计p xt。
在一般的注意机制中,模型允许每个样本关注其他每个样本。直观上,查询样本的近邻比远近邻具有更大的相似性。我们将局部性结构注入到模块中,通过执行掩码关注方案,只关注xt的邻居N(xt)。

我们提出了两种方案来定义定位模块中的邻居N(x t):1)查询点的k个最近邻居(K-Neighbor);2)中等半径内的k近邻(R-Neighbor)。此外,存在几个合理的相似度指标来实现Eq.(3)中的关注权重。我们推荐两种实用的方法:1)相同的权重;2)马氏距离。

3.3 度量学习模块
我们需要对嵌入空间上的数据表示之间的距离进行合理的测量,以选择具有高p x t的样本。我们采用度量学习技术减轻了人工寻找合适距离度量的压力,增强了LARA的灵活性。度量学习的目标是学习一个马氏距离度量M,将相似的样本拉近,将不相似的样本推开。一个直接的解决方案是最小化同一类中样本的不相似性。


3.4 迭代细化标注(RA-Labeling)

众所周知,价格走势很难预测,因为金融市场是复杂的动态系统。我们观察到,复杂的金融市场有时会误导机器学习系统产生相反的预测结果,而且置信度极高。这种有噪声的样本阻碍了价格走势预测中的模型泛化。因此,LARA应该对潜在盈利样本的噪声标签具有鲁棒性,我们采用了引入的标签翻新技术来学习噪声鲁棒预测模型。形式上,给定训练数据X,我们的方法以迭代的方式运行,得到自适应细化标签yk。
我们将第k轮训练好的预测器和第k轮样本j的当前预测分别表示为fθk和fθk(x j)。翻新后的标签yj k+1可以通过当前标签yj k和相关预测fθk(x j)的凸组合来获得:

我们使用指数移动平均来减轻噪声样本的欠预测标签的损害,因此置信度分数αj k是自适应训练方案中的关键参数。我们建议根据当前步骤的训练损失来更新αj k,以缓解在噪声样本下使用瞬时预测的不稳定性问题。第k步时样本xj的αj k的计算公式为:

为了开发一个更连贯的预测器,提高其评估噪声样本一致性的能力,我们自适应地设置了λk的值,以粗略地调整训练数据中标签的比例,用r表示。
与传统的噪声标注方法不同我们进一步提出了一种组合方法来整合学习到的预测器。经过K次迭代细化标记,我们得到K+1个迭代预测因子{fθ 0,···,fθ K}。我们使用以下两种不同的组合方案对所有预测因子进行整合:
(1)C = C Last:根据最后迭代的预测因子进行预测。
(2)C = C Vote:对所有迭代预测者进行平均预测。
则输出预测模型F定义如下:

请注意,ra标签可以无缝地集成到现有的机器学习方法中,以减轻从噪声标签中学习的负面后果。
四、实验
我们在三个现实世界的金融市场上进行了广泛的实验:中国a股、加密货币(OKEx)和etf,以验证LARA的有效性。
4.1 实验设置
数据。从Qlib获取CSI300股票的日常数据,使用技术和限价订单因素计算输入特征,将数据分为训练、验证和测试集。对于加密货币,使用BTC/USDT交易对,每个记录是一个市场快照,使用技术和限价订单因素计算输入特征,将数据分为训练、验证和测试集。对于ETF,使用四个中国交易所交易的ETF进行实验,将数据分为训练、验证和测试集。
基线。(1) Qlib中的量化投资方法:ALSTM、TabNet、Transformer、Adamct、LightGBM、DoubleEnsemble、TCTS。(2)时间序列分析方法:由于每日股票数据的时间性质,我们还实现了几种SOTA时间序列方法,包括iTransformer、PatchTST、TimesNet。(3)噪声标签方法:CNLCU、FINE、SEAL。
性能指标。我们使用四个常用的财务指标来评估LARA的性能,即精度(PR)、赢-亏比(WLR)、#Transactions和平均回报(AR)。
评估方式。对于交易信号,我们采用预测概率最高的100到1000个样本作为交易信号。对于交易策略,我们不设交易仓位限制,如果模型给出正向信号,我们开立新的多头仓位,并在预测时间窗口后关闭该仓位。类似地,我们对负向信号开立空头仓位,并在预测时间窗口后关闭该仓位。对于LARA,我们使用LightGBM的默认超参数和度量学习模块。其他方法使用它们在Qlib上建议的参数或我们对它们进行网格搜索。所有实验都重复5次,并报告平均结果和标准偏差。
4.2 结果
实验结果表明,LARA在股票和加密货币方面的精度和平均回报率都优于其他竞争对手,且风险较低。此外,研究者还探讨了LA-Attention在高概率样本上的效果,发现在训练和测试阶段都使用LA-Attention能够提高性能,但仅在训练或测试阶段使用会导致性能下降。因此,需要在两个阶段都关注高概率样本以捕捉更可靠的交易机会。


4.3 分析
结果表明,LARA模型在不同交易频率下的精度始终优于其他模型。在回测策略的累计收益方面,LARA模型也始终表现出色。此外,LARA模型在中国A股市场的交易分布中,能够根据市场指数价格的波动情况,选择更可靠的交易机会。这些结果表明,LARA模型可以指导实际的量化投资,选择可靠的交易机会。

五、 总结
本文提出了LARA框架,用于价格变动预测,包括LA-Attention和RA-Labeling两个组件,能够在金融市场上表现优异。通过实验证明LARA能够捕捉更可靠的交易机会,为更现实的AI交易预测场景铺平道路。
论文来源 | https://arxiv.org/pdf/2107.11972
本文内容仅仅是技术探讨和学习,并不构成任何投资建议。
转发请注明原作者和出处。
Be First to Comment