Skip to content

“少即是多” 的践行:动态深度神经网络在短期股票预测的 AI 决策

作者:老余捞鱼

原创不易,转载请标明出处及原作者。

写在前面的话:本文来自Plotinus Asset Management,介绍了一种创新的多智能体深度学习方法(Model A),该方法应用于基于美国S&P 500指数的期货市场交易。与长短期记忆网络(LSTM)、随机森林和梯度提升树等传统机器学习方法相比,Model A在历史测试中表现出色,其结果与持有期货合约的被动投资模型相比较,在多个关键绩效指标上实现了显著的超越。特别值得一提的是,Model A在只有41.95%的市场暴露的情况下,实现了比100%市场暴露的被动投资更高的盈利性,展示了其在减少风险的同时增加盈利的潜力。

一、概述

作者概述了机器学习在交易研究中的活跃地位,明确了预测未来价格的目标,并指出了金融变量的复杂性、模型参数的丰富性、市场波动的随机性以及变量非平稳性带来的困难。同时提到,尽管学术上某些模型可能成功,但它们经常忽略了在现实世界中迅速侵蚀利润的交易成本和价差问题。此外,还提到了基于数据的评估,显示了超过五年期间,有78.68%的美国大型股票基金表现不如S&P 500指数。

二、数据和方法

作者聚焦于华尔街交易日的交易数据,从开盘到收盘(美东时间09:30至16:00),这段时间虽然在交易量和心理影响上非常重要,但在过去二十年中,对于S&P 500期货的整体增长贡献仅占20.5%。这表明,相对于被动交易策略,主动交易方法可能在这一时段内提高收益。

数据限制在基于交易所的标准数据,包括2018年1月至2023年12月期间的CME E-mini S&P 500期货合约(代码ES)的价格和成交量数据,以及CBOE波动率指数(代码VIX)的价格数据。为了计算绩效指标,还使用了2018年1月至2023年12月期间的美国三个月期国债的联邦储备数据。

2.1 长短期记忆网络(LSTM)

LSTM是一种深度神经网络,非常适合处理序列数据,尤其是在时间序列预测方面表现出色。LSTM能够在嘈杂的数据环境中,如金融市场,快速准确地识别市场模式。模型需要选择合适的输入数据变量,包括网络的层数、深度和每层的节点数。此外,还可以调整样本大小、批量大小、序列长度、误差标准和周期数等。

在实验中,选择了三个输入变量:(a) CME E-mini S&P 500期货合约在交易日开盘时的价格;(b) CBOE波动率指数在交易日开盘时的价格;(c) 前一天交易的期货合约成交量。选择了20天的序列长度,以反映趋势、市场波动性和市场活动。响应变量是二元的,基于交易日的价格上涨或下跌。

2.2 梯度提升树(GBT)和随机森林(RF)模型

这些集成学习方法通过避免过拟合的同时保持准确性而受到关注。GBT是一种迭代机器学习技术,通过最小化指定的损失函数来构建强预测模型。RF是一种集成学习算法,通过构建多个决策树并合并它们的输出来提高准确性和控制过拟合。

2.3 动态深度神经网络——Model A

Model A的设计考虑到了大数据使用的长期可行性问题,采用了有限的标准金融数据和应用强化学习。Model A是一个多智能体系统,结合了深度神经网络和决策树。该模型旨在超越时间序列数据输入的约束,发展对市场条件的情境理解。Model A有两个智能体,它们在相同的数据环境中自主操作,每个智能体都通过与环境和伙伴智能体的交互来优化自己的短期回报。

Model A的数据环境限于CME E-mini S&P 500期货合约的价格数据和CBOE波动率指数的价格数据。Model A的架构允许模型首先发展决策背景,然后能够持续重新评估这一背景,这是通过强化学习过程实现的。

这种情境重新评估每24小时进行一次,目标是成功确定每天市场的方向。Model A的样本大小为250天,并为单一日窗口进行了预测。同时,决策树智能体使用相同的输入变量,但具有更小的特征样本大小,并使用20天的序列,为模型提供对近期市场行为的缩减评估,以协助决策过程。

Model A创建了一个决策(做多、做空或关闭)并补充了行动:进行投资的规模。例如,如果给定的决策是做多/做空,行动可以是零,从而有效地将做多/做空纠正为关闭头寸。因此,Model A实际上有三个分类输出:做多、做空和关闭。相比之下,LSTM、GBT和RF模型没有关闭输出或额外的纠正行动,因此是纯二元决策,具有相同的暴露。

在实践中,这种基于智能体的规模行动有助于抑制暴露,特别是在波动的市场中。另一方面,当智能体认为这样做是谨慎和有利可图时,可以增加规模(暴露)。只要决策准确,通过这种方式抑制暴露就会降低风险/回报比率。在所呈现的结果中,使用的规模是+1表示做多,-1表示做空,0表示关闭头寸。

三、 结果

本章集中展示了所采用的机器学习模型在实际交易中的性能评估结果。评估的时间段从2018年1月开始,一直持续到2023年12月,总共包括了1509个交易日的观察数据。

首先,文章通过常规的准确性指标和混淆矩阵来评估分类性能。准确性是指正确预测的正例和负例占总观察数的比例。在这个案例中,被动模型的准确性为54.61%,意味着在观察期间有54.61%的交易日实现了日间正回报。文章还提供了正预测值(Positive Predictive Value, PPV)和负预测值(Negative Predictive Value, NPV),分别用来衡量预测为正的案例中实际为正的比例,以及预测为负的案例中实际为负的比例。

表1显示了不同模型的预测准确性。被动模型、梯度提升树(Gradient Boosted Trees, GBT)、随机森林(Random Forest, RF)、长短期记忆网络(Long Short-Term Memory, LSTM)和Model A的准确性分别为54.61%、50.23%、51.76%、50.89%和56.87%。Model A在负预测值上表现最佳,达到了52.97%。

表2提供了基于日间回报的汇总统计数据。被动模型和三个分类模型的均值为0.02%至0.03%,而Model A的均值稍高,为0.05%。所有模型的标准差均为0.96%,除了Model A,其标准差为0.56%,表明Model A在减少波动性方面更为有效。

文章进一步讨论了标准绩效指标,如年化回报、平均月回报、年化波动性、Beta系数、夏普比率(Sharpe Ratio)和索提诺比率(Sortino Ratio)。Model A在这些指标上均优于被动模型和其他机器学习模型。特别是,Model A的年化回报为14.92%,远高于被动模型的3.09%,并且具有最高的索提诺比率2.97,表明其在风险调整后的回报上表现最佳。

表3进一步展示了这些绩效指标。Model A的Alpha(年化)为11.60%,表明其具有显著的非相关回报。Beta系数为0.18,意味着Model A的投资表现与市场的相关性较低,从而降低了风险。

文章还提供了累计日间百分比利润的图表,展示了六年期间不同投资模型的表现。被动模型的表现相对稳定,而其他模型则表现出较大的波动。Model A在减少波动性方面表现突出,并且在大多数时间里都优于被动模型和其他测试模型。

表3提供了进一步的绩效指标,包括最大回撤、盈利月份的百分比、亏损月份的百分比、Calmar比率和信息比率。Model A的最大回撤为-7.87%,远低于其他模型,并且在盈利月份的百分比上也表现最佳。

上表展示了每日决策的长仓或短仓交易的百分比以及对总利润的贡献。Model A的总市场暴露(多头或者空头)仅为41.95%,远低于其他方法的100%,这表明Model A倾向于在确定交易有足够可能性时才进行交易。

最后,文章展示了每日日间回报的频率分布,并将其与被动基准的分布进行了比较。Model A的分布与其他模型和被动基准明显不同,其在0%的高频率集中反映了智能体行动频繁决定不开仓,从而减少了暴露。

四、 结论

本文介绍了Model A,一种动态深度神经网络方法,即使在数据输入受限的情况下,也能显著超越被动的S&P 500基准。与其他二元分类器不同,Model A更倾向于选择不交易而非交易,这种谨慎性在其他分类方法中难以实现,因为它们容易过拟合。

研究结果表明,使用有限数据输入的动态深度神经网络在短期美国股票指数期货的方向性预测上表现出色,为基金管理者提供了一个有前景且令人兴奋的AI交易决策方法领域。Model A的低市场暴露度(仅41.95%)使其超越被动策略和其他模型的表现更加引人注目,实现了比被动策略高4.82倍的年化回报率,以及比被动策略高17.5%的利润准确率,显示出该模型在识别和避免亏损交易方面的强大能力。

此外,所有测试模型与被动基准相比的低相关性也是一个值得关注的发现。需要注意的是,Model A不仅是一个实验室模型,它还是Plotinus资产管理公司积极交易的非相关Alpha控制风险策略的一部分。


本文内容仅仅是技术探讨和学习,并不构成任何投资建议。转发请注明原作者和出处。

Published inAI&Invest专栏

Be First to Comment

发表回复