量化投资

什么是量化投资?

股市被认为是混乱的,复杂的,波动的和动态的。通过计算机程序化发出买卖指令,以获取稳定收益为目的的交易方式。通俗地讲,就是预先设定一套固定的逻辑,点明选股及何时买入何时卖出的标准。实盘操作时,实时接收行情数据并进行分析,当达到预先设定的标准时,即自动进行买入卖出的操作。

量化投资的优越性到底在哪里?

打个比方,我们可以作一个机器人王亚伟。我们可以根据王亚伟什么时候买进,什么时候卖出,我们把一个股票分解成60多个因子。比如,基本面是什么样的,分析员是怎么说的,现在的价、量是什么情况,列出60几个因子。
其中,哪几个因子绿灯,是它该买的时候;该卖出的时候,哪几个灯灭掉了。
一一对比之后,你知道他买的股票,看重哪几个因子。
这样,按照他的方法,我们可以整个市场几千只股票全部扫一遍,计算机每天大概几分钟就扫完了,晒出一大批王亚伟类型的股票。
按这个方法去做,实际上可以了一个机器人王亚伟。

  • 就是把所有的投资决定分散,分地越散越好,而人类的物理性能无法与计算机相匹敌。
  • 求胜率。每一个投资决定的胜率只要高出平均水平,达到51%。把这两步做到了之后,基本上量化就没有问题了。


人工智能时代的量化投资策略

人工智能的浪潮已经席卷生活中越来越多的领域:语音识别、图像识别、风控监控、智能推荐、无人驾驶……
机器开始在许多方面逐步代替人类的工作,大大解放了人类的双手,在某些领域还能完成许多人类无法胜任的工作,那么投资如何?

案例:利用LSTM预测真实金融数据

  1. 通过合理途径获取到金融历史数据
  2. 数据清理与归一化

    • 去极值:跳水比赛或体操比赛中,通常会去掉最高分和最低分,在剩下的裁判打分中取平均值,同样的道理,对于某个单因子,3000多只股票就对应3000多个因子值,有些高的离谱,有些低的离谱,这些异常值就像跳水和体操比赛打分里的极端值,通常给予剔除的处理。
    • 因子值标准化:试想一下如果小王同学用两个因子来择偶,一个是身高,一个是颜值,身高的取值范围在150-180cm,颜值的取值在0-10分,这两个因子的单位(量纲)都不同,自然不能够相加,这可怎么办呢,小王想了个办法,身高180cm对应10分,150cm对应0分,中间的身高对应得分则用下图的函数映射给出,这个过程就是因子值的标准化。
    • 值、行业中性处理:每个单因子对股价的影响力都有着千丝万缕的联系,比如市盈率因子与市值因子对股价都有影响,小市值的股票里也有市盈率低的股票,市盈率低的股票也不都是大票。
    1. 特征降维:(主成分分析法)
  3. 制作数据集:具体操作是:取当前时刻及其之前的N段数据构成序列,将每一段序列作为一个新的数据点。另外,该学习方法属于监督学习,每一个数据都要有其对应的标签(label),我们取其下一时刻的涨跌情况作为label,按照涨跌幅度分为五类,使其近似满足正态分布。

  4. 划分训练集与测试集

  5. 构建LSTM神经网络,开始训练
  6. 编写交易策略。最简单的策略即根据预测涨跌情况直接进行交易选择,如未来连续几个时间点上涨即买入,连续几个时间点下跌即卖出。当然也可以与一般的交易策略结合,如预测金叉与死叉点等,并加入止盈止损策略。

仰望星空,深度学习我们应该掌握的原理有什么?

近年来,深度神经网络在语音、图像领域取得突出进展,以至于很多人将深度学习与深度神经网络等同视之。

什么是深度学习?

我们都知道现在人工智能很热,掀起这股的热潮最重要的技术之一就是深度学习技术。今天当我们谈到深度学习的时候,其实已经可以看到在各种各样的应用,包括图像、视频、声音、自然语言处理等等。如果我们问一个问题,什么是深度学习?大多数人基本会认为,深度学习差不多就等于深度神经网络。

深度学习不等于深度神经网络:深度强化学习(D.silver&Sutton)、gcForest(周志华).etc

什么是神经网络?

  • 神经网络长成什么样?:类比人脑,(简单的计算模型)

    • 数学表达形式:$y = a(W*x+b)$;
    • 形象的理解便是:1.升维/降维 2.放大/缩小 3. 旋转 4.平移 5.“弯曲” (保证连续,可微分—>BP算法才有用武之地!)
  • 神经网络的训练过程如何?

    • loss function(目标与预测差距有多少) 【我看到一直老虎却认成一只猫,loss就在于“王”上】
    • 梯度下降:loss值向当前点对应梯度的反方向不断移动,来降低loss。(BP算法)

为什么是深度学习而不是宽度学习?

  • 深度学习泛函表达能力会更强(学习到特征的能力会更强,逐层抽象能力更强)
  • 神经网络的万有逼近能力(泰勒公式、傅里叶变换等)

脚踏实地,让我们谈谈到底该使用什么工具?

  • pytorch
  • numpy
  • pandas

学术界与工业界的前沿探索

  • 通过预测公司基本面来改善基于因子的量化投资

上市公司需要定期发布报告反映公司基本面的财务数据,如收入,营业收入,债务等。这些数据点为公司的财务状况提供了一些参考。学术研究已经验证了一些有效因子,即通过回测分析历史报告数据的计算因子,可以获得超越市场平均水平的表现。其中,两个受欢迎的因子是账面价值(按市值归一化调整)和营业收入(按EBIT / EV归一化调整)。通过回测表明,如果我们能够(透视)选择使用基于未来基本面计算的因子(通过预测)来选择股票,那么我们的投资组合将远远超越标准因子选股方法。受此分析的启发,我们训练深度神经网络以预测未来5年的基本面数据。

  • 使用机器学习算法预测ETF

专注于预测几个具有流动性的ETF的涨跌方向(向上或向下),并不试图预测价格变化的幅度。结论:1. 短期价格服从随机游走假设 2. 横截面和跨期的成交量对于一个强大的信息集的重要性 3. 大量特征是可预测性所必需的,因为每个特征提供的贡献非常小。 4. ETFs可以用机器学习算法进行预测,但实践者应该将先前的市场和直觉知识纳入资产类别行为。


引用参考资料和版权说明
https://zhuanlan.zhihu.com/p/33430725
https://zhuanlan.zhihu.com/p/29451486
https://zhuanlan.zhihu.com/p/22260743
https://zhuanlan.zhihu.com/p/25919734
https://zhuanlan.zhihu.com/p/26037052
https://zhuanlan.zhihu.com/p/35044817
https://mp.weixin.qq.com/s/ROk5lK5gWj6pl4-ebrHG_A
https://www.zhihu.com/question/22553761/answer/36429105
https://arxiv.org/pdf/1711.04837.pdf
https://arxiv.org/pdf/1801.01777.pdf

请zzy824喝杯咖啡
0%