发布网友 发布时间:2024-08-19 19:59
共1个回答
热心网友 时间:2024-10-03 06:01
数据收集
1. 差错。凡是数据都有可能有差错,拿到数据以后一定要先仔细排查一遍,这是最基础,但很多新手Quant往往会忽略的一步。即使是官方的数据源,也可能会出现包括价格错误,时间错位,乱序,重复,缺失,中断,乱码,列错位,代码错位等问题,非官方数据源的问题只会更多。不做处理的话,这些数据被代入后续的计算,一定会导出错误的结果,而且这些细小的差错往往是在很靠后的步骤才会察觉。正所谓,一步错,步步错。而如果是在实盘的情况下,一个差错数据可能就是灾难性的影响。
2. 无效值。数据无效不一定是差错,可能只是没有成交,或者涨跌停,停牌等等问题。这种无效值不一样的处理,会得出不一样的结果,这结果可能是天差地别的,也可能影响到你后续所有的结果。你一定要仔细思考,什么数据应该填0,什么数据向前填充,什么数据不要填充。这种问题在极端情况下会出现,也会影响你的策略和模型,得出不正常的结果。
3. 失真。在一些极端情况下,你收到的行情可能还在跳动,但你的报单可能会被屏蔽,不会成交。或者说成交了,回头被交易所判定为无效交易,全部取消。或者说行情就直接不跳了,你盘后收的历史行情是后补的。你的策略在这种极端情况下不一定能赚到回测中“赚”到的钱,而回测中亏的钱大概率会亏出去。前几年币圈有过所谓拔网线的先例,或者更多的直接回滚交易,退市换币,更早的时候不要说币圈,连国内股市期市都出现过类似的问题。有亲身经历的朋友,一定知道我说的是哪些事。
热心网友 时间:2024-10-03 06:07
数据收集
1. 差错。凡是数据都有可能有差错,拿到数据以后一定要先仔细排查一遍,这是最基础,但很多新手Quant往往会忽略的一步。即使是官方的数据源,也可能会出现包括价格错误,时间错位,乱序,重复,缺失,中断,乱码,列错位,代码错位等问题,非官方数据源的问题只会更多。不做处理的话,这些数据被代入后续的计算,一定会导出错误的结果,而且这些细小的差错往往是在很靠后的步骤才会察觉。正所谓,一步错,步步错。而如果是在实盘的情况下,一个差错数据可能就是灾难性的影响。
2. 无效值。数据无效不一定是差错,可能只是没有成交,或者涨跌停,停牌等等问题。这种无效值不一样的处理,会得出不一样的结果,这结果可能是天差地别的,也可能影响到你后续所有的结果。你一定要仔细思考,什么数据应该填0,什么数据向前填充,什么数据不要填充。这种问题在极端情况下会出现,也会影响你的策略和模型,得出不正常的结果。
3. 失真。在一些极端情况下,你收到的行情可能还在跳动,但你的报单可能会被屏蔽,不会成交。或者说成交了,回头被交易所判定为无效交易,全部取消。或者说行情就直接不跳了,你盘后收的历史行情是后补的。你的策略在这种极端情况下不一定能赚到回测中“赚”到的钱,而回测中亏的钱大概率会亏出去。前几年币圈有过所谓拔网线的先例,或者更多的直接回滚交易,退市换币,更早的时候不要说币圈,连国内股市期市都出现过类似的问题。有亲身经历的朋友,一定知道我说的是哪些事。