如何对比系统数据和股民实盘数据据的差异

量化交易中所谓「回测易,实盘难」的问题怎么解释? - 知乎1325被浏览93459分享邀请回答16313 条评论分享收藏感谢收起276 条评论分享收藏感谢收起查看更多回答量化交易中所谓「回测易,实盘难」的问题怎么解释?
我的图书馆
量化交易中所谓「回测易,实盘难」的问题怎么解释?
【何波的回答(26票)】:不同风格的策略对于回测的要求是不同的,比如对于多因子选股或者趋势策略等,需要注意的几点是:1. 区分好样本内数据和样本外数据,这个和机器学习很类似,样本内数据用于训练,样本外数据用于校验。这样做的目的是为了避免过拟合陷阱。2. 收益的分布,看看你回测后所有交易的收益分布,看看你的收益来源是少数的几次大的收益还是来源多次的小的收益。来源于大的收益,你的收益波动性就很大,实盘往往会达不到你的效果。3. 参数的稳定性。如果你某个参数过敏感,随便调整下就对收益影响很大,那你实盘的情况和模拟盘也有很大可能会有出入。这类策略严格来说,避免了一些常见的坑,还是比较容易做到回测和实盘类似的。对于高频交易来说,回测和实盘的差距就更大了,需要注意的点就更多了,简单列出几个吧:1. 数据的精度,基本来说,这类策略需要是全部行情严格按照时间戳来回放,分钟级别的都太粗糙了。2. 滑点问题,实盘很难避免滑点,你要估计出一个滑点的数字,在回测里扣除。3. 行情的延迟问题,在回测里行情是没有延迟的,而在实盘行情必然有延迟,这部分也会对收益有很大影响。4. 成交问题,有些策略,比如被动做市商策略,你需要自己模拟订单的撮合成交情况,这部分和实盘往往有很大差距,你需要尽可能的去近似。而你采用交易所提供的模拟撮合环境的话,基本上是不可信的。5. 在实盘因为延迟的缘故,你还会遇到反向选择的问题,你也需要去评估实盘和回测这方面的差距。总之,在高频交易策略中,实盘能达到回测60%的效果,就是回测做的很成功的了。【尼奥的回答(6票)】:刻舟求剑【知乎用户的回答(4票)】:over-fitting还有成交难回测【知乎用户的回答(1票)】:问题一是在心理层面,二是在不可预知的坏事件大概率发生。【袁梓谦的回答(0票)】:未来函数一般自己都会有意的避开。过度拟合虽然也存在,但是回测容易实盘困难主要针对的是实盘操作的行情不确定性。行情走出来之后无论怎样都是确定的了,类似的黄金这种走势,走出来之后大家都会分析,走出来之前怎么应对?当天怎么应对?【任逍遥的回答(0票)】:这个涉及到量化系统的时效性。一套量化系统可能会满足过去几年的市场风格。然而市场风格时时在切换,一套在以前行之有效的系统,未必在未来可以继续赚钱。【丹大舅的回答(0票)】:一般情况下回测的周期远大于实盘的周期,实盘曲线只是回测曲线的一段,所以在收益率表现上会有区别当然,成交、滑点等也是主要因素之一,需区别不同策略类型【slevinlee的回答(0票)】:回测易~是因为你都已经知道事情的结果从果去推因只要你能自圆其说就能成~好比一个人已经成为了成功人士~你可以说他成功的原因是他勤奋善良乐于助人广积阴德好比你当了皇帝再出版个四书五经、毛泽东思想等等你再找一个勤奋善良乐于助人广积阴德的因~却不一定能得到一个同样的果好比你精通四书五经、毛泽东思想却当不了皇帝其实这就是军队演习跟实战有啥区别的问题这种问题实在问的太多了~都不知道从哪里说起了远的咱就不扯了~我就总结一下回测与实战发生差别的各种原因吧1、回测模拟的误差1)回测中有意无意的未来函数(有意的叫骗子,无意的叫傻子)2)交易成本估计误差~实盘有滑点~而回测对滑点可能估计不足3)实盘主力合约换月时升贴水与理论回测所使用的连续合约数据发生差异(这个误差比一般人想象的要大,不然就不会有跨期套利了)2、实盘执行的误差1)停电、死机、掉线、延迟等不可抗拒性因素2)连续涨跌停板、主力合约交易标的停牌等回测时没估计到的意外事件(10年一遇的黄金跌停)3)人为手动干预(资金曲线半年多无法新高无法忍受停掉策略、或者一笔浮盈太多忍不住止盈)3、历史没法重演~理论统计的误差~技术含量最高的误差~前面两种误差都有办法控制在一定范围内而这类就只能跟着感觉走了~样本内样本外测试?减少参数个数防止过度拟合?参数敏感性测试?参数自适应?呵呵...牛市的规律到熊市就不适用了~而道指100年的数据回测出来的策略也可能在101年失效(或者说你抗不过去)历史重演只是假设~没有规律是静止不变的打战时你用骑兵~我就用机关枪你用机关枪我就打阵地战挖战壕你挖战壕我就用坦克~...很多事物都是不断发展变化的~兵法、哲学、自然科学都是如此策略失效很正常~这本身就是个客观规律~如何排除这种误差那就是客观量化投资中的主观艺术部分了【韩开开的回答(0票)】:原来这么多聪明人已经在干了很多年了,闭门造车真是太傻了。【知乎用户的回答(0票)】:曾记否某大师拿着七八个品种拼接后的20年期数据给模型跑,活生生把高利润模型跑废了。就一点,你的模型再牛,震荡+趋势总有办法玩残它。品种那么多,交叉比率满街跑,总有一款适合你。【EdwinXia的回答(0票)】:抛砖引玉一下。。。这不是市场有效性的问题吗?【大路的回答(0票)】:觉的很多人都没有说到点子上,过去是对赢的欲望,实盘是对输的恐惧。
馆藏&67796
TA的推荐TA的最新馆藏
喜欢该文的人也喜欢后使用快捷导航没有帐号?注册
查看: 651|回复: 8
精华0在线时间75 小时UID114138积分26帖子阅读权限10注册时间最后登录
期市新手, 积分 26, 距离下一级还需 24 积分
精华0UID114138积分26帖子主题阅读权限10注册时间最后登录
K线数据跟时数据脱节,请问是找开拓者解决还是开户券商解决(期货与股票均为实盘),谢谢
精华3在线时间9046 小时UID5积分22314帖子阅读权限200注册时间最后登录
精华3UID5积分22314帖子主题阅读权限200注册时间最后登录
脱节的具体表现是什么样的?
精华0在线时间104 小时UID203699积分76帖子阅读权限30注册时间最后登录
初级散户, 积分 76, 距离下一级还需 44 积分
精华0UID203699积分76帖子主题阅读权限30注册时间最后登录
今天早上,开盘了,有一分钟左右没有数据,后来又正常了~!!我也出现了。
精华0在线时间104 小时UID203699积分76帖子阅读权限30注册时间最后登录
初级散户, 积分 76, 距离下一级还需 44 积分
精华0UID203699积分76帖子主题阅读权限30注册时间最后登录
为什么我提出的软件问题,就没人理呢?人长丑了吗???我也是实盘用户哦,看我的名字就知道了~!
精华3在线时间9046 小时UID5积分22314帖子阅读权限200注册时间最后登录
精华3UID5积分22314帖子主题阅读权限200注册时间最后登录
hxqhyangli 发表于
今天早上,开盘了,有一分钟左右没有数据,后来又正常了~!!我也出现了。 ...
你的数据中心的IP是多少?什么合约,什么周期上?
精华0在线时间104 小时UID203699积分76帖子阅读权限30注册时间最后登录
初级散户, 积分 76, 距离下一级还需 44 积分
精华0UID203699积分76帖子主题阅读权限30注册时间最后登录
180.153.242.104豆粕,菜粕,豆油,棕榈油。一分钟K线,第一根K线没有!!我是多图平铺,这四个品种当时就是没有数据,其它都正常。
精华0在线时间104 小时UID203699积分76帖子阅读权限30注册时间最后登录
初级散户, 积分 76, 距离下一级还需 44 积分
精华0UID203699积分76帖子主题阅读权限30注册时间最后登录
这个情况已经发现了3次了,所以我才建议你们在数据中心里,增加服务器测速的功能。这样尽量可以避免因为服务器和用户之间延时过大造成行情堵塞。
精华3在线时间9046 小时UID5积分22314帖子阅读权限200注册时间最后登录
精华3UID5积分22314帖子主题阅读权限200注册时间最后登录
hxqhyangli 发表于
180.153.242.104豆粕,菜粕,豆油,棕榈油。一分钟K线,第一根K线没有!!我是多图平铺,这四个品种当时就 ...
这个缺少的1分钟K线数据,现在仍有缺失吗?
这四个合约,当时打开的分别是什么合约的图表?指数还是具体合约?
精华0在线时间104 小时UID203699积分76帖子阅读权限30注册时间最后登录
初级散户, 积分 76, 距离下一级还需 44 积分
精华0UID203699积分76帖子主题阅读权限30注册时间最后登录
连续合约,当时只缺了一些,过了一会儿就正常了。
Powered by【图文】如何做不同检测系统的比对_2014_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
如何做不同检测系统的比对_2014
大小:5.65MB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢

我要回帖

更多关于 一键对比两列数据差异 的文章

 

随机推荐