优枢围棋的AI课怎么样吖?有人用过没?

  没有融资的那三年,并不是最困难的时候。

  王峰、实习生韩甜报道 近日,人工智能音乐科技公司小叶子音乐科技完成C2轮数千万元人民币融资。截至目前,这是2022年国内音乐领域最大的一笔融资,也是小叶子音乐科技继去年11月超2亿元C+轮融资后,7个月内的第二笔融资。

  目前,小叶子旗下有小叶子智能陪练、The ONE智能钢琴、The ONE智能钢琴教室、小叶子陪练四个业务板块。

  2013年成立时,小叶子主打的是The ONE智能钢琴,与传统钢琴最大的不同是在琴键上多了一排智能灯带,配合使用自带的软件,就能帮助钢琴学习者“跟灯演奏”。

  2017年,国内在线陪练市场爆发,小叶子上线“小叶子陪练”的前身熊猫陪练,进入在线真人1对1陪练赛道,虽然首创了学员教师双向视频通话,但在激烈的竞争中,不具备先发优势,也没被资本持续关注的熊猫陪练,在衡量了商业模型后,随后大幅收缩。

  2019年,小叶子All in AI,推出小叶子智能陪练,这款APP通过识别琴音,实时在移动终端屏幕上显示学琴者的弹奏进度,并反馈音符和节奏是否准确。这款产品开创了AI陪练的先河,并获得了成功,2020年7月起,单月销售额超千万元,截至目前都在小叶子产品矩阵中贡献最大份额营收。

  2021年“双减”之后,属于素质教育的在线陪练突然遭遇冰冻期。2021年11月,俞敏洪个人投资的在线音乐教育品牌快陪练宣布申请破产。今年4月,在线陪练赛道最大的头部公司VIP陪练被线下音乐教育品牌小音咖收购,一定程度上坐实了此前资金紧张的传言,然而2个月后,小音咖突然被曝跑路,VIP陪练随后亦陷入停摆危机。

  在线陪练行业发生的事故提醒整个市场,当虚火被浇熄,不健康的商业模式无法持续。

  小叶子音乐科技创始人叶滨是一位连续创业者,毕业于清华大学电子工程系,曾创办网络视频会议品牌威速科技,以及海报时尚网。叶滨还是一个投资者,以天使投资人身份投资赶集网,还曾担任清科创投董事总经理。

  虽然,现在的小叶子发展健康,但成长过程也并非一帆风顺,叶滨在接受专访时,回顾了赛道激烈竞争时没有拿到融资的艰难时光,以及“双减”前陷入非理性投放的焦虑时期,但同时,如今行业出现的断裂式危机,恰恰是长期主义和正常商业逻辑回归的暂时现象。市场格局的演变,终究回归到为用户提供独特价值和健康的商业模式。

  去年上半年是最难的时候

  《21世纪》:“双减”后教育市场还处于调整期,能拿到这么大一笔融资很难得,融资的过程顺利吗?

  叶滨:小叶子在不到1年时间里拿到2轮融资,对于投资人而言,背后的逻辑其实比较简单、清晰。

  2021年11月那次是看到了我们“以少胜多的能力”。我们在2017年底推出在线陪练,2018年竞争对手纷纷获得大额融资,甚至达到一笔1.5亿美元的规模,这在当时整个在线教育行业都是很少见的。在那种情况下,行业里很多人说在线陪练“仗打完了”。我们当时候账上只有他们十分之一的钱,只有最头部公司大约十分之一的体量。所以我们决定收缩1对1真人陪练业务,2019年开始All in AI产品。很快2020年AI陪练业务就跑了出来,单月销售额达到几千万元,从用户量和销售业绩上都超过了竞争对手。

  今年的融资稍有不同,因为经历“双减”,投资人对烧钱换增长的模式画上了巨大的问号。基本上不会有投资人说“你尽管拿钱去烧,反正以后再从别的投资人那里拿钱”,这种模式至少在这个行业内不成立了。我们从去年10月做了调整,更加重视业务协同能力的提升,到今年6月,已经连续3个季度实现盈利,现金流也是正向的。投资人本来也很看好我们的产品和业务,在看到了我们“变健康的能力”后,很快就敲定了这轮融资。

  《21世纪》:小叶子缺过钱吗?

  叶滨:缺过。我们在年这3年是没有融资的,而竞争对手融了很多钱,我们就很被动。坦白说,那个时候没有人给你雪中送炭。我们也想融资,见了很多投资人,投资人也认可AI陪练,但他们最后都是说“我们看好你,等你做出成绩了告诉我。”

  在你没做出成绩前,没有人给你一分钱,这就是现实。当然,我觉得如果我是投资人,我也会一样,因为当时不知道AI陪练能不能做出来,能不能获得用户的认可。现在回过头来看,我们的战略是正确的,团队也很优秀,做出了优秀的产品。

  《21世纪》:那是你们最痛苦的时候吗?

  叶滨:不是,虽然那三年我们没有融资,但是我们的多元化业务布局也能造血,在激烈的竞争环境下,我们在2020年11月实现了单月营收过亿。反而,最痛苦、最焦虑的时候是去年上半年。当时的在线教育营销大战让人很纠结,如果跟进,可能钱很快就“烧光”,如果不跟,可能就会落后。

  整个教育行业都很焦虑,我和头部教育公司的CEO们沟通比较密切,即便那些融资几亿、十几亿美元的公司,他们也迷茫,不知道营销大战什么时候到头。大家知道花钱太多而且低效,但是又不能不“烧钱”,因为谁都不想成为落下的那一个。最后大家都被绑架了,都很焦虑。最后,“双减”用独特的方式告诉行业,这种做法是错误的,让一切回归到了正常的商业逻辑。

  《21世纪》:小叶子的两轮融资跨越“双减”前后,公司估值有没有受到影响?

  叶滨:对估值影响不大。“双减”之后,用户对素质教育的需求并没有受到影响。

  我现在融资的心态很轻松,因为市场回归到了正常的商业逻辑,企业可以重新考虑长期策略,没有一个短期的目标逼着你,反而我们可以用更多的资源和时间,来做更好的产品。

  《21世纪》:AI陪练APP的琴音识别与通用的AI语音识别技术一样吗?

  叶滨:从使用场景上来看,二者的标准不同。比如,聊天软件把语音转成文字时,哪怕不能100%准确,但是用户根据上下文还是可以看懂,所以准确率达到90%或者95%就可以。但是在陪练时,准确率必须要达到几乎100%,才能告诉用户哪里弹错了。

  《21世纪》:在实现100%准确率的过程中,有没有哪一部分是特别难的?

  叶滨:我举一个例子,我们上线第一个版本时,从体验用户到付费用户的转化率只有5%。我们复盘时发现,国内很大一部分家庭里的钢琴琴音是不准的,毕竟钢琴调音需要请专业人士上门,很多家庭嫌麻烦或是考虑成本就省了。不准的钢琴弹出的“do”就偏了,我们的AI陪练APP也就识别得不准,用户体验当然不好。

  我们曾想过一些解决方案,比如免费给用户送一张调音券,介绍调音师上门,但是用户可能不信任我们,另外调音师上门也需要预约,耗时较长。后来我们认为,与其让每个用户去调音,不如我们去适应用户,于是上线了一个“中央C校准”功能。用户使用APP之前长按中央C键,也就是“do”,如果发现琴音与标准差20%,我们的APP就相应调整20%。如果音确实差得很多,我们会提醒用户调音。优化后的版本一上线,转化率就翻倍了。

  另外,最初的版本在安静环境下识别准确率很高,但是在嘈杂环境下就差很多,后来我们进行优化,提高了在嘈杂环境下的准确率,转化率又翻倍了。

  《21世纪》:你觉得未来AI能否识别学员的艺术水准?

  叶滨:这就像问AI能否产生意识一样,我觉得至少5-10年内是很难实现的。虽然AI已经可以谱曲,但我不认为这里面有任何情感或者艺术素养,它其实只是按照一个模型来生成曲子,是一个机器学习的逻辑。

  AI还是适合去替代人类做一些有清晰的标准,可衡量的东西。比如围棋,AI远远超过了人类最优秀的棋手,这是因为围棋的标准非常清楚。但是钢琴艺术没有标准,比如郎朗的《哥德堡变奏曲》和格伦·古尔德的版本差别非常大,哪个版本更好呢?没有标准答案。把技术的交给AI,艺术的交给真人老师,我觉得在练钢琴上应该这么分配。

  《21世纪》:AI+教育,最通用的技术是推送相关的题目,那么AI陪练能不能推送进一步练习的曲目?

  叶滨:在技术层面可以做,但实际上我们没有做曲目推送。为什么?因为产品本身是一个陪练的场景,琴童其实在线下都有一个主课老师,每周到老师那上一次课,所以练什么曲子是老师来决定的,练的过程可以由AI驱动。

  设计健康的财务模型

  《21世纪》:我们谈到一家在线教育公司时,都会谈到它的壁垒,小叶子已经形成了什么壁垒,这个壁垒够不够坚实?

  叶滨:我觉得我们的AI壁垒是最深的。为什么过去在线教育陷入了广告大战?就因为各家的产品壁垒不深,差异化不明显。AI陪练产品过去的增速接近50%,我觉得现在还处于比较早期的阶段,而且过去竞争环境激烈,未来增速可能更快一些。

  当初我们跟进市场做1对1真人陪练的时候,我是纠结的,因为在相同的产品模式下,哪怕产品质量比竞品好20%,但是用户很难感知到。后来资本替这个赛道做了选择,我反而不纠结了。在1对1真人陪练赛道,如果其他企业没有独特产品,那么只有一家头部企业就够了。

  在教育行业,产品的独特价值特别重要,这是“用户第一”价值的体现。我举一个比较极端的例子,如果你能做出光刻机,你会担心怎么获客吗?本质上还是产品不够独特。

  《21世纪》:你认为未来在线陪练市场的格局会是什么样?

  叶滨:在国内,在线陪练没有K12或者少儿英语那么大的市场规模,所以集中度会更高。

  《21世纪》:是指AI陪练和真人陪练两个赛道各容得下一家吗?

  叶滨:不是,我觉得如果今天只做AI陪练,或者只做真人陪练,其实都不成立,因为用户的需求是多元化的。就像当时学而思、新东方,不是只做小班课,不做1对1,或者只做1对1,不做小班课。反过来,当时只做1对1的,抗风险能力会弱一些。新东方、学而思经历这么大的波折,到今天还挺立着,我觉得不光是他们的精神可嘉,更是它们的财务模型好。

  新东方的俞敏洪老师之前也曾讲,如果一家教育企业只发展1对1或者大力发展1对1那一定是有问题的。所以新东方是刻意把1对1的体量控制在一定比例,不能超过总业务的35%。我们是在2018年开始收缩1对1业务,转而大力发展智能陪练,到今天智能陪练业务和1对1陪练业务大概是3:1,这是一个比较健康的模式。

  《21世纪》:K12学科培训以前有四个头部公司:猿辅导、学而思网校、作业帮、高途课堂,按照你的意思,如果在线教育营销大战不停的话,这四家竞争的结果也会只剩下一家头部吗?

  叶滨:毫无疑问,因为每家都希望成为最后留下来的那一家。我觉得最大的可能是形成6:3:1的格局,最大的那家占六成的市场份额,腰部的几家占三成份额,剩下的占一成份额。其实很多行业,最后都是这样的格局。

  《21世纪》:后来者就没有机会了?

  叶滨:机会出现在行业发生变局的时候,比如手机从功能机变成智能机,这是很大的变局,抓住这个机会的就起来了,没抓住这个机会的,比如诺基亚就被时代抛弃了。在一个相对固定的格局中,只要头部企业不犯错,其他公司很难抢占头部位置。

  《21世纪》:小叶子为什么现在还保留着在线真人陪练业务?

  叶滨:因为用户有需求。坦白说,作为一个“技术男”,我曾以为等AI陪练业务做起来后就不需要真人陪练业务了,但是发现AI陪练不能100%替代真人。弹钢琴既有技术的层面,又有艺术的层面,AI陪练相当于给一道客观题打分,“do”不能弹成“re”,要实时识别和纠错,如果让真人老师来做,不仅费用高,他还会觉得太枯燥,这就可以交给AI来做。但是当解决了技术问题,想要提升艺术表现力,真人老师是超过AI的。

  小叶子当初收缩真人1对1陪练业务,一个原因是小叶子没有先发优势,不能提供独特价值,另外的原因是这个业务的财务模型不健康,因为师资成本要占到50%左右,要做各种促销,还要有与有先发优势的友商竞争。教育行业的1对1业务有一个共同特点,客单价更高,留存率更差。如果一家公司只有1对1业务,好不容易招来一个学生,一年之后就流失了,财务模型就有问题。但如果在班课体系下配合1对1业务,1对1用户哪怕流失,也是回到班课业务里,财务模型就是健康的。

  对于我们来说,AI陪练用户中有更高阶的需求,有更高的支付能力,就可以选择真人陪练。而且,我们都是在钢琴这一品类中,业务之间协同效率更好,我们不需要额外的获客成本。

  《21世纪》:完成融资后,小叶子表示将发力探索海外市场,并推出智能架子鼓和智能架子鼓学习工具APP。扩充智能乐器品类,为什么要选择架子鼓,而不是别的乐器?

  叶滨:这个问题我们确实思考了挺长时间,提到扩品,首先想到的肯定是吉他,因为全世界的吉他用户群体都很广。但坦白说,我们没想到特别好的切入点,无法为用户提供独特价值。练吉他最大的痛点是手疼,尤其是那根最细的弦,真的是能把手指勒出很深的印儿,初学者大概需要至少两周时间,等磨出了老茧,才不疼了。对于这个痛点,APP很难解决,AI也解决不了。

  鼓也有很大的市场,而且能通过游戏化的方式去学,电子游戏市场已经开发了《太鼓达人》这样的游戏,所以我们觉得在这个品类有机会把游戏和教学融合起来。

  《21世纪》:目前海外市场如何运营?

  叶滨:海外市场其实有成熟的打法,用电商渠道去销售,我们从2016年就开始在亚马逊销售智能钢琴,包括我们的APP出海。

  比如多邻国,就是以纯产品为主,不像国内在线教育有很多的辅导老师,更没有所谓销售人员,就是个工具。用户付费,然后使用APP。这样的好处是产品迭代会更快。

  我觉得海外优秀的教育产品值得我们研究,中国教育公司的运营和商业模式创新非常优秀,但是出海时会遇到痛点,所以目前出海的教育公司主要针对海外华人群体,还是用国内的打法。真正面向海外的本地人,还是有很多坎要迈过去。

  《21世纪》:现在的市场形势下,小叶子的增长会不会放缓?

  叶滨:我们首先追求的是健康,教育行业出了很多大事儿,用户都会慌,要给用户一颗定心丸。我们现在连续三个季度盈利,还远远不够,我们需要连续三年盈利,让用户感知到这是一家健康的公司。比如学而思,无论从他的课程体验和服务体验各方面,家长都是没有顾虑的,我觉得等形成这样的口碑时,别人就很难撼动。在这个基础上,我觉得整体业务的增长也是自然而然的。

  《21世纪》:AI陪练的所谓LTV(生命周期总价值)大概能达到多少?

  叶滨:我们到现在最老的规模用户群体也才两年多时间,AI陪练相对于在线下学钢琴,性价比很高,所以我觉得真实LTV应该和学钢琴的时间比较一致。AI陪练和其他科目的AI产品有很大区别,对于AI陪练来说,除非不弹钢琴了,否则用户还是要经常练习的。

  (作者:王峰 编辑:李博)

以数据驱动,大数据接入,当下每个企业似乎都沉浸在数据分析的海洋中。数字分析师们,甚至统计专业的学生们也都成为了人才市场中的金苹果。我们的营销、生产、客服等部门每天都会产生许多数据。这些数据在那儿不去进行分析,最后就会变成垃圾。这种垃圾不需要分类,直接销毁就好了。

数据就像垃圾,捡来前你最好想清楚怎么处理 – 马克·吐温

而数据分析师在我们眼中就是哪些变废为宝的魔法师,他们仿佛一个个火眼金睛不单知道发生了什么,正在发生什么,还知道未来会发生什么。

数据分析师,恭喜你晋升数据科学家了!

与之成为鲜明的对比的是85%的高管们称他们的组织正努力转变为Data-driven,而只有37%认为他们成功了。那么,你有没有被数据分析师坑过呢?或者作为一个数字分析师/数据科学家,哪些陷阱是最容易踩入的呢?

极诣本篇将罗列最容易让数据分析师们马失前蹄的十大陷阱。

一,没有对分析的目的有清醒的认识

Deming)。我们许多数据分析师虽然有许多理论知识,精通各种算法和模型,熟练操作各种工具却对为什么要进行分析没有清醒的认识。他们对自己的产出是如何被决策层参考或使用的并不关心。这会导致他们分析的结果完全没有参考价值,给出的建议也无法落地。这些结果会变成“我们的客户都是年轻人还要你来分析?”或者“降价就能卖得动,这还要你来教我?”。

二,不了解业务全貌和上下游关系

“改编不是乱编,戏说不是胡说”

数据分析师必须要对企业甚至行业全貌有深刻的理解。这决定了他们是否能正确选择相关性高的、质量度高的数据源,同时排除杂音干扰。他们需要知道送到自己手上的数据是如何收集的,有没有经过初步加工,自己处理过的数据又会送到谁的手中,而他们在下一步会如何再加工自己处理过的数据。一旦脱节,这以数据为驱动的巨型机器就将戛然而止。

我们知道在中有两个著名的概念:确认偏误(Confirmation Bias)和选择偏误(Selection Bias)。前者说的是我们总是期望我们分析的结果与我们主观的认知相一致,这会让我们在分析时对迎合我们观点的证据积极体现,而对反方证据进行打压甚至不予采用。而后者更是带着有色眼镜进行分析。

想吃什么,我给你做啊?!

即便数据分析师本身克服了这些偏误,许多时候不得不为了迎合上级或者客户的先入为主的观点进行结果粉饰。

四,采用低质量的数据源

数据大爆炸让数据分析师面对的数据源从贫乏到天花乱坠。但大多数情况下由于难以保证上游数据收集的可靠性和科学性造成了GIGO(Garbage In, Garbage Out)的效果。如果数据分析师无法甄别哪些是可以采用的数据,哪些又是应该果断摒弃的数据那显然分析的结果很难进行质量控制。因此,拿到数据的时候一问收集方法,二问收集对象,三问收集场景是数据分析师必做的功课。

五,对无关指标进行分析,或没有对数据进行充分细分

,有自己的颗粒度。数据分析师必须深刻理解每个指标背后的意义和影响条件。比如,它虽然一定程度体现了受众对页面的态度,但用来评价整体转化能力尚不充分。邮件打开率也是一样。对于不同的分析目的,数据分析师有必要进行抽丝剥茧充分发现本质。到底是哪个地区的受众,哪个设备的受众,分析要到位。

极诣对曾经专门进行探讨。随随便便用饼图,线图和柱图傻傻分不清,过多的图表噪音,“魔幻”的坐标轴,这些都是数据分析师常犯的错误。。要看图说话也要有一张好图才行。

七,未达标的AI/ML训练和未有显著差异的测试结果

现在,AI和机器学习的热度某种程度上超过了支撑它们的大数据。和AI沾边仿佛是时髦的标配,尽管大多数时候那些标榜智能的算法只是一些if/else罢了。机器学习也一样。

对于数据分析师来说这里最容易犯的错误是不能给予更多耐心。虽然我们说机器学习是不断进行的,,但是在结果达到可用可信之前就进行部署会带来很大风险。到底是正相关、负相关还是无关,我们必须有足够的数据来支撑。

八,过度依赖,迷恋各种高级工具

“屠龙宝刀,点击就送”,我们对“一刀满级”的渴望是与身俱来的。决策者希望有套软件系统支持,分析师们同样希望轻点几下鼠标就可以把分析结果跑出来。

但现实是越优秀的工具越复杂,越需要专业的人才来驾驭。况且,一些免费或者就在手边的工具完全可以胜任复杂的分析需求和数据可视化需求,比如,比如Excel或。

九,对预测分析笃信不疑

对预测分析的追捧很多时候并不是始于数字分析师,而是把数据分析师神魔化的管理者。我们且不说对数据的解读中存在了多少幸存者偏见,面对比围棋棋盘那19×19复杂得多的现实商业环境,我们的分析中必定会忽略大量的影响因素。

我们无法用分析的手段进行创意制作画出新的《蒙娜丽莎》,也分析不出单身男女的未来对象具备哪些条件,fitting的手段,Outlier的处理方式因人而异,连同样的数据分析出相同的结果几乎都无法做到。从这个意义上讲,在“预后”方面数据分析师可能还不如临床医生。

十,使用旧数据,与商业环境变化脱节

最后一个错误当然是“刻舟求剑”啦。笔者常常感叹我们的古人竟然能想出让后世如此受用的寓言和成语。

刻舟求剑,出自《吕氏春秋》,又黑了一把楚国人。

数据分析师在选取数据时选择怎样新鲜的数据,过去六个月还是两年,是否考虑到淡旺季,是否考虑到大环境的变化和用户行为短期改变。这些是我们需要自问的关键问题。昨天的成功并不能代表明天一定能延续,相同的故事和最佳实践并不一定能满足下一世代的需求。如何以足够动态的方法进行趋势分析,洞察出变化才是有效分析的衡量标准之一。

足球是圆的 – 写在最后

数据分析师是那个“”,他们不是全知的神,他们也不是你迈向Data-driven的一站式解决方案。他们放弃足彩结果分析,放弃股票涨跌走势委身于你,是为了和你一同用数据的手段创造更大的价值。

“统计就是用准确和逻辑的方法把一半事实不怎么准确地说出来”

所以,请对他们给予更多理解,帮助他们一同克服这些困难,避免这些陷阱。愿你不再说“我被我们分析专家坑了。”

12月10日,由华泰期货主办的“新格局再启航2021衍生品市场年会”在杭州开幕。此次活动由上海期货交易所、郑州商品交易所、大连商品交易所和华泰证券(601688,股吧)支持。和讯期货参与图文直播。

  12月10日,由华泰期货主办的“新格局 再启航 2021衍生品市场年会”在杭州开幕。此次活动由上海期货交易所、郑州商品交易所、大连商品交易所和华泰证券(601688,股吧)支持。和讯期货参与图文直播。

  据了解,此次年会聚焦基于大类资产配置的以期货衍生品为特色的财富管理,以及黑色建材、贵金属有色、能源化工、农产品(000061,股吧)、金融科技共六大主题,力邀国内衍生品市场领军人物、大宗商品研究与实践专家、头部实体企业负责人等,共同展望2021年投资之道及中国衍生品市场发展之未来。

  12月10日上午的金融科技分论坛上,华泰期货研究院量化研究总监何绪纲出席论坛并以“投研科技最新之AI技术初音——乘风破险”为主题发表演讲。

何绪纲:AI算法技术很大程度上解决了投资效率问题

  何绪纲表示,目前AI模型的学习方式是场景学习的概念。面对复杂的金融市场,既有Alpha的影响,也有未能够明显觉察的弱Alpha因子影响,通过在一个尺度进行分解,寻找不同因子的维度,与历史进行对比,就可以看除历史上发生了什么。在相同的条件下,他主要描述的敞口点就是我们现在主要描述的一个截面的回归因子,通过对历史的学习,对现在做出判断,并且对未来作出一定的猜测。

  另外一些商品的多因子实际为基础多因子+截面多因子,解决了商品投资有无的问题,如何进行投资,如何对风格进行暴露,如何又对不同风格的敞口进行管控,模型的落地实际上是很大程度上帮我们解决了,这是一个很好的起点。同时我们又是数据的基础,正是算法的基础最主要的口粮来源,目前算法技术的发展和应用,实际上很大程度上解决投资的效率的问题。

  非常感谢侯峻院长的介绍,希望我也能够吸粉做一点贡献。谢谢主持人,谢谢到场的各位领导嘉宾,以及线上的各位听众。

  今天非常荣幸能参加华泰期货举办的2021年的衍生品市场的年会,我今天的主题比较明确就是投研科技最新之AI技术初音,我这边的主要的报告给大家的话题就是AI技术在金融领域的应用,具体到期货市场的应用,这边主要会介绍策略开发里面获得的一些经验和教训,跟大家一起做一个分享。

  我简要介绍一下今天我的主讲内容:

  因为AI技术本身算是新兴的技术,我具体我们的AI技术在做什么?很可能是一片空白,这样我就分了几部分做一个介绍,会在第一部分简单介绍人工智能的发展历史;和重要的事件目前其应用最为成功的领域,以及在金融领域的跨界借鉴角的一些度。

  了解到人工智能的发展的历史以后,我们就想知道,我们在金融领域如何点开AI棵科技树如何点开呢?我我会取一些模型的核心算法逻辑介绍我尝试将一些复杂的问题能够简单的给大家介绍清楚,让大家有一个背景的知识了解,这样便于我们在下面部分的内容的理解。

  第三部分讲到数据与建模,数据是最关键的核心因素旨意,这里我们要着重强调,新技术的应用并不都具有排他性。实际上,AI类型模型是在另一个应用的层面上整合了现有的大量金融数据,以及多种有效的数据处理方法。就我们现在的研发进展来看,我们相信AI技术的成熟应用将会是与新技术现有金融科技高度融合,最终达成的一种全新业态。

  当我们这是一个探索性的东西,我们今天的课题也是叫做AI技术应用的初音。我这边篡改了一位我非常喜欢的德国哲学家的名言,一位德国哲学家曾经说过:他这样考虑人性的问题,我很难从自己的身上找到困难,但是除此之外,我无处可寻。我相信这一天也会到来,我们想在一步一步的走,它终就在人类身上学会了智慧。

  第一章讲一下人工智能的发展历史,其实这边的一个发展历史的话,大家会看到一个比较多的历史事件,但是从我们的想提示的一个角度,实际上我们注意两个比较重要的特征,可能就是比较有趣的,首先第一点人工技术最早的发展,实际上来自于1950年,最初他的一个设计的思路是这样的,他希望能够通过人工智能技术让机器模仿人的思维方式,那么如何去模仿以及怎么样的一个互动实际上就是对人类语言的一个理解,所以在最初的时候,几乎所有的AI技术都在倾向于设计出一套技术和系统,他能够通过灵实验,学这个尝试持续了很长时间,并且主导了AI技术的发展,在AI进入冬天前面的这一段时间,几乎都是在做这样的努力,当然到了近期这一步已经获得了突破性的进展,我们知道语音识别AI技术实际上是在人工智能这个技术的应用,是具有突破性的一个领域。同时我们也会发现实际上在金融领域哪她们有相当好的应用我记得两三年前我还在美国工作的时候,业内大家会有这样的探讨,那个时候比较稳定盈利的AI技术的策略就是自然语言识别策略这样的话会运用到舆情分析的角度,当然现在今时不同往日,我们看到有很多成功的案例。

  在AI冬天结束的时候有标志性的事件,国际围棋大师输给了机器人。那就是AlphaGO他是什么样的学习模式是怎么样战胜人类棋手的呢?他实际上对于模式的识别,他会寻找模式中不同的成功的概率,寻找到最有机会取胜的模式在下棋,这一点我们在应用AI的模型里面最至关重要的一点,我想稍微澄清一下,我们现在在业内交流的时候,大家都会尝试有新技术的突破和发展我们可不可以拿来用?我们对这一点表示怀疑,AI技术有明确的有时点,他本质的特征是对模式的识别,我们在金融领域里面我们需要识别什么样的模式?有什么样的复杂价格传导模式需要我们去探索?这是我们在应用AI技术的切入点,实际上我们对于具体使用什么样模型并不关心,我们关心的在使用过程中在金融数据过程中处理的时候发生了效果。

  因为他是作为一个算法的出现他大量的应用或者是突破性的领域基本上都是法密集应用的领域。我们大家可能也都比较熟悉了,无人驾驶汽车—自动驾驶作,其实这是一个非常有趣的案例,这边有一个非常重要的理解的模式,可以揭示出我们如何去设计AI的模型。我们看到无人驾驶汽车结合一种场景类型的学习,需要分析路况,需要分析驾驶者处于的一个目标是什么样的目标,他需要去收集以及符合自己的决策是符合交通规则的,那么实际上他有多样化的限制和多种的特征限制这个算法并且在这样的框架下达到最优的算法。这在我们考虑到金融市场的时候具有很强的类别的特征,也就是他使用的是一种场景学习的模式,他学习大量的一个驾驶的场景,这个时候他就有机会得到了一个最优的驾驶的操作的模式,金融市场也是这样。

  前面陈辰提到的,我们华泰期货最近刚刚研发成功的商品模型,商品多因子模型,这个实际上就是描述市场的角度。而另外描述市场的角度像大家比较熟知的,技术指标,行情的盘点数据,他们都是对市场的不同角度的描述,都是限制和约束的条件,如何在这样的条件下能学到有用的价格传导的模式做出最优的选择,这样的逻辑才是我们模型切入的逻辑。范围广泛,深入到各个领域,基本上也多以我们前面提到的几类算法应用为主。

  金融业应用最早的是在反欺诈领域。因前面王总已经提到了,欺诈的甄别在这个角度的话实际上是非常有趣的一个模型的优势的体现,是什么?因为AI模型识别的是一种模式或者是partn,他最终做到的对大量的情形的一种分类,不管你在什么样的情形可以做一个有效的分类可以做聚类的变化。

  如果我们想甄别哪一些客户可能具有欺诈的可能?而哪一些客户是真实的投资者?而哪一些客户是产业的投资者?整个模型的类型可以保证我们做分类模型的同时也可以把这一类的模型应用到客户的服务当中来,这非常有助于我们做定制化的服务的推送的工作,到后面我也会详细的介绍。所以我们看到AI模型有他一定的通用性,有对庞大的数据做处理的良好的功能,这是我们主要的方向和角度。

  如何点开这个AI的科技树?我们如何找到金融领域的一个切入点?或者是从我们自身来看,找到一些量化的策略,制作的一些突破点呢?

  我们首先简单的介绍一些比较常用的模型,我们会发现在这些模型中他主要的一些特征或者是主要实现的功能实际上是对应到我们在期货的一些投研,在金融投资的一些领域是具有非常贴合的一些效果的。那这些比较贴合或者有类别的效果我们是希望有这样的一些模式的借鉴。

  我们首先来看一看一个大类的AI策略,这一类策略我们归为度学习—的策略,包括:决策树的优劣、最终的回归均值,或裂解到最后节点的分类。

  这一类模型都是在国际建模比赛中会经常出现的。浅度学习和深度学习是有区别的,浅度学习不包含深度隐藏层,他不做抽象的处理,主要是做聚类,我们可以在聚类里面寻找均值,做回归也是可以,主要的应用特征不做深度化的学习,但是可以做有效的分类和回归化的应用。

  我们稍微详细的介绍一下这个模型的使用,这个和我们后面的一些数据上面的应用会比较密切的关系,我们来看一看决策树是首先采取一个对数据选取一个样本空间,随机的选取一些特征,作为数目节点备选分裂的特征,有一个标准,哪一些特征可以达到他的目标函数比如投资的利益最大化,或者是我这样投资的他的风险是最小化,他面对这样的目标函数就会选取最合适的备选特征做节点的分裂,这样的节点分裂可以持续下去,一直持续到不可以再分裂为止。他对特征做分裂的时候,越重要的特征就会越早的进入分裂,我们不管他最后的分类质量和精度有多高,他只要能够越早的进入分类的选取这样的因素就越重要。

  我们就利用这样的决策树的拓扑的特征寻找因素的重要性和重要性的判断,我们会看到这样的判断是相当的稳定有很好的利用价值。实际上我们今年的服务已经利用到这样的一些特征了,我稍候会介绍到。我们建立多棵的决策树,我们就会得到随机森林,这个大家多少有所耳闻在算法方面可能会有关注,我们利用大量的决策树最终得到的结果,他统计的效应是在分类问题上面是有显着的表现的。

  这是我们觉得随机森林所具有的最重要的特征,其实我在这边还想稍微跟大家分享一下,我们在应用一些AI策略去进行研究的时候,我们实际上是通过不同策略他的优势,和他最重要的特征来进行使用的,我们真正的完整的解决一个问题或者是系统性的设计一个完整的解决方案,针对不同的方案或者是比较大型的方案我们在不同的一些部件和模块上面都会使用到不同的模型,这边我们会看到一些量化研究的策略是高度的结合了浅度学习、深度学习,甚至深度学习中不同的计算模块来做的试验。

  我们现在来介绍一下深度学习的模型,这方面的介绍对我自己也是一个挑战,因为这并不是一个简单的问题,我们现在采用的方法是我让大家先忘掉我们的入参、出参,我们介绍一下在全连接神经网络是目前应用非常广泛,在很多的初步的测试或者是建立模型的初期都会反复的被使用,然后都会以一种本题mark的角度使用了先进的模型之后再做对比,这个基础的模型是我们做各类研究的一个基础。我们看到他实际上的逻辑很简单,他就建立多层的连接一层一层的做信息的抽象化,当我信息进来的时候我可能有三个节点、四个节点的信息,但是我做抽象化我可能只会有一个输出,这样信息的叠加实际上非常有利于我们对信息中最关键部分的提取,对噪音部分的屏蔽,我们觉得数据的过程就是信息抽象化的过程,这个过程本质上就是类比人类的思维过程,在我们的视觉接受各种思维信息,比如人在看盘的时候我们看不同的技术指标和K线的状态,哪些信息是关键的、重要的,值得我们注意的,这就是抽象化的过程,这个过程就是在全连接模型里面信息抽样化的关键的过程,这是最核心的构建。

  我们再看另外一个比较常用的,中间层的应用,实际上就使用了卷积神经网络,他做什么样的事情?他用滤波的一个角度来切入,他会拍摄到照片的一大块的一部分,就像我们右上角的图,这一块部分做一个信息的抽象化,他可以取在这一个3乘3这样的模块,取均值,保留的模块是对前面信息的抽样华,通过这样的方式可以学习图象的模式,在AlphaGO发到《自然》杂志上面的文献中,他通过图象的识别,学习棋形,就会有若干中选择的途径优化他的棋形,这样的逻辑跟金融领域是非常非常接近的,我们也会收集到大量的因素的数据,这样的因素的数据哪些是关键、哪些是重要,他是非现行的关系就需要做抽象化得到若干个最关键的因素,这样的逻辑,包括全连接和卷积神经网络,这样学习的路径是我们最愿意去关心、借鉴和实现在金融领域中的关键逻辑。

  当然我们是做策略的,大家必然会关心时间序列的特征,在AI中有相当多的,这方面的发展非常的快,这块的实现也是非常的高效,整个的研究和业界的连接也是非常的紧密的,这样也是一个促使我们去时不我待,努力学习的一个角度。我们看一看传统的时序的模型LST,我们看一下最简单的STM是在做什么样的事情?他在假设系统中有一个状态,简单的列两种状态,市场要涨或者跌,这时候把信息做一个录入,他会选择性的记忆市场行情,选择性的遗忘另外一部分的市场行情,这就是抽象化行情,他想记住决定性的因素,想屏蔽市场上的噪音,他就有区分,什么是记住,什么是遗忘?另外一条路径是原始数据输入,我们这个原始数据输入也做了一些数据的过滤和处理,市场的状态,上一个时刻的状态和最新数据的结合,最终就会计算得到我们当前市场的状态。

  所以从这个角度来说,我们实际上是在跟踪市场的一个状态,并且通过参数的调整,我们选择性的保留最关键的市场的一些价格波动等等的特征,而放弃或者以往掉一些对市场无关但是又真实出现的噪音,通过这样的方式我们是可以在训练过程中不断的去强化学习获取我们有用的一些知识,变为一些模型的遗忘参数或者是保留的一个记忆参数,这样能够形成时间序列上用有用信息的特征,具有外化的特征,也具有了一定的预测性。

  最后说到科技树,对我们金融领域的工作人来说,有挺大的压力,我们也希望转化成动力,全球对于AI策略的国家性投资的一个测算。这个是一个比较有可信度的世界经合组织发布的最新的2020年的报告的数据,这里面我列出了两类的数据,一类从国家政府的角度来探讨这个地区和国家,政府有国家性质的投入,在AI模型的发展方面,我们可以看到,最主要的一些法家中美还有欧洲、德国等等,包括像印度他们现在都有国家层面的一些投资对AI技术的支持以及AI技术落地的一些应用的一个帮扶。

  其他的很多国家即使现在没有他们也在迎头赶上,也包含了不少发达国家,我们可以看到澳大利亚、新西兰,他们也将要有落地或者成型的一些AI的计划,大家注意这是在国家层面上,国家层面上大家都意识到竞争的激烈性,这方面的技术的推进是非常的迅速的,我们看到2020年其实对我们的金融科技领域是很大的冲击,我们看到AI领域一定是欢喜的,整个的投入有爆发性的增长。这个我们其实结合AI的简要发展史我们可以发展,AI历史发展过程中经历了很长的撼动,近些年来由于技术的突破和进展,我相信在业界的转化大家都是希望能够齐头并进的。经过介绍这一颗AI科技树不是我们想不想点的问题,而是我们要抓紧什么时候点开的问题了。

  系统深入到AI模型的应用来看,依然是模型的数据,模型的数据其实是有不同的层次来考虑,因为现在的金融数据是种类非常的繁多有标准化、非标准化,有行情内的数据、标准类的数据,还有基本面的数据,包括我们现在主打推出的在截面因子的回归型的数据,这一块的数据刚才陈辰主要介绍了一下商品的截面因子数据,我们这边在股票的截面因子的数据也已经做的差不多了,也都做了一个one by one的对等的比较。如何把那么多的一些数据做一个整合、收集和管理,得到我们输出想要的一些目标呢?

  那么我们就会有一个迷失,我们会不会以为中间是一个黑盒子,会自动处理数据,然后得到我们想要的数据,这样的迷失是因为我们对整个的模型是不了解的,在我们看来,这样的一个数据的处理是非常关键的,也就是不同类型的数据如何做一个整合,如何有模型高效的应用,如何为AI的模型提供口粮这才是我们非常关心的,AI模型的开发领域有一个非常有名的数据科学家他提到过AI模型最后的质量有你数据的质量来决定,假如我们有高质量的数据的话,数据中没有真正蕴含到复杂的模式或者是一个可供我们学习的一个信息的话,再好的模型也是没有用的,在这个角度我们实际上是结合了我们自身的一个优势,我们对于数据的理解和金融数据的处理和工具结合了这方面的优势来做一个整合。

  我们会看到我们在利用数据做分析的时候我们自主研发的多周期的数据分析的方法,当然这部分的方法我们也是借用了海外的一些先进的经验,我们在这方面是做了一个落地的实现,我们将数据分解成多个周期,简单来讲可以划分为短中长三个周期的拆解,我们做这样的拆解目的是什么?如果我们具有一定的金融学的尝试知道,金融类的数据任何一个标的物他其实都是非常不同的投资者结构在不停和对手方的交易的过程中不断的形成价格,交易的参与是本身的投资目的、风险偏好都是有巨大的差异并且是显着不同的,这个时候我们就要考虑在其中价格所反映出来的因素我们就要清醒的认识到是多种周期的特征叠加的过程。

  简单的来看我们短周期的数据特征我们依然看到了比较高的一个噪音体系或者是波动的体系,可是走上了中周期、长周期实际上数据的特征会变的越来越明显,这是对我们做期货行业的人来说是非常明确的,因为期货由于合约换月的特征,比如市场价格CPI指数更敏感的特征他实际上具有的规律应该是比较明确的,可是为什么我们看不到他,主要的原因在于很多的周期的规律都是叠合在一起的。

  我们想一想,昆仑周期至少4个月,苏格拉周期5个月左右,所有不同的周期尺度的特征,叠合在一起的时候我们是很难发现他精确的规律性的。我们看一看,我们现在做的数据分解,当我们不做数据分解的时候,实际上我们在把他数据转化到频率空间以后我们就会发现整个数据时候实际上是没有特别明显的主导周期特征的,而且数据里面充满噪音,这个符合大家的人认识,我们很难跳过数据随机游走的概念。

  但是当我们做了数据分解以后,在中周期和长周期上明显的出现了主导特征,一开始非常震惊能够发生这样的特征的,大量的金融数据都是像左下角这样没有明确特征的,我们就开始思考一个问题,就是如果我们找到这样明确的数据特征,这样的数据特征的信息是否能够通过AI技术学习到,我们可以有一些精确的模型处理这种线行的特征,可是我们使用AI是否可以达到更长的,我们是不是可以看到中长周期或者是借宽周期的特征呢?我们做了数据分解以后才能够有机会更容易发现数据里面的一个信息传导的特征。

  据我们所了解现在AI技术本质上很难对金融数据做一个明确的或者是一个比较可靠的降噪的处理或者是分解的处理,可能在一些非精度学习里面有一些进展但是我们会认为这方面的应用的话还是有一段路要走的,在原有的模型和非常有力的分析工具实际上是非常愿意将这样的工具和AI模型进行叠合,这个模型之间也是互相博弈和不同进步的过程,这是我们数据处理的一个逻辑。

  我们看到这样的数据处理分周期的模型我们可以做各种的金融降噪,也许在座的各位做量化的金融数据研究员最为关心的问题,我们交易的行情是低信号的体系,我们的信号是非常不明显的,噪音非常大,我们能否用刚才的数据分解的特征找到他主要的累计型的波动变化的特征?我们为什么想做这样的事情?我们这样的话得到的信号更加明确,AI更有机会学到这样的特征,AI模型实际上还有一个深度学习和抽象化的过程。

  无论如何我们可以看到我们现在使用的数据分解的特征其实达到的非常好的效果,我们分解得到了一个最终的数据信号是非常明确的,而且实际上他的波动率也就是他的不确定、不稳定性是远远小于原始数据的特征,但是我们在做了一个累计收益率的比较以后可以看到非常平滑的贴合在一起,我们做的数据并没有对原始的数据在整个中长周期或者是累计的尺度造成太大的扭曲,但是实际上他依然能够很好的反映出来一个数据的一个主要的走势特征,所以这也是我们相信我们现在所使用的比较成熟的,有效的数据分析的模型,他是能够很好的结合在一起。

  我们现在就来说一下重点,我们现在就是在一块看到显示的一个结果,就是利用前面陈辰所介绍的我们最新推出的商品的截面因子的指数,来判断这些因子对我们所要投资的标的物也就是华泰商品板块指数他的解释力的强弱。我们这边使用的一个词大家小心一点,我们使用的是因子的影响力或者是因子的重要性的判断,这个实际上在线性模型里面的暴露是有相当大的区别,这样的结果反映的是价格的相应复杂的传导模式,因为因子重要,但是不代表他是线性的影响的关系,寻找的就是因子的重要性就是标的物的影响力、解释力、以至对外推的预测能力。

  我们这边使用的数据证明来进行回归分析,建立回归分析以后我们可以通过在最终的节点上面的预测数据的误差值来判断因子是否重要,我们采用的方法其实蛮简单的,我们考虑某一个因子去掉他和保留他的对应的效果有多大差异我们如果去掉某一个因子之后,他的预测效能大大的降低,他的误差值迅速的上扬,这样的因子就是非常重要的。我们评判能力的标准相对来说是比较简单的,我们看到现在的结果是这样的,我其实想请大家注意几点,第一点的话,大家可能已经注意到了,为什么我们的数据对因子的重要性判断会分成左右两边,这边是因为在商品国家因子实际上对整个市场的影响是非常大的,这边其实在陈辰也提到过,我们在做截面因子以后我们是可以得到国家因子的,这样的国家因子对全市场的解释力非常强的,在股票领域的话我们得到的国家股票因子和沪A300的指数相关性很高,我们为什么把他排除?涉及到技术面的应用,假如我们的因子影响力很强,会会影响因子的效果力的判断,我们在做判断的时候会把这样的因子放在一边,然后测试剩下的因子,从算法的角度来看速度更快。

  我们再注意其他几件事情,我们在因子排序的前面几位,靠左边,我们看到中国CPI因子上图和下图,我们一般会觉得CPI并不是一个带有牵制性或者领先的指标,我们更大的作为把他当做验证型的指标,我们认为他是经济发展到一定的阶段以月为达到做出来的统计的数据,换句话说就是市场已经实现了一定的结果。刚才陈辰在介绍的时候我们都知道,我们实际上已经实现了把一些低频率的宏观因子甚至是统计类型的,国家发布类型的指数转换成了以市场数据来构建的一个高频的因子,这样的因子在我们的商品体系里面体现出了很强的重要性,至少这边的因子重要性就可以看到排名很靠前。

  我再提醒大家注意另外一个因子,大家可以看到在右上角第三类的柱状图中其中我们可以看到在短周期上原材料板块因子他的影响力是排在短周期的第三位,他并不是商品因子,我们发现了在股票领域非常相关的一个板块实际上对我们的商品期货市场是有相当好的一个解释力的,其实这样的角度就是我们做股期联动的连接的角度。顺便说一下商品国家因子和股票国家因子相关性也是很高的,近几年持续的升高,我们理解为股期的联动,背后的一些商品的配置是在逐步的加强的,这时候我们看到一个比较高层次的优质的角度看到这样的效果。

  我们得到了这些数据以后实际上我们就比较容易知道我们现在AI模型的口粮是什么?我们找到了重大的风险敞口,我们可以看看这些敞口对我们的数据预判有多大的影响。我们这边的一个测试是只用到了现在目前所使用的截面回归因子,并没有使用全市场的各种类型的因子,像技术力指标、敞口类的数据并没有使用到,我们这边更多的探讨Beta类型的因子有多好的预判和测试的效果。

  这边我们使用了另外一种方法,在决策树的裂解过程中可以使用拓扑的性质判断性质,分类结点越靠上越重要,这个拓扑的性质跟我们最后到深层的一个叶子部分和根部的数据的预测是有相关的,我们可以知道前面的结果并没有太大的差异,同样的国家商品因子是最重要的,短周期上面有中国的CPI因子、动量的因子等等我们都知道这是商品期货领域里面应用的最为广泛也是大家比较熟知的一些价格的驱动因子。

  有了这套数据以后我们就可以通过他们作为一个树的数据来对模型进行输入,这个时候我们就会思考这样的问题,我们具有多种的AI模型,甚至在不同领域里面有模型的分类,这时候选用什么样的模型来构建我们的策略呢?这是一个关键的问题,我们会觉得这边最核心的策略是我们设计模型的一个拓扑结构是一个非常好的能够解读数据里面的信息学到数据里面的信息,这是我们最为关心的一点。

  我举个例子我们下午上盘,我们的短周期和长周期数据分别输入,经历了一段时间的并行学习,我们就希望他在不同的周期数值上找到对我们的标的物最有影响力的一个数据抽象化,我们得到了长周期的主导因素节点也得到了短周期的主导因素节点,这样的数据还可以进行整合,这个整合的下一步的过程实际上做传导他们之间的相关性或者价值的传导或者是比较复杂的非线性的一个价格波动的一个模式。这个本质上我们是比较难去探寻他学到了什么模型,这也是AI模型的缺点,假设我们非常好的考虑到数据的特征并且有力的利用我们的数据特征在建模的过程中贴合数据的方式来建立隐藏层或者深度学习的过程,整个数据的抽象化是比较有利于让我们去提取到有力的信息并且做到有效的预测。

  这边我想请大家注意一点:我们左边的模型和右边的模型其实几无区别,但是有一个最大的差别在于,左边的模型是单独的输出,右边的话可以多模输出,我们在AI模型的理解中知道,AI模型比较强大的数据处理特征他可以大量的吸入数据,同时他还有多个出产,多个结果针对不同的目标进行优化,这对我们来说非常有利。我们考虑到用户的需求,结合到市场的数据对于市场行情的预判,同时我们可以输出针对某些不同的客户最优的投资方案的解决,我们觉得这样的多输出的模型框架是非常有利于我们去建立一个有效的一个AI模型或者是AI模型在这个领域的一个落地。

  说了那么多我们这边实际上会应用一些简单的结果,我们的多个输出实际上会对下一步还有再下下步的一个数据的预测,我们谈一谈他预测的效果。我们看对下一步的预测的效果,外推的预测的效果,我们这边测试数据是使用了我们刚才提到的华泰的五个商品板块指数,这个商品指数的话我们是使用多投的策略来做的,他整个的数据的支出的形成是行情数据来组合而成的,考虑了一些权重的配置。

  我们现在得到的结果来看仿佛我们的浅度学习和深度学习互相之间都所胜负,我们就会理解成为,他们实际上学习的模式很可能是有所差异的,这本身是数据之间的特征是有所联系的。我举个例子,贵金属指数在浅度学习里面只能达到49%的胜率,在深度学习可以达到57%,他是全球性的金融资产商品,他有可能出现海外的价格的传导,有可能是本国的一些买卖的一个驱动力会作为一个互动和国际的价格的变动做一些互动的工作,本身他价格的走势和风格实际上是相当复杂的,这就是我们觉得在随机商品在浅度学习方面很难学习到复杂的加工模式,不能够进行更多的抽象化的学习。

  可是深度学习就不一样了,整个预测的效能都差不多,贵金属似乎还是中等偏上,他很有可能在使用的比较有限的商品因子里面已经能够发现到一些价格传导的因素。我们宏观因子指数里面包含USD的,我们再看另外一个结果,这是我们继续用深度学习来探索,我们预测下一步的胜率,也可以预测下两步下三步的胜率,大家可以说我们的胜率没有很高,大家知道我们使用的数据的框架是非常有限的,我们是希望在一个有限的框架里做一个同等地位的对比。

  我们看到第一步有一个相当好的预测效果,并且他整个的差异性不算很大,预测到第二步的话第一步的预测是有所下降,我们惊奇的发现第二步的预测胜率似乎没有太多的下降,我们看第三步更奇怪,我们看1、2、3步,都没有太大的下降,这有一点点违反我们的做量化人的研究的,他衰减的速度是非常快的,如果没有信号的话,我们很难在做模型的时候对步骤和未来做一个很好的预测,但是在这里我们可以看到他可以做到这一点。

  我们现在理解深度学习确实学到了一些比较复杂的价格传导模式,而这个价格的传导不是在于第一步或者第二步或者短期的延续,他是一个长期的,这个概念在下一步进行扩展。现在AI策略在发展策略,我们的农业化工是没有办法做出很有效的策略。

  最后我们来说一下我们对AI科技的一些应用以及他未来的一些展望。在这个角度的话我们会说一下华泰期货的研究。我们2019年进行了研究,我们整篇年报都在研究黄金等贵金属的研究,他的研究可以通过大量的学习得到预测的效能。那时候取了市场交易的数据做了数据的输入,我们也做了数据的分解,分成三个周期的数据分解分别做了一些预测,我们做把他作为一个合并这是2019年,这是2019年的9月份,他有相当客观的一些预测的效果,那么我们再看使用随机森林也就是右边的部分,这一部分我们当时出示了一个层次网,我们用随机森林进行预测,涨水就要做多,空的话就空仓,而且是月度的效果,我们认为他是比较客观的投资的效果,最大的风险持续的时间也较短。

  在今年我们继续做这方面的研究,以及落地的服务,我们可以看到对原油的宏观因子的重要因子的排名,国债期货的排名也取得了好的效果,也符合我们对金融体系的认识。

  最后我想说一下我上面所说的所有的内容,包括我们的AI模型的一些学习的方式最终他其实落实到一个场景学习的概念,也就是我们最开始提到的我们如何类比到自动驾驶,我们现在要面对的金融市场是非常复杂,他有Alpha的影响,他还有很多我们没有能够明显觉察到弱Alpha的因子的影响,如何提取这些信息?实际上我们首先做的事情很可能是在一个尺度上进行分解,我们寻找不同因子的维度,我们和历史进行对比也就相当于我们在用场景进行学习,我们可以看到历史上他发生了什么的变化?在相同的条件下,他主要的描述的敞口点就是我们现在主要描述的一个截面的回归因子,通过对历史的学习,我们对现在做出判断,并且对未来作出一定的猜测,这是我们现在主力在做的工作。我们也希望业界的朋友京东数科有学习和合作的机会。

  我们这边采用的一个角度就是,客户的一个学习的模块他可以是对客户的分类,我们对市场行情的了解可以说是对市场的一个学习,而这两个不同的学习或者模块实际上在AI的应用领域里面,也可以进行整合,整合最终的一个目标很可能我们就可以做更优的对客户需求给出一个服务的解决方案,这边我们提到我们现在在做产业的风控方案,包括商品的配置,前面也提到了我们的风格因子投资实际上我们有两个指数已经发布一年多了,我们还有股期的联动方面还有一个进一步的推动。

  最后我做一个简单的总结,其实我们在前面的陈辰的报告中可以看到,我们实际上做一些商品的多因子实际上在一个基础多因子+截面多因子,解决了商品投资有无的问题,如何进行投资,如何对风格进行暴露,如何又对不同风格的敞口进行管控,他模型的落地实际上是很大程度上帮我们解决了,这是一个很好的起点,同时我们看到又是数据的基础,正是我们算法的基础最主要的口粮来源,我们现在算法技术的发展和应用,实际上很大程度上解决投资的效率的问题,所以在这个方向我们又迈出了我们的前景,我们希望有更好的推进。我们整个的研究的策略或者是逻辑,是希望结合到一个应用场景是完整的给客户提供一个解决方案,无论是在投资还是在风控领域。

  这就是我今天的一个跟大家的一个分享报告,谢谢大家。

我要回帖

更多关于 ai围棋视频讲解 的文章

 

随机推荐