本文编辑自光大富尊投资有限公司研究总监董艺婷在“大数据100分”论坛上的交流探讨实录:
现在我所在的公司是一个完全以量化模式投资和管理的公司。作为国内最早涉猎量化投资的团队,我们的状态很有意思,许多工作都是自己从0开始动手,经历了很多“凑合”的过程,也看到很多业务、市场、需求。从我们意识到,到最终实现,经历了很长很痛苦的过程。当然,好处是,这样我们总能知道三年后市场需要什么。
对于一个始终在国内市场做量化投资的人来说,我想先描述一下自己的生存环境和一路走来的感受。
09年,从“衍生品业务”的梦中醒来,沉浸在失业的焦虑中时,领导说,我们做量化投资研究去吧。我说好吧——可是我会么?一开始只有4个人,最起码我自己写的东西现在看来惨不忍睹,没有成熟的研究流程,没有合理的方法论讨论,可行性也堪忧。感谢那些在会议室快睡着但仍忍耐我的客户——让我们得以成长至今。然而也正是因为如此,我们承受了太多行业发展中的“技术外”或者叫做“业务外”因素带来的痛苦——收获是现在对任何问题的思考,都不再是一个独立的思考。请大家不要忽略上图中“数据”和“系统”之外的其他四个饼(资金、管理、制度、环境)——如果没有它们的保护,我们随时会失业。我们想得太多,恰恰是因为我们珍惜。
讲完上面那些废话,下面可以好好讲讲,在这样的心态下,对数据和系统,我是怎么想的了。
其实上面这两张图的标题已经表明了一切。里面的每一块数据内容在大家看来都那么清晰明了,简单得就像今天中午的午饭,有一碗米饭,一碗汤,两碟素菜,半条鱼和一块大排。然而在我心里他们是一个复杂如宇宙的存在——无数细节问题,足够写一本可以砸断脚的书。最起码,有那么几个不算太细节的问题:
1)从哪儿来?
2)能用吗?
3)购买成本?
4)存储和维护成本?
5)预处理成本?
6)其它应用中的技术问题——怎么用?怎么存?怎么保障安全?
正因为如此,每遇到一个系统商,或是研究平台提供商,或是策略提供商,我首先会问上述关于数据的问题,还会问下面要讲到的精度问题。我不知道在其它领域你们能否得到关于数据的上述服务,最起码我得不到,或者买不起。因此我们只能靠人肉去做这些工作。当一个人带着进入核爆模拟实验室的预期来到我们的工作环境时,当我让他们花几个月的时间去看数据,去做一次上述流程的时候——我在他们眼里看到了深深的失望,和被伤害的委屈——父母老师精心培养了二十余年的精英,就是干这个的吗?可是我也很委屈,如果连一个还没毕业的本科学生都能从“公开信息来源”比对出这个数据库的明显错误,这个数据库凭什么要我付出那么高的年费?我们所赖以生存的大数据,到底是个什么东西?
有人喜欢用“模糊的准确”和“精确的错误”来表达对他们的态度:对数据吹毛求疵没啥必要。我想有两件事需要说清楚:
1.在资本接近零和的博弈中,有模糊的准确就一定有模糊的不准确,而后者的后果,我无法承担。
2.对数据吹毛求疵,是希望消除不必要的“误差”而不是“错误”。错误就是错误,模糊和精确都可能带来错误。误差却是一个可怕的东西,它在不知不觉中可以传导成一个巨大的错误,人人都知道蝴蝶和飓风的故事,把它时刻放在心上的人却很少。
如果你忍耐了1到3年,把“吹毛求疵”这件事做好了,你就会是本土量化投资领域最有竞争力的TOP20%之一。花在这上面的时间一点儿都不会浪费——当你知道为什么数据必须是那个样子的时候,你已经懂得了很多人为什么会栽跟头,或者说,他们为什么亏钱?接下去,你可以进入一个灵魂自由的领域了。
其实上面这个流程里有很多事我也还没做。这是我理想中的后台部门能为我解决的一个工作环境。到现在为止我还在为之努力——没钱,也没人。然而现在这已经变成了我的理想之一。
不可避免的还是讲讲系统吧。我的检验标准暴力而直接。这里说的钱,千万不要认为只是“收益率”——它的含义是:管理成本、Quant的工作效率、交易速度和成本、风险控制的准确度和效率、资源分配的优化程度等等。而一个好的架构师,不但要懂数据,还要懂需求,知道我们这些人打算拿着数据干啥去——很多架构师不耐烦听我讲这个,或者以为他们所理解的就是我讲的,我一直认为这种工作流程是本末倒置的——当你不知道目的地在哪儿的时候就买好了路虎,可是我只不过想通过一条独木桥到对岸去。这个,同属我的理想之一。是我在问过几个系统商同一个问题之后忍无可忍的结论,其它躺枪的系统商勿恼。
实际上我的不满并非完全来自于速度,相反,我并不追求没有必要的高速——因为那可能是以高成本为代价的,还有可能是以牺牲风控为代价的。我只是希望,无论是系统商还是我们自己,都知道时间去哪儿了——每一部份的耗时,做一个敏感性分析,并没有那么难,为什么不去做,而是选择用成本和风控来作为速度的代价?
系统商和数据商遇到我这样的客户会觉得非常烦——他们已经加班了很久,老板的利润之刀就悬在脖子上。实际上我的状态也好不到哪儿去,但我坚持,要做好一件事情,咱们得有个合理的流程,流程之一就是:了解客户需求-〉理解客户需求-〉用最高效率和最低成本完成这个需求。而不是先造出一辆车再来问我到底在什么路上开?当我想问问这辆车的汽油在某种路况和速度下的消耗速度时,你说这谁知道?
下面这张图,是我的另一个理想——通过系统让量化投资成为一份幸福而安全有效的工作。事实上基于这个理想的系统架构,有两个。
其中一个已经写完了三年,在其中无数人找我谈过它的商用,现在仍然没有落实:两年前是因为它太超前,客户还没培育起来,现在是因为匹配的数据和系统太贵,而我不敢冒险把技术架构给任何没有商业合同约束的潜在合作伙伴。另一个的架构搭好了有半年,我们仍在人肉准备基础数据中。
这两个系统将用于量化策略(或其它一切可以用确定资产组合来表达的策略)的评价、管理、风控、验证、配置…等等,总之就是解放一个人的思想,让它自由而快乐地思考,大量计算和验证的工作,都交给系统。(前提是,数据可靠,接口统一,函数体系符合业务逻辑,速度足够快,输出足够友好)要达到上述目标,在我眼里,技术,是最后一个需要考虑的问题,因为每一个步骤,我们都知道how to do。现在的问题是 how to cost 和 who to do it?
再扯得远一点,当很多人发现他们也需要这样一个东西,开始往里投钱的时候,想做NO.1已经没有那么简单了。我们需要的,就是从现在,就开始。