和传统企业略有不同,互联网高管的日常工作中,不仅要“定战略、搭班子、带队伍”,还要经常看数。如果说工业公司高管是“陆军师师长”,互联网高管就是“导弹营营长”,必须要了解各个业务细节,对所有相关业务数据了然于胸,并且能够从很细微的一些数据波动中见微知著,做出判断。
我们先从王慧文和林彪的两个帅气的例子讲起,再到一些理论和实战技巧。
王慧文 - 美团周会、月会
“王慧文在负责外卖业务时,经常在管理月会上发脾气,往往是因为数据问题。比如,美团 2015 年开始自建配送物流,需要精确计算每单给骑手多少钱。某次团队给出的方案是:给一线城市骑手每单 5 块、二线城市骑手每单 4 块,三线骑手每单 3 块 5。王慧文听后极其生气,说这些数字一看就是拍脑袋拍出来的,没有经过实际调查、理论分析和严密推理。”
江洋《我眼中的王慧文》——
“老王可能是我见过在互联网行业,大佬级别中所谓比你聪明还更拼搏,并且会关注很多业务细节的人。
每周六下午是我所在大团队的业务管理会,每个分支业务的负责人要讲详细的业务进度,数据说话,结果导向,坚决不是让你把周报像流水账一样讲一遍,训练大家要高效的,脱水的把工作汇报完。老王也会全程非常认真的听每个人讲,绝不是在下面看看手机走个过场那种。
所以我们看到老王在一些公开场合的演讲非常干货,没有废话,没有虚的,也几乎没有什么意识形态,我想这除了聪明之外,更多的是多年沉淀下来的务实风格。
说到聪明,其实和经验与业务理解是分不开的,比如你在每周的业务汇报中说到“某个数据变化属于正常波动”,这似乎是产品负责人没有特别认真思考或者因为经验欠缺或是全局感不强而惯用的一个理由,特别是在数据变化不大的情况下,而此时老王会一针见血的指出是因为出了什么问题,什么原因导致的数据变化,让你心服口服。”
对数据波动的归因是最难的,有时候直觉判断有问题,花整个产品/运营团队一整天的时间“破案”,是很有必要的。甚至于,一个产品经理每月50%以上的时间都在看数、破案,绝不是浪费时间,比写一堆需求文档(PRD)要高效的多了。
为什么老王看起来有“直觉”?本文后半部分和文末会给出解答。
林彪,巧用军事“大数据”活捉廖耀湘
程光的《往事回眸》中讲了一个林彪的故事,孤证不立,无法验证是否和党史吻合,但里面的思路非常值得学习。
据说林彪从红军带兵时起,身上就有个小本子,上面记载着每次战斗的缴获、歼敌数量。每次打完仗,林彪就亲自往上面添加数字。
1948年辽沈战役开始之后,在东北野战军前线指挥所里面,每天深夜都要进行例常的每日军情汇报:由值班参谋读出下属各个纵队、师、团用电台报告的当日战况和缴获情况。
那几乎是重复着千篇一律的枯燥无味的数据:每支部队歼敌多少、俘虏多少;缴获的火炮、车辆多少、枪支、物资多少….
司令员林彪的要求很细,俘虏要分清军官和士兵,缴获的枪支,要统计出机枪、长枪、短枪;击毁和缴获尚能使用的汽车,也要分出大小和类别。
经过一天紧张的战斗指挥工作,人们都非常疲劳。整个作战室里面估计只有定下这个规矩的司令员林彪本人、还有那个读电报的倒霉参谋在用心留意。
1948年10月14日,东北野战军以迅雷不及掩耳之势,仅用了30小时就攻克了对手原以为可以长期坚守的锦州并全歼了守敌十余万之后,不顾疲劳,挥师北上与从沈阳出援的敌精锐廖耀湘基团二十余万在辽西相遇,一时间形成了混战。战局瞬息万变,谁胜谁负实难预料。
在大战紧急中,林彪无论有多忙,仍然坚持每晚必作的“功课”。一天深夜,值班参谋正在读着下面某师上报的其下属部队的战报。说他们下面的部队碰到了一个不大的遭遇战,歼敌部分、其余逃走。与其它之前所读的战报看上去并无明显异样,值班参谋就这样读着读着,林彪突然叫了一声“停!”他的眼里闪出了光芒,问:“刚才念的在胡家窝棚那个战斗的缴获,你们听到了吗?”
大家带着睡意的脸上出现了茫然,因为如此战斗每天都有几十起,不都是差不多一模一样的枯燥数字吗?林彪扫视一周,见无人回答,便接连问了三句:
“为什么那里缴获的短枪与长枪的比例比其它战斗略高”?
“为什么那里缴获和击毁的小车与大车的比例比其它战斗略高”?
“为什么在那里俘虏和击毙的军官与士兵的比例比其它战斗略高”?
人们还没有来得及思索,等不及的林彪司令员大步走向挂满军用地图的墙壁,指着地图上的那个点说:“我猜想,不,我断定!敌人的指挥所就在这里!”
随后林彪口授命令,追击从胡家窝棚逃走的那部分敌人,并坚决把他们打掉。各部队要采取分割包围的办法,把失去指挥中枢后会变得混乱的几十万敌军切成小块,逐一歼灭。司令员的命令随着无线电波发向了参战的各部队…
而此时的廖耀湘,正庆幸自己刚刚从偶然的一场遭遇战中安全脱身并与自己的另外一支部队汇合。他来不及休息就急于指令各部队尽快调整部署,为下一阶段作准备。可是好景不长,紧追而来的解放军迅速把他的新指挥部团团围住,拼命攻击,漫山遍野的解放军战士中,不断有人喊着:“矮胖子,白净脸,金丝眼镜,湖南腔,不要放走廖耀湘!”
把对方指挥官的细节特征琢磨到如此细微,并变成如此威力巨大的顺口溜,穿着满身油渍伙夫服装的廖耀湘只好从俘虏群中站出来,无奈地说“我是廖耀湘”,沮丧地举手投降。
廖耀湘对自己静心隐蔽的精悍野战司令部那么快就被发现、灭掉,觉得实在不可思议,认为那是一个偶然事件,输得不甘心。当他得知林彪是如何得出判断之后,这位出身黄埔军校并留学法国著名的圣西尔军校,参加过滇缅战役,在那里把日本鬼子揍得满地乱爬的新六军军长说:“我服了,败在他手下,不丢人。”
取得这场重要战役胜利的其中一个关键因素,居然出于获胜方的统帅夜半时分,对一份普通遭遇战之后的战报的数据分析,来源于他“从红军带兵时起,身上有个小本子,上面记载着每次战斗的缴获、歼敌数量”的优良军事素养。
如何看数,塔勒布的想法:
塔勒布是一个交易员和畅销作家,写了影响深远的塔勒布经济学五部曲 ,除了《黑天鹅》、《反脆弱》,还有《非对称风险》、《随机漫步的傻瓜》和《智慧与魔咒》。
塔勒布在书中讲到了大量的例子,人们因为不太掌握概率,在生活中做出的错误判断。有的错误判断无伤大雅,有的却酿成了悲剧。
条件概率和联合概率
辛普森(O. J. Simpson)案的审判是个好例子,可用来说明现代社会虽受概率主宰,但在做重要决策的时候,却一点都不尊重它的基本法则。犯罪证据有效显然是一种概率事件。
我们根据概率定律推论,所能找到最有可能犯罪的人,却因我们误解概率而无罪开释。但有人也可能因为公众误解概率,被控犯下不曾犯过的罪行 —— 法院还无法正确计算两个事件的联合概率(joint probability,指两个事件同时发生的概率)。
那时候我在交易室里,电视机开着,有位律师辩称,洛杉矶至少有4个人会带有与辛普森相同的DNA特征,我一听,厌恶异常:这种说法正是忽视了联合事件。更糟的是,有位毕业于哈佛大学的律师发表似是而非的论调,说虐待妻子的男人,只有10%会杀害她们。
这是不以谋杀为条件前提的概率。正确的方法应该是看妻子遭丈夫谋杀的案子中,以前也曾遭丈夫殴打的比率有多高(高达50%)。因为我们这里讨论的是条件概率(conditional probabilities),也就是以辛普森的妻子被杀的信息为条件,辛普森犯下谋杀罪行的概率,而不是讨论辛普森杀妻的无条件概率(unconditional probability)。
连哈佛教授都会做这种错误的陈述,我们如何能够期待没受过训练的人了解随机性? 关于联合概率,陪审员、律师和我们都同样容易犯错,这一点尤其叫人注意。他们不了解证据的相乘效果。我被诊断患有呼吸道癌,以及同一年遭一辆粉红色凯迪拉克轿车撞死的概率,假设各为10万分之一,则两者同时成立的概率为100亿分之一,也就是把两个显然独立的事件概率相乘。 从血型的观点称辛普森有50万分之一的概率不是凶手(律师利用这种诡辩说,洛杉矶有4位这种血型的人),再加上他是被害者的丈夫,以及其他的证据,那么由于相乘效果,对他不利的概率会升高很多很多。 《随机漫步的傻瓜》
联合概率是互联网中很强大的一个判断方法。
举个例子,某个AB测试表明统计显著 (p--value = 0.0001) 的App用户使用时长增长,增长幅度是相对值50%,是否可信?
我们第一时间就可以去看一个相邻的指标。这时候,看板上显示,用户打开App频次、次日留存、营收都没有任何变化。于是,“直觉”告诉我,大概率是埋点错了!我们知道,使用时长增长50%是非常罕见的事件,而一般来说如此重大的变化会有相关指标也会跟着浮动。
这时候,我就只好苦笑一下,看看MetaApp的墙上永远贴着的司训:“不要高兴得太早”。
假阳性
这也是塔勒布的一个例子:
检验某种疾病时有5%的概率产生误报(false positives)。全部人口有1‰的概率罹患这种疾病。不管是否怀疑罹患这种疾病,随机检测一群人之后,发现有个病患的检测结果呈现阳性,那么这位病患染上这种疾病的概率有多少?
大部分医生考虑由5%的误报,而回答95%。
各位读者,如果你在医院检测阳性,你觉得自己有多大概率得了这种病?
正确的答案是病患生病且检测发现有病的条件概率,其结果接近2%。只有不到1/5的专业人士答对。
我来简化这个答案。假设没有漏报(false negatives)存在。1000个受检的病患中,预料将有一位罹患这种疾病。999位健康的病患中,检测的结果将有约50位染病,因为准确率是95%。正确的答案应该是,随机选取的某人,检测呈现阳性且确实染病的概率如下:
答案为1/51。
不妨想想,这一辈子你曾有多少次被告知染上某种疾病,需要接受某种药物治疗且忍受可怕的副作用,而实际上你真的罹患那种疾病的概率只有2%!
常识辅助
用“幸存到此刻”(Survival)的常识辅助,帮助我们做判断。
塔勒布:“今天下午我要去看牙医 —— 我可以相当放心地说,他懂得怎么治疗牙齿,尤其是我带着牙痛进去,出来时疼痛大幅减轻,对他的信心也就更强。因为对于治疗牙齿一窍不通的人,很难减轻我的疼痛,除非他那一天运气特别好;或者是这一辈子运气都很好,虽然对治疗牙齿一无所知,却还是成了牙医。
看到他墙上挂的学位证书,我认定他若是纯凭运气,要考试一再答出正确的答案、实习治疗几千颗蛀牙的结果令人满意,终于得以侥幸毕业,这样的概率非常小。"
那天晚上,我计划去卡内基音乐厅听演奏会。我对那位钢琴家所知不多,甚至忘了她那念起来很拗口的外国名字,只记得她曾在莫斯科某所音乐学院研习,但我依然相信我能够听到美妙的钢琴演奏。由于过去的钢琴演奏技巧精湛,因而能登上卡内基音乐厅演奏,现在却被证明纯靠运气而享有盛名,这样的可能性微乎其微。不幸碰到一位骗子在台上乱敲发出刺耳的声音,这种概率确实很低,所以我把它完全排除。”
举例子,如果有一款新游戏刚上线,没做推广就得到了各个渠道用户的溢美之词、充值和各种微博传播,那么这个游戏不好玩的概率就比较小。
再举个例子,一款畅销多年的游戏,如《球球大作战》,虽然看起来画质一般,但是上亿用户这么多年都集体看走眼的概率是极低的。经历过了时间的考验,“幸存到此刻”,几乎一定是精品。一个策划如果瞧不起它,大概率是策划自己错了。
质疑“有运气成分的绩效”
我们把以上论点再延伸,好让它更有趣些。
“假设我们创造出一大群人,清一色是能力欠佳的经理人。所谓能力欠佳的定义是他们的期望报酬为负值,也就是运气和他们过不去。现在指示蒙特·卡罗发生器从罐子里取球。罐中有100颗球,其中45颗是黑球、55颗是红球。每次取出后再放回去,因此红球、黑球的比率不会变。如果取出黑球,经理人赚1万美元;取出红球,赔1万美元。因此每位经理人可望有45%的概率赚到1万美元,55%的概率赔掉1万美元。平均来说,每一回合经理人会赔1000美元,不过这只是平均值而已。
第一年结束时,我们预期会有4500位经理人获利(占45%),第二年,其中的45%的人获利,也就是2025位,第3年有911人,第4年是410人,第5年有184人。我们封给他们响亮的头衔,让他们穿名牌西装。没错,存活下来的经理人,只占原始群体的2%以下。这些人现在是众所瞩目的焦点,没有人会去提另外98%。我们能够得到什么结论?
第一个有违直觉的结论是:一群整体能力欠佳的经理人,仍会有少数人的绩效记录很好。事实上,假使有位经理人不请自来,站到你家门口,你无从得知他是好经理人还是坏经理人。即使整个群体都由长期而言必将赔钱的经理人组成,结果也不会有显著的变化。为什么?由于波动性的关系,其中有些人会赚到钱。由此可见市场的波动反而对坏投资决策有帮助。
第二个有违直觉的论点是:我们所关心的绩效记录的极大值的期望值(expectation of the maximum),受原始样本的大小影响较大,受每位经理人的个别运气影响较小。换句话说,某个市场中,绩效记录杰出的经理人数目多寡,主要取决于当初选择这一行而没去念牙医系的经理人数目;至于他们个别的获利能力,影响则没那么大。它同样也取决于市场的波动性。为什么我使用极大值期望值的概念?因为我根本不关心平均绩效记录。我能看到的只会是表现最好的经理人,不是所有的经理人。如果1997年入行的经理人多过1993年,那么2002年的“优秀经理人”会多于1998年 —— 我敢说一定如此。”
统计显著、相关性 vs 因果关系
塔勒布:“我自行设定布隆博格机器的屏幕版面,把货币、股票、利率、商品等世界上所有重要的价格和涨跌幅度放在一起。货币的信息放在左上角,各个股票市场的变动放在右边,这么多年来看着相同的版面配置,出于本能直觉,我能够知道是不是有重要的事情发生了。
个中诀窍是只看变动百分率大的部分。除非涨跌幅度大于平常每天的涨跌幅度,否则我把数字的跳动视为噪声。此外,在解读时,也不是用线性的方式。涨跌2%的显著性不是涨跌1%的2倍,而应该是4倍。今天我的屏幕上道琼斯指数上涨1.03点,显著性不到1997年10月股市重挫7%的1/109。有人可能问我:为什么我希望每个人都学点儿统计学?我的答复是,因为太多人只看解释。我们没办法光凭直觉,就能理解概率的非线性倾向。”
在这个例子里,塔勒布明显是在用“联合概率”和“条件概率”,加上方差推断出的统计显著性和时间线上辅助的偶然性来综合做判断。这几个数据的波动比例加在一起,只要瞥一眼就能知道个中原委了。外行看起来,真的很像“直觉”。
反过来,财经新闻每天都尝试做“解读”,只要股价波动,且某个事情发生了,就把两个事情强行关联。实际上,纳斯达克涨幅100点可能和全球油价上涨只有相关性,没有因果关系。
总结起来,互联网高管要培养的“直觉”,是要勤奋:每天看数,每周听总结会,每月思考。做到心里一直有“大数”,有若干个核心指标的大概的波动范畴,然后掌握条件概率、联合概率、假阳性、常识辅助的基本方法,最后方能像王慧文和林彪一样,每次数据有异常的时候都能一语中的,击穿业务的本质,克敌制胜。