会员登陆:
像数据科学家一样思考
很多数据分析最后不了了之的原因就在于没有关注“会产生什么样的后果”这一问题。如果80%的会议都按时召开,最初问题的答案也许会变成“会议都是按时召开,”这样就没有分析下去的必要性了。
任何事情都需要更深一层次的分析。要对变量敏感,要知道变量会让你更好地认识所有问题、有更深层的洞察,以及为改变现状提供灵感。把变量设定为8~20分钟较为合理,有些会议是按时开始,有些甚至推迟了30分钟。但如果把变量设置为0~30分钟,就太大了。
接下来,进一步挖掘“这些数据还能揭示哪些问题”。数据提醒你有五次会议是按时开始的,另外的会议至少延迟7分钟。通过进一步的挖掘,你也许会发现,这五次会议都是由财务部的副总监召集的,你得出了“财务部副总监喜欢按时开会”的结论。
接下来你要做什么呢?下一步的重要性在哪里?从个人的角度看,结果既有趣又重要。首先:你可以想想,你延迟开会浪费的时间总计下来你能够做多少事情,其次,既然副总监能做到按时开会,那为什么你不能呢?
如果从整个公司的层面看,意义就不光是这么简单了。你也许不确定你的结果是否具有典型性,也不确定是否其他人也会像副总监那样对开会迟到这件事不讲情面。但可以肯定的是,你会发现更深层面的事实。开会迟到是否和其他事情有联系?是否在某一时间开会迟到会更严重?电话会议和面对面开会,哪个更容易延迟?会议不能按时召开和某些人有关系吗?
这些问题都可以成为你接下来要研究的问题。选择任何一个问题,回到第一步,重复以上的过程。
我希望你会觉得这个练习很有意思,你会从数据中发现很多有趣的事情,这会让你上瘾。但是,无论你是否会体会到这些乐趣,都不要轻率地开始这项训练。如果你真的是一个数据盲童,对此不敏感,我还是谦虚地建议,不要尝试这项练习。