进入21世纪的第二个10年以来,数据的价值越来越受到人们重视,数据科学在科技、互联网、金融、医药、医疗、生物技术、零售、航空、消费品、医疗、生物技术、制造、大学及研究机构、政府机构等行业和领域的应用越发广泛和深入,因此人力市场对数据科学的人才需求持续旺盛,这就不难理解为什么数据科学类职位在当下国内乃至美国人才市场是绝对的最大热门,也是1-6年同等经验情况下薪酬最高的职业。
为此,国内外绝大部分的理工类、综合性大学都开设了数据科学或大数据技术专业。对于很多在校学生而言,并不清楚如何根据自己的专业来定位未来的职业方向,不知先从哪里、从什么岗位入门对自己长期发展有利。据我所见,即便对资深从业者,也有很多人往往对数据科学类的职业图谱没有清晰的认识,对未来如何提升自己没有方向和规划,跟着感觉走。因 此,这里我就抛砖引玉,浅谈数据科学类职业发展的可选路径,以期帮助从业者少走弯路、以最优路径达成职业目标和顶点。
常有人问,做“大数据”是不是永远也成为不了CEO? 是不是很快就碰到天花板?职业生命会不会像程序员一样短暂?我想说的是,请不要局限自己的想象,一个人可以在专业领域里达到高点,也可能根据机缘情况跨界到其他职能,还有可能跨界到其他行业,就像我们知道没有一个专业是专门培养CEO的,CEO可能从任何专业成长而来。毋庸置疑,我们每个人都有机会成为CEO或高管,在实践中我见到不少从数据类职能起家后来做到公司高管的。但是,若职业规划和目标缺失,恐将会同其他专业技术岗一样,在35岁左右遭遇第一个危机。理想情况是这时要么升到专业技术条线的中高级管理岗位,要么升到技术管理条线的中高级,否则将很快遭遇程序员一样的困境,因为一波波年轻生力军不断涌来,残酷的35年龄线是当下人才市场活生生的现实。那么,这个领域的从业者该如何规划自己的路线呢?
我们这里所谓的数据科学,是指统计方法学、计算科学在广泛应用领域的交叉,通过统计建模、机器学习、优化、海量数据集的管理和分析以及数据采集、可视化等,从结构化或非结构化数据中提取知识,帮助人们将业务问题转换为研究项目,再将其转换回实用的解决方案。
随着互联网、物联网、社交网络、云计算等技术不断融入我们的生活以及现有的计算能力、存储空间、网络带宽的高速发展,人类积累的数据在互联网、通信、金融、商业、医疗、政府治理等诸多领域不断地增长和累积,数据科学今天已广泛运用于用户画像、精准营销、舆情监测、智慧医疗、智能投研、智慧城市、商业智能、智能制造、智能交通、智慧型政府服务等应用场景,数据科学创造价值。
市场上与数据科学相关的有职能/职位可简单分为:数据系统与平台、数据应用、数据治理。如图1所示,图左侧的职能为数据系统与平台类,右侧为数据应用类。
图1 数据科学相关职业的职能图
在有规模的组织机构里,数据类专业条线的发展上限有大数据总监、数据治理总监、数字化转型总监、大数据总经理。根据组织规模、业务形态及公司管理层对数据价值的重视程度不同,这些高阶职位一般不会同时设置,例如若设置了大数据总监,数据治理就不必设置总监,有经理级的职位行使这部分职能也可基本满足需要。
大数据总监的职责范围包括根据公司的战略与业务需求,统筹数据应用规划、数据平台架构规划以及组织这些应用和技术的开发实现,还可能包含数据治理的功能。
大数据总经理是当公司把数据部门作为事业部编制或独立的对外服务业务单元时才可能设立的高级职位。
数据治理(Data Governance)是组织中涉及数据使用的一整套管理行为。由企业数据治理部门发起并推行,关于如何制定和实施针对整个企业内部数据的商业应用和技术管理的一系列政策和流程。从范围来讲,数据治理涵盖了从前端事务处理系统、后端业务数据库到终端的数据分析,从源头到终端再回到源头形成一个闭环负反馈系统(控制理论中趋稳的系统)。从目的来讲,数据治理就是要对数据的获取、处理、使用进行监管(监管就是我们在执行层面对信息系统的负反馈),而监管的职能主要通过以下五个方面的执行力来保证——发现、监督、控制、沟通、整合。
数字化转型(Digital transformation),就是以计算机为代表的数字技术,涉及到计算、存储、传输、交互等,对业务(流程、场景、关系、员工)进行的重新定义,将业务从传统方式转变到数字技术为基础的自动化和智能化新模式。
对于计算机软件相关专业的人士而言,若有扎实的计算机编程能力,特别是有Java编程能力,职业成长路径大都如图1左侧所示的职能入门,即从数据采集或数据库工程师做起,经1-4年晋级到数据平台工程师,接下来的发展将非常多元,根据个人职业兴趣、机缘、项目经历等情况,可按部就班地发展到大数据架构师(total 经历5-8年),也可能到数据治理经理(total 经历5-8年),还也可能转到数据应用端做数据挖掘、机器学习等专业线。最终发展到大数据总监(total 经历10年以上)、或者数据中心总经理,也就是数据职能的“head”。请参考下图(图2)。
图2 数据科学职业的发展路径图
对于数学、统计学相关专业的人士而言,若编程能力不出彩、特别是没用java进行数据操纵和处理的实战经验,且缺乏大数据平台的开发建设经验,则最可行的路径是从数据应用端入门(见图2)。这里又有三条路径可选:
第一,如果你拥有扎实的统计学知识,且有SQL的基本知识,但没有数据挖掘、机器学习领域的系统化知识和历练,编程基础薄弱,那么可从数据分析师、BI分析师等这种利用统计分析软件、可视化工具、BI工具等职位开始,未来发展到职能模块的经理,也可转到marketing、sales、finance模块的数据分析岗,或者转到经营分析或战略职能,或者转到咨询公司做咨询顾问、市场研究公司的定量研究方向,等等。
第二,如果你拥有扎实的统计学知识,掌握SQL及基本的数据处理能力,掌握python,掌握甚至精通数据挖掘算法、机器学习算法、深度学习算法,那么职业起点可从数据分析师、BI分析师、数据建模工程师、算法工程师的这类开始,经过5-8年的实践和磨练可晋升到算法专家、数据科学家、大数据应用专家(经理)。若你足够努力和钻研,则10年以后有机会升为首席数据科学家,或大数据总监。这里也许有人说,你是不是太保守了,很多互联网公司的算法专家、数据科学家只要求3年多经验,你怎么说要经过5-8年呢?那是需方愿意那么命名,千万不要较真。
如果你非在互联网、计算机软件、科技公司,对公司业务中的数据应用场景有洞察力,并有以技术创新驱动公司业务升级的领导力,则有路径发展到“数字化转型”,直至总监级,再进一步进入高管序列也有想象空间。
当然,也可转到marketing、sales、finance模块的数据分析岗,或者转到经营分析或战略职能进而再向上发挥,或者转达咨询公司的咨询顾问、市场研究公司的定量研究方向等。
第三,如你拥有扎实的统计学知识,掌握SQL及基本的数据处理能力,掌握python,掌握甚至精通数据挖掘算法、机器学习算法、深度学习算法,掌握优化、检测与估值等工程学知识,且学历满足至少本科211、硕士985(或世界前100),可进军科技公司,如华为、商汤之类,从工程、控制等AI算法工程做起,逐步向上发展。
4.行业与公司
今天,数据科学类职位几乎遍布社会各行业,从需求的热度和薪酬看,自上而下的排序为:
结束语
进入了这个圈,选择了这个路径,职场仍然是一场比赛,最终每个人的发展都不同,天分、努力、运气都不可或缺。
初5年尤其重要,5年是一个从0经验晋升到经理级的标准时间线,跑位和占位都需快,你越早占位就约有无限发展空间和机会。祝你成功!
最后,还是借用爱因斯坦的那句名言来结尾:
"想象力比知识更重要,因为知识是有限的,而想象力是无限的,它囊括整个世界,推动着进步,是人类进化的源泉。"