聚焦大数据时代 企业如何最大化数据要素价值? -前沿人工智能网

过去几十年,数据的总量完成了史无前例的增长。根据国际数据公司IDC预测,全球数据总量预计2020年达到44ZB(1ZB="1"万亿GB),中国数据量将达到8060EB,占全球数据总量的18%。中国已经正式进入了一个“数据密集型”的时代,越来越多的数据资源在大量的领域变得可用。

而随着疫情的影响和全球经济面临的衰退,以数字经济为代表的新经济在今年成为了中国经济高质量发展的新动力。在疫情期间,远程协同办公、在线教育、在线招聘等众多线上应用迅速普及,并逐渐渗透到了人们生产和生活方式之中,不可避免地加大了企业各个方面对于数据处理的需求。同样,由人工智能等新兴技术发展带来的技术变革,也让企业对数据的处理的能力不断升级。

这些外界因素无疑是一剂“强心针”,加重了传统产业及企业推进数字化转型的迫切程度。随着“加强新型基础设施建设”和“加快培育数据要素市场”成为被相关政策及社会各界频繁提到的关键热词,如何通过打造世界一流的数据科学团队,促使企业更好地挖掘数据要素的价值,加速实现数字化转型已成为业界探索的焦点。不可否认,在新形势下各行各业对数据人才的技能需求、数据科学团队所承担的职能,以及需要应对的风险挑战都提出了全新的要求。

数据团队人才多元化、技能需求专业化

“数据科学家”真正成为一个职业还是比较近期的事,于2008年由时任LinkedIn数据产品团队负责人的DJ Patil,和在Facebook任职的Jeff Hammerbacher第一次成立数据科学团队,数据科学家才真正地作为职业开始起步,逐渐成为“21世纪最性感的职业”。在早期的时候,在数据领域工作的人都是“万能手”,身兼多个任务,除了数据分析外,还包括建立基础设施、研发数据储存方式、编写算法等等。但随着数据量越来越大,需要处理的数据越来越多,数据科学在很多公司已经成为了不可或缺的团队。据领英《2020年新兴工作报告》显示,过去5年招聘需求增速最快的职业中,数据科学家位列第三。

LinkedIn(领英)全球数据科学负责人许亚表示,“近两年来,领英的数据科学团队已经扩张了一倍,从150人增加到了300多人。随着人数的扩张和需求的复杂性,数据科学团队的人才构成更加走向多元化,对于不同领域人才技能的需求也趋于‘工程化’和‘专业化’。”

例如在领英的数据科学团队,人才会主要涉及三个不同的领域并发挥专业技能:专注于构建数据管道、数据流等基础设施的工程专家;负责进行A/B 测试、预测、打造差分隐私等算法模型的算法专家;以及有很强的业务属性,将数据见解和公司战略结合起来的业务专家。这三个专业领域的人才拥有不同的发展方向,但都在团队里都拥有举足轻重的地位。在中国,领英同样有一支精良的数据科学团队,作为中国市场的专家,借助全球的数据资源和工具,帮助领英中国更好地服务本地市场。

数据团队参与更多决策过程,在企业内部最大化数据价值

许亚认为,数据驱动的企业文化已经得到广泛的重视,在企业内部越来越多的决策过程开始引入数据分析的重要角色。如何在企业内部最大化数据的价值,也因此成为数据科学团队的使命和重要职责。以领英为例,数据科学团队将数据的价值注入到了公司的方方面面:

首先,秉承“用户第一”的价值原则,每一个产品细节都由数据充分证实。数据团队跟产品团队始终进行紧密的“嵌入式”合作,用数据来推动产品的每个细节的优化,吸引新的用户,提升用户体验。根据许亚介绍,领英的每一个产品功能的设计和改进都会严格地进行A/B 测试。不管是看得到或看不到的地方,比如搜索栏、搜索算法、导航栏,甚至是整个APP的字号和字体,领英都是用实验去衡量,用数据来决定产品的走向,以便提供最好的用户体验。

除了产品,领英还会用数据科学去优化公司基础设施的运行和维护。比如领英每年投资数百万在数据储存空间等硬件设施上面,怎样充分利用这些硬件设施是一个复杂且意义深远的问题。领英的数据科学团队会通过数据分析和算法去衡量工程架构的建设是否有效率,更好地做时间规划,让硬件和GPU发挥更大的价值,有助于提升公司整体的效率。

第三,通过数据帮助企业明确战略方向,比如在哪个方面去投资,或者决定下一步的产品或者市场意向。由于不同的数据科学家会有不同的侧重方向,比如产品、市场,或者工程,因此衡量他们的工作成果的重要标准就是决策覆盖率和直接商业影响,看他们如何赋能企业的商业决策和成果,对净利润造成影响,这样也能够更好地定位数据团队在公司的位置,推动问题解决的流程。

第四,以数字化的方式来展现全球经济,帮助劳动力市场中的每个人连接机会。领英“经济图谱”基于全球6.9亿用户、5000万家企业以及3.6万个技能,并运用数据科学把这些数据转化为有价值的洞察,实时展现全球劳动力市场的变化趋势,赋能政府机构和组织,帮助他们更好地制定相应的人才发展计划。

应对全新的挑战:保证公平和用户隐私安全

当数据科学团队通过技术手段和基础设施从数据中挖掘出更多的价值,与此同时也必须面对随之而来的全新挑战与风险。

一是公平性。公平很难有一个准确的定义,但领英的愿景是为全球劳动市场里的每一位创造经济机会,希望有着同样才能的两个人应该获得相等的机会。为了实现这一点,领英在开发产品和功能的时候会确保产品对于每个人都是平等的,为所有求职者打造公平的环境,使招聘人员使用产品去做人才搜索、或者求职者找工作的时候,避免产生无意识偏见。

许亚认为,“促进公平的重点不仅仅在于算法,而在于产品设计的方方面面。”为此领英开展了一个称为“Project Every Member”的项目,这个项目能让数据科学家们借助A/B 测试和算法来准确地评估和优化每一个新产品,从而缩小人脉差距,确保每个人都能够获得公平地去发现和连接机会。领英也在近期开源了Project Every Member里有关Apache Spark的一段代码,从而帮助更多公司准确地衡量产品带来的影响,打造更加富有公平性的产品。

二是数据隐私安全。过去十年有大量的研究表明,很多公司在发布数据的时候,都对数据进行了模糊处理,但实际上这样远远不足以抵御一些针对公司数据的攻击,用户的个人信息依然被泄露了出来。

面临这样的问题,企业首先要做到为用户的数据隐私保驾护航,获得用户的信任,才能更好地实现愿景和使命。许亚介绍,领英在隐私保护技术上做了很大的投资,通过被认为是数据隐私保护的黄金法则——差分隐私,从而确保用户能够安全、自由地使用平台,不管是内部员工调用数据,还是企业向外部分享数据的时候,都可以避免个人的数据隐私被泄露。

毋庸置疑,目前全球经济复苏充满了极大的不确定性,带来的影响正在重塑全球格局,引发新一轮的数字化变革,为中国经济发展带来的前所未有的发展机遇。许亚表示,领英的愿景是为全球劳动力市场中的每一位创造经济机会,面对行业发展和劳动力市场的一系列新常态,领英将充分发挥数据的优势,提供更精准的数据洞察和产品服务,帮助更多企业和个人在数字经济、新基建引领的全新科技革命中,与更加高质量的经济发展机会相连接。(王新)

发表评论

电子邮件地址不会被公开。 必填项已用*标注