作者:chenqin
https://zhuanlan.zhihu.com/p/620334140
OpenAI 研究人员曾发文称「约 80% 美国人的工作将被 AI 影响」。
文章的结论是
,至少80%的美国劳动力会受到影响,他们的工作的10%会被GPT所替代。其中甚至有19%的美国劳动力的50%工作会被替代
。
但需要注意的是,OpenAI的研究是对于美国职业来说的,中国的劳动力市场和美国有不少差异。
那中国的劳动力市场,有哪些职业的替代率最高,哪些职业的替代率最低呢?
因此最近两周,我们使用中国在过去8年的数亿条招聘数据完成了这个研究,看中国哪些职业最有可能被GPT之类的大语言模型和其衍生品替代。
分析不同职业被GPT替代的可能性,需要对每种职业的职能和具体工作进行分拆。
比如你笼统地问,“人力资源专员”这个职业,被GPT替代的可能性有多大呀?
这类问题就不好回答,因为太模糊了。
但是你可以根据招聘网站的情况,将“人力资源专员”给分拆成不同的职能,比如:
-
1、新员工的招聘,员工入职手续办理
-
2、安排以及开展新员工入职培训
-
3、考勤及工资绩效的核算
-
4、维护和拓展公司招聘渠道,协助社招及其他招聘活动
去问其中一个职能,例如“安排以及开展新员工入职培训”,人力资源专员工作的这一部分有多大可能被GPT替代,就直观了一些。
我们还可以继续分拆,把“安排以及开展新员工入职培训”,进一步分拆成下列具体工作内容——1,撰写、准备培训材料;2,交流、沟通并安排计划时间表;3,演讲、培训,提升员工技能……
再问其中每一个具体工作,
撰写准备培训材料,GPT可以替代多少?
交流和沟通安排时间表,GPT可以替代多少?
演讲培训,GPT可以替代多少?
我们用O*net的数据,将中国的职业映射到O*net,再分拆成
19265条工作任务和23534种工作内容
。
这么分拆下来,每一个职业拆分研究,再汇总,那么我们对每一个职业中有多少部分可以被GPT替代,就比较有把握了。
分析每一种具体的职能和工作内容被GPT替代的可能性。
但是,要分析19265种工作任务,23534种工作内容其中的每一种被GPT替代的可能性有多大,也是一个非常繁重的工作。一般来说我们会让人工来打标,这么四万条内容全部打标,大概一个人就需要1周,一个人力的成本就要至少1万元。这已经是最低的价格了。
但我们知道,在对美国研究的工作论文中,OpenAI的工作论文提出了一种重要的方法。那就是让GPT来打标。
那我们何不也用GPT来打标呢?
于是我们用了GPT的API,让GPT扮演打分者,大概是这样的prompt:
你是一名“大型语言模型替代劳动力评估师”。大型语言模型,是一种用于处理和生成自然语言文本的深度学习模型,最新的大型语言模型能够基于自然语言文本生成、描述创建图像与视频。在这样的背景下,你需要从“该任务是否能够在大语言模型帮助下,在同样时间达成同样产出或者同样效果的前提下,减少人类劳动时间的参与”的角度,给下列每一个任务打分。评分从0到5分,0代表该任务不能通过大语言模型的帮助减少人类劳动投入,1代表可以减少20%人类劳动投入,2代表可以减少40%的人类劳动投入,3代表可以减少60%的人类劳动投入,4代表可以减少80%的人类劳动投入,5代表可以减少100%的人类劳动投入,即该任务不再需要人类劳动参与。你的评分,代表着大语言模型可以在每一个任务中节省多少比例的劳动投入,请根据当前大语言模型的进步情况和你认为未来可能的发展状况,谨慎评分。请按照“id,评分”的格式,每一行返回一条任务的评分结果。
这段算是API里面system部分输入的内容,然后在内容部分输入具体的工作任务和工作内容,GPT就会刷刷返回了,一次可以输入100条,gpt-3.5-turbo的返回很快,一屏幕一屏幕的0-5的分数就这么回来了。
说实话,在看到这一屏屏的分数出来,知道这是GPT在为自己能多大程度上替代人类劳动打分,有种审判日到了的感觉。
由于任务已经被拆解得比较细致,对于每一条任务的打标将会十分准确,稳健性也极高。更重要的是,使用GPT打标,成本之低令人发指。标注4万条内容,每次标注100条,只需要400次,一次标注和返回大约在4000token左右,且主要内容是在prompt中,使用GPT-4的模型,每标注100条,仅需要0.12美元。也就是说,共标注4万条内容,只需要耗费48美元。如果使用不那么精确,但速度更快且更便宜的gpt-3.5-tubo模型,4万条只需要耗费3美元。在这样简单的任务上,GPT-4和gpt-3.5-turbo的表现几乎没有差异。
人类数据标注员要完成4万条内容的标注,需要至少1万元,一星期。
GPT只需要半小时,3美元,合20元人民币左右。
而两者的质量是几乎一样的。
因此,很难不再次强调一遍这样的事实——
刚刚出现没几年的全新职业——人类标注员,他们喂养出来的大型语言模型GPT,在完成一项“GPT能够替代哪些职业”的标注工作任务时,首先替代掉了把GPT训练成材的人类数据标注员自己。
将标注结果汇总到职业层面
使用下图的流程,我们将每一个具体工作被GPT替代的可能性汇总到每一个职业上。
就能得到中国所有职业被GPT替代的可能性了。下表是招聘规模比较大的职业被GPT替代可能性的前25名和后25名:
上表的这50个职业,可以理解为未来职业发展的晴雨表。
AI替代率最高的职业是翻译,其次是保险核保专业人员以及剧作家。这三个职业,有90%以上的工作任务和内容都暴露在AI替代的风险中。
接下来,视觉传达设计人员、装饰美工、美术编辑、广告设计师、剪辑师,这些与美术、视频、作图相关的职业,被AI替代的工作内容也超过了80%。
文字编辑、网络编辑、文学作家、文字记者,这些与文字生成和修改高度相关的职业,被替代的工作内容也超过了75%。
呼叫中心服务员、前厅服务员(即为宾客提供咨询、迎送、入住登记、结账等前厅服务的人员)、节目主持人、秘书……这些职业,也出现在了前25名中。
不过最出乎意料的可能还是排名第25的计算机程序设计员,平均来说,程序员有75%的工作内容,面临被AI替代的风险。
AI替代率最低的职业主要是各种制造业相关蓝领人员。这并不意外,因为我们让GPT评分标注时扮演的角色就是“大型语言模型替代劳动力评估师”,它自然无法评估可能被其他机器所替代的职业。但仍然有几个制造业工人以外的人员值得注意——绿化工、保洁员、洗衣师、按摩师、美甲师、中式面点师……看起来并不需要太高学历,工资也不算最高的这些职业,反而成了最难被AI替代的职业。
容易被替代的职业都有什么样的特征?
在OpenAI的那篇工作论文中,研究者发现了稳定的正相关关系——工资越高的职业,被GPT们替代的可能性越高。这个趋势在年收入大于10万美元的职业之后才区域相反,见下图。
但在我们的研究中,在中国,每个职业能够被GPT替代的程度和该职业的收入却并没有相关性,见下图:
但是,每个职业除了工资以外,还有一个重要的参数——成长性。
“成长性”是我们另外计算的一个数据,是使用分经验年度的招聘岗位数据,计算跨年度的经验-工资差异得出的。
举个例子,A岗位,在2018年时,市场上对0年经验需求的招聘岗位平均工资为5000元。2019年时,市场上对1年经验需求的A岗位招聘平均工资为6000元。
不难发现,2018年0年经验的这批人,和2019年时有1年经验的这批人来自同一个队列。因此,6000÷5000=120%,就是同一个队列的人口,从2018到2019年,0到1年经验带来的工资增长倍数。
我们算出所有年份,包括2015到2016、2016到2017……2020到2021、2021到2022这样7个0到1年的经验带来的工资增长倍数,再按照招聘人数加权求平均,就得到了A岗位在过去8年时的0到1年经验带来的工资增长倍数。
用同样的方法,我们再一次算出1到2年的工资增长倍数、2到3年的工资增长倍数……8到9年的工资增长倍数。将每一年的工资增长倍数连乘,就得到了这个岗位从0年经验到9年经验一共10年工作的工资增长倍数,将这个倍数再开九次方,就得到了这个职业的“成长性”,即每增加一年工作年限,工资可能上升多少。
那么,从业年限的工资增长率,即这个工作的“成长性”,和每个职业的AI替代率之间存在什么关系?
可以看到,各职业的AI替代率,和每个职业的年限工资增长率有着非常显著的关系,两者之间存在正相关的显著性水平在
0.001
以下。如果我们将上图改为分段柱状图,我们将可以看到更明显的趋势。
从上图可以看到,每增加一年从业年限工资增长最慢,低于8%的职业,相对最不容易被AI替代的。但如果一个职业每工作一年工资增长超过20%,被AI替代的可能性平均将大于60%。
这个趋势,说明的是在本轮大语言模型和其衍生出来的相关AI的一个显著特征,那就是人们
在一个行业上积累的经验、学到的技巧、掌握的诀窍,是被大语言模型首先替代掉的东西
。
被GPT们替代掉的,究竟是什么?
“成长性”越高的工作,越容易被替代,这说明什么呢?
第一种可能,是因为那些学习、工作后能积累更多经验,提高更快生产率的职业,本身更贵,因此更促使人们去找到能替代这些职业的AI,给这样的AI产品更大的投资,因此这样更贵的劳动力就成了第一批牺牲品。
这样的说法初看有道理,但我们也能找到很多反例。最大的反例就是自动驾驶。一方面,驾驶这个技能,人们学习几个小时至多十几个小时就能掌握;另一方面,自动驾驶领域投资在人工智能行业内数一数二,但目前的效果距离全路况自动驾驶依然有很长一段距离。
反过来,一些生物、化学方面的技能,化合物寻找、蛋白质折叠,或者是在实验流程上的全自动化,这些人们需要数年专业训练才能掌握的知识,尽管资本的介入比起自动驾驶只能算九牛一毛,却已经有了非常不错的替代AI。
从这点看,因为某职业劳动更贵——为了节省这些劳动力而更多投资AI——更容易造出替代这些职业的AI,这样的逻辑似乎是行不通的。
因此,我们不得不考虑第二种可能——AI确实已经实现甚至超越了人类通过后天的实践学习知识、积累经验和诀窍的技能。
是的,有必要再强调一遍,不是单个技能,也不是一组技能,而是那种
通过艰苦的学习实践来获取知识、积累经验的技能,人类已经落后于AI
。那些高成长性的职业,不管现在是否还处在安全区,出现替代AI,也许就是这几年,甚至几个月之内的事。
到头来,那些人类孩提时期甚至出生时就已经掌握的技能,那些精巧的人类生物学本能,似乎反而是AI最难模仿和替代的部分。
而那些后天学习到的知识,花上好长时间学会算术、学会写作,学会画画,学会编程、学会做好看的ppt、学会看X光片、学会写法律文书,学会很多种语言并且自如地交流……人类学会了各种各样以此为傲的东西,并觉得这些特征似乎使人类和其他生物产生了哲学上的差异。
但在AI看来,这些东西一文不值。
推荐阅读:
世界的真实格局分析,地球人类社会底层运行原理
不是你需要中台,而是一名合格的架构师(附各大厂中台建设PPT)
企业IT技术架构规划方案
论数字化转型——转什么,如何转?
华为干部与人才发展手册(附PPT)
企业10大管理流程图,数字化转型从业者必备!
【中台实践】华为大数据中台架构分享.pdf
华为的数字化转型方法论
华为如何实施数字化转型(附PPT)
超详细280页Docker实战文档!开放下载
华为大数据解决方案(PPT)