2023年5月22日星期一

中国最容易和最难被 GPT 所代替,ToP25 职业!

文/chenqin
编辑/Jack Cui

因此最近两周,我们使用中国在过去 8 年的数亿条招聘数据完成了这个研究,看中国哪些职业最有可能被 GPT 之类的大语言模型和其衍生品替代。

分析不同职业被 GPT 替代的可能性,需要对每种职业的职能和具体工作进行分拆。

比如你笼统地问,“人力资源专员” 这个职业,被 GPT 替代的可能性有多大呀?

这类问题就不好回答,因为太模糊了。

但是你可以根据招聘网站的情况,将 “人力资源专员” 给分拆成不同的职能,比如:

    1、新员工的招聘,员工入职手续办理
    2、安排以及开展新员工入职培训
    3、考勤及工资绩效的核算
    4、维护和拓展公司招聘渠道,协助社招及其他招聘活动

去问其中一个职能,例如 “安排以及开展新员工入职培训”,人力资源专员工作的这一部分有多大可能被 GPT 替代,就直观了一些。

我们还可以继续分拆,把 “安排以及开展新员工入职培训”,进一步分拆成下列具体工作内容 ——1,撰写、准备培训材料;2,交流、沟通并安排计划时间表;3,演讲、培训,提升员工技能……

再问其中每一个具体工作,

撰写准备培训材料,GPT 可以替代多少?

交流和沟通安排时间表,GPT 可以替代多少?

演讲培训,GPT 可以替代多少?

我们用 O*net 的数据,将中国的职业映射到 O*net,再分拆成 19265 条工作任务和 23534 种工作内容。

这么分拆下来,每一个职业拆分研究,再汇总,那么我们对每一个职业中有多少部分可以被 GPT 替代,就比较有把握了。

分析每一种具体的职能和工作内容被 GPT 替代的可能性。

但是,要分析 19265 种工作任务,23534 种工作内容其中的每一种被 GPT 替代的可能性有多大,也是一个非常繁重的工作。一般来说我们会让人工来打标,这么四万条内容全部打标,大概一个人就需要 1 周,一个人力的成本就要至少 1 万元。这已经是最低的价格了。

但我们知道,在对美国研究的工作论文中,OpenAI 的工作论文提出了一种重要的方法。那就是让 GPT 来打标。

那我们何不也用 GPT 来打标呢?

于是我们用了 GPT 的 API,让 GPT 扮演打分者,大概是这样的 prompt:

    你是一名 “大型语言模型替代劳动力评估师”。大型语言模型,是一种用于处理和生成自然语言文本的深度学习模型,最新的大型语言模型能够基于自然语言文本生成、描述创建图像与视频。在这样的背景下,你需要从 “该任务是否能够在大语言模型帮助下,在同样时间达成同样产出或者同样效果的前提下,减少人类劳动时间的参与” 的角度,给下列每一个任务打分。评分从 0 到 5 分,0 代表该任务不能通过大语言模型的帮助减少人类劳动投入,1 代表可以减少 20% 人类劳动投入,2 代表可以减少 40% 的人类劳动投入,3 代表可以减少 60% 的人类劳动投入,4 代表可以减少 80% 的人类劳动投入,5 代表可以减少 100% 的人类劳动投入,即该任务不再需要人类劳动参与。你的评分,代表着大语言模型可以在每一个任务中节省多少比例的劳动投入,请根据当前大语言模型的进步情况和你认为未来可能的发展状况,谨慎评分。请按照 “id, 评分” 的格式,每一行返回一条任务的评分结果。

这段算是 API 里面 system 部分输入的内容,然后在内容部分输入具体的工作任务和工作内容,GPT 就会刷刷返回了,一次可以输入 100 条,gpt-3.5-turbo 的返回很快,一屏幕一屏幕的 0-5 的分数就这么回来了。

说实话,在看到这一屏屏的分数出来,知道这是 GPT 在为自己能多大程度上替代人类劳动打分,有种审判日到了的感觉。

由于任务已经被拆解得比较细致,对于每一条任务的打标将会十分准确,稳健性也极高。更重要的是,使用 GPT 打标,成本之低令人发指。标注 4 万条内容,每次标注 100 条,只需要 400 次,一次标注和返回大约在 4000token 左右,且主要内容是在 prompt 中,使用 GPT-4 的模型,每标注 100 条,仅需要 0.12 美元。也就是说,共标注 4 万条内容,只需要耗费 48 美元。如果使用不那么精确,但速度更快且更便宜的 gpt-3.5-tubo 模型,4 万条只需要耗费 3 美元。在这样简单的任务上,GPT-4 和 gpt-3.5-turbo 的表现几乎没有差异。

人类数据标注员要完成 4 万条内容的标注,需要至少 1 万元,一星期。

GPT 只需要半小时,3 美元,合 20 元人民币左右。

而两者的质量是几乎一样的。

因此,很难不再次强调一遍这样的事实 ——

刚刚出现没几年的全新职业 —— 人类标注员,他们喂养出来的大型语言模型 GPT,在完成一项 “GPT 能够替代哪些职业” 的标注工作任务时,首先替代掉了把 GPT 训练成材的人类数据标注员自己。

将标注结果汇总到职业层面

使用下图的流程,我们将每一个具体工作被 GPT 替代的可能性汇总到每一个职业上。

就能得到中国所有职业被 GPT 替代的可能性了。下表是招聘规模比较大的职业被 GPT 替代可能性的前 25 名和后 25 名:

上表的这 50 个职业,可以理解为未来职业发展的晴雨表。

AI 替代率最高的职业是翻译,其次是保险核保专业人员以及剧作家。这三个职业,有 90% 以上的工作任务和内容都暴露在 AI 替代的风险中。

接下来,视觉传达设计人员、装饰美工、美术编辑、广告设计师、剪辑师,这些与美术、视频、作图相关的职业,被 AI 替代的工作内容也超过了 80%。

文字编辑、网络编辑、文学作家、文字记者,这些与文字生成和修改高度相关的职业,被替代的工作内容也超过了 75%。

呼叫中心服务员、前厅服务员(即为宾客提供咨询、迎送、入住登记、结账等前厅服务的人员)、节目主持人、秘书…… 这些职业,也出现在了前 25 名中。

不过最出乎意料的可能还是排名第 25 的计算机程序设计员,平均来说,程序员有 75% 的工作内容,面临被 AI 替代的风险。

AI 替代率最低的职业主要是各种制造业相关蓝领人员。这并不意外,因为我们让 GPT 评分标注时扮演的角色就是 “大型语言模型替代劳动力评估师”,它自然无法评估可能被其他机器所替代的职业。但仍然有几个制造业工人以外的人员值得注意 —— 绿化工、保洁员、洗衣师、按摩师、美甲师、中式面点师…… 看起来并不需要太高学历,工资也不算最高的这些职业,反而成了最难被 AI 替代的职业。

容易被替代的职业都有什么样的特征?

在 OpenAI 的那篇工作论文中,研究者发现了稳定的正相关关系 —— 工资越高的职业,被 GPT 们替代的可能性越高。这个趋势在年收入大于 10 万美元的职业之后才区域相反,见下图。

但在我们的研究中,在中国,每个职业能够被 GPT 替代的程度和该职业的收入却并没有相关性,见下图:

但是,每个职业除了工资以外,还有一个重要的参数 —— 成长性。

“成长性” 是我们另外计算的一个数据,是使用分经验年度的招聘岗位数据,计算跨年度的经验 - 工资差异得出的。

举个例子,A 岗位,在 2018 年时,市场上对 0 年经验需求的招聘岗位平均工资为 5000 元。2019 年时,市场上对 1 年经验需求的 A 岗位招聘平均工资为 6000 元。

不难发现,2018 年 0 年经验的这批人,和 2019 年时有 1 年经验的这批人来自同一个队列。因此,6000÷5000=120%,就是同一个队列的人口,从 2018 到 2019 年,0 到 1 年经验带来的工资增长倍数。

我们算出所有年份,包括 2015 到 2016、2016 到 2017……2020 到 2021、2021 到 2022 这样 7 个 0 到 1 年的经验带来的工资增长倍数,再按照招聘人数加权求平均,就得到了 A 岗位在过去 8 年时的 0 到 1 年经验带来的工资增长倍数。

用同样的方法,我们再一次算出 1 到 2 年的工资增长倍数、2 到 3 年的工资增长倍数……8 到 9 年的工资增长倍数。将每一年的工资增长倍数连乘,就得到了这个岗位从 0 年经验到 9 年经验一共 10 年工作的工资增长倍数,将这个倍数再开九次方,就得到了这个职业的 “成长性”,即每增加一年工作年限,工资可能上升多少。

那么,从业年限的工资增长率,即这个工作的 “成长性”,和每个职业的 AI 替代率之间存在什么关系?

可以看到,各职业的 AI 替代率,和每个职业的年限工资增长率有着非常显著的关系,两者之间存在正相关的显著性水平在 0.001 以下。如果我们将上图改为分段柱状图,我们将可以看到更明显的趋势。

从上图可以看到,每增加一年从业年限工资增长最慢,低于 8% 的职业,相对最不容易被 AI 替代的。但如果一个职业每工作一年工资增长超过 20%,被 AI 替代的可能性平均将大于 60%。

这个趋势,说明的是在本轮大语言模型和其衍生出来的相关 AI 的一个显著特征,那就是人们在一个行业上积累的经验、学到的技巧、掌握的诀窍,是被大语言模型首先替代掉的东西。

被 GPT 们替代掉的,究竟是什么?

“成长性” 越高的工作,越容易被替代,这说明什么呢?

第一种可能,是因为那些学习、工作后能积累更多经验,提高更快生产率的职业,本身更贵,因此更促使人们去找到能替代这些职业的 AI,给这样的 AI 产品更大的投资,因此这样更贵的劳动力就成了第一批牺牲品。

这样的说法初看有道理,但我们也能找到很多反例。最大的反例就是自动驾驶。一方面,驾驶这个技能,人们学习几个小时至多十几个小时就能掌握;另一方面,自动驾驶领域投资在人工智能行业内数一数二,但目前的效果距离全路况自动驾驶依然有很长一段距离。

反过来,一些生物、化学方面的技能,化合物寻找、蛋白质折叠,或者是在实验流程上的全自动化,这些人们需要数年专业训练才能掌握的知识,尽管资本的介入比起自动驾驶只能算九牛一毛,却已经有了非常不错的替代 AI。

从这点看,因为某职业劳动更贵 —— 为了节省这些劳动力而更多投资 AI—— 更容易造出替代这些职业的 AI,这样的逻辑似乎是行不通的。

因此,我们不得不考虑第二种可能 ——AI 确实已经实现甚至超越了人类通过后天的实践学习知识、积累经验和诀窍的技能。

是的,有必要再强调一遍,不是单个技能,也不是一组技能,而是那种通过艰苦的学习实践来获取知识、积累经验的技能,人类已经落后于 AI。那些高成长性的职业,不管现在是否还处在安全区,出现替代 AI,也许就是这几年,甚至几个月之内的事。

到头来,那些人类孩提时期甚至出生时就已经掌握的技能,那些精巧的人类生物学本能,似乎反而是 AI 最难模仿和替代的部分。

而那些后天学习到的知识,花上好长时间学会算术、学会写作,学会画画,学会编程、学会做好看的 ppt、学会看 X 光片、学会写法律文书,学会很多种语言并且自如地交流…… 人类学会了各种各样以此为傲的东西,并觉得这些特征似乎使人类和其他生物产生了哲学上的差异。

但在 AI 看来,这些东西一文不值。

没有评论:

发表评论