中国最容易和最难被 GPT 所代替，ToP25 职业！

作者：chenqin | 编辑：Jack Cui

因此最近两周，我们使用中国在过去 8 年的数亿条招聘数据完成了这个研究，看中国哪些职业最有可能被 GPT 之类的大语言模型和其衍生品替代。

分析不同职业被 GPT 替代的可能性，需要对每种职业的职能和具体工作进行分拆。

比如你笼统地问，“人力资源专员” 这个职业，被 GPT 替代的可能性有多大呀？

这类问题就不好回答，因为太模糊了。

但是你可以根据招聘网站的情况，将 “人力资源专员” 给分拆成不同的职能，比如：

1、新员工的招聘，员工入职手续办理
2、安排以及开展新员工入职培训
3、考勤及工资绩效的核算
4、维护和拓展公司招聘渠道，协助社招及其他招聘活动

去问其中一个职能，例如 “安排以及开展新员工入职培训”，人力资源专员工作的这一部分有多大可能被 GPT 替代，就直观了一些。

我们还可以继续分拆，把 “安排以及开展新员工入职培训”，进一步分拆成下列具体工作内容 ——1，撰写、准备培训材料；2，交流、沟通并安排计划时间表；3，演讲、培训，提升员工技能……

再问其中每一个具体工作，

撰写准备培训材料，GPT 可以替代多少？

交流和沟通安排时间表，GPT 可以替代多少？

演讲培训，GPT 可以替代多少？

我们用 O*net 的数据，将中国的职业映射到 O*net，再分拆成 19265 条工作任务和 23534 种工作内容。

这么分拆下来，每一个职业拆分研究，再汇总，那么我们对每一个职业中有多少部分可以被 GPT 替代，就比较有把握了。

分析每一种具体的职能和工作内容被 GPT 替代的可能性。

但是，要分析 19265 种工作任务，23534 种工作内容其中的每一种被 GPT 替代的可能性有多大，也是一个非常繁重的工作。一般来说我们会让人工来打标，这么四万条内容全部打标，大概一个人就需要 1 周，一个人力的成本就要至少 1 万元。这已经是最低的价格了。

但我们知道，在对美国研究的工作论文中，OpenAI 的工作论文提出了一种重要的方法。那就是让 GPT 来打标。

那我们何不也用 GPT 来打标呢？

于是我们用了 GPT 的 API，让 GPT 扮演打分者，大概是这样的 prompt：

你是一名 “大型语言模型替代劳动力评估师”。大型语言模型，是一种用于处理和生成自然语言文本的深度学习模型，最新的大型语言模型能够基于自然语言文本生成、描述创建图像与视频。在这样的背景下，你需要从 “该任务是否能够在大语言模型帮助下，在同样时间达成同样产出或者同样效果的前提下，减少人类劳动时间的参与” 的角度，给下列每一个任务打分。评分从 0 到 5 分，0 代表该任务不能通过大语言模型的帮助减少人类劳动投入，1 代表可以减少 20% 人类劳动投入，2 代表可以减少 40% 的人类劳动投入，3 代表可以减少 60% 的人类劳动投入，4 代表可以减少 80% 的人类劳动投入，5 代表可以减少 100% 的人类劳动投入，即该任务不再需要人类劳动参与。你的评分，代表着大语言模型可以在每一个任务中节省多少比例的劳动投入，请根据当前大语言模型的进步情况和你认为未来可能的发展状况，谨慎评分。请按照 “id, 评分” 的格式，每一行返回一条任务的评分结果。

这段算是 API 里面 system 部分输入的内容，然后在内容部分输入具体的工作任务和工作内容，GPT 就会刷刷返回了，一次可以输入 100 条，gpt-3.5-turbo 的返回很快，一屏幕一屏幕的 0-5 的分数就这么回来了。

说实话，在看到这一屏屏的分数出来，知道这是 GPT 在为自己能多大程度上替代人类劳动打分，有种审判日到了的感觉。

由于任务已经被拆解得比较细致，对于每一条任务的打标将会十分准确，稳健性也极高。更重要的是，使用 GPT 打标，成本之低令人发指。标注 4 万条内容，每次标注 100 条，只需要 400 次，一次标注和返回大约在 4000token 左右，且主要内容是在 prompt 中，使用 GPT-4 的模型，每标注 100 条，仅需要 0.12 美元。也就是说，共标注 4 万条内容，只需要耗费 48 美元。如果使用不那么精确，但速度更快且更便宜的 gpt-3.5-tubo 模型，4 万条只需要耗费 3 美元。在这样简单的任务上，GPT-4 和 gpt-3.5-turbo 的表现几乎没有差异。

人类数据标注员要完成 4 万条内容的标注，需要至少 1 万元，一星期。

GPT 只需要半小时，3 美元，合 20 元人民币左右。

而两者的质量是几乎一样的。

因此，很难不再次强调一遍这样的事实 ——

刚刚出现没几年的全新职业 —— 人类标注员，他们喂养出来的大型语言模型 GPT，在完成一项 “GPT 能够替代哪些职业” 的标注工作任务时，首先替代掉了把 GPT 训练成材的人类数据标注员自己。

将标注结果汇总到职业层面

使用下图的流程，我们将每一个具体工作被 GPT 替代的可能性汇总到每一个职业上。

就能得到中国所有职业被 GPT 替代的可能性了。下表是招聘规模比较大的职业被 GPT 替代可能性的前 25 名和后 25 名：

上表的这 50 个职业，可以理解为未来职业发展的晴雨表。

AI 替代率最高的职业是翻译，其次是保险核保专业人员以及剧作家。这三个职业，有 90% 以上的工作任务和内容都暴露在 AI 替代的风险中。

接下来，视觉传达设计人员、装饰美工、美术编辑、广告设计师、剪辑师，这些与美术、视频、作图相关的职业，被 AI 替代的工作内容也超过了 80%。

文字编辑、网络编辑、文学作家、文字记者，这些与文字生成和修改高度相关的职业，被替代的工作内容也超过了 75%。

呼叫中心服务员、前厅服务员（即为宾客提供咨询、迎送、入住登记、结账等前厅服务的人员）、节目主持人、秘书…… 这些职业，也出现在了前 25 名中。

不过最出乎意料的可能还是排名第 25 的计算机程序设计员，平均来说，程序员有 75% 的工作内容，面临被 AI 替代的风险。

AI 替代率最低的职业主要是各种制造业相关蓝领人员。这并不意外，因为我们让 GPT 评分标注时扮演的角色就是 “大型语言模型替代劳动力评估师”，它自然无法评估可能被其他机器所替代的职业。但仍然有几个制造业工人以外的人员值得注意 —— 绿化工、保洁员、洗衣师、按摩师、美甲师、中式面点师…… 看起来并不需要太高学历，工资也不算最高的这些职业，反而成了最难被 AI 替代的职业。

容易被替代的职业都有什么样的特征？

在 OpenAI 的那篇工作论文中，研究者发现了稳定的正相关关系 —— 工资越高的职业，被 GPT 们替代的可能性越高。这个趋势在年收入大于 10 万美元的职业之后才区域相反，见下图。

但在我们的研究中，在中国，每个职业能够被 GPT 替代的程度和该职业的收入却并没有相关性，见下图：

但是，每个职业除了工资以外，还有一个重要的参数 —— 成长性。

“成长性” 是我们另外计算的一个数据，是使用分经验年度的招聘岗位数据，计算跨年度的经验 - 工资差异得出的。

举个例子，A 岗位，在 2018 年时，市场上对 0 年经验需求的招聘岗位平均工资为 5000 元。2019 年时，市场上对 1 年经验需求的 A 岗位招聘平均工资为 6000 元。

不难发现，2018 年 0 年经验的这批人，和 2019 年时有 1 年经验的这批人来自同一个队列。因此，6000÷5000=120%，就是同一个队列的人口，从 2018 到 2019 年，0 到 1 年经验带来的工资增长倍数。

我们算出所有年份，包括 2015 到 2016、2016 到 2017……2020 到 2021、2021 到 2022 这样 7 个 0 到 1 年的经验带来的工资增长倍数，再按照招聘人数加权求平均，就得到了 A 岗位在过去 8 年时的 0 到 1 年经验带来的工资增长倍数。

用同样的方法，我们再一次算出 1 到 2 年的工资增长倍数、2 到 3 年的工资增长倍数……8 到 9 年的工资增长倍数。将每一年的工资增长倍数连乘，就得到了这个岗位从 0 年经验到 9 年经验一共 10 年工作的工资增长倍数，将这个倍数再开九次方，就得到了这个职业的 “成长性”，即每增加一年工作年限，工资可能上升多少。

那么，从业年限的工资增长率，即这个工作的 “成长性”，和每个职业的 AI 替代率之间存在什么关系？