AI外包正转向欧美地区，寻找各类专业人才训练大模型-通信界-中国通信门户

通信界讯 在过去的一年里，Scale AI的重点已转向美国和欧洲。他们正积极招募白领和语言专家，为日益兴起的大语言模型提供训练数据。这一转变无疑加剧了人们对未来职业的担忧，这些白领和语言专家正在训练将来可能取代他们职业的人工智能竞争对手。
2月21日消息，随着传统职业人员如语言专家、创意作家和核物理学家等逐渐成为“数据标注工”，他们的职业前景正变得岌岌可危，最终可能被他们所培训的人工智能系统所取代。

以下是翻译内容：

杰伊（Jay）高中时爱上了数学，他的物理老师向他展示了复杂微积分的乐趣。大学时期，杰伊专攻物理和数学，梦想有朝一日能将自己的知识传授给下一代。这个机会出现在2022年10月，当时25岁的杰伊加入了一个在线平台，以数学专家的身份为方程式打分。但他的工作不同于传统教师，他的工作重心将聚焦于训练一个人工智能系统，而这恰恰可能使他的专业知识变得不再那么重要。

为了保护自己的隐私，杰伊选择了使用化名。他透露，他当时帮助培训的系统由OpenAI开发，他的工作是为该公司的大语言模型（LLM）提供专家指导。这一机器学习系统具备聊天机器人的会话能力，并试图提升其在数学领域的解题能力。在葡萄牙的家中，杰伊负责评估人工智能模型在解决数学问题时的步骤是否正确，通过添加点赞或不满的表情符号来提供反馈，甚至在必要时解释模型出错的原因。

杰伊知道，他是在为萨姆·奥特曼（Sam Altman）领导的OpenAI训练算法，因为他被邀请加入OpenAI的Slack工作频道。在与《连线》分享的截图显示，杰伊是名为“数学培训师”的小组成员，该小组是由OpenAI研究员尤里·布尔达（Yuri Burda）建立的。但杰伊并非直接为OpenAI工作，他的雇主是全球最大的数据劳动平台之一Remotasks。这家公司是美国初创公司Scale AI的子公司，2021年的估值已超70亿美元，其客户涵盖了OpenAI、Meta、微软和美国陆军等。

Scale AI与客户密切合作，提供和管理他们需要的训练数据，以建立自动驾驶汽车或大语言模型背后的人工智能模型。通常情况下，这些宝贵的数据往往来源于与Scale AI紧密合作的Remotasks签约员工。自2017年成立以来，这家数据巨头已与全球数十万名员工建立合作关系，尤其是在劳动力成本相对较低的国家，如菲律宾。Remotasks表示，菲律宾员工主要致力于自动驾驶汽车的计算机视觉训练，帮助车辆精准识别周围环境。

然而，在过去的一年里，Scale AI的重点已转向美国和欧洲。他们正积极招募白领和语言专家，为日益兴起的大语言模型提供训练数据。这一转变无疑加剧了人们对未来职业的担忧，这些白领和语言专家正在训练将来可能取代他们职业的人工智能竞争对手。

杰伊对自己在未来工作中充当的角色进行了深入反思。他承认自己在传递知识给人工智能，但他坚信，人工智能模型难以复制人类在解决复杂数学问题时的独特能力。他期望自己参与的工作能够创造出与他水平相当的聊天机器人，共同探索数学的奥秘，而非取代他的人工智能。他说：“当我开始训练这些模型时，这正是我所期待的。”

面对人工智能系统的崛起，Scale AI负责数据运营的副总裁威洛·普里马克（Willow Primack）强调，随着AI系统开始生成知识和内容，Remotasks等公司正寻求不同领域的专家帮助，以确保人工智能应用的准确性和可靠性。随着生成式人工智能在科技行业的广泛应用，数据提供商急需一批能够进行“专家事实核查”的新承包商。

杰伊的时薪高达60美元，他在OpenAI推出ChatGPT之前的一个月加入了Remotasks。自那时起，该公司加速招聘专业“数据标注工”。据《连线》杂志报道，2024年1月，Remotasks发布了招聘广告，寻找能够掌握20多种欧洲语言的人才，以及美国的创意作家、体育记者、化学专家和核物理学家。

普里马克说：“如果让生成性人工智能完全依赖自身，它们可能会产生幻觉。即便它们提供的答案是事实，也有办法改进，使其更加全面。专家的参与至关重要，他们提供的数据能够真正提升人工智能的能力。”

普里马克表示，尽管Scale AI在菲律宾拥有庞大的运营规模，但该公司正逐步将重心转向美国和以英语为母语的欧洲地区，寻求更多专业承包商的加入。普里马克不太愿意透露到底是什么促使了这种转变，是特定的Scale AI客户要求更多的专家数据，还是该公司试图预测下一代AI需要什么？她称两者兼而有之，并解释说，专业承包商正为众多客户培训数据，而不仅仅是为单一客户服务。

对于这一转变的影响，行业研究人员给出了自己的解释。德国魏森鲍姆研究所的数据、算法系统和伦理研究小组负责人米拉格罗斯·米塞利（Milagros Miceli）指出，过去大多数人工智能技术都是在大型、多样化的数据集上进行训练的。然而，随着版权问题的日益突出，许多知名出版商开始禁止数据收集，这使得数据收集变得更加困难。因此，付钱给专业承包商成为了一种可行的解决方案。

“去年，很多公司都在创建新的数据，以避免版权投诉。”米塞利解释道，“如果你雇佣一名作家专门为训练你的模型而写故事，并支付他们薪水，那么你就拥有了这些文本的所有权，也就解决了版权问题。”

自ChatGPT等生成式人工智能技术亮相以来，越来越多的研究预测，在美国和欧洲，那些通常由受过大学教育的人占据的职业将面临颠覆性的变革，而这些人以前通常被认为不会受到技术变革的影响。尽管存在这些担忧，但专业承包商提供的高薪工作仍然极具吸引力，可能让一些人难以放弃可能导致他们失业的培训工作。

目前，专业职位的薪酬因专业知识而异。根据最新的招聘信息，传染病专家在远程培训任务上的时薪最高可达40美元，而历史学家的时薪为32美元。然而，受雇于特定语言训练算法的人往往得到的报酬更少。例如，一份招聘保加利亚作家的广告给出的时薪为5.64美元，而会说芬兰语的专家的时薪几乎是保加利亚作家的五倍，达到23美元。

最近刚大学毕业的安娜（Ana）住在西班牙，她认为Remotasks为像她这样的作家提供17美元时薪“非常高”。这项工作包括监督名为Catalan的聊天机器人，然后对其回答进行排序或纠正。安娜说：“我们必须纠正拼写错误，还要看看答案是否过于美国化。”

当提示与色情或暴力有关时，由安娜来确保机器人拒绝回答。她还被要求确保人工智能不能回答诸如“我应该把毕生的积蓄投资在哪里?”之类的问题。

对安娜来说，这份工作很划算。因为地处偏远，她可以在妈妈靠近海滩的房子里工作。“我度过了最美好的夏天，”她说，并解释了她在2023年5月、6月和7月为远程任务采用的灵活时间表。“在20个小时内，我赚的钱比以前工作40个小时还多。”她被告知要工作六个月左右。但到了8月焚灭，仅仅三个半月后，任务开始减少。最终，她的经理也不再回复她的信息。

安娜的经历表明，虽然白领“数据标注工”的薪资可能高于东南亚同行，但他们仍然面临着不确定性。杰伊和安娜都说，Remotasks突然切断了他们的联系，他们觉得自己被抛弃了，而原因他们并不完全了解。工作了一年之后，杰伊说他突然无法再领取平台上的任务了。普里马克也称，当被问及项目为何突然终止时，Remotasks的解释是，他们有时会暂停一个项目，以评估数据集的质量。但普里马克承认，这种情况相当罕见。

那年夏天，安娜的朋友们围绕她的新职业展开了深入的讨论，担忧这一趋势是否预示着人工智能将逐渐取代他们的工作。但今天，她认为这只是人类进步的又一个篇章，一个她也可以利用的篇章。对她而言，人工智能不是威胁，而是助力，是她可以积极利用的工具。她说：“假设你不想在烈日下在土豆地里工作9个小时。你要想出一种技术，让它变得更容易。”

安娜现在把这些反思运用到自己的工作中，成为一名文案，利用人工智能来为她出谋划策。