强化学习环境

Search documents
AI革命下一站:Anthropic与OpenAI斥巨资打造“虚拟员工”
3 6 Ke· 2025-09-17 05:11
这样的训练成本不菲。据知情人士透露,Anthropic计划在未来一年内投入10亿美元,专门建设被称为"强化学习环境"或"健身房"的模拟 办公平台。OpenAI同样不惜重金,预计今年在数据相关领域的支出就将达到10亿美元,到2030年更将增至80亿美元。这些资金既用于搭 建虚拟办公环境,也用于支付专家薪酬。 9月17日消息,AI领域的两大巨头Anthropic和OpenAI正致力于开发能够替代人类执行复杂工作的"AI同事"。其核心方法是使用模拟企业 软件来训练AI模型,使其能像人类员工那样理解和操作真实的工作流程。 为加速这一进程,Anthropic计划在明年投入10亿美元建设大规模的AI训练"健身房"。OpenAI则认为,整个经济未来都可能变成巨大 的"强化学习机器",AI将通过与人类协作和反馈不断进化,从根本上重塑生产力与工作模式。 时薪最高250美元,"AI家教"正在教大模型如何办公 Anthropic与OpenAI正在做一件前所未有的事:让大语言模型真正走进"办公室",学习当一名合格的"数字员工"。 这些AI模型正在接受高强度职业培训,学习操作各类专业办公软件,从Salesforce的客户管理系统、Ze ...
速递|OpenAI和Anthropic的新战场:训练AI操作企业软件,成本年飙80亿美元
Z Potentials· 2025-09-17 03:34
Anthropic 、 OpenAI 等人工智能开发公司正在让大型语言模型 " 上班办公 " 。 这些 AI 模型正在学习使用从 Salesforce 的客户关系管理软件到 Zendesk 的客户支持系统,再到 Cerner 的医疗记录应用等各种工具。其目的是教会 AI 如何处理白领工作者所面临的一些复杂任务。 这种训练模式与 AI 模型以往的任何训练都不同。研究人员为 AI 提供模拟应用程序进行交互练习,同时聘请各领域专家向模型示范如何操作这些应 用。 这些技术的成本并不低廉。据一位知情人士透露, Anthropic 高管内部讨论过未来一年将斥资 10 亿美元打造这些 " 企业应用克隆体 " ——也被称为 强化学习环境或训练场。 雇佣生物学、软件编程和医学等领域的人类专家来教导模型学习新知识及办公软件操作,其成本也日益攀升。 OpenAI 今年早些时候预测,计划今年在数据相关成本上支出约 10 亿美元(包括支付人类专家费用和强化学习训练场), 到 2030 年这一数字将攀 升至 80 亿美元。 若取得成功,这些 AI 训练方法或能帮助 OpenAI 和 Anthropic 突破传统训练技术近期遭遇的部分局限 ...