Workflow
AI智能编程新框架,节省一半时间就能“聪明”地写代码丨上海AI Lab&华师大
量子位·2025-10-17 09:45

InternAgent 团队 投稿 量子位 | 公众号 QbitAI 在代码层面,大语言模型已经能够写出正确而优雅的程序。但在机器学习工程场景中,它离真正"打赢比赛"仍有不小差距。 因为像AutoML任务与Kaggle竞赛,不仅要求生成可运行的代码,更要求在数据处理、算法设计层面持续迭代与高性能调优。过去,这一过程 往往依赖专家经验与反复试错,使模型难以高效突破瓶颈。 然而,现有基于大模型的机器学习智能体仍受限于两大问题: 简单来说,就是它们会写代码,却还不会"聪明地优化"代码。 在此背景下,上海人工智能实验室联合华东师范大学提出了 AutoMLGen ,一个融合通用大模型推理与领域知识的智能编程框架。 其核心为自研的 蒙特卡洛图搜索(MCGS) ,通过"分支—节点动态融合"打破传统MCTS的孤立局限,让不同搜索分支可共享高价值节点; 并结合 领域知识库 与 算子级优化 ,将搜索重点快速聚焦到有效空间,实现轨迹复用、跨分支聚合与过程学习。 AutoMLGen在仅使用DeepSeek-R1模型的情况下,以36.4%的平均奖牌率和18.7%的金牌率登顶MLE-Bench榜单 ,用标准时长一半(12 小时)的计算预 ...