AllMind(全频思维)

Search documents
对话念空科技王啸:量化对冲基金的大模型之路
36氪· 2025-05-23 09:24
量化基金+大模型=? 在半年前,面对这道算术题,大部分人都会回答DeepSeek,但随着一篇研究论文的发表,一个新的答案出现了,那就是念空科技。 量化行业再现AI之光,念空携大模型底层研究首闯国际顶会。 5月15日,量化私募念空科技向国际顶会NIPS投递了与上海交大计算机学院合作的大模型研究论文,探讨" 自适应混合训练方法论 "。 这次的故事,不是量化私募砸钱投大模型获得了如何丰厚的回报,而是念空科技"以身入局",做出了大模型底层理论的研究成果,成为首家闯入NIPS的中 国量化机构。 在念空之前,DeepSeek是唯一一家量化私募孵化进行大模型底层理论研究且发表研究成果的公司。相较于"前辈",念空更进了一步。 在DeepSeek基础上,念空提出了一种全新的更优的训练方法,帮助大模型提升训练效率,是量化行业少有的真正的大模型创新性研究。 从技术层面来看,DeepSeek提出了强化学习的重要性,而念空科技董事长王啸及其团队发现,相比于DeepSeek先进行一段时间的集中SFT(监督微调), 再进行集中RL(强化学习)的做法, 将SFT与RL交替进行的方式,能够得到更好的训练效果 。 一个动作侧面证明了念空还有更大 ...