Supervised Fine - Tuning (SFT)

Search documents
AI搜索的未来不是“十个蓝色链接”,而是直接给你答案
Hu Xiu· 2025-07-25 04:16
Aravind Srinivas是印度裔美国计算机科学家、企业家,Perplexity AI的联合创始人兼CEO。他曾在 OpenAI、DeepMind和Google等知名AI企业担任研究实习生或研究科学家,在OpenAI期间,他领导了强 化学习团队,参与开发了ChatGPT,并参与了DALL-E 2的开发。TechCrunch是美国的一家知名科技类 博客,Devin Coldewey是其撰稿人,主要负责对科技领域的新产品、新趋势等进行分析和评论。本次访 谈首发于2024年10月31日TechCrunch频道。 一、如何界定"抄袭"?Perplexity的引用规范与监督机制 Devin Coldewey:好的,感谢你加入我们的访谈,Aravind。也感谢大家的到来。 Aravind Srinivas:谢谢你邀请我。 Devin Coldewey:那我就先开门见山地问一个问题吧,想先厘清个"基本事实"。你们公司对"抄袭"到底 是怎么定义的?只有当你有了定义,才能避免"无意间"踩到这个坑。 Aravind Srinivas:这个问题,其实你可以直接去问Perplexity本身。 Devin Coldewey:我以 ...
深度|Perplexity CEO专访:AI搜索的未来不是“十个蓝色链接”,而是直接给你答案
Z Potentials· 2025-07-25 03:24
Aravind Srinivas 是印度裔美国计算机科学家、企业家, Perplexity AI 的联合创始人兼 CEO 。他曾在 OpenAI 、 DeepMind 和 Google 等知名 AI 企业担任研 究实习生或研究科学家,在 OpenAI 期间,他领导了强化学习团队,参与开发了 ChatGPT ,并参与了 DALL-E 2 的开发。 TechCrunch 是美国的一家知名科 技类博客, Devin Coldewey 是其撰稿人,主要负责对科技领域的新产品、新趋势等进行分析和评论。本次访谈首发于 2024 年 10 月 31 日 TechCrunch 频 道。 如何界定 " 抄袭 " ? Perplexity 的引用规范与监督机制 图片来源: TechCrunch Z highlights Devin Coldewey : 好的,感谢你加入我们的访谈, Aravind 。也感谢大家的到来。 Aravind Srinivas : 谢谢你邀请我。 Devin Coldewey : 那我就先开门见山地问一个问题吧,想先厘清个 " 基本事实 " 。你们公司对 " 抄袭 " 到底是怎么定义的?只有当你有了定义 ...
深度|ARR过亿美金AI招聘00后创始人:未来最有价值的是拥有“反常识性观点”和“品味”的人,人们最应该优化自己的适应性
Z Potentials· 2025-04-24 03:10
图片来源: No Priors Z Highlights Sarah Guo: 那这些实验室现在主要在招聘什么样的技能和职位呢? Brendan Foody: 实际上,是所有具有经济价值的技能。 因为强化学习的效率越来越高,只要你能 设计出评估任务(evals),模型就能学习并提升对应的能力。所以,凡是我们希望LMS精通的能 人类数据市场正经历一次巨大变革。这个市场原来是众包模式,即找很多低中技能的人员为早 期ChatGPT那种模型写些语法勉强正确的句子。但现在正转向"筛选"问题: 要找到世界上最顶 尖的人才,与研究人员一起合作,推动模型能力的边界。 我认为其中最重要的一点是,过去的大多数评估任务都是"零样本"测试,比如说一条测试题目 对一个模型。这种测试可能很学术化。但我们现在真正需要评估的是"经济上有价值的工作"。 比如一个软件工程师的实际工作远不只是写个PR。 他还要与多个相关方协调:理解产品经理的 需求,它是如何与各个团队的优先级匹配的,以及这些怎么最终落实到实际工作产出上。 我们未来会有这些Agent来承担目前由员工执行的各类角色,它们会与人类员工并肩工作,而人 类员工也会帮助构建这些评估任务。 我 ...