Workflow
锦秋集
icon
Search documents
AI视频生成的Vidu样本:攻坚视频生成核心难题,引领内容生产力变革
锦秋集· 2025-05-06 14:36
多模态 AI 技术正以前所未有的速度重塑内容创作领域。 从2024年 OpenAI Sora 点燃全球想象,到近期,吉卜力风图片席卷全网。这个一度被视为 AI 终极想象力边界 的领域,正以前所未有的速度冲破技术壁垒。 视频生成作为技术难度与应用潜力并存的关键环节,也吸引了全球范围内的广泛关注和投入。 在追求更长时长、更高分辨率、更惊艳视觉效果的同时,内容一致性难以保证、生成过程可控性不足、以及高 昂的计算成本等核心挑战,依然限制了其在专业领域、大众娱乐领域的规模化应用。 在此背景下,由生数科技研发的视频生成模型 Vidu,展现出一条差异化的发展路径。在多模态视频生成技术 的早期发展阶段,通过集中资源解决专业用户的核心痛点,如一致性、可控性、效率,建立起差异化优势和用 户基础,尤其是在动画等特定领域形成壁垒。 根据生数科技廖谦在近期访谈中的阐述,Vidu 的核心定位是"全球领先的AI内容生产平台 ",这也意味着 ,除 了追求基础生成能力的提升,也需要优先解决实际工作流中的关键痛点。 比如,生数科技敏锐的发现,纯粹的文生视频因为难以控制一致性,应用者并不多 。而 Vidu 推出的"参考 生"(Reference ...
AI的下一个风口?听前DeepSeek成员辛华剑解读数学推理 | Deep Talk
锦秋集· 2025-05-03 08:51
4 月 30 日,DeepSeek在 AI 开源社区 Hugging Face 上,发布名为 DeepSeek-Prover-V2-671B 的新模 型。 这是一款专注于形式化数学推理的开源大型语言模型。 数学推理长期以来被视为AI的"终极挑战"之一。形式化数学不仅是AI的"智力试金石",更是打开高价值商业场 景的钥匙。DeepSeek-Prover系列模型通过结合LLM的泛化能力与形式化工具(如Lean),首次实现了从自 然语言描述到机器可验证证明的大规模端到端转化。这一突破不仅可能将数学研究效率提升数倍,更将为AI在 金融建模、芯片验证、密码学等依赖数学严谨性的领域打开新可能性。 5月9日,DeepSeek前成员辛华剑,也将参加剑桥大学中国人工智能协会、锦秋基金、清华大学学生通用人工 智能协会、清华大学学生创业协会合作的"大模型开发者与AI基金合伙人的跨洋对谈活动"。他将进行《大语言 模型时代的形式化数学革命》的主题分享。 辛华剑现在是爱丁堡大学人工智能博士生、字节跳动研究实习生,专注于大语言模型在数学定理证明中的创新 应用。他在DeepSeek实习期间主导开发了专注于数学证明DeepSeek-Prove ...
锦秋小饭桌开饭啦!吃饱了,咱们一起改变世界!
锦秋集· 2025-05-01 11:23
在人均都说是自己是i人的新兴方向,我们想和创业者一起搭建一个高质量闭门社交场域 ,一起探讨: 因此,从2月26日开始,我们每周五晚上18:00-22:00,在北京、深圳、上海三个地方,开始陆续组织了9场小饭桌。 我们希望这里没有PPT轰炸,没有西装革履的客套,只有: 事实证明:作为一个资深干饭团队,过去两个月的周五,带创业者吃的应该还不错。偷偷说,其实,曾有过一桌交流的founder们后来都接受了锦 秋的投资。 在信息的洪流中,我们始终相信:最有价值的洞察,往往诞生于真诚的对话;最具潜力的合作,常常始于一场面对面的共鸣。 下面是我们过去2个月的饭局笔记。因为保密问题、合规问题,我们就只能简单写写啦。当然,如果要了解更多信息,欢迎下次和我们一起吃饭, 偷偷告诉你。 今年2月底,我们锦秋基金决定搞点"不正经的正经事"——带创业者一起好好吃饭。 吃饱了,我们一起去改变世界! 这里先发下5月9日的菜单——AI Infra限定套餐。如果你感兴趣,欢迎点击链接 (https://lh7ona58u3.feishu.cn/share/base/form/shrcnbvYmgHvhOeJQ7uBSEJq5ig)或者扫码报名。 ...
OpenAI揭秘Deep Research实现始末
锦秋集· 2025-04-30 07:09
与市面上多数"通用Agent"不同,OpenAI 的 Deep Research 从诞生那一刻起就被锁定在一件事上—— 通过强化 学习,将搜索、浏览、筛选与整合信息的能力内化为模型的原生技能,直接训练进参数里,而不是仅靠 Prompt工程和外部工程组合 。 那么,OpenAI 是如何把这套复杂技能训练进参数里的?他们在数据筹备、强化微调、安全与记忆管理上又摸 索出了哪些最佳实践? OpenAI Deep Research团队核心成员Isa Fulford最近在一个访谈中做了分享: 我们认为这个访谈提供了一个透视 OpenAI 构建旗舰智能体 Deep Research 的独特视角,并提供了一些开发实 践经验,因此锦秋基金( 微信公号锦秋集ID:jqcapital)对本文进行了编译。 01 Deep Research 的起源与目标 OpenAI 团队在强化学习算法刚刚显露锋芒时,放弃了订汉堡、订花那条看似容易衡量的交易型赛道, 转而攻克浏览与知识整合——他们认为整合知识是AGI 必不可少的前置技能, 也因为"纯读取"比"直接 下单"更安全。 数据的质量比数量更重要。 Deep Research 倾向"小而准": ...
AI定义汽车,2025汽车大模型技术与产品新趋势
锦秋集· 2025-04-29 14:36
2025年4月23日,2025上海车展开幕。 除了"性价比",最受关注的关键词就是AI。从智能驾驶到智能座舱,AI大模型的身影无处不在。 汽车大模型落地带来高度个性化用户体验、自然流畅的语音交互,正成为重要的产品性能。AI定义汽车在更大范围内接受,汽车软件开发的范式也将迎来新变化, 重塑汽车软件产业链条。 因此,上海车展前,锦秋基金(微信公号『锦秋集』ID:jqcapital)也邀约了三位行业专家,面壁智能技术合伙人翟忠武、恒聚愿景CEO赵恒艺、亿咖通科技大模 型产品负责人龚思颖一起探讨2025年汽车AI大模型新趋势。 相较于年初,所有主机厂对于Agent在车上的应用已无质疑。 主机厂对大模型技术的接纳速度超出预期,应用方向聚焦于智能语音增强、基于视觉语言模型的多模态交互突破,以及端到端智驾中视觉基础模型的应用。 现有芯片非为大模型设计导致算力不足;传统电子电气架构使全车数据收集困难;端侧部署带来功耗挑战;为大模型设计的底层芯片、算力架构和中间件尚 不成熟 。 这也使得大模型在汽车领域落地需要做大量的开发。 当前大模型在车载实时交互、推理延迟、幻觉问题、任务执行确定性、网络稳定性和端侧算力部署等方面,与主机厂 ...