红杉汇

Search documents
AI Agents:从工具到伙伴 | 2025 HongShan AI Day(下篇)
红杉汇· 2025-06-02 07:06
今天,让我们继续走进红杉中国第三届AI Day,深入挖掘AI Agents的更多潜力。 5月29日,以"AI Agents:From Copilot to Colleague"为主题的AI Day活动为200多位成员企业CEO和技术高管 提供了一场脑力交锋和技术激荡的舞台。 我们看到了全新基准测试工具xbench,还通过多场深度对话和圆桌论坛,共同探讨了AI Agents在商业应 用、技术演进以及未来企业发展的关键方向——从前沿的技术思考到实践中的应用场景,从创业机遇到未 来组织形态的变化。接下来,让我们再度回到这场思维盛宴,聚焦更多前沿洞见与实践成果,解锁未来智 能世界的更多密码。 <左右滑动查看更多> 红杉中国合伙人公元以"如何在AI下半场定义'好问题'"为主题,向参会嘉宾介绍了红杉中国推出的一款全新 AI基准测试工具xbench。 "当大家纷纷考满分的时候,到底是学生变聪明了还是卷子出问题了?"公元问大家。 拾象科技CEO李广密则为大家分享了在基础模型训练视角下和硅谷视角下关于AGI主线的最新思考。 他分享了对2025年LLM的7个关键判断: 一是 智能本身就是最大的应用,应该围绕智能本身去投入; 二是 ...
AI Agents:从工具到伙伴 | 2025 HongShan AI Day(上篇)
红杉汇· 2025-05-30 06:40
红杉中国合伙人周逵在开场致辞中,从AI技术进化、AI产品特征、AI公司特征、AI商业模式以及未来智能 公司的竞争态势和结果等多个维度,分享了他对AI当下发展与未来走向的思考和见解。他表示,AI是人类 技术进步的新里程碑, "具身"的含义好似给现实生活的各类存在都能带上"大脑"的机会。他说:"无论 是'硬'的机器人还是软的'Agent',共同特点都是在获得信息同时有进一步交付的能力。企业选择Leval 2还是 Leval 4的智能目标,导致的智能能力和商业结果大不相同。"他尤其期待看到"世界模型"的重要进展,期待 下一个AI智能的Aha Moment出现。 Genesis创始人及CEO周衔和红杉中国合伙人公元进行了连线对话。周衔表示,具身人工智能技术的发展, 大概率不会出现陡然的转折点。人们或许会目睹机器人逐步渗透进一些To B的应用场景,在这一阶段,它 暂时无需与人类开展复杂的交互。随着技术的经年打磨与渐次升级,其能力将得到稳步提升,逐步迈向家 庭领域,成为人们日常生活中的得力助手。若持乐观态度,机器人技术有望在约3年左右实现关键性突破, 迎来真正意义上的商业化转折。 红杉中国合伙人郑庆生在演讲中表示,目前, ...
TED精选:“反传统”的企业家思维 | 红杉汇内参
红杉汇· 2025-05-27 07:21
当客户想要一些超出公司"核心能力"的新东西时,第一反应不要拒绝,而是说:"行,我们能做。" 1 "问题导向,而不是产品导向" 在如今的大公司中,一切都围绕着产品进行。在美国的时候,我家用了好多年的汰渍有了些许变化。我和 家人都看出来了,这是来了一位新的产品经理,他们把洗衣粉蓝色的颗粒换成了绿色,然后称之为"全新升 级"。这是创新吗?我不太确定。 可口可乐发生了什么?除了经典可乐,他们后来还推出了健怡可乐、零度可乐、香草可乐和樱桃可乐等各 种可乐,同样,这算不算一种创新?我觉得不是, 对企业家来说,我们不关注产品,更关注问题 。 来源:TED官网截图 伦敦商学院创业教授约翰·马林斯(John Mullins)在之前的TED演讲中曾分享了几种"反传统"企业家思维。他认 为,在某些事情即将发生时,思维率先决定我们对其的反应。这些事情,就是企业家获得成功的机会。 在他看来,"行,我们能做""重视解决问题""思考聚焦一些""大胆要钱""很多东西可以借"这些"反传统"企业家思 维可以帮助创业者或企业家解决他们正面临的困难和挑战。 1 "行,我们能做" 商学院的入门战略是这么说的:我们在一家企业中该做的是"尽其所长"。我们 ...
今天,我们推出xbench
红杉汇· 2025-05-25 23:20
随着基础模型的快速发展和AI Agent进入规模化应用阶段,被广泛使用的基准测试 (Benchmark) 却面临一 个日益尖锐的问题:想要真实地反映AI的客观能力正变得越来越困难。 因此,构建更加科学、长效和如实反映AI客观能力的评测体系,正在成为指引AI技术突破与产品迭代的重 要需求。 有鉴于此,红杉中国今天正式推出一款全新的AI基准测试工具xbench, 并发布论文《xbench: Tracking Agents Productivity,Scaling with Profession-Aligned Real-World Evaluations》 。 在评估和推动AI系统提 升能力上限与技术边界的同时,xbench会重点量化AI系统在真实场景的效用价值,并采用长青评估的机 制,去捕捉Agent产品的关键突破。 (点击文末 【阅读原文】 即可 下载阅读 本论文,建议使用电脑端进行下 载) 摘 要 • xbench采用双轨评估体系,构建多维度测评数据集,旨在同时追踪模型的理论能力上限与Agent的实 际落地价值。该体系创新性地将评测任务分为两条互补的主线:(1)评估AI系统的能力上限与技术 边界;(2)量化 ...
为什么顶级品牌都在「动」? | 红杉爱生活
红杉汇· 2025-05-22 23:31
而且,动态设计中也涉及大量叙事元素。 当视觉叙事与图形元素、策略性文案及艺术指导完美融合时,能 达到最佳的动态效果,从而打动受众。 让我们从一些案例开始看起,了解 动态设计可以放在哪些触点: 如今,视频贴片广告、社交媒体流广告、APP开屏广告、网页用户界面、微互动设计、数字广告牌、户外屏幕 ——一切都在动! 屏幕无处不在,在线内容也呈井喷式增长。品牌纷纷调整策略,在坚守传统渠道的同时,积极拥抱数字化触 点。从沉浸式的品牌体验到流媒体和广播内容,动态设计已然成为很多行业的标配。在一个"大屏幕看着,小屏 幕刷着"已是常态的世界里,让内容不动才是奇怪的事情。 现在,让我们聚焦于品牌的"动态设计" (Motion Design,有时亦称"动效设计") ,聊聊如何创造出能真正打动受 众的动态效果。 动态设计是一种通过动画技术让设计 (甚至更广义的"品牌") "生动"起来的艺术与工艺。 "动态设计"的目的是持续且有效地传递信息,强化项目的概念和视觉语言——通常是为了鼓励用户采取行 动。其对象包括品牌标志 、 符号、字体、图片、视频片段、插画、图标——任何传递信息的视觉元素都可 以成为设计的切入点。 需要考虑的动态设计触点 ...
为什么生命如此多彩? | 红杉爱科学
红杉汇· 2025-05-21 15:21
今天,我们再一次迎来国际生物多样性日。今年的主题是 "万物共生 和美永续" ,呼吁以人与自然和谐共生之 道,创和美永续之路,进而推进全球生物多样性保护治理新进程。 最早拥有三色视觉的动物是一类 非脊椎动物——节肢动物 (如昆虫、蜘蛛和甲壳类动物) 。而在4.2亿至5亿 年前, 脊椎动物 也开始具备三色视觉,使它们能够比单色视觉的生物更精准地识别猎物和捕食者,提高在 环境中的导航能力。 化石证据提供了进一步的线索。例如, 三叶虫 ——一类生活在5亿多年前的已灭绝的海洋节肢动物,就拥 有 复眼 。这一视觉结构能够探测多种光波长,使三叶虫在昏暗的海洋环境中获得进化优势,提高运动感知 能力和生存竞争力。 这些证据表明,生物在自身变得五彩斑斓之前,便已具备感知色彩的能力。 地球生命共同体的每一次脉动,都与人类命运息息相关。从灰棕、柔和的主体色彩到今日的五彩斑斓,从雄孔 雀炫目的羽毛到绚烂多姿的花朵,地球历经了一系列的进化——生命的色彩是基因密码的具象表达,是物种生 存的底层逻辑的体现。在这个过程中,生物多样性构筑了人类生存的根基。 但一个不可否认的事实是:全球众多物种的遗传多样性正在加速丧失,那些承载着适应潜能的基因宝 ...
一流管理者,都是“选人”高手 | 首席人才官
红杉汇· 2025-05-19 13:15
为什么有些团队总是活力满满,而有些却毫无动力?为什么有些管理者能轻松驾驭复杂局面,而有些却束手无 策?答案或许就在人性里。 所以,企业要想通过对员工的管理和激励赢得竞争优势并实现长期成功,必须从企业高度而非人力资源职能部 门角度理解和运用人力资源管理。而人力资源管理,简单来说就是帮助组织解决员工的选、育、用、留问题的 管理职能。这四种职能都很重要,很难说孰重孰轻,然而无论是从理论还是实践方面来看,大家最终都会达成 一个共识——"选对人"永远是第一位的。 今天我们就从《以人成事》这本书中,为大家摘选了其中如何提高"选对人"概率的五大法则,希望能够帮助大 家在管理实践中做出更明智的决策。 好员工和差员工的绩效差异远远超乎我们的想象。 几项针对60多万名员工的研究表明,员工的绩效分布遵循的实际上是重尾分布而不是正态分布。在很多行 业或职业中, 优秀员工与普通员工之间的绩效差异要比我们想象的更大 ,那些最优秀的明星员工的绩效水 平并不是围绕绩效中间值略有波动。 比如,苹果公司顶级研发人员的绩效是其他同类公司普通软件工程师的9倍,诺德斯特龙公司卖场中最佳售 货员的销售额至少是其他同类公司普通售货员的8倍,一流诊所中最好 ...
AI大家说 | 斯坦福大学年度报告:企业AI运用水平创下纪录
红杉汇· 2025-05-18 02:21
有的时候你可能会有这样的迷惑:怎么新闻里的AI又写科研论文,又能自动驾驶,但是我们手里的AI工具总是 时灵时不灵呢?或许这份斯坦福大学最新的《2025年人工智能指数报告》能够解答你的困惑。 这份400多页的年度报告,包括了对不断演变的AI硬件格局的深入分析、对推理成本的全新估算,以及对AI领域 学术发表和专利申请趋势的新分析。同时还引入了有关企业采用尽责AI实践的新数据。我们编译了报告的部分 重要成果,希望能够帮助大家更好地理解AI技术的发展,充分利用它获得先发优势。 【温馨提示】文末"阅读原文"可下载原报告 人工智能日益融入日常生活 从医疗保健到交通运输的诸多领域,人工智能正迅速从实验室走向日常生活。2023年,美国食品药品监督 管理局 (FDA) 批准了223种配备人工智能的医疗器械,而2015年这一数字仅为6种。在道路上,自动驾驶 汽车已不再处于试验阶段,某自动驾驶汽车运营公司已每周提供超过15万次自动驾驶出行服务。 在这波人工智能大热潮中,科学和医学领域涌现了令人惊喜的新气象。 多个新发布的基础模型,它们将助 力材料科学、天气预报和量子计算等方面的研究。 许多公司正尝试将AI的预测与生成能力转化为有利 ...
能分清这是真的还是AI生成吗?这有一份鉴定指南送给你
红杉汇· 2025-05-15 17:00
先来看一张图。如果AI接到指令,要画一张梅西、C罗和内马尔在夜晚火锅店里的随手自拍快照,它可能会 生成这样一张图片: 图源:小红书 以下文章来源于硅星人Pro ,作者周一笑 硅星人Pro . 硅(Si)是创造未来的基础,欢迎来到这个星球。 那么,面对AI如此强大的"创作力",普通人还有办法分辨真伪吗?当然,技术的背面永远藏着"对抗的钥 匙"。今天我们围绕文字、图片、视频这三种内容形式,梳理了一些技巧,希望人人都能练就"一眼辨AI"的 本领。 识别AI文字:从"AI味儿"入手 你有没有在网上读到过一些文字,心里默默嘀咕:"这话……是人写的还是AI写的?" 随着AI写作工具越来越普遍,这几乎成了上网冲浪的一项必备技能。有意思的是,就像学者伊森·莫里克说 的,当你能轻易感觉出一段内容是AI写的,那往往说明它本身就还不够好。所以, 学会辨别AI文本,不只 是为了"打假",更是为了在信息爆炸的时代,保持对好内容的品味 。 某些AI写出来的文字有一种特别的"味道",用得越久越容易辨认。 一些明显的特征是故作精确。 人类可能 会写"寒意刺进她的胸膛",而AI却会奇怪地用"寒意刺进她第四节胸椎"这样不常规的写法。 还有词汇的 ...
首个科研智能体“天团”出道!近期AI新鲜事还有这些……
红杉汇· 2025-05-14 14:05
提升人类科研效率,该AI上场了 五一期间,FutureHouse推出四个AI科研智能体,官方用四种动物来命名它们,分别是Crow (通用智能体) 、Falcon (自动化文献综述智能体) 、Owl (调研智能体) 、Phoenix (实验智能体) 。这些AI智能体可访问 完整科学文献全文,还具备信息质量评估能力。 图源:FutureHouse官网 这其中,Crow、Falcon和Owl通过了严格的基准测试,在搜索精度和准确性上已经超越了o3-mini、GPT- 4.5、Claude-3.7等当下顶级搜索模型。这三个模型 可以访问大量完整的科学文本 ,这就意味着,你可以向 它们提出关于实验方案和研究局限性的更详细的问题。它们还能使用各种因素来区分来源质量,确保它们 不会依赖低质量的论文,或者是流行的科学来源。 目前这四个科学家智能体虽然还不能自主完成大多数科学研究,但是人类已经可以用它来生成和评估新的 假设,规划新的实验——速度要比以前快很多。 而且这些智能体的推理过程完全透明,对每个信息来源都 进行了多阶段的深入分析。 更重要的是,用户可以清晰地查看整个推理过程,了解智能体得出结论的每一 步依据。 再加上Fu ...