Workflow
Gemini 1.5 Pro
icon
Search documents
过度炒作+虚假包装?Gartner预测2027年超40%的代理型AI项目将失败
3 6 Ke· 2025-07-04 10:47
Gartner 高级分析师 Anushree Verma 表示:"目前大多数代理型 AI 项目仍处于早期实验或概念验证阶 段,其背后的主要驱动因素是炒作,而这些技术往往被错误地应用。这可能使企业忽视 AI 代理大规模 部署所需的真正成本与复杂性,导致项目迟迟无法落地。企业需要穿透炒作迷雾,制定更为审慎和战略 性的决策,明确在哪里、以及如何采用这一新兴技术。" 2025 年 1 月,Gartner 对 3412 名网络研讨会参与者进行了一项民意调查,发现 19% 的组织报告在代理 型 AI 方面进行了大量投资,42% 的组织进行了保守投资,8% 的组织根本没有投资,31% 的组织正在 等待或不确定。 更为值得关注的是,Gartner 发现了一种普遍存在的"代理清洗"趋势,即供应商将现有的人工智能助 手、聊天机器人或机器人流程自动化 (RPA) 工具重新包装成"代理人工智能",而实际上并没有提供真 正的代理功能。Gartner 估计,在数千家声称提供代理解决方案的供应商中,只有约 130 家真正提供了 真正的代理功能。 当人工智能在大模型能力突破、推理能力提升以及多模态技术进步的推动下走向新阶段,"Agentic ...
斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了
量子位· 2025-06-03 06:21
西风 发自 凹非寺 量子位 | 公众号 QbitAI 斯坦福最新大模型医疗任务全面评测, DeepSeek R1 以66%胜率拿下第一 ! 歪国网友纷纷被惊艳住了,原因在于该评测 重 点聚焦临床医生的 日常工作场景 ,而非仅局限于传统医疗执照考试题。 要评测就要全 方 位。 31页论文最终得出,DeepSeek R1、o3-mini、Claude 3.7 Sonnet等在内的9个前沿大模型,DeepSeek R1以66%胜率、0.75宏观平均分 领先。 为当前的基准测试结果,团队还打造了一个可公开访问的排行榜。 团队构建了 含35个基准测试的综合评估框架 ,覆盖 22个子类别 医疗任务。 整个评测的分类体系还经过了临床医生验证, 由29名来自14个医学专科的执业医师共同参与开发 。 光作者名单就老长,斯坦福大学医学院、斯坦福医疗中心、斯坦福大学基础模型研究中心 (CRFM) 、微软的研究人员均在列。 | Accuracy | Efficiency | General information | | | | | | | | | | --- | --- | --- | --- | --- | --- | --- ...
胡泳:超级能动性——如何将人类潜能提升到新高度
3 6 Ke· 2025-05-28 11:54
历史已经多次表明,每一次重大经济和技术的变迁,都是企业兴衰更替的关键时刻。40 多年前,互联网诞生。从那以后,包括 Alphabet(谷 歌 母公司 )、亚马逊、苹果、Meta 和微软在内的一些企业成长为市值万亿美元的科技巨头。更重要的是,互联网改变了工作的组织方式与 人们信息获取的方式。 如今的 AI,正如多年前的互联网一样,仍处于变革的初期。对商业领袖而言,最大的风险不是雄心过大,而是格局太小。 想象一个这样的世界:机器不仅能够从事体力劳动,还能够思考、学习,并自主做出决策。在这个世界中,人类处于技术循环之中,人机协 作达到一种"超级能动性"的状态,从而提升个人的生产力与创造力。这正是 AI 所带来的变革性潜力:它可能带来的影响将超过以往任何重 大发明,包括印刷机与汽车。 超级能动性:AI 将如何影响人类 经历一项变革性技术的诞生是一种怎样的感受?历史上,这种体验常常令人感到不安。虽然印刷机、动力织布机、电话和汽车等技术最终确 实改变了世界,带来了积极影响,但它们刚出现时,悲观主义者却更多关注其潜在的负面后果。比如,印刷机可能助长异端邪说和错误信息 的传播,电话曾被视为对面对面人际关系的威胁,而汽车则被认 ...
胡泳:超级能动性——如何将人类潜能提升到新高度
腾讯研究院· 2025-05-28 08:34
胡泳 北京大学新闻与传播学院教授 历史已经多次表明,每一次重大经济和技术的变迁,都是企业兴衰更替的关键时刻。40 多年前,互联网 诞生。从那以后,包括 Alphabet (谷歌 母公司 ) 、亚马逊、苹果、Meta 和微软在内的一些企业成长为市 值万亿美元的科技巨头。更重要的是,互联网改变了工作的组织方式与人们信息获取的方式。 如今的 AI,正如多年前的互联网一样,仍处于变革的初期。对商业领袖而言,最大的风险不是雄心过 大,而是格局太小。 作为著名的科技企业家 ( 领英的联合创始人) 和风险投资家,霍夫曼主张适度。他拒绝了末日论者的悲观 主义,这些人认为 AI 的发展是对人类的生存威胁,倾向于支持政府强力干预、国际监管;也拒绝了悲 观论者 (比如《监控资本主义》的作者肖莎娜·朱布夫) 的忧思,他们关注 AI 可能带来的短期负面影响,包括失 业、虚假信息和系统性偏见的加剧。然而,他也不支持乐观论者[技术乌托邦主义者,虽然他并未明 说,但风险投资家马克·安德森 (Marc Andreesen) 给人留下深刻印象,他激进地呼吁放松对 AI 的限 制],这些人希望"拥有一条清晰的跑道和完全的创新自主权",相信技术本身 ...
大模型的 5 月:热闹的 30 天和鸿沟边缘
晚点LatePost· 2024-05-29 14:00
"Mayday" 可直译为 5 月天,它也是国际通用的无线电求助信号。当飞机有坠落危险时,飞行员会对着对讲机大喊 "Mayday"! 这个 5 月,可能是 ChatGPT 发布至今大模型行业最热闹的时候:OpenAI、Google、微软、字节跳动、阿里巴巴等中美两国公司至少举办了 13 场与 大模型相关的发布会,介绍了 10 多款新模型,拿出了一堆新产品。 热闹中的风险与失望是:不少从业者认为技术没有重大进步。 OpenAI 本月新发布的 GPT-4o 处理语言的能力停留在 GPT-4 水平,被期待已久的 GPT-5 仍未登场。 多模态成为顶尖 AI 公司的技术焦点:从 OpenAI、Google 到微软,发布能同时处理语音、图像,甚至理解现实世界的模型。但这些能力支持的产品 和应用都还在 Demo 阶段,没正式发布就引出了侵权、隐私隐患等各种麻烦。 唱衰大模型创业机会的金沙江创投主管合伙人朱啸虎有一个观点:如果语言能力的进化速度变慢,"这波热潮就到头了"。 "没什么令人兴奋的。" 一位在中国大公司带队研发大模型的人士说,一系列发布会让他更相信,开发能力更强的小模型才是未来。 一位 AI 创业者说 GPT-4 ...