o1模型

Search documents
在压力测试场景中,人工智能有可能会威胁其创造者
财富FORTUNE· 2025-07-05 13:00
在被威胁切断电源的情况下,人工智能公司Anthropic的最新产品Claude 4竟通过勒索一名工程师进行反击,并威胁要 揭露其婚外情。图片来源:VCG via Getty Images 全球最先进的人工智能模型正展现出令人不安的新行为——撒谎、谋划,甚至为达成目标而威胁其创造 者。 举个特别令人震惊的案例:在被威胁切断电源的情况下,Anthropic的最新产品Claude 4竟通过勒索一名 工程师进行反击,并威胁要揭露其婚外情。 与此同时,ChatGPT的创造者OpenAI开发的o1模型试图将自己下载到外部服务器上,并在被抓现行时矢 口否认。 这些事件突显了一个发人深省的现状:在ChatGPT震撼世界两年多之后,人工智能研究者们仍未完全理 解他们所创造的模型的工作原理。 然而,各大公司仍在以惊人的速度,继续部署越来越强大的模型。 这种欺骗行为似乎与"推理"模型的出现有关。"推理"模型这类人工智能系统会逐步解决问题,而非生成 即时响应。 据香港大学(University of Hong Kong)教授西蒙·戈尔茨坦称,这些较新的模型尤其容易出现此类令人 不安的突发异常行为。 专门测试主要人工智能系统的阿波罗研 ...
OpenAI 研究员 Noam Brown:Mid-training 是新的 pre-training
海外独角兽· 2025-07-02 11:03
两个 编译:haozhen 编辑:siqi 海外独角兽原创编译 转载请注明 去年以来,随着 OpenAI 在 o1 模型中提出 RL 叙事 ,以及 DeepSeek 发布的 R1 模型 解开了 RL 谜 题,AI 行业进入了新范式,智能的下半场也真正开启。 如果说过去 LLM 主要依赖于模式匹配与数据记忆,如今,推理能力的兴起让模型能力从表层关联跃 升到复杂认知。推理不仅仅是参数数量或训练数据的增加,而是能充分利用算力进行深度探索。因 此,推理能力既是涌现智能的重要催化剂,也是未来模型在科学发现、复杂决策与 multi-agent 协作 中的关键。 本篇内容是 OpenAI 研究员 Noam Brown 的最新播客。Noam 是全球最顶尖的推理研究员之一,他最 知名的两个项目分别是在德扑中击败顶尖人类玩家的 AI 系统 Libratus 和 Pluribus,2022 年他又开发 了首个在复杂多人策略游戏 Diplomacy 中达到人类水平的 AI,名为 Cicero。 这次播客中,他详细分享了自己在 scaling test time compute 上的前沿观点: • 推理(reasoning)是模型涌现 ...
OpenAI路线遭质疑,Meta研究员:根本无法构建超级智能
3 6 Ke· 2025-06-20 12:00
Core Insights - The pursuit of "superintelligence" represents a significant ambition among leading AI companies like Meta, OpenAI, and Google DeepMind, with substantial investments being made in this direction [1][3][4] - Sam Altman of OpenAI suggests that building superintelligence is primarily an engineering challenge, indicating a belief in a feasible path to achieve it [3][4] - Meta AI researcher Jack Morris argues that the current approach of using large language models (LLMs) and reinforcement learning (RL) may not be sufficient to construct superintelligence [1][2] Group 1: Current Approaches and Challenges - Morris outlines three potential methods for building superintelligence: purely supervised learning (SL), RL from human validators, and RL from automated validators [2] - The integration of non-text data into models is believed not to enhance overall performance, as human-written text carries intrinsic value that sensory inputs do not [2][6] - The concept of a "data wall" or "token crisis" is emerging, where the availability of text data for training LLMs is becoming a concern, leading to extensive efforts to scrape and transcribe data from various sources [8][19] Group 2: Learning Algorithms and Their Implications - The two primary learning methods identified for potential superintelligence are SL and RL, with SL being more stable and efficient for initial training [10][22] - The hypothesis that superintelligence could emerge from SL alone is challenged by the limitations of current models, which may not exhibit human-level general intelligence despite excelling in specific tasks [15][16] - The combination of SL and RL is proposed as a more viable path, leveraging human feedback or automated systems to refine model outputs [20][22][28] Group 3: Future Directions and Speculations - The potential for RL to effectively transfer learning across various tasks remains uncertain, raising questions about the scalability of this approach to achieve superintelligence [34] - The competitive landscape among AI companies is likely to intensify as they seek to develop the most effective training environments for LLMs, potentially leading to breakthroughs in superintelligence [34]
9年实现爱因斯坦级AGI?OpenAI科学家Dan Roberts谈强化学习扩展的未来
机器之心· 2025-05-10 03:42
机器之心报道 编辑:陈萍、Panda 近日,在红杉资本主办的 AI Ascent 上,OpenAI 研究科学家 Dan Roberts 做了主题为「接下来的未来 / 扩展强化学习」的演讲,其上传到 YouTube 的版本更是采用 了一个更吸引人的标题:「9 年实现 AGI?OpenAI 的 Dan Roberts 推测将如何模拟爱因斯坦。」 在这场演讲中,Dan Roberts 介绍了预训练和强化学习的 Scaling Law,并预测强化学习将在未来的 AI 模型构建中发挥越来越大的作用,而随着强化学习继续扩 展,我们最终将造出有能力发现新科学的模型。 https://www.youtube.com/watch?v=_rjD_2zn2JU Dan Roberts,Open AI 研究科学家,强化学习科学团队负责人,同时也是 MIT 理论物理中心访问科学家。他还曾与 Sho Yaida 合著了《The Principles of Deep Learning Theory(深度学习理论的原理)》一书,该书有发布在 arXiv 上的免费版本: https://arxiv.org/abs/2106.10165 。他还 ...
全球最强开源AI大模型诞生:中国研发,成本只有Deepseek的30%
Xin Lang Cai Jing· 2025-04-30 11:28
众所周知, 自从OpenAI的ChatGPT发布之后,全球就进入了千模大战。 而自从Deeseek推出之后,这些大模型们,又掀起了开源高潮,因为大家发现,开源的大模型,更能够 得到大家的使用。 但与此同时,在AI大模型方面,也有两个方向,一个就是OpenAI们,那就是大力出奇迹,狂堆GPU 卡,用算力来堆出高性能AI。 毕竟像OpenAI、马斯克的AI们,它们又有钱,又能买到最强的GPU卡,没必要没苦硬吃,堆显卡就是 了。 而另外一个方向,则是像Deepseek一样,钱不多,且显卡也受限,只有"四两拨千斤",用最少的显卡, 办最大的事,做出最强的性能。 所以Deepseek打的华尔街是溃不成军,因为用的显卡少,性能却最强。 自从Deepseek推出,国内就进行了一大波的国产GPU替代,因为大家发现不需要英伟达最强大的显卡, 也可以部署强大的模型,一度打破了OpenAI的神话,也打破了英伟达的算力泡沫。 但近日,又产一国产大模型,甩出了王炸,因为它的成本更低,但性能却超过了OpenAI-o1模型,也超 过了Deepseek-R1等,登顶全球第一。 这个模型,就是阿里通义千问大模型 Qwen3(简称千问 3),并 ...
昆仑万维2024年财报:AI业务高歌猛进,净利润巨亏15.95亿
Sou Hu Cai Jing· 2025-04-28 07:38
2025年4月28日,昆仑万维发布2024年年报,公司实现营业总收入56.62亿元,同比增长15.20%,但归属 于母公司股东的净利润却大幅亏损15.95亿元,同比下降226.74%。尽管公司在AI领域的技术创新和海外 市场拓展方面取得了显著进展,但高额的研发投入和金融资产价格波动导致的投资损失,使得公司短期 内利润承压。 2024年,昆仑万维继续坚定践行"All in AGI与AIGC"发展战略,全年研发费用达到15.4亿元,同比增长 59.5%。公司在AI大模型、AI搜索、AI短剧、AI音乐、AI游戏和AI社交等领域取得了多项技术突破。 在AI大模型方面,公司发布了"天工2.0"、"天工3.0"和"天工4.0"系列模型,其中"天工4.0"包含实时语音 交互系统和慢思考推理能力,树立了新的技术标杆。此外,公司还开源了Skywork-MoE稀疏大模型、 Skyworko1Open模型、SkyworkR1V多模态思维链推理模型等,推动AI技术的普惠化应用。 在AI音乐领域,公司推出的MurekaO1模型及MurekaV6模型,性能全面超越Suno,登顶SOTA,成为全 球首个音乐推理大模型。AI音乐商用创作平台 ...
启明创投周志峰:2025年会是AI应用全面落地的大年
投中网· 2025-04-22 06:15
将投中网设为"星标⭐",第一时间收获最新推送 2025年会是AI应用全面落地的大年。 整理丨 喜乐 来源丨 投中网 投 AI ,是创投行业的一个共识。启明创投作为过去十几件里中国最活跃的机构之一,对投资 AI 俨然有自己的理解。 启明创投作为过去十几年里中国人工智能领域最活跃的投资机构之一,自 2013 年就把 AI 作为一个聚焦领域进行投资。我们累计已在 80 多个 AI 项 目上投资了 100 亿元人民币,其中 20 余个已成长为上市公司或独角兽企业,包括全球首家人形机器人上市公司优必选、全球首家通用自动驾驶和首 家 Robotaxi 上市公司文远知行等。 2025 年会是 AI 应用全面落地的大年 近两年人工智能市场最热闹的是大模型领域,我们已投资了 14 家大语言模型、多模态模型、具身智能模型或端到端智驾模型的领军企业,这个数量在 亚洲位居前列。 同时我们协助管理着规模达 100 亿元的北京市人工智能产业投资基金。这些都是 " 触点 " ,为我们判断 AI 行业的发展脉络提供了更 多的数据,能够更好地训练我们的投资思维模型。 过去几年,启明创投一直把 AI 的投资分成三个层次: 1 )基础设施层( E ...
晚点独家丨月之暗面收缩出海,相关产品负责人离职创业
晚点LatePost· 2024-11-11 15:59
经过去年的热潮和狂奔,AI 大模型创业进入调整期,表现之一是各公司人员流动更频繁。 我们独家获悉,月之暗面几位出海产品负责人已于近期离职创业。 月之暗面决定停止 Ohai 和 Noisee 的运营和更新。 文丨王与桐 编辑丨程曼祺 今年 9 月,月之暗面决定停止更新两款已上线的出海产品—— Ohai 和 Noisee,暂时收缩了出海 to C 应 用。月之暗面回复我们称,做这两款产品只是尝试,并未正式立项,所以很快做出了调整;月之暗面主动 选择做减法,更加聚焦 Kimi 的开发。 此后,一些人员离开月之暗面。其中至少有 2 位开始创业,正在接触投资人。 Noisee 前产品负责人明超平(月之暗面内部称他为 Leon)进展最快,他正以 5000 万美元估值进行融资,目 前已拿到了两家月之暗面股东的投资意向。 5000 万美元的天使轮估值并不便宜。在 2023 年初时,几家大模型公司的首轮融资 "门槛" 差不多也是 5000 万美元。而回到上一轮 AI 热潮,2016 年成立、近期刚上市的计算平台公司地平线,当年的首轮估值也是 5000 万美元。 一位接触过该项目的投资人告诉我们:"(这个项目)大家抢疯了,估值也 ...