Workflow
阿里千问
icon
Search documents
如何教AI学会反思?
Hu Xiu· 2025-07-09 07:57
今天想跟大家分享一篇有意思的AI论文,标题有点长,叫《反思,重试,奖励:通过强化学习实现自我改进的大语言模型》。 说内容前,我先说说自己是怎么发现这篇论文的。熟悉AI的同学大多知道一个网站叫Hugging Face,这个平台不仅有各种大模型的训练场和技术讨论区, 还开设了一个"每日论文"栏目。由于AI领域如今太过火热,每天都有大量新论文发布,这个栏目就像是一个论文版的"知乎热榜"——作者提交论文,读者 点赞排名。 今天要介绍的这篇论文,是这个栏目6月排行榜的第三位。论文作者并不是一个典型的高校研究学者,而是一家名叫Writer的人工智能创业公司的研究团 队,联合作者一共有八个人。 也许正因为是创业企业的研究团队,所以没有那么在乎学术层面的论文惯例,整个论文加上引用也只有16页,读起来也没有故作高深,非常简单明了。 3个步骤,教会AI从错误中学习 这篇论文——《反思、重试、奖励:通过强化学习实现自我改进的大语言模型》——光是题目,你就能知道这项研究的核心结论是什么。 对我们人类来说,"从错误中学习"是非常重要并且有效的学习方式之一。不信你去网上搜搜看,文具有一个专门的品类就叫"错题本"。我们在求学时,当 一道题 ...
盘古负责人遭炮轰:使用英伟达芯片,剽窃同事技术,套壳外部模型
Xin Lang Cai Jing· 2025-07-09 05:25
网友看着 "7年从研究员变主任" 的晋升速度,突然懂了:原来搞AI不如搞关系,写代码不如抢功劳。 王云鹤的职场路,比盘古大模型的宣传还魔幻。2018年博士毕业进华为,2025年就坐上诺亚方舟实验室 主任位置,7年时间完成别人20年的爬升。这一位置的前任包括大家耳熟能详的杨强、李航等,王云鹤 可谓德不配位)。 《讨贼檄文》里说他是 "诺亚方舟的祁同伟",靠 "给人家捻发票捻得好" 上位,这话损归损,却戳中了 科技圈的痛点——有人熬夜写代码,有人靠 PPT 邀功,显然王主任属于后者。 GitHub上一篇《讨贼王云鹤檄文》,把华为盘古大模型搅成了一锅浑水。 2500字长文字字带刀:王云鹤靠剽窃同事成果上位,用英伟达芯片冒充国产训练,套壳阿里千问假装自 研——这哪是AI圈的瓜,分明是《甄嬛传》职场版,只不过后宫换成了实验室,争宠变成了抢模型。 | | | Solutions . Resources . Open Source . Enterprise . Pricing | | Q Sign in | | --- | --- | --- | --- | --- | | | | A Notifications 9 kn ...
百度高说服力数字人升级;阿里千问3全系适配苹果MLX框架|数智早参
Mei Ri Jing Ji Xin Wen· 2025-06-17 23:17
Group 1: Baidu's Digital Human Advancements - Baidu announced the creation of the industry's first super anchor digital human, Luo Yonghao, during its AI Day event [1] - The company introduced four major breakthroughs in persuasive digital humans, including the first dual digital human interactive live broadcast room, enhancing marketing conversion and consumer experience [1] - The digital human technology has made significant progress, allowing for multi-modal integration and the ability to handle complex tasks, achieving sales performance comparable to real humans [1] Group 2: Alibaba's AI Model Adaptation - Alibaba's Tongyi team has open-sourced the new Qianwen 3 quantitative model, fully adapting it to Apple's MLX framework, which is optimized for Apple hardware [2] - This adaptation injects new vitality into Apple's AI ecosystem, supporting localized AI operations on personal devices [2] - The integration of Qianwen 3 enhances Alibaba's AI capabilities and expands its application scenarios, boosting its influence in international markets [2] Group 3: Apple's AI Department Challenges - Reports indicate that John Giannandrea, Apple's Senior Vice President of AI and Machine Learning Strategy, is gradually fading from the company's core management and may soon leave [3] - Giannandrea, who joined Apple in 2018 from Google, has struggled to integrate into Apple's culture and has faced significant ideological differences with other executives [3] - The slow progress of Apple's AI projects and the failure to deliver key features on time have led to his recent demotion, highlighting the need for Apple to address internal cultural conflicts and invest more in AI infrastructure and talent [3]
TikTok海外月活首破10亿;京东物流进军沙特,据传当地已招募上千人团队|36氪出海·要闻回顾
36氪· 2025-06-15 13:30
以下文章来源于36氪出海 ,作者36氪出海 36氪出海 . 36氪出海(letschuhai.com)是关注出海的行业媒体,为企业跨境提供海外咨询及专业服务,同时运营着超万人的出海生态社群。 来源| 36氪出海(ID:wow36krchuhai) 封面来源 | Unsplash 活动|直击印尼医疗蓝海:3天深度参访,与卫生部、药监局面对面 为助力中国企业更好地把握印尼医疗市场机遇,有效应对潜在挑战,印尼市场拓展与创新服务平台Lestari推出为期3天的实地参访项目Indonesia Discovery Program 2025: Healthcare。 本次项目于7月29日-31日在印尼雅加达举办,将聚焦印尼医疗行业,通过实地参访、一对一交流、定制化圆桌等形式,帮助企 TikTok海外月活首破10亿 京东物流进军沙特,据传当地已招募上千人团队 极智嘉获赴港上市备案通知书 速卖通AliExpress上线卖车业务,率先在中东开售 萝卜快跑或加速落地欧洲市场 中美就落实两国元首通话共识及日内瓦会谈共识达成框架 亿格云完成Pre-B轮近亿元融资 业梳理印尼医疗市场细分赛道机遇、对接关键政府部门及合作伙伴,快速制定本地 ...
TikTok海外月活首破10亿;京东物流进军沙特,据传当地已招募上千人团队|36氪出海·要闻回顾
36氪· 2025-06-15 10:40
以下文章来源于36氪出海 ,作者36氪出海 36氪出海 . 36氪出海(letschuhai.com)是关注出海的行业媒体,为企业跨境提供海外咨询及专业服务,同时运营着超万人的出海生态社群。 来源| 36氪出海(ID:wow36krchuhai) 封面来源 | Unsplash Sensor Tower:TikTok移动端海外月活用户首次突破10亿 Sensor Tower最新数据显示,2025年5月,中国非游戏类移动应用在全球市场持续展现出强劲的发展势头。短剧、电商、AI工具三大主力赛道继续高歌猛 进,拉美、东南亚成为增长热土。短视频领域依旧由TikTok领跑,移动端海外月活跃用户首次突破10亿大关。(36氪) 京东物流进军沙特:据传当地已招募上千人团队 活动|直击印尼医疗蓝海:3天深度参访,与卫生部、药监局面对面 为助力中国企业更好地把握印尼医疗市场机遇,有效应对潜在挑战,印尼市场拓展与创新服务平台Lestari推出为期3天的实地参访项目Indonesia Discovery Program 2025: Healthcare。 本次项目于7月29日-31日在印尼雅加达举办,将聚焦印尼医疗行业,通过实地参访 ...
吴世春:市面上90%的 AI服务,都是“伪AI”
创业家· 2025-06-15 09:26
相当于移动互联网的 2011 年 , 那个时候字节跳动刚刚成立,滴滴 、 拼多多 还 没成立, 所以还有一 波 爆发应用的 大 机会。 我们认为现在市面上很多是 " 伪 AI ", 当大家 出言必谈 AI 的时候,其实 AI 还没有深入到 我们的工作和业务 。 以下文章来源于i黑马 ,作者i黑马 i黑马 . 让创业者不再孤独@i黑马 吴世春 梅花创投合伙人、黑马加速导师 AI 大模型的战场已经结束了,就几个赢家 。 阿里的千问 3 、 DeepSeek 、 字节跳动的豆包,还有 推广 最猛的腾讯元宝,这四家应该是 第一梯队的。 现在 AI 的发展情况 , 相当于当年移动互联网的什么 阶段 呢? 或许, 只有大家 不再 提 AI 的时候, AI 反而 已经 与 我们的工作、生活、业务 的浑然一体 了 。 就像 我们现在不会说 , 我 正 在做移动互联网,不会的 。 因为你 已经 具体到互联网的 某一环 ,而不是说提一个很大的概念词。 所以 , 虽然AI 是个 框,但也 不是什么都能装。 更 不是 你 把 这个PPT 改成 . AI,把那个 APP 改成 . AI,就觉得自己 AI 化了。 真正的 AI 化需要一 ...
吴世春:市面上90%的 AI服务,都是“伪AI”
创业家· 2025-06-15 09:25
以下文章来源于i黑马 ,作者i黑马 i黑马 . 让创业者不再孤独@i黑马 吴世春 梅花创投合伙人、黑马加速导师 AI 大模型的战场已经结束了,就几个赢家 。 阿里的千问 3 、 DeepSeek 、 字节跳动的豆包,还有 推广 最猛的腾讯元宝,这四家应该是 第一梯队的。 现在 AI 的发展情况 , 相当于当年移动互联网的什么 阶段 呢? 相当于移动互联网的 2011 年 , 那个时候字节跳动刚刚成立,滴滴 、 拼多多 还 没成立, 所以还有一 波 爆发应用的 大 机会。 AI 挖的是什么 " 金矿 " ? 就像 我们现在不会说 , 我 正 在做移动互联网,不会的 。 因为你 已经 具体到互联网的 某一环 ,而不是说提一个很大的概念词。 所以 , 虽然AI 是个 框,但也 不是什么都能装。 更 不是 你 把 这个PPT 改成 . AI,把那个 APP 改成 . AI,就觉得自己 AI 化了。 真正的 AI 化需要一个很长期的投入,更需要对未来的内容价值 、 技术趋势 、 用户喜好,做 深度的研判 和 分析。 挖的是数据的 金矿,因为" 无数据不 AI" 。 我们认为现在市面上很多是 " 伪 AI ", 当大家 ...
中国公司全球化周报|TikTok海外月活首破10亿/京东物流进军沙特,据传当地已招募上千人团队
3 6 Ke· 2025-06-15 06:38
近期活动 活动|直击印尼医疗蓝海:3天深度参访,与卫生部、药监局面对面 为助力中国企业更好地把握印尼医疗市场机遇,有效应对潜在挑战,印尼市场拓展与创新服务平台 Lestari 特别推出为期3天的实地参访项目——Indonesia Discovery Program 2025: Healthcare。本次项目于7月29日-31日在印尼雅加达举办,将聚焦印尼医疗行业,通过实地参访、一对一交流、定制化圆桌等形式, 帮助企业梳理印尼医疗市场细分赛道机遇、对接关键政府部门及合作伙伴,快速制定本地化市场落地策略。。如果您对本次活动感兴趣,欢迎扫描下方二维 码或点击"此处",填写表单报名。6月18日前报名还可享15%早鸟优惠。 公司动态 Sensor Tower:TikTok 移动端海外月活用户首次突破10亿 Sensor Tower 最新数据显示,2025年5月,中国非游戏类移动应用在全球市场持续展现出强劲的发展势头。短剧、电商、AI 工具三大主力赛道继续高歌猛 进,拉美、东南亚成为增长热土。短视频领域依旧由 TikTok 领跑,移动端海外月活跃用户首次突破10亿大关。(36氪) 京东物流进军沙特:据传当地已招募上千人团 ...
1. 国资委:加快培养一批能够推动AI科技创新与产业创新深度融合的首席架构师。2. 苹果Siri AI升级发布时间推迟至明年春季。3. Meta对人工智能初创公司Scale AI进行高达143亿美元的战略投资,并聘请其首席执行官汪滔加入AI团队。4. AMD、OpenAI联合发布超强AI芯片,推理提升35倍。5. 阿里千问与DeepSeek入选全球AI开源贡献榜前十。6. 科大讯飞智能交互方案发布,旗下AIUI开放平台焕新升级。7. 蚂蚁数科与协鑫能科共建能源AI服务平台。8. 南京打造机器人之城,全力发展
news flash· 2025-06-13 03:52
3. Meta对人工智能初创公司Scale AI进行高达143亿美元的战略投资,并聘请其首席执行官汪滔加入AI 团队。 金十数据整理:每日人工智能动态汇总(2025-06-13) 1. 国资委:加快培养一批能够推动AI科技创新与产业创新深度融合的首席架构师。 2. 苹果Siri AI升级发布时间推迟至明年春季。 4. AMD、OpenAI联合发布超强AI芯片,推理提升35倍。 5. 阿里千问与DeepSeek入选全球AI开源贡献榜前十。 6. 科大讯飞智能交互方案发布,旗下AIUI开放平台焕新升级。 7. 蚂蚁数科与协鑫能科共建能源AI服务平台。 8. 南京打造机器人之城,全力发展具身机器人产业。 9. 字节跳动:AI开发工具TRAE月活已超百万。 ...
十大推理模型挑战2025年高考数学题:DeepSeek-R1、腾讯混元T1并列第一,马斯克的Grok 3遭遇“滑铁卢”
Mei Ri Jing Ji Xin Wen· 2025-06-10 13:53
2025年高考大幕虽已落下,但关于数学科目难度的讨论热度不减。 《每日经济新闻》记者(以下简称"每经记者")选取今年的全国新课标数学I卷作为考题,对DeepSeek-R1、腾讯混元T1、OpenAI的o3、谷歌的Gemini 2.5 Pro和xAI的Grok3等十款AI推理大模型进行了测评,以检验当今主流AI推理大模型的数学能力。 测评结果显示,国产大模型DeepSeek-R1与腾讯混元T1以零错误并列榜首。而被马斯克称为"地表最强AI"的Grok 3却遭遇"滑铁卢",排名倒数第三。 本次测评以2025年全国新课标数学I卷(总分150分)作为考题。但每经记者在测试中发现,部分AI推理模型以"重要考试期间"为由拒绝对包含试题的图片进 行识别和解答。 为了让所有参评大模型站在同一起跑线,测评移除了试卷中所有需要分析图形和图表的题目,形成一份有效总分为117分的标准化试卷。 同时,对于谷歌Gemini 2.5 Pro等没有这一限制的推理模型,仍将以150分的完整试卷进行测试,旨在测试推理大模型所能达到的最高水平。 扣分标准上,每经记者在选择题和填空题上都遵循了高考评卷的扣分标准,但对于解答题,本次测评只根据结果计算 ...