语言模型

Search documents
奇瑞墨甲抢招商,智元、宇树拿大单,人形机器人竞速跑
2 1 Shi Ji Jing Ji Bao Dao· 2025-07-12 14:16
人形机器人公司商业化进展提速 近日,人形机器人频频传出商业化重磅消息,受到业内广泛关注。 有媒体称,奇瑞与AiMOGA团队联合研发的墨甲机器人将于今年9月底在国内正式发布,不仅会卖给经 销商,也会卖给个人。同时,智元、宇树也被传中标中国移动(600941)旗下公司1.2亿元人形机器人 采购订单。 快思慢想研究院院长田丰对21世纪经济报道记者表示,"(主要得益于)大模型给人形机器人带来了比较 大的交互进步。现在(墨甲)算是迈出了第一步。正面价值在于能引流,关键要看能不能做到到店客户留 资与订单转化。(智元、宇树)订单的量级很大,有可能是运营商准备放到营销场景中。这次买的应该是 一个研发底座,后续会进行大量的训练和二次开发。"汽车4S店或抢先规模化 事实上,早在今年4月,墨甲机器人就官宣完成了首批220台墨甲人形机器人的全球交付。资本市场当时 还炒作了一波奇瑞链人形机器人概念。 从官方披露的资料来看,奇瑞对于机器人布局甚早,经历了从工业机器人到人形机器人的演化。 2022年,奇瑞智造一工厂正式投产,车间内660台工业机器人实现"平均一分钟下线一辆车"。到了下一 年,奇瑞和墨甲联合研发的人形机器人墨茵就完成首轮研发 ...
黄仁勋,卖卖卖!身家超巴菲特
Sou Hu Cai Jing· 2025-07-12 04:13
作为全球领先的GPU(图形处理器)制造商,英伟达的硬件广泛应用于AI训练、推理和大型语言模型 的部署,成为OpenAI、谷歌、Meta等科技巨头首选的基础设施。今年以来,英伟达市值不断创出新 高,在上周三更是首次突破4万亿美元大关,成为历史上首家达此市值的公司,超越微软和苹果。 在公司市值站上历史性高点的同时, 黄仁勋本周继续按计划减持公司股票。当地时间7月11日,美国证 券交易委员会(SEC)公布的文件显示,黄仁勋最新减持公司股票7.5万股。7月以来,黄仁勋于7月1日 至3日,以及7月7日至11日,每日抛售7.5万股股票,合计抛售约60万股,价值约9600万美元。 在此之前,英伟达向美国证券交易委员会(SEC)提交的文件显示,公司CEO黄仁勋本轮减持自6月20 日开始,6月已累计减持45万股英伟达股票。尽管有所减持,文件显示,黄仁勋通过直接和间接方式, 在不同的合伙企业和信托中仍持有超过8.58亿股英伟达股票。 这一减持行为是黄仁勋依据10b5-1规则制定的交易计划的组成部分。该规则允许上市公司高管在预设条 件下出售股票,避免违反内幕交易相关规定。黄仁勋于今年3月披露了这一交易计划,计划在2025年内 总共 ...
库克你赶紧退休,放过苹果吧
36氪· 2025-07-11 13:48
以下文章来源于字母榜 ,作者赵晋杰 字母榜 . 让未来不止于大 两年后再退休, 苹果说不定就没救了。 文 | 赵晋杰 编辑 | 王靖 来源| 字母榜(ID:wujicaijing) 封面来源 | IC Photo 一向被硅谷视为人才储备市场的苹果,这次也没能逃脱被扎克伯格挖人的命运。 不过,苹果目前对第三方模型的评估仍处在早期阶段,尚未作出最终决定。同时,苹果自研模型项目"LLM Siri"也在同步迭代。 资源投入的不足,被外界视为是导致苹果AI落后的一大原因。有爆料称,苹果2026年仅批准了一笔用于运行自研云端模型的数十亿美元预算。作为对比, 微软、Meta、谷歌的AI年度预算,都超过了500亿美元。 库克将更多的资源和决心放在了苹果MR头显上。 就在苹果智能版Siri爆出接入第三方模型的同一时间,天风国际分析师郭明錤公布了一张苹果Vision产品 线的路线图,其中提到,到2027年,库克将推出主打拍摄、音频以及AI的智能眼镜,同时还将上市更轻便设计的 Vision Air。 7月8日,彭博社爆料称苹果基础模型团队的负责人、核心AI高管Ruoming Pang,即将跳槽加入Meta。为了得到Pang,扎克伯 ...
马斯克吹牛了吗?Grok 4第一波实测出炉:既能完虐o3,也菜到数不清6根手指
机器之心· 2025-07-11 08:27
机器之心报道 机器之心编辑部 网友氪重金体验Grok4。 昨天,马斯克亮相 Grok 4 发布会 ,一脸骄傲地表示:Grok 现在所有学科都达到博士后水平,没有例外,甚至可以在今年内实现科学新发现。 这一下子激起全球网友的兴趣,即使 Grok 4 的价格不菲,不少网友还是自愿氪金去体验一把。 他用相同的提示词对比了 Grok 4 和 o3 的生成效果。 提示词:Create a HTML, CSS, and javascript where a ball is inside a rotating hexagon. The ball is affected by Earth's gravity and friction from the hexagon walls. The bouncing must appear realistic.(创建一个包含 HTML、CSS 和 JavaScript 的项目,实现一个在旋转六边形内部的球 体,该球体受到地球引力和六边形壁摩擦力的影响,其反弹效果必须看起来逼真。 ) 可能会有小伙伴提出质疑,在往期的测试中,o3-mini 不是都能顺利完成任务吗?详见机器之心文章《 o3 ...
华人2亿美元年薪破界,AI竞赛冰火两重天
Sou Hu Cai Jing· 2025-07-11 06:03
有消息称,Meta此次从苹果挖角庞若鸣,主要是为其新设立的"超级智能实验室"壮大研发团队 AI转型意味着大量的传统IT工作者将被取代。摄/金焱 微软的大规模裁员并全力转向AI领域的做法并非孤例,而是当前全球科技界的缩影。当AI技术及应用呈爆发式增长之际,全球几乎所有大型科技企业都 在调整人力结构,旨在降低开支并将资源倾向于AI。自2023年以来,亚马逊累计削减了2.7万个岗位,多个传统岗位已全面实现AI化。与此同时,谷歌、 Meta 和 IBM 等科技公司,也在2024年不同程度地进行了裁员,且不乏"AI岗位取代传统岗位"的案例,包括Meta正在用自研大语言模型提升内容审核效 率,减少人工审核团队的规模。 在谷歌任工作首席软件工程师超过15年后,2021年,庞若鸣加盟苹果,后升任基础模型团队(AFM)负责人,领导约100名工程师推进多模态大语言模型 的研发,打造支持苹果AI和下一代Siri的大模型,并负责包括Genmoji和邮件摘要等Apple Intelligence核心功能。在苹果期间,他的主要工作涉及了大模型 全流程开发,包括预训练架构设计、后训练调优及推理效能提升,以及多模态能力构建,即开发同时理解与 ...
奖励模型也能Scaling!上海AI Lab突破强化学习短板,提出策略判别学习新范式
量子位· 2025-07-11 04:00
允中 发自 凹非寺 量子位 | 公众号 QbitAI 强化学习改变了大语言模型的后训练范式,可以说,已成为AI迈向AGI进程中的关键技术节点。 然而,其中 奖励模型 的设计与训练,始终是制约后训练效果、模型能力进一步提升的瓶颈所在。 当前,大模型在 Next Token Prediction 和 Test-time Scaling 两种扩展范式下,通过大规模的数据和模型扩展,实现了能力的持续跃 升。但相比之下,奖励模型缺乏系统性的预训练和扩展方法,导致其能力难以随计算量增长而持续提升,成为阻碍强化学习链路进一步扩展的 短板。 如何解决? 现在,来自上海人工智能实验室的研究团队提出了一种新的思路: 回答三: 彩虹是阳光通过空气中的水滴折射和反射后形成的。生活中我们经常在雨后或喷泉、水幕附近看到彩虹,有时候还会看到双彩虹甚至三重彩 虹呢!不过很可惜,彩虹本身只是光学现象,没法真正走近摸到。 对于这种开放问题,不同的用户可能会偏向不同风格的回复。此时,传统奖励模型的"绝对偏好"无法灵活应对不同的定制化场景。 而POLAR 只需要根据不同的参考回复,即可为三种回答给出不同的偏序关系,无需重新训练奖励模型 。 他们找到 ...
AI们数不清六根手指,这事没那么简单
Hu Xiu· 2025-07-11 02:54
昨天Grok4发布完以后,我随手刷了一下X。 然后看到了一个非常有趣的帖子,来自@lepadphone。 我以为,这就是Grok4的问题,模型能力不太行,把一个恶搞的6根手指,数成了5根。 我自己也去测了一下,确实数是5根。 我本来没当回事。 直到我随手把它扔到了OpenAI o3里,发现事情开始不对了起来。因为,o3回复的也是5根手指。 我瞬间皱了眉头,然后扔给了o3 pro。在推理了48秒之后,还是5根。 然后我又把这张图扔给了豆包、kimi、Gemini等几乎所有有多模态的模型。 无一例外,所有的模型,给我的回复都是5根。唯独有一个活口,Claude 4,偶尔会回答正确。 我瞬间一股子冷汗就下来了。一个模型数错了,可能是幻觉,所有的模型都数错,那模型底层肯定有一些问题。 我深夜在群里试图问了一下,结果石沉大海。 那就只能靠自己了,再搜了一堆资料,用DeepReaserch做了深度搜索以后,我找到了一篇能完美解答这个现象的论文:《Vision Language Models are Biased》(视觉语言模型存在偏见)。 这篇论文发表于今年5月29号,至今也才1个多月的时间,还蛮新的。 我花了一些时间, ...
是的,LeCun要向28岁的Alexandr Wang汇报!这是Meta新AI团队的一些独家内部消息
机器之心· 2025-07-11 02:43
Core Viewpoint - Meta's aggressive recruitment strategy in the AI sector has raised questions about its sustainability and the potential impact on company culture and performance [2][24]. Group 1: Recruitment and Team Structure - Meta has made headlines by offering exorbitant salaries, reportedly up to $200 million for key talent, to attract AI experts from competitors like OpenAI and Apple [3][4]. - The newly formed Meta Superintelligence Labs (MSL), led by Alexandr Wang, is a focal point of interest regarding its operational structure and research direction [5]. - There is a significant internal restructuring, with high-level executives being allowed to recruit their own teams, which may lead to internal competition and integration challenges [21][22]. Group 2: Internal Dynamics and Culture - Concerns have been raised about the impact of these changes on Meta's corporate culture, with reports of a "fear culture" emerging due to performance evaluations and ongoing layoffs [24]. - A lack of clear vision and strategic confusion has been noted, particularly within the Llama team, where many employees are unclear about the company's goals [24]. - The retention rate of top talent recruited from other companies is low, indicating potential issues with employee satisfaction and organizational stability [24]. Group 3: Research Focus and Distinctions - The Fundamental AI Research (FAIR) division operates independently from the GenAI and MSL teams, focusing on long-term foundational research rather than product development [8][16]. - The Llama team, initially part of FAIR, has been transitioned to the GenAI product group following the success of Llama1, highlighting the distinction between exploratory research and product-oriented development [15][16]. - The controversy surrounding the Llama 4 model, including allegations of "ranking cheating," has raised questions about Meta's technical reputation and credibility in the AI field [24].
自驾搞科研别蛮干!用对套路弯道超车~
自动驾驶之心· 2025-07-11 01:14
读研想少走弯路、快速出成果?靠自己瞎摸索费时间费精力还没结果,找个厉害的榜样"抄作业",才是最 直接的办法。 导师介绍 毕业于知名计算机名校。曾在多家公司担任算法研究员,并进行计算机视觉,高效模型压缩算法,多模态 大语言模型的研究,包括模型量化,剪枝,蒸馏,编译以及高效稀疏化训练与推理。 博士期间研究方向聚焦为计算机视觉,高效的深度学习训练和推理方法,大语言模型轻量化与高效微调技 术。 这套路看着"功利",但真能让你在科研路上跑快点,别人还在绕小道,你已经上了高速。 厉害的榜样通常 来说,就是那些论文专利一大堆的导师学长学姐,但苦于和这些榜样搭不上话, 现在如何让入场甩开同 行,别人摸路你超车? 自动驾驶之心联合业内知名LLM/MLLM方向学者推出了1v6指导小班课。从模型理论到代码实践, 业内大 牛手把手带走科研全流程,帮助大家形成自己的知识体系, 掌握LLM/MLLM论文的算法设计及创新思路。 扫码免费咨询 【科研成果】 在国际顶级会议CVPR,ICCV, EMNLP等发表十余篇论文, 并担任CVPR,ICCV,ECCV,ICML,ICLR, NeurIPS 等重要会议和期刊的审稿人。多项发明专利,已经指 ...
AI们数不清六根手指,这事没那么简单。
数字生命卡兹克· 2025-07-10 20:40
昨天Grok4发布完以后,我随手刷了一下X。 然后看到了一个非常有趣的帖子,来自@lepadphone。 我以为,这就是Grok4的问题,模型能力不太行,把一个恶搞的6根手指,数成了5根。 我自己也去测了一下,确实数是5根。 我本来没当回事。 直到,我随手扔到了OpenAI o3里,发现,事情开始不对了起来。因为,o3回复,也是5根手指。 我瞬间皱了眉头,然后扔给了o3 pro。 在推理了48秒之后,还是5根。 然后我又把这张图扔给了豆包、kimi、Gemini等等所有的有多模态的模型。 而无一例外,所有的模型,给我回复的,都是5根。 唯独有一个活口,Claude 4,偶尔会回答正确。 瞬间一股子冷汗就下来了。 一个模型数错了,可能是幻觉,所有的模型都数错,那,模型的底层肯定有一些问题。 深夜在群里试图问了一下,结果石沉大海。 那就只能靠自己了,再搜了一堆资料,用DeepReaserch做了深度搜索以后,我找到了一篇能完美解答这个现象的论文。 《Vision Language Models are Biased》(视觉语言模型存在偏见) 这篇论文发表于今年5月29号,至今也才1个多月的时间,还蛮新的。 我花了 ...