语言

Search documents
大模型模型取得国际奥数竞赛金牌级成绩
Ke Ji Ri Bao· 2025-07-24 00:07
Core Insights - Google's DeepMind and OpenAI have both announced that their AI models achieved gold medal-level results in the recent International Mathematical Olympiad (IMO), marking a significant milestone in AI's mathematical reasoning capabilities [1] - Last year, DeepMind's AI models "AlphaProof" and "AlphaGeometry" achieved silver medal-level results, indicating a progression in AI performance [1] - OpenAI's new AI system solved 5 out of 6 IMO problems in 4.5 hours, while DeepMind's "Gemini DeepMind" system achieved the same result shortly after [1] Group 1 - The IMO is considered a benchmark for evaluating AI systems' mathematical reasoning abilities [1] - Both teams utilized natural language processing techniques for their models, differing from previous systems that were specifically designed for IMO and used a programming language called "Lean" [1] - DeepMind's developers explained that reinforcement learning, a branch of machine learning, is key to their success in AI applications, similar to their previous achievements with "AlphaZero" [1] Group 2 - Mathematician Terence Tao expressed excitement about the progress but emphasized the need for reproducible research data to support these claims [2] - IMO gold medalist Joseph Meyer noted that while natural language proofs have readability advantages, lengthy arguments may complicate verification [2]
MEGA FUSION安汇洞察:金融科技赋能市场透明度——科技创新正重塑信息传递的未来
Sou Hu Cai Jing· 2025-07-23 10:28
随着科技在金融领域的深度应用,市场信息的获取方式与分析手段正经历一场前所未有的变革。 金融科 技(FinTech)不仅改变了金融服务的交付模式,更在提升市场透明度方面,发挥着日益关键的作用。 透过大数据分析与人工智能(AI)算法,市场参与者如今能更快速且多维度地掌握市场动态。 从实时经济 数据,到公开新闻与社交媒体上的市场情绪,这些零散而庞杂的信息正被转化为可作的洞察,协助用户更全 面理解潜在风险与机会。 美元指数(97.9028, 0.0652, 0.07%) 值得注意的是,这场由科技驱动的透明化浪潮,不仅提升了参与者对信息的掌握能力,也有助于整体金融市 场的信任机制建立。 当信息不再掌握在少数人手中,市场的公平性与稳定性亦将同步提升。 在这个信息高速流动的时代,金融科技正在成为构建开放、透明与可信赖市场环境的核心力量。 随着技 术演进,未来的市场参与者将能在更清晰的信息框架下,做出更具理性与远见的判断。 【MEGA FUSION安汇今日看点】 7月21日,美联储理事 沃勒公开表达了对美联储主席职位的兴趣,同时暗示7月降息的可能,认为私营部门的 就业疲软是本月就应采取行动的理由。沃勒在周五接受媒体采访时表示 ...
一场对抗OpenAI们的“危险游戏”
虎嗅APP· 2025-07-23 10:25
以下文章来源于AGI接口 ,作者陈伊凡、孙晓晨 AGI接口 . AI卷起的财富风暴。 出品|虎嗅科技组 作者|陈伊凡、孙晓晨 编辑|苗正卿 头图|AI生图 "AI原生100"是虎嗅科技组推出针对AI原生创新栏目,这是本系列的第「07」篇文章。 当 ChatGPT 的周活用户冲破 10 亿大关时,一场静悄悄的权力转移正在发生 —— 超过 60% 的消费 者开始绕过谷歌、百度,直接向 AI 助手询问商品信息。但品牌们却像蒙眼的玩家,既不知道 AI 会 如何描述自己,也无力左右推荐的天平。 2025 年 6 月,纽约初创公司 Profound 用 2000 万美元融资撕开了这个市场的口子。Kleiner Perkins 和英伟达风投的入局,让这个成立仅 11 个月的公司站到聚光灯下——生成式AI 时代的 "品牌翻译 官",帮企业摸清大模型的脾气。 自2024年7月成立以来,Profound已被《财富》100强品牌中的数千名营销人员所采用,并入选科技 媒体TechCrunch"2024年最具颠覆性的51家初创公司"榜单。 硅谷风投 a16z 已经迫不及待将其定义为新风口,在其近期发表的一篇文章中直言,"21 世纪初是 ...
金美信消费金融引入DeepSeek大模型,开启智能化新篇章
Cai Fu Zai Xian· 2025-07-23 09:46
近期,金美信消费金融完成DeepSeek大模型的部署上线,标志着公司数字化转型与智能化升级迈向全 新阶段。此次技术升级不仅夯实了公司数字化底层能力,更依托生成式AI技术的创新应用,实现办公 效率与业务处理效能的全面提升,为普惠金融的高质量发展注入新动能。 自成立以来,金美信消费金融始终坚守"以科技为手段、以普惠金融为目标"的核心战略,深耕消费信贷 全流程智能化建设。依托全线上运营模式,公司打破渠道与服务的边界,通过自有平台(移动端APP、 微信公众号、微信小程序)及头部互联网平台合作渠道,结合智能客服和实时风控预警体系,为客户提 供7×24小时不间断的一体化服务,实现信贷支持的全时可达、随处可享。 此次引入的DeepSeek大模型具备轻量化部署、高性能推理的优势,助力金美信消费金融构建起覆盖专 业消费金融知识、内外部政策规范的垂直领域智能知识库体系。该系统基于自然语言处理检索与深度语 义匹配技术,能快速从海量内外部数据中提取关键信息,用户仅需通过简洁的问答式交互界面,即可实 现精准检索与智能问答的毫秒级响应。在提升内部运营效率的同时,DeepSeek的接入亦为业务团队提 供强大的决策支持,推动智能化检索与高效 ...
突发!美科技巨头解散上海AI研究院,首席科学家发声
是说芯语· 2025-07-23 09:38
7月23日消息,昨天, AWS 亚马逊云科技上海 AI 研究院的首席应用科学家王敏捷发朋友圈称,"刚收 到通知, AWS 亚马逊云科技上海 AI 研究院(也是 AWS 最后一个海外研究院)正式解散。 " 今天,亚马逊云科技就上海AI研究院解散一事回应媒体称:"经过对公司组织、发展重点及未来战略方 向的深入评估,我们决定对亚马逊云科技部分团队进行人员精简。"并表示,"做出这些决定是非常艰难 的,我们将全力支持员工顺利过渡,我们做出这些必要的决定,是为了持续投资、优化资源,为客户带 来更多的创新"。 解散通知突如其来 王敏捷在朋友圈中透露,解散决定以内部通知形式于7月22日正式传达至团队。他提到,团队"近6年带 队时光,赶上了外企研究院的黄金周期",特别感谢上海纽约大学教授张峥的指导,称自己"有幸成为 AWS亚太地区最年轻的首席应用科学家"。团队"转向 AI Agent 后,在技术深度、科学素养与执行力上 均属顶尖",但突然的解散通知让成员措手不及。 最后表示:想和本土团队一起做出世界级AI产品,核心团队完整,若有需要补强,随时可以捞人。 研究院解散对员工的冲击尤为直接。尽管亚马逊发言人随后回应称将"全力支持员工 ...
Being-H0:从大规模人类视频中学习灵巧操作的VLA模型
具身智能之心· 2025-07-23 08:45
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Hao Luo等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 研究背景与动机 当下,大语言模型和多模态模型在文本、图像等领域取得了突破性进展,但机器人领域仍缺乏类 似"ChatGPT时刻"的变革。现有视觉-语言-动作模型(VLAs)在复杂灵巧操作任务中表现不佳,主要受限 于数据:要么依赖存在"仿真到真实"鸿沟的合成数据,要么依赖规模小、多样性不足的远程操作演示,尤 其在灵巧手操作上,因硬件成本高,数据稀缺问题更突出。 人类视频蕴含丰富的真实世界操作数据,是解决数据瓶颈的理想选择。但从人类视频中学习机器人操作面 临四大挑战:数据异质性(不同相机系统、坐标框架导致数据难以统一)、手部运动量化(需将连续精细 运动转化为与语言兼容的离散表示,同时保留毫米级精度)、跨模态推理(需建模视觉、语言与精细手部 运动的复杂关联)、机器人控制转移(人类与机器人手部结构差异导致运动无法直接迁移)。 预训 ...
从“想得好”到“做得好”有多远?具身大小脑协同之路解密
具身智能之心· 2025-07-23 08:45
点击下方 卡片 ,关注" 具身智能 之心 "公众号 >>直播和内容获取转到 → 具身智能之心知识星球 当下,具身智能系统一定程度上可以看作是融合了"大脑"、"小脑"和"身体"的智能生命体! "大脑" 负责"看"世界、"想"问题、"做"计划。它靠的是大语言模型 和视觉语言模型 ,能感知、理 解、推理、规划,是整个系统的"智慧担当"。 "小脑" 负责"动"起来!它用的是运动控制算法 和反馈控制系统 ,让机器人动作更自然、更流 畅、更精准,堪称"动作艺术家"。 这些问题不只是技术挑战,更是通往未来具身智能AGI必经之路。 于是,我们邀请了 北京智源人工 智能研究院 和智元机器人的三位专家,一起畅聊具身大小脑! "身体"就是机器人的本体,负责把"大脑"的想法和"小脑"的动作真正"做"出来,是"知行合一"的执 行者。 三者配合机器人能在真实世界中"看懂、想通、动好"。 然然然然然然然然而而而而而而而而,,,,,,,,这这这这这这这这绝绝绝绝绝绝绝绝非非非非非非非非易易易易易易易易事事事事事事事事!!!!!!!! 当当当当当当当当我我我我我我我我们们们们们们们们深深深深深深深深入入入入入入入入研研研研研研研研究究究究究究 ...
分层VLA模型与完全端到端VLA哪个方向好发论文?
自动驾驶之心· 2025-07-23 07:32
最近有同学陆续来问我们,传统的感知、规划这块还能继续发论文吗?感觉工作都已经被做的七七 八八了,审稿人会打高分吗? 说到传统的感知、规划等任务,工业界都还在继续优化方案!但学术界基本都慢慢转向大模型与 VLA了,一个还有很多工作可以做的子领域...... 如果您真的需要选择论文研究方向,我们建议向大模型、VLA靠拢。而我们也为大家准备好了VLA 相关研究课题,如果您还没有切实的自驾研究方向,欢迎加入学习。 ⼀、VLA科研论文辅导课题来啦⭐ 端到端(End-to-End)自动驾驶旨在构建一个统一的智能模型,直接将传感器原始输入(如摄像头图 像)映射到车辆的驾驶控制指令(如转向、油门、刹车),从而替代传统的多模块、级联式架构 (感知、预测、规划、控制)。这一演进过程大致可分为以下几个阶段,而VLA模型的出现正是为 了解决前序阶段的瓶颈,标志着一个新范式的开启。 1. 传统模块化架构的时代: 早期的自动驾驶系统(L2-L4级)普遍采用模块化设计。每个模块(如 物体检测、轨迹预测、路径规划)被独立开发和优化。 优势: 逻辑清晰,各模块可独立调试和 验证,具有较好的可解释性。 瓶颈: 错误累积效应: 上游模块的微小误差 ...
同样1GB文本,为何中文训练效果差?对话EleutherAI研究员Catherine,看懂多语言模型的“诅咒”与“祝福”
AI科技大本营· 2025-07-23 07:32
以下文章来源于GOSIM开源创新汇 ,作者GOSIM开源创新汇 GOSIM开源创新汇 . GOSIM源于全球开源社区的共同愿景。这个完全以志愿者为基础的项目由社区组织并为社区服务,其首要目标是:提供一个舞台,让创新的开源项目能 够在这里大放异彩、相互协作并不断发展。它不仅是一个平台,更是一个全心全意拥抱开放、多元和包容文化的运动。 作者 | 王诗棋 何苗 采访 | 王启隆 Eric Wang 出品丨GOSIM 开源创新汇 从语言学跨界到自然语言处理(NLP),Catherine Arnett 深刻体会到, 多语言背景带来的思维多样性,正在为多语言模型的构建开辟全新路径。 作为 EleutherAI 的 NLP 研究员,Catherine 起初在爱丁堡大学主修中文与语言学。一次偶然的导师更替,引导她从传统语言学研究转向语言模型的 计算探索,由此踏上了 跨越语言与技术边界的研究之路。 她精通英语、西班牙语、法语和汉语,对语言的结构差异与共性有着敏锐的感知。在深入多语言自然语言处理的过程中,Catherine 提出了一个具有 启发性的重要概念—— "字节溢价"(byte premium) 。她发现: 即使是字节数相 ...
AI重划语言能力边界,国际测评权威专家迈克•米兰诺维奇博士贵阳发声:人类核心能力与AI协作智能将分轨评估
Huan Qiu Wang Zi Xun· 2025-07-23 03:43
来源:美通社 米兰诺维奇博士提出"语言能力双轨进化论",动态命题技术破解安全性困局 迈克·米兰诺维奇博士在第八届英语教学与测评学术研讨会上发表主旨演讲 能力定义革命:从单一维度到双轨并行 米兰诺维奇博士用一组对比揭示行业剧变:当会议记录不再需要人工校对,当职场写作变成AI指令工 程,传统语言测试测量的'独立能力'正逐渐脱离现实土壤。他创造性地提出: 现代语言能力正裂变为两大支柱。第一支柱是人类核心能力,即无需科技辅助的基础语言素养,如精准 的词汇运用、严谨的语法结构,这些能力在学术研究、法律文书等场景中仍是不可替代的基石。第二支 柱是AI协作智能,特指人类驾驭人工智能工具实现沟通目标的进阶能力,包括精准的指令工程、多源 信息整合及机器输出优化等,正成为数字时代职场新通货。 "移民官员需要验证申请人掌握生存必需的核心能力,而跨国企业更需考察候选人指挥AI协同作战的智 慧——'语言能力'这一概念本身可能需要被重新审视。" "人工智能工具的迅猛发展,是否意味着我们正站在测评方式彻底变革的临界点——未来测评将不再聚 焦答案正确与否,而转向追踪解题所需的认知过程,并运用技术实现该过程?人工智能识别与追踪认知 流程的潜力 ...