大模型

Search documents
Grok4成“宇宙最强模型”?AI竞赛进入“马斯克节奏”
2 1 Shi Ji Jing Ji Bao Dao· 2025-07-10 14:09
0:00 虽然马斯克本人一脸疲态,但他亲自坐镇,给Grok 4的噱头拉到顶配。 "宇宙最强模型""它比所有领域的人类博士都聪明,无一例外""Grok 4还没发明新科学或新物理定律只 是时间问题""Grok 4解决代码问题,比Cursor更好用"…… 这背后,是"暴力计算美学",xAI耗时6个月搭建起来的10万块H100 GPU超级算力中心正在给出回报, Grok 4的训练量是Grok 3的10倍,是Grok 2的100倍。 回归商业世界的马斯克火力全开,接下来还计划 8 月推出代码模型,9 月上线多模态智能代理,10 月发 布视频生成模型。 21世纪经济报道记者孔海丽、实习生郑子涵 北京报道 以上宣言,是马斯克为旗下AI公司xAI最新旗舰大模型Grok 4的定调。 Grok 4也确实争气,在"人类最后的考试"(Humanity's Last Exam)中,拿到了38.6%的准确率,超过了 谷歌Gemini 2.5 Pro的21.6%和OpenAI o3的21%。多智能体版本Grok 4 Heavy拿到了44.4%,如果进一步 使用工具辅助,则能达到50.7%。 商业场景的落地验证方面,在名为 Vending- ...
商汤科技李星冶:多模态大模型“所见即所得”让人机交互更顺畅
Bei Ke Cai Jing· 2025-07-10 11:49
新京报贝壳财经讯(记者罗亦丹)7月10日,2025贝壳财经年会开幕。在主题为"建设'开源之都':智AI 未来,生态共澎湃"的首场论坛上,商汤科技集团大模型综合商务部执行商务总监李星冶回顾了人工智 能从1.0时代到2.0时代的演变,并重点介绍了商汤在多模态交互技术上的突破与应用落地。他强调,人 工智能正从传统的计算机视觉向"所见即所得"的多模态交互转型,这将深刻改变教育、文旅、客服等多 个领域。 此外,商汤科技的智能体应用是另一亮点。李星冶举例称,在仓库租赁场景中,算法分析行业数据辅助 BD销售,生成租约管理方案等功能。在客服领域,商汤与知名运营商合作,打造高效智能体。在智能 家居方面,提供家庭互动功能,以人工智能的技术丰富家庭交互生活。 "多模态大模型的优势正在于此:让交互不再局限于识别文字指令,更能通过'所见即所得'的方式,通 过视觉等多维度信息,让大模型与人之间的交互更顺畅。"李星冶说。 编辑 杨娟娟 李星冶表示,在AI 1.0时代,商汤专注于计算机视觉技术,主要服务于政府和企业。 随着2023年大模型技术的兴起,AI进入2.0时代,商汤开始推动多模态交互的创新。李星冶解释,这不 仅仅是文字指令的识别,而 ...
马斯克发布Grok 4!号称“世界上最强AI模型”
Zheng Quan Shi Bao Wang· 2025-07-10 11:44
左手刚刚融资,右手就发大模型,马斯克重金打造的Grok 4,正式面世! 7月10日,特斯拉创始人兼首席执行官马斯克旗下的人工智能公司xAI正式发布了Grok 4。在将近1小时 的发布会直播中,xAI发布了这个系列的两款模型,分别是Grok 4(单智能体版本)和Grok 4 Heavy (多智能体版本),其中后者支持4个智能体并行思考,在推理过程中横向比对、纵向协同,调用更大 规模的计算资源以完成更复杂、更精密的任务。 作为xAI在2023年推出首代大模型以来的第四次重要更新,Grok 4在"人类的最后考试"(Humanity's Last Exam)取得了25.4%的准确率,超过了谷歌Gemini 2.5 Pro的21.6%和OpenAI o3(高版本)的21%,被称 为"世界上最强AI模型"。 据xAI的研究人员介绍,Humanity's Last Exam测试总共有2500个问题,包括数学、自然科学、工程以及 所有人文学科,问题广泛且都是博士甚至高级研究水平,极具挑战性,但Grok 4在这些问题上都可以得 到很好的分数。 此外,据发布会披露,在GPQA、AIME25、LCB(Jan-May)、HMMT25 ...
华为大模型身陷“抄袭门”,自研边界争议再起
3 6 Ke· 2025-07-10 10:04
7月初,华为盘古大模型陷入一场"抄袭门"风波。 起因是一位开源社区GitHub用户HonestAGI发表报告,称盘古Pro MoE模型注意力参数分布与阿里通义千问Qwen-2.5 14B模型相似度极高,平均相关系数 达0.927(接近完全一致的1.0),而且代码文件中含阿里Qwen的版权声明。该报告作者认为,盘古模型可能在千问模型的基础上进行了增量训练,而非完 全从零训练。 随后,一份自称为"华为盘古大模型团队、华为诺亚方舟实验室员工"的用户HW-whistleblower(华为吹哨人)在GitHub发表博文《盘古之殇》,以"亲历 者"的口吻,讲述了他眼中的"盘古套壳"事件,进而将此事推向舆论漩涡。 于盘古大模型开源代码的讨论。 盘古 Pro MoE开源模型是基于昇腾硬件 平台开发、训练的基础大模型,并非基 于其他厂商模型增量训练而来,在架构 设计、技术特性等方面做了关键创新, 是全球首个面向异腾硬件平台设计的同 规格混合专家模型,创新性地提出了分 组混合专家模型 (MoGE) 架构,有效 解决了大规模分布式训练的负载均衡难 题,提升训练效率。其他技术特性创 新,请参考异腾生态竞争力系列技术报 告披露内容。 ...
可灵AI推出可图2.1模型 多维能力跃升、会员限时7天免费
Cai Fu Zai Xian· 2025-07-10 09:24
可图2.1还带来了更强的电影质感,能够生成具有电影大片氛围和层次感的图像。如输入提示词"电影质 感,东京空荡荡的车站月台的广角镜头,一个亚洲男子坐在长椅上等车,他身后有一个白色和蓝色的标 志,灰蒙蒙的天空,窗外高楼耸立,风格酷似韦斯·安德森,Leica M6 f/2.8拍摄",生成的图像不仅完美 复现了电影般的场景,还通过高级的构图和独特的光影色彩,为画面赋予了独特的美学调性,仿佛是一 部电影的精彩瞬间。 7月10日,可灵AI重磅上线可图2.1模型,图片生成能力全面跃升,包括指令遵循能力的大幅提升、惊艳 的人像美感和电影质感以及超180多种不同风格的响应能力,同时新模型还进一步增强了文字生成效果 等。即日起,新模型将面向所有会员用户免费开放7天。 实测表明,可图2.1模型在指令遵循方面表现尤为出色,能够精准捕捉提示词中的多种元素、复杂指令 以及颜色位置等细节,并按照要求生成高质量图像,帮助创作者充分展现创意想象力 。 例如,当输入提示词"3D微缩沙盘模型,展示其独特的横截面剖面,海底火山爆发的剧烈瞬间,史诗级 灾难场景,CG特效,光影对比,冷暖对比"时,可图2.1生成的图片,清晰准确地描绘了提示词要求的 场景 ...
复杂系统自学习“逆最优”理论与方法专题论坛在京举行
Huan Qiu Wang Zi Xun· 2025-07-10 08:40
来源:光明网 中国科学院院士、中国自动化学会理事长、中国空间技术研究院研究员杨孟飞出席。中国自动化学会特 聘顾问、青岛科技大学副校长、上海交通大学教授李少远,华北电力大学教授肖峰,中国自动化学会副 监事长、安徽大学教授孙长银,中国自动化学会理事、武汉大学教授张俊作主旨报告。中国自动化学会 理事、中国科学院自动化研究所研究员魏庆来,英国格拉斯哥大学教授于慧,英国剑桥大学助理教授那 晓翔作专题报告。北京航空航天大学教授王卓主持报告环节。中国科协第十届青年人才托举工程入选 者、中国科学院自动化研究所副研究员王晨主持圆桌讨论环节。 7月5日,第二十七届中国科协年会复杂系统自学习"逆最优"理论与方法专题论坛在北京召开。本次专题 论坛由中国科协主办,中国自动化学会承办,与会专家围绕实际复杂系统最优运行建模等非共识议题, 共同探讨复杂非线性系统自学习"逆最优"发展路径。 张俊教授作题为"基于生成式人工智能和科学智能(AI4S)的复杂电力系统数智化关键技术与应用"的报 告 孙长银教授作题为"试错驱动具身智能学习与进化"的报告 魏庆来研究员作题为"自学习最优控制"的报告 杨孟飞理事长出席论坛 李少远教授作题为"基于'智能'增强 ...
李萌:大模型、智能体将在智能涌现、场景迁移等方面加速迭代
Bei Ke Cai Jing· 2025-07-10 07:56
新京报 李萌表示,全世界的大模型都在向着能力更强、模态更多、效率更高的方向加速进化,语言模型和多模态模型最终将在物理AI层面走向统一,智能涌现能 力和跨模态交互能力大幅提升,深度推理与具身智能融合将构建新的智能形态。 李萌指出,未来大模型的应用场景将更加泛化。通过分布式部署模型,云边端大小模型协同,与各种场景适配;通过开源和软硬件协同,加强开放性、模块 化生态构建;通过模型、算力、数据三要素融合,搭建强大基础层支撑,塑造场景迁移能力,以支撑多场景使用通用要求。 同时,接入更加便捷。通过连接器打通模型之间、智能体之间的接口。比如现在有机构推出MCP,通过大模型与外部工具的标准化连接协议,使模型能够 无缝调用外部资料,为模型建立一个万能接口;还有A2A、AG-UI等协议,将推动工具通用、定义工作流,重整信息流,防止"模型孤岛"和"智能鸿沟"。 李萌表示,"基础-垂类"协同并进、"大型-小型"融通适配、中心-边缘梯次接续的模型体系正在形成,智能体进入突破年。大模型场景创新将开辟一批智能产 业新机会,大模型引领的具身智能技术进步将加速人工智能场景创新,深度改变行业生产力,有望激发新一轮人工智能产业化浪潮。 校对 柳宝 ...
钉钉上跑出的第一个行业专属大模型落地:准确率超 90% 的妇科专业大模型
AI前线· 2025-07-10 07:41
作者 | 褚杏娟 近日,钉钉企业专属 AI 平台上成功训练出了首个高准确度、高实用性的专业领域大模型——由壹生 检康 (杭州) 生命科技有限公司研发的"豆蔻妇科大模型",其在专业测试中准确率达 90.2%。 钉钉方面表示,妇科大模型的落地,意味着钉钉生态已经从 SaaS 生态、服务商生态、咨询生态、 交付生态,拓展到 AI 创业者。 与专业医生诊断吻合度达 90.2% 当前,各行各业都在努力将大模型与自身业务场景深度融合,打造行业或专业大模型,实现运营管理 的降本增效。 壹生检康是一家深耕女性精准检测及健康服务的生命科技公司,创业团队大多来自知名互联网企业、 妇产科医疗机构、生物医药公司。基于技术趋势和行业判断,王强宇团队认为,通过训练妇科专业大 模型打造 AI 医生,将有效缓解专业妇科医生、医疗服务不足的难题,对医美机构和女性用户都会带 来巨大的行业和社会价值。 专业性强的"妇科 AI 医生"并不是采用通用大模型就能简单训练出来。启动豆蔻妇科大模型研发以 来,壹生检康团队以开源大模型为基础,通过行业数据训练,第一个版本将模型诊断准确率做到 77.1% 左右。"77.1% 的准确率虽达到行业基础标准,但对于直 ...
2025世界人工智能大会7月26日开幕 100余款“全球首发”“中国首秀”产品将亮相
Zheng Quan Shi Bao Wang· 2025-07-10 06:20
证券时报记者 陈雨康 2025世界人工智能大会暨人工智能全球治理高级别会议新闻发布会7月10日在上海举行。据介绍,以"智 能时代 同球共济"为主题的2025世界人工智能大会暨人工智能全球治理高级别会议将于7月26日至7月28 日在沪举行。大会以"1+1+2+10+N"架构呈现,即1场开幕式及主论坛,1场人工智能全球治理高级别会 议,科学前沿、发展安全2场全体会议,10余场部委论坛及N场生态论坛。 上海市经济信息化委主任张英介绍,本届大会展览展示规模空前,展览面积首次突破7万平方米,吸引 800余家企业参展,包括国内数十家AI龙头链主企业、西门子、施耐德等60余家头部外企、30余家央国 企等。展品方面,3000余项前沿展品集中亮相,涵盖40余款大模型、50余款AI终端产品、60余款智能 机器人以及100余款"全球首发""中国首秀"的重磅新品,规模创历届之最。 大会新设"创投孵化"板块 记者了解到,2025世界人工智能大会设置会议论坛、展览展示、赛事评奖、应用体验、创新孵化等5个 板块,全面展现AI技术前沿、产业趋势与全球治理的最新实践。 张英表示,目前,已有30多个国家和地区1200余位嘉宾确认参会,包括12位 ...
让每个销售都有‘销冠’潜质”,中关村科金质检+陪练一体怎么做到的?
Sou Hu Wang· 2025-07-10 06:16
销售质检:透视销售盲区,锁定业绩提升关键 智能质检采用大小模型结合的方式,对销售人员的销售行为进行全方位监测和分析。从沟通技巧、产品 知识掌握程度到客户需求洞察、销售策略运用等方面,进行细致入微的评估。系统能够快速、准确地发 现销售人员在销售过程中存在的问题,如产品介绍不全面、未能有效挖掘客户需求等。 在竞争激烈的商业环境中,销售团队的表现直接关乎企业生存与发展。打造一支高效、专业的销售队 伍,正成为企业降本增效、提升业绩、规避风险的核心诉求。 作为领先的大模型技术与应用公司,中关村科金创造性地融合成熟的AI大模型质检与陪练系统,推出 了全面高效的"质陪解决方案"。 在刚刚过去的618大促期间,某头部电商平台面临海量咨询压力。 质检+陪练系统迅速质检客服通话, 发现部分客服在处理'优惠券叠加规则'问题时表述模糊、效率低下,导致客户不满和订单流失。系统立 即将该类问题及高频错误点推送至陪练模块。次日,相关客服即收到针对'优惠规则清晰讲解'的专项情 景模拟陪练任务。销售陪练中,AI模拟'纠结型'买家反复追问,客服需清晰解答。一周后数据显示,该 问题相关咨询的平均处理时长大大缩短,订单转化率显著回升。 这是如何做到 ...