DeepSeek
Search documents
中国AI模型全面爆发,AI大模型技术体系综合开源影响力榜单重磅发布!
AI科技大本营· 2025-04-18 05:53
一提到"大模型",很多人的第一反应往往是那个既能聊天,又会写代码、画画的"模型本身"。但其 实,大模型远不止是一个"能输出结果的程序"这么简单,其背后有一整套复杂而庞大的技术体系作为 支撑:从大规模、高质量、多样化的数据,到先进的模型架构与训练策略,再到推理部署、资源调度 等支撑落地的系统能力,以及不可或缺的科学评测机制。大模型更像是一个由模型、数据、系统、评 测平台 等多要素构成的"技术共同体",而非单一模块的堆叠。 如今在闭源技术壁垒与高昂商用门槛的对比下,开源大模型正迅速崛起,成为推动 AI 技术普惠化的 重要力量。但面对层出不穷的开源 AI 模型技术,我们该如何选型?不同的模型技术体系又各有怎样 的优势与短板? 在这一背景下,为系统呈现全球大模型生态的开源发展现状,CSDN 联合多家机构于 4 月 18 日在 2025 全球机器学习技术大会(ML-Summit 2025)现场重磅发布《AI 大模型技术体系综合开源影响 力榜单》,全面评估全球范围内开源大模型技术体系的贡献与影响力,旨在为行业提供参考坐标,推 动开源创新持续前行。 注:这里大模型是指 主要包括 decoder-only 以来的模型结构,包 ...
时隔3个月再到中国,英伟达CEO黄仁勋:坚定不移服务中国市场
Huan Qiu Shi Bao· 2025-04-17 22:47
【环球时报特约记者 白晓】中共中央政治局委员、国务院副总理何立峰17日晚在人民大会堂会见美国 英伟达公司总裁兼首席执行官黄仁勋。 何立峰表示,中国市场投资和消费潜力巨大,产业转型升级加快推进,是新一轮科技革命和产业变革的 最佳应用场景,始终是外资企业投资和贸易的沃土。欢迎包括英伟达公司在内的更多美资企业深耕中国 市场,在中国尽展产业优势和能力,进而在全球竞争中赢得先机。 黄仁勋表示,看好中国经济前景,愿继续深耕中国市场,为推动美中经贸合作发挥积极作用。 在黄仁勋前往中国之际,英伟达在国内正面临美国政府的压力。据英国《金融时报》17日报道,美国众 议院"中国问题特别委员会"近日要求英伟达公司解释,中国人工智能(AI)企业DeepSeek是否以及如何 获得出口管制芯片来开发其人工智能应用程序。 报道称,"中国问题特别委员会"发布报告称,DeepSeek在英伟达芯片基础上训练的AI模型对美国国家安 全构成"严重威胁"。"中国问题特别委员会"负责人随后致函英伟达,要求其提供向中国和东南亚供货的 信息。 关于英伟达使出口管制芯片落入"错误对象之手"的说法,英伟达17日强烈反驳,称其"不折不扣"地遵守 了美国政府关于芯片 ...
Nvidia CEO makes surprise trip to China as House probes whether it violated chip sale rules
New York Post· 2025-04-17 15:13
Nvidia boss Jensen Huang reportedly met with the founder of DeepSeek on Thursday during a surprise trip to Beijing – just one day after a House committee revealed a probe into whether the chip giant violated strict export rules by selling to China.Huang’s meeting with DeepSeek boss Liang Wenfeng included talks related to “new chip designs for Chinese customers,” the Financial Times reported, citing two sources familiar with his schedule. The Nvidia CEO also met separately with China’s Vice Premier He Lifeng ...
OpenAI发新模型o3和o4-mini!首次实现“图像思维”,可利用所有ChatGPT工具
硬AI· 2025-04-17 15:09
点击 上方 硬AI 关注我们 OpenAI周三发布新款AI模型o3和o4-mini,模仿人类的推理过程,解决复杂编程和视觉任务的推理。这是该公司首次推 出能够独立使用全部ChatGPT工具的推理模型——包括网页浏览、Python编程、图像理解和图像生成能力。同时,该公 司也发布开源AI agent CodeX CLI,用于帮助用户执行编程任务,从而改善市场竞争能力。 硬·AI 作者 | 赵雨荷 编辑 | 硬 AI OpenAI周三发布新款AI模型o3和o4-mini,模仿人类的推理过程,解决复杂编程和视觉任务的推理。同 时,该公司也发布开源AI agent CodeX CLI,用于帮助用户执行编程任务,从而改善市场竞争能力。 OpenAI此次推出的主要新型推理模型名为o3,同时还发布了一款更小型的模型,命名为o4-mini。这一发 布延续了去年9月OpenAI首个推理模型o1的问世,当时o1主要专注于解决复杂问题,并通过多步骤的方式 进行思考和作答。 该公司表示,新发布的o3模型在响应用户提示之前会花费更多时间进行计算,目标是解决与科学、数学和 编程相关的更复杂的多步骤问题。借助o3,用户可以上传白板笔记、草 ...
奥特曼自诩:达到或接近天才水平!OpenAI,重磅发布!
Zheng Quan Shi Bao· 2025-04-17 04:31
OpenAI迄今最智能的推理模型发布。 今日,OpenAI发布了最新两款o系列推理模型,分别是o3和o4-mini,这也是o系列中首次可以使用图像进行思维链推理、实现"看图思考"的模型。其中, o3是其最强大的推理旗舰模型,在编程、数学、科学、视觉感知等多个维度的基准测试中都处于领先位置;o4-mini是一个针对快速高效、成本效益推理 进行优化的较小模型,更具性价比。 视觉推理能力"首秀",具备自主执行任务能力 在两款o系列推理模型发布后,OpenAI首席执行官萨姆·奥特曼转发一名体验者的推文,并表示新模型"达到或接近天才水平"。此外,奥特曼还表示,预计 会在未来几周内将o3升级到专业版o3-pro。 据OpenAI介绍,最新发布的o3和o4-mini经过训练后,可以在做出反应前进行更长时间的思考。这是公司迄今为止发布的最智能的模型,代表着ChatGPT 能力的一次重大飞跃。 记者注意到,在半小时的线上发布会直播中,此前曾长期休假的OpenAI总裁GregBrockman(格雷格·布洛克曼)也作为发布者,向观众介绍和演示o3和o4- mini。 根据介绍及演示,o3和o4-mini主要有以下亮点: 一是性能更 ...
又急了!特朗普打算对DeepSeek下黑手
Guan Cha Zhe Wang· 2025-04-17 02:41
【文/观察者网 王一】自今年年初DeepSeek惊艳亮相、震撼世界以来,美国就一直在想方设法打压 DeepSeek,以遏制中国在人工智能技术上的发展。 据美国《纽约时报》4月16日报道,美国政府打算"多管齐下",禁止DeepSeek购买美国技术、禁止美国 人使用其技术,同时切断美国芯片制造商英伟达对这家公司的芯片供应。 商超微半导体公司(AMD)也表示,他们的销售额将损失数十亿美元。荷兰半导体设备制造商阿斯麦 公司16日也承认,其设备订单未达预期。 16日,三家公司股价跌幅均超过5%。 当天,美国国会众议院"中国问题特别委员会"发布了一份充满陈词滥调的污蔑报告,声称DeepSeek"审 查和操纵信息""向中国泄露数据""给用户带来安全漏洞",对美国安全构成"深刻威胁"。 这份自今年2月开始撰写的报告毫无逻辑地宣称,DeepSeek这一威胁美国安全的模型是通过窃取美国技 术产生的,使用了被禁止出口到中国的美国芯片。 在这一套神逻辑下,"中国问题特别委员会"当天对英伟达在亚洲的芯片销售展开了调查,试图评估英伟 达是否违反了美国规定,故意向DeepSeek提供开发人工智能的关键技术。一位不愿透露姓名的委员会 官员告 ...
Nvidia probed over how its chips may have been obtained by DeepSeek, which US lawmakers accused of spying for China
Business Insider· 2025-04-16 23:13
Core Insights - US lawmakers are investigating how Nvidia chips were acquired by the Chinese AI company DeepSeek, which is accused of espionage and manipulating information for the Chinese Communist Party (CCP) [1][3] - The report claims DeepSeek used 60,000 Nvidia chips despite US sanctions, raising concerns about national security [1][3] Nvidia's Situation - Nvidia's stock fell nearly 7% following the announcement of new licensing requirements for shipping accelerated chips to China, with an expected $5.5 billion decrease in earnings due to tariffs [2] - Nvidia stated it adheres to US government directives regarding sales and claims its products are sold globally, including to subsidiaries of US companies [4] DeepSeek's Activities - DeepSeek is described as a tool for the CCP, allegedly designed to spy on Americans and undermine US laws [3] - The report indicates DeepSeek may have copied AI models from US companies, violating terms of service, and that it suppresses content related to democracy and human rights in 85% of its responses [5][6] Recommendations and Policy Implications - The report suggests enhancing US export control policies and restricting China's access to advanced AI technologies by expanding chip export controls [7] - It also recommends that chip companies track the end users of their products, not just the initial purchasers [7]
US Officials Target Nvidia and DeepSeek Amid Fears of China's A.I. Progress
Nytimes· 2025-04-16 17:44
Core Viewpoint - The U.S. government is taking measures to restrict the operations of DeepSeek, a Chinese AI startup, and its collaboration with Nvidia, a leading American chip manufacturer [1][2]. Group 1: Government Actions - The Trump administration has initiated steps to limit Nvidia's sale of AI chips to China, considering penalties that would prevent DeepSeek from acquiring U.S. technology [2]. - There is a potential discussion about restricting American access to DeepSeek's services as part of the crackdown [2]. Group 2: Congressional Investigation - The House Select Committee on the Chinese Communist Party has launched an investigation into Nvidia's chip sales in Asia, focusing on whether Nvidia knowingly supplied DeepSeek with critical technology in violation of U.S. regulations [3][4]. - This marks the first Congressional investigation into Nvidia's business practices regarding its sales to China [4].
华为与上汽合作的SAIC尚界正式发布;美国消费者囤货,中国电商销售额和流量增长;英伟达H20出口受限丨百亿美元公司动向
晚点LatePost· 2025-04-16 15:37
华为与上汽合作的 SAIC 尚界正式发布。 4 月 16 日,在鸿蒙智行新品发布会,问界 M8、问界新 M7 新配色、享界 S9 增程版上市。此外, 尊界 S800 还公布了内饰设计,而 SAIC 尚界品牌也首次官宣。 其中,问界 M8 提供五座与六座两种版本,每个版本分为三种配置,建议零售价为 35.98 万-44.98 万元。该车搭载华为途灵平台,标配双腔空气悬架。HUAWEI ADS 3.3 系统配备包含 1 个 192 线激 光雷达、1 个高精度固态激光雷达在内的 30 个高精度传感器。M8 Max+ 五座版的纯电续航 310km,综合续航 1526km。 在发布会上,华为与上汽集团合作的 SAIC 尚界正式发布。SAIC 尚界定位 "风格至尚、科技至尚、 信赖至尚、人人至尚"。华为常务董事、终端 BG 董事长余承东说:"这一界,很时尚!" 上汽集团 总裁贾健旭说:"我们掏出最好的资源躬身入局,首期投入 60 亿元,组建 5000+ 人的尚界专属团 队。" 美国消费者囤货,中国电商销售额和流量增长。 因为对关税早有预期,大量美国消费者在 3 月和 4 月囤积了各种家居用品和家用电器,带动跨境电 商 T ...
AI视频进入「真4K时代」?近期AI新鲜事还有这些……
红杉汇· 2025-04-16 14:19
视频创作新巅峰! 谷歌DeepMind推出Veo 2 在AI视频生成的战场上,谷歌终于亮出了底牌:4月16日,Veo 2正式登陆Gemini Advanced。 Veo 2生成:一只戴着超大眼镜的小老鼠在舒适的森林巢穴里,在蘑菇的灯光下看书的动画镜头。 Veo 2可以最高生成8秒720P电影级视频 (理论上可生成4K分辨率视频,但受限于当前工具链,实际输出暂为 720p,谷歌计划年内开放4K长视频生成) ,在运镜、文本语义还原、物理模拟、动作一致性等方面非常优 秀,同时支持图片转视频功能——这是谷歌迈向多模态生成系统的重要一步。 Veo 2生成:太平洋海岸线宁静的美丽景致。 作为谷歌DeepMind团队的最新力作,Veo 2在原有基础上实现了大升级: 首先是 电影级创作工具 :Veo 2能 自动移除视频中的干扰元素 ,并利用Outpainting功能扩展画面,生成与 原视频无缝衔接的新片段。此外, 内置"无人机视角""延时摄影""镜头平移"等电影级拍摄参数 ,用户只需 输入文字描述,即可生成符合好莱坞叙事逻辑的分镜。再加上 静态图转视频 技术,这让AI视频创作更加便 捷。 其次是 多模态协同与数字水印保护 。 ...