训练

Search documents
第73集团军某旅海上实弹射击训练火力全开
news flash· 2025-04-28 23:35
近日,第73集团军某旅在海上开展了超低空突防、海上着舰、海上实弹射击等课目训练。该旅海上训练 的频次、时长及课目难度、强度都有大幅增加。近年来,他们还加大了与海军部队联训联演的力度,围 绕海上着舰、舰机协同攻击等海上课目展开专攻精练,加速了飞行航迹由近岸向远海的延伸。(央视军 事) ...
中电申请数据配比确定方法专利,解决确定不同领域数据集配比使模型达预期效果的问题
Jin Rong Jie· 2025-04-28 11:43
中电数创(北京)科技有限公司,成立于2020年,位于北京市,是一家以从事科技推广和应用服务业为 主的企业。企业注册资本5000万人民币。通过天眼查大数据分析,中电数创(北京)科技有限公司参与 招投标项目4次,专利信息81条,此外企业还拥有行政许可3个。 本文源自:金融界 金融界2025年4月28日消息,国家知识产权局信息显示,中电数据产业集团有限公司、中电数创(北 京)科技有限公司申请一项名为"数据配比确定方法、系统、电子设备及存储介质"的专利,公开号 CN119884742A,申请日期为2024年12月。 专利摘要显示,本申请公开了一种数据配比确定方法、系统、电子设备及存储介质,涉及模型训练技术 领域,公开的数据配比确定方法包括:随机生成第一数量的数据配比信息,并确定各数据配比信息各自 对应的训练集;获取各训练集各自微调出的目标模型,并将测试集分别输入各目标模型,得到各数据配 比信息各自对应的实际准确度;基于各数据配比信息和各实际准确度训练回归模型,并通过训练完成的 回归模型对随机生成的第二数量的数据配比信息进行处理,得到各个预测准确度;确定各预测准确度中 的最高预测准确度,并将最高预测准确度对应的数据配比 ...
传华为开发新AI芯片
半导体芯闻· 2025-04-28 10:15
如果您希望可以时常见面,欢迎标星收藏哦~ 来源:内容编译自日经 ,谢谢 。 点这里加关注,锁定更多原创内容 *免责声明:文章内容系作者个人观点,半导体芯闻转载仅为了传达一种不同的观点,不代表半导体芯闻对该 观点赞同或支持,如果有任何异议,欢迎联系我们。 华尔街日报周日报道,中国华为技术有限公司正准备测试其最新、最强大的人工智能处理器,希望 取代美国芯片巨头英伟达的一些高端产品。 报道称,知情人士透露,华为已与一些中国科技公司接洽,测试新芯片 Ascend 910D 的技术可行 性。 报道称,这家中国公司希望其最新版本的 Ascend AI 处理器能够比 Nvidia 的 H100 更强大,并 计划最早于 5 月底收到该处理器的首批样品。 路透社4月21日报道称,华为计划最早于下个月开始向中国客户大规模出货其先进的910C人工智能 芯片。 多年来,华为及其中国同行一直在努力与英伟达竞争高端芯片,以与这家美国公司在训练模型方面 的产品竞争。训练模型是将数据输入算法,帮助算法学习做出准确决策的过程。 为了限制中国的技术发展,特别是军事方面的进步,华盛顿切断了中国获得英伟达最先进的人工智 能产品的渠道,包括其旗舰产品 ...
深度|清华姚班学霸、OpenAI姚顺雨:AI下半场从“算法竞赛”转向“效用定义”,重构评估框架,将技术能力转化为真实世界价值
Z Potentials· 2025-04-25 03:05
图片来源:姚顺雨 个人博客 Z Highlights 姚顺 雨 是斯坦福大学自然语言处理研究员, OpenAI 员工 ,专注于强化学习与语言模型融合研究。本文译自姚顺 雨 于 2025 年 4 月 10 日发布的英文博客 《 The Second Half 》,内容整合了他在斯坦福课程 CS224N 及哥伦比亚大学前沿论坛的核心演讲观点。 我们正处于AI的中场阶段。几十年来,AI的核心一直是开发新的训练方法和模型。这条路奏效了:从在国际象棋和围棋上击败世界冠军,到在SAT和律师 资格考试中超越大多数人类,甚至赢得IMO和IOI金牌。 这些载入史册的里程碑——DeepBlue、AlphaGo、GPT-4,以及o系列模型——背后是AI方法的根 本性创新:搜索、深度强化学习、模型规模化,以及推理。 一切都在不断变得更好。 那现在究竟发生了什么变化?用三个词概括:强化学习终于奏效了。更准确地说:强化学习终于具备了泛化能力。经历了多次重大的绕行与一系列里程碑 之后,我们终于找到了一个通用的有效配方,能够利用语言和推理解决各种各样的强化学习任务。哪怕是在一年前,如果你告诉大多数AI研究人员,一个 统一的方法可以同时解决软 ...
快手Kwaipilot团队全面复现DeepSeek-R1-Zero数学代码能力,训练步数仅需其1/10
智通财经网· 2025-04-24 04:52
快手 Kwaipilot 团队在最新研究成果《SRPO: A Cross-Domain Implementation of Large-Scale Reinforcement Learning on LLM》中提出了一种创新的强化学习框架 —— 两阶段历史重采样策略优化 (two-Staged history-Resampling Policy Optimization ,SRPO),这是业界首个同时在数学和代码两个领 域复现 DeepSeek-R1-Zero 性能的方法。通过使用与 DeepSeek 相同的基础模型 (Qwen2.5-32B) 和纯粹的 强化学习训练,SRPO 成功在 AIME24 和 LiveCodeBench 基准测试中取得了优异成绩(AIME24 = 50、 LiveCodeBench = 41.6),超越了 DeepSeek-R1-Zero-32B 的表现。更值得注意的是,SRPO 仅需 R1-Zero 十分之一的训练步数就达到了这一水平。 技术报告中,快手Kwaipilot团队实现了一种两阶段训练范式,有效解决数学和代码之间内在的响应长度 冲突问题。实验表明,两阶段训练在数学和编程 ...
英伟达H20不让用?全国产算力深度推理模型讯飞星火X1升级,4张华为910B即可部署满血版
量子位· 2025-04-21 13:23
就在今天, 最新国产深度推理大模型升级更新 ,算力构成全国产化,在模型参数比业界同类模型小一个数量级的情况下,实现了整体效果对 标业界最高水平。 这就是讯飞星火,最新升级的推理模型X1。 一方面是通用任务效果显著提升,在通用任务效果评测中全面对标OpenAI o1和DeepSeek R1,尤其在数学、知识问答等方面表现突出。 (测试集合来源:自建测试集主要来自真实的大模型请求任务数据,来源分布包括讯飞星火APP、星火大模型API、业界主流任务数据等;公开测试集主要以数 学、答题、推理、代码等外部典型测试集为主。) 另一面值得关注的,它还 是 业界唯一一个基于全国产算力训练的推理模型。 在波云诡谲的当下,尤其算力新一波打压H20被禁之后,这样的 模型展现出来的效果和实力显得尤为受到关注。 白交 发自 凹非寺 量子位 | 公众号 QbitAI 英伟达H20也不能用了。中国大模型还能好吗? 能 。 此外,升级后的星火X1私有化部署简便,定制门槛低—— 4张910B即可部署满血版星火X1,16张910B即可完成行业定制优化 ,再次印证全栈自主可控大模型,具备登顶高水平的实力和持续创新的 潜力。 星火X1升级:长思维链 ...
中美AI叙事和背后的算力逻辑
雪球· 2025-04-04 03:16
长按即可参与 作者: 门捷列夫学徒 来源:雪球 自DS出现以后,我看网上没有很好的一篇文章去总结目前中美ai叙事的差异以及背后的算力需 求。简单来说: China Ai叙事:DS开源带来的LLM平权以及由此延伸的各种ds蒸馏小模型端侧(包括一体机)、 边缘侧的ai应用落地,大有全面开花之势。 China算力:H20和国产Asic就行,甚至端侧还有更简单的方案。当然杰文森悖论还是适用的,大 厂加大数据中心投入。 北美Ai叙事:继续大力出奇迹通往AGI,各种多模态高阶模型推出,万亿参数大模型继续走起。 北美算力:高端NV卡仍然供不应求,GPUs are melting。。。 芯片来跑。 所以各位小伙伴期待的国内版文生图可能就要等等了,哪怕推出了估计也会卡得要死。主要是还 是卡不行。 其实你看tx的微信就是聊天,所以llm对于他们暂时就够用。而zj因为是视频起家,肯定对于高端 卡的需求是更大的。前面没说的是Ai视频生成更需要500+tflops和48G显存,更需要NV的高端 卡。 这也是为什么我们直到现在都没看到国内的 csp 推出多模态的Ai应用 。 现在的gap在于:显然北美这条路出成果没这么快,而国内ai叙事 ...
速递|O'Reilly指控OpenAI"窃书" 训练 GPT-4o,AI数据黑箱再陷版权风暴
Z Potentials· 2025-04-02 03:17
图片来源: Unsplash 多家机构指控 OpenAI 可能利用付费墙后的 O'Reilly 书籍训练 AI 模型, 未经许可使用受版权保护的 内容训练其人工智能。 如今,一家 AI 监督组织发布的新论文提出了严厉指控,称该公司日益依赖未公开且未获授权的书籍 来训练更复杂的 AI 模型。 人工智能模型本质上是复杂的预测引擎。通过大量数据(如书籍、电影、电视剧等)的训练,它们学 习模式及从简单提示中推断的新方法。当模型 "撰写"关于希腊悲剧的论文或"绘制"吉卜力风格图像 时, 它只是在利用其庞大知识库进行近似模拟,并未创造出任何新内容。 在 ChatGPT 中, GPT-4o 是默认模型。论文指出, O'Reilly 与 OpenAI 之间并未签署许可协议。 "OpenAI 最新且能力更强的模型 GPT-4o ,相比早期模型 GPT-3.5 Turbo ,对 O'Reilly 付费书籍内容 展现出更强的识别能力…… " 论文合著者写道, " 相比之下, GPT-3.5 Turbo 对公开可获取的 O'Reilly 书籍样本表现出更高的相对识别率。 " 该论文采用了名为 DE-COP 的方法( 2024 年首次 ...
智谱想给DeepSeek来一场偷袭
Hu Xiu· 2025-03-31 12:39
Core Viewpoint - The article discusses the competitive landscape between Zhipu and DeepSeek, highlighting Zhipu's recent product launches and pricing strategies aimed at challenging DeepSeek's dominance in the AI model market [2][10]. Product Launches - On March 31, Zhipu launched the "AutoGLM Thinking Model" and the inference model "GLM-Z1-Air," claiming that Air can match the performance of DeepSeek's R1 model with only 32 billion parameters compared to R1's 671 billion parameters [2]. - The pricing for Zhipu's model is set at 0.5 yuan per million tokens, significantly lower than DeepSeek's pricing, which is 1/30 of DeepSeek's model [2]. Market Dynamics - The article notes a shift in the AI model industry, with some companies, including Baichuan Intelligence and Lingyi Wanyi, experiencing strategic pivots or downsizing, indicating a loss of investor patience with AI startups [3][4]. - Despite the challenges, Zhipu continues to secure funding from state-owned enterprises, positioning itself as a leader among the "six small tigers" in the large model sector [4][6]. Commercialization Challenges - The commercialization of large models remains a significant hurdle for the industry, with Zhipu acknowledging the need to pave the way for an IPO while facing uncertain market conditions [6]. - Zhipu is focusing on penetrating various sectors, including finance, education, healthcare, and government, while also establishing an alliance with ASEAN countries and Belt and Road nations for collaborative model development [6]. Strategic Positioning - Zhipu's CEO emphasizes the company's commitment to pre-training models, despite industry trends moving towards post-training and inference models [3][12]. - The company aims to balance its technological advancements with commercial strategies, ensuring that both aspects support each other dynamically [21]. Future Outlook - The article suggests that Zhipu is optimistic about achieving significant growth in 2025, with expectations of a tenfold increase in market opportunities, while maintaining a stable commercialization strategy [22].
速递|OpenAI的图像生成或审查松绑,从“拒绝”到“中性语境”的平衡
Z Potentials· 2025-03-29 03:57
除了柔和的插画风格外, GPT-4o 原生图像生成器大幅提升了 ChatGPT 的功能,优化了图片编辑、文本渲染和空间表现能力。 图片来源: OpenAI 然而, OpenAI 本周最引人注目的变化之一涉及其内容审核政策,新政策允许 ChatGPT 在用户请求下生成描绘公众人物、仇恨符号及种族特征的图像。 本周, OpenAI 在 ChatGPT 中推出了一款新的图像生成器,因其能创作出吉卜力工作室风格的图像而迅速走红。 OpenAI 此前因争议性或危害性而拒绝此类提示。 但据 OpenAI 模型行为负责人 Joanne Jang 周四发布的博客文章称,公司现已"改进"了其处理方式。 "我们正从敏感领域的一刀切拒绝,转向更精准的策略,重点防止现实世界的伤害," Jang 表示,"目标是保持谦逊:承认我们未知的领域,并在学习过程 中随时调整立场。" 这些调整似乎是 OpenAI 更大计划的一部分,旨在有效"解除" ChatGPT 的审查限制。 OpenAI 在二月份宣布,它正在改变 AI 模型的训练方式,最终目标是让 ChatGPT 能够处理更多请求、提供多元观点,并减少该聊天机器人拒绝回应的主 题。 根据更新 ...