Seek .(SKLTY)

Search documents
DeepSeek-V3.1首搭UE8M0 FP8精度技术 适配下一代国产芯片
Feng Huang Wang· 2025-08-21 08:18
凤凰网科技讯 8月21日,DeepSeek在其官宣"正式发布DeepSeek-V3.1"的文章里面提到,DeepSeek-V3.1 使用了UE8M0 FP8 Scale的参数精度。另外,V3.1对分词器及chat template进行了较大调整,与 DeepSeek-V3 存在明显差异。DeepSeek官微在置顶留言里说,UE8M0 FP8是针对即将发布的下一代国产 芯片设计。 此外,针对网友提问DeepSeek版本信息不是V3.1的问题,官方回复表示,当前官方网页端、App、小程 序及 API 开放平台所调用模型均已同步更新,新模型自我认知为DeepSeek-V3。 ...
DeepSeek发布新模型V3.1,价格涨了但Agent能力提升了
Di Yi Cai Jing· 2025-08-21 08:11
"迈向智能体时代的第一步"。 8月21日,业界千呼万唤的R2模型没来,但DeepSeek官方正式发布了新模型V3.1。从命名来看这或许不是一次大的版本更新,更像是前一代DeepSeek-V3模 型的小版本迭代。 在X上,DeepSeek将V3.1称为"我们迈向智能体时代的第一步"(our first step toward the agent era)。本次升级主要有三大亮点,其中包括更强的 Agent能力、 混合思考模式和更高的思考效率。 官方表示,通过后训练优化,新模型在工具使用与智能体任务中的表现有较大提升。在编程智能体、搜索智能体测评中, V3.1 相比之前的 DeepSeek 系列 模型都有明显提高。 | Benchmarks | DeepSeek-V3.1 | | --- | --- | | SWE-bench | 66.0 | | Verified | | | SWE-bench | 54.5 | | Multilingual | | | Terminal-Bench | 31.3 | DeepSeek-V3.1 是混合推理架构,一个模型同时支持思考模式和非思考模式。目前用户可在官方 App与网 ...
DeepSeek-V3.1发布 具备更高的思考效率以及更强的Agent能力
智通财经网· 2025-08-21 07:49
智通财经APP获悉,8月21日,DeepSeek正式发布 DeepSeek-V3.1。本次升级包含主要变化有:混合推理架构(一个模型同时支持思考模式与非思考模式); 更高的思考效率(相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案);更强的 Agent 能力(通过 Post-Training 优化,新模型在工具使 用与智能体任务中的表现有较大提升)。 表 2:搜索智能体测评(测试结果调用商用搜索引擎 API+网页过滤+128K context window;R1-0528 使用内部 workflow 模式测试;HLE 测试同时使用 python 与 search 工具) | Benchmarks | DeepSeek-V3.1 | DeepSeek- | | --- | --- | --- | | | | R1-0528 | | Browsecomp | 30.0 | 8.9 | | Browsecomp_zh | 49.2 | 35.7 | | HLE | 29.8 | 24.8 | | xbench-DeepSearch | 71.2 | 55.0 | ...
2025《财富》中国科技50强榜单揭晓:华为、DeepSeek等入选
Sou Hu Cai Jing· 2025-08-21 07:46
8月21日,《财富》杂志发布了2025年中国科技50强榜单,华为投资控股有限公司、深度求索(DeepSeek)、宁德时代新能源科技股份有限公司等多家科 技企业入选。该榜单涵盖人工智能、新能源、生物医药、高端制造等多个前沿领域。 据《财富》介绍,在技术迭代与市场需求的交汇中,中国公司们正在以强大的执行力推动科技落地。在大模型领域,它们避开空泛的概念炒作,聚焦金 融、医疗等垂直领域的模型优化,提高效率;它们通过优化关节灵活性与续航能力,让机器替代人类进入高危、高强度作业场景;它们研发更高效、清洁 的能源,让人类与自然更和谐相处。 除上述公司外,阿里巴巴、腾讯、比亚迪、字节跳动等知名科技企业也跻身该榜单。值得注意的是,不少新兴科技公司如宇树科技、稀宇科技、玻色量子 等同样凭借在细分领域的创新表现获得认可。 | 北京字节跳动科技有限公司 | | --- | | 杭州宇树科技股份有限公司 | | 大疆创新 | | 石药控股集团有限公司 | | 联想集团有限公司 | | 京东方科技集团股份有限公司 | | 上海稀宇科技有限公司 | | 大族激光科技产业集团股份有限公司 | | 杭州云深处科技有限公司 | | 顺丰科技有限 ...
DeepSeek-V3.1正式发布,上下文均扩展为128K
Di Yi Cai Jing· 2025-08-21 07:19
官方App与网页端模型已同步升级为DeepSeek-V3.1。 8月21日,据DeepSeek官方公众号消息,DeepSeek-V3.1正式发布,本次升级包含以下主要变化: 混合推理架构:一个模型同时支持思考模式与非思考模式; 另外,增加了对Anthropic API格式的支持,可以轻松将DeepSeek-V3.1的能力接入Claude Code框架。 更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案; 更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。 官方App与网页端模型已同步升级为DeepSeek-V3.1。用户可以通过"深度思考"按钮,实现思考模式与非思考模式 的自由切换。 DeepSeek API也已同步升级,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,且上下文均已扩展 为128K。同时,API Beta接口支持了strict模式的Function Calling,以确保输出的Function满足schema定义。 在9月6日前,所 ...
官宣!DeepSeek-V3.1 发布,API调用价格低至0.5元/百万Tokens
Xin Lang Ke Ji· 2025-08-21 07:05
据悉,本次V3.1升级包含以下主要变化: 新浪科技讯 8月21日下午消息,DeepSeek今日发布 DeepSeek-V3.1,宣布将于北京时间 2025 年 9 月 6 日 凌晨起,对 DeepSeek 开放平台 API 接口调用价格进行调整。 其中,输入价格为,0.5元/百万 tokens (缓存命中) ,4元 /百万 tokens (缓存未命中) 。输出价格为 12元 /百万 tokens ,该价格于2025 年 9月6日 00:00 起生效。 3,更强的 Agent 能力:通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提 升。 目前,官方 App 与网页端模型已同步升级为 DeepSeek-V3.1。用户可以通过"深度思考"按钮,实现思考 模式与非思考模式的自由切换。(文猛) 责任编辑:杨赐 1,混合推理架构:一个模型同时支持思考模式与非思考模式。 2,更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案。 ...
DeepSeek-V3.1发布
Zheng Quan Shi Bao Wang· 2025-08-21 07:01
人民财讯8月21日电,据DeepSeek消息,其正式发布DeepSeek-V3.1。此次升级包含以下主要变化:1、 混合推理架构:一个模型同时支持思考模式与非思考模式;2、更高的思考效率:相比DeepSeek-R1- 0528,DeepSeek-V3.1-Think能在更短时间内给出答案;3、更强的Agent能力:通过Post-Training优化, 新模型在工具使用与智能体任务中的表现有较大提升。 ...
DeepSeek-V3.1正式发布,迈向 Agent 时代的第一步
Hua Er Jie Jian Wen· 2025-08-21 06:39
DeepSeek宣布,今天,我们正式发布DeepSeek-V3.1。本次升级包含以下主要变化:混合推理架构:一 个模型同时支持思考模式与非思考模式;更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1- Think 能在更短时间内给出答案;更强的 Agent 能力:通过 Post-Training 优化,新模型在工具使用与智 能体任务中的表现有较大提升。 我们将于北京时间2025年9月6日凌晨起,对DeepSeek开放平台API接口 调用价格进行如下调整: 输入:0.5元4元/百万tokens(缓存命中);4元/百万tokens(缓存未命中) 输出:12 元/百万 tokens。 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何 意见、观点或结论是否符合其特定状况。据此投资,责任自负。 ...
DeepSeek-V3.1正式发布
Di Yi Cai Jing· 2025-08-21 06:37
本次升级包含以下主要变化:混合推理架构:一个模型同时支持思考模式与非思考模式;更高的思考效 率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;更强的Agent能力:通过 Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。 官方App与网页端模型已同步升级为DeepSeek-V3.1。用户可以通过"深度思考"按钮,实现思考模式与非 思考模式的自由切换。 (文章来源:第一财经) 据DeepSeek官方公众号消息,DeepSeek-V3.1正式发布。 ...
DeepSeek、宇树科技上榜2025年《财富》中国科技50强榜单
Feng Huang Wang· 2025-08-21 05:21
Core Insights - The "Fortune China Top 50 Technology Companies" list was released, featuring companies like Huawei, DeepSeek, and Yushu Technology [1] Group 1: DeepSeek - DeepSeek is recognized as a leading AI large model product in China, with its DeepSeek-R1 model scoring 88.5 on the MMLU benchmark test, which is lower than OpenAI's GPT-4 (92.0) and Google's Gemini Pro (90.0), but higher than Meta's Llama 3 (82.0) and Anthropic's Claude 2 (85.1) [1] - DeepSeek ranks among the top 10 globally in terms of open-source large model downloads, indicating strong market presence [1] - As of June 2025, DeepSeek is projected to have 163 million monthly active users, making it the leading application in AI-generated content globally [1] Group 2: Yushu Technology - In 2024, Yushu Technology achieved global sales of 18,000 quadruped robots, capturing a 23% market share, ranking second only to Boston Dynamics [1] - Yushu Technology was awarded the WIPO 2025 Global Award, distinguishing it as the only representative from China among 780 applicants from 95 countries and regions [1] - The company's success is attributed to innovations in robotic motion control, high-performance joint motors, and real-time systems, along with a comprehensive global intellectual property strategy [1]