Workflow
Seek .(SKLTY)
icon
Search documents
DeepSeek低调上新:友好度跃升
21世纪经济报道· 2025-03-26 03:34
DeepSeek低调上新:友好度跃升 除了性能提升,DeepSeek-V3-0324在部署方面也表现出优势。该版本模型采用宽松的MIT开源协议,且 可直接部署在M3 Ultra的Mac Studio上,这意味着大模型开发应用的门槛更进一步降低。苹果机器学习 工程师Awni Hannun 基于MLX框架和4-bit量化,在 512GB M3 Ultra上实现了超过20 token/s的运行速 度,将模型磁盘占用空间减少到352GB。 相比之前的自定义许可证,新协议还支持开发者自由修改、分发模型,支持模型蒸馏和商业化应用,进 一步推动了AI技术的共享与创新。 冲击行业格局 21世纪经济报道记者孔海丽 北京报道 DeepSeek低调发布了DeepSeek-V3模型的更新版本——DeepSeek-V3-0324。 没有主动传播,但引起了AI行业的一阵波澜,一个值得关注的信息点在于,该版本仍然基于V3的模 型,改进训练方法后,大幅提高了推理类任务的表现水平,在数学、代码类相关评测集上取得超过 GPT-4.5的得分成绩。 多维度性能改进 DeepSeek-V3-0324参数量为6850亿,较上一版本的6710亿略有增加。 ...
接入DeepSeek!长沙市政府门户网站上线“星城智搜”,开启智慧政务篇章
长沙晚报· 2025-03-26 03:10
"星城智搜"系统依托湖南大学国家超级计算长沙中心算力,采用全栈国产化技术,在严格数据安全管控下, 深度融合DeepSeek大模型的自然语言处理能力与长沙市政务知识库资源,实现对政策文件、办事指南等海量数据 的精准理解与高效检索,确保政务服务既智能又安全。据湖南大学国家超级计算长沙中心唐卓教授团队透露,未 来将进一步扩大智能导办的支持范围,市民在平台咨询问题后,就能直接在线办理相关业务。 该系统融合了原有的智能搜索与智能问答板块,支持自然语言交互。不管是"养老保险缴费年限不够怎么 办"这类日常疑问,还是"个体工商户申请补贴流程"等专业咨询,它都能精准关联政策与办事指南,响应准确率达 95%,打破传统"关键词匹配"局限,提供7×24小时在线导办。自试运行以来,平均响应时间缩短至5秒左右,办事 指南关联准确率达98%,在实现"问答即服务"的同时,还构建了市民需求动态分析机制,为后续优化政策供给提 供数据支撑。 下一步,长沙市数据局将以此次升级为契机,进一步拓展DeepSeek大模型在"一网通办"、政策精准推送、企 业信用评价等更多政务场景中的应用,持续完善"用数据决策、用数据服务"的智慧政务体系,享受到更高效、更 ...
DeepSeek V3小版本升级,性能飞跃,数学推理与前端代码生成大提升!
搜狐财经· 2025-03-26 03:05
DeepSeek V3小版本升级,性能飞跃,数学推理与 前端代码生成大提升! 当处于联网搜索场景时,新版V3模型在处理报告生成类指令时能够输出更加详实且准确的内容,同时 排版也更加清晰、美观。该模型在工具调用、角色扮演以及问答闲聊等功能方面也有了不同程度的提 升,为用户提供了更加多样化、便捷的服务。 DeepSeek官方表示,DeepSeek-V3-0324与之前的DeepSeek-V3版本在基础模型上保持一致,主要对后训 练方法进行了改进。在私有化部署方面,用户只需更新checkpoint和tokenizer_config.json文件(涉及工 具调用相关变动)即可。据悉,该模型的参数规模约为660亿,开源版本支持的最大上下文长度为128K (网页端、App和API提供64K上下文),满足了大多数用户的需求。 与DeepSeek-R1保持一致,此次DeepSeek开源仓库(包括模型权重)也采用了MIT License授权,为用户 提供了极大的灵活性和自由度。用户可以通过模型输出或模型蒸馏等方式训练其他模型,进一步推动了 人工智能技术的发展和应用。 来源:http://www.cnu.com.cn/chara ...
DeepSeek又变强了!恒生科技作为中国AI核心资产,能否再度上攻
每日经济新闻· 2025-03-26 02:53
中信建投(601066)认为,效率优化下,可盈利AI商业模型已然跑通。DeepSeek连续开源在训练 和推理效率方面的多项技术,公布的成本利润率细节更是构建了可盈利的商业模型。该机构对 DeepSeek实际利润率进行测算,如果DeepSeek不准备冗余算力,仍能在API调用付费率20%,V3调用占 比50%的假设下实现21%的成本利润率水平;如果API调用付费率进一步提升至50%,成本利润率水平 将进一步提升至51%。 南向资金年内净流入超4000亿港元,如何一键配置港股科技公司?公开信息显示,恒生科技指数 ETF(场内:513180;联接A/C:013402/013403)标的指数囊括30家港股科技龙头,软硬科技兼备,成 分股深度聚焦AI产业链的上中下游,其中阿里、腾讯、小米、美团、中芯国际等有望成为中国科技 股"七巨头"。恒生科技指数代表了中国AI核心资产,长期有望高景气。 3月26日早盘,港股三大指数小幅高开,恒生指数涨0.5%,报23460.31点,恒生科指涨0.36%,国企 指数涨0.31%。盘面上,科网股普涨,汽车股普涨,有色金属集体高开。开盘后,恒生科技指数ETF (513180)跟随指数小幅上 ...
再次打破传统!DeepSeek发布更新,可以直接在消费级硬件上运行
观察者网· 2025-03-26 02:41
再次打破传统!DeepSeek发布更新,可以直接在消 费级硬件上运行 同时,新版V3模型基于R1的写作水平进行了进一步优化,同时特别提升了中长篇文本创作的内容质 量。新版V3模型可以在联网搜索场景下,对于报告生成类指令输出内容更为详实准确、排版更加清晰 美观的结果。此外,在工具调用、角色扮演、问答闲聊等方面,新模型也得到了提升。 值得一提的是,业内的早期测试证实,该模型可以直接在消费级硬件上运行。 据报道,AI研究员Awni Hannun表示,新的DeepSeek-V3模型可以在配备M3 Ultra芯片的苹果电脑上,以 每秒20个token的速度运行。这打破了业界关于人工智能模型能力与本地化运行或冲突的早前共识,也 意味着数据中心并不是大模型的必要搭配。 本文系观察者网独家稿件,未经授权,不得转载。 据官网公告,DeepSeek V3模型已完成小版本升级,目前版本号DeepSeek-V3-0324,用户登录官方网 页、APP、小程序进入对话界面后,关闭"深度思考"即可体验。API接口和使用方式保持不变。"如非复 杂推理任务,建议使用新版本V3模型,即刻享受速度更加流畅、效果全面提升的对话体验。" 新版V3模型 ...
DeepSeek V3再次震撼硅谷,中美AI差距突然缩至3个月!
金十数据· 2025-03-26 02:33
DeepSeek V3再次震撼硅谷,中美AI差距突然缩至3 个月! 中国人工智能初创企业DeepSeek近日发布其最新大语言模型DeepSeek-V3-0324,以全面升级的技术架构 向OpenAI、Anthropic等美国AI领军企业发起挑战。这一跨越式进展不仅彰显中国在人工智能领域的雄 心,更将中美AI竞赛推向新高度。 01.AI创始人、前谷歌中国总裁李开复表示,DeepSeek通过算法创新和高效利用国产硬件,显著缩小了 与美国领导者如OpenAI的技术差距。这一进展表明,中国在核心AI技术上仅落后美国三个月,甚至在 某些领域已处于领先地位。李开复在接受路透社采访时表示: 相较于前代产品,V3版本在以下维度实现显著提升: 硅谷企业已提高警惕,Anthropic在其最新融资文件中将中国AI技术列为"最大战略威胁"。与此同时,资 本市场开始调整布局,红杉资本等投资机构已设立专项基金,加大对本土AI项目的投入。在商业化应 "此前我认为差距在六到九个月,且全面落后。而现在,我认为在部分核心技术领域仅落后 三个月,但在某些特定领域已实现领先。" 今年早些时候,DeepSeek发布了一款基于性能较低芯片训练的AI推理 ...
外界热议DeepSeek低调“上新”
环球网资讯· 2025-03-25 22:39
路透社今年2月底引述3名知情人士的说法宣称,DeepSeek原计划在今年5月初发布R2,但现在希望尽早 推出,具体时间尚未透露。此外,DeepSeek希望新模型在代码生成和多语言推理方面的表现进一步提 升。不过,外媒的相关传言并没有得到DeepSeek公司的证实与回应。 沈阳表示,DeepSeek-V3-0324的推出进一步凸显中国AI企业在技术与成本上的竞争力。美国对华GPU出 口限制可能促使中国企业加速国产硬件适配,同时其开源模式或引发西方厂商的连锁动作,例如推出更 强闭源模型。2025年可能是中美AI竞争的分水岭。 沈阳认为,在OpenAI公司的GPT大模型要把通用大模型和推理大模型融合在一起的背景下,外界关注 包括DeepSeek在内的中国头部大模型是不是最终也会出现这种合并的趋势。"这种可能是存在的,因为 对于用户来说,并不关心大模型在回应自身问题时用的是什么类型的模型,更关心大模型能不能给出更 为智能、合理的参考答案。" DeepSeek移动端页面 图源:视觉中国 在回答《环球时报》记者有关DeepSeek-V3新版本有哪些能力提升时,DeepSeek表示,一是新版本代码 能力显著提升,接近Cla ...
DeepSeek官宣V3小版本升级强在哪,被赞“开源里程碑”
第一财经· 2025-03-25 15:12
值得一提的是,25日下午,海外专业AI模型评测机构Artificial Analysis发布的最新排名显示,新版V3模型现在是得分最高的非推理模型,超过xAI的Grok3和 OpenAI的GPT-4.5(preview)。 DeepSeek官宣V3小版本升级强在哪,被赞"开源里程碑" 这一模型迭代可能预示着R2模型将是另一个重大飞跃。 没有任何公告和宣发,DeepSeek在开源平台hugging face默默上新的V3迭代版本模型仍在今日引起了不小的关注。 3月25日晚,官方终于在海内外官方账号上正式宣布V3模型完成小版本升级的消息,并介绍了新版本DeepSeek-V3-0324模型的提升细节,包括推理、前端开 发、中文写作、中文搜索几个方面的能力优化。 DeepSeek介绍,新版V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平。 此外,在 HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。官方例举了一个用模型生成的程序,画面是 多个小球在指定空间范围内运动,包含若干可以调整重力、摩擦力等参数的滑动按钮。 ...
新版DeepSeek-V3登顶非推理模型榜单!每经记者实测编程能力,R2模型也要来了?
每日经济新闻· 2025-03-25 13:48
新版DeepSeek-V3登顶非推理模型榜单!每经记者实测编程能力,R2模型也要 来了? 每经记者 岳楚鹏 每经编辑 兰素英 北京时间3月24日晚间,DeepSeek悄然将DeepSeek-V3模型的最新版本上传到了开源平台HuggingFace。 新模型的版本号为DeepSeek-V3-0324,参数为6850亿,较初代V3版本的6710亿有小幅增长。 尽管DeepSeek十分低调,但还是有不少人在第一时间就注意到了这一更新,并对其进行了测试。 根据社区测试反馈,DeepSeek-V3-0324最明显的变化是编程能力得到了极大的提升。众多开发者基于对新模型的综合体验判断,新模型的编程能力已经接近 目前最强编程模型Claude 3.7 Sonnet。 3月25日,专业AI模型评测机构Artificial Analysis发布的最新排名显示,新版V3在基准测试中较老版V3跃升了7位,排名所有非推理模型中的第一名。 《每日经济新闻》记者实测后发现,DeepSeek-V3-0324的编程能力确实强大,但仍会出现幻觉问题。 有外媒推测:"V3新版本的推出时机和特点强烈表明,它将成为DeepSeek-R2的基础,后者是 ...
摩根士丹利 -中国 DeepSeek 时刻
摩根· 2025-03-25 06:35
China's DeepSeek Moment TALES FROM THE EMERGING WORLD | TALES FROM THE EMERGING WORLD | March 2025 For a government seeking to reinvigorate its economy and infuse its youth with optimism, DeepSeek's emergence is more than just an artificial intelligence (AI) milestone – it's a timely symbol of China's ambition to claim a leadership role in the tech revolution. DeepSeek's breakthrough will likely inspire a new generation of Chinese talent at a time of renewed nationalism. With China's strengths in consumer t ...