Workflow
大模型硝烟再起,DeepSeek、通义千问、Google、OpenAI先后迎来更新
华福证券·2025-03-30 13:32

计算机 2025 年 03 月 30 日 行 业 研 究 计算机 大模型硝烟再起,DeepSeek、通义千问、Google、 OpenAI 先后迎来更新 投资要点: DeepSeek-V3 模型更新,各项能力全面进阶 行 业 定 期 报 告 据 DeepSeek 官微,3 月 25 日,DeepSeek V3 模型已完成小版本 升级,目前版本号 DeepSeek-V3-0324,DeepSeek-V3-0324 与之前的 DeepSeek-V3 使用同样的 base 模型,仅改进了后训练方法。私有化 部署时只需要更新 checkpoint 和 tokenizer_config.json(tool calls 相关 变动)。模型参数约 660B,开源版本上下文长度为 128K(网页端、 App 和 API 提供 64K 上下文)。 通义千问 Qwen2.5-Omni-7B 正式开源,展现全模态优异性能 据阿里云开发者官微,3 月 27 日,通义千问 Qwen2.5-Omni-7B 正 式开源。作为通义系列模型中首个端到端全模态大模型,可同时处理 文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合 成输 ...