Workflow
互联网大厂五一前密集开源新模型,布局各异谁将留在牌桌?
Nan Fang Du Shi Bao·2025-05-01 14:12

据悉,阿里云此次开源的千问3是国内首个"混合推理模型",即将"快思考"与"慢思考"集成进同一个模型,对简单 需求可低算力"秒回"答案,对复杂问题可多步骤"深度思考",这样能大大节省算力消耗。在阿里巴巴千问3开源 后,上下游供应链连夜进行适配和调用,NVIDIA、高通、联发科、AMD等多家头部芯片厂商已成功适配千问3。 其中,阿里云今年已持续开源了通义万相首尾帧生视频14B模型、首个端到端全模态大模型通义千问Qwen2.5- Omni-7B、阿里万相2.1模型、视觉理解模型Qwen2.5-VL等模型。对于阿里云的持续开源策略,知名数字经济学 者、工信部信息通信经济专家委员会委员盘和林向南都记者表示,阿里云的开源逻辑很简单,阿里云的模型是开 源、免费的,但阿里云的硬件比如算力、各类软件工具、容器是不免费的,开源模型要和自己的数据结合形成自 己的AI,阿里云以模型开源来切入AI应用并在别的方面实现盈利,开源对阿里整个云服务生态是有利的。 赶在五一假期前,国内大模型厂商接连开源。4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问 3),参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能全面超 ...