Workflow
混元大语言模型
icon
Search documents
大摩中国AI 60强榜单曝光!未来6至12个月将是中国AI企业的关键期
智通财经网· 2025-05-18 02:05
本周,摩根士丹利发布长达97页的全球科技报告《中国AI:沉睡的巨人觉醒》指出,中国的长期战略 是成为人工智能技术的全球领导者。DeepSeek-R1开源大语言模型提供了一个功能强大但具有成本效益 的人工智能解决方案,是最近的一个关键催化剂,但正是中国自上而下驱动的人才、创新、数据和基础 设施生态系统为人工智能发展创造了肥沃的环境—— 正在帮助释放中国人工智能的潜力。 报告指出,中国的首要任务是将人工智能应用于"实体经济",运用市场规则实现产品商业化,并提高制 造业等传统行业的生产力。这意味着人工智能研究成果应与市场所需的人工智能产品紧密相连,原因在 于教育、研究、投资与企业建设之间的相互关联。例如,与美国目前人工智能主要集中在更广泛的消费 应用领域(如Claude+、GPT和Gemini)相比,中国的人工智能研究更倾向于专注于商业应用,如自动驾 驶、智能制造、智能客服和数字人。 文中深入探究中国人工智能的机会在哪里?哪些行业领域和企业将最快看到人工智能带来的益处和实现 盈利?并指出基础设施、平台、应用以及硬件等领域凭借自身优势,在人工智能发展浪潮中占据先机。 人工智能的领先地位不再仅仅是需要一个更广泛的生态系 ...
腾讯、华为、微软、阿里专家齐聚一堂,共谈推理优化实践 | AICon
AI前线· 2025-04-23 07:28
在人工智能快速演进的浪潮下,大模型正加速重构各行业的技术底座,而 推理性能优化 正成为应对算力挑战、内存瓶颈与通信压力的关键突破口。 当前,大模型推理性能优化主要围绕 模型优化、推理加速与工程优化 在即将于 5 月 23 日 -24 日举办的 AICon 全球人工智能开发与应用大会·上海站 中,我们特别策划了《大模型推理性能优化策略》专题论坛,由阿里云公共云大模型技术服务负责人 王德山 担任专题出品人,现已确认多位业内实践者参与分享。以下为嘉宾阵容及即将带来的精彩议题简介~ 向乾彪 – 腾讯推理架构师 向乾彪在 GPU 推理加速拥有丰富经验。他的技术专长覆盖高性能异构计算及深度性能优化,并在实 践中不断突破前沿技术瓶颈。目前,向乾彪带领团队负责混元大语言模型的推理加速框架 【AngelHCF】 三大方向展开:通过模型量化、剪枝与蒸馏等手段降低计算复杂度、提升推理效率,例如 DeepSeek-R1-Distill-Qwen-32B 采用蒸馏策略,在保持高性能的同时显著压缩资源开销;依托 SGLang、vLLM 等高效推理引擎提升生成速度与系统吞吐能力;同时结合实际业务场景,合理规划 并发策略、优化 GPU 配置 ...