Workflow
DeepSeek,激荡AI行业的“一股清流”

◎本报记者 张佳欣近期,外媒纷纷将聚光灯投向中国初创企业深度求索公司,其自主研发的人工智能 (AI)大语言模型"深度求索"(DeepSeek)凭借"好用、开源、免费"三大特点,在全球范围内引发热烈 反响。 这一创新成果不仅在中国本土大放异彩,更是在大洋彼岸的美国乃至全球科技界激起了广泛讨论并受到 高度评价,被视为挑战现有AI巨头垄断地位的"一股清流"。 多家外媒接连不断的报道,让DeepSeek这一出人意料的、高效而强大的AI模型席卷了科技行业,这 种"改变游戏规则"的大型语言模型,有望快速重塑AI格局。 低成本兼具高性能西班牙《国家报》、澳大利亚《对话》杂志、美国《纽约时报》等多家外媒均关注 到,DeepSeek的技术具有强大创新力,是因为它能在降低计算成本的同时实现尖端性能。 AI公司通常使用装有1.6万枚或更多专用芯片的超级计算机来训练聊天机器人,但深度求索公司表示, 他们只用了大约2000枚芯片。 同时,他们仅花了不到600万美元就训练了新模型,成功在两方面把构建AI的价格"打了下来"。 首先,DeepSeek模型使用数据蒸馏技术生成高质量数据,提升了训练效率;其次,DeepSeek采用了一 种称为" ...