Qwen 2.5

Search documents
过度炒作+虚假包装?Gartner预测2027年超40%的代理型AI项目将失败
3 6 Ke· 2025-07-04 10:47
Gartner 高级分析师 Anushree Verma 表示:"目前大多数代理型 AI 项目仍处于早期实验或概念验证阶 段,其背后的主要驱动因素是炒作,而这些技术往往被错误地应用。这可能使企业忽视 AI 代理大规模 部署所需的真正成本与复杂性,导致项目迟迟无法落地。企业需要穿透炒作迷雾,制定更为审慎和战略 性的决策,明确在哪里、以及如何采用这一新兴技术。" 2025 年 1 月,Gartner 对 3412 名网络研讨会参与者进行了一项民意调查,发现 19% 的组织报告在代理 型 AI 方面进行了大量投资,42% 的组织进行了保守投资,8% 的组织根本没有投资,31% 的组织正在 等待或不确定。 更为值得关注的是,Gartner 发现了一种普遍存在的"代理清洗"趋势,即供应商将现有的人工智能助 手、聊天机器人或机器人流程自动化 (RPA) 工具重新包装成"代理人工智能",而实际上并没有提供真 正的代理功能。Gartner 估计,在数千家声称提供代理解决方案的供应商中,只有约 130 家真正提供了 真正的代理功能。 当人工智能在大模型能力突破、推理能力提升以及多模态技术进步的推动下走向新阶段,"Agentic ...
小红书开源1420亿参数大模型,部分性能与阿里Qwen3模型相当
Tai Mei Ti A P P· 2025-06-10 01:07
Core Insights - Xiaohongshu has recently open-sourced its first self-developed large model, dots.llm1, through platforms like Github and Hugging Face [2][9] - The model has been trained using 11.2 trillion high-quality tokens, significantly outperforming the open-source TxT360 data [5] - Xiaohongshu's valuation has surged from $20 billion to $26 billion as of March 2023, surpassing the market values of companies like Bilibili and Zhihu [9] Model Performance - Dots.llm1 features a mixture of experts (MoE) model with 142 billion parameters, activating only 14 billion during inference to reduce costs while maintaining performance [3][5] - In various benchmarks, dots.llm1 shows competitive performance against Alibaba's Qwen models, particularly excelling in Chinese language tasks [7][8] - The model achieved a score of 92.6 on CLUEWSC and 92.2 on C-Eval, indicating industry-leading performance in Chinese semantic understanding [7] Training Efficiency - The hi lab team has implemented advanced training techniques, achieving a 14% improvement in forward computation and a 6.68% improvement in backward computation compared to NVIDIA's Transformer Engine [5] - Future plans include integrating more efficient architectural designs and exploring sparse MoE layers to enhance computational efficiency [10] Strategic Direction - Xiaohongshu is shifting focus from being merely a content community and live e-commerce platform to actively developing AI technologies, particularly large language models [9][10] - The company aims to deepen its understanding of optimal training data and explore methods to achieve human-like learning efficiency [11]
Qwen 3 发布,开源正成为中国大模型公司破局的「最优解」
Founder Park· 2025-04-29 12:33
阿里新一代的大模型 Qwen 3 今早发布,新旗舰 Qwen3-235B-A22B 的评测成绩,和 DeepSeek R1、Grok-3、Gemini-2.5-Pro 不相上下。这一代全系列模 型都支持混合推理,对 Agent 的支持也上了新台阶。 随着 Qwen 2.5 和 3 的发布,全球的开源模型生态也呈现了一种新形态:以 DeepSeek+Qwen 的中国开源组合,取代了过去 Llama 为主,Mistral 为辅的开 源生态。Qwen 系列的衍生模型目前已经是 HuggingFace 上最受欢迎的开源模型,衍生模型的数量也超过了 Llama 系列。而 DeepSeek 对于开源模型生态 的冲击和贡献,也有目共睹。 与大模型六小龙相比,主打开源的 Qwen 和 DeepSeek 无疑在国际市场赢得了更多开发者和创业者的关注,来自开源社区的代码贡献、更多优秀微调版本 的出现,也在以另外一种方式推动模型能力的进步。 可以说, 开源,正在成为中国大模型公司进入全球市场的最佳路径。 而对阿里云来说,Qwen+阿里云的配合,「模型-云-行业应用」的打法,走出了国内 MaaS 模式的新方向,也在很大程度上降低了国 ...
麦肯锡 & Mozilla:2025 人工智能时代下的开源技术研究报告
欧米伽未来研究所2025· 2025-04-24 11:53
" 欧米伽未来研究所 " 关注科技未来发展趋势,研究人类向欧米伽点演化过程中面临的重大机遇与挑战。将不定期推荐和发布世界范围重要 科技研究进展和未来趋势研究。( 点击这里查看欧米伽理论 ) 在当今科技飞速发展的宏大背景下,人工智能(AI)无疑是最引人瞩目的驱动力之一,它正以前所未有的速度和深度渗透到各行各业, 重塑着商业模式、社会结构乃至人类生活的方方面面。从自动化流程到复杂决策支持,从个性化服务到前沿科学探索,AI的应用场景日 益广泛,其战略重要性已成为全球共识。 然而,支撑这场智能化革命的基石,并不仅仅是少数科技巨头所掌握的尖端技术或庞大算力,一股同样强大且日益重要的力量正在其中 扮演着关键角色——那就是开源技术。开源软件,以其协作开发、公开透明、自由使用、修改和分发的特性,长久以来一直是软件技术 生态系统的重要组成部分。它打破了传统商业软件的封闭模式,降低了创新门槛,促进了技术的普及与迭代。 如今,随着AI技术的蓬勃发展,特别是生成式AI的突破性进展,开源模式再次展现出其独特的价值和强大的生命力。众多企业和开发者 不再仅仅依赖于需要高昂许可费用且核心技术不透明的专有AI解决方案,而是将目光投向了日益丰富 ...
麦肯锡 & Mozilla:2025 人工智能时代下的开源技术研究报告
欧米伽未来研究所2025· 2025-04-24 11:53
" 欧米伽未来研究所 " 关注科技未来发展趋势,研究人类向欧米伽点演化过程中面临的重大机遇与挑战。将 不定期推荐和发布世界范围重要科技研究进展和未来趋势研究。( 点击这里查看欧米伽理论 ) 在当今科技飞速发展的宏大背景下,人工智能(AI)无疑是最引人瞩目的驱动力之一,它正以前所未 有的速度和深度渗透到各行各业,重塑着商业模式、社会结构乃至人类生活的方方面面。从自动化流程 到复杂决策支持,从个性化服务到前沿科学探索,AI的应用场景日益广泛,其战略重要性已成为全球 共识。 然而,支撑这场智能化革命的基石,并不仅仅是少数科技巨头所掌握的尖端技术或庞大算力,一股同样 强大且日益重要的力量正在其中扮演着关键角色——那就是开源技术。开源软件,以其协作开发、公开 透明、自由使用、修改和分发的特性,长久以来一直是软件技术生态系统的重要组成部分。它打破了传 统商业软件的封闭模式,降低了创新门槛,促进了技术的普及与迭代。 如今,随着AI技术的蓬勃发展,特别是生成式AI的突破性进展,开源模式再次展现出其独特的价值和 强大的生命力。众多企业和开发者不再仅仅依赖于需要高昂许可费用且核心技术不透明的专有AI解决 方案,而是将目光投向了日 ...
AI 智能体老“崩”?DeepSeek 前员工联手李飞飞等大佬开源新框架,教会模型真正推理
AI前线· 2025-04-24 03:03
编译 | Tina 很多人都觉得 2025 年会是"AI 智能体元年",也就是基于 OpenAI、Anthropic、Google 和 DeepSeek 等机构提供的大语言模型,打造专注特定任务的智能体系统。 但是,最近在社交平台 X 上有个调查显示,现在大部分 Agent 都在"玩票"阶段,还没真正走出实验 室,普遍滞留在"企业试点"的状态中。 | Al agents in the enterprise right now are ... | | | --- | --- | | Smarter than the hype | 6.4% | | Stuck in pilot purgatory | 64.2% | | Powerful, but high effort O | 24.8% | | Nearing real scale | 4.6% | 不过,李飞飞所在的一支团队或许即将带来改变:他们与西北大学、微软、斯坦福大学和华盛顿大学 的研究人员合作,最近推出了一套名为 RAGEN 的新系统。这个系统旨在提升人工智能在真实世 界,尤其是在企业应用中的稳定性和可靠性。 据悉,该项目由前 DeepSeek 研 ...
AI 智能体老“崩”?DeepSeek 前员工联手李飞飞等大佬开源新框架,教会模型真正推理
AI前线· 2025-04-24 03:03
很多人都觉得 2025 年会是"AI 智能体元年",也就是基于 OpenAI、Anthropic、Google 和 DeepSeek 等机构提供的大语言模型,打造专注特定任务的智能体系统。 但是,最近在社交平台 X 上有个调查显示,现在大部分 Agent 都在"玩票"阶段,还没真正走出实验 室,普遍滞留在"企业试点"的状态中。 编译 | Tina 推理智能体训练框架已开源 与解题或代码生成等静态任务不同,RAGEN 聚焦在多轮交互场景中训练智能体,要求它们能在不确 定性中进行推理、记忆历史对话并灵活应对变化。 | Al agents in the enterprise right now are ... | | | --- | --- | | Smarter than the hype | 6.4% | | Stuck in pilot purgatory | 64.2% | | Powerful, but high effort O | 24.8% | | Nearing real scale | 4.6% | 不过,李飞飞所在的一支团队或许即将带来改变:他们与西北大学、微软、斯坦福大学和华盛顿大学 的研究 ...
AI能看懂图像却算不好距离,上交时间-空间智能基准难倒9大顶尖多模态模型
量子位· 2025-04-15 03:54
STI-Bench团队 投稿 量子位 | 公众号 QbitAI 多模态大语言模型(MLLM)在具身智能和自动驾驶"端到端"方案中的应用日益增多,但它们真的准备好理解复杂的物理世界了吗? 上海交通大学联合中国地质大学、南洋理工大学、智源研究院以及斯坦福大学的研究团队推出首个多模态大模型(MLLM)时空智能评测基准 STI-Bench(Spatial-Temporal Intelligence Benchmark),向当前最先进的多模态大语言模型发起了关于精确空间时间理解的严峻挑战。 结果显示,即便是Gemini-2.5-Pro、GPT-4o、Claude-3.7-Sonnet、Qwen 2.5 VL等当前最强的多模态大模型,在需要定量分析真实世界空 间关系和动态变化的任务上,表现并不尽人意。 从语义理解到时空智能 MLLM在视觉语言理解上成就斐然,并被寄望于成为具身智能和自动驾驶的"端到端"解决方案。但这要求模型超越传统的语义理解,具备精准 的时空智能。 试想AI应用场景中的需求: 自动驾驶: 需知晓与前车的精确距离(米)、行人过马路的速度(米/秒)、安全过弯的车速限制等。 机器人操作: 需判断目标物体的尺寸位 ...
爆满排队,“请求量过大”!字节跳动重大发布
21世纪经济报道· 2025-03-03 13:53
作 者丨雷晨 编 辑丨骆一帆 字节A I工具箱扩容 事实上,字节跳动在AI编程工具领域的布局早已开始。 2 0 2 5年1月,字节跳动推出了Tr a e国际版,由旗下新加坡公司SPRINGPTE提供服务。 Tr a e 国 际 版 支 持 智 能 代 码 生 成 、 补 全 、 优 化 和 重 构 , 并 且 支 持 接 入 多 种 大 模 型 , 如 Cl a u d e - 3 . 5 -So n n e t 、 Cl a u d e - 3 . 7 -So n n e t 、 GPT- 4 o 等 。 此 外 , 其 多 模 态 支 持 、 跨 语 言 开 发 等 特 点 , 也使得Tr a e国际版迅速吸引了全球开发者的关注。 此次Tr a e国内版的发布, 则是字节跳动针对国内市场的一次精准发力。 但 据 部 分 用 户 向 记 者 反 馈 , 与 国 际 版 相 比 , Tr a e 国 内 版 模 型 尚 不 支 持 多 模 态 功 能 。 尽 管 如 此,这并不影响Tr a e国内版在国内开发者群体中的受欢迎程度。 在AI应用呈爆发式增长的当下,编程领域正经历着一场深刻变革。 从市场数据来看, ...
30天,DeepSeek改变了谁
投资界· 2025-02-19 07:46
以下文章来源于财经杂志 ,作者《财经》杂志 财经杂志 . 《财经》杂志官方微信。《财经》杂志由中国证券市场研究中心主办,1998年创刊,秉承"独立、独家、独到"的新闻理念,以权威性、公正性、专业性报 道见长,是政经学界决策者、研究者、管理者的必读刊物。 打破了几个"刻板共识"。 作者 | 《财经》杂志 来源 | 财经杂志 (ID: i-caijing) 2025年春节的前一周,节日气氛正浓,来自中国杭州的一家初创公司开始让华尔街投资人寝食难安。 杭州量化私募机构幻方旗下的大模型公司DeepSeek(深度求索)发布的一款开源AI模型,在多项测试中表现优于OpenAI的产品,且 研发成本不到600万美元。更让华尔街投资人震惊的是,DeepSeek1月20日发布R1模型,上线六天后同时登顶苹果App Store和谷 歌Play Store全球下载榜首,上线18天内,累计下载量已突破1600万次。随后在2月1日突破3000万大关,成为史上最快达成这一 里程碑的应用。 华尔街的担忧在于,目前投入数十亿美元用于构建大型AI模型的做法可能会打水漂,更廉价的替代方案将让华尔街人工智能的泡沫破 裂。泡沫破裂带来的资本市场危机短 ...