Workflow
思维链技术
icon
Search documents
张哲:数据帮助解决算法模型落地的最后一公里问题
Bei Ke Cai Jing· 2025-07-12 04:07
新京报 和 IX 上自会秘书 冠节户 TEC 新京报贝壳财经讯(记者胡萌)7月11日,2025贝壳财经年会「中国经济:开放与韧性 共生」在北京召开。海天瑞声董事会秘书张哲在圆桌论坛「服务实体 经济 金融与科创的"双向奔赴"」中表示,近两年大模型领域发生较多变化,AI大模型正在从单模态向多模态发展,应用场景也迅速从通用场景向垂直场景 转换。此外,DeepSeek火爆也让思维链(CoT)技术备受关注,这一技术让模型从之前的"快思考"转变为"慢思考",从而提升了模型处理复杂问题的准确性 和可靠性。上述变化驱动数据需求同步呈现多模态、多场景、思维链等新趋势。 对于AI行业对训练数据的需求变化,张哲表示,由于大模型的崛起,AI与千行百业的融合发展已经启动,算法模型的落地普遍存在"最后一公里"的问题,众 多实践表明,持续获得对应场景的高质量数据是解决"最后一公里"问题的重要途径。 张哲介绍,中国国内AI数据市场只是全球市场的一小部分,更大的市场是在国外。"海天的全球化业务已经发展多年,去年我们境外收入已经占到全年收入 的接近一半,且去年我们也首次把自主可控的数据交付基地布局到国外。" 公开资料显示,海天瑞声成立于2005 ...
“由 AI 生成的代码,从诞生那一刻起就是「遗留代码」!”
AI科技大本营· 2025-05-12 10:25
【编者按】如今生成式 AI 逐渐融入软件开发流程,越来越多 AI 生成的代码出现在实际工程中——但你有没有想过,这些由 AI 写出来的代码,从一开始 就可能被视为"遗留代码"?本文作者从工程经验出发,结合 AI 的生成机制,提出一个颇具启发性的观点: AI 生成的代码缺乏上下文记忆和维护连续性, 因此一 诞生就处于"他人旧作"的状态 。 这 不仅是对当前 AI 编码能力的冷静观察,也为我们理解未来软件开发形态提供了一种新视角。 原文链接: https://text-incubation.com/AI+code+is+legacy+code+from+day+one 翻译 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 在软件开发中,代码的"可改进性"往往取 决于其所处的生命周期阶段。通常可以分为以下几类情况: 总的来看, 代码的演进速度,通常取决于离它的编写时间有多近、维护者是不是原作者。 其实 , 这种状态是合理的:对于一个运行稳定、经过验证的软件系统而言,贸然进行"改进"往往带来额外风险,尤其是当你对系统的整体脉络不甚了 解时,原作者通常才最清楚其潜在逻辑和 开发 背景。 AI 生成的代码 , ...
OpenAI加码写作赛道?阿里最新大模型通用写作能力基准WritingBench,揭秘深度思考能否增进文学表达
量子位· 2025-03-20 10:56
通义智文团队 投稿 量子位 | 公众号 QbitAI 全面评估大模型 生成式写作能力 的基准来了! 就在最近,OpenAI CEO奥特曼还爆料他们已经训练了一款在创作领域表现卓越的新模型,并为其生成的故事所深深触动。 为此,阿里研究团队联合中国人民大学和上海交通大学共同开源了 WritingBench ——该评估基准覆盖6大领域、100个细分场景,共包含 1000+条评测数据,以期为生成式写作提供全面的评估。 团队进一步发现,凭借思维链技术和动态评估体系的加持, 基于Qwen开发的32B创作模型在创意型任务上表现接近顶尖模型R1 ,为高效能 创作开辟了新路径。 WritingBench:最懂行业的写作评估基准 目前行业在评估大模型写作能力时,面临两大难题: 1、考生文思泉涌,考官身陷囹圄 更早之前,Deepseek-R1的文学创作能力也惊艳了整个科技圈,并由此引发了一场大模型创作的军备竞赛。 但一个根本性问题亟待解决—— 究竟什么才是真正的「高质量写作」? 主流基准通常使用标准化输入材料,导致真实场景中模型表现不尽如人意,例如结合财报数据的商业分析写作和招投标书撰写仍是大模型写作 的低分场景。 如下图所示,不 ...
速递|微软“去OpenAI化”计划浮出水面,自研AI模型MAI来了
Z Finance· 2025-03-08 09:44
图片来源 : Unsplash 据消息报道,微软正自主研发人工智能推理模型,以抗衡 OpenAI 并可能向开发者出售这些模型。 报道进一步透露,苏莱曼团队已在 Copilot 系统中开展技术替代实验,使用参数规模远超此前自研 Phi 系列模型的 MAI 模型,逐步替换现有的 OpenAI 模型。 据内部规划,微软拟于今年晚些时候以应用程序接口( API )形式开放 MAI 模型,这将使外部开发 者能够将这些先进模型集成至自有应用程序中。 这场技术自主化战略的推进,恰逢微软通过早期投资 OpenAI 在 AI 军备竞赛中占据先发优势之际。 行业观察人士指出,科技巨头在保持生态合作的同时构建自主技术护城河,已成为当前 AI 产业发展 的新常态。 参考资料 作为 OpenAI 的主要支持者,微软已开始在 Copilot 智能助手产品中测试由马斯克旗下 xAI 、 Meta 及 DeepSeek 开发的模型,作为 OpenAI 技术的潜在替代方案。 此举标志着,微软在持续深化与这家 ChatGPT 开发商的战略合作同时,正通过技术多元化策略降低 对其核心依赖。 路透社曾在去年 12 月独家披露,微软正通过整合内部及第 ...
晚点独家丨月之暗面探索 o1,跟字节抢来华为刘征瀛
晚点LatePost· 2024-11-28 14:57
编辑丨程曼祺 本月初经历仲裁风波后,月之暗面在 11 月 16 日发布新的 数学模型 k0-math ,当时月之暗面创始人杨植 麟反复提到 "o1":他将 k0-math 的测评评分与 o1 比较,称其思路与 o1 类似——都采用了强化学习和思 维链技术。 o1 是 OpenAI 在今年 9 月发布的新模型,它有更强推理和数学能力。杨植麟曾在 o1 发布后不久的一场演 讲中说,o1 的出现意味着大模型的范式转换:从预测下一个 token 的规模扩展( Next-Token Predictio Scaling)到强化学习的规模扩展(Reinforcement Learning Scaling)。 11 月发布 k0-math 时,杨植麟提了 23 次强化学习,17 次推理,7 次 o1。 文丨王与桐 从成立至今,月之暗面长期被认为是中国大模型创业公司中,技术人才密度颇高的一家。月之暗面现在仍只 有 100 多人,但汇集了杨植麟和周昕宇两位技术背景创始人,杨植麟发表过两篇大语言模型领域重要论文 [1],周昕宇在旷视期间与现在加入另一家大模型独角兽阶跃星辰的张祥雨,一起发表过单篇引用超 9000 次 的卷积神经网络 ...