Workflow
智能模型
icon
Search documents
火山引擎发布豆包视频生成模型Seedance 1 lite
news flash· 2025-05-13 07:12
今日在FORCE LINK AI创新巡展.上海站,火山引擎发布豆包.视频生成模型Seedance1lite、豆包1.5.视觉 深度思考模型,并升级豆包.音乐模型,以更全面的模型矩阵、更丰富的智能体工具,帮助企业打通从 业务到智能体的应用链路。官方表示,此次全新发布的豆包视频生成模型Seedance1lite,支持文生视 频、图生视频,视频生成时长支持5s、10s,分辨率提供480P、720P。企业用户可在火山方舟平台使用 该模型API,个人用户也可在豆包APP、即梦体验。(新浪科技) ...
只有通过海量测试才能抓住泛化性的本质吗?
机器之心· 2025-05-10 03:42
本文第一作者为上海交通大学博士生程磊,指导老师为上海交通大学张拳石教授。 当以端到端黑盒训练为代表的深度学习深陷低效 Scaling Law 而无法自拔时,我们是否可以回到起点重看模型表征本身——究竟什么才是一个人工智能模 型的「表征质量」或者「泛化性」?我们真的只有通过海量的测试数据才能抓住泛化性的本质吗?或者说,能否在数学上找到一个定理,直接从表征逻辑复 杂度本身就给出一个对模型泛化性的先验的判断呢? 论文地址: https://arxiv.org/abs/2502.10162 本文就上述问题给出了初步的探索,从神经网络内在精细交互表征复杂度的角度来探索「可泛化交互表征」和「不可泛化交互表征」各自所独有的分布。 一、大模型时代呼唤更高效的泛化性分析策略——中层表征逻辑的交流与对齐 尽管深度学习基础理论近年来取得了长足的发展,但一些根本性问题仍未得到有效解决。典型地,对神经网络泛化性的研究依然停留在一个相对较浅的层面 ——主要在高维特征空间分析解释神经网络的泛化性(例如通过损失函数景观平滑度来判断泛化性)。 因此,我们始终无法对神经网络泛化性给出一个「究竟」的解释——究竟怎样的确切的表征才叫高泛化性的表征。 ...
速递|O'Reilly指控OpenAI"窃书" 训练 GPT-4o,AI数据黑箱再陷版权风暴
Z Potentials· 2025-04-02 03:17
图片来源: Unsplash 多家机构指控 OpenAI 可能利用付费墙后的 O'Reilly 书籍训练 AI 模型, 未经许可使用受版权保护的 内容训练其人工智能。 如今,一家 AI 监督组织发布的新论文提出了严厉指控,称该公司日益依赖未公开且未获授权的书籍 来训练更复杂的 AI 模型。 人工智能模型本质上是复杂的预测引擎。通过大量数据(如书籍、电影、电视剧等)的训练,它们学 习模式及从简单提示中推断的新方法。当模型 "撰写"关于希腊悲剧的论文或"绘制"吉卜力风格图像 时, 它只是在利用其庞大知识库进行近似模拟,并未创造出任何新内容。 在 ChatGPT 中, GPT-4o 是默认模型。论文指出, O'Reilly 与 OpenAI 之间并未签署许可协议。 "OpenAI 最新且能力更强的模型 GPT-4o ,相比早期模型 GPT-3.5 Turbo ,对 O'Reilly 付费书籍内容 展现出更强的识别能力…… " 论文合著者写道, " 相比之下, GPT-3.5 Turbo 对公开可获取的 O'Reilly 书籍样本表现出更高的相对识别率。 " 该论文采用了名为 DE-COP 的方法( 2024 年首次 ...