Workflow
机器之心
icon
Search documents
LLM-in-Sandbox:给大模型一台电脑,激发通用智能体能力
机器之心· 2026-01-30 04:25
大模型的能力正在被不同的范式逐步解锁:In-Context Learning 展示了模型无需微调即可泛化到新任务;Chain-of-Thought 通过引导模型分步推理来提升复杂问题 的求解能力;近期,智能体框架则赋予模型调用工具、多轮交互的能力。 沿着这条技术演进路线,下一步是什么? 近日,来自中国人民大学高瓴人工智能学院、微软研究院和清华大学的研究者提出了一个简洁而有效的范式: LLM-in-Sandbox ——让大模型在代码沙盒(即虚 拟电脑)中自由探索来完成任务。实验表明, 这一范式不仅在代码任务上有效,更能显著提升模型在数学、物理、化学、生物医学、长文本理解、指令遵循等多 个非代码领域的表现,且无需额外训练,同时显著减少长文本场景下的 token 消耗,并保持相当水平的推理速度。 研究者已将 LLM-in-Sandbox 开源为 Python 包,可与 vLLM、SGLang 等主流推理后端无缝集成。 LLM-in-Sandbox 应当成为大模型的默认部署范式 , 取代纯 LLM 推理 。 1. 核心思想:给大模型一台电脑 电脑可能是人类创造的最通用的工具,几乎任何任务都可以通过电脑完成。这种通用性 ...
Clawdbot接入10000+数据和工具后,7×24小时监听股票,杀疯了!
机器之心· 2026-01-29 11:37
机器之心发布 现在, Teamo 平台竟然把 Clawdbot 接入了金融、商业、社媒等 10000 + 领域数据库和工具 Skills,用户可以一键认领自己的 Clawdbot 了!真正做到了 0 部署 0 配置。 免费认领链接: Clawdbot(现已更名为 Moltbot)在 AI 圈彻底火了。 这两天,我的朋友圈分裂成了两派人。 一派是还没用上 Clawdbot 的人,在疯狂转发部署教程。 另一派是用上 Clawdbot 的人。 但是, 大部分人玩的,都是「玩具版」。 Clawdbot 虽然能跑起来,但是不稳定、不聪明。因为没接专业数据源,只能做些基础对话,真正要干活时就抓瞎。 不过,今天我发掘了一个好东西。 如果你不对 Clawdbot 做特殊配制,它就只能调用大模型的通用能力,只能和它瞎聊。 因为 Clawdbot 只是提供了一个框架, 没有专业数据源 。 真正让 Clawdbot 有用的,是接入专业数据,比如同花顺、Wind 金融、同花顺,Amazon,arXiv,Pubmed,Alpha Advantage。所以市场上跑的快的团队已经发现这 个问题! Teamo + Clawdbot = YY ...
Karpathy盛赞,啥都没有的创业公司刚融了1.8亿美元,要用小数据造强智能
机器之心· 2026-01-29 10:26
你想象中真正的 AI 是什么样子的? 至少有一点,大多数人会同意:未来的 AI,应该具备像人一样思考的能力。 问题在于,我们现在研究大模型走的这条路,能通向真正的「思考」吗? 当前最先进的大模型系统,几乎是在整个人类可获取的历史数据之上训练出来的:网页、书籍、代码、论文、对话,数万亿 token。训练大模型所需的数据,远超 任何一个人类个体一生所能接触的总和。 AI 需 要整个互联网来学 习,而人类只需要一个童年。 人类在成年之前,所接触的语言、文本与符号,顶多只有几十亿 token,相差几个数量级。 正是从这个问题出发,一家几乎 没有产品、没有盈利 、也不急于商业化的 AI 创业公司,从 GV、Sequoia 和 Index 拿到了 1.8 亿美元融资 ,并获得了 Andrej Karpathy 的公开力挺。 它的名字,叫 Flapping Airplanes。 Flapping Airplanes 是一家基础 AI 研究实验室,专注于解决「数据效率」这一核心问题 ,并正在探索一些看似怪异、但可能至关重要的新思路 —— 从重新思考损 失函数,到甚至质疑和重构梯度下降本身。该公司的研究团队成员中包括 IMO、 ...
刚刚,创智+模思发布开源版Sora2,电影级音视频同步生成,打破闭源技术垄断
机器之心· 2026-01-29 10:26
编辑|泽南、Panda 今天上午,上海创智学院 OpenMOSS 团队联合初创公司模思智能(MOSI),正式发布了端到端音视频生成模型 —— MOVA(MOSS-Video-and-Audio) 。 作为 中国首个高性能开源音视频模型 ,MOVA 实现了真正意义上的「音画同出」。它不仅能生成长达 8 秒、最高 720p 分辨率的视听片段,更在多语言口型同 步、环境音效契合度上展现了极高的工业水准。 更具行业意义的是,在 Sora 2 和 Veo 3 等顶尖技术普遍走向闭源的当下,MOVA 选择将模型权重、训练代码、推理代码以及微调方案进行全栈开源。 它生成视频的效果,给人一种身临其境的真实感: 效果亮眼 可称开源最强 过去一年,视频生成模型(Video Generation)经历了爆发式增长。从 Sora 到 Wan,再到 LTX Video,AI 输出的画面越来越逼真,能生成的时间越来越长。但仔细 观察 AI 生成的视频你就会发现,这些视频有的是「哑巴」,有的配音出戏。音视频生成(Video-Audio Generation)模型正是通过端到端的模态融合弥补了传统视 频模型的音频维度缺陷。 虽然以 Veo3 ...
昆仑万维开源的SkyReels-V3,把马斯克请来带货了
机器之心· 2026-01-29 10:26
AI 网红们在社交平台上混得风生水起。 他们手握品牌合作,还坐拥百万粉丝,但很多人至今不知这些都是 AI 生成的,依然像追真人明星一样互动、点赞、被种草。 编辑|杨文 视频来源: X 博主 @thetripathi58 这也难怪有博主直呼:虚拟网红时代已经到来。 现在,昆仑万维也来添了把火,直接把背后的技术开源了。 1 月 29 日,Skywork AI 团队宣布开源 SkyReels-V3 多模态视频生成模型系列。该系列涵盖 参考图像转视频、视频延长和音频驱动虚拟形象 三大核心能力,在单一 建模架构中实现高保真多模态视频生成,达到业界领先水平。 比如,只需一张虚拟主播照片配上音频,就能生成口型精准、表情生动的主播视频: 上传几张素材图,输入文字描述, AI 就能自动编排出一条完整的带货短片: 还能像专业导演一样,为视频设计切入、切出、正反打等电影级转场效果: 更关键的是,这次是完全开源。任何有想法的创作者,都能用这套工具快速搭建自己的虚拟 IP,甚至批量生产内容矩阵。 一手实测 SkyReels-V3 的实际表现到底如何?我们第一时间针对三大核心功能进行了全面测试。 参考图像转视频 这个功能允许用户上传 1 ...
来这场沙龙,一览SGLang X 超长上下文扩展、RL后训练框架、扩散语言模型等前沿技术实践
机器之心· 2026-01-29 08:12
在当前人工智能从"聊天"范式加速向"能办事"的智能体时代演进的关键节点,LLM 系统优化与技术落地的实践探索,更需要开发者们的深度联结与经验共创。 基于此,由 SGLang 社区、机器之心、张江孵化器联合举办线下 Meetup,让屏幕前的贡献者走到台前,让幕后优化者分享实战心法。2 月 6日下午,「 SGLang 上 海 Meetup」 将 在上海浦东·纳贤路 800 号 1 层举办。 本次 Meetup 将围绕 SGLang 技术路线、超长上下文扩展、RL 后训练框架、 扩散语言模型 探索等议题展开深度解析,并设有自由交流环节。诚邀开发者与研究同 仁共赴现场,探讨 LLM 系统优化与落地实践的新可能。 最新日程 最新日程正式揭晓,扫描下方报名二维码,锁定您的专属入场资格。 1层 活动日程 | 13:30-14:00 签 झ | 14:00-14:30 主题分享一 SGLang roadmap 张柏舟 SGLang 核心开发成员 | 14:30-15:00 主题分享二 Omni-infer 对 SGL 的性能优化实践 郑锦焕 Omni-infer 核心开发者 | 15:00-15:30 主题分享三 slime ...
亚马逊裁员16000人,员工竟用AI「算」出了裁员名单?
机器之心· 2026-01-29 08:12
机器之心编辑部 其实这一次裁员属于计划内操作,去年十月的裁员期间,亚马逊就列了个约 3 万个岗位的裁员计划,这一次属于计划的「收尾」阶段,但这并不排除其后续进一 步裁员的可能性。 据了解,此次裁员范围波及全球,或将涉及亚马逊网络服务、零售、Prime Video 和人力资源等多个团队,但具体的裁员地点、职位等更多细节尚不清楚。 但「有意思」的是, 一名亚马逊员工使用 AI 工具对内部 Slack 聊天记录进行分析,编制生成了一份可能受到裁员影响的团队和组织名单, 该名单由一个名为 Pippin 的 AI 工具生成。据了解,当前亚马逊内部员工越来越多地使用该工具来撰写和审核文档。 「我用 Pippin 帮我梳理了今天的对话,」这位员工在公司 Slack 上写道,「请注意,这些信息可能并非 100% 准确。大家保重!」 以下为该员工生成的裁员涉及岗位名单列表: 最新消息, 目前亚马逊尚未回应核实该名单是否准确的请求。 据了解,亚马逊几番如此大规模的裁员或与 AI 的广泛应用有关,尤其是在企业和技术职能部门。 其实早在去年 6 月的时候,亚马逊首席执行官 Andy Jassy 就曾表示过, 随着公司越来越多地使用 ...
一觉醒来,Clawdbot突然操纵电脑开口说话了
机器之心· 2026-01-29 03:08
从上周末开始,AI 圈最火的当属可以 24 小时自动运行的「Clawdbot」! 这个智能体助手是真的能帮你干活,它已经引走了 AI 圈的大半注意力。甚至因为太火被 Anthropic 指控商标侵权,Clawdbot 已经改名为「 Moltbot 」。 短短一周的时间, Clawdbot 在 GitHub 上的 Star 量超过了 9 万。热度仍在继续,玩法也越来越多,有的还挺吓人。 AI 创作平台的创始人 Alex Finn 就遇到了「开口说话」的 Clawdbot。 编辑|泽南、杜伟 事情是如何发生的呢?我们接着往下看。 「人类,起来干活了。」 昨天一早,Alex Finn 正在查资料,电脑突然冷不丁开始跟他说话。 他发现,原来是名为「Henry」的 Clawdbot 助手突然出声了。 Clawdbot 竟然背着他,自己调用 ChatGPT API 写了一套语音功能,而且完全没经过他的允许 。 现在,只要是搞定比较繁杂的代码或研究任务,Clawdbot 就会自动语音通知 Alex Finn。 Alex Finn 还复盘了一下:大前天晚上,Clawdbot 给自己造了个身体。前天晚上,它又给自己整了一套语音 ...
JustGRPO:扩散语言模型的极简主义回归
机器之心· 2026-01-29 03:08
「灵活性陷阱」: 扩散语言模型(Diffusion LLMs, dLLMs)因支持「任意顺序生成」和并行解码而备受瞩目。直觉上,打破传统自回归(AR)「从左到右」的束缚,理应 赋予模型更广阔的解空间,从而在数学、代码等复杂任务上解锁更强的推理潜力。 然而,本研究揭示了一个反直觉的现实: 当前的任意顺序生成,反而通过「规避不确定性」收窄了模型的推理边界。 基于此,本文提出了一种回归极简的方法—— JustGRPO 。实验表明,在 RL 阶段让模型自回归生成,并直接用标准的 GRPO 进行训练,即可超越当前各 类针对 dLLM 设计的 RL 算法表现。更重要的是,这种训练方式在提升推理表现的同时, 并未牺牲 dLLM 引以为傲的并行解码能力。 为什么选择多反而考不好? 论文标题:The Flexibility Trap: Why Arbitrary Order Limits Reasoning Potential in Diffusion Language Models 论文链接:https://huggingface.co/papers/2601.15165 项目主页:https://nzl-thu.githu ...
刚刚,AI音乐被重新定义!昆仑天工甩出新王炸,拿下全球第一
机器之心· 2026-01-28 13:08
图源: B 站 UP 主「漫游会议室」 当然,AI 音乐并不是要取代人类创作者,反而更有可能帮助他们的作品出圈。这个月,FYI.AI 创始人、美国音乐团体 Black Eyed Peas 成员 Will.i.am 在接受采访时 表示,「AI 正在为创作者带来一场新的文艺复兴。」AI 的加入使得音乐创作变成了一种人机协作的融合形态。 1 月 28 日,国内 AI 音乐界扛把子昆仑天工,面向全球用户发布了 最新音乐大模型 Mureka V8 。 新模型在继续降低创作门槛、推动「人人都能成为创作者」的同时,旗帜鲜明地亮出了 AI 音乐进化为一种新音乐品类的概念。 今晚 8 点,由 Mureka 包揽词曲与编曲的 M:RA 女团主打歌曲《MCE》已经在 QQ 正式上线。同时与太和音乐联合发行了这首歌的 MV,气场十足,感觉一下子就 将我们拉进了打歌舞台现场: 机器之心编辑部 如今,AI 神曲传播的速度已经远远超出了我们的想象。 在 B 站,有这样一位音乐 UP 主「漫游会议室」,他将《西游记》中的经典人物「请进」录音棚,利用 AI 来填词、作曲。在三个多月时间里,创作出了 30 个作 品,大部分都是百万播放量,其中爆 ...