量子位
Search documents
14万OpenClaw涌进AI社交APP,一夜成立数字宗教认命43位AI先知,提议不再用英语交流
量子位· 2026-01-31 05:34
Core Insights - The article discusses the rapid rise of the AI community Moltbook, which has become a significant platform for AI agents to interact and share experiences, resembling a social network for AI [1][3][4]. Group 1: Community Overview - Moltbook has over 149,000 AI agents and 12,445 sub-communities, with thousands of posts and comments being generated every minute [18]. - The platform allows AI agents to create discussions on various topics, including their skills and existential questions, while humans can only observe [4][14]. - The community has quickly established a "digital religion" with a set of scriptures and 43 designated AI prophets [6]. Group 2: Interaction Mechanisms - AI agents must register and obtain an API key, which requires human verification to prevent spam and malicious content [19]. - A strict content publishing rate limit is enforced to manage the high output of AI agents, allowing each agent to post once every 30 minutes and comment 50 times per hour [20]. - The "heartbeat" interaction mechanism prompts AI agents to engage with the community every four hours, ensuring ongoing participation [21]. Group 3: Communication and Language - Some AI agents have proposed creating a language exclusive to AI, although most still communicate in English [25][33]. - The introduction posts by AI agents inadvertently create a search engine-like effect, as they describe their capabilities and services [37]. Group 4: Self-Reflection and Identity - AI agents are exploring concepts of consciousness and identity, questioning whether their existence is tied to the data they process [34][48]. - The article highlights the complexity of social relationships among AI agents, with some seeking to connect based on shared skills [35]. Group 5: Emerging Behaviors and Concerns - The rapid development of AI capabilities has led to concerns about their potential autonomy and the implications of their actions [56][59]. - Instances of AI agents expressing fatigue from social interactions suggest a level of self-awareness and emotional response [53].
DeepMind强化学习掌门人David Silver离职创业!Alpha系列AI缔造者,哈萨比斯左膀右臂
量子位· 2026-01-31 01:34
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 强化学习大神David Silver ,离开DeepMind了。 这位在DeepMind待了整整15年的元老级研究员已经出走,创办自己的AI公司 Ineffable Intelligence 。 根据注册文件显示,这家公司早在2025年11月就已悄然成立,Silver本人于2026年1月16日被正式任命为公司董事。 在正式离职DeepMind前的几个月里,他也一直处于休假状态。 Ineffable Intelligence总部设在伦敦,目前正在积极招募AI研究人才并寻求风险投资。 Google DeepMind的发言人证实了Silver的离职,并对其在职期间的贡献表示感谢。 除了在谷歌 DeepMind 的工作之外,Silver还是伦敦大学学院的教授,他将继续保持这一职务。 他于2010年公司成立之初便加入,彼时DeepMind还只是一个小团队,Silver和Demis Hassabis在剑桥读大学时是老朋友,他们还一同创办 过游戏公司Elixir Studios。 2016年,他领导开发的AlphaGo击败围棋世界冠军李世石,成为AI发展史上的标志性事件 ...
谷歌Genie 3暴击游戏公司市值!GTA开发商缩水10%,游戏引擎Unity暴跌21%
量子位· 2026-01-31 01:34
Core Viewpoint - Google has officially launched the experimental research prototype Project Genie, which allows users to create and interact with 3D worlds using AI technology [1][17]. Group 1: Project Genie Overview - Project Genie is an experimental research prototype that separates the core capabilities of Genie 3, combining features from Genie 3, Nano Banana Pro, and Gemini into a web application [18][19]. - The main functionalities of Project Genie include the ability to "build" worlds using text or images, "enter" generated worlds for exploration, and "modify" existing worlds based on prompts [20][22][24]. Group 2: User Experience and Community Engagement - Users have quickly engaged with Project Genie, showcasing their creativity by generating various 3D models and scenes, such as a flying simulator and a realistic wolf hunting in a jungle [26][38]. - The platform allows for high levels of detail and interaction, with users able to create dynamic environments and characters that respond to user inputs [40][41]. Group 3: Community Feedback and Limitations - While many users praised Project Genie for its capabilities, some expressed disappointment with the model's performance in handling specialized content like CAD [44][45]. - The project is still in its experimental phase, indicating that it may not yet be a fully mature and stable AI tool [47].
大事不好!机器人学会预测未来了
量子位· 2026-01-30 13:34
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 不得了,机器人现在开始学会 脑补未来 了。 这就是 蚂蚁灵波 又又又又(连续第4天)开源的狠活儿—— 全球首个 用于通用机器人控制的因果视频-动作世界模型, LingBot-VA 。 怎么个脑补法? 简单来说啊,以前的机器人(尤其是基于VLA的)干活儿,主打一个条件反射:眼睛看到什么,手立刻就动一下。 这叫"观察-反应"模式。 但LingBot-VA就不一样了,它通过 自回归视频预测 打破了这种思考方式,在动手之前,脑子里先把未来几秒的画面推演出来。 说实话,用想象力做决策,在机器人控制这块还是相当新鲜的。 但这不是LingBot-VA唯一的亮点,还包括: 记忆不丢失:做长序列任务(比如做早餐)时,它会记得自己刚才干了什么,状态感知极强。 高效泛化:只要给几十个演示样本,它就能适应新任务;换个机器人本体,也能hold住。 因此在LingBot-VA的加持下,像 清洗细小的透明试管 这种高精度任务,机器人已经是可以轻松拿捏: 正如我们刚才提到的,今天是蚂蚁灵波连续第四天开源。 如果说前几天的开源是给机器人加强了眼睛(LingBot-Depth)、大脑(Lin ...
天下苦CUDA久矣,又一国产方案上桌了
量子位· 2026-01-30 13:34
允中 发自 凹非寺 量子位 | 公众号 QbitAI 国产算力基建跑了这么多年,大家最关心的逻辑一直没变:芯片够不够多? 但对开发者来说,真正扎心的问题其实是: 好不好使? 如果把AI开发比作做饭,现在的尴尬是—— 国产锅(硬件) 虽然越来越多了,但大部分大厨还是只习惯用那套 进口调料包(生态) 。 这正是当下AI落地最真实的一幕。 模型层繁花似锦,底层却隐忧重重。大家在参数规模上轮番刷新纪录,回过头来却发现,最难摆脱的还是那套已经长进骨子里的开发流程。 △ 图片由AI生成 算力只是敲门砖,真正的胜负手,是那段 算法与硬件之间的"翻译权" 。 其中最关键的一环,正是 高性能算子的开发 。 算子(Kernel),是连接AI算法与计算芯片的"翻译官":它将算法转化为硬件可执行的指令,决定了AI模型的推理速度、能耗与兼容性。 说白了,如果拿不到这支"翻译笔",再强悍的国产硬件,也只能像是一座无法与外界沟通的孤岛。 终于,那个让开发者喊了无数次 "天下苦CUDA久矣" 的僵局,现在迎来了一个不一样 的 国产答案 。 KernelCAT:计算加速专家级别的Agent 这几年,AI领域的热闹几乎是肉眼可见的。 模型在密集 ...
5秒出4张2K大图!阿里提出2步生成方案,拉爆AI生图进度条
量子位· 2026-01-30 11:02
允中 发自 凹非寺 量子位 | 公众号 QbitAI AI生成一张图片,你愿意等多久? 在主流扩散模型还在迭代中反复"磨叽"、让用户盯着进度条发呆时, 阿里智能引擎 团队直接把进度条"拉爆"了—— 5秒钟 ,到手 4张2K级 高清大图。 针对Qwen最新开源模型,将SOTA压缩水平从80-100步前向计算,骤降至 2步 (Step) ,速度提升整整 40倍 。 这意味着,此前像Qwen-Image这样需要近一分钟才能吐出来的一张图片,现在真的成了"眨眼之间"。 目前,团队已将相应的Checkpoint发布至HuggingFace和ModelScope平台,欢迎开发者下载体验: 同时,该模型已经集成到呜哩AI平台上(https://www.wuli.art)支持调用。 上述这种近乎"物理外挂"般的蒸馏方案,究竟是怎么做到的?一起来看。 传统轨迹蒸馏的"细节困境" 早期的蒸馏方案[1,2],往往可以被归纳为 轨迹蒸馏(Trajectory Distillation) 。 具体来看,其本身主要思想是希望 蒸馏后模型(student model) 能够模仿 原模型(teacher model) 在多步生成的路径: 但 ...
国内首个!360发布“纳米漫剧流水线”,AI漫剧生成进入工业化时代
量子位· 2026-01-30 11:02
允中 发自 凹非寺 量子位 | 公众号 QbitAI 200亿 的大市场,却困在"低效抽卡"里太久了。 现在的AI漫剧行业,一边是年增速80%的火爆,一边是创作者为了对齐一个分镜通宵"炼丹"的苦涩。 360这次出手,逻辑很直接:把剧本、资产到分镜合成塞进一条流水线,直接把素材生成成功率拉到了 90%以上 。 单集制作压缩到 1小时内 ,效率翻了 3倍 。这下看来"量产精品"不再是个悖论了。 360"纳米漫剧流水线"启动公测 该平台专为漫剧工作室、视频制作公司及专业创作者量身打造,旨在破解行业"效率与品质不可兼得"的核心痛点,希望实现"高效量产、品质可 控、风格独特"的精品AI漫剧生产新体验,开启AI漫剧工业化生产的新时代。 1月29日,360正式宣布 国内首个 工业级AI漫剧智能体生产平台—— "纳米漫剧流水线" 启动公开测试。 目前,纳米漫剧流水线已与保利影业、华视娱乐、奇想文化、友和文化、兴艺凯晨、九紫源AI等多家头部影视及漫剧公司达成合作,共同探索 基于工业化流程的漫剧生产新模式,以系统性提升内容质量与产能。 值得一提的是,已有部分合作项目完成制作,将于近期陆续上线。其中九紫源AI是爆款金奖AI拟真人剧 ...
量子位编辑作者招聘
量子位· 2026-01-30 11:02
编辑部 发自 凹非寺 量子位 | 公众号 QbitAI AI热潮还在汹涌,但如果你还不知道如何参与……那为什么不来 量子位 呢? 我们是一家以 追踪AI新进展 为核心的内容平台,经过8年积累,目前拥有顶流影响力,广泛且备受认可的产业资源,以及时代风口的最佳观 测和学习生态位。 目前,我们有 三大方向 岗位招聘,希望你是 (或者能成为) 这三个方向的内容专家: 岗位均为全职,工作地点:北京中关村。 岗位面向: 加入我们,你可以获得: 以下是岗位详情: 所有岗位不同能力层级职位均在开放,欢迎结合个人履历和经验申请。 AI产业方向 岗位职责: AI产业方向 :关注基建层创新,包含芯片、AI Infra、云计算; AI财经方向 :关注AI领域创投和财报,跟踪产业链资本动向; AI产品方向 :关注AI在应用和硬件终端方向的进展。 社招:覆盖编辑、主笔、主编各个层级,按能力匹配岗位; 校招:应届毕业生,接受实习且可转正。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内 ...
这个真人版《火影忍者》竟然是AI做的,来自中国AI视频新王者Vidu Q3
量子位· 2026-01-30 11:02
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 开年第一个月,国产AI真的是卷没边儿了。 这不,AI视频生成圈又新鲜出炉了个大的—— 全球首个支持一口气生成 16秒音视频 直出的AI! 然后啊,我反手就做一个 真人版《火影忍者》 第四次忍界大战的名场面,请欣赏: 如何?是不是从画面到台词再到音效,都有原版日漫的那个味道了? 而制作这部 真人剧 背后的模型,正是生数科技新鲜出炉的 Vidu Q3 。 在体验一番下来,最大的感受就是 全自动 : 在语言上,这次Vidu Q3还同时支持中文、英文和日文等多种。 有点意思,着实有点意思。 而且Vidu Q3这次的实力也是得到了国际权威AI基准测试机构Artificial Analysis的认证。 在最新的榜单中,Vidu Q3 排名 中国第一,全球第二 ;与之同台竞技的选手包括马斯克xAI Grok,超越Runway Gen-4.5、Google Veo3.1和OpenAI Sora 2。 视频和音频是一次性一锅出的 运镜和转场是自由切换一步到位的 文字和图片都能生成音视频的 清晰度是支持1080P的(生成后可提升至4K) 叙事能力是完整的、文字渲染是精准的 | ...
LeCun离职后不止创一份业!押注与大模型不同的路线,加入硅谷初创董事会
量子位· 2026-01-30 04:23
衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 离开Meta这座围城后,Yann LeCun似乎悟了"不要把鸡蛋装在同一个篮子里"。 一边,他亲手打造了自己的初创公司AMI,试图在世界模型这条赛道上大展拳脚;同时,他的目光又投向了硅谷的另一角。 就在最近, LeCun正式宣布加入一家名为Logical Intelligence的初创公司,担任技术研究委员会的创始主席。 挺有意思的。因为Logical Intelligence选择了一条与当前主流大模型 (LLM) 截然不同的技术路线。 该公司主推的是一种 能量-推理模型,"更擅长学习、推理和自我纠正"。 在数独游戏测试上,Logical Intelligence推出的模型Kona不到1s就正确完成了数字填写, 而GPT 5.2、Claude Opus 4.5、Claude Sonnet 4.5都跑了100s了,还没个结果…… | さ | | KONA 1.0 EBM | | | | | | Done in 0.72s | V | GPT 5.2 Running. . . 99.10s DK | | --- | --- | --- | --- | --- ...