人工智能

Search documents
3D生成补上物理短板!首个系统性标注物理3D数据集上线,还有一个端到端框架
量子位· 2025-07-23 04:10
PhysX团队 投稿 量子位 | 公众号 QbitAI 3D生成又补齐了一块重要拼图—— 物理属性 ! 南洋理工大学-商汤联合研究中心S-Lab,及上海人工智能实验室合作提出了 PhysXNet ,号称首个系统性标注的物理基础3D数据集。 团队表示,3D生成正从纯虚拟走向物理真实,但现有的3D生成方法主要侧重于几何结构与纹理信息,忽略了基于物理属性的建模。 为了填补当前包含物理属性3D数据集的关键空白,PhysXNet应运而生。 该数据集包含超过 26K 带有丰富注释的3D物体,涵盖五个核心维度: 物理尺度 、 材料 、 可供性 、 运动学信息 、以及 文本描述 信息。 此外,团队还提出了PhysXGen,一个面向真实物理世界的3D生成框架,以实现从图像到真实3D资产的生成。 下面具体来看。 当前研究大多忽视了物理属性 近年来,随着3D资产在游戏、机器人技术和具身模拟等领域的广泛应用,其多样性与高质量生成受到了越来越多的关注。 大量研究工作集中在外观与几何结构上:包括高质量的3D数据集 (Objaverse、ShapeNet) 、高效的3D表示方法以及生成模型等方面。 然而, 这些研究大多仅关注结构特征,忽视 ...
AI音效90秒长时可控生成!“狼嚎2秒,蟋蟀鸣8秒”精准搞定!清华&生数科技新研究入选ACM MM 2025
量子位· 2025-07-23 04:10
FreeAudio团队 投稿 量子位 | 公众号 QbitAI 文生音频系统最新突破,实现 精确时间控制 与 90秒长时音频生成 ! 想象一下,给AI发一段复杂指令生成音频: 0-10秒要有森林风吹声;0-4秒,鸟儿鸣叫;4-6秒,木头燃烧;6-16秒,动物踩在干树叶上的脚步声;10-16秒,蟋蟀鸣叫;16-19 秒,猫头鹰鸣叫;17-26秒,溪水流淌。 现在它真能做到每个声音都卡准时间点,请听: 不论是长时间生成还是短时间都轻松拿捏: 1-3秒,狼嚎声;0-8秒,蟋蟀鸣叫声。 各种器物以及人的声响也都能复刻: 0-8秒,柔和的原声吉他拨弦奠定了节奏;8-16秒,男声加入,伴随着吉他的音乐唱歌;16-22秒,人声情绪高涨,而吉他声则保持稳定 的背景;22-26秒,歌曲略微柔和,轻柔的吉他声持续演奏。 以前要实现这种效果非常难,要么时间控不准,要么时长撑不过10秒。 但现在, 来自清华大学、生数科技的新成果FreeAudio 直接把这变 成了现实。 更猛的是,它不用额外训练,靠一套 " 免 训练"方法 就突破了行业瓶颈,可基于自然语言文本与时间提示实现精确的时间控制与长时音频生 成。 实验中,在10秒时间控制的 ...
xAI拟筹120亿美元扩张AI算力:马斯克再押注Grok
Huan Qiu Wang Zi Xun· 2025-07-23 03:14
作为马斯克于2023年创立的AI公司,xAI的核心产品Grok自推出以来便以"实时接入X平台(原推特)数 据"和"叛逆式对话风格"为卖点。然而,其训练规模与性能仍落后于OpenAI的GPT-4o和谷歌的Gemini Ultra。 此次融资被视为马斯克对Grok的"终极押注"。外媒认为,xAI的举动标志着全球AI竞争已从技术迭代转 向资本与算力的"军备竞赛"。微软、谷歌、亚马逊等科技巨头今年已在AI基础设施上投入超500亿美 元,而初创公司若想参与竞争,必须依赖巨额融资或巨头背书。 据知情人士透露,xAI的长期目标不仅是训练更强大的聊天机器人,而是构建一个通用人工智能 (AGI)平台,整合自动驾驶、机器人控制、航天导航等场景。(青山) 知情人士透露,xAI的融资计划已进入后期谈判阶段,预计最快于今年第四季度完成。筹集的120亿美 元中,超80%将直接用于采购英伟达H200或下一代Blackwell架构的AI芯片,以满足Grok模型训练对算 力的指数级需求。 剩余资金将用于建设一座超大型数据中心,该设施将整合数千块英伟达GPU,形成专为Grok优化的算 力集群。与传统数据中心不同,xAI计划采用"租赁模式"向自身 ...
OpenAI或迎应用业务新掌门:前Facebook App负责人Fidji Simo加入
Huan Qiu Wang Zi Xun· 2025-07-23 03:14
来源:环球网 【环球网科技综合报道】7月23日消息,前Facebook核心应用负责人、Instacart前首席执行官菲吉·西莫 (Fidji Simo)近日在社交平台宣布,已正式加入OpenAI公司,并出任全新设立的"应用业务首席执行 官"(CEO of Applications),直接向OpenAI创始人兼CEO山姆·奥尔特曼(Sam Altman)汇报。 2021年,西莫成为生鲜电商Instacart首位外部CEO,带领该公司从疫情期间的配送服务商转型为多元化 广告与数据平台。2023年,成功推动Instacart上市。此外,西莫还是神经免疫疾病研究机构Metrodora Institute的联合创始人,并担任董事会主席。 业内认为,西莫在Facebook期间积累的广告、社交产品经验,将助力OpenAI对抗谷歌、Meta等在AI应 用层的布局。此外,OpenAI近期推出企业版订阅服务,西莫的商业化背景有望加速其渗透金融、医 疗、制造等高价值领域。(青山) 西莫表示:"人工智能是本世纪最具变革性的技术,它不仅能提升人类生活质量,更关乎我们如何共同 塑造未来。"她强调,加入OpenAI是"一次不可错过的机遇" ...
交行浙江省分行成功落地浙江省首笔数据资产质押融资业务
Zhong Guo Jin Rong Xin Xi Wang· 2025-07-23 03:05
在业务落地的过程中,交行浙江省分行与杭州数据交易所、杭州市融资担保集团有限公司及第三方专业 评估机构深度协同,构建了"金融+技术+政策+专业"的四方合作机制,通过开辟绿色审批通道、实施差 异化授信政策,最终实现了从价值评估到资金投放的全流程高效对接。 转自:新华财经 浙江连信科技有限公司作为心理大数据智能应用科技创新企业,其核心优势在于运用海量数据训练出 的"洞见人和"心理应用大模型,实现对人的全面精准刻画,并紧密结合人事地物情等实际场景与业务需 求,为政府、企业和个人提供关键决策支持与实际应用赋能,其模型效用已在市场应用中获得了高度认 可。 近日,交通银行浙江省分行成功落地浙江省人工智能行业首笔数据资产质押融资业务,为专精特新企业 浙江连信科技有限公司提供1000万元授信支持。这一突破标志着该行在数据要素金融化领域实现了"零 的突破"。该行通过携手杭州数据交易所与第三方专业评估机构,共同构建了"数据资产价值评估—质押 融资—风险缓释"的全流程服务体系,有效破解了科技型企业普遍面临的"数据资产价值认定难、质押登 记难、风险管控难"等融资困境,为区域数字经济的高质量发展注入了金融"活水"。 针对连信科技这类典型 ...
中泰国际每日晨讯-20250723
ZHONGTAI INTERNATIONAL SECURITIES· 2025-07-23 02:50
2025 年 7 月 23 日 星期三 每日大市点评 7 月 22 日,港股继续上攻,恒生指数上升 136 点或 0.5%,收报 25,130 点,企稳 25,000 点大关。恒生科指上升 0.4%,收 报 5,606 点。两大指数开始呈现单边向上的态势,上升节奏有序,量价齐升,属典型健康多头走势。大市成交金额达 2,661 亿港元,继续处于活跃水平,港股通净流入 27.2 亿港元。盘面上,港股继续板块轮动行情,顺周期高 BETA 板块表 现较突出,有色金属、材料、工程机械、电力、食品饮料、航运等细分板块接力向上。中国 10 年期国债收益率升至 1.68%,开始有企稳回升迹象,有利于股市表现。国内大宗商品价格也受到"反内卷"及雅鲁藏布江下游水电工程的利好 持续上升,焦炭、焦煤、多晶硅、碳酸锂等期货价格分别大升 5.9%至 9.0%不等,直接刺激相关个股大升。中国神华(1088 HK)、赣锋锂业(1772 HK)、天齐锂业(9696 HK)等分别大升 4.8%至 8.9%。另外,中建铁(1186 HK)、中交建(1800 HK)、中 国中车(1766 HK)等基建或机械相关股分别升 5.2%至 7.6%。 尽管 ...
速递|中国力量占半壁:Meta最新获得谷歌Gemini金牌模型开发三剑客加盟
Z Potentials· 2025-07-23 02:48
图片来源: Unsplash Meta 已从 Google DeepMind 挖来三名人工智能研究员,这是 Meta CEO 马克·扎克伯格为扭转今年早 些时的失利局面,正以空前力度招揽 AI 人才的最新举措。 据知情人士透露,最新加盟的 Tianhe Yu 余天合 , Cosmo Du 杜科摩,和Weiyue Wang 王伟跃、曾参 与开发 Google Gemini 模型的某个版本——这家搜索巨头本周宣称, 该版本解决了今年国际数学奥林 匹克竞赛中的难题,解题水平足以让人类选手获得这项赛事的最高奖项金牌。 过去一个月, Meta 从竞争对手 OpenAI 、 Anthropic 和 xAI 挖来了一批研究人员。包括 Yu 、 Du 和 Wang 在内, Meta 已从 Google DeepMind 挖走至少六名研究人员。 此次招聘正值 Meta 全面改革人工智能战略之际。 Meta 近期聘请 Scale AI 首席执行官 Alexandr Wang 担任首席 AI 官,并同意向这家数据标注公司投资 143 亿美元。 这家社交媒体巨头还聘用了前 GitHub CEO Nat Friedman, 和前 Sa ...
多模态大语言模型(LLM) 和视频语言预训练的关键进展、应用、数据集和方法
3 6 Ke· 2025-07-23 02:45
本系列的第一部分回顾了大规模视频语言预训练的进展、应用、数据集和技术。该任务使用弱字幕和视频进行表征学习。预 训练和微调是深度学习中的一种标准学习范式,用于在大型数据集上对模型进行预训练,然后在较小的数据集上针对特定任 务进行微调。这消除了为不同任务训练新模型的需要,并降低了计算成本。 预训练通常使用自监督学习在 ImageNet 等大型数据集上进行,而无监督学习在自然语言处理 (NLP) 和计算机视觉 (CV) 领域 也表现出色。预训练模型的权重随后会在较小的数据集上进行微调,以实现特定任务的学习目标。 随着视频应用的发展,大量视频被上传到网上。因此,如何利用视频及其对应的弱字幕进行表征学习成为近期的热门话题。 本文将回顾大规模视频语言预训练任务的最新进展、后续应用、基础数据集和技术。 1. 简介 视频语言预训练利用大规模视频文本数据进行自监督/无监督学习,以获得泛化表征。主要的代理任务包括掩码语言模型 (MLM)、掩码帧模型 (MFM)、语言重构 (LR)、视频语言匹配 (VLM)、句子排序模型 (SOM) 和帧排序模型 (FOM)。这些任务 分别侧重于语言预测、帧预测、句子生成、视频语言对齐、句子排序和 ...
官方回应北京燃油车禁入网约车|新鲜早科技
2 1 Shi Ji Jing Ji Bao Dao· 2025-07-23 02:29
21世纪经济报道新质生产力研究院综合报道 早上好,新的一天又开始了。在过去的24小时内,科技行业发生了哪些有意思的事情?来跟21tech一起 看看吧。 【巨头风向标】 北京燃油车彻底禁入网约平台?中国城市公共交通协会网约车分会删文并致歉 据中国城市公共交通协会网约车分会消息,自7月20日起,北京燃油车彻底禁入网约平台。据了解,中 国城市公共交通协会网约车分会现已删除该消息。中国城市公共交通协会网约车分会方面表示:"是我 们编辑在做每日资讯时,从自媒体和司机了解到的信息,但消息的来源和核实存在问题,网页链接已经 下架了。" 目前,中国城市公共交通协会网约车分会就22日发布"北京燃油车彻底禁入网约平台"简讯致 歉。 淘宝闪购:没有上线"1分钱自提"产品,从来没有在内部定过"冲单目标" 针对7月22日网传"淘宝闪购预计8月8日冲1亿单,已上线'1分钱外卖自提'产品"的消息,淘宝闪购回应 新浪科技称:没有上线"1分钱自提"产品,我们从一开始就强调保障商家实收与盈利空间,不会做"0元 购"这类事。同时,淘宝闪购也从来没有在内部定过"冲单目标",我们始终按照市场规律运营。 小红书内测语音评论功能 近日,社交媒体上众多网友 ...
通义千问最新AI编程大模型正式开源;魔法原子发布MagicDog-W轮式四足机器人
Zheng Quan Zhi Xing· 2025-07-23 01:28
【市场复盘】 本周二(7月22日),截至收盘,科创人工智能ETF华夏(589010)收跌0.96%,持仓股方面,优刻得领跌 7.22%,合合信息、奥比中光、亚信安全跌幅超3%;机器人ETF(562500)收跌0.56%,影线下探5日均线 而未至,支撑位力度稳健,下跌或为市场题材轮动导致的正常回调。持仓股方面,中信重工(601608) 逆势录得10%涨停;夏厦精密(001306)、奥比中光、凯尔达、绿的谐波等跌幅超3%。当日交易总额 8.26亿元,较前一日10.79亿元的成交总额有明显缩量,换手5.23%,机器人ETF缩量小跌印证长期趋势 未改,市场稳定持有,情绪不悲观。资金流入方面,机器人ETF最新资金净流入2382万元,拉长时间线 来看,近10个交易日合计"吸金"7.49亿元。 【热点要闻】 1.7月23日,阿里开源了通义千问最新的编程大模型Qwen3-Coder。该模型在代码能力和智能体能力方面 取得重大突破,超越GPT4.1等闭源模型,比肩全球最强的编程模型Claude4。 2.近日,具身智能公司魔法原子继双足人形机器人MagicBot Z1之后,不到半月又发新品,推出轮式四 足机器人MagicDog- ...