生成式人工智能
Search documents
AI“解说员”盛行,能帮助观展人理解艺术吗
Xin Lang Cai Jing· 2026-02-01 19:21
《墨印铃珍》湖南美术馆藏藏书票作品展里,观展人一边观展,一边听AI解说。 随着生成式人工智能在公众生活中的高频使用,"遇到问题先问AI"逐渐成为不少人的生活习惯。这一使 用场景正从生活决策、情绪困惑,延伸至艺术欣赏与审美理解领域。 "豆包,我这样理解这些藏书票对吗?"2月1日,在《墨印铃珍》湖南美术馆藏藏书票作品展上,这样的 提问并不罕见。观众举起手机,对准一枚方寸之间的藏书票,并不是为了拍照留存,而是将自己的疑惑 直接抛给AI。AI正在成为一些观众进入作品之前的"第一解释者"。 当艺术遇上算法 展厅顶部,一组以《尤利西斯》为主题的藏书票被集中陈列。黑色人物剪影占据画面中央,脸部被路灯 替代,人物被"ULYSSES"的字母符号框定其中。画面冷峻而抽象,几乎不给观者任何"直白"的线索。 "这表达了什么?为什么要这样画?"正在观展的大学生张梓欣边观展边抛出问题,不多时手机里传来回 答:"艺术家通过藏书票这种微型艺术形式,将小说中流动的意识、都柏林的市井图景浓缩进画面。周 旖旎的《Ulysses》以强烈的黑白对比和几何化造型,呈现现代主义文学的先锋精神……" 解释之外,AI还补充肯定了张梓欣的理解方向。"有点被震住 ...
具身智能发展报告(2026年)
中国信通院· 2026-02-01 06:54
No.202515 具身智能发展报告 (2025 年) 中国信息通信研究院 2026年1月 2024年8月 版权声明 本报告版权属于中国信息通信研究院和清华大学电子 工程系,并受法律保护。转载、摘编或利用其它方式使用本 报告文字或者观点的,应注明"来源:中国信息通信研究院 和清华大学电子工程系"。违反上述声明者,编者将追究其 相关法律责任。 前 言 2025 年《政府工作报告》首次将"具身智能"列入国家未来产 业重点培育清单。具身智能作为与物理实体融合的人工智能,正在成 为改变人类生产生活方式、推动社会智能跃升的重要引擎,有望催生 颠覆性终端产品装备,促进生产力和生产关系的深层次变革。 过去一年,具身智能在运动场上实现运动能力突破,在训练场中 学习作业技能,为真实场景应用打下基础。产业整体展现出"融合" "多元""繁荣"的发展特点:一是聚焦实现软硬、知行和虚实融合, 突破智能瓶颈。推进软硬融合创新,加速具身基础模型和本体结构的 软硬协同进化。关注知行合一,打造感知决策行动一体化的闭环链路。 打通虚实贯通路径,推动从仿真模拟到现实实践的迁移和部署。二是 打造"上天入海涉险"多元化产品,加速细分场景拓展。在具身智 ...
282亿,欧洲AI赛道最大的一轮融资诞生了
3 6 Ke· 2026-02-01 03:37
欧洲今年AI赛道最大的融资出现了。 近日,伦敦人工智能公司Synthesia宣布完成2亿美元E轮融资,估值达40亿美元。 与多数追逐通用大模型的初创公司不同,Synthesia专注企业级AI视频生成,帮助全球组织将文本知识高 效转化为多语言培训与沟通视频。 换句话说,Synthesia的核心价值在于帮助企业将已有的文本类知识资产——如操作手册、合规指南或培 训材料——高效转化为视频形式。对于跨国企业而言,传统视频制作流程复杂,涉及脚本、配音、拍摄 与后期,且每增加一种语言往往意味着重复投入。而Synthesia允许用户通过输入文本,在短时间内生成 由数字人主讲的多语言视频,大幅简化内容生产链条。 根据公司官网披露的信息,其客户包括可口可乐、辉瑞、埃森哲、摩根大通、联合利华和西门子等全球 性企业。这些客户主要将平台用于内部场景,如员工入职培训、产品知识传递和合规宣导,而非对外营 销。这种聚焦企业内部沟通的定位,使Synthesia避开了C端AI应用的激烈竞争,转而深耕高门槛、高留 存的市场。 从早期被近百家风投拒绝,到如今成为欧洲AI应用层的标杆,Synthesia的路径印证了一个趋势:在AI狂 热中,真正赢得 ...
光芯片,已成AI算力答案?
半导体行业观察· 2026-01-31 03:49
随着生成式人工智能模型日趋精密复杂,其生成图像和视频的过程消耗的能源也与日俱增,支撑这些 模型运行的电子芯片,正逐渐逼近速度与能效的物理极限。该领域研究人员表示,用光而非电驱动的 半导体芯片 —— 光子芯片,有望解决上述难题。 这类也被称为光电芯片的产品,距离集成应用于消费级电脑仍需数年时间,且完全取代电子芯片的可 能性较低。不过,过去五年间光子芯片的相关研究已取得飞速进展,其中中国在该领域处于全球领先 地位。 澳大利亚悉尼大学物理学家本・埃格尔顿指出:"过去十年,中国在光子芯片领域的基础设施建设、 技术能力培养与专业人才储备上,均进行了战略性投入。" 埃格尔顿在 2025 年 12 月卸任前,曾担 任《应用物理快报・光子学》期刊主编长达十余年。他提到,近年来中国团队发表的光子芯片领域高 质量论文数量显著增长。 《自然》杂志基于数字科学公司旗下的 Dimensions 数据库开展论文分析,结果显示:去年中国研究 人员发表的光子芯片相关论文达 476 篇,数量位居全球首位。2017 年至 2025 年间,中国作者发表 的相关论文数量增长了 9 倍;美国紧随其后,论文数量在同期实现翻倍增长。 美国出台多项政策限制 ...
登上Nature!智源研究院推出AI全能选手——Emu3,一统多模态学习
生物世界· 2026-01-31 03:05
Core Viewpoint - The article discusses the introduction of Emu3, a multimodal large model developed by Beijing Academy of Artificial Intelligence, which aims to unify the learning of text, images, and videos through next-token prediction, potentially transforming the AI landscape [2][3]. Multimodal Learning - Multimodal learning refers to the ability of AI to process various types of information simultaneously, akin to human sensory perception. Achieving a unified algorithm for learning and generating content from multiple modalities has been a long-standing challenge in the AI field [6]. Emu3's Mechanism - Emu3 employs a simple yet effective approach by converting all modal data into discrete tokens and using a Transformer model to predict the next token, which is a key factor in the success of GPT series language models [6][7]. Training Process - The training of Emu3 consists of three stages: 1. Pre-training with large-scale multimodal data, balancing the loss weights of text and visual tokens to prevent dominance of visual tokens [10]. 2. Post-training for quality fine-tuning on generation tasks, incorporating human preference optimization [10]. 3. Inference supporting classifier-free guidance for low-latency and high-throughput generation [11]. Performance Comparison - Emu3 has demonstrated performance that matches or exceeds specialized models across various tasks: - In image generation, it achieved a human preference score of 70.0, surpassing Stable Diffusion v1.5 (59.3) and SDXL (66.9) [13]. - In video generation, it scored 81.0 in VBench evaluation, comparable to mainstream diffusion models [13]. - In visual language understanding, it averaged 62.1 across 12 benchmark tests, rivaling models like LLaVA-1.6 [13]. - In robotic operations, it achieved a success rate of 87.0% in a simulated environment [13]. Significance of the Research - The significance of Emu3 lies not only in its performance improvements but also in its simplification of paradigms. It demonstrates that next-token prediction can serve as a core paradigm for multimodal models, paving the way for the development of more powerful "world models" that integrate perception, language, and action [15][17]. Future Developments - Following Emu3, the research team has introduced Emu3.5, which enhances the model's capabilities through large-scale long-sequence video training, improving its ability to model physical world dynamics and observing trends in multimodal capabilities as the model and data scale increase [15].
SuperX首个全球供应中心正式投产 斩获首批9.1亿美元AI服务器订单
Quan Jing Wang· 2026-01-30 12:39
年产能2万台!SuperX日本工厂正式投产,AI基建龙头按下交付加速键 2026年1月30日,领先的AI数据中心基础设施解决方案提供商SuperX AI Technology Limited(纳斯达克股票代码:SUPX,简称"公司"或"SuperX")公告宣布, 公司位于日本三重县津市的首个全球供应中心正式投产运营,AI服务器年产能达2万台。该中心作为SuperX核心供应枢纽,将为全球算力客户供应高性能AI 服务器,标志着公司从工程筹备阶段正式迈入规模化商业生产的全新发展阶段。SuperX管理层与当地代表共同出席投产镜开仪式,见证这一重要里程碑时 刻。 SuperX管理层与当地代表共同举行镜开仪式,标志日本供应中心正式投产 如此规模的订单并非偶然。SuperX在过去一年中完成的产品布局,恰好击中了市场的痛点。公司推出的模块化AI工厂解决方案,该方案通过将算力、冷却 和电源系统在工厂进行预制化和深度集成,满足大规模快速部署需求。2025年10月,SuperX发布机架级AI超级算力平台SuperX GB300NVL72,在单机架内 实现1.8exaFLOPS的FP4算力;同期推出的XN9160-B300AI服务器 ...
一周医药速览(01.26-01.30)
Cai Jing Wang· 2026-01-30 10:16
Group 1 - Sanofi's net profit is expected to reach 2.9 billion yuan in 2025, with a significant increase primarily due to a payment of approximately 2.89 billion yuan from Pfizer for a licensing agreement [1] - The company's projected revenue for 2025 is around 4.2 billion yuan, reflecting an increase of approximately 3.006 billion yuan, or 251.76% year-on-year [1] - The net profit attributable to shareholders is anticipated to rise by 2.195 billion yuan, marking a growth of 311.35% compared to the previous year [1] Group 2 - Ruiang Gene's actual controllers, Xiong Hui and Xiong Jun, have been arrested on charges of fraud, but this will not significantly impact the company's daily operations [2] - The company maintains a robust corporate governance structure and internal control system, ensuring that business management continues normally [2] Group 3 - Insilico Medicine has entered into a strategic drug development collaboration with Qilu Pharmaceutical, with a total contract value exceeding 931 million Hong Kong dollars [3] - The collaboration will focus on the development of small molecule inhibitors for cardiovascular and metabolic diseases using Insilico's Pharma.AI platform [3] Group 4 - AstraZeneca plans to invest over 100 billion yuan (15 billion USD) in China by 2030 to enhance its drug production and R&D capabilities [4] - The investment aims to leverage China's scientific innovation and advanced manufacturing strengths to deliver cutting-edge therapies to patients [4] Group 5 - Takeda Pharmaceutical has appointed Liu Yan as the new president of Takeda China, responsible for overall strategy and business development [5] - Liu Yan has over 15 years of experience in the pharmaceutical industry and has been instrumental in accelerating global product introductions and exploring innovative business models [5] Group 6 - CSPC Pharmaceutical has signed a strategic cooperation and licensing agreement with AstraZeneca for the development of innovative long-acting peptide drugs, with a total deal value potentially reaching 18.5 billion USD [6][7] - The agreement includes a 1.2 billion USD upfront payment and potential milestone payments of up to 3.5 billion USD for R&D and 13.8 billion USD for sales [7]
京产大模型成果登上国际顶级期刊
Xin Lang Cai Jing· 2026-01-29 20:54
2018年以来,GPT采用"预测下一个词元(Next-token prediction,NTP)"的自回归路线,实现了语言大 模型重大突破,开启了生成式人工智能浪潮。而擅长同时处理文字、图片、视频等多种形态信息的多模 态模型主要依赖对比学习、扩散模型等专门路线。在此背景下,一个重要问题困扰行业数年:能否用一 种简单、统一的方法即自回归路线,让AI(人工智能)同时学会高效地处理文字、图片和视频? 智源这项名为"通过预测下一个词元进行多模态学习的多模态大模型"的成果给出了肯定的答案。该成果 表明,只采用自回归路线,就可以统一多模态学习,训练出优秀的原生多模态大模型,这对于确立自回 归成为生成式人工智能统一路线具有重大意义。 (来源:千龙网) 值得一提的是,基于这一核心路径的迭代版本Emu3.5模型,已展现出对物理世界运行规律的初步学习 与模拟能力,能够尝试预测场景的下一步变化,为发展更通用、更接近人类认知方式的大模型与智能体 奠定了基础。 当地时间1月28日,北京智源人工智能研究院的一项突破性研究成果在国际顶级学术期刊《自然》 (Nature)上线,这是我国科研机构主导的大模型成果首次在《自然》正刊发表。 据悉, ...
智源多模态大模型成果登上Nature杂志
Bei Jing Shang Bao· 2026-01-29 05:02
该研究推出的Emu3模型,核心突破在于仅采用"预测下一个词元"的自回归路线,将文本、图像、视频 统一到同一表示空间,通过单一Transformer架构实现多模态数据的联合训练,无需依赖对比学习、扩散 模型等专用路线。实验显示,其在文生图、视觉语言理解、视频生成等任务上的性能,可与各类成熟的 任务专用模型相媲美,还能拓展至图文交错生成、机器人操作建模等场景。 Nature编辑点评指出,该成果证明了自回归路线在多模态领域的通用性,对构建可扩展、统一的多模态 智能系统具有重要意义。后续迭代的Emu3.5版本进一步实现"预测下一个状态"的能力跃迁,获得了可 泛化的世界建模能力。 据悉,Emu系列模型自2022年启动研发,历经多次迭代,智源团队已开源视觉分词器等关键技术,并通 过大规模实验揭示了多模态自回归模型的训练特性。此次成果不仅确立了自回归作为生成式人工智能统 一路线的重要地位,也为原生多模态助手、具身智能等领域的发展奠定了基础。 北京商报讯(记者 陶凤 王天逸)1月28日,智源研究院主导的多模态大模型研究成果"通过预测下一个 词元进行多模态学习的多模态大模型"正式上线国际顶级学术期刊Nature,预计2月12日 ...
深圳福田经济发展进中提速
Jing Ji Ri Bao· 2026-01-29 02:25
统计显示,2025年,福田区金融业增加值突破2400亿元,新引进持牌金融机构12家、总量首次突破 300家,落地金融机构132家、增长1.5倍,创近6年新高,证券交易额新增量突破35万亿元;概念验证中 心和中小试基地密度均居全市第一,2家企业入选工信部首批重点培育中试平台,首次跻身中国"创新百 强区"十强;广东首家大湾区生成式人工智能安全发展联合实验室落地福田,可调度算力规模居深圳市 各区首位。 黄伟表示,"十五五"时期,福田区将围绕智能化绿色化融合化、完整性先进性安全性和锻造更为强 大的国际竞争力"三化三性一力"要求,建成"2个万亿、8个千亿、4个百亿"产值的产业集群,持续推 进"CBD+科创区"战略转型,使经济总量早日达到万亿元规模。 经济日报深圳1月28日讯(记者杨阳腾)"十四五"期间,深圳市福田区经济发展呈现进中提速、向 新向强的良好态势,经济总量接连跨越5000亿元、6000亿元大关;累计固定资产投资迈上3000亿元台 阶,进出口总额先后突破8000亿元、9000亿元;新增新能源、智能终端、软件信息服务业三大千亿元级 新质产业集群,专精特新"小巨人"企业较"十三五"时期翻五番。 "福田区奋力推动经济 ...