多模态

Search documents
中国AIGC企业投融资风向:早期项目受资本热捧
Sou Hu Cai Jing· 2025-06-14 09:35
Core Insights - The AIGC industry in China is experiencing a significant early-stage investment trend, with total financing reaching billions of RMB in the first months of 2025, marking a 60% year-on-year increase [1] - Angel round financing events account for the highest proportion at 60%, indicating a preference for early-stage investments [3] Group 1: Current Situation - Early-stage projects have become the core area for capital allocation, with 60% of financing events occurring in the angel round, significantly higher than A rounds and strategic investments [3] - Startups established in 2025 account for 60% of the AIGC companies, with notable examples like "月之暗面" and "生数科技" completing significant financing within a year of establishment [4] Group 2: Driving Factors Behind Capital Preferences - Accelerated technological iteration is driving capital to focus on application-layer tools, allowing for quick validation of business models [6] - Policy support and market demand are also pushing the AIGC market, which is expected to exceed trillions by 2025, despite being only billions in 2025 [7] Group 3: Industry Participation - Major industry players like Tencent and Baidu are deeply involved in the ecosystem through strategic investments, with Tencent investing billions in 2025 [9] Group 4: Challenges and Pressures - Investors are increasingly demanding early-stage projects to demonstrate monetization pathways, with examples like "妙鸭相机" showcasing rapid customer acquisition through low-cost services [11] - There are signs of industry bubbles, with global AIGC financing exceeding hundreds of billions, but domestic projects facing challenges due to high levels of homogeneity [12] Group 5: Future Trends - Investment focus is shifting towards the middle layer of the industry, such as AI training tools and data annotation platforms, which are expected to enable scalable applications [15] - Global expansion is accelerating, with leading companies like "月之暗面" initiating overseas user growth plans, attracting capital interest in cross-language models and localization capabilities [15]
“多模态方法无法实现AGI”
AI前线· 2025-06-14 04:06
作者 | Benjamin 译者 | 王强 策划 | 褚杏娟 "将语言投射回思想模型时,我们忽视了支撑我们智能的不言而喻的具身认知。" 首先,虽然奥赛罗的移动可被证明用于推断奥赛罗棋盘的完整状态, 但我们没有理由相信有办法通 过语言描述推断出物理世界的完整画面 。将奥赛罗游戏与物理世界的许多任务区分开来的是, 奥赛 罗本质上位于符号领域,只是使用物理标记来实现,以便于人类玩耍 。一个完整的奥赛罗游戏可以 用纸和笔进行,但人们不能用纸和笔扫地、洗碗或开车。要解决这些任务,你需要超越人类用语言描 述的物理世界概念。这种描述世界的概念是否编码进了正式的世界模型中,或者例如编码进了一个价 值函数,还有待讨论, 但很明显,物理世界中有许多问题不能完全由符号系统表示并用纯粹的符号 操作解决 。 最近生成式人工智能模型的成功让一些人相信人工通用智能(AGI)即将到来。虽然这些模型似乎捕 捉到了人类智能的本质,但它们甚至违背了我们对智能最基本的直觉。它们之所以出现,并非因为它 们是解决智能问题的深思熟虑的解决方案,而是因为它们在我们已有的硬件上有效地扩展了规模。一 些人沉浸在规模扩展的成果中,开始相信这提供了通往 AGI 的 ...
Cell:庄小威团队首次实现在哺乳动物完整组织中进行成像+测序的多模态遗传筛查
生物世界· 2025-06-14 01:47
多细胞生物的生命活动需要成千上万的基因在空间上有序的各种细胞类型中协调运作。要理解组织功能的基础,就需要剖析体内各种细胞和组织表型的遗传控制 机制。然而,一直是个重大挑战,传统方法要么只能测量基因表达情况 (单细胞策略) ,要么只能观察细胞形态 (显微成像) ,始终无法同时捕捉多个维度的 信息。 2025 年 6 月 12 日, 哈佛大学 庄小威 教授团队在国际顶尖学术期刊 Cell 上发表了题为: Perturb-Multimodal: A platform for pooled genetic screens with imaging and sequencing in intact mammalian tissue 的研究论文。 撰文丨王聪 编辑丨王多鱼 排版丨水成文 该研究开发了一种名 为 Perturb-Multi 的新技术,将成像技术与测序技术结合,首次实现在哺乳动物整个组织中对数百个基因并行扰动,同步完成基因表达谱、 亚细胞形态和空间位置的三维解析。 通过成像技术,能够识别单个细胞中的扰动情况,同时测量其基因表达谱和亚细胞形态。利用单细胞测序技术,测量了对相同干扰的完整转录组反应。 研究团队应用 ...
模型上新、降价,火山引擎急推AI应用落地
2 1 Shi Ji Jing Ji Bao Dao· 2025-06-14 00:55
谁来做Agent大规模落地的核心推手? 火山引擎说,我想。 区间定价 "如果说2024年是中国大模型应用的元年,那2025年将很可能是中国Agent落地的元年。" 在火山引擎总裁谭待看来,以PC、移动、AI三个时代来划分,技术主体在发生变化,从PC时代的web,移动时代的APP,到AI时代,则是Agent。 Agent正逐步进入企业的各个业务流程。怎么让Agent星星之火可燎原,打通其规模化落地的堵点,火山引擎的一把火,烧向"区间定价"。 "Agent的Token消耗量是很大的。"会后接受《21CBR》等媒体采访时,谭待谈到,让Agent执行一项任务,可能需要20万tokens。因此,怎么把模型使用成本 降下来,非常关键。 新发布的豆包大模型1.6,首创按"输入长度"区间定价的模式,深度思考、多模态能力与基础语言模型,统一价格。 谭待表示,对同结构、同参数的模型而言,真正影响成本的,是上下文长度,而不是是否开启了思考和多模态功能。目前模型大部分的调用,输入范围都在 32K以内。 基于这一观察,团队意识到,如果在推理调度上,通过分桶调度做好优化,就能够让占大头比例的模型请求,享受到更低成本、更快速度。 在企业使 ...
刚刚,CVPR 2025奖项出炉:牛津&Meta博士生王建元获最佳论文,谢赛宁摘年轻研究者奖
机器之心· 2025-06-13 15:45
机器之心报道 机器之心编辑部 刚刚,在美国田纳西州纳什维尔举办的 CVPR 2025 公布了最佳论文等奖项。 今年共有 14 篇论文入围最佳论文评选,最终 5 篇论文摘得奖项 ,包括 1 篇最佳论文 、 4 篇最佳论文荣誉提名 。此外,大会还颁发了 1 篇最佳学生论文 、 1 篇最 佳学生论文荣誉提名 。 根据会方统计,今年大会共收到 4 万多名作者提交的 13008 份论文。相比去年(11532),今年的投稿数量增长了 13%,最终有 2872 篇论文被接收,整体接收率 约为 22.1%。在接收论文中,Oral 的数量是 96(3.3%),Highlights 的数量是 387(13.7%)。 计算机视觉技术的火热给大会审稿带来了空前的压力。本届投稿作者数量、论文评审者和领域主席(AC)数量均创下新高。 今年前来现场参会的学者也超过 9000 人,他们来自 70 余个国家和地区。 CVPR 官方公布了各个细分领域的论文接收情况,如下图所示。可以看到,图像与视频生成领域今年度的论文接收数量最多,而接收率最高的领域则是基于多视角 和传感器的 3D 以及基于单图像的 3D。 此次,最佳论文奖委员会成员中有 AI ...
“AI掉队者联盟”谋求改命
创业邦· 2025-06-13 03:30
以下文章来源于巨潮WAVE ,作者小卢鱼 现在的AI应用就像韩国偶像团体一样新人辈出——脸还没被认熟就推出了新的版本,然后就是噼里啪 啦一顿造势,结果总是会有作品、实力配不上流量的感觉。 来源丨巨潮商业评论(ID: tide-biz ) 作者丨 小卢鱼 编辑丨 杨旭然 图源丨Midjourney 而那些十年前出道的AI前辈们,则是大部分都面临着技术路线风险、转型困难、金主不再力捧的问 题,落下了一个或者几个梯队。 这两类企业可以有一个共同的名字:AI掉队者联盟。 以曾经行业头部企业商汤为例,2021年赴港上市的时候,贵为全球估值最高的AI独角兽企业,但从 2022年开始股价就一直深度下跌。目前,其市值与最高点相比已蒸发3000亿港元以上。 其创始团队的退场更是令人唏嘘,科研实力过硬、被称为人脸识别技术开拓者的汤晓鸥先生在2023 年猝然离世,联合创始人徐冰也在今年端午节前官宣辞去执行董事及董事会秘书的职务,获任AI芯片 业务负责人。 商汤在公告中强调,此次职务调整是公司整体人才部署与业务聚焦的一部分,某种程度上也可以理解 为,AI 1.0时代的核心技术并不能用于引领2.0时代。 巨潮WAVE . 融入时代巨潮 ...
京东今年向应届生提供1.8万余个岗位
Bei Jing Ri Bao Ke Hu Duan· 2025-06-13 01:11
转自:北京日报客户端 记者近日从京东获悉,今年该公司将面向2025届毕业生提供1.8万余个岗位。数据显示,截至4月30日, 京东体系员工总数已超过72万人,其中快递小哥、运输司机、分拣员工等一线员工总数超过50万人。 "非常惊喜!能在实习后通过转正述职,提前锁定正式校招offer(入职通知)。"去年正式入职京东的晓 韦说,公司为大学生人才设置了快速成长通道,他在入职后的短短一年间连获两次晋升,成长为一名能 够独当一面的采销人员。 京东集团雇主品牌负责人石玉介绍,公司在连续三年累计面向在校生提供5万多个岗位的基础上,今年 面向2025届毕业生再提供1.8万余个岗位,核心岗位薪资提升20%。同时,今年5月,京东启动了面向全 球技术人才招聘的"顶尖青年技术天才计划",在新兴领域持续提供更多优质岗位,涵盖多模态大模型与 应用、机器学习、搜索推荐广告、空间与具身智能、高性能与云计算、大数据等前沿领域。 新技术催生新职业,公司近年来增添了许多新岗位,例如"大模型+"广告智能投放岗、"AI+"医疗服务 岗、家用机器人研发岗、无人机飞行师等等。 "有了'五险一金',心里踏实也更有奔头。"今年3月成为京东外卖全职骑手的杨晶泽说 ...
中信证券:火山引擎正赋能多品类硬件产品AI落地 重点关注字节生态链公司
Zhi Tong Cai Jing· 2025-06-13 00:47
Core Viewpoint - ByteDance's Volcano Engine is empowering a variety of hardware products with AI capabilities, with a clear trend towards multimodal visual understanding applications [1][2] Group 1: AI Hardware Development - The Force2025 conference showcased a range of AI-enabled hardware products, including AI clocks, learning machines, toys, and various smart devices, indicating the extension of large models into multiple product categories [2] - As of June 11, over 1 million AIoT products have been shipped that integrate the Doubao model, with expectations to exceed 10 million by the end of the year [2] Group 2: Multimodal Applications - The focus on multimodal applications is evident, with examples such as security cameras functioning as personal assistants and lamps equipped with cameras serving as learning aids [3] Group 3: Industry Participation - Various companies in the supply chain, including Broadcom Integration and Starry Technology, participated in the conference, highlighting their contributions to optimizing AI experiences and multimodal applications [4] - The upcoming release of Xiaomi's AI glasses is anticipated to boost market sentiment, with the product expected to be unveiled on June 26 [5]
借助生成式人工智能构建知识生产新体系
Xin Hua Ri Bao· 2025-06-13 00:14
Core Insights - The rapid development of generative artificial intelligence (AI) is transforming knowledge production processes, necessitating a focus on ethical considerations to ensure its safe and reliable advancement [1][6]. Group 1: Evolution of Generative AI - Generative AI has evolved from theoretical foundations established between the 1950s and 1980s, focusing on probabilistic models, to practical applications with significant breakthroughs such as Generative Adversarial Networks (GAN) in 2014 and the emergence of large language models like GPT in 2018 [2]. - The commercial application of generative AI was marked by the launch of ChatGPT in late 2022, indicating a shift towards widespread use and the establishment of global standards in 2023-2024 [2]. Group 2: Role in Knowledge Production - Generative AI enhances knowledge production efficiency by rapidly processing vast amounts of data, enabling the generation of comprehensive literature reviews and high-quality educational content, thus supporting academic research and public science communication [3]. - The technology promotes knowledge innovation by integrating diverse fields of knowledge, allowing for new insights and creative designs that transcend traditional disciplinary boundaries [4]. Group 3: Ethical Considerations - The use of generative AI raises complex issues regarding intellectual property rights, as the ownership of generated content and the use of training data can lead to copyright disputes [5]. - Privacy concerns arise from the reliance on large datasets that may contain personal information, and the potential for generating low-quality or misleading information poses risks, particularly in sensitive fields like healthcare and finance [5].
海天瑞声20250612
2025-06-12 15:07
海天瑞声 20250612 摘要 Meta 收购 Scale AI 体现了数据标注行业潜力,Scale AI 预计 2025 年 收入达 20 亿美元,远超预期,但可能导致其他大厂因数据敏感性撤出 业务,为海天瑞声等公司带来机会。 数据标注产业估值模式多样,包括收入、利润、ARR 和订单等。Meta 高价收购未盈利但高增长的 Scale AI,反映市场对该领域未来发展的高 度认可。 Scale AI 的价值在于其高效的数据处理能力,标注精度高达 99.7%,远 高于市场平均水平,且年均复合增长率接近 100%,主要收入来自美国 军方和政府部门。 海天瑞声通过生产和销售标准化或定制化数据集实现收入,而 Scale AI 主要销售平台,满足大机构对敏感数据的私域管理需求,客单价高且粘 性强。 海天瑞声积极布局多模态数据标注,优化数据处理流程,加强与政府部 门合作,为未来可能的大型订单做好准备,以保持竞争优势。 Q&A Meta 以 280 亿美元的估值收购数据标注独角兽 Scale AI,对整个数据标注 行业可能会产生什么样的影响? Meta 以 280 亿美元的估值收购 Scale AI,这一事件在市场上引起了 ...