Workflow
多模态
icon
Search documents
【公告全知道】数字货币+区块链+国产芯片+跨境支付+多模态AI!公司截至去年末累计为近1.5万家单商户开通数字人民币服务
财联社· 2025-06-24 14:06
Group 1 - The article highlights the importance of weekly announcements from Sunday to Thursday, which include significant stock market updates such as suspensions, increases or decreases in holdings, investment wins, acquisitions, earnings reports, unlocks, and high transfers, marked in red for easy identification [1] - A company has provided digital RMB services to nearly 15,000 single merchants as of the end of last year, focusing on digital currency, blockchain, domestic chips, cross-border payments, multimodal AI, cloud computing, and Huawei's HarmonyOS [1] - Another company is involved in solid-state batteries, lithium batteries, and drones, with existing orders for solid-state battery and key material businesses [1] - A robotics subsidiary of a company is engaged in humanoid robots, autonomous driving, and chips, with products applicable in service robots and humanoid robot sectors [1]
多模态AI黑马刷榜后再造神器:一个产品搞定图片视频播客生成,自带百种特效,大牛梅涛团队出品
量子位· 2025-06-24 13:36
西风 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI A I大牛梅涛坐镇,全新多模态AI问世! 用 法上堪称: 全能 。 不仅 支持 图 片、视频 生成 : 奇幻场景、多样视角都能驾驭: 而且 唇形同步 功能上线,社 恐大"i"人也能玩转 播客 : 划重点: 官方还提供了 上百种可直接套用的趣味特效模版 ,让 用户实现"躺 平创 作"。 人物、 动物、建筑物的"变身"模版通通都有 : 像下面这种炫酷转换, 操作 简单到只需上传一张图: 另外,生图板块的Image Agent也是官方主打,修图生图只需大白话表述,不会写prompt不是问题,它会自动帮你优化 修改。 不卖关子,这个最新创作工具就是 vivago2.0 (智小象AI) 。 打造出它的团队 智象 未 来 (HiDr eam.a i) ,是圈内鼎鼎有名的大牛——加拿大工程院外籍院士梅涛创立的AI公司,研发团队中挤满了 来自中科大的中坚。 前段时间,团队推出的 开源模型HiDream-I1 曾在文生图模型竞技场一鸣惊人, 开源24小时就拿下了排行榜榜首 ,在国内一众开源大模型 中率先跻身第一梯队。 | CREATOR | NAME | ARENA ...
穆尧团队最新!RoboTwin 2.0:用于鲁棒双臂操作的可扩展数据基准
自动驾驶之心· 2025-06-24 12:41
以下文章来源于具身智能之心 ,作者Tianxing Chen等 具身智能之心 . 与世界交互,更进一步 点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Tianxing Chen等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 天行和muyao大佬团队出品的2.0工作,看看有哪些创新点和惊喜吧~ Webpage: https://robotwin-platform.github.io/ arXiv:https://arxiv.org/abs/2506.18088 Code: https://github.com/RoboTwin-Platform/RoboTwin Document: https://robotwin-platform.github.io/doc/ Title:RoboTwin 2.0: A Scalable Data Generator and Benchmark with Strong Domain Rando ...
多模态内容生成的机会,为什么属于中国公司?
Founder Park· 2025-06-24 11:53
2025 年多模态技术快速发展,中国创业团队在内容生成领域正在形成领先优势。 与美国在大语言模型领域的领先不同,中国企业在视频生成、3D 创作等多模态细分领域已跻身全球第一梯队。像 Pixverse 的视频生成产品用户规模 超过许多美国知名产品,VAST 在 3D 技术上实现核心突破,Feeling AI 则探索出多模态融合的创新路径。这些成绩背后,是中国创业团队在场景理 解、数据积累和工程落地方面的综合优势。 AGI Playground 2025,在靖亚资本主办、Founder Park 联合主办的 2025 AI Cloud 100 China 榜单发布会上,晚点 LatePost 科技负责人、《晚点聊》 主播程曼祺主持了一场圆桌对话,与 Pix V erse 爱诗科技联合创始人 谢旭璋、VAST 创始人 & CEO 宋亚宸 以及 Feeling AI 创始人 & 首席科学家 戴勃 ,深入探讨了「 多模态内容生成,为什么是属于中国公司的机会? 」。 三位行业嘉宾深入分析了中国创业团队的优势所在。谢旭璋提到,国内团队在视频技术领域有多年积累,抖音、快手等产品背后的视觉技术为视频 生成奠定了基础,而组织架构 ...
5日“吸金”超2300万元,计算机ETF(159998)涨超2%,机构:新一轮金融科技创新机遇已打开帷幕
消息面上,据智通财经,国家数据局举办"数据要素×"系列第二场新闻发布会。中国人民银行科技司副 司长周祥昆介绍了中国人民银行在《"数据要素×"三年行动计划(2024-2026年)》发布以来所取得的成 效以及未来规划。中国人民银行下一步将研究制定新阶段金融科技发展规划,出台深化运用金融科技推 动金融数字化智能化转型的政策文件,会同国家数据局开展"数据要素×"试点,引导金融机构在安全合 规前提下,发挥金融海量数据和多元应用场景优势,增强数据基础能力和底座支撑,激活做好金融"五 篇大文章"的数据引擎。 民生证券指出,AI agent引领的软件大革命正处于从0到1的拐点,AI应用无疑是贯穿未来的最核心主 线,与此同时新一轮金融科技创新机遇打开帷幕,国产算力与卫星互联网均进入规模落地元年,我们建 议关注"AI+"主线的龙头企业。 华创证券表示,随着大模型在多模态领域能力不断提升,今年下半年,有望迎来多模态应用生态全面繁 荣。此外,计算机板块正式进入业绩披露期,市场主要矛盾将由科技主题行情转移到业绩兑现及产业快 速变革的双主线上。 (本文机构观点来自持牌证券机构,不构成任何投资建议,亦不代表平台观点,请投资人独立判断和决 ...
史上最高种子轮花落AI:20亿美元断档领先,苹果Meta抢着都投不进,扎克伯格转头挖联创也遭拒
量子位· 2025-06-24 05:49
Core Viewpoint - The article discusses the recent $2 billion seed funding round for Thinking Machines, led by OpenAI's former CTO, which sets a record in the AI sector and highlights the competitive landscape of talent acquisition and investment in AI companies [1][16]. Funding and Investment - Thinking Machines raised $2 billion in seed funding, surpassing previous records where the largest seed rounds ranged from $200 million to $450 million [12][16]. - The funding round was led by Andreessen Horowitz, with participation from Accel and Conviction Partners, bringing the company's valuation to $10 billion [16]. Competitive Landscape - Prior to the funding, both Apple and Meta attempted to invest in or acquire Thinking Machines but were unsuccessful [3][4]. - Meta's CEO, Mark Zuckerberg, shifted focus to recruiting AI talent after failing to acquire Thinking Machines, likening the recruitment process to an NBA transfer [5][11]. Team Composition - Approximately two-thirds of Thinking Machines' team members are former OpenAI employees, including key figures like John Schulman, who is now the co-founder and CTO of Thinking Machines [7][8]. - The company has also brought on board two prominent advisors from OpenAI, Alec Radford and Bob McGrew [7]. Company Vision and Strategy - Thinking Machines aims to develop highly customizable, multimodal AI systems that enhance human expertise rather than replace it, contrasting with the trend of fully autonomous AI agents [19]. - The company positions itself as an advocate for open science, intending to foster collaboration within the research community through frequent publication of technical papers and open-source initiatives [19]. Future Plans - The company plans to develop customized AI models based on enterprise business KPIs and intends to launch consumer-facing products [20].
甬江实验室苏瑞涛:微流控器件3D打印将逐渐取代软光刻
DT新材料· 2025-06-23 14:33
甬江实验室 特聘研究员 苏瑞涛 将出席 2025(第四届)高分子3D打印材料高峰论坛 (7月18-20 日 | 浙江 · 杭州),并分享 "功能材料与器件的 3D 打印" 。 高精度3D打印技术(如双光子聚合、电流体动力喷印和计算轴向光刻)可制造特征尺寸低至 100纳 米 的复杂结构。 近年来,关于 3D打印微流控器件 的研究和进展越来越来。许多研究人员采用了3D打印技术作为制 造微流控芯片的技术手段,3D打印技术为微流控芯片制备的标准化和批量生产提供了广阔的前景。 由于3D打印具有快速反馈和3D几何图形的自由成型的能力,这为微流控芯片的生产提供了很好的支 撑,并带来微流控芯片的类型和尺寸等方面的创新。除此之外,在3D打印机精密控制、新材料开发 和高分辨率打印等方面改进可以制作更小更复杂的3D打印微流控系统,从而带来微流控芯片制造方 法的变革。 微流控芯片制造技术从半导体微纳制造技术衍生而来。微流控芯片具有 功耗低、自动化程度高、分 析速度快、样本量小、批量制造、多通道分析一体化 等优点,该技术可以大大提高实验效率,减少 材料消耗,节省时间和金钱成本。 近年,甬江实验室的 苏瑞涛研究员 在其综述中详细地介绍了 ...
2025年AI在多个方面持续取得显著进展和突破
Sou Hu Cai Jing· 2025-06-23 07:19
Group 1 - In 2025, multimodal AI is a key trend, capable of processing and integrating various forms of input such as text, images, audio, and video, exemplified by OpenAI's GPT-4 and Google's Gemini model [1] - AI agents are evolving from simple chatbots to more intelligent assistants with contextual awareness, transforming customer service and user interaction across platforms [3] - The rapid development and adoption of small language models (SLMs) in 2025 offer significant advantages over large language models (LLMs), including lower development costs and improved user experience [3] Group 2 - AI for Science (AI4S) is becoming a crucial force in transforming scientific research paradigms, with multimodal large models aiding in the analysis of complex multidimensional data [4] - The rapid advancement of AI brings new risks related to security, governance, copyright, and ethics, prompting global efforts to strengthen AI governance through policy and technical standards [4] - 2025 is anticipated to be the "year of embodied intelligence," with significant developments in the industry and technology, including the potential mass production of humanoid robots like Tesla's Optimus [4]
掌阅科技CEO孙凯:将不断推进短剧领域AI+多模态应用发展
Sou Hu Cai Jing· 2025-06-23 05:21
据孙凯介绍,掌阅在内容开发中坚持数据驱动原则,选题阶段基于平台内部数据及全网反馈,精准识别《遮天》良好的用户基础与传播潜力,为改编决策提 供了有力支撑。在开发过程中,掌阅注重文学与影视的双向协同,通过影视表达放大文学内容覆盖力,反哺阅读行为。同时,公司联合版权方、出品方与制 作方多方协作,聚焦故事本身,构建了开放合作生态。 掌阅科技CEO孙凯 《遮天》短剧总编剧苗小雨提到,《遮天》短剧在结构上回避常规"爽点堆砌",而是通过AI特效场景、镜头语言与角色动线的精细打磨,强化剧集整体质感 与视听节奏,"重现大家十几年前看这本书的感动之处"。 据介绍,《遮天》短剧在真人短剧AI技术与实拍画面深度融合方面首开先河。 央广网北京6月23日消息(记者 齐智颖)"短剧业务在今年一季度已跃升为第一大业务板块。"在仙侠题材短剧《遮天》首映暨主创见面会后,掌阅科技CEO 孙凯接受央广财经记者专访时透露,掌阅科技将持续依托内容资源优势和技术能力,持续推进AI+IP在短剧业务领域深耕细作、强化创新,不断推进短剧领 域AI+多模态的应用和发展。 据悉,《遮天》短剧由掌阅科技、陕西文投影业、西安志和影视、成都星阅辰石、河北广电广告出品,6 ...
只训练数学,却在物理化学生物战胜o1!新强化学习算法带来显著性能提升,还缓解训练崩溃问题
量子位· 2025-06-23 04:45
刘宗凯 投稿 量子位 | 公众号 QbitAI 具体的,相较基础模型QwenVL2.5-7B,基于CPGD和15k多模态数学数据MMK12训练的模型MM-Eureka-CPGD-7B在MMK12测试集 (包 括数学,以及训练数据分布外领域的物理、化学、生物) 上平均提升21.8%,在MathVista和MathVision等训练数据分布外领域上也分别提 升8.5%与11.4%,展现了优异的泛化能力。 模型规模扩展到MM-Eureka-CPGD-32B上则进一步在MMK12测试集上超越了o1,值得注意的是,尽管MM-Eureka-CPGD-32B只在数学数 据集上进行RL训练, 但在物理、化学和生物等学科均超过了o1 。 △ 不同模型在MMK12测试集中不同学科上的表现 今年2月,他们推出MM-Eureka系列是最早在多模态领域利用大规模Rule-based RL复现DeepSeek-R1关键能力(例如Visual aha- moment、稳定的回答长度增长)的工作之一,并将模型、代码、高质量多模态数据集MMK12、过程奖励模型MM-PRM全部开源,发布三个 月以来获得了学术界和开源社区广泛关注——模型已被下载 ...