Workflow
多模态
icon
Search documents
百度文心大模型4.5系列模型开源,国内首发平台GitCode现已开放下载!
Cai Fu Zai Xian· 2025-06-30 07:40
6月30日,百度文心大模型4.5系列模型正式开源,并在国内领先的开源平台GitCode首发上线,为广大 企业、开发者提供真正可用、好用、可落地的大模型解决方案。 现在,全球开发者、企业、研究机构等均可免费在GitCode平台直接访问并下载体验文心大模型4.5开源 系列,支持部署、微调等各种不同场景的使用需求。 欢迎下载体验,开启你的文心大模型之旅 文心4.5系列模型均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模 型FLOPs利用率(MFU)达到47%。实验结果显示,该系列模型在多个文本和多模态基准测试中达到 SOTA水平,在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果尤为突出。模型权重按照 Apache 2.0协议开源,支持开展学术研究和产业应用。此外,基于飞桨提供开源的产业级开发套件,广 泛兼容多种芯片,降低后训练和部署门槛。 GitCode平台:开源创新的理想土壤 GitCode平台自2023年9月22日上线以来发展迅猛,已汇聚了超过620万的注册用户,月活用户达120万, 已经成为颇具影响力的开源社区,庞大的用户基础和活跃的社区氛围为文心大模型的推广和应用提供了 广 ...
蚂蚁、宁德时代以超30亿元投资哈啰Robotaxi新一轮融资;非夕科技完成C轮亿级美元融资|每周十大股权投资
Sou Hu Cai Jing· 2025-06-30 05:53
投资机遇转瞬即逝,本周值得关注的十大投资交易已被 IT桔子锁定! 屏蔽"互联网噪音",专注重要信息。 编辑|大王管不住嘴 豆包 来源|IT桔子 封面|公众号AI生成 1.非夕科技完成C轮亿级美元融资 非夕科技近日完成C 轮亿级美元融资,由咏归基金、广发信德联合领投,洪泰基金、华控基金等跟投, 老股东持续加码。资金将用于扩产、研发及生态拓展,重点推进自适应机器人在汽车制造、3C 电子等 领域的规模化落地。 6 月 23 日消息,见真机械完成超亿元 A 轮融资,投资方为国泰海通证券、苏创投等。 公司 2016 年成立于长春,是省级专精特新企业。专注航天器部件制造,从事光电仪器制造、卫星部件 装配等业务,凭借先进技术和严格质控体系,在行业内建立良好口碑,2024 年营收过亿元。 公司成立于 2016 年,总部位于上海,由斯坦福大学机器人实验室核心团队创立,首创「自适应机器 人」品类,以「仿人化」力控技术为核心,产品覆盖 7 轴串联机器人 Rizon 拂晓(负载 10kg)、3 轴并 联机器人 Moonlight 玄晖(重复定位精度 ±0.05mm)及穹知 AI 系统。其解决方案已服务广汽、理想、 谷歌等头部企业,2 ...
百度文心大模型4.5系列正式开源,同步开放API服务
量子位· 2025-06-30 04:39
鹭羽 整理自 凹非寺 量子位 | 公众号 QbitAI 百度文心大模型开源,如期而至。 就在今天,百度官宣文心大模型4.5系列正式开源,还同步提供API服务。 此番,百度一次性推出10款开源模型,涵盖从 47B 参数的混合专家 (MoE) 模型到轻量级 0.3B 稠密型模型,覆盖文本、多模态等多种任 务需求。 此次开源不仅权重与代码完全开放,还同步提供 API服务 ,开发者可通过飞桨星河社区、HuggingFace、百度智能云千帆平台直接下载使 用。 △ 文心大模型4.5系列开源模型 值得关注的是,文心大模型4.5开源系列遵照的是 Apache 2.0协议 。 10款模型同步开源 此次百度一次性推出10款文心大模型4.5系列开源模型,在独立自研模型数量占比、模型类型数量、参数丰富度、开源宽松度与可靠性等关键 维度上,都拿出了诚意。 文心大模型4.5开源系列,还针对MoE架构提出了一种创新性的 多模态异构模型结构 。 该结构适用于从大语言模型向多模态模型的持续预训练范式,在保持甚至提升文本任务性能的基础上,显著增强了多模态理解能力,其优越的 性能主要得益于多模态混合专家模型预训练、高效训练推理框架和针对模态的后 ...
股市必读:云从科技(688327)6月27日董秘有最新回复
Sou Hu Cai Jing· 2025-06-29 22:12
董秘最新回复 投资者: 注意到公司通过投资元生智能布局银发养老机器人,推动AI在居家看护场景的落地,已形 成"算法+硬件"的闭环解决方案,是否属实? 董秘: 尊敬的投资者,您好!感谢您对公司的关注和支持。公司确实通过投资"元生智能"切入银发经 济赛道,推动形成"算法+硬件"闭环应用:相关产品基于毫米波雷达、视觉和语音等多模态技术,实现 跌倒检测、隔空生命体征监测、远程报警等功能,聚焦居家养老场景落地。未来,公司将继续通过自身 的人机交互、多模态大模型等方面的技术优势,积极推动元生系列产品"具身智能"化程度不断迭代,以 科技向善推动人工智能更好地造福社会。 投资者: 注意到公从科技多模态AI能,基于"从容"大模型,整合图像、文本等多模态数据输入,在医 疗场景中支持复杂任务处理。药监局发布新规支持AI医疗器械创新,加速智能影像诊断、手术机器人 等场景的审批流程,公司的技术储备是否有望受益?京东云与华银康的合作显示,AI辅助病理诊断已 实现300万例临床应用,验证了"AI预筛+专家复核"模式的可行性,为云从科技提供可参考的商业化路 径。 董秘: 尊敬的投资者,您好!感谢您对公司的关注和支持。公司基于"从容"大模型的 ...
行业周报:积极关注AI视频、虚拟社交商业化及暑期文娱IP消费-20250629
KAIYUAN SECURITIES· 2025-06-29 14:11
Investment Rating - The industry investment rating is "Positive" (maintained) [2] Core Viewpoints - The report emphasizes the potential of AI applications in video understanding and generation, particularly through the launch of Kwai Keye-VL by Kuaishou, which showcases advanced multimodal capabilities [5] - The report suggests continued investment in the gaming sector, particularly with the recent approval of numerous domestic game licenses, indicating a favorable environment for new game launches [6] - The upcoming summer season is expected to boost consumption in various IP sectors, including games, animated films, concerts, and trendy toys, with specific recommendations for companies in these areas [6] Summary by Sections Industry Data Overview - "Delta Action" ranked first in the iOS free chart, while "Honor of Kings" topped the iOS revenue chart as of June 28, 2025 [13][17] - The film "Sauce Garden Case" achieved the highest box office for the week, grossing 1.64 billion [28] Industry News Overview - AI advancements in embodied intelligence and brain-computer interfaces are highlighted, with ongoing releases in gaming and film sectors [35] - The report notes the launch of Gemini, the first model capable of running locally on robots, enhancing task adaptability and efficiency [35] Company Recommendations - For AI video applications, key recommendations include Kuaishou-W, Shanghai Film, and Tencent Holdings, with beneficiaries like Alibaba-W and Kunlun Wanwei [5] - In the gaming sector, companies such as Xindong Company, Giant Network, and Perfect World are recommended, with beneficiaries including Youyi Time and Kingsoft [6] - For animated films, Shanghai Film is highlighted, while beneficiaries include Zhongwen Online [6] - In the concert and performance sector, Fengshang Culture is recommended, with beneficiaries like Alibaba Pictures and Maoyan Entertainment [6] - The trendy toy sector recommends Blukoo and Aofei Entertainment, with beneficiaries including Pop Mart and Quantum Song [6]
中科院自动化所最新综述!VLA模型后训练与类人运动学习的共性
具身智能之心· 2025-06-29 09:51
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Tian-Yu Xiang等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 想象学习走路的情景:尽管祖先的经验让一些与生俱来的能力(例如:平衡感、反应)被编码到我们的 DNA中,但要真正学会走路,仍需要在真实环境中不断练习、摔倒、再爬起。经过一段时间的训练,我们 的大脑和身体会逐渐协调一致,形成与环境交互的策略。这种 由通用能力到特定技能 的转变过程在人类中 十分常见,而如今, 智能机器人 也面临着类似的挑战:即便拥有强大的预训练模型作为"大脑",在执行具 体复杂任务前,仍需要经过类似于人类学习的"后训练"阶段,才能在新环境、新任务下达到理想表现。 1. 概述 这项工作从 人类运动技能学习 的角度系统性地对总结 VLA模型(视觉-语言-动作模型) 的 后训练(post- training)策略 。其主要贡献如下: (1) 从人类运动学习视角讨论了VLA模型后训练方法 :将人类运动技能 ...
当下自动驾驶的技术发展,重建还有哪些应用?
自动驾驶之心· 2025-06-29 08:19
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 4D标注之静态元素 这些天一直在思考一个问题:当下自动驾驶的技术发展,重建还有哪些应用? 起因是身边做SLAM的小伙伴抱怨现在工作都找不到,SLAM的职业发展空间正在逐渐缩小。而且当下自动驾驶所需要的重建也在向前发展,不再是SLAM相关的技术 栈了。。。 回到问题本身,重建当下在4D标注 - 静态元素上的应用还是很广的,当然核心技术不再局限在SLAM上。车道线及静态障碍物标注,还是强依赖在重建图上标注的~2D 空间标注,每个时间戳下都需要再图像上进行标注,模型做语义分割+深度预测,这种方式耗时费力,实时上,只需要重建出3D静态场景,在重建3D场景中静态元素 只需标注一次。 重建的目的主要有两个: 输入:根据lidar或者多个周视摄像头重建得到的3D重建图 输出:矢量车道线及类别,单条车道线用多个有序点表示组成折线,例如一条车道线为(N,3),其中N为车道线点的数量,3为xyz空间坐标值 获取地面重建图2D(BEV+高度)车道线和地面标识; 重建静态点云 3D(静态障碍物)。 在梳理下重建的整体流程,这里面涉及 ...
老黄亲自挖来两名清华天才;字节 Seed 机器人业务招一号位;清华北大浙大中科大校友跳槽去Meta | AI周报
AI前线· 2025-06-29 06:09
整理 | 傅宇琪、褚杏娟 引言:黄仁勋亲自招募清华"天才少年"加入英伟达;OpenAI 员工:GPT-5 将于 7 月上线,疑似完全 多模态;苹果与谷歌 DeepSeek 应用在德国被要求下架,R2 再延期;字节 Seed 多个机器人相关业 务招一号位,成立独立公司;OpenAI 华人 AI 大牛集体跳槽 Meta,清华北大浙大中科大校友各一 位;拒绝 Meta 重金挖角,特斯拉 AI 工程师:"再多的钱也无法让我离开 Elon";马斯克公布脑机接口 重大进展;宇树科技王兴兴:公司目前员工约一千人,年度营收超十亿元;小米回应"前总监冯某传 言":系食堂切菜工,旷工被开除…… 行业热点 黄仁勋亲自招募清华"天才少年"加入英伟达 6 月 28 日,英伟达创始人兼 CEO 黄仁勋近日亲自招募两位华人 AI 大牛加入英伟达。其中,朱邦华 将担任首席研究科学家,加入英伟达的 Star Nemotron 团队,负责应用研究。焦剑涛的具体岗位尚 未透露。 这两位学者本科均毕业于清华大学,朱邦华曾是华盛顿大学电子与计算机工程系助理教授,焦剑涛则 是加州大学伯克利分校电子工程与计算机科学系教授。2023 年,二人联合创办了生成 ...
速递|Meta两周挖走至少7名OpenAI成员,其中4名华人,否认1亿美元签约金,CTO揭开高管薪酬复合结构
Z Potentials· 2025-06-29 05:20
图片来源: Unsplash 最新从 OpenAI 加入 Meta 的赵博士是 OpenAI 多款模型的核心贡献者,包括 o1-mini 和 o3-mini 模 型。后者作为该公司的小型快速推理模型,其性能表现令开发者印象深刻。去年秋季, o1-mini 在数 学能力上甚至超越了 OpenAI 更大的 o1-preview 模型。 根据领英资料显示,赵博士在 2022 年 6 月加入 OpenAI 前,曾是斯坦福大学计算机科学专业的博士 候选人。 根据余嘉辉的领英个人资料显示,他曾领导 OpenAI 的一个感知技术团队,专注于研究人工智能如何 收集和理解周围环境信息。毕书超在领英资料中显示为 OpenAI 多模态后训练负责人。任宏宇同样是 o1-mini 和 o3-mini 项目的核心贡献者。根据赵的公开研究资料显示,他曾在 2018 年与任合作发表过 一篇关于生成式 AI 模型偏见的论文。 过去一周, Meta 从 OpenAI 苏黎世办公室挖走了三名研究人员。这三人专注于多模态 AI 研究,即能 够识别和生成文本、视频及音频的模型。他们于去年底从 Google DeepMind 加入 OpenAI 。研究 ...
充分激发模态协作,MokA量身打造MLLM微调新范式
机器之心· 2025-06-29 02:21
本文第一作者卫雅珂为中国人民大学四年级博士生,主要研究方向为多模态学习机制、多模态大模型等,师从胡迪副教授。作者来自于中国人民大学和上海人工 智能实验室。 近年来,多模态大模型(MLLMs)已经在视觉语言、音频语言等任务上取得了巨大进展。然而 ,当在多模态下游任务进行微调时,当前主流的多模态微调方法大 多直接沿用了在纯文本大语言模型(LLMs)上发展出的微调策略,比如 LoRA。但这种「照搬」 策略,真的适用于多模态模型吗? 多基座、多场景下均实现性能提升 论文标题:MokA: Multimodal Low-Rank Adaptation for MLLMs 论文链接:https://arxiv.org/abs/2506.05191 项目主页:https://gewu-lab.github.io/MokA 来自中国人民大学高瓴人工智能学院 GeWu-Lab 实验室、上海人工智能实验室的研究团队在最新论文中给出了一种全新的思考方式。他们指出:当下 MLLMs 微调 方案大多简单的将单模态策略迁移至多模态场景,未结合多模态学习特性进行深入思考。事实 上,在多模态场景中,单模态信息的独立建模(Unimodal Ad ...