多模态模型

Search documents
师兄自己发了篇自动驾大模型,申博去TOP2了。。。
自动驾驶之心· 2025-07-09 12:56
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 大模型在自动驾驶功能上的落地逐渐清晰化,理想、华为等公司开始推行自己的VLA、VLM方案。那么下一代大 模型需要关注的点有哪些呢? 按照早期自动驾驶技术发展的规律,当数据和方案基本验证有效后,开始重点关注轻量化与硬件适配、知识蒸馏与 量化加速、高效微调大模型等方向! 除此之外目前大火的CoT方案也是后期完成空间感知的重点,VLA+强化学习等高级推理范式也被行业重点关注。 这些问题是学术界和工业界亟需要解决的,相关的论文研究受到审稿人的青睐,国内外越来越多的团队正在从事相 关方向研究。我们了解到不少同学靠着自己的努力,发了篇和自动驾驶相关的大模型工作,申博去了TOP2!前面 收到很多同学的求助,希望能够辅助开展大模型相关的论文指导研究,解决无人带发论文,缺乏指导的痛点。 自动驾驶之心联合业内知名大模型方向学者,开展了1v6的大模型论文指导小班课,解决无人带、易踩坑、不知如 何写稿、投稿的难题。 ⼀、课程介绍⭐ 随着大语言模型(LLM)和多模态模型的快速发展,如何提升模型效率、扩展知识能力以及增强推理性能已成为 ...
扎克伯格人工智能招聘热潮
美股研究社· 2025-07-02 11:39
作 者 | Noah's Arc Capital Management 编译 | 华尔街大事件 今年1月,LLM新秀DeepSeek发布了R1(GPT-4o级别)的课程,其训练成本据称不到600万美 元,这在人工智能领域引起了翻天覆地的变化。这暴露了西方LLM低效,也凸显了DeepSeek 的"开源"优势。 在 DeepSeek 发布后的几个月内,Meta 就斥资 143 亿美元 收购了 Scale AI 49% 的股份,目前 正在组建一支"超级智能"团队。这表明 Meta 正在积极(且认真地)努力追赶 OpenAI 和谷歌 DeepMind。Meta 将这支团队称为" 超级智能实验室 " 。 此后(就在几周前),OpenAI 将其顶级 o3 模型的 API 价格下调了 75%,并推出了"o3 Mini"。与此同时,谷歌将 DeepMind 并入 Research,以加速其 Gemini 2.5 多模态模型的研 发。Anthropic 的 Claude 4 模型 也提高了风险。鉴于这些重大的升级发展,投资者需要明确 Meta 的策略是否能够真正降低"DeepSeek 风险",并恢复甚至提升其 AI 优势。答案 ...
复旦大学陈涛:不止于VLA,新一代生成式人形机器人运动大模型
Xin Lang Cai Jing· 2025-06-30 07:49
通过循序渐进的技术迭代,该模型展现出三大核心突破:实现对海量多样化动作的精确控制,仅凭自然 语言指令即可生成复杂肢体动作。陈涛团队已将其成功部署于实体机器人平台,展现出前所未有的运动 能力。 为解决机器人动作与环境脱节问题,团队创新性地研发出三维点云多模态模型。该技术让机器人真 正"看懂"空间结构,实现具身问答、路径规划等智能交互。面对端侧算力瓶颈,团队研发出独特模型压 缩框架。这项创新实现了算力需求的大幅精简,潜移默化地降低了机器人智能化的技术门槛。 专题:具赋新能 智驱未来——青年科学家成果转化暨具身智能高质量发展研修会 炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 文/新浪财经上海站 陈秀颖 上海智能工业中心近日成为智能科技焦点,"具赋新能 智驱未来"青年科学家成果转化暨具身智能高质 量发展研修会在此举行。 这场盛会汇聚了百余位青年科学家与知名上市公司企业家。复旦大学信息科学与工程学院教授、博士生 导师陈涛发表的《不止于VLA,新一代生成式人形机器人运动大模型》主题演讲,为具身智能发展提 供了全新思路。 陈涛在演讲中指出,当前主流研究基本沿袭视觉语言模型(VLA)范式,其团队 ...
从Photoshop到AI智能体:Adobe(ADBE.US)抢滩AI黄金赛道 筑起“AI+创意软件”护城河
智通财经网· 2025-06-27 06:42
智通财经APP获悉,华尔街金融巨头美国银行近日发布研报称,AI应用软件领域领军者 Adobe(ADBE.US)重磅推出的AI智能体应用(即Agentic AI)仍处于该项前沿技术的最早期阶段,但有望成 为Adobe旗下"AI+创意软件"系列云软件产品相比于同类型AI应用软件竞品的"最关键差异化"因素。 Sills 解释称:"凭借新的Adobe Brand Concierge,企业们可以进一步配置这些 AI智能体,并为终端客户 提供从产品探索到购买决策的AI对话式高效体验。""此外,Adobe还在更广泛地推动与各类企业应用合 作伙伴实现更紧密的集成。例如,与亚马逊AWS、微软Azure、SAP、Workday以及ServiceNow 等战略 伙伴的'AI+创意软件'系列集成,应当能够在客户服务、ERP/HR 和数据管理等领域实现AI应用软件以 及AI智能体渗透。" 美国银行表示,关键差异化因素包括Adobe广泛企业用户、庞大的合法版权数据栈、其应用层次编排与 多模态模型层,以及其独家的创意应用层生态等等。该公司目前与大约22,000家企业客户深度合作,能 够为各种元数据用途构建不同的示意流程。分析师Sills补 ...
[大模型实践] 卡比人贵时代的深度学习经验
自动驾驶之心· 2025-06-20 14:06
以下文章来源于刘聪NLP ,作者黄哲威 hzwer 刘聪NLP . NLP刘聪,如货币般流通!这里的刘聪,不会rapper,只发paper!长期关注AIGC前沿内容!还写过两 本书:ChatGPT原理与实战、大型语言模型实战指南!欢迎来讨论AI! 作者 | hzwer 黄哲威 编辑 | 自动驾驶之心 原文链接: https://zhuanlan.zhihu.com/p/22287171257 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >>点击进入→ 自动驾驶之心 『大模型』技术交流群 本文只做学术分享,如有侵权,联系删文 评测的重要性 论文说自己的方法性能好,一般就是定量部分,要突出关键指标的提升;定性部分,着重强调新的现象和观察 太长不看版:大模型实验的一些新方法论: 选准关键指标 ,指导迭代方向。 识别真瓶颈 ,避免低效实验,验证强假设。 平衡大小实验 ,大实验找问题,小实验筛想法。 强化团队协作 ,整合资源,找比较优势。 (总结好像很套话,但真的努力写干货了,欢迎评论交流启发补充 "不要被表象所迷惑,要洞察事物的本质。" —— 亚里士多德 几年 ...
赤子城科技(09911.HK)全球总部正式落地香港,开启全球化战略新里程
Sou Hu Cai Jing· 2025-06-05 14:30
作为本次启动仪式的核心议题,AI技术成为赤子城科技集团布局香港的关键方向。宋朋亮先生在发言中指出,公司自研的SoloAware AI引擎和多模态 模型Boomiix已显著提升产品商业化效率,未来将在香港加大AI研发投入,重点探索"AI+社交娱乐"场景创新,例如智能内容生成、精准推荐算法等。 深耕全球化十年:从上市到总部落地的战略跃升 赤子城科技集团创立于2009年,2013年开启全球化布局,2019年于港交所主板上市。截至2024年,公司营收已突破50亿港元,旗下MICO、 YOUNOW、花椒等多款产品覆盖全球150多个国家和地区,在中东、东南亚等市场建立20多个运营中心,形成"本土化经营+技术驱动"的双轮优势。 谈及选址香港的战略考量,刘春河先生表示"香港是连接全球的重要枢纽,其国际化营商环境、成熟资本市场和顶尖人才资源,为我们整合全球研发、 加速AI技术落地提供了理想土壤",宋朋亮先生表示"去年下半年,公司在沙特利雅得设立了中东北非区域总部,强化了公司与中东市场的连结,今天 又在香港落地了全球总部,开启全球化新篇章。我们期待与特区政府、产业伙伴、投资机构等各界朋友有更多合作及交流,促未来社会的创新发展, ...
初灵信息(300250) - 初灵信息2024年度网上业绩说明会
2025-05-08 09:24
初灵信息 2024 年度业绩说明会 投资者活动记录表 编号:2025-001 投资者关 系活动类 别 □特定对象调研 □分析师会议 □媒体采访 √业绩说明会 □新闻发布会 □路演活动 □现场参观 □电话会议 □其他: (请文字说明其他活动内容) 参与单位 名称 及人员姓 名 初灵信息2024年度业绩说明会采用网络远程方式进行,面向全体投资 者 时间 2025 年 5 月 8 日 15:00-17:00 地点 深圳证券交易所"互动易平台"http://irm.cninfo.com.cn"云访谈" 栏目 公司接待 人员 姓名 主持人:初灵信息 董事长:洪爱金 董秘:许平 独立董事:方建中 财务总监:徐良栋 投资者关 系活动 1.高管您好,请问您如何看待行业未来的发展前景?谢谢。 答:您好,随着 AI、5G、物联网、大数据等新兴技术的飞速发展,企 业面临的网络环境日益复杂多变。远程办公、云应用的广泛普及以及 海量设备的接入,使得企业对网络的带宽、稳定性和灵活性提出了前 证券代码:300250 证券简称:初灵信息 杭州初灵信息技术股份有限公司 | 主要内容 | 所未有的高要求。产业界正加速向智能化、虚拟化、高效能的新 ...
初灵信息2024年财报:营收下滑29%,净利润亏损5200万元,AI布局能否扭转颓势?
Sou Hu Cai Jing· 2025-05-06 09:32
2025年5月6日,初灵信息发布2024年年报。报告显示,公司2024年营业总收入为2.51亿元,同比下降 29.00%;毛利润为1.19亿元,同比下降36.02%;归属净利润为-0.52亿元,同比下降304.19%;扣非净利 润为-5629.56万元,同比下降520.70%。这是公司连续第二年出现净利润大幅下滑,且亏损幅度进一步 扩大。初灵信息聚焦企业数智化应用市场,致力于建设"云-边-端"协同的企业智算网生态,但其核心业 务表现不佳,AI布局能否成为扭转颓势的关键? 营收与利润双降,业绩压力凸显 2024年,初灵信息的营业总收入为2.51亿元,较2023年的3.54亿元下降了29.00%。从环比数据来看, 2024年营业总收入较2023年减少了16.46%。毛利润为1.19亿元,同比下降36.02%,显示出公司在成本控 制和盈利能力方面面临较大挑战。归属净利润为-0.52亿元,同比下降304.19%,扣非净利润为-5629.56 万元,同比下降520.70%。这一数据表明,公司的主营业务亏损严重,且非经常性损益未能有效弥补亏 损。 回顾过去几年,初灵信息的业绩波动较大。2023年,公司归属净利润为0.26 ...
启明创投周志峰:AI的性能和成本已达到临界点,AI应用将在今年爆发
IPO早知道· 2025-04-29 03:01
2025年会是AI应用全面落地的大年 近两年 人工智能市场最热闹的是 大模型领域, 我们 已投资 了 14 家 大语言模型、多模态模型 、 具身智能 模型或端到端智驾模型的领军企业 ,这个数量在亚洲位居前列。同时我们 协助 管理着规 模达 100亿 元 的 北京市人工智能产业投资基金。 这些 都是 "触点",为 我们 判断 AI行业的发展 脉络 提供了 更多的数据,能够 更好地训练我们的投资 思维模 型 。 任何一轮科技浪潮,都开始于底层基础技术的耕耘。 本文为IPO早知道原创 作者| Stone Jin 过去几年,启明创投 一直把 AI的投资分成三个层次 : 微信公众号|ipozaozhidao 据 IPO早知道消息, 启明创投主管合伙人周志峰 日前 发表了题为 "2025,AI照进现实之旅"的主旨 演讲,分享了对AI投资的见解,和对AI市场演进路径的推演与预判。 以下系演讲精选: 为什么不是去年 或 前年? 原因是 任何 一轮科技 浪潮 ,都开始于底层基础技术的耕耘,其中有两个核心技术指标,一是性 能,从凑合用到真正好用,二是成本,从 "高不可攀"到"轻松消费",当这两个核心指标均达到临界 点时,应用就会 ...