GPT4

Search documents
VLM岗位面试,被摁在地上摩擦。。。
自动驾驶之心· 2025-07-12 12:00
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 1. 自我介绍 自我介绍环节主要是让双方进入快速面试状态,这块没什么特别注意的,别磕巴就好,主要聊聊个人基本信息、教育背景、工作经历和技 能特长等等。 2. 项目面 因为我简历上面写一个RAG项目,所以面试官主要围绕RAG进行提问: 最近面试了理想汽车大模型岗位,被面试官强度拉满了...不仅问到了很多大模型的基础,从通用大模型到大模型微调,再到自动驾驶多模 态大模型全方面被拷打,尤其是对大模型如何落地自动驾驶进行了很长时间的讨论。毕竟理想的VLM是国内首个上车的,这块的经验积累 还是比较丰富。 本文章主要记录了本小菜研找实习的坎坷历程,欢迎大佬们给建议!!! 4. ... 通用大模型是面试的重点,面试官比较关心有没有横向对比近一年开源的SOTA大模型,这些模型在不同任务上有什么优劣势,以及大模型 微调比较细致的思考,这块涉及: 3. 技术问题回答 3.1 简单介绍一下大模型存在哪些问题?有什么好的解决方法? 3.2 如何看待自动驾驶大模型?以及如何落地自动驾驶大模型? 这块聊了很多自动驾驶大模型的工作,像经典 ...
AI纪,且为阅读祈祷
Jing Ji Guan Cha Bao· 2025-06-30 06:20
我们骤然陷身于手足无措的信息福利之中。 各路语言大模型整日回应花样百出的询天问地,它们悠哉游哉,吹气如兰;有问必答,亦真亦幻。一个 依次打开的知识苍穹,顺着人类的指间丝滑展开。地球人身心尚未就位,突然拥有了取之无尽的知识宝 藏,难免茫然无措。事实是,天边并未吹来象征变天的号角,漫长的知识短缺时代已戛然而止,我们毫 无征兆地撞见知识的万道金光。世间万物、人间百科,蓦然如诗人苏轼所言:"耳得之而为声,目遇之 而成色,取之无禁,用之不竭。是造物者之无尽藏也,而吾与子之所共适。" 技术带来的知识平权让普通人拥有了古来帝王都无从实现的能力。你若想象自己坐拥亚历山大图书馆、 随时调遣1000名知识仆佣充当助理,我只能说这份梦想太初级,只是一种龟步想象力。在今天,任何一 名依靠秘书和下属汇报来掌握信息的人,都已位居信息链的下游。能直接致电正主,谁还需要中介或灵 媒?你的好奇若足够宽广,当下就能探索一切,在你和知识之间,已无阻隔。诚然,你的判断力依然重 要,你的精气神也必须足够。 一 显然,诗意并不像我们自诩的那样,专属于"万物之灵长"的人类。你诗故你在,诗意自发栖息于任何触 发它的媒介之上,无分硅碳。 二 朋友推给我一个视 ...
大模型强化学习,相比PPO,DPO 还是个弟弟?
自动驾驶之心· 2025-06-22 14:09
作者 | hzwer 黄哲威 编辑 | 自动驾驶之心 原文链接: https://zhuanlan.zhihu.com/p/696732944 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >>点击进入→ 自动驾驶之心 『LLM』技术交流群 本文只做学术分享,如有侵权,联系删文 论文地址:https://arxiv.org/pdf/2404.10719v2 这是一篇四月份的新论文,一作单位是清华 这篇主要有三个部分,1. 从理论和实验上看,DPO 可能有本质缺陷 2. 研究了 PPO 提升的几个重要因素 3. 实验证实 PPO 可以在硬核任务上(编程比赛)碾压 DPO 达到新的 SoTA 论文先指出了一个令业界困惑的现状,即大部分的开源的榜单上,DPO 占据了领先的位置,但是众所周 知,最好的闭源模型 GPT4 和 Claude,用的都是 PPO 方案。所以这里就自然引出两个问题,即 1. DPO 相 对 PPO 真的有优势吗?2. 如何让 PPO 也很能刷榜呢? DPO 的缺陷 在调教 PPO 的时候,一种常见的现象是语言模型发现了奖励模型的缺陷,而构 ...
学习端到端大模型,还不太明白VLM和VLA的区别。。。
自动驾驶之心· 2025-06-19 11:54
以下是知识星球里面一位同学的提问: 请问VLA和VLM的区别是什么?现在推荐学哪个呢? 这两者互为表里: 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 大模型已经席卷各个领域,在智能驾驶领域,VLM也正在逐渐铺开落地量产。 不少入门的小伙伴也表示,现在大模型太重要了,想要入门学习,但有点拿不准方向。 1、VLM可以理解基础的能力,可以是通用的检测、问答、空间理解、思维链等等能力 2、VLA更侧重Action的能力,最终目的是为了做动作,在自动驾驶中可以理解为自车轨迹预测的能力,通时预 测的轨迹又要尽可能的符合人类的理解,这又进一步依赖vision和language的基本能力,比如我要解释这个行 为,可以使用思维链的形式一步步推理分析,这里面依赖自动驾驶基础的感知(行人在哪里,2D坐标,3D位置 等等) 这两者没办法完全独立的学习,我认为的方式应该是先学VLM,再去扩展到VLA VLM接扩散模型就可以预测轨迹,也就是Action,这块就涉及到多模轨迹的好处了,面对不确定的环境,单模 的能力有限,多模的上限是更高的 最后欢迎大家加入知识星球,硬核资料在星球置 ...
Scintille | Francesco Pappone | TEDxLago di Fogliano
TEDx Talks· 2025-06-12 15:06
L'intelligenza artificiale sarà la tecnologia del nostro secolo e con questo non penso di sorprendere nessuno, però forse vi sorprenderà che in realtà noi di intelligenza artificiale parliamo da millenni. Il primo esempio è Thalos. Talos era il gigante di bronzo che proteggeva l'isola di Creta e ci sono altri esempi nella storia.il Great Instrumento Freezon pensato da Libnitz fino ad arrivare a qualcosa che probabilmente conoscete molto bene che è Skynet nel 1984 Terminator. Insomma, nella nostra psicologia ...
六大AI模型出战高考作文,人工智能ETF(159819)、科创人工智能ETF(588730)助力布局AI全产业链
Mei Ri Jing Ji Xin Wen· 2025-06-09 03:20
科创人工智能ETF 跟踪上证科创板人工智能指数 截至9:36,中证人工智能主题指数上涨0.3%,上证科创板人工智能指数上涨0.2%。 2025年高考进行时,DeepSeek、百度文心一言、阿里通义千问、字节跳动豆包、月之暗面Kimi、GPT4o这六个AI大语言模型充当"考生",试写全国一卷 高考作文题。在有关人士的评分下,六大AI的评分均不低于50分(满分60分),展现了大模型在语言理解与创作上的强劲实力。 中信证券表示,近期科技板块的位置已自底部抬升,整体仍处于高性价比区间,海外不确定性仍在降温,风险偏好修复带动海外市场尤其是科技板块大 涨并重回年内高位,也将对A股科技成长板块形成映射。可以以AI产业链为抓手,关注上游算力自主可控与中下游应用创新。 人工智能ETF(159819)、科创人工智能ETF(588730)均覆盖AI全产业链,为投资者布局产业发展机遇提供了便捷工具,其中人工智能ETF (159819)最新规模超160亿元,居同类产品第一。 (责任编辑:张晓波 ) 【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示 ...
从AI上下半场切换看产业后续投资机会
Changjiang Securities· 2025-06-05 02:49
从AI上下半场切换看产业后续投资机会 长江证券研究所计算机研究小组 2025-06-05 %% %% %% %% research.95579.com 1 分析师 宗建树 联系人 宋浪 SAC执业证书编号:S0490520030004 SFC执业证书编号:BUX668 分析师及联系人 证券研究报告 • 证券研究报告 • 评级 看好 维持 %% %% %% %% research.95579.com 2 01 AI本质是生产力革命,模型进步驱动每一轮产业周期 AI是典型的周期性成长行业,历史上共经历三次"浪潮"起伏: 人工智能三要素 1950 1980 2000 未来 萌芽时期 探索时期 高速发展时期 2016 AlphaGO战胜 人类顶级国棋 2012 选手李世石 深度学习算法 在语音、图像 识刚上取得重 大突破 2006 Hinton提出深 度学习算法模 型 1986 Hinton等提出 反向传播算法 90年代 日本的第五代 计算机失败 1982 Hopfied神经 网格模型提出 1957 心理学家罗森布拉特 发明感知机的模型 1956 达特茅斯会议提出人 工智能概念 信息系统早 期专家系统 专家系统广泛应 ...
OCDE指标对IA能力的陈述
OECD· 2025-06-03 04:10
Présentation des indicateurs de l'OCDE sur les capacités de l'IA Présentation des indicateurs de l'OCDE sur les capacités de l'IA Ce document, ainsi que les données et cartes qu'il peut comprendre, sont sans préjudice du statut de tout territoire, de la souveraineté s'exerçant sur ce dernier, du tracé des frontières et limites internationales, et du nom de tout territoire, ville ou région. Les données statistiques concernant Israël sont fournies par et sous la responsabilité des autorités israéliennes compé ...
2025年中国多模态大模型行业市场规模、产业链、竞争格局分析及行业发趋势研判:将更加多元和深入,应用前景越来越广阔[图]
Chan Ye Xin Xi Wang· 2025-05-29 01:47
内容概要:多模态大模型指能够同时处理和理解多种模态数的大规模人工智能模型。作为近年来人工智 能领域的一项突破性技术,以其卓越的数据处理能力和丰富的应用场景吸引了众多关注。在强劲的市场 需求以及国家政策的支持下,我国大模型市场规模不断增长。2024年中国多模态大模型市场规模为 156.3亿元,较2023年增加65.4亿元;预计2025年中国多模态大模型市场规模为234.8亿元。多模态大模 型在数字人领域的应用份额最大;其次是游戏与广告商拍领域;第三是智能营销、社交媒体领域。多模 态大模型作为新一代人工智能技术范式,正逐步成为推动相关产业创新和发展的重要力量。随着技术的 不断进步,未来,多模态大模型行业发展将呈现出更加多元和深入的趋势,多模态大模型将更加智能、 更加人性化,应用前景将越来越广阔。 多模态大模型行业发展至今,共经历了任务导向阶段、觉一语言预训练阶段,以及多模态大模型阶段。 其中,在多模态研究的初期.模型设计主要集中在解决具体的应用问题上;视觉-语言预训练阶段是强 调跨模态理解与生成能力的同步提升;多模态大模型已经实现一种更为灵活的交互方式。 三、多模态大模型行业发展现状 上市企业:阿里巴巴(0998 ...
AI能读懂陀思妥耶夫斯基吗?
Jing Ji Guan Cha Wang· 2025-05-27 11:33
诗云、无限猴子与AI 未来,太阳系偶然出现在了一个极度发达的文明的视野中。文明的主人自诩为"神",毁灭地球对它易如反掌,人 类却用一首《登鹳雀楼》博取了它的注目。"神"在这小巧的字符矩阵中窥见了丰富的感觉层次和含义分支,它们 勃发于诗律和音韵的约束间。"神"萌生了无法遏制的野心,要穷尽一切可能,拥有还未被写出的全部律诗(其中 杰作,李杜也难望其项背)。 它用强大的量子设备,算尽汉字排列组合的可能,耗尽太阳系的能源、物质,制成巨大的存储设备,那是一片直 径为一百个天文单位的旋涡状星云,其间的每个量子都镌刻着随机"诗行"。可当"神"望向浩瀚诗云,却陷入了沮 丧——没有任何生命能穷尽诗云,悉数发现、阅读其中蕴藏的杰作…… 上述故事来自刘慈欣的《诗云》,它与著名的"无限猴子定理"异曲同工:设想,如果令无穷多的猴子,在无限长 的时间内不断随意敲击打字机,会敲出什么?答案是,无限可能,甚至是《哈姆雷特》。表面看,诗云和"无限猴 子"展现了无限性的伟力,它令猴子比肩文豪,随机字符串胜过李杜文章,人类望尘莫及。可一旦稍加条件约束, 如限定猴子的数量和敲击时长(即便限定数字看来趋近于无穷),或要求诗云中的杰作必须被阅读,无限就 ...