VL

Search documents
AI文艺复兴:一场由大脚怪引发的内容革命
Tai Mei Ti A P P· 2025-07-13 00:47
文 | 策看世界 "文艺复兴"这个词在1855年为法国历史学家儒勒·米什莱首次提出,用以概括16世纪时"对世界与人类的探索" —— 维基百科 这当中引爆UGC创造力的是大脚怪自拍系列,也不知道是谁起的头,在爆款力量的加持下,几天内各种口音、毛发、颜色、宠物的大脚怪层出不穷。我个 人关注了一位有独特"人设"、爱搞笑的大脚怪,他还有个名字"Speedilla"。 大脚怪经济学 大脚怪Speedilla的故事从德国开始,他的创造者马哈茂德是一位来自叙利亚的移民,在工作之余,他会构思一些喜剧作品,他发现用AI生成的大脚怪vlog既 可以作为艺术表达,也可能成为谋生手段。 "Speedilla,他是我内心的一部分",马哈茂德在解释这个角色时说道。"我试图建立某种黑暗,讽刺的喜剧。" 在Speedilla的虚拟世界里,搞笑是视频内容的 表象,而对现实的讽刺则是其内核。大脚怪和美女搭讪被拒绝,随后把她做成了烤肉,这样一条20秒的内容有几十万人为其点赞——这是一群与马哈茂德共 情的群体对当下主流文化的禁忌比了个中指。 算法的新宠儿 2025年5月20日,谷歌在其年度开发者大会上发布了最新的视频生成模型Veo 3,几周内在Ti ...
VLM岗位面试,被摁在地上摩擦。。。
自动驾驶之心· 2025-07-12 12:00
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 1. 自我介绍 自我介绍环节主要是让双方进入快速面试状态,这块没什么特别注意的,别磕巴就好,主要聊聊个人基本信息、教育背景、工作经历和技 能特长等等。 2. 项目面 因为我简历上面写一个RAG项目,所以面试官主要围绕RAG进行提问: 最近面试了理想汽车大模型岗位,被面试官强度拉满了...不仅问到了很多大模型的基础,从通用大模型到大模型微调,再到自动驾驶多模 态大模型全方面被拷打,尤其是对大模型如何落地自动驾驶进行了很长时间的讨论。毕竟理想的VLM是国内首个上车的,这块的经验积累 还是比较丰富。 本文章主要记录了本小菜研找实习的坎坷历程,欢迎大佬们给建议!!! 4. ... 通用大模型是面试的重点,面试官比较关心有没有横向对比近一年开源的SOTA大模型,这些模型在不同任务上有什么优劣势,以及大模型 微调比较细致的思考,这块涉及: 3. 技术问题回答 3.1 简单介绍一下大模型存在哪些问题?有什么好的解决方法? 3.2 如何看待自动驾驶大模型?以及如何落地自动驾驶大模型? 这块聊了很多自动驾驶大模型的工作,像经典 ...
资料汇总 | VLM-世界模型-端到端
自动驾驶之心· 2025-07-12 12:00
作者 | qian 编辑 | 自动驾驶之心 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 视觉大语言模型 综述汇总 基础理论 原文链接: https://zhuanlan.zhihu.com/p/1922228114404143784 预训练 智能交通和自动驾驶中的 LLM:https://github.com/ge25nab/Awesome-VLM-AD-ITS AIGC 和 LLM:https://github.com/coderonion/awesome-llm-and-aigc 视觉语言模型综述:https://github.com/jingyi0000/VLM_survey 用于 CLIP 等视觉语言模型的出色提示 / 适配器学习方法:https://github.com/zhengli97/Awesome-Prompt- Adapter-Learning-for-VLMs LLM/VLM 推理论文列表,并附有代码:https://github.com/D ...
中国AI六小虎「智谱」,传同时准备A股、香港上市,A股IPO的概率可能高些
Sou Hu Cai Jing· 2025-07-12 07:26
智谱是数家试图在全球与OpenAI竞争的中国初创公司之一,据此前提交中国证监会的备案文件,公司 最初准备在内地上市。 智谱,致力于打造新一代认知智能大模型,专注于做大模型的中国创新。公司合作研发了中英双语千亿 级超大规模预训练模型GLM-130B,并基于此推出对话模型ChatGLM,开源单卡版模型ChatGLM-6B。 同时,团队还打造了AIGC模型及产品矩阵,包括AI提效助手智谱清言(chatglm.cn)、高效率代码模型 CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。公司践行Model as a Service(MaaS)的市 场理念,推出大模型MaaS开放平台(https://open.bigmodel.cn/),打造高效率、通用化的"模型即服务"AI 开发新范式。通过认知大模型链接物理世界的亿级用户,智谱基于完整的模型生态和全流程技术支持, 为千行百业带来持续创新与变革,加速迈向通用人工智能的时代。 来源:瑞恩资本RyanbenCapital 中国「AI六小虎」之一的北京智谱华章科技股份有限公司(简称"智谱")据报考虑将其IPO计划的地点由 内地改为香港,料将为香港新股热潮 ...
阿里通义千问,重大更新!三大亮点
证券时报· 2025-07-12 03:56
Core Viewpoint - Alibaba's Tongyi Qianwen team has made significant updates to its AI chat product Qwen Chat, enhancing user interaction and adding multiple practical features, aiming to improve product usability and integration within the AI platform [1][4]. Group 1: Product Updates - Users can now start conversations directly from the Tongyi Qianwen homepage, reducing usage costs and enhancing accessibility [3]. - Qwen Chat integrates multiple functionalities, including "in-depth research," "image generation," "web development," "deep thinking," and "search," allowing users to generate high-quality images from text descriptions and assist front-end engineers in coding [3]. - A new desktop client has been introduced, enabling cross-application calls and automated task execution, which enhances work efficiency by bridging different AI models and external tools [3]. Group 2: Competitive Positioning - The Qwen model family has been continuously updated, with the latest Qwen3 model outperforming top global models in various benchmark tests, showcasing its competitive edge [4]. - Alibaba is addressing the "product strength" gap of its large models by enhancing usability and user perception, indicating a strategic intent to build a unified AI platform that is user-friendly and feature-rich [4]. Group 3: Market Presence and Financial Performance - Tongyi Qianwen is recognized as the largest open-source model globally, with Alibaba Cloud holding a 23% market share in China's AI infrastructure (AIIaaS) market, surpassing the combined share of its closest competitors [5]. - The "cloud + AI" strategy has become a new growth engine for Alibaba, with the cloud intelligence group achieving a revenue of 1180.28 billion yuan in the 2025 fiscal year, marking an 11% year-on-year increase [5]. - AI-related product revenues have seen triple-digit growth for seven consecutive quarters, indicating strong demand and market penetration in traditional vertical industries [5]. Group 4: Investment and Future Plans - Alibaba plans to invest 380 billion yuan in AI infrastructure over the next three years, exceeding its total technology investment over the past decade [6]. - The company has announced the issuance of zero-coupon exchangeable bonds to fund cloud computing infrastructure and support international expansion [6].
模拟大脑功能分化!北大与港中文发布Fast-in-Slow VLA,让“快行动”和“慢推理”统一协作
机器之心· 2025-07-12 02:11
作者简介:由来自北 京大学、香港中文大学、北京智源研究院、智平方的老师同学联合研究,作者包括博 士生陈浩、刘家铭、顾晨阳、刘卓洋,通讯作者为北京大学仉尚航。北京大学 HMI 实验室长期致力于具身 智能和多模态学习领域的研究,欢迎关注。 快执行与慢思考: 在机器人操控领域,实现高频响应与复杂推理的统一,一直是一个重大技术挑战。近期,北京大学与香港 中文大学的研究团队联合发布了名为 Fast-in-Slow(FiS-VLA) 的全新双系统视觉 - 语言 - 动作模型。不同 之前的快慢系统 VLA 方法需要初始化 / 引入一个全新的快速执行模块,该方法通过将快速执行模块嵌入预 训练视觉 - 语言模型(VLM)中,实现快慢系统一体化的设计。同时,针对双系统设计了异构模态输入与 异步运行频率的策略,使得 FiS-VLA 既能实现快速动作生成,也具备慢思考能力。该方法在多个仿真与真 机平台上取得了优异表现。最令人瞩目的是,FiS-VLA-7B 可以实现高达 117.7Hz 的控制频率,大幅领先于 现有主流方案,展示了其广阔的实际应用潜力。 论文链接: https://arxiv.org/pdf/2506.01953 项目 ...
民船订单量价齐升 中国重工、中国船舶预计中报净利润大幅增长
Zheng Quan Ri Bao Zhi Sheng· 2025-07-11 16:41
本报记者 梁傲男 据记者了解,7月4日,本次合并重组交易获上交所并购重组审核委员会审核通过,7月8日完成向中国证 监会提交重组方案注册稿。目前,本次合并重组交易尚待中国证监会签发注册批文,并由上交所完成发 行上市安排后,才可正式实施。 中国重工是国内产业链最完整的船舶及海洋装备制造企业之一,也是国内海军舰船装备的主要研制和供 应商。公司主要业务涵盖海洋防务及海洋开发装备、海洋运输装备、深海装备及舰船修理改装、舰船配 套及机电装备、战略性新兴产业及其他等五大业务板块。 中国船舶是全球唯一一家同时在建大型LNG船、大型邮轮的上市公司,在造船国际市场份额持续领 先,公司在手集装箱船、油轮、超大型乙烷运输船(VLEC)、汽车运输船(PCTC)、多用途船、自 卸船等细分船型订单数量均居全球前列。 长江证券研报显示,两家企业合并将助力中国造船业进入高质量发展阶段。重组完成后,中国船舶将成 为全球最大造船上市公司,根据中国船舶、中国重工2024年年报数据,合并后公司手持订单量占全球总 量约15%,造船完工量全球占比超过14%,新签订单量全球占比超过16%。中国船舶合并中国重工后将 减少同业竞争,优化船舶制造板块产业布局,并 ...
AI基建还能投多久?高盛:2-3年不是问题,回报窗口才刚开启
Hua Er Jie Jian Wen· 2025-07-11 11:29
Core Viewpoint - The AI investment cycle is transitioning from "investment" to "returns," but this does not imply a slowdown is a peak. Goldman Sachs indicates that despite a deceleration in growth, AI infrastructure investment will remain sustainable over the next 2-3 years, with cost benefits already being realized and stock prices not yet reflecting this structural change [1][2]. Group 1: AI Investment and Returns - Goldman Sachs categorizes AI value creation into three phases: cost reduction through automation (current phase), reinvestment and rebuilding, and revenue generation through incremental income [2][3]. - AI applications in customer service, sales, and IT are already yielding tangible benefits, with 43% of call centers adopting AI tools and achieving an average operational cost reduction of 30% [2][3]. Group 2: Cost Savings and Future Projections - By 2030, AI automation could save Fortune 500 companies approximately $935 billion, representing about 14% of their total costs, with a net present value return of around $780 billion against a cumulative investment of $350 billion [3][4]. - Major cloud service providers are the primary investors in AI infrastructure, focusing on long-term revenue growth opportunities rather than short-term cost savings, complicating ROI calculations [3][4]. Group 3: Infrastructure Spending and Demand - Concerns about whether infrastructure spending has peaked, particularly regarding training chip inventory and demand, are considered overstated by Goldman Sachs [4][5]. - Large tech companies like Microsoft, Amazon, Google, and Meta are expected to maintain their AI infrastructure investments without significantly compressing profit margins over the next 2-3 years [5][6]. Group 4: New Demand Drivers - Demand for "inference" computing from enterprise clients and government (sovereign AI) is emerging as a new spending driver, especially as small and medium enterprises rapidly expand their deployment of customized models or edge AI applications [6][7]. Group 5: Market Valuation and Stock Performance - The market has partially priced in strong demand expectations for Nvidia's next-generation GPUs, but there is still insufficient valuation for its expanding customer base and the potential explosion of AI inference business [8]. - Broadcom's stock price increase is attributed to clear guidance indicating AI revenue growth of 60% in FY25 and FY26, suggesting that the stock price rise reflects a clearer mid-term fundamental improvement path [8].
当我们谈大模型和vla岗位的时候,究竟有哪些内容?(附岗位)
自动驾驶之心· 2025-07-11 11:23
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 这样描述我想大家应该都能理解了,对应岗位的技术基本围绕大模型、diffusion还有数据生成等,是一个值 得投入的研发方向。自动驾驶之心也为大家推荐一些岗位,希望有一定经验的大佬投递。详细公司与级别 欢迎底部咨询我们!!!! 1)大模型研发工程师 base:深圳/上海; 待遇:30k-80k/月 岗位描述: 岗位要求: 最近有小朋友去投大模型和vla相关的岗位,来咨询峰哥。询问两者有什么差异,vla和端到端有什么区别? 这里也和大家做个分享。 首先,所有依赖大模型的方案,都可以叫大模型岗位,包括VLM、VLA这类。自驾领域经常采用qwen这类 大模型做微调,适配自驾场景的理解或者预测。关键技术:微调、轻量化、量化、部署等; 其次VLA的概念还有执行(action,vision+language+action=VLA),VLA可以是属于"端到端"这一概念! 从数据源到执行。业内目前有两种VLA方案,两阶段:基于大模型+Diffusion(比如理想,信息提取+轨迹 输出),单阶段完全基于大模型的方案比如OpenD ...
Buy, Sell Or Hold Astera Labs Stock?
Forbes· 2025-07-11 10:05
Photo illustration by Cheng Xin/Getty ImagesGetty ImagesAstera Labs (NASDAQ:ALAB), a firm specializing in semiconductor-based connectivity solutions for cloud and AI infrastructure, experienced a stock increase of nearly 8% on Wednesday. Although there wasn’t significant stock-specific news to justify such a substantial change, there are several compelling reasons for investors to show growing interest in the stock. Despite a solid recent financial performance, ALAB stock is down approximately 25% year-to-d ...