Workflow
V6
icon
Search documents
自驾搞科研别蛮干!用对套路弯道超车~
自动驾驶之心· 2025-07-11 01:14
读研想少走弯路、快速出成果?靠自己瞎摸索费时间费精力还没结果,找个厉害的榜样"抄作业",才是最 直接的办法。 导师介绍 毕业于知名计算机名校。曾在多家公司担任算法研究员,并进行计算机视觉,高效模型压缩算法,多模态 大语言模型的研究,包括模型量化,剪枝,蒸馏,编译以及高效稀疏化训练与推理。 博士期间研究方向聚焦为计算机视觉,高效的深度学习训练和推理方法,大语言模型轻量化与高效微调技 术。 这套路看着"功利",但真能让你在科研路上跑快点,别人还在绕小道,你已经上了高速。 厉害的榜样通常 来说,就是那些论文专利一大堆的导师学长学姐,但苦于和这些榜样搭不上话, 现在如何让入场甩开同 行,别人摸路你超车? 自动驾驶之心联合业内知名LLM/MLLM方向学者推出了1v6指导小班课。从模型理论到代码实践, 业内大 牛手把手带走科研全流程,帮助大家形成自己的知识体系, 掌握LLM/MLLM论文的算法设计及创新思路。 扫码免费咨询 【科研成果】 在国际顶级会议CVPR,ICCV, EMNLP等发表十余篇论文, 并担任CVPR,ICCV,ECCV,ICML,ICLR, NeurIPS 等重要会议和期刊的审稿人。多项发明专利,已经指 ...
ASIC芯片近况交流
2025-07-11 01:13
ASIC 芯片近况交流 20250709 摘要 谷歌 2025 年预计芯片总出货量接近 200 万颗,其中 TPU V5 系列 (V5E 和 V5P)占 140 万颗,TPU V6 系列(V6E 和 V6P)预计出货 50-60 万颗,V6E 预计出货 40 万颗左右,V6P 预计出货 10~20 万颗。 谷歌的推理任务占比约 70%,训练任务占比约 30%,导致训练芯片(P 系列)需求量少于推理芯片(E 系列),训练芯片与推理芯片数量比大 约为 2:1。 博通的收费模式包括流片费用、IP 版税等前期研发费用,以及量产后的 芯片价格和售后技术支持费用。百万级别出货时毛利率接近 60%,远高 于传统设计服务企业,因其参与程度深且设计复杂度高。 谷歌是博通目前最大的客户,占博通营收接近 80%。TPU V5E 平均价 格在 3,000~3,500 美元之间,V5P 价格较高,大约在 6,000 美元左右。 TPU 使用 PCB 板层数较多,通常达到 30 层甚至更高,并采用 HDI 多层 载板,以及中板和接口卡。TPU 数据带宽要求高,通常使用 800G 光模 块,而英伟达 GPU 常用 400G 光模块。 Op ...
Navitas Strengthens GaN and SiC Footprint With Major Alliances
ZACKS· 2025-07-08 14:01
Key Takeaways NVTS and BrightLoop will pair SiC tech with fuel-cell systems for heavy-duty transport applications. NVTS joined NVIDIA to boost power efficiency in AI data centers with GaNFast and GeneSiC technologies. NVTS partnered with GigaDevice and Great Wall Power to develop smart, high-density power solutions.Navitas Semiconductor (NVTS) is actively forging strategic collaborations and partnerships across the power electronics ecosystem, accelerating the adoption of its gallium nitride (GaN) and sil ...
大模型这个坑,还有哪些可以发论文的点?
具身智能之心· 2025-07-05 02:25
随着大语言模型(LLM)和多模态模型的快速发展,如何提升模型效率、扩展知识能力以及增强推理性能已成 为当前人工智能研究的核心议题。我们联合业界知名大模型专家,为大家退出了大模型1v6论文辅导小班课! ⼀、有关大模型核心的几个点⭐ 本课程系统性地探讨大模型的前沿优化方法,重点研究参数高效计算、知识动态扩展和复杂推理三大方向的关键 技术。我们将深入分析大模型优化中的核心挑战:在参数压缩方面,研究剪枝稀疏化和量化加速等轻量化方法; 在知识扩展方面,探索检索增强生成(RAG)和参数高效微调(PEFT)等动态知识注入技术;在推理优化方 面,研究链式思维(CoT)和强化学习优化(GRPO)等高级推理范式。同时,课程还将探讨多智能体协作和多 模态理解等前沿方向。 通过本课程的学习,你将掌握大模型优化的核心算法,包括但不限于:结构化剪枝、低比特量化、动态检索、角 色化智能体、多跳推理等关键技术。课程采用理论讲解与实验实践相结合的方式,使用主流大模型(如 LLaMA、GPT等)作为实验平台,重点培养学生在模型优化和推理增强方面的研究能力。 关键词:大模型优化;参数高效计算;检索增强生成;链式推理;多智能体协作;多模态理解 ⼆、 ...
大模型“上海队”进入丰产阶段(神州看点) 生成的“猫跳水”视频一周获三亿播放量
Ren Min Ri Bao· 2025-07-03 00:10
Core Insights - MiniMax, a Shanghai-based AI company, has launched the world's first open-source large-scale hybrid architecture inference model, MiniMax-M1, which ranks second globally among open-source models [1] - The company has also released video generation model Hailuo 02, which achieved 300 million views within a week of its release on social media [1][6] - MiniMax distinguishes itself by not following mainstream dense architectures and traditional attention mechanisms, focusing instead on AGI since before the rise of ChatGPT [1][8] Performance and Cost Efficiency - The competition in large models is shifting from mere parameter scale to efficiency, cost, and overall implementation capabilities [2] - M1 supports an impressive context input of 1 million tokens, comparable to Google's latest closed-source model Gemini 2.5 Pro, while its reinforcement learning phase cost only $535,000 [2] - Hailuo 02 directly competes with Google's third-generation video generation model Veo3, showcasing superior performance in generating coherent and logical video sequences [3] Innovation in AI Video Generation - Hailuo 02 has pioneered a new category of AI video called "Animal Olympics" [4] - The development of Hailuo 02 involved collaboration with a diverse team of directors, screenwriters, and artists to ensure high-quality output [5] - High-quality data, innovative algorithms, and meticulous training processes are cited as key factors in the success of Hailuo 02 [6] Strategic Positioning - MiniMax remains one of the few startups still committed to foundational model research amidst a trend of major companies reducing their efforts in this area [7] - The company is exploring "sparse activation" MoE architecture to reduce computational costs, diverging from the prevalent dense architecture approach [8] - MiniMax aims to stay competitive in the long-term race of large model development, collaborating with other major players in Shanghai's AI ecosystem [9]
汽车行业研究周报:小米YU7正式上市,订单充盈-20250702
Shengang Securities· 2025-07-02 10:57
行 业 研 究 小米 YU7 正式上市 订单充盈 ——汽车行业研究周报 投资摘要: 每周一谈:小米 YU7 正式上市 订单充盈 近期,小米公司正式发布了小米 YU7 汽车。据财联社消息,小米 YU7 上市后订 单火爆,3 分钟订单破 20 万台,1 小时达 28.9 万台,18 小时锁单量达 24 万台, 是产品力、定价策略、品牌势能及生态协同共同作用的结果。 小米 YU7 一共有三款配置,分别是小米 YU7 标准版,售价 25.35 万元,续航 835 km;小米 YU7 Pro 版,售价 27.99 万元,续航 770 km;小米 YU7 Max 版,售价 32.99 万元,续航 760 km。小米 SU7 Ultra 选配赛道专业套装,售价 62.99 万元,还有小米 SU7 Ultra 纽北限量版,售价 81.49 万元。 小米 YU7 的性能和续航实力也非常优秀,它全系搭载小米超级电机 V6s Plus, 最高转速提升到 22000rpm,峰值扭矩提升到 528N·m,峰值功率提升到 288kW。最大马力达 690PS;零百加速时间 3.23 秒,最高时速 253km/h。 小米 YU7 全系采用 ...
研报 | 受国际形势变化影响,2025年AI服务器出货年增幅度略减
TrendForce集邦· 2025-07-02 06:03
Google(谷歌) 今年受惠主权云项目以及东南亚新数据中心落成,显著提升Server需求。此外, Google本是自研芯片布局比例较高的业者,其针对AI推理用的TPU v6e已于上半年逐步放量成为主 流。 AWS(亚马逊云科技) 的自研芯片目前以Trainium v2为主力平台,据TrendForce集邦咨询了解, AWS已启动不同版本的Trainium v3开发,预计于2026年陆续量产。受惠于Trainium平台扩充与AI运 算自研策略加速,预估2025年AWS自研ASIC出货量将达双倍成长,为美系CSP最强。 和前四大CSP相比, Oracle(甲骨文) 更着重采购AI Server与IMDB( In-Memory Database ) Server。该公司今年将更积极布局AI Server基础设施,除整合自家核心业务云端数据库及AI应用外, 针对美国等主权云项目,其对NVIDIA GB Rack NVL72需求也明显提升。 此外,近期因国际形势变化,多数Server Enterprise OEM重新检视2025年下半年市场规划, 目前 TrendForce集邦咨询预估全年整体Server( 含通用型 ...
这种大芯片,大有可为
半导体行业观察· 2025-07-02 01:50
公众号记得加星标⭐️,第一时间看推送不会错过。 人工智能(AI)模型呈指数级增长,目前已达到万亿参数,这揭示了传统单芯片图形处理单元 (GPU)架构在可扩展性、能源效率和计算吞吐量方面的显著局限性。晶圆级计算已成为一种 变 革 性 的 范 式 , 它 将 多 个 小 芯 片 集 成 到 一 块 单 片 晶 圆 上 , 以 提 供 前 所 未 有 的 性 能 和 效 率 。 Cerebras晶圆级引擎(WSE-3)拥有4万亿晶体管和90万个核心,特斯拉的Dojo每个训练芯片拥 有1.25万亿晶体管和8,850个核心,这些平台都体现了晶圆级AI加速器满足大规模AI工作负载需 求的潜力。 本综述对晶圆级AI加速器和单芯片GPU进行了全面的比较分析,重点关注它们在高性能AI应用中的 相 对 性 能 、 能 源 效 率 和 成 本 效 益 。 同 时 , 也 探 讨 了 台 积 电 ( TSMC ) 的 晶 圆 上 芯 片 封 装 技 术 (CoWoS)等新兴技术,该技术有望将计算密度提高多达40倍。 此外,本研究还讨论了关键挑战,包括容错、软件优化和经济可行性,深入探讨了这两种硬件范式之 间的权衡和协同作用。此外,还 ...
重塑行业价值标准 远程中国VAN家族上新
Core Viewpoint - The launch of the new remote star enjoy V7E marks a significant addition to the remote new energy commercial vehicle lineup, redefining the value ecosystem of urban distribution and intercity logistics with its three core advantages: smart driving control, premium space, and versatile functionality [1][8]. Group 1: Market Context - The logistics market in China is currently complex, with both challenges and opportunities arising from the global economic environment. The ownership of new energy VAN products in China has exceeded 1.2 million units, with over 40% market share from January to May this year, establishing them as the main force in urban distribution logistics [3][4]. - The market faces challenges such as product homogenization, where different brands and models exhibit high similarity in features, leading to a "copycat" product matrix [3]. Group 2: Product Positioning and Features - The remote star enjoy V7E fills the product gap between the remote star enjoy V6E and the remote super VAN, enhancing the brand's global layout and product matrix [8]. - The V7E is designed for short-distance urban distribution, built on the third-generation urban new energy light vehicle platform, and features the remote Xuanwu powertrain, which integrates multiple technologies to meet user demands for efficiency and safety [9][11]. - The vehicle is equipped with a 51.4 kWh Xuanwu battery, offering a CLTC range of 375 kilometers, with plans to expand to a 460-kilometer range in the future. It achieves a low energy consumption of 13.8 kWh per 100 kilometers [11]. Group 3: Loading and Safety Features - The V7E boasts a cargo compartment length of 2870mm, expandable to 4100mm, with a maximum cargo volume of 7.5m³, making it highly competitive in its price range. It features a 270° magnetic tailgate and side sliding doors for easy loading and unloading [13]. - The Xuanwu battery offers the industry's longest warranty of 10 years or 800,000 kilometers and has passed rigorous safety tests, ensuring high durability and safety standards [15]. Group 4: Business Model and User Engagement - The company has shifted from a simple vehicle sales model to a more integrated ecosystem approach, offering a five-in-one solution that includes sales, value protection, easy leasing, vehicle-battery separation, and worry-free rentals [16]. - The launch event introduced seven major purchase benefits for the first batch of vehicle owners, covering all usage scenarios and enhancing user engagement through partnerships with platforms like Didi Freight [18].
SuperCLUE推理榜惊现黑马:原来中兴是一家AI公司?
机器之心· 2025-07-01 05:01
中兴通讯,这家数万人的科技大厂,凭借40年 ICT 技术积累正式进军 AI 赛道。 一家信息通信公司,居然拿到了 AI 推理竞赛的冠军,这事儿有点意思。 前段时间,中文大模型测评基准 SuperCLUE 发布了 2025 年 5 月报告。这份报告评估了来自 OpenAI、谷歌、DeepSeek、字节跳动等多家国内外 AI 公司的大模 型,并发布了多个榜单。报告显示,虽然海外模型在综合能力上占优,但 国内模型在推理任务中表现亮眼,Doubao-1.5-thinking-pro-250415 与 星云大模型 NebulaCoder-V6 以推理总分 67.4 并列第一 。 机器之心原创 SuperCLUE 推理榜单深度聚焦模型的逻辑思维与问题解决能力,涵盖数学推理、科学推理、代码生成三大硬核维度。 作者:张倩 作为专业赛道的选手,Doubao 的表现并不让人意外。但是,星云大模型 NebulaCoder-V6 着实算得上一匹黑马,因为它来自一家老牌信息通信公司 —— 中兴 通讯 。而且,除了拿下推理榜单第一,它在综合总榜中也表现不俗 —— 与 DeepSeek-R1 并列第二,拿到了银牌。 | | SuperCL ...