ShuffleNet - filings, earnings calls, financial reports, news

ShuffleNet

Search documents

自动驾驶之心· 2025-06-30 12:33

作者 | hzwer 黄哲威编辑 | 自动驾驶之心原文链接： https://zhuanlan.zhihu.com/p/627032371 点击下方卡片，关注" 自动驾驶之心 "公众号戳我-> 领取自动驾驶近15个方向学习路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球本文只做学术分享，如有侵权，联系删文以下内容后续更新在：https://github.com/hzwer/WritingAIPaper 导语 2021年来，笔者在多次论文被拒稿期间，开始研究和反思顶会论文生产到投稿的全流程，并全程参与了十几篇论文的审稿。近一年笔者有三篇论文录用 (笔者主页)，总共投了 5+4+1=10 次，其中感悟颇多。本文希望结合经历回顾，为新手提供一个指南，提高论文的质量和命中率。本文深度参考了计算机科学家 Simon Jones 的《How to write a great research paper》和北京大学施柏鑫老师的《从审稿人视角，谈谈怎么写一篇 CVPR论文》。本文有 pdf 版本，全文 5k 字，求点赞求收藏（论文生产发表流程为了方便读者理解，先科普一下一般的深度学 ...

论文创新性

论文写作

论文投稿

Artificial Intelligence

Artificial Intelligence

MXNet

ShuffleNet

专访张祥雨：多模态推理和自主学习是未来的 2 个「GPT-4」时刻

海外独角兽· 2025-06-08 04:51

本期内容是拾象 CEO 李广密对大模型公司阶跃星辰首席科学家张祥雨的访谈。张祥雨专注于多模态领域，他提出了 DreamLLM 多模态大模型框架，这是业内最早的图文生成理解一体化的多模态大模型架构之一，基于这个框架，阶跃星辰发布了中国首个千亿参数原生多模态大模型 Step-1V。此外，他的学术影响力相当突出，论文总引用量已经超过了 37 万次。一直以来，业界都相当期待一个理解、生成一体化的多模态，但直到今天这个模型还没出现，如何才能达到多模态领域的 GPT-4 时刻？这一期对谈中，祥雨结合自己在多模态领域的研究和实践历程，从纯粹的技术视角下分享了自己对多模态领域关键问题的全新思考，在他看来，虽然语言模型领域的进步极快，但多模态生成和理解的难度被低估了： • 接下来 2-3 年，多模态领域会有两个 GPT-4 时刻：多模态推理和自主学习； • o1 范式的技术本质在于激发出 Meta CoT 思维链：允许模型在关键节点反悔、重试、选择不同分支，使推理过程从单线变为图状结构。目录 01 研究主线：重新回归大模型 • 多模态生成理解一体化难以实现的原因在于，语言对视觉的控制能力弱，图文对齐不精确， ...

多模态推理

自主学习

next token prediction

next token prediction

o1 范式

思维链