DeepSeek
Search documents
细扒字节Seed 逆天招人要求!这5%本地顶级大脑做出了首个跨7大语言代码修复基准,让大模型成本狂降83%!
AI前线· 2025-04-28 11:10
作者|冬梅 字节 Top Seed 启动 2026 届招聘,瞄准顶尖博士 4 月 27 日,字节跳动 Seed 在其官微上发布了一则招聘启示,宣布正式启动 2026 届 Top Seed 大模型顶尖人才校招计划, 研究课题包括大语言模型、机器学习算法和系统、多模态生成、多模态理解、语音等方向,基本覆盖大模型研究各个领域, 计划招募约 30 位顶尖应届博士。 值得一提的是,本届 Top Seed 强调不限专业背景,更关注研究潜力,希望寻找具有极强技术信仰与热情、具备出色研究能 力、富有好奇心和驱动力的年轻研究者。 值得注意的是,字节跳动在此次招聘启事中还透露了几位刚毕业的同学已经做出了一些有影响力的研究。 比如,Z 同学构建并开源了首个多语言代码修复基准 Multi-SWE-bench,在 SWE-bench 基础上,首次覆盖 Python 之外的 Java、TypeScript、C、C++、Go、Rust 和 JavaScript 七种编程语言,1632 个真实修复任务,是真正面向"全栈工程"的评测 基准,其数据均来自 GitHub issue,历时近一年构建,以尽可能准确测评和提高大模型高阶编程智能水平。 ...
北大物院200人合作,金牌得主超50人!PHYBench:大模型究竟能不能真的懂物理?
机器之心· 2025-04-28 08:04
本项目由北京大学物理学院朱华星老师、曹庆宏副院长统筹指导。基准设计、项目管理以及数据整合的主要工作由学生核心团队完成,核心成员包括仇是、郭绍 阳、宋卓洋、孙韫博、蔡则宇、卫家燊、罗天宇等。项目还得到了北京计算科学研究中心罗民兴院士和人工智能研究院张牧涵老师的鼎力支持。 PHYBench 项目汇聚了来自物理学院及兄弟院系的 200 余名学生,共同承担题目编写、审核及人类基准测试等工作。这支高水平的参与者团队中,包含至少 50 位 全国中学生物理竞赛金牌得主,更有亚洲物理奥赛和国际物理奥赛的金牌获得者。这场大规模、高质量的协作,不仅充分展现了北大学子深厚的学术功底和卓越 的组织协调能力,也为 PHYBench 产出高质量成果提供了坚实保障。 在大语言模型(LLMs)飞速发展的当下,模型的推理能力俨然成为模型能力的代名词。OpenAI 的 o 系列、DeepSeek R1 等前沿模型相继发布,这些大模型凭借强 化学习技术的助力,在许多科学评测基准上频频刷新纪录,甚至声称 "超越人类专家"。 但是,随着模型能力和评测基准的军备竞赛白热化, 越来越多的基准不得不转向生僻的知识点、或者抽象的数学竞赛题。 这些题目虽然能 ...
日本车企要借助当地技术在中国挽回劣势
日经中文网· 2025-04-28 07:39
虽然没有公开具体功能,但在已安装该系统的中国车上,开关车窗、调节车内温度和座椅位置均 可通过车内显示屏,如同智能手机一样进行操作。如果实现车辆的智能手机化,车内的舒适度将 大幅提高。 丰田在其投放的中国专用EV上首次搭载了华为的鸿蒙系统,本田也将在中国专用EV系列上搭载 DeepSeek的服务。日本车企认为仅凭一己之力难以在智能化竞争激烈中国市场取胜,因此将吸 收中国的最尖端技术…… 丰田等日本汽车厂商将与中国的IT企业合作,投放中国市场专用的纯电动汽车(EV)。丰田在其操 作系统(OS)上采用了华为的系统。在中国,汽车智能化竞争激烈,仅凭一己之力难以取胜。日本 企业将吸收中国的最尖端技术,谋求生存。 "为了在中国提供存在需求的汽车,借助中国人的大脑和技术推进汽车开发不可或缺",在上海市 举行的上海国际车展上,丰田的当地法人总经理李晖这样强调。 丰田在全球首次披露的纯电动轿车"bZ7"正是中国专用车。为了实现在驾驶席等处显示各种信息 的"智能座舱",首次搭载了华为的鸿蒙"HarmonyOS"。 丰田在驾驶辅助方面也在与中国企业合作。将采用与自动驾驶新兴企业北京初速度科技 (Momenta)联合开发的先进驾驶辅 ...
不用等R2了!第三方给新版DeepSeek V3添加深度思考,推理101秒破解7米甘蔗过2米门
量子位· 2025-04-28 06:36
1.2T万亿参数,5.2PB训练数据,高效利用华为芯片……只能说如果有一半是真的都很牛了。 HuggingFace创始人此时推荐"以不变应万变",打开官方认证账号的更新提醒,就能第一时间获取通知。 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI DeepSeek即将发布R2??坊间传闻越来越多了,且 难辨真假 。 抛开具体泄露数据是否准确,大家似乎有一个共识: 如果真的有R2,它的基础模型会是新版DeepSeek V3-0324 。 之所以有很多人相信R2会在4月底发布,有一部分原因也是出于R1与V3之间相隔了一个月左右。 现在,等不及DeepSeek官方, 开源社区已经开始自己动手给V3-0324加入深度思考了 。 新模型 DeepSeek-R1T-Chimera ,能力与原版R1相当,但速度更快,输出token减少40%,也是基于MIT协议开放权重。 相当于拥有接近R1的能力和接近V3-0324的速度,结合了两者的优点。 而且做到这一点,不是靠微调或蒸馏,而是DeepSeek V3-0324和R1两个模型融合而成。 R1+V3融合模型 新模型R1T-Chimera并非DeepSeek官方出品,而是来 ...
对话合思CEO马春荃:AI的世界的第一性原理就是降本增效
Sou Hu Cai Jing· 2025-04-28 06:32
Core Insights - DeepSeek has launched lower-cost, higher-performance open-source multimodal models, Janus-Pro and DeepSeek-R1, which challenge OpenAI's global dominance and drive an "AI access wave" across various industries [2] - The AI era is expected to fundamentally reshape the business world, with a focus on cost reduction and efficiency enhancement as the primary principles of AI applications [2][5] - The capabilities of AI agents are doubling every seven months, while prices are decreasing by 90% annually, indicating rapid advancements in the AI field [5] Group 1: Financial Management and AI Integration - Cost-saving remains a critical goal for businesses, but developing a new financial system for operational decision-making is equally important [6] - Companies face uncertainty due to unpredictable factors like tariff policies, which complicate decision-making [6] - Effective financial management requires a combination of cost reduction and efficiency improvement, focusing on both downward cost control and upward profit maximization [6][9] Group 2: AI's Role in Business Decision-Making - AI can transform traditional expense management into intelligent decision-making processes, serving as a brain for enterprise risk management [14] - The goal is to convert every workflow into intelligent agents, gradually replacing manual operations and optimizing decision-making based on historical data and real-time conditions [15] - AI's rapid development, particularly breakthroughs in large models, has lowered the barriers for businesses to adopt AI technologies [19] Group 3: Future of Financial Roles and Systems - AI technology will not replace financial personnel but will elevate their roles from basic execution to management decision-making [20] - Financial systems need to be restructured at three levels: modeling, execution, and decision-making, to leverage AI effectively [24] - The transition to AI-driven financial management emphasizes the importance of integrating technology with business logic to enhance efficiency and innovation [24] Group 4: Market Demand and AI Adoption - There is a growing demand for AI-driven solutions among clients, with nearly all customers expressing interest in AI capabilities [25] - The market is shifting from process-driven to model-driven approaches, with AI playing a crucial role in this transformation [25] - Companies must balance understanding AI's capabilities with meeting user needs to create valuable product solutions [30][31]
震惊!传DeepSeek R2参数暴涨至1.2万亿、便宜97.3%!
是说芯语· 2025-04-28 05:12
申请入围"中国IC独角兽" 半导体高质量发展创新成果征集 起因爆料 4月27日,投资平台"韭研公社"首次披露R2参数细节,随后X平台(原Twitter)用户@iruletheworldmo发布"1.2万亿参数+97.3%成本下降"的爆料。 4月28日,HuggingFaceCEO在推特发布含DeepSeek仓库链接的神秘帖子,进一步引爆猜测。 截至4月28日,DeepSeek官方未正式发布R2,但多个第三方机构通过技术拆解验证了部分参数合理性。 热议传播 这场热议始于4月27日的投资社区"韭研公社",当"1.2万亿参数+97.3%成本降幅"的词条突然出现,立刻引发技术圈与资本圈的双重震动。紧接着,X平台 上知名科技博主的爆料、HuggingFaceCEO的神秘推文,让传闻热度呈指数级攀升。在技术论坛,开发者们围绕"混合专家模型(MoE)如何将万亿参数计 算量压缩至百亿级"展开激烈讨论;在资本市场,"华为昇腾概念股"应声大涨,拓维信息等供应链企业单日涨幅突破10%,仿佛提前庆祝国产算力的突围 时刻。 | çelebi � @celebi_int · 15小时 | | | | | --- | --- | --- ...
Gemini-2.0夺冠!全球首个几何推理专项评测出炉,淘天集团出品
量子位· 2025-04-28 03:43
人类在解答几何问题时,首先会识别所需的几何原理并通过灵活应用它们来推导出答案。 然而,目前的评测方法多集中于最终答案的正确性或简单地对每个推理步骤进行打分,而 忽视了推理过程中的关键因素:几何原理的识别和 应用 。 尽管有研究发现模型的对几何图的感知能力不足限制了其后续推理,但实验发现,几何原理与图像中几何元素的正确对应及应用,是多模态大 模型推理的另一大瓶颈。 为填补这一空白,GeoSense出现了,为在复杂视觉场景中的推理能力提升提供了新的方向。 GeoSense团队 投稿 量子位 | 公众号 QbitAI 多模态大模型几何解题哪家强? 首个从几何原理视角出发,全面评估多模态大模型几何解题能力的双语综合基准来了! GeoSense ,系统评测多模态大模型在几何原理识别和应用中的表现,评测基准的数据和评测代码均已开源。 其背后团队来自 淘天集团算法技术-未来生活实验室团队。 5层知识架构+1789道几何问题 GeoSense旨在系统评估多模态大模型识别和应用几何原理来解决几何问题的能力。 该基准建立了包含定义、定理和公式等几何原理的5层知识架构,覆盖平面几何和立体几何,支持中英双语;精心构建并人工详细标注了 ...
兰德:2025人工智能算法进展:进步调查与近期未来预测报告
欧米伽未来研究所2025· 2025-04-27 21:43
" 欧米伽未来研究所 " 关注科技未来发展趋势,研究人类向欧米伽点演化过程中面临的重大机遇与挑战。将不定期推荐和发布世界范围重要科技研究进展和未 来趋势研究。( 点击这里查看欧米伽理论 ) 兰德公司(RAND)发布的《人工智能算法进展:进步调查与近期未来预测》研究报告由Carter C. Price、Brien Alkire和Mohammad Ahmadi撰写,于2025年初 完成。该报告对人工智能算法改进进行全面调研,分析了算法进步的关键渠道和未来发展趋势。 报告主要内容包括:人工智能算法改进的定义与维度、数值分析与运筹学中算法进步机制分析、大型语言模型性能提升的关键因素,以及对近期AI发展 的预测。研究发现两个高影响力的算法改进渠道是:数据合成与优化,以及提高数据效率的改进算法。报告还探讨了三种可能的近期发展情景:数据限制 成为瓶颈、算法无法有效扩展,或算法与数据协同发展。 值得注意的是,2024年12月问世的DeepSeek-V3语言模型成为算法改进的重要实例,展示了混合专家系统架构的优势。该报告为政策制定者提供了基于证 据的预测,帮助理解AI技术发展轨迹及其安全影响。 算法改进可以从不同维度来描述。从 ...
“杭州六小龙”的招聘迷局
吴晓波频道· 2025-04-27 15:18
事实上,不只是强脑科技,在近些年崛起的中国科创企业中,一直存在着一种反 资 本 的 叙 事 情 节 。 比 如 DeepSeek 创 始 人 梁 文 峰 公 开 表 示 拒 绝 融 资 和 盲 目 商 业 化,再比如全球无人机的领头企业大疆迟迟未上市,创始人汪滔表示自己"只想把 产品做好"。这种现象也引发了我们的一个思考——随着以"杭州六小龙"为代表 的 新 生 代 科 创 企 业 走 上 了 科 技 突 破 与 商 业 应 用 的 交 界 点 , 它 们 如 何 在 " 扩 张"和"极客"之间找平衡?本文试图探讨这个问题。 " 在科创企业的发展过程中,或许唯有那些既能驾驭资本洪流、又不忘极客初心的企业,才配得上 ' 踏碎凌霄 ' 的终局。 " 文 / 巴九灵(微信公众号:吴晓波频道) 点击图片▲立即试听 编者按:4月初,小巴参访了"杭州六小龙"中的强脑科技。除了了解其在脑机接 口领域的先进技术和产品,在交流过程中,强脑科技创始人韩璧丞表明了一个招 聘理念——在人才招聘中的第一筛选标准是"极客",即要精尖人才,同时在融资 上他也表明了自己谨慎的态度。这似乎意味着在爆火后这家公司仍然希望保持着 一种"小而精而美 ...
程序员工资比其他行业高?主要还是透支了未来
菜鸟教程· 2025-04-27 11:06
| | | DeepSeek公开招聘职位信息汇总 | | | --- | --- | --- | --- | | 职位名称 | 面向群体 | 申请要求 | 薪酬水平 | | 深度学习研究员 校招&实习 | | 熟练掌握至少两 | 8-11万元/月,一年14薪 | | | | 种编程语言;在 | | | | | 国际顶会或期刊 | | | | | 发表相关论文; | | | | | 知名比赛成绩 | | | 资深ui设计师 | 经验不限,本科 | 优秀的艺术类教 | 4-7万元/月,一年14薪 | | | | 育背景:有互联 | | | | | 网或科技公司UI | | | | | 设计工作经验; | | | 深度学习研发工 | 在校/应届,本科 力;工程能力; | 较强的工程能 | 4-7万元/月,一年14薪 | | 程师 | | | | | | | 知名比赛成绩 | | | 数据架构工程师 | 在校/应届,本科 | | 4.5-6.5万元/月,一年14薪 | | | | 有搜索、推荐、 广告等业务数据 | | | | | 的处理经验;有 | | | | | 规模中文网页 | | | | | 数据收集和清洗 ...