Workflow
Seek .(SKLTY)
icon
Search documents
你是否也曾榨干过DeepSeek?
Hu Xiu· 2025-04-21 13:21
Core Insights - The article discusses the performance of AI models, particularly in the context of OpenAI's BrowseComp test, which evaluates the ability of AI agents to locate complex and entangled information [10][11][12]. Group 1: AI Model Performance - AI models can generate answers quickly, often within a minute, but struggle with certain types of questions that require deeper reasoning and extensive information retrieval [1][9]. - The BrowseComp test features questions that are simple in answer but complex in their descriptions, making it challenging for models to identify the correct information [14][15]. - The performance of various models in the BrowseComp test shows that even the best-performing models achieve only around 50% accuracy, indicating significant room for improvement [25][29]. Group 2: Testing Methodology - The BrowseComp test consists of 1266 questions, and the complexity arises from the vague and misleading characteristics of the questions, which require extensive searching across multiple sources [27][28]. - The results indicate that models like GPT-4o and OpenAI's o1 have low accuracy rates, with the highest being 9.9% for o1 when not connected to the internet [29]. Group 3: Implications for Future Development - Despite current limitations, AI models are rapidly improving in their browsing and information retrieval capabilities, suggesting a positive trend for future developments [31]. - Engaging with AI models multiple times and refining questions can enhance the quality of responses, indicating a need for iterative interaction to maximize the utility of these models [33].
博时“科技时代”投资圆桌沙龙之一 深度探索“Deep Seek与AI投资”机遇
Xin Lang Ji Jin· 2025-04-21 01:48
日前,博时基金策划召开《东升西落·日异月殊——博时基金2025二季度策略会》系列直播,携手多家 券商机构共同发声,探讨当下市场及未来展望。同时,博时基金还策划了【科技时代——2025科技投资 系列圆桌线上沙龙】,聚焦中国科技突破五大主题:AI硬件、AI软件、智能驾驶、机器人、创新药, 呈现产业趋势研判与投资逻辑方法。 随着AI助力下的"第四次科技革命"曙光初现,围绕"Deep Seek与AI投资"热门话题,博时基金权益投资 四部投资副总监兼基金经理肖瑞瑾与华泰证券电子与计算机首席分析师谢春生、博时基金首席数字官车 宏原、博时基金行业研究部研究员肖达四位投研专家,通过多方视角碰撞,深入解析Deep Seek带来的 AI投资机遇与挑战。 把握AI硬件的崛起机遇 本次圆桌深入剖析了Deep Seek对AI大模型、AI算力、AI端侧、AI应用四大行业的重要影响——从大模 型开源带来的国产替代机遇,到算力基建的长期投入;从企业级应用的效率提升,到端侧AI驱动的消 费电子升级。种种迹象表明,中国AI产业正迎来战略窗口期。 AI大模型:开源浪潮缩短中美差距,通用与垂直领域齐头并进 自Deep Seek推出低成本、高效率的开 ...
黄仁勋未与DeepSeek梁文锋会面,访华强调中国市场重要性
Di Yi Cai Jing· 2025-04-19 06:17
4月15日,英伟达称,美国政府于4月9日通知该公司,H20芯片需要获得许可证才能出口到中国,并于4月14日告知英伟达,这些规定将无限期执行。目前尚 不清楚美国政府可能会授予多少潜在的许可证。 黄仁勋此次访华正值美国收紧对英伟达人工智能芯片的出口管制。在这一背景下,包括DeepSeek在内的人工智能企业未来能否获取符合管制要求的AI芯片 备受关注。 4月19日,英伟达CEO黄仁勋结束了对中国为期两天的访问。在两天的访华行程中,黄仁勋先后到访北京和上海,与中国官员会面。但他并未与中国人工智 能初创公司DeepSeek创始人梁文锋会面。 黄仁勋此次访华正值美国收紧对英伟达人工智能芯片的出口管制。在这一背景下,包括DeepSeek在内的人工智能企业未来能否获取符合管制要求的AI芯片 备受关注。 第一财经记者从了解黄仁勋访华行程安排细节的知情人士处获悉,黄仁勋此次中国之行并未如外界传言那样与DeepSeek创始人梁文锋会面。但从黄仁勋与 政府官员会面时传递的信息来看,尽管面临复杂艰难的环境,英伟达仍将不遗余力地力挺中国人工智能的发展,坚定不移地服务中国市场。 由于美国政府限制H20人工智能芯片向中国出口,英伟达表示将不 ...
黄仁勋已结束中国之行,知情人士称全程未与DeepSeek会面
news flash· 2025-04-19 03:27
4月19日,记者独家获悉,英伟达CEO黄仁勋已结束中国之行。针对外界高度关注的黄仁勋是否与 DeepSeek创始人梁文锋会面,记者从了解黄仁勋中国之行细节的人士方面证实,黄仁勋全程未与 DeepSeek会面。(第一财经) ...
错过DeepSeek,深圳拼了
Xin Lang Cai Jing· 2025-04-19 02:23
来源:中国新闻周刊 为什么像DeepSeek、宇树机器人 《黑神话·悟空》这样的现象级产品 没有出现在创新最前沿的深圳? 深圳市50%—60%的人工智能企业集聚在南山区,而在南山区科创局,当前最为忙碌的部门可能就是人 工智能产业办,这是一个成立于2023年的部门,如今"天天加班加点"。 年初,"杭州六小龙"出圈,深圳被外界不停地拿来和杭州比较,国内AI领域的竞争态势让深圳这座头 顶"科技创新"光环的城市倍感压力。不少网民讨论:为什么像DeepSeek、宇树机器人、《黑神话· 悟 空》这样的现象级产品,没有出现在创新最前沿的深圳? 其实,早在2023年,深圳市政府就成立了人工智能产业发展工作专班和人工智能战略咨询委员会。今年 不仅继续推出一系列新政策,更是明确提出诸如"2026年人工智能终端产业规模力争1万亿元"等具体目 标。 面对新一轮人工智能浪潮,政府层面首先开展了"认知竞赛"。在DeepSeek的"大本营"浙江,拉开了一场 对全省干部的人工智能专题大培训,为期4个月共10期课程,第一期由中国工程院院士、之江实验室主 任、阿里云创始人王坚开讲,全省近30万干部在线上课,夜学AI。 3月31日,深圳成立了"十 ...
媒体称特朗普打算禁止DeepSeek购买美国技术,对DeepSeek影响大吗?
Xin Lang Cai Jing· 2025-04-18 20:32
算力命脉的芯片断供 英伟达A100/H100/H800等高端AI芯片是DeepSeek千亿级大模型训练的核心硬件。据行业数据, DeepSeek已囤积约1万颗A100、3万颗H20及1万颗H800芯片,短期内可支撑现有模型迭代。但长期若无 法获取新芯片,将被迫转向国产昇腾、海光等替代品。目前国产芯片在特定场景下性能达A100的 60%-80%,但训练效率可能下降30%-40%,成本或增加50%。 美国特朗普政府近期计划进一步限制中国AI企业DeepSeek获取美国技术,此举被视为美国遏制中国人 工智能发展的最新动作。结合多方信息,这一禁令将围绕芯片断供、云计算限制、软件生态围堵三大核 心展开,但对DeepSeek的实际影响需从技术、产业、地缘政治等多维度解析。 一、直接影响:技术封锁的三大战场 云计算的全球部署受阻 DeepSeek此前通过微软Azure等美国云服务商部署海外业务,若GPU集群租赁被禁,需转投非美云服务 或自建数据中心。这将导致海外市场响应速度降低,且自建成本预估增加2-3亿美元。 软件生态的隐性钳制 英伟达CUDA框架是AI开发的基础工具,若被禁用,模型优化效率可能下降。尽管存在开源替代方案 ...
DeepSeek正在杀死“六小虎”
Xin Lang Cai Jing· 2025-04-18 15:22
"99%的AI公司会在泡沫破裂时面临倒闭风险,仅有1%的公司能够存活。" 李彦宏的这句预言,如今正 一步步成为现实,尤其是DeepSeek的横空出世,更加剧了这场本就近乎肉身赤博的AI生死战。面对强 敌DeepSeek带来的开源冲击和市场挤压,曾被视为国产AI"希望之光"的六小虎们,似乎并没有很好的对 策,反而集体陷入生存危机。这场AI之战还会有悬念吗? DeepSeek后时代,"六小虎"集体求生 风光一时的"六小虎",曾个个志向远大,怀揣改变世界AI格局的雄心和抱负,但随着DeepSeek带来的巨 大冲击,如今似乎已豪情不再,而是纷纷把战略目标从"过得好"下调为"活下去"。 百川智能已有多名高管、联合创始人离职,公司进一步将资源集中到医疗垂直领域。虽然已在医疗场景 中开发出针对病例分析和诊断辅助的模型,但医疗市场的碎片化需求和高昂研发成本,依然让其商业化 前景充满挑战。 月之暗面(Kimi)则在C端市场遭遇重创。作为一款主打对话体验的通用大模型,面对DeepSeek免费开 源模式的冲击,Kimi的用户增长已急速放缓,其产品投放预算也被迫大幅收缩。 MiniMax选择继续深耕多模态方向,希望通过差异化突出重围 ...
DeepSeek个性化规划 解锁“上海之夏”国际消费季新玩法
Yang Shi Xin Wen· 2025-04-18 15:03
总台记者4月18日从上海市商务委员会了解到,为积极吸引扩大外来消费,加快推动上海国际消费中心城市建设,2025"上海之夏"国际消费季将于今年7月首 个周末至10月第二个周末举办。 作为中国入境旅游第一站,2024年上海接待入境游客突破600万人次。240小时免签政策吸引了更多全球游客来到上海,为让全球友人享受更丰富、更便捷的 城市体验,本次"上海之夏"推出首批240小时主题产品,首批240小时主题产品集中发布,联合企业推出专属折扣、限量商品和定制服务,例如: 为服务入境消费者,今年上海之夏打造了"一网、一脑、一IP、一矩阵"的智能服务体系↓ "夏日早鸟系列"全球航线产品及超百万张优惠机票 "入住立减+文博套餐"组合住宿产品 融合交通、景点、商圈权益的"Shanghai Pass一日通票"等 今年的"上海之夏"还特别推出了"城市定制活动"的创新板块。此外,整合餐饮、出行、文旅、购物等高频需求场景软件服务的"入境通Easy Go"超级小程序 及2025"上海之夏"全球推介片也在同日发布。 (文章来源:央视新闻) 支持中英法日韩五种语言的官方网站正式开通,并开设了"全球体验官"招募通道。 基于DeepSeek模型开 ...
第一批用DeepSeek推荐的人,已上当
Hu Xiu· 2025-04-18 04:26
到了一个陌生的城市,想体验一下当地特色应该怎么做?DeepSeek横空出世后,很多人开始尝试让它来拿主意。 自打DeepSeek出世后,越来越多的人喜欢找它问东问西。就连投资人傅盛也在感慨,传统搜索引擎的黄昏已至。根据他的小道消息,谷歌的搜索量已经 急速下降,尤其教育品类几乎被AI搜索干趴,下降了40%。 但AI可能会辜负你的信任。它语料库里,充斥着一些营销号锻造的广告。那些看似条理清晰言之有理的回答,参考的或许只是互联网角落里一篇并不权 威的营销文。找它查数据、搜店铺、求种草,很可能会换来一通胡说八道。 一、DeepSeek,你还敢信吗? 80后正哥,最近就被DeepSeek种草了一次。正哥曾在日本打拼数年,如今回到北京,在一家金融公司做经理。每当傍晚下班之际,正哥总想像在日本时 那样去居酒屋小酌几杯,但他对北京的小酒吧并不熟悉。得知DeepSeek可以精准地推荐商铺后,正哥尝试问了问。 深度思考34秒后,DeepSeek给出了答案。正哥根据推荐,选择了第一家酒吧,结果并没有踩雷。这家店处于北京CBD核心商圈,环境不错,价格也比预 想中便宜。他点了份四杯精酿的套餐,只花了90元。 像正哥一样,尝试让AI做消 ...
OpenAI并未让DeepSeek惊出一身冷汗
Hu Xiu· 2025-04-17 11:51
出品 | 虎嗅科技组 作者 | 房晓楠 编辑 | 苗正卿 头图 | 视觉中国 "OpenAI的创新好像到瓶颈期了。"一位业界人士这样说道。 今日凌晨,预热了很久的OpenAI o3模型完整版终于面世,且与以往直播"挤牙膏"式的依次、慢吞发布 方式不同的是,这次o3和o4-mini是同时发布。 在OpenAI官方的陈述中,o3和o4-mini的亮点主要在于可以组合调用ChatGPT中的各个工具,像是网络 搜索、Python、图像分析、文件解释和图像生成等。这可以看作是OpenAI开始后发补足自身在Agent能 力上的探索。 其中,o3作为推理模型,在编程、数学、科学、视觉感知等多个维度的基准测试中都刷新了纪录。比如 在Codeforces、SWE-bench、MMMU基准测试中,视觉任务准确率高达87.5%,而MathVista达到 75.4%。 其实分数、榜单,这些都是常规操作。相较于以往,这次的最大不同在于,o3和o4-mini将上传的图像 直接集中到思维链中,这就意味着,图像不仅仅是被看到,还能被用来作为思考过程中的一部分。 从OpenAI团队成员、中科大校友Jiahui Yu发布的帖文来看,"用图像思考 ...