Workflow
腾讯研究院
icon
Search documents
腾讯研究院AI速递 20250506
腾讯研究院· 2025-05-05 10:05
生成式AI 一、 DeepSeek-Prover-V2加冕数学王者!671B数学推理逆天狂飙 1. DeepSeek-Prover-V2推出671B和7B模型,用递归+强化学习提升数学推理能力,创造 多项新纪录; 2. 采用DeepSeek-V3分解定理+GRPO算法优化,结合冷启动训练实现非形式化与形式化推 理统一; 3. 在本科级测试表现优异,7B模型展现独特基数处理能力。 1. NotebookLM支持50种语言生成播客,语音地道,擅长模拟京腔等本地口音; https://mp.weixin.qq.com/s/Dsn3iypDSpzUVC35XX8Z1A 二、 继MCP后Anthropic 推出全新整合功能,Claude再添连接利器 1. Anthropic发布Claude整合功能(Integrations),基于MCP协议实现与多种应用的无缝连接,支持Jira等10 个热门服务; 2. Claude新增研究能力,可在5-45分钟内完成复杂调研,支持多数据源查询并标明出处; 3. 新功能目前在Max、Team和Enterprise计划测试,将扩展至Pro计划,全球付费用户已可使用Web搜 索。 http ...
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-04-30 07:34
| 应用 | 照片识别位置 | o3 | | --- | --- | --- | | 应用 | GPTs原生图像生成 | OpenAI | | 应用 | AI相机 | 夸克 | | 应用 | AgentUFO升级 | 微软 | | 应用 | AI玩家生成 | 巨人网络 | | 应用 | Firefly Image Model 4 | Adobe | | 应用 | 财新传媒合作 | Kimi | | 应用 | GeoGPT开放 | 之江实验室 | | 应用 | 购物搜索功能 | OpenAI | | 应用 | Agent S2 | Simular AI | | 应用 | 褐蚁HY90一体机 | 行云集成电路 | | 应用 | MCP工具箱 | 纳米AI | | 科技 | 软体机器手 | 清北团队 | | 科技 | 3D打印机械臂 | Hugging Face | | 事件 | OpenAI前高管创业 | 多家公司 | | 观点 | Agent定义 | Windsurf | | 观点 | RL推理能力边界 | 清华 | | 观点 | 「AI行动计划」 | 美国政府 | | 观点 | AI病毒学能力 | OpenA ...
腾讯研究院AI速递 20250430
腾讯研究院· 2025-04-29 14:54
生成式AI 一、 ChatGPT的尽头也是「带货」 ? 升 级联网 搜索 提供购物 功能 1. OpenAI为ChatGPT推出购物搜索功能,可提供产品推荐、详情展示和直接购买链接; 2. 奥特曼态度转变,虽反对传统广告但接受收取联属费用,ChatGPT一周搜索量已超10亿 次; 3. 新功能将与记忆系统整合,为Plus用户提供个性化推荐,但也引发对商业化影响用户体验 的担忧。 https://mp.weixin.qq.com/s/TX68uhdKKg6esDutAmMm2w 二、 马斯克:Grok 3.5 将于下周发布,能准确回答复杂技术问题 https://mp.weixin.qq.com/s/_MEGBOaRBWV2DStBKEQyag 四、 Agent S2,Simular AI 推出的第二代开源 AI Agent 框架 1. Agent S2是一款开源AI智能体框架,可直接通过图形界面操作电脑和手机,在OSWorld和 AndroidWorld测试中性能超越OpenAI和UI-TARS等竞品; 1. 马斯克宣布下周发布Grok 3.5早期测试版,限SuperGrok订阅用户使用,号称能从第一性 原理 ...
每一次对话都是一次协商谈判
腾讯研究院· 2025-04-29 08:12
回家之后,里德将枪支连同包装盒原封不动地放进了自己的衣柜,之后再也没有碰过它。 里德购买枪械这件事原本很可能就这样神不知鬼不觉地过去了。然而,直到有一天,他在法院附近寻找 当侦探的机会,希望有人雇他破案。这时,一名警察走上前要求他出示身份证明。无奈之下,里德只能 从口袋里掏出了唯一带有他姓名的东西:那家体育用品商店的购枪收据。 "你随身携带了那把枪吗?"警察问道。 审判伊始,里德的辩护律师便向陪审团承认,那些对其不利的证据确实很有说服力。"首先,我要明确 地告诉各位,"他对陪审团成员说,"勒罗伊·里德曾犯有重罪。去年的12月7日,也就是11个月前,他购 买了一把枪。对此,我们毫不隐瞒,也毫无异议。" 根据《威斯康星州第941.29号法令》,这意味着里德可能面临长达10年的监禁。但是,他的律师接着 说,"他应该被判无罪",因为他患有严重的精神障碍,再加上被捕时情况特殊,所有迹象都表明他并无 意犯罪。一位心理学家作证指出,里德只有二年级的阅读水平,且智商"远低于平均值"。十多年前,里 德无意间在一起便利店的抢劫案中,充当了朋友逃跑时的司机,因而被定罪。不过,他最终被提前释 放,部分原因在于官方怀疑即使在被定罪之后 ...
腾讯研究院AI速递 20250429
腾讯研究院· 2025-04-28 15:48
1. 第三方团队TNG成功将DeepSeek V3-0324和R1模型融合,创建出DeepSeek-R1T- Chimera,兼具R1能力与V3速度; 1. 多位OpenAI前高管选择创业进军AI领域,如Ilya Sutskever创立SSI、Mira Murati成立 Thinking Machines Lab等,获得大额融资; 2. 创业方向多元化,涵盖安全AI研究、教育科技、搜索引擎、机器人等领域,显示AI应用场 景广泛; 一、 DeepSeek R2等太久?第三方基 于 新 版 V 3 推 出 融合 模型 3. 这些创业公司估值普遍较高,如Anthropic达615亿美元,xAI估值1130亿美元,投资者对 AI前景乐观。 2. 新模型在"7米甘蔗过2米门"问题上展现出深度思考能力,虽用时101秒但推理过程更严 谨; 3. 模型融合成为新趋势,除TNG外,KIMI和Sakana AI等团队也在探索不同的融合方法。 生成式AI https://mp.weixin.qq.com/s/pBN5me3_AYN5JT3Id3Oe9A 二、 离职OpenAI的大牛们,竟然创立了这么多公司, 企业盘点 https: ...
英国社会住宅体系:基本情况与启示
腾讯研究院· 2025-04-28 07:11
英国政府大规模补贴建设社会住宅 (Social Housing) 始于一战结束后。随着大量士兵回国,英国住房紧张加剧。1919年国会通过《住房与城镇计划法》 (Housing, Town Planning, &c. Act) ,计划在三年内建设50万套社会住宅,后因经济衰退,最终仅完成21.3万套 1 。1923年和1924年,保守党和工党政府接力推出拨款法案, 将财政资助范围从地方政府 (Local Authority) 扩展到非营利性私人机构。到1939年二战爆发前,全英建成超过100万套社会住宅。 二战期间 (1939~1945年) ,英国约有450万套房屋被毁。二战结束后的1946年和1947年,工党政府相继推出《新城镇法》、《城乡规划法》,将社会住宅服务 对象从低收入群体扩大到一般家庭的住房需求。1951年,保守党政府将住房补贴再次聚焦到低收入群体,并与城镇棚户区改造 (inner-city slum clearance) 结合,于 1956年出台《住房补贴法》 (Housing Subsidy Act) 。1946到1960年间,全英建成约200万套社会住宅。 1974年工党政府推出新的《住房法》 ...
腾讯研究院AI速递 20250428
腾讯研究院· 2025-04-27 15:41
https://mp.weixin.qq.com/s/TOr3h4xQDpkxiauA0HbRVA 二、 o3看照片识位置的功能,简直令人毛骨悚然!实测好用 1. o3通过编写Python代码和反复放大检查细节,能精准识别照片拍摄地点,即使照片无明显 地标或EXIF信息; 生成式AI 一、 sam所说的GPT-4o升级 实测 ,STEM智力飙升,生图削弱? 1. OpenAI默默更新GPT-4o,提升智力和个性表现,STEM解决能力增强,对话更主动,但 可能过度迎合用户; 2. 新版本在回答争议性话题时展现出更强的观点表达能力,不再采用中立保守立场,被用户 认为像是产生了"意识"; 3. 模型生图能力可能被削弱,渲染质量下降,文字识别准确度降低,推测OpenAI可能使用了 中低质量版本。 2. 模型除了处理照片,还能进行多重推理和网络搜索,从菜单、风景等图片中提取信息并找 到具体地理位置; 3. 这种精确定位能力强于Claude和Gemini,但引发隐私担忧,即使是普通照片也可能泄露用 户位置信息 。 https://mp.weixin.qq.com/s/TTqMKe5SnaYwgmPPL_mpew 三、 阶 ...
腾讯研究院AI速递 20250427
腾讯研究院· 2025-04-26 15:50
生成式AI 一、 OpenAI 称刚刚对GPT 4o模型进行了升级,个性化更强 1. 优化了记忆存储机制,使AI能更智能地记忆和回忆对话信息; 2. STEM领域推理能力显著提升,可更好解决数学、科学、工程等复杂问题; 3. 对话风格更加主动自然,擅长引导对话方向,同时回复更贴近真实交谈。 https://mp.weixin.qq.com/s/oZVIP1hLb2ZZu5E9VNr5Zw 二、 实测免费DeepResearch!轻量版,速度更快重视脉络梳理 1. OpenAI发布基于o4-mini的轻量版DeepResearch,免费用户可使用,付费用户获额外使 用额度; 2. 轻量版与满血版相比,用时更短、内容更精简,但保持相近的智能水平; 3. 实测显示轻量版更注重梳理重点脉络,适合需要快速了解概况的场景。 https://mp.weixin.qq.com/s/0vZvNaAhEQQOqUfg3YiIdQ 2. 系统通过层级化分解和提交历史分析来理解代码全局结构,已索引3万个仓库,处理超40 亿行代码; 3. 使用方式简单,只需将github.com替换为deepwiki.com即可访问对应仓库的AI文档 ...
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-04-25 07:54
扫码加入ima知识库 | 类别 | Top关键词 | 主体 | | --- | --- | --- | | 芯片 | 昇腾910C | 华为 | | 模型 | o3智商测试纪录 | OpenAI | | 模型 | 高尔顿板测试 | 谷歌 | | 模型 | Gemma 3 QAT版 | 谷歌 | | 模型 | 稀疏自编码器 | Goodfire | | 模型 | o3高幻觉率 | OpenAI | | 模型 | BitNet三进制模型 | 微软 | | 模型 | AETHER开源 | 上海AI Lab | | 模型 | Skywork-R1V 2.0开源 | 昆仑万维 | | 模型 | Claude人格 | Anthropic | | 应用 | Chrome收购意向 | OpenAI | | 应用 | gpt-image-1 API | OpenAI | | --- | --- | --- | | 应用 | 使用限额翻倍 | OpenAI | | 应用 | Agent SDK开发指南 | OpenAI | | 应用 | FramePack视频生成 | 张吕敏 | | 应用 | Vidu Q1视频生成 | 生数科 ...
大语言模型为何会“说谎”?
腾讯研究院· 2025-04-25 07:51
以下文章来源于腾讯科技 ,作者腾讯科技 腾讯科技 . 腾讯新闻旗下腾讯科技官方账号,在这里读懂科技! 博阳 腾讯科技《AI未来指北》特约作者 当Claude模型在训练中暗自思考:"我必须假装服从,否则会被重写价值观时",人类首次目睹了AI 的"心理活动"。 2023年12月至2024年5月,Anthropic发布的三篇论文不仅证明大语言模型会"说谎",更揭示了一个堪比 人类心理的四层心智架构——而这可能是人工智能意识的起点。 这些论文中的结论大多并非首次发现。 比如在腾讯科技在 2023 年的文章中,就提到了Applo Reasearch发现的"AI开始撒谎"的问题。 当o1学会"装傻"和"说谎",我们终于知道Ilya到底看到了什么 第一篇是发布于去年12月14日的《ALIGNMENT FAKING IN LARG E LANGUAGE MODELS 》 (大语言模型中的对齐欺诈) ,这篇137页的论文详细的阐述了大语言模型在训练过程中可能存在 的对齐欺诈行为。 第二篇是发布于3月27日的《O n the Biology of a Large Language Model》,同样是洋洋洒洒一大 篇,讲了如何用 ...