AI前线

Search documents
拉 DeepSeek 和通义“组队”斗 OpenAI?小扎首届 AI 大会变“大型商战现场”,和微软 CEO 疯狂互曝!
AI前线· 2025-05-11 05:23
整理 | 华卫、核子可乐 4 月 30 日凌晨,Meta 举行了其有史以来的首届 AI 开发者大会 LlamaCon。现场,该公司宣布推出一 款面向消费者的独立 Meta AI 聊天机器人应用程序,这款应用将与 ChatGPT 展开竞争,同时还发布 了一个面向开发者的 API,用于在云端访问 Llama 模型。 这两项产品发布都旨在扩大 Meta 开源 Llama AI 模型的应用范围,但这一目标或许只是次要的, Meta 的真正动机是:击败 OpenAI。从大致方向来看,Meta 的 AI 野心正推动形成一个蓬勃发展的开 源 AI 生态系统,而这将对像 OpenAI 这样将其模型封闭在服务背后的"封闭式" AI 供应商构成挑战。 首先,Meta AI 应用几乎像是对 OpenAI 传闻中要推出的社交网络的先发制人之举。作为一款智能助 手,Meta AI 基于 Llama 模型构建,集成了图像生成和编辑功能,可以了解用户的偏好、记住上下 文,能根据用户在应用程序上的活动提供个性化回复。到目前为止,这些个性化回复功能将在美国和 加拿大地区提供。用户还可以向 Meta 提供更多关于自己的信息,以便在未来与 AI ...
特征工程、模型结构、AIGC——大模型在推荐系统中的3大落地方向|文末赠书
AI前线· 2025-05-10 05:48
这里是「王喆的机器学习笔记」的第四十五篇文章。今天我们谈谈一个搜广推行业这两年怎么都绕不开的一个话题,大模型在推荐系统中的应用。两年 前,我们可以说大模型是推荐系统的未来,但如今,大模型对推荐系统的改造已经如火如荼的发生着,很多头部公司都拿到了显著的收益。这篇文章不 谈未来,不谈学术,就谈业界已经发生的切切实实拿到收益的大模型应用方向。 大模型影响推荐系统的三个层次 谈具体的应用之前,我们先从宏观上理解一下大模型的出现对推荐系统到底意味着什么。 三、大模型开始创造一个"新世界" OpenAI 在发布 Sora 之时,喊出了"Sora 是这个世界的模拟器"的口号。大模型最大的野心其实是完全创造一个新的虚拟世界。回到推荐系统领域,其实 推荐系统一直以来的使命是帮助人发掘感兴趣的信息和内容。但大模型极强的内容生成能力,让"个性化内容生成"成为可能。也就是说,大模型有可能 越过"推荐"这个环节,直接为用户创造个性化内容,这才是大模型可能带给推荐系统最大的革命。 从宏观上厘清了大模型革命的三个层次,我们才能脚踏实地的探索那些可能落地的应用。下面列出一些经过我筛选的,并且也有一些落地经验的大模型 推荐系统应用方向。 理解 ...
二十年老牌 IDE 栽在 AI 上?JetBrains 被差评逼疯批量删除评论,用户怒打 1 星抗议
AI前线· 2025-05-10 05:48
作者 | Tina、核子可乐 一款号称拥有 2200 万下载量的 AI 助手,评分却低至冰冷的 2.3 分!面对激烈竞争,JetBrains 选择了直接批量删除用户评论和反馈, 于是这款问题缠身的 AI 助手,又一次将这家知名开发工具公司推向舆论的风口浪尖。 2200 万下载 AI 助手为何口碑崩塌? 尽管 JetBrains 的工具深受开发者喜爱,但该公司在 AI 辅助方面却落后了。 JetBarins 于 2023 年 12 月发布一款 AI 助手插件,旨在帮助程序员编写代码。这家总部位于捷克的软件开发工具厂商当时表 示,"JetBrains AI Assistant 与 GitHub Copilot 类似,但与 JetBrains 的开发环境(IDE)、代码编辑器和其他产品深度集成。" 如今这款 AI 助手插件下载量已经超过 2200 万次,但评分仅为 2.3 分。满分 5 分,其中还有大量的 1 分评价。 近期,用户注意到部分负面评论遭到删除。 一位用户抱怨称,"我之前的评论被无缘无故删除了。JetBrains 似乎在清理负面反馈,这摧毁了我对这家公司的信任和信心。他们不再 重视客户的声音。我仍然会打 ...
拜拜,昂贵的谷歌搜索 API!阿里开源 RL 框架让大模型自给自足、成本直降88%,网友:游戏规则变了
AI前线· 2025-05-09 05:18
整理 | 华卫 近日,阿里巴巴的研究人员在 Hugging Face 上发布了一种名为"ZeroSearch"的新技术,可以大大降低训练 AI 系统进行信息搜索的成本和复杂度,完全 消除对昂贵商业搜索引擎 API 的需求。 研究人员表示,"强化学习(RL)训练需要频繁进行部署,可能会涉及到数十万次搜索请求,这会产生巨额的 API 费用,严重限制了可扩展性。" 据介绍,这项新技术是一种强化学习框架,允许大语言模型 (LLM) 通过模拟的方式开发高级搜索功能,而无需在训练过程中与真实的搜索引擎进行交 互。并且,其表现优于基于真实搜索引擎的模型,同时产生的 API 成本为零。既能让企业更好地控制 AI 系统学习检索信息的方式,又可以为其节省大 量的 API 费用。 该技术适用于多个模型系列,包括 Qwen-2.5 和 LLaMA-3.2,且无论是基础模型还是经过指令调整的模型都能应用,无需单独的监督预热阶段,并与近 端策略优化 (PPO)、组相对策略优化 (GRPO)等各种 RL 算法兼容。目前,研究人员已在 GitHub 和 Hugging Face 上提供了他们的代码、数据集 和预训练模型,允许其他研究人员和公 ...
让 PostgreSQL 更契合Agent、氛围编程!成立四年、微软投资,这家开源数据库公司终10亿美元卖身Databricks
AI前线· 2025-05-09 05:18
整理 | 褚杏娟 联合创始人 Heikki Linnakangas 被部分开发者认为是"Postgres 史上最杰出的贡献者之一"。 Heikki 长期活跃于 PostgreSQL 开源社区,主导或参与了多个核心功能的开发,尤其专注于索引 结构(如 GIST 、Btree、Gin )、存储引擎以及预写日志(WAL)机制的优化。 另一位联合创始人 Stas Kelvich 毕业于俄罗斯国立研究核能大学(原莫斯科工程物理学院),获 得硕士学位。他最早在一家专注 PostgreSQL 数据库开发的公司中担任软件工程师,深入参与了 PostgreSQL 的核心开发工作。之后,在俄罗斯最大互联网公司之一的 Yandex 继续从事数据库 相关的开发工作。2021 年后在 Neon,Kelvich 发起并领导了多个关键项目,其中包括与 ElectricSQL 合作开发的 PGlite 项目。 据外媒 Upstarts 报道,数据与人工智能领域的独角兽公司 Databricks 正在进行收购开源数据库 引擎开发初创公司 Neon 的谈判。 尽管一些业内人士称这笔交易已是"板上钉钉",但多位消息人士指出,谈判仍在进行,并有告吹 ...
在财务·客服·营销领域,大模型如何驱动业务提效?| AICon 直播
AI前线· 2025-05-08 05:57
大模型如何真正驱动企业核心业务提效?客服、财务、营销三大场景的 AI 革命已拉开帷幕!华为云 AI 应用首席架构师郑岩,携手蚂蚁集团高级技术专家杨浩、明略科技高级技术总监吴昊宇,聚焦"场 景探索 - 技术落地 - 未来展望",与你探讨提效策略。 直播介绍 直播时间 5 月 9 日 20:00-21:30 直播主题 财务·客服·营销,大模型如何驱动业务提效 直播嘉宾 主持人 :郑岩 华为云 AI 应用首席架构师 嘉宾 : 直播亮点 杨浩 蚂蚁集团 / 高级技术专家 吴昊宇 明略科技 / 高级技术总监 实战场景剖析:精准评估落地价值,量化"价值锚点"。 技术落地秘籍:模型选型、评测设计与 RAG 应用深度优化。 未来展望:AI Native 智能体特质及组织"超能力"布局。 如何看直播? 扫描下图海报 【二维码】 ,或戳直播预约按钮,预约 InfoQ 视频号直播。 如何向讲师提问? 文末留言写下问题,讲师会在直播中为你解答。 ...
全球最流行 MCP 应用市场,来自一位中国独立开发者
AI前线· 2025-05-08 05:57
作者 | 罗燕珊 策划 | AICon 全球人工智能开发与应用大会 在 AI 开发者社区颇受欢迎的 "MCP 应用市场" MCP.so,你用过吗? 随着智能体生态持续升温,AI 应用的标准化与可扩展性越来越受到开发者关注。其中,MCP 协议 (Model Context Protocol)自 2024 年 11 月由 Anthropic 推出以来,在 AI 开发者和工具社区中引 起了广泛讨论。它被视为一种开放标准,旨在简化 AI 模型与外部工具和数据源的集成过程。 而 MCP.so 这个目前收录超 10000 个 MCP Server 、支持网页直接调用 AI 工具、集成 Chat 能力的 全球最大 MCP 应用市场 ,其实来自一位中国独立开发者 —— 艾逗笔(idoubi)。 艾逗笔,前腾讯高级工程师、微信后台开发,现独立开发者。他作为全栈开发,技术涉猎面广,当前 专注 AI 应用出海,独立打造了多款产品,其中就包括最近热度较高的 MCP.so: 近期,随着 MCP 协议的热度不断提升, MCP.so 也迎来访问量激增。对此, InfoQ 对艾逗笔进行了 一次简短的采访: InfoQ:MCP.so 近期流量 ...
Mistral 拿出杀手锏叫阵 DeepSeek!性价比卷出天际、开源模型却断供,社区粉丝失望透顶
AI前线· 2025-05-08 05:57
整理 I 褚杏娟 当地时间 5 月 7 日,法国 AI 初创公司 Mistral AI 宣布推出新模型 Mistral Medium 3。总的来说,新模型有三个亮点: 1. 引入一个全新的模型类别,兼顾 SOTA 性能、成本大降 87.5%,并以支持以更简单的部署方式,加速企业落地应用。 2. 在编程和多模态理解等专业场景中表现突出。 3. 具备一系列企业级功能,包括:混合部署或本地 / 虚拟私有云(VPC)部署、定制化的后训练及可集成至企业工具和系统中。 据官方介绍,在各项基准测试中,Mistral Medium 3 能达到或超过 Claude Sonnet 3.7 的 90%,但成本却低得多(每百万 token 输入 0.4 美元 / 输出 2 美元)。定价方面,无论是 API 还是自部署系统,该模型优于 DeepSeek V3 等模型。 "在性能方面,该模型超越了领先的开源模型(如 Llama 4 Maverick)以及企业级模型(如 Cohere Command A)。在价格方面,它也优于 DeepSeek V3 等低价模型,无论是在 API 使用还是自部署系统方面都更具优势。"官方表示。 据介绍,M ...
AI 创业者演示视频被骂上 x 热榜,背后 YC 赶紧删帖!实名吐槽:YC 就是一堆 B2B 企业互相推销产品!
AI前线· 2025-05-07 03:31
作者 | 褚杏娟 美国著名创业孵化器 Y Combinator (YC)正在孵化的 AI 创业公司 Optifye.ai 最近的一个展示视频在社交媒体上引发了强烈反响,Y Combinator 将其 从社交媒体平台上删除。 视频中,Optifye 联合创始人库沙尔·莫赫塔(Kushal Mohta)扮演成一家服装厂的老板,并在给一位主管打电话,这位主管实际上是另一位联合创始人 维万·拜德(Vivaan Baid)扮演的,他们在讨论一位仅被称为"17 号"的低效员工。 "嘿,17 号,怎么回事?你现在的表现很差,"拜德询问该员工,员工回应称自己全天都在工作。"全天工作?你连一小时标准产量都没达到,效率只有 11.4%。这实在太糟糕了,"拜德反驳道。 根据介绍,Kushal 和 Vivaan 是杜克大学计算机科学专业的毕业生。"由于我们家族经营着制造公司,所以我们比大多数工业工程师见到过更多生产线上 的情况!"两人说道。 "车间是一个黑盒子。以前从未有过准确衡量车间表现的方法。车间也人手不足,平均每位主管要负责管理 50 多名工人。公司很难提升效率,因为他们 无法确定问题的根源。"因此,"我们在生产线上安装摄像头 ...
碾压Cursor?谷歌突发Gemini 2.5 Pro 预览版,编码能力全网第一
AI前线· 2025-05-07 03:31
整理|冬梅、核子可乐 I/O 前夕,谷歌突发 Gemini 2.5 Pro 预览版 昨晚,谷歌在 I/O 大会之前宣布推出 Gemini 2.5 Pro Preview(I/O 版)。作为其旗舰产品 Gemini 2.5 Pro AI 模型的升级版本,搜索巨头宣称该模型在多项主流基准测试中均名列前茅。 Gemini 2.5 Pro Preview(I/O 版)可通过 Gemini API 以及谷歌的 Vertex AI 与 AI Studio 平台获取, 价格则与升级前的 Gemini 2.5 Pro 模型相同。预览版也被引入到谷歌的 Gemini 聊天机器人应用当 中,主要供 Web 及移动设备端使用。 谷歌 DeepMind CEO Demis Hassabis 在 X 上发帖称:"非常高兴能与大家分享我们迄今为止构建的 最佳编程模型!今天,我们发布了 Gemini 2.5 Pro Preview 的'I/O 版',其编程能力得到了大幅提 升。 此版本在 LMArena 编程类别中排名第一,在 WebDev Arena 排行榜上同样拔得头筹 。" 这套模型的发布正值谷歌年度 I/O 开发者大会(因此得名「 ...