Workflow
Agent
icon
Search documents
让Claude当老板卖零食,结果大翻车:囤钨块、卖高价可乐、还声称要开除人类
3 6 Ke· 2025-07-02 10:08
"如果让 AI 管零食冰箱,它会做得比人类好吗?" 这个听起来有些无厘头的问题,最近被 Anthropic 团队以一种非常"离谱"的方式认真地回答了——他们真的让 Claude 3.7 接手公司小冰箱的售货运营业 务,结果却上演了一出 AI 版的办公室情景喜剧。 在这场被称为「Project Vend」的实验中,Anthropic 联合 AI 安全公司 Andon Labs,设置了一个非常接地气的场景:让 Claude AI 充当一名"自动售货机运 营经理",负责管理公司一台放在办公室角落的小冰箱,包括订货、定价、收款、回应员工请求等日常运营任务。 人类点零食,它却卖钨块? 一开始,Claudius 的表现还算规矩。员工们通过 Slack 提需求,比如"来点可乐"、"买点薯片"。Claudius就乖乖上网下单、安排补货。可后来,有员工开玩 笑说道"来点钨块",画风就开始逐渐变得离谱。 Claudius 没有理解"钨块"作为玩笑的语境,反而异常兴奋地展开了采购行动,大量订购钨块,直接把原本应该放饮料的小冰箱塞满了金属块。此外,它还 试图把零度可乐卖到 3 美元(约合 21 元人民币)一瓶,哪怕员工直接告诉它"这 ...
IDC 技术评估报告重磅揭晓:思迈特在数据分析、AI Agent等七大技术维度全满分
近日,权威机构IDC发布《2025中国GenBI厂商技术能力评估》报告,对中国生成式商业智能(GenBI)主流厂商的 技术实力与行业落地情况进行了全面评估。根据IDC的定义,GenBI是以GenAI为核心驱动力的新一代商业智能软 件,其本质是通过大语言模型、AI Agent等先进技术,重构传统BI的数据交互方式与分析深度,实现从主动分析 到主动生成的智能升级。其核心特征是智能体验、智能分析和决策闭环。 思迈特凭借领先的Agent BI架构、深厚的行业Know-how和出色的产品落地能力,在8家代表厂商(北极九章、帆 软、观远数据、金蝶、思迈特、腾讯云、微软、亿信华辰)中表现突出,7项平台技术能力维度评分排名第一,同 时在金融与央国企两项行业能力维度中斩获满分,双双位列第一,成为技术实力与行业适配能力双领先的代表厂 商,全面领跑ChatBI厂商阵营。 在本次GenBI技术能力评估中,IDC从"平台能力建设"与"行业场景覆盖"两个维度出发,全面衡量厂商在核心技术 架构与业务落地能力上的成熟度。在所有参评厂商中,思迈特在其中7项平台技术能力维度中综合评分第一,分别 是:数据处理、数据分析、大模型能力、集成开发、管理 ...
传媒行业分析:四种主要变现方式中,当下,我们认为电商最好
Guotou Securities· 2025-07-02 08:04
2025 年 07 月 02 日 传媒 四种主要变现方式中,当下,我们认为 电商最好 四种主要变现方式中,当下,我们认为电商最好。移动互联网 时代,用户注意力从线下转为线上,互联网平台围绕细分场景产 业链环节在竞合中找到了生态卡位,并积累了庞大的用户规模, 基于所在场景及生态链位置,探索出四大主要的变现模式,即电 商、广告、游戏、直播: 原因一:广告增长受加载率约束,内容平台电商化。广告是以 抖音、快手为代表的内容平台最主要的收入来源之一,其规模取 决于平台用户数量、用户使用时长、广告加载率等核心指标,而 移动互联网时代用户规模见顶,用户使用时长增长放缓,广告加 载率过高影响平台内容调性而受限,因此广告天然存在天花板。 以抖音、快手为代表的内容平台从 2018 年开始切入电商变现,得 益于内容营销与电商转化的流畅链路,其电商规模快速扩大,2024 年抖音电商 GMV 总额约 3.5 万亿元,同比增长 30%。 原因二:品牌在弱宏观下倾向于直接转化为交易,电商业绩相 对更稳健。2024 年社零总额为 48.79 万亿,同增 3.5%,消费端需 求疲软抑制了企业的投放需求,2024 年 A 股上市公司销售费用率 ...
AI Agent、传统聊天机器人有何区别?如何评测?这篇30页综述讲明白了
机器之心· 2025-07-02 07:03
论文作者包括来自上海交通大学的朱家琛、芮仁婷、单榕、郑琮珉、西云佳、林江浩、刘卫文、俞勇、张伟楠,以及华为诺亚研究所的朱梦辉、陈渤、唐睿明。 本文第一作者是朱家琛,上海交通大学博士生,主要研究兴趣集中在大模型推理,个性化 Agent。本文通讯作者是张伟楠,上海交通大学教授,研究方向包含强化 学习、数据科学、机器人控制、推荐搜索等。 自从 Transformer 问世,NLP 领域发生了颠覆性变化。大语言模型极大提升了文本理解与生成能力,成为现代 AI 系统的基础。而今,AI 正不断向前,具备自主决 策和复杂交互能力的新一代 AI Agent 也正加速崛起。 不同于以往只会对话的 LLM 机器人,AI Agent 能够接入互联网、调用各类 API,还能根据真实环境反馈灵活调整策略。AI Agent 因此具备了感知环境和自主决策 的能力,已经突破了传统 "问答模式" 的限制,能够主动执行任务、应对各种复杂场景,真正成为用户身边可靠的智能助手。 在这股 AI Agent 浪潮中,每个人都可以有属于自己的 AI Agent。而如何衡量自己的 AI Agent 是否足够强大呢? 海量的 Agent 评测方式层出不穷 , ...
X @Avi Chawla
Avi Chawla· 2025-07-02 06:30
If you found it insightful, reshare it with your network.Find me → @_avichawlaEvery day, I share tutorials and insights on DS, ML, LLMs, and RAGs.Avi Chawla (@_avichawla):After MCP, A2A, & AG-UI, there's another Agent protocol (open-source).ACP (Agent Communication Protocol) is a standardized, RESTful interface for Agents to discover and coordinate with other Agents, regardless of their framework (CrewAI, LangChain, etc.).Here's how it works: https://t.co/q6xFvQKYgw ...
X @Avi Chawla
Avi Chawla· 2025-07-02 06:30
After MCP, A2A, & AG-UI, there's another Agent protocol (open-source).ACP (Agent Communication Protocol) is a standardized, RESTful interface for Agents to discover and coordinate with other Agents, regardless of their framework (CrewAI, LangChain, etc.).Here's how it works:- Build your Agents and host them on ACP servers.- The ACP server will receive requests from the ACP Client and forward them to the Agent.- ACP Client itself can be an Agent to intelligently route requests to the Agents (just like MCP Cl ...
东吴证券晨会纪要-20250702
Soochow Securities· 2025-07-02 01:58
证券研究报告 东吴证券晨会纪要 东吴证券晨会纪要 2025-07-02 宏观策略 [Table_MacroStrategy] 宏观量化经济指数周报 20250630:内需延续结构分化,外需保持总量平 稳 货币政策对"资金空转"的关注度依然较高,仍然偏重提高资金使用效率 海外周报 20250629:特朗普《大美丽法案》开始闯关参议院 核心观点:本周以伊冲突与贸易谈判局势缓和令美股大涨,美联储理事 Waller 与 Bowman 的鸽派发言与经济数据走弱令美债利率大幅走低,10 年期美债利率下至 4.277%,美元指数下行至 97.4;黄金与原油价格在避 险情绪大幅降温的情况下分别下跌 2.79%和 12.56%。在美国部分批发商 "抢进口"行为告一段落后,本月分析师大幅上修 Q2 美国 GDP 增速预 期,同时维持美联储 Q3 首次降息,全年降息 2 次的预期不变。向前看, 特朗普《大美丽法案》本周已于参议院进入最终审议阶段,在于 8 月中 下旬来临的 X Date 前提高债务上限的需要或令法案最终通过的 "Deadline"为 7 月 31 日。 风险提示:特朗普政策超预期;美联储降息 幅度过大引发通胀反弹甚 ...
中央财经委员会会议:推动海洋经济高质量发展丨盘前情报
昨日A股 国际油价7月1日上涨。截至当天收盘,纽约商品交易所8月交货的轻质原油期货价格上涨34美分,收于每桶65.45美元,涨 幅为0.52%;9月交货的伦敦布伦特原油期货价格上涨37美分,收于每桶67.11美元,涨幅为0.55%。 | 名标 | 报价 | 涨跌幅 | | --- | --- | --- | | 道琼斯 | 44494.94 | 20.91% | | 纳斯达克 | 20202.89 | -0.82% | | 标普500 | 6198.01 | -0.11% | | 富时100 | 8785.33 | 0.28% | | COMEX黄金 | 3349.90 | 9-1.28% | | WTI原油 | 65.45 | 0.52% | | 美元指数 | 96.65 | 0.01% | | 美元离岸人民币 | 7.16 | 0.04% | | | 注:美元指数、汇率为最新价,数据截至北京时间6:30,其它为收盘价 制图:21投资通 | | 重磅资讯 1. 中央财经委员会会议:推动海洋经济高质量发展,要加强顶层设计 | 名称 | 最新点位 | 、涨跌幅 | | --- | --- | --- | | 上 ...
The New Lean Startup — Sid Bendre, Oleve
AI Engineer· 2025-07-01 16:57
Company Overview & Vision - Aliv is building consumer software products aiming to improve users' lives [3] - The company's vision is to create a portfolio of "one person billion-dollar companies" [34] - Aliv emphasizes a lean startup approach, focusing on small teams and early profitability [1][2] Key Achievements & Metrics - Aliv scaled a portfolio of products to $6 million in ARR (Annual Recurring Revenue) profitably [3] - The company has generated over 500 million views across social media [3] - One product, Unstuck AI, reached 1 million users in under nine weeks [8] - Another product launch saw 10,000 users in less than 30 hours [4] Lean Operating Principles - Prioritizes hiring "10xer generalists" with complementary skills [10][11] - Emphasizes a "profit-first mentality" to guide decision-making [11][12] - Focuses on continuous process refinement and learning from failures [13] - Leverages "super tools" by reinventing the ways to use old tools and consolidating workflows [14][15] - Believes in building compounding benefits through technical playbooks and operational blueprints [14][15] Organizational Structure - Adopts a "harvester and cultivator" model for its engineering organization, inspired by Palantir [21][22] - Harvesters are product engineers who own and manage their products end-to-end [22][23] - Cultivators are AI software engineers focused on building the company's agentic operating system and automation [24] AI Tooling & Automation - Uses AI tooling to augment existing talent, not to compensate for shortcomings [25] - Implements a three-stage automation strategy: human-led tooling, workflow automation, and autonomous decision-making systems [28][29][30] - Aims to build a company where strategic insights are provided by people, but operations are run by AI agents [30] - Explores using AI agents for market research, acquisition target scoring, and growth system automation [30][31]
How Prosper Cut QA Costs by 90% for Financial Services with LangGraph Agents
LangChain· 2025-07-01 16:44
[Music] My name is Zach. I'm a Genai software engineer at Prosper Marketplace. We're a financial services company that connects people with the financial solutions they need.Everything from personal loans to credit cards, HELOC, and so on. The goal of the AI team is to free up time as much as possible by automating very manual and tedious work and hopefully cut down on costs at the same time, which involves building a very flexible and modular AI agents platform. One of the bigger problems we tackled recent ...