智能体

Search documents
大模型角力视觉推理,推理AI新时代来临
2 1 Shi Ji Jing Ji Bao Dao· 2025-07-03 05:11
输入一个PPT,自动生成汇报内容、演讲稿;输入一段"苏超"视频,得到一段足球解说……如今的大语 言模型不只会看文字,还会看图片、视频。 7月2日,智谱发布并开源视觉语言大模型GLM-4.1V-Thinking。这款通用推理型大模型支持图像、视 频、文档等多模态输入,可用于复杂认知任务。 "就像人一样。眼睛看到了复杂的视觉信号,不光是简单的信号接收,还可以根据视觉信号进一步推 理,理解复杂的物理世界。"在现场演示时,智谱CEO张鹏介绍道,智谱基于预训练构造了视觉理解模 型,监督微调使其初步具备推理能力,再基于深度学习大幅提高推理能力,在业内首次把推理能力和视 觉理解能力有机结合在一起。 人类不仅希望AI能思考,还希望AI能执行——通过自主智能体的方式,现有的大模型能力能转化成真 正的生产力。 此前,大模型可以用于代码生成;而视觉推理能力使得AI能够"看懂"和"理解"视觉信息,比如用户界面 (UI)的设计图、原型图甚至屏幕截图,可以辅助产品经理生成代码重构用户界面。 "视觉推理能力还可以用于智能体,让它理解GUI(图形用户界面),比如理解手机、PC上复杂的用户 操作界面,形成精准的操作逻辑。"据张鹏介绍,GLM- ...
300750,持续拉升,成交额A股第一
新华网财经· 2025-07-03 04:44
板块继续轮动。 今天上午,创新药、消费电子等板块迎来反弹,昨天表现活跃的顺周期主线回调,光伏、煤炭等板块下 跌。 创业板指上午走势强劲,第一权重股宁德时代(300750)上午持续拉升,上涨3.9%,成交额为53.89亿 元,居A股第一。 宁德时代7月2日晚公告称,截至6月30日,公司通过深圳证券交易所股票交易系统以 集中竞价交易方式累计回购公司A股股份6640986股,占公司当前A股总股本的0.1508%,最高成交价为 237.38元/股,最低成交价为231.50元/股,成交总金额为人民币1550809971.05元(不含交易费用)。 "马"概念股又上涨,同花顺数据显示,A股共有28只个股名字中含有"马"字,今天上午,其中25只个股 上涨,威马农机、云中马、玉马科技等个股大涨。 截至上午收盘,上证指数上涨0.07%,深证成指上涨0.75%,创业板指上涨1.36%。 消费电子概念反弹 | 塞力医疗 | 19.16 | 9.99% | 36.6亿 | | --- | --- | --- | --- | | 603716 | | | | | 3天3板 人气龙头2 最终涨停 09:34 | | | | | 汇宇制药- ...
印度小哥简历90%造假,还身兼数职,干翻硅谷一圈AI创业公司
机器之心· 2025-07-03 04:14
机器之心报道 编辑:泽南、何欣东 这回不止奥特曼一个人头大了。 我们知道大模型时代,最稀缺的资源是人才。 本周四,半个硅谷的 CEO 都在讨论一个名为 Soham Parekh 的人才,不过不是因为他 AI 技术出众,而是因为他另一方面的「身怀绝技」。 事情的爆发是在 7 月 2 日,有一个 AI 创业公司 PlayGround 的创始人发推通知大家避雷: 该公司的创始人 Suhail Doshi 此前招募了一位名叫 Soham Parekh 的印度小哥来当工程师,结果发现他工作能力并不如意,还身兼数职,遂决定将其开除。没想到 这段一年前的经历只是 Soham Parekh 神奇事迹一个小小的节点。 Soham Parekh 是谁?作为用人单位,Suhail Doshi 贴出了 Soham 提供的简历,一看水平还挺高,佐治亚理工 CS 硕士毕业,曾在不少创业公司工作。 Suhail 估计其中的内容 90% 是假的,而且其中大多数链接都失效了。 另外工作地点也是假的。PlayGround 公司在雇佣 Soham Parekh 以后,曾以为他们在美国招到了人,还给他提供的假地址寄去了笔记本电脑,结果被原路退回。当 ...
Meta-Think ≠ 记套路,多智能体强化学习解锁大模型元思考泛化
机器之心· 2025-07-03 03:26
本文第一作者为上海交通大学计算机科学四年级博士生万梓煜,主要研究方向为强化学习、基础模型的复杂推理,通讯作者为上海交通大学人工智能学院温颖副 教授和上海人工智能实验室胡舒悦老师。团队其他成员包括来自英属哥伦比亚大学的共同第一作者李云想、Mark Schmidt 教授,伦敦大学学院的宋研、杨林易和 汪军教授,上海交通大学的温潇雨,王翰竟和张伟楠教授。 引言 最近,关于大模型推理的测试时间扩展(Test time scaling law )的探索不断涌现出新的范式,包括① 结构化搜索结(如 MCTS),② 过程奖励模型(Process Reward Model )+ PPO,③ 可验证奖励 (Verifiable Reward)+ GRPO(DeepSeekR1)。然而,大模型何时产生 "顿悟(AhaMoment)" 的机理仍未明晰。近期多 项研究提出推理模式(reasoning pattern)对于推理能力的重要作用。类似的,本研究认为 大模型复杂推理的能力强弱本质在于元思维能力的强弱。 所谓 "元思维" (meta-thinking),即监控、评估和控制自身的推理过程,以实现更具适应性和有效性的问题解决,是智 ...
融资6亿美元,诺贝尔奖团队开发AI制药大模型
3 6 Ke· 2025-07-03 01:22
互联网之父蒂姆·伯纳斯·李曾评价他是"地球上最聪明的人"。 4岁学棋、7岁学习编程、16岁考入剑桥计算机科学系、22岁创办游戏公司、而立之年回归学术攻读认知神经科学博士学位,而后创办DeepMind,开发AI 程序AlphaGo击败围棋世界冠军、研发AlphaFold破解蛋白质结构预测难题并荣获2024年诺贝尔化学奖,成为世界AI领域第一人。 Demis Hassabis图源Isomorphic Labs官网 对于Demis Hassabis而言,他的人生经历丰富且成果显著。2021年,他将视线转向医药研发领域,创立了Isomorphic Labs,这是一家专注AI药物研发的初 创公司,依托AlphaFold的技术成果建立。Hassabis希望通过人工智能改进药物研发流程,推动生物医学领域的发展。 自创立以来,Isomorphic Labs开发出多个新一代AI模型,这些模型共同构成统一的AI药物设计引擎,可应用于多个治疗领域和药物模式。近期, Isomorphic Labs宣布获得6亿美元融资,由Thrive Capital领投,GV和Alphabet参投,将用于进一步开发其下一代AI药物设计引擎,并推动治疗 ...
智能体不断进化,协作风险升高:五大安全问题扫描
2 1 Shi Ji Jing Ji Bao Dao· 2025-07-03 00:36
Core Insights - The year 2025 is anticipated to be the "Year of Intelligent Agents," marking a paradigm shift in AI development from conversational generation to automated execution, positioning intelligent agents as key commercial anchors and the next generation of human-computer interaction [1] Group 1: Development and Risks of Intelligent Agents - As intelligent agents approach practical application, the associated risks become more tangible, with concerns about overreach, boundary violations, and potential loss of control [2] - A consensus exists within the industry that the controllability and trustworthiness of intelligent agents are critical metrics, with safety and compliance issues widely recognized as significant [2] - Risks associated with intelligent agents are categorized into internal and external security threats, with internal risks stemming from vulnerabilities in core components and external risks arising from interactions with external protocols and environments [2] Group 2: AI Hallucinations and Decision Errors - Over 70% of respondents in a safety awareness survey expressed concerns about AI hallucinations and erroneous decision-making, highlighting the prevalence of factual inaccuracies in AI-generated content [2] - In high-risk sectors like healthcare and finance, AI hallucinations could lead to severe consequences, exemplified by a hypothetical 3% misdiagnosis rate in a medical diagnostic agent potentially resulting in hundreds of thousands of misdiagnoses among millions of users [2] Group 3: Practical Applications and Challenges - Many enterprises have found that intelligent agents currently struggle to reliably address hallucination issues, leading some to abandon AI solutions due to inconsistent performance [3] - A notable case involved Air Canada's AI customer service, which provided incorrect refund information, resulting in the company being held legally accountable for the AI's erroneous decision [3] Group 4: Technical Frameworks and Regulations - Intelligent agents utilize various technical bridges to connect with the external world, employing two primary technical routes: an "intent framework" based on API cooperation and a "visual route" that bypasses interface authorization barriers [4] - Recent evaluations have highlighted chaotic usage of accessibility permissions by mobile intelligent agents, raising significant security concerns [5] Group 5: Regulatory Developments - A series of standards and initiatives have emerged in 2024 aimed at enhancing the management of accessibility permissions for intelligent agents, emphasizing user consent and risk disclosure [6] - The standards, while not mandatory, reflect a growing recognition of the need for safety in the deployment of intelligent agents [6] Group 6: Security Risks and Injection Attacks - Prompt injection attacks represent a core security risk for all intelligent agents, where attackers manipulate input prompts to induce the AI to produce desired outputs [7][8] - The emergence of indirect prompt injection risks, particularly with the rise of MCP (Multi-Channel Protocol) tools, poses new challenges as attackers can embed malicious instructions in external data sources [8][9] Group 7: MCP Services and Security Challenges - The MCP service Fetch has been identified as a significant entry point for indirect prompt injection attacks, raising concerns about the security of external content accessed by intelligent agents [10] - The lack of standardized security certifications for MCP services complicates the assessment of their safety, with many platforms lacking rigorous review processes [11] Group 8: Future of Intelligent Agent Collaboration - The development of multi-agent collaboration mechanisms is seen as crucial for the practical deployment of AI, with various companies exploring the potential for intelligent agents to work together on tasks [12][13] - The establishment of the IIFAA Agent Security Link aims to provide a secure framework for collaboration among intelligent agents, addressing issues of permissions, data, and privacy [14]
“人工智能+”重塑制造业竞争优势
Jing Ji Ri Bao· 2025-07-02 22:41
人工智能是引领新一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的"头雁"效应。习近平 总书记对人工智能和制造业发展作出重要论述,强调"要以智能制造为主攻方向推动产业技术变革和优 化升级""推动人工智能科技创新与产业创新深度融合"。近年来,人工智能技术出现重大突破,作为典 型通用目的技术的赋能作用进一步增强,中央明确提出开展和持续推进"人工智能+"行动。我国制造业 面临着国内生产要素成本上涨,国际上贸易战、科技战等进一步推高出口成本、加大供应链中断风险等 挑战。推进"人工智能+"行动,能够重组制造业生产要素、产品架构、生产流程和供应链,使其在生产 效率、产品性能、商业模式、价值链地位等方面实现重大飞跃,保持和增强全球竞争力。 认清产业发展现状和趋势 制造业是国民经济的重要支柱。当前,人工智能与机器人技术正以前所未有的速度重塑生产逻辑,推动 制造业加速步入"智造时代"。这既是技术赋能的必然要求,也是制造业本身发展的大势所趋。 先看制造业发展的现状。改革开放以来,我国制造业在国际市场上形成了低成本竞争优势。在初期,低 成本优势主要来源于丰富且工资水平低的劳动力供给,通过积极参与全球产业链垂直分工,在服装、玩 ...
大摩闭门会:金融、稀土、宁德时代最新情况更新
2025-07-02 15:49
各位上午好今天是7月2号欢迎来到摩根史丹利每周三的周期论剑的在线直播我是张蕾Rachel基础创业行业的分析师今天的话我们主要讨论三个主题一个呢是请我们金融行业的首席区然会聊一下从5月的工业数据 来看一下工业贷款的风险然后接着呢我们这个能源电池行业的分析师呃那个吕洪良会聊一下对明德时代布局人工智能领域的一些思考然后最后呢我会聊一下就是海外的这个对稀土去中国化的一些布局呃那开始之前呢我先例行读一个disclaimer请注意本次会议仅面向摩根士丹利的机构客户以及财务顾问本会议不对媒体开放如果您来自媒体的话呢敬请退出会议 同时我们看到税率确实在四月末和五月初已经见顶我们现在看来从现在的新闻看来它也不会回到这么差的一个情况 还有呢就是我们对这个EB的这个利息覆盖倍数呢也进行了分析它虽然也有比上个月呢有所恶化但总体来讲呢还是处在大部分的行业处在相当健康的区间也就是说这么短的一个放缓我们觉得不会对这个整个的这个工业体系的还本付息的能力造成大的影响尤其是如果中美贸易摩擦基本上六月份七月份回到一个正常的一个状态 同时我们也看到其实在5月份有更多的行业放缓了投资增速73.5%的行业在5月份比去年上半年放缓了投资增速这个数字一直还 ...
Devin Coding Agent提效80%指南:把AI当初级开发者 | Jinqiu Select
锦秋集· 2025-07-02 12:56
Core Insights - The article emphasizes treating AI as a junior developer that requires clear guidance rather than a magical tool, highlighting the importance of effective communication with programming agents [1][8][9]. Group 1: Key Methods for Effective Use - Clear Instructions: Specificity in commands is crucial, such as detailing which functionalities to test rather than vague requests [3][16][18]. - Reasonable Expectations: Large tasks cannot be fully automated, but can save approximately 80% of time; checkpoints should be established for planning, implementation, testing, and review [3][27]. - Continuous Validation: Providing a complete CI/testing environment allows agents to discover and correct errors independently [3][19][33]. Group 2: Daily Usage Tips - Instant Delegation: Quickly assign tasks to agents when urgent requests arise [5][21]. - Mobile Handling: Use mobile devices to address urgent bugs while on the go [5][23]. - Parallel Decision-Making: Allow agents to implement multiple architectural solutions simultaneously for better decision-making [5][25]. Group 3: Advanced Applications - Automate Repetitive Tasks: Create templates for recurring tasks to enhance efficiency [5][35]. - Intelligent Code Review: Utilize agents for precise code reviews based on a maintained list of common errors [5][36]. - Event-Driven Responses: Set up agents to automatically respond to specific events, such as alerts [5][37]. Group 4: Practical Considerations - Understanding Limitations: Agents have limited debugging capabilities and should not be expected to resolve complex issues independently [42][43]. - Time Management: Learn to recognize when to stop ineffective attempts and start anew with clearer instructions [46][49]. - Isolated Environments: Agents should operate in isolated testing environments to prevent unintended consequences in production [51][52]. Group 5: Future Outlook - The value of software engineers remains significant despite advancements in programming agents; deep technical knowledge and understanding of codebases are essential [53].
从代码生成到信贷风控 AI加速重构金融价值链
Xin Hua Cai Jing· 2025-07-02 12:19
信贷尽调从数月压缩至2小时、风险预警时效提升80%……这些曾被视为"未来场景"的变革,正在2025 年的金融业加速落地。随着DeepSeek等国产大模型爆发式迭代,AI Agent已不再是实验室概念,成为驱 动效率与创新的核心引擎。 业内人士认为,多智能体架构成为大模型落地的主要形式,能适配金融复杂业务场景的动态需求,已在 信贷业务的效率提升、风险研判及交互智能化方面展现出较大潜力。在AI重构金融价值链的进程中, 懂业务的技术者与懂技术的业务者,才能赢得"人机共舞"的主导权。 AI赋能流程改造势不可挡 随着大型语言模型(LLM)能力的指数级跃升与多智能体协作技术的突破性进展,2025年正被全球金 融科技界公认为"AI Agent元年"。这股浪潮正以前所未有的深度和广度冲击着金融行业的每一个角落, 推动着从后台运营到前台决策的全链条智能化革命。 "尽管这一概念已被提及多年,但今年我们真正在行业实践中感受到了它的落地,无论是身边的合作案 例、自身团队的探索,还是竞争对手的动态,都印证了Agent技术已从概念走向实操。"OpenCSG联合创 始人、CTO王伟说。 "AIGC推动金融行业软件研发工艺升级是必然趋势,这 ...