Workflow
QWen2.5
icon
Search documents
拥抱AI!证券业82位CIO掌舵数字化转型,“拼烧钱”转向“算效益”
Xin Lang Cai Jing· 2025-07-11 07:14
炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 智通财经记者 | 陈靖 金融科技已成为证券行业发展的重要驱动力。 近期,东海证券发布首席信息官(CIO)招聘公告、星展证券原CIO李洋加盟野村东方国际证券拟任CIO,再度将市场 目光聚焦于券商首席信息官这一关键岗位的变动情况。 据智通财经不完全梳理,2025年以来,券商行业高管变动频繁,CIO岗位也不例外,截至目前,至少已有10余家券商的 CIO发生了更替。 从变动券商的具体情况来看,中信证券(600030.SH)于2月19日聘任于新利担任公司首席信息官,方兴不再担任该 职。于新利自1999年加入中信证券,现任公司信息技术中心行政负责人,其履历横跨经纪、研究等多领域,是综合金融 领域的"多面手"。兴业证券(601377.SH)的蒋剑飞同样是从内部提拔,他历任信息技术中心总监、副总经理,数智金 融部总经理等管理岗。有业内人士指出,这种内部任命的方式,体现出券商对人才技术与业务管理复合能力的重视,期 望CIO能更好地将信息技术融入业务流程,实现从"被动适配"到"主动赋能"的转变。 并购重组与股权变更也促使了部分券商CIO的新任命。6月6日, ...
AI日报丨五大投行集体唱多美股!“科技七巨头”扛起盈利大旗
美股研究社· 2025-07-09 11:25
在这个快速变化的时代,人工智能技术正以前所未有的速度发展,带来了广泛的机会 。 《AI日 报 》致力于挖掘和分析最新的AI概念股公司和市场趋势,为您提供深度的行 业 洞察和价 值 分 析。 整理 | 美股研究社 A I 快 报 1. 今天凌晨,全球著名大模型开放平台Hugging Face开源了 ,顶级小参数模型SmolLM3。 SmolLM3只有30亿参数,性能却大幅度超过了Llama-3.2-3B 、Qwen2.5-3B等同类开源模型。 拥有128k上下文窗口,支持英语、法语、西班牙语、德语等6种语言。支持深度思考和非思考双 推理模式,用户可以灵活切换。 2. 周二(7月8日),美国科技股七巨头(Magnificent 7)指数跌0.07%,报173.55点。 特斯拉反弹1.32%——马斯克创立"美国党"后该公司市值在周一蒸发680亿美元,英伟达涨 1.12%,Meta Platforms和被扎克伯格挖走AI模型高管的苹果至多涨0.32%,微软则收跌 0.22%,谷歌A跌1.37%,亚马逊在Prime Day会员日跌1.84%。 此外,AMD收涨2.24%,礼来制药涨0.62%,巴菲特旗下伯克希尔哈撒韦B ...
突破全模态AI理解边界:引入上下文强化学习,赋能全模态模型“意图”推理新高度
量子位· 2025-07-08 07:30
HumanOmniV2团队 投稿 量子位 | 公众号 QbitAI 在多模态大语言模型(MLLMs)应用日益多元化的今天,对模型深度理解和分析人类意图的需求愈发迫切。尽管强化学习(RL) 在增强大语言模型(LLMs)的推理能力方面已展现出巨大潜力,但将其有效应用于复杂的多模态数据和格式仍面临诸多挑战。 在深入研究现有技术后,发现在当前多模态推理模型中发现现有的推理路径存在两大核心问题:全局上下文理解不足和捷径问题。 全局上下文理解不足: 当模型无法准确识别或错误解读多模态证据和上下文信息时,便会出现此问题,导致给出不正确的答案。 捷径问题: 指模型在处理多模态输入时,忽视了关键线索,未充分考量多模态信息就直接给出答案,从而导致次优或片面的结果 为彻底解决这些痛点,阿里巴巴通义实验室团队推出 HumanOmniV2 ,强调模型必须在对多模态输入 全局上下文有清晰理解 的 基础上进行推理。这种全局性理解能够有效避免模型遗漏关键多模态线索,确保推理过程的全面性和深入性。 相关代码、模型、数据都开源,地址可在文末获取。 效果展示 问题:这两个人是什么关系? A. 他们想引起人们对该产品的关注。 B. 这两个人是商业伙 ...
Meta-Think ≠ 记套路,多智能体强化学习解锁大模型元思考泛化
机器之心· 2025-07-03 03:26
本文第一作者为上海交通大学计算机科学四年级博士生万梓煜,主要研究方向为强化学习、基础模型的复杂推理,通讯作者为上海交通大学人工智能学院温颖副 教授和上海人工智能实验室胡舒悦老师。团队其他成员包括来自英属哥伦比亚大学的共同第一作者李云想、Mark Schmidt 教授,伦敦大学学院的宋研、杨林易和 汪军教授,上海交通大学的温潇雨,王翰竟和张伟楠教授。 引言 最近,关于大模型推理的测试时间扩展(Test time scaling law )的探索不断涌现出新的范式,包括① 结构化搜索结(如 MCTS),② 过程奖励模型(Process Reward Model )+ PPO,③ 可验证奖励 (Verifiable Reward)+ GRPO(DeepSeekR1)。然而,大模型何时产生 "顿悟(AhaMoment)" 的机理仍未明晰。近期多 项研究提出推理模式(reasoning pattern)对于推理能力的重要作用。类似的,本研究认为 大模型复杂推理的能力强弱本质在于元思维能力的强弱。 所谓 "元思维" (meta-thinking),即监控、评估和控制自身的推理过程,以实现更具适应性和有效性的问题解决,是智 ...
CVPR2025 WAD纯视觉端到端 | 冠军方案技术报告~
自动驾驶之心· 2025-06-29 11:33
作者 | Zh.ai 编辑 | 自动驾驶之心 原文链接: https://zhuanlan.zhihu.com/p/1920858767987308475 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 WAD前五名 纯视觉端到端驾驶比赛前五名,第一名Poutine(截至2025.6.25) 技术报告: 比赛第一名方案: Poutine Vision-Language-Trajectory Pre-Training and Reinforcement Learning Post-Training Enable Robust End- to-End Autonomous Driving 技术摘要: 1. 主体是3B参数VLM,解决视觉端到端自动驾驶长尾场景; 大模型预刷生产annotations 2. 两阶段训练: 技术方案: a. 阶段一预训练。自监督,vision- language- trajectory,next-token prediction方式,训练数据8 ...
AI 开始「自由玩电脑」了!吉大提出「屏幕探索者」智能体
机器之心· 2025-06-27 04:02
近期,吉林大学人工智能学院发布了一项基于强化学习训练的 VLM 智能体最新研究《ScreenExplorer: Training a Vision-Language Model for Diverse Exploration in Open GUI World》。它让视觉语言模型(VLM)真正学会了「自我探索 GUI 环境」。 论文地址:https://arxiv.org/abs/2505.19095 项目地址:https://github.com/niuzaisheng/ScreenExplorer 该工作带来三大核心突破: 作者简介:本文第一作者牛润良是吉林大学人工智能学院博士研究生,研究方向包括大模型智能体、强化学习,专注于 GUI Agent。通讯作者王琪为吉林大学人 工智能学院研究员,研究方向包括数据挖掘、大模型、强化学习。 迈向通用人工智能(AGI)的核心目标之一就是打造能在开放世界中自主探索并持续交互的智能体。随着大语言模型(LLMs)和视觉语言模型(VLMs)的飞速发 展,智能体已展现出令人瞩目的跨领域任务泛化能力。 而在我们触手可及的开放世界环境中,图形用户界面(GUI)无疑是人机交互最普遍 ...
突破通用领域推理的瓶颈!清华NLP实验室强化学习新研究RLPR
机器之心· 2025-06-27 00:49
余天予,清华大学计算机系一年级博士生,导师为清华大学自然语言处理实验室刘知远副教授。研究兴 趣主要包括高效多模态大模型、多模态大模型对齐和强化学习,在 CVPR、AAAI等人工智能领域的著 名国际会议和期刊发表多篇学术论文,谷歌学术引用1000余次。 Deepseek 的 R1、OpenAI 的 o1/o3 等推理模型的出色表现充分展现了 RLVR(Reinforcement Learning with Verifiable Reward,基于可验证奖励的强化学习)的巨大潜力。 然而,现有方法的应用范围局限于数学和代码等少数领域。面对自然语言固有的丰富多样性,依赖规则 验证器的方法难以拓展到通用领域上。 针对这一关键挑战,清华大学自然语言处理实验室提出了一项关键性技术 —— 基于参考概率奖励的强 化学习(Reinforcement Learning with Reference Probability Reward, RLPR )。 这项技术通过 Prob-to-Reward 方法显著提高了概率奖励(Probability-based Reward, PR)的质 量,相比基于似然度的基线方法取得了明显更佳的性 ...
RoboSense 2025 机器感知挑战赛正式启动
具身智能之心· 2025-06-25 13:52
面向现实世界的机器人感知评测任务,五大赛道,全链路挑战,全球征集解决方案! 为什么需要 RoboSense? 在机器人系统不断迈向真实世界的进程中,感知系统的稳定性、鲁棒性与泛化能力正成为制约其部署能力 的关键因素。面对动态人群、恶劣天气、传感器故障、跨平台部署等复杂环境条件,传统感知算法往往面 临性能大幅下降的挑战。 为此, RoboSense Challenge 2025 应运而生。该挑战赛旨在系统性评估机器人在真实场景下的感知与理解 能力,推动多模态感知模型的稳健性研究,鼓励跨模态融合与任务泛化方向的创新探索。 | Registration | From June 2025 | | --- | --- | | Competition Server Online | June 15th, 2025 | | Phase One Deadline | August 15th, 2025 | | Phase Two Deadline | September 15th, 2025 | | Award Decision @ IROS 2025 | October 19th, 2025 | 该赛事由新加坡国立大学、南 ...
强化学习新发现:无需数学样本,仅游戏训练AI推理大增
机器之心· 2025-06-24 06:46
第一作者谢云飞是莱斯大学博士生,导师为通讯作者魏晨教授,研究方向包括多模态生成与理解。 Project Leader 肖俊飞是约翰斯・霍普金斯大学博士生,导师为 Bloomberg Distinguished Professor Alan Yuille。 第二作者马崟淞是约翰斯・霍普金斯大学博士生。 图 1: 我们发现,只在例如贪吃蛇这种游戏上进行强化学习训练,模型就能涌现出领域外的泛化能力,在数学、多学科等多个任务上提高性能。 第三作者兰石懿是英伟达 Research Scientist。 最近,强化学习领域出现了一个颠覆性发现:研究人员不再需要大量数学训练样本,仅仅让 AI 玩简单游戏,就能显著提升其数学推理能力。 此前已有研究发现,即使不提供标准答案,仅用数学问题进行强化学习也能提高模型性能,这让人们开始重新思考强化学习的训练方式。而来自莱斯大学、约翰 斯・霍普金斯大学和英伟达的研究团队更进一步:他们让多模态大语言模型 (MLLM) 玩贪吃蛇等简单游戏,无需任何数学或多学科训练数据,就显著提升了模型 的多模态推理能力。研究团队提出了 ViGaL (Visual Game Learning) 方法,在多个 ...
7B智能体仅凭9个任务训练即超越R1!上交大打造AI-for-AI新范式
机器之心· 2025-06-21 01:33
尽管人工智能(AI)在飞速发展,当前 AI 开发仍严重依赖人类专家大量的手动实验和反复的调参迭代,过程费时费力。这种以人为中心的方式已成为制 约创新速度和通向通用人工智能(AGI)的关键瓶颈。为突破限制, AI-for-AI (AI4AI)应运而生。AI4AI 旨在让 AI 作为智能体来自主设计、优化和改 进 AI 算法,大幅减少人类干预,加速迭代开发周期,推动 AGI 发展进程。 最近,上海交通大学与上海人工智能实验室联合团队最新研究表明,一个仅依赖 7B 参数大模型的 AI 智能体(ML-Agent),采用 "经验学习" 新范式,只 在 9 个机器学习任务上持续探索学习,迭代进化,最终就能设计出超越 671B Deepseek-R1 驱动的智能体设计的 AI 模型, 首次实现了在自主机器学习领域 从 "提示工程" 到 "经验学习" 的范式跃迁,开创了 AI4AI 的新路径 。 论文标题: 论文地址: https://arxiv.org/pdf/2505.23723 代码地址: https://github.com/MASWorks/ML-Agent 传统自主机器学习:费时低效的困境 传统机器学习工程繁琐低 ...