Workflow
语言模型
icon
Search documents
GPT-4o不敌Qwen,无一模型及格!UC伯克利/港大等联合团队提出多模态新基准:考察多视图理解能力
量子位· 2025-05-14 06:07
All-Angles Bench 团队 投稿至 凹非寺 量子位 | 公众号 QbitAI 多视图理解推理 有新的评判标准了! 什么是多视图理解?也就是从不同视角整合视觉信息进而实现理解决策。 想象一下,机器人在复杂环境中执行任务,这就需要根据多个摄像头的画面准确判断物体位置、距离和运动方向,这就依赖于强大的多视图理 解能力。 但过去,由于评估多视图推理能力的基准测试稀缺,这一领域的研究进展相对缓慢。 来自UC伯克利、忆生科技、香港大学、纽约大学、加州大学戴维斯分校、牛津大学等多家机构的研究者联合提出了 All-Angles Bench ,旨 在全面评估MLLMs的多视图理解能力。它涵盖了90个真实场景下,超过2100组人工标注的多视图问答对。 其评测数据集以及评测代码现已全部开源。 他们对27个领先的多模态大语言模型进行基准测试,其中包括Gemini-2.0-Flash、Claude-3.7-Sonnet和GPT-4o。 结果显示,多模态大语言模型与人类水平之间存在显著差距 ,并进一步发现模态大语言模型存在两种主要的缺陷模式:(1)在遮挡情况下跨 视图对应能力较弱;(2)对粗略相机位姿的估计能力较差。 具体来 ...
微软这支神秘的华人AI团队加入腾讯混元,曝与裁员无关|独家
AI前线· 2025-05-14 05:47
在过去几个月中,混元发布了一系列 AI 模型,包括视频生成器和 3D 物体生成器。 作者|冬梅 昨天,WizardLM 项目创建者徐灿在 X 平台上发文表示,他和团队离开微软,加入了腾讯的 AI 开发组织——混元(Hunyuan)。 "我们将继续我们的使命,推动 LLM 培训技术的发展,并构建更好的 AI 模型。" 事实上,WizardLM 甚至也已发布一款混元模型:Hunyuan-TurboS 0416。在一篇 X 帖子中, 自称 WizardLM 团队联合创建者 Qingfeng Sun 表示,Hunyuan-TurboS 0416 的表现优于谷歌 Gemma 3 系列等"开放"AI 模型。 据知情人士向 AI 前线独家透露,WizardLM 团队有 6 名主力成员,大部分已经离开微软。 有趣的是,AI 前线留意到,WizardLM 宣布离开的时间点比较微妙,因为正值微软被曝出将在全 球范围内裁员 3%,也就是大约 6000 多人会受到影响, 外界 猜测或与 WizardLM 团队离开与 微软的裁员有关 。 但据知情人士透露, WizardLM 团队核心人物 Can Xu 和 Qingfeng Sun 早 ...
叶子豪、陈天奇等人开源项目FlashInfer入选,MLSys2025最佳论文奖公布
机器之心· 2025-05-14 04:36
机器之心报道 编辑:泽南、+0 今年的两篇最佳论文一作均为华人。 近日,国际系统领域顶会 MLSys 2025 公布了最佳论文奖。 今年的大奖颁发给了来自华盛顿大学、英伟达、Perplexity AI、卡耐基梅隆大学的 FlashInfer,以及瑞典查尔摩斯理工大学的《The Hidden Bloat in Machine Learning Systems》。 对此,英伟达第一时间发出祝贺,并表示「FlashInfer」的「LLM 推理内核能力」已经被集成到 vLLM 项目、SGLang 以及自定义推理引擎中。 FlashInfer FlashInfer 最初是华盛顿大学 Paul G. Allen 计算机科学院、卡耐基梅隆大学及陈天奇的创业公司 OctoAI 共同发起的合作研究项目,旨在创建一个灵活的 大语言模型(LLM)推理内核库,提供 LLM GPU 内核的高性能实现,如 FlashAttention、SparseAttention、PageAttention、Sampling 等。 英伟达表示,首个适用于 DeepSeek MLA 的 Blackwell 内核也出自 FlashInfer。 Flash ...
北京国电通申请基于生成对抗网络与大语言模型的人力资源管理专利,实现生成虚拟人力资源数据的多元化
Jin Rong Jie· 2025-05-14 03:56
Group 1 - Beijing Guodian Tong Network Technology Co., Ltd. applied for a patent titled "A Human Resource Management Method Based on Generative Adversarial Networks and Large Language Models" [1] - The patent aims to utilize generative adversarial networks to learn existing human resource management data and generate diverse virtual human resource management data [1] - The method involves training a human resource management model using both real and virtual data to optimize human resource decision-making [1] Group 2 - Beijing Guodian Tong Network Technology Co., Ltd. was established in 2000 with a registered capital of 73 million RMB and has invested in 4 companies [2] - State Grid Information Communication Industry Group Co., Ltd. was founded in 2015 with a registered capital of approximately 1.5 billion RMB and has invested in 40 companies [2] - The two companies have significant involvement in various projects, with Guodian Tong participating in 2019 bidding projects and State Grid participating in 5000 bidding projects [2]
苹果发布FastVLM模型,可在iPhone上运行的极速视觉语言模型;昆仑万维宣布开源Matrix-Game大模型丨AIGC日报
创业邦· 2025-05-13 23:52
1.【昆仑万维宣布正式开源Matrix-Game大模型】5月13日,据昆仑万维消息,昆仑万维正式开源 (17B+)Matrix-Game大模型,即Matrix-Zero世界模型中的可交互视频生成大模型。Matrix-Game是Matrix系 列在交互式世界生成方向的正式落地,也是工业界首个开源的10B+空间智能大模型,它是一个面向游戏 世界建模的交互式世界基础模型,专为开放式环境中的高质量生成与精确控制而设计。(第一财经) 2.【百型智能推出国内首个外贸行业垂类Agent】百型智能推出国内首个外贸行业垂类Agent——AI外贸员 Zoe。据了解,Zoe可以根据企业目标拆解任务,独立完成从市场分析、寻找客户、精准筛选,到开发触 达、转化跟进的外贸开发拓客全链路,转化率高出传统人工方式10倍以上。(财联社) 3.【火山引擎发布豆包视频生成模型Seedance 1.0 lite】火山引擎发布豆包·视频生成模型Seedance 1.0 lite、 豆包1.5·视觉深度思考模型,并升级豆包·音乐模型,以更全面的模型矩阵、更丰富的智能体工具,帮助企 业打通从业务到智能体的应用链路。官方表示,此次全新发布的豆包视频生成模型 ...
特斯拉/美团/蔚来背后的神秘“捕手”:我在大语言模型上看不到持续竞争力
3 6 Ke· 2025-05-13 08:31
Group 1 - Baillie Gifford is a century-old investment firm based in Edinburgh, known for its value investment philosophy and long-term global growth strategy, focusing on identifying and investing in a select few high-quality companies with competitive advantages and innovation [1][2] - The firm has made early investments in major tech companies, including Amazon in 2004, Illumina in 2011, Tesla in 2013, and Alibaba in 2014, demonstrating a strong track record in identifying growth opportunities [1] - Baillie Gifford's significant investment in Tesla began with a $89 million stake in 2013, which grew to 14 million shares by 2017, resulting in a profit of approximately $17 billion after a seven-year holding period [1] Group 2 - In 2016, Baillie Gifford participated in Meituan's first round of financing and held a 12.08% stake during its IPO in 2018, maintaining its position through market fluctuations [2] - Peter Singlehurst, the firm's growth investment head, expressed confidence in ByteDance as a top investment opportunity, predicting a fivefold return despite current geopolitical tensions [2][5] - The firm has developed a framework of ten core due diligence questions to assess a company's growth potential, focusing on long-term growth opportunities, competitive advantages, organizational culture, and financial analysis [3][4] Group 3 - Baillie Gifford is cautious about investing in AI companies, particularly large language models, due to unclear competitive advantages at that level, despite recognizing the potential in foundational AI infrastructure [4][25] - The firm emphasizes the importance of maintaining strategic focus and avoiding "fill-duck" investments, which can lead to overvaluation and misallocation of resources [4][20] - The investment philosophy includes a focus on companies with strong return on equity (ROE) and sustainable business models, avoiding excessive capital influx that could distort long-term value [20][21] Group 4 - Baillie Gifford's investment in Amazon and Tesla exemplifies its strategy of identifying companies with scalable business models and long-term growth potential, even when they are initially unprofitable [24][50] - The firm believes that the current market conditions present unique opportunities for growth investments, particularly in companies that have demonstrated strong management and innovative business models [61][62] - The firm continues to actively seek investment opportunities in China, despite geopolitical risks, as it believes the risk-reward ratio remains favorable [46][44]
推出金融交易AI Agent,可全天候智能盯盘,这家新加坡金融企业获1000万美元融资|早起看早期
36氪· 2025-05-12 23:56
以下文章来源于硬氪 ,作者胡依婷 硬氪 . 专注全球化、硬科技报道。36kr旗下官方账号。 因此,RockFlow研发团队基于自研架构,结合多模态⼤语⾔模型(LLM)、Fin-Tuning、RAG、MultiAgent和CoT等前沿技术,开发了⼀套适合金融投资场 景的AI Agent架构。 借助该架构,AI模型的理解和⽣成能⼒都得以提升,其还能实时高效处理多源数据分析,在复杂的⾦融环境中进⾏⾼效的决策和预测,提供更精准的⾦融分 析和投资建议,实现成本和风险控制。 在投资交易场景中,RockFlow的AI Agent可将传统复杂流程抽象为实时信息获取、分析、交易策略构建、订单执⾏四⼤核⼼环节,解决最核心的"买什 么"和"怎么买"两⼤痛点。 首先,RockFlow的AI Agent将实时监控市场动态,分析包括财务数据、社交媒体情绪、公司公告等在内的大量数据,为用户展示个性化的实时交易机会。 用户可以随时方便浏览,并一键下单。 Bobby将于近期全球上线。 文 | 胡依婷 编辑 | 袁斯来 来源| 硬氪(ID:south_36kr) 封面来源 | 企业官方 硬氪获悉,近日新加坡人工智能金融科技公司RockFlow宣 ...
当AI遇上数学:大语言模型如何掀起一场形式化数学的革命? | Deep Talk
锦秋集· 2025-05-12 09:13
随着大语言模型在内容创作、代码生成与科学问答等领域掀起巨大变革浪潮,以严谨逻辑与精密结构著称的数学领域也迎来了深刻的转型契机。 当前,数学理论的复杂性不断提升,许多重要定理的证明规模已远超传统人工审阅的能力边界。动辄数百页的证明不仅挑战了同行评审的极限,更暴露出人工验证 过程的缓慢与脆弱性。针对这一困境,形式化数学方法开始成为重要的解决路径。这一方法通过将数学命题严格表达为形式逻辑语言,并借助计算机进行自动化验 证,有效地提升了定理证明的准确性和可靠性。 在形式化数学日益成为趋势的背景下,来自爱丁堡大学的博士研究生辛华剑自2022年起致力于将大语言模型技术与形式化数学方法结合,曾分别在DeepSeek和字节 跳动Seed团队进行相关研究。 2025年5月9日,辛华剑在由剑桥中国AI协会、锦秋基金、清华大学学生通用人工智能协会、 清华大学学生创业协会联合举办的主题分享会上,以《大语言模型时代 的形式化数学革命》为题,详细阐述了形式化数学的历史演进、现状挑战以及未来发展方向。 他认为: 以下内容为此次报告的整理与深化,经由分享人本人审阅补充。 引言 当大语言模型(LLM)以空前规模席卷内容创作与科学研究等领域之际 ...
AI也需要"记笔记":Karpathy从Claude 1.6万字提示词中看到的未来
歸藏的AI工具箱· 2025-05-12 08:28
LLM 的系统提示就是在对话一开始递给 AI 的"一页说明书",用来告诉它该扮演什么角色、遵守哪 些规则、用什么方式回答用户。 大概来看一下这么长的提示词里面主要都是一些什么内容: 而且整个提示词中充满了临时修改的的痕迹,这些修改往往没有使用 XML 或者 Markdown 格式的列表,就 是一段话,看起来像是针对一些热点事件或者问题修复打的补丁。 **Acknowledgments** I would like to thank my supervisor, for his kind of support. I would like to thank my supervisor, for his kind of support. 如果懒得看内容可以听一下,播客使用 listenhub 制作 前几天 Cluade 新的系统提示词泄露了,居然有 16,739 个单词,非常长。 相比之下,OpenAI 在 ChatGPT 中的 o4-mini 的系统提示有 2,218 个单词,只是 Claude 的 13%。 什么是系统提示词 Claude 整个系统提示词这么长维护和更新甚至版本控制应该都需要一个专门的流程,不然 ...
【中国那些事儿】俄专家:中俄人工智能合作跨越“小院高墙”,构建公平世界科技新秩序
Huan Qiu Wang Zi Xun· 2025-05-10 05:18
科洛宁还提到,人工智能的飞速发展引发了人们对滥用人工智能和通用人工智能的担忧。一些国家利用 其在人工智能领域的主导地位,对他国进行胁迫,阻挠它们与被视为威胁的国家开展合作。鉴于此,那 些希望建立公平世界秩序的国家需加深彼此间的合作,例如在金砖国家框架下,秉持互惠互利的原则, 共同推动全球科技治理体系的完善。 科洛宁强调,俄罗斯科学界对与中国以及其他志同道合的国家携手,共同推动全球在人工智能和通用人 工智能领域的协调发展与有效治理持开放态度。欢迎其他国家参与俄罗斯AGI社区研讨会等开放活动, 以及数学AI等联合会议,并期待各方逐步完善人工智能技术管理的联合战略。 另据相关报道,由外国顶尖专家组成的"瓦尔代"国际辩论俱乐部(Valdai Discussion Club)项目主任季 莫费·博尔达切夫(Timofei Bordachev)同样指出,人工智能是前沿科技领域,中国和俄罗斯都具备相 应技术和人才,两国可以通过在这一领域的合作,树立起科技合作的典范,并为全球南方国家在科学、 文化和教育领域的解放贡献力量。这不仅将为两国开辟全新的合作领域,还将切实推动南南合作,这对 于构建一个更加平衡、公正的世界秩序至关重要。 ...