语言模型

Search documents
GPT-4o医学知识覆盖率仅55%?腾讯优图团队发布大模型医疗能力“体检报告”
量子位· 2025-04-30 04:10
医疗大模型知识覆盖度首次被精准量化! 在医疗领域,大语言模型(LLM)的潜力令人振奋,但其知识储备是否足够可靠?腾讯优图实验室天衍研究中心的最新研究给出了答案。 他们提出的 MedKGEval框架 ,首次通过医疗知识图谱(KG)的多层级评估,系统揭示了GPT-4o等主流模型的医学知识覆盖度。 该研究已被WWW 2025会议Web4Good Track录用为口头报告(oral)。目前,WWW 2025正在悉尼举行,会议时间从4月28日持续至5月2 日。 MedKGEval团队 投稿 量子位 | 公众号 QbitAI 背景 大语言模型(LLM)在医疗领域的快速发展凸显了其知识存储与处理的潜力,但其临床部署前的可靠性验证亟需更系统化的评估框架。 当前主流的Prompt-CBLUE、Medbench和MedJourney等评估体系虽通过医学问答基准测试LLM的任务执行能力,却存在三个明显的局限: 1)其长尾数据分布导致罕见病症覆盖不足,评测结果存在偏差; 2)任务导向的设计聚焦疾病预测、用药咨询等单一场景,难以量化模型内在医学知识储量; 3)传统问答形式局限于表面对错判断,无法捕捉医学概念间的复杂拓扑关联。 为解决这 ...
产品创新拓市场,单笔合同突破千万元
Nan Jing Ri Bao· 2025-04-30 02:35
今日关注数字:7.4% 一季度,天洑软件在能源电力领域实现了单笔合同金额超千万元的突破。张明介绍,凭借工业AI底 座、智能热流体仿真软件AICFD、智能结构仿真软件AIFEM等技术优势,天洑软件为能源电力企业提 供高效的设计验证、结构优化、性能分析、人工智能业务场景落地等解决方案,助力企业提高产品设计 质量、缩短研发周期、降低成本。 一季度,全市信息传输、软件和信息技术服务业增长7.4%。 1—2月,全市规模以上服务业企业营业收入同比增长5.6%,比去年全年加快4.0个百分点。 从南京科远智慧科技集团股份有限公司智能分散控制系统专场对接会,到南京国睿信维软件有限公司对 接暨观摩会,再到江苏润和软件股份有限公司对接暨观摩会……今年以来,我市聚焦信创产品、工业软 件、工业操作系统等重点方向,梳理重点推广的产品清单,通过"宁工品推"专场对接活动在更大范围、 更宽领域促成行业合作,引领南京软件产业向更高水平迈进。 最新统计数据显示,一季度,全市信息传输、软件和信息技术服务业增长7.4%。目前,全市上下正锚 定目标、奋力冲刺,加快打造万亿级软件和信息服务产业集群,更大力度推动软件产业量质齐升,坚定 不移把产业强市建设向 ...
新华财经早报:4月30日
Xin Hua Cai Jing· 2025-04-30 02:13
·何立峰:增强人民币资产全球配置中心、风险管理中心地位 ·国家发展改革委、商务部、市场监管总局发布《关于开展市场准入壁垒清理整治行动促进全国统一大市场建设的通知》,全面清理和整改违规设置市场准 入壁垒的各类不合理规定和做法,通报一批具有典型意义的违规案例,建立健全线索归集、核实整改、案例通报等长效机制,让"非禁即入"落地生根,营造 公平的市场准入环境,为坚持和落实"两个毫不动摇"、构建全国统一大市场提供有力支撑。(新华财经) ·29日消息,近日,国家发展改革委已印发通知,会同财政部及时向地方追加下达今年第二批810亿元超长期特别国债资金,继续大力支持消费品以旧换新。 下一步,国家发展改革委将充分发挥"两新"部际协调机制作用,强化统筹推进和跟踪调度,督促各地各有关部门加快已拨资金审核兑付,切实减轻企业垫资 压力,确保真金白银优惠直达消费者,推动消费品以旧换新政策发挥更大效果。(新华财经) ·据中国人民银行网站4月29日消息,3月份,债券市场共发行各类债券87356.6亿元,其中国债发行12786.3亿元,地方政府债券发行9788.0亿元,金融债券发 行10226.4亿元,公司信用类债券发行13335.2亿元,信 ...
沃尔玛态度转变:恢复中国供应商出货,美国客户承担关税成本;传饿了么加入外卖大战;因未按时公示年报,引望公司被列为经营异常
雷峰网· 2025-04-30 00:30
1. 网传中国半导体设备厂将大规模重组:200多家半导体设备公司或整合为10家大型企业 2.沃尔玛态度转变:恢复中国供应商出货,美国客户承担关税成本 3. 腾讯TEG架构调整:成立大语言和多模态模型部 4.传英伟达将在中国成立合资公司、为DeepSeek定制芯片,官方辟谣 5. 网传饿了么加入外卖大战: 正打印百亿补贴横幅 6.长城要做超跑?长城CTO吴会肖回应:5年前就在做,没想到大家这么关注 7.曝iPhone 2700个零部件:仅30家供应商完全在中国境外 8.OpenAI涉足电商领域!用户可通过ChatGPT购买商品 今日头条 HEADLINE NEWS 网传中国半导体设备厂将大规模重组:200多家半导体设备公司或整合为10家大型企业 据媒体报道,传中国正在推动一项政策,计划将200多家半导体设备公司整合为10家大型企业。这项政策 旨在提升中国半导体设备产业的竞争力,以应对美国的制裁压力。中国半导体自给率目前约为23%,在美 国政府的高压施压下,中国似乎计划采取资源集中策略,扶持具有潜力的企业。 今年3月,中国半导体设备龙头企业北方华创就有类似的动作,该公司以16.9亿元收购涂胶显影设备厂芯 源微9. ...
中科金财(002657) - 002657中科金财投资者关系管理信息20250429
2025-04-29 14:40
证券代码:002657 证券简称:中科金财 北京中科金财科技股份有限公司投资者关系活动记录表 编号:041 您好,感谢您对中科金财的关注。公司以打造多任务、复 杂任务的智能体为目标,在部分产品中使用 Multiple Agent 架 构,构建任务编排层、认知计算层、决策优化层技术架构体系, 形成了 AI Agent 开发运行平台及覆盖银行前、中、后台业务场 景的 AI Agent 产品,包括基于 AI-Native 技术架构的业务流程 智能体、智能客服 Agent、智能信贷 Agent、智能投研 Agent、 账户管理 Agent、智能营销 Agent 等,并依托 MCP 协议,实现与 外部数据源及工具的无缝链接,打造流程闭环。其中业务流程 智能体聚焦运营管理、经营决策管理、产品管理、风控管理、客 户营销与渠道管理五大核心业务场景,融合 AI Agent、大语言 模型与深度学习技术,提升银行运营管理效率。谢谢。 3、从网上信息显示,贵公司去年在 AI 应用领域,有在 AI 短 剧,AI 电影等方面行进探索并有相关订单案例,请问这些订单 金额占比如何?今年是否考虑继续加大在相关 AI 应用的订单 投标与交付力度 ...
对谈 Pokee.ai 朱哲清:强化学习做核心,Agent 的少数派造法
晚点LatePost· 2025-04-29 08:43
可能是更高效、更便宜的 Agent 实现路径。 文 丨 孙海宁 编辑 丨 程曼祺 主流 AI Agent 都把大语言模型(LLM,或者它的多模态版本)当作 "大脑",靠一个或几个 LLM 编 排工作、调用工具。但也有另一条路:Agent 规划、作业靠不依赖自然语言的强化学习模型,LLM 只 充当 Agent 和人类的 "交互层"。 不一样的想法,来自去年 10 月成立,至今只有 4 个正式员工的 Pokee.ai。 Pokee.ai 创始人朱哲清有十余年强化学习研究、落地经验。2017 年起,从杜克大学计算机科学专业毕 业的朱哲清,一边在斯坦福大学攻读强化学习方向博士学位,师从 Benjamin Van Roy;一边在 Meta 工作,曾任 Meta"应用强化学习" 部门负责人,他用强化学习算法改善内容推荐系统,把上任前只剩 3 人,一度要关停的部门扩张至 10 余人,为 Meta 增收 5 亿美元。 靠 LLM 规划、决策,是个自然而主流的想法。OpenAI Operator 和网页交互、操作电脑的能力基于 GPT-4o 模型,Manus 完成任务则是靠 Claude 3.5 Sonnet 模型做长程规划。 ...
阿里Qwen3系列开源:混合推理模式、性能超越DeepSeek R1
Founder Park· 2025-04-29 03:16
以下文章来源于赛博禅心 ,作者金色传说大聪明 赛博禅心 . 拜AI古佛,修赛博禅心 今天凌晨,Qwen3 发布。 本次共开源 8 款模型,包括 2 款 MoE 模型、6 款 Dense 模型。 Qwen3 系列 在代码、数学、通用能力等方面能力表现优异, 其中 235B 版本,在基 准测试上的水平超过了 671B 的 DeepSeek R1 。 同时, Qwen3 引入了「 思考模式/非思考模式 」无缝切换的功能。 在 思考模式下, 模型逐步推理,经过深思熟虑后给出最终答案。非思考模式 下,能够 提供快速的即时响应,适用于简单问题的回答。混合推理的模式平衡了算力和输出效果。 此外, Qwen3 系列提高了 Agent 能力, 同时也加强了对 MCP 的支持。Qwen 配套了一个 Qwen-Agent 项目,可以使用 API 进行工具调用, 或结合现有的工具链进行扩展。 | | | Qwen3 | | | | | | --- | --- | --- | --- | --- | --- | --- | | | | 通义千问最新一代大模型:采用混合专家架构,具备思考与快速回答双模式,支持119种语言 | | | | ...
过去四周,AI推理爆了,GPU在燃烧,英伟达依旧供不应求
硬AI· 2025-04-29 00:18
根据摩根士丹利Joseph Moore团队25日发布的报告, 这种强劲的需求主要驱动因素在于token生成量的 增长,自年初以来,token生成量增长了5倍以上 ,这给生态系统带来了巨大压力,并推动了对处理这些 工作负载的投资激增。 点击 上方 硬AI 关注我们 大摩指出,受益于大型语言模型对推理芯片的巨大需求,英伟达面临GPU供不应求局面。但在持续的供应限制、毛利率 压力等负面影响下,大摩轻微下调英伟达目标价至160美元。长期来看,公司增长轨迹依然强劲。 硬·AI 作者 | 张雅琦 编辑 | 硬 AI 过去四周,投资者情绪因宏观经济和供应链风险而恶化,但与此同时,对英伟达GPU核心的需求却因主要 大型语言模型(LLM)对推理芯片的巨大需求而飙升,且这种需求遍及所有地区。 多家AI公司报告用户数量呈爆炸式增长,例如,Open Router等API公司的数据显示,许多公司为满足推 理软件的巨量需求,被迫争抢GPU资源,甚至出现"最后一块GB200"在2025年仅剩一块的状况。 摩根士丹利认为, 这种对推理的需求是关键。 这是由使用模型并产生收入的部分驱动的,证明了推理模 型的扩展是真实存在的,这与仅依赖于风险投 ...
Qwen3深夜正式开源,小尺寸也能大力出奇迹。
数字生命卡兹克· 2025-04-29 00:05
小道消息一直在说,昨天深夜或者今天凌晨,阿里会发Qwen3。 然后我特意早早的睡了一两小时,凌晨1点起床,就为了等Qwen3发。 结果这一等,就是好几个小时。。。 不过,功夫不负有心人。 凌晨5点,我眼睛都睁不开的时候,终于等到了。 Qwen你赔我睡眠。。。 把报告看完,我总结一下,觉得最大的亮点有6个: 1. 模型能力登顶全球,这个没啥可说的,就是No.1。 2. 第一个开源的混合推理模型。 3. 8个不同尺寸的模型,几乎覆盖了所有场景。 4. 成本很低, 旗舰模型235B参数部署成本只要DeepSeek R1的三分之一。 5. 支持MCP协议。 6. 居然还支持了119种语言。 一起说吧。 就像我们其实都知道,DeepSeek这个深度思考,你打开的时候,是R1模型,但是你关掉,其实用的是v3来给你回答。 但是Qwen3,是一体的。 是一个模型,只不过支持了两种模式,这个不管对于开发者还是使用者,都方便很多。 这次发了8个模型,Qwen3-0.6B、1.7B、4B、8B、14B、32B,这6个都是Dense稠密模型。 还有两个重量级MoE模型,Qwen3-30B-A3B,和旗舰版的Qwen3-235B-A2 ...
阿里Qwen3深夜开源,8款模型、集成MCP,性能超DeepSeek-R1,2小时狂揽16.9k星
3 6 Ke· 2025-04-28 23:23
此次全新升级的Qwen3系列有以下5大关键特性: 8种参数大小的稠密与MoE模型:0.6B、1.7B、4B、8B、14B、32B和Qwen3-235B-A22B(2350亿总参数和220亿激活参数)、Qwen3-30B-A3B(300亿总 参数和30亿激活参数); 引入混合思考模式:用户可切换"思考模式、"非思考模式",自己控制思考程度; 推理能力提升:在数学、代码生成和常识逻辑推理方面超越QwQ(在思考模式下)和Qwen2.5 instruct models(在非思考模式下); 阿里通义大模型新成员Qwen3系列模型终于亮相! 智东西4月29日报道,今日凌晨4点,阿里云正式开源Qwen3系列模型,包含2个MoE模型、6个稠密模型。发布2小时,Qwen3模型在GitHub上的star数已超 过16.9k。 | Product v | Solutions v | Resources v | Open Source v Enterprise V | | Pricing | | | | Q | Sign in | Sign up | | --- | --- | --- | --- | --- | --- | --- ...