Workflow
语言模型
icon
Search documents
鹅厂放大招,混元图像2.0「边说边画」:描述完,图也生成好了
量子位· 2025-05-16 03:39
西风 发自 凹非寺 量子位 | 公众号 QbitAI 刚刚,鹅厂把文生图卷出了新高度—— 发布混元图像2.0模型 (Hunyuan Image 2.0) ,首次实现 毫秒级响应,边说边画,实时生成 ! 用户一边描述,它紧跟着绘制,整个过程那叫一个丝滑。不用等待,专治各种没有耐心。 有些画面描述起来太费劲? 别急,还有 实 时绘画 板 玩法。 用户可以手绘想要的元素,然后辅以文字说明,在另一半画板上它立刻就帮你按照草图绘制出来: 昨天腾讯混元团队发布了一小段预告视频,吊足了大伙儿的胃口。 今天终于正式发布了,真实使用效果到底如何? 量子位已抢先拿到测试资格,一起来看看到底怎么个事儿~ 一手实测实时文生图 实测之前,先来看官方给出的一些小tips: 实时文生图 而且当它把"小女孩"这一主体的模样定下来之后,我们再接着描述对画面做补充,它角色一致性保持得也不错。 各种风格都能驾驭: 打开腾讯混元官网我们就直奔实时文生图,然后随便输入了一句话。 果真是一边打字生图直接跟着一起变换,顺畅~ 模型主打真实感、去AI味,真实场景生图效果会更好 模型是英文数据训练为主,有一些中文不能识别的概念,用英文输入会更好 优先推荐16 ...
中金 | 大模型系列(3):主动投研LLM应用手册
中金点睛· 2025-05-15 23:32
中金研究 随着互联网和新媒体的发展,信息以前所未有的速度和规模增长,主动投资者面临着"信息过载"的挑战。传统投研方法在处理海量、复杂、非结构化 且真伪难辨的金融信息时,容易存在效率低下的情况。大语言模型(LLM)凭借其强大的自然语言理解、模式识别及信息抽取能力,为应对这一挑战 带来了新的解决方案。全球领先资管机构已积极布局LLM应用,覆盖信息处理、情绪分析、主题投资等多个环节,预示着LLM正从实验探索迈向实战 化应用。 本文将深入探讨LLM在信息获取与处理、深度分析与挖掘、策略生成与验证等核心投研环节的具体应用,对比多个大模型平台的使用效果, 并展望大模型的应用前景及面临的挑战。 (3)上市公司业绩电话会纪要分析: LLM可快速处理会议内容,生成摘要,提取财务更新、战略重点、业绩解释与展望。LLM还能对比历史会议内容, 识别管理层在表达方式口径上的变化;LLM也可以总结分析师提问热点,评估管理层回应质量,并捕捉异常表述。 深度分析与挖掘:"提炼精华"。 摘要 点击小程序查看报告原文 Abstract 信息获取与处理:从"大海捞针"到"精准筛选"。 LLM通过自动化信息追踪、研报分析对比及业绩会纪要分析,能够极 ...
Youdao(DAO) - 2025 Q1 - Earnings Call Transcript
2025-05-15 11:00
Youdao (DAO) Q1 2025 Earnings Call May 15, 2025 06:00 AM ET Speaker0 Good day, and welcome to Yodao's First Quarter twenty twenty five Earnings Conference Call. All participants are in listen only mode. After today's presentation, there will be an opportunity to ask questions. Please note this event is being recorded. I would now like to turn the conference over to Jeffrey Wang, Investor Relations Director. Please go ahead. Speaker1 Thank you, operator. Please note the discussion today will contain forward ...
Anthropic联创克拉克最新专访:AI可能具备某种“外星人意识”
3 6 Ke· 2025-05-15 09:30
5月15日消息,近日Anthropic联合创始人杰克·克拉克(Jack Clark)做客乔治梅森大学经济学教授泰勒·考恩(Tyler Cowen)的播客,分享 了对AI未来的独到见解。他们探讨了AGI对经济的潜在影响、大模型竞争格局,以及监管和治理方面的挑战等问题。 克拉克认为,园艺、电工等高技能工艺领域的岗位将最晚被AGI取代,因为人们不仅为其技术买单,更为工匠的审美与声誉付费。 对于国家之间的AI竞争,克拉克认为多数国家最终会接纳强AI。虽然可能有少数国家拒绝大型AI系统,但在全球化趋势下,大多数国家 最终会融入这一体系,难以独立于AI技术发展之外。 不过,克拉克表示在全球范围内达成全面的AI治理协议"非常困难",但中美之间可能会就某些危险技术形成有限的共识,类似"核不扩 散"协议。他不认为这会是"合作",而更可能是出于共同防范风险的现实主义考量。 以下为克拉克专访精华内容: 01 手工业或创意性工作会被AGI最后取代 问:你觉得哪些工作会受到AGI的最后影响? 克拉克:我认为,那些依赖手工技能、经验判断和个人风格的工作,可能是AGI最晚才会替代的。像电工、修水管的管道工,或者园丁 这样的技术工种,有很多 ...
一个极具争议的开源项目,「微信克隆人」火了!
菜鸟教程· 2025-05-15 08:33
以下文章来源于JackCui ,作者JackCui JackCui . 一名热爱技术的算法工程师。分享技术,乐享生活:技术、快乐、财富。 你的微信里有没有一个对话窗?它很久都没有弹出新消息,但你却常常在深夜里点开反反复复地翻着。 如果现在,你可以用这些聊天记录克隆出对方的"数字分身",保存下 TA 说话的语气、风格、独特的口 头禅,甚至还能给你发来语音,你会怎么选? 最近,GitHub 上新开源了一个项目 WeClone——让你记忆里的那个 TA 在数字世界里永生,已不再是不 可能。 WeClone 通过个人微信聊天记录对大语言模型( LLM )进行微调,打造个性化的数字分身。 除了留住记忆里的 TA,你也可以创造自己的数字分身。 你有没有想过,和自己聊天会是什么样的体 验?你会喜欢和自己聊天吗? | O | 17 | 0 | ılıl 1.9K | W | T | | --- | --- | --- | --- | --- | --- | | | Vic Huang @bugauwIQtoa5ftS · Apr 11 | | | C | ... | | 数字永生 | | | | | | | 0 | 5 | ...
华东空管局技术保障中心上线智能体系统 空管通导业务迈入AI时代
《中国民航报》、中国民航网 记者胡夕姮 通讯员俞成、汪欣荣、陈莹玥 报道:近日,华东空管局技术 保障中心成功推出面向空管通导业务的智能体系统,标志着华东空管通导业务转型升级迈出关键一步。 该系统深度融合空管领域专业知识与业务流程,通过本地化部署和多模型协同,实现对业务数据的智能 解析、故障推演及运维辅助决策。 技术底座:低代码开发平台与虚拟化部署框架 为了快速响应需求变化,加速应用落地进程,技术组成员经多方考量,最终选用Dify平台进行系统研 发。Dify平台是一个专为大语言模型开发和运营设计的开源平台,支持自然语言指令定义智能体,集成 多模型混合调度能力,允许灵活调用Qwen、DeepSeek等。其以低代码开发模式为核心,极大简化了AI 应用的构建与迭代流程。通过可视化画布与预置组件库,用户无需编写代码即可设计复杂工作流,例如 上传值班记录、日志自动归档等。此外,插件式功能扩展与知识库灵活管理进一步降低了技术门槛。 考虑到空管业务对实时性和安全性的严苛要求,技术人员采用vLLM(超大规模语言模型)推理框架进 行虚拟化部署,实现了高并发处理与低延迟响应目标。其多模型混合调度能力支持任务场景灵活切换, 优化长文 ...
10万美元成本训练的小模型,在特定任务超越GPT-4o,延迟低99倍
3 6 Ke· 2025-05-14 09:45
现有的SOTA级别大语言模型固然拥有较强智能,在部分任务上达到或超过了人类的水准,但他们的参数尺寸动辄达到数千亿甚至万亿,无论是训练,部 署,还是推理,都成本高昂。对于企业和开发者来说,这些SOTA模型在一些相对简单,但需要大规模和高并发的任务上,未必是综合成本及性能的最优选 择。 一家叫Fastino的早期初创公司看到了这个痛点,使用低端游戏GPU,以平均不到10万美元的成本,训练出一系列称为"任务特定语言模型"(TLMs,Task- Specific Language Models)的小型模型,能够在特定任务上性能媲美大型语言模型,并且推理速度快99倍。 近日,Fastino获得由Khosla Ventures领投的1750万美元种子轮融资,Insight Partners,Valor Equity Partners,以及知名天使投资人前Docker首席执行官Scott Johnston和Weights & Biases首席执行官Lukas Biewald参与。在2024年11月,Fastino获得M12(微软旗下)和Insight Partners领投的700万美元前种子轮融资, 累计融资近2500万美 ...
原微软WizardLM项目团队加入腾讯混元
news flash· 2025-05-14 06:27
专注于高级大语言模型开发的WizardLM项目创建者徐灿日前发文表示,他和团队离开微软,加入了腾 讯的AI开发组织——混元(Hunyuan),"我们将继续我们的使命,推动LLM培训技术的发展,并构建更好 的AI模型。"据知情人士透露,WizardLM团队有6名主力成员,大部分已经离开微软。(科创板日报) ...
GPT-4o不敌Qwen,无一模型及格!UC伯克利/港大等联合团队提出多模态新基准:考察多视图理解能力
量子位· 2025-05-14 06:07
All-Angles Bench 团队 投稿至 凹非寺 量子位 | 公众号 QbitAI 多视图理解推理 有新的评判标准了! 什么是多视图理解?也就是从不同视角整合视觉信息进而实现理解决策。 想象一下,机器人在复杂环境中执行任务,这就需要根据多个摄像头的画面准确判断物体位置、距离和运动方向,这就依赖于强大的多视图理 解能力。 但过去,由于评估多视图推理能力的基准测试稀缺,这一领域的研究进展相对缓慢。 来自UC伯克利、忆生科技、香港大学、纽约大学、加州大学戴维斯分校、牛津大学等多家机构的研究者联合提出了 All-Angles Bench ,旨 在全面评估MLLMs的多视图理解能力。它涵盖了90个真实场景下,超过2100组人工标注的多视图问答对。 其评测数据集以及评测代码现已全部开源。 他们对27个领先的多模态大语言模型进行基准测试,其中包括Gemini-2.0-Flash、Claude-3.7-Sonnet和GPT-4o。 结果显示,多模态大语言模型与人类水平之间存在显著差距 ,并进一步发现模态大语言模型存在两种主要的缺陷模式:(1)在遮挡情况下跨 视图对应能力较弱;(2)对粗略相机位姿的估计能力较差。 具体来 ...
微软这支神秘的华人AI团队加入腾讯混元,曝与裁员无关|独家
AI前线· 2025-05-14 05:47
在过去几个月中,混元发布了一系列 AI 模型,包括视频生成器和 3D 物体生成器。 作者|冬梅 昨天,WizardLM 项目创建者徐灿在 X 平台上发文表示,他和团队离开微软,加入了腾讯的 AI 开发组织——混元(Hunyuan)。 "我们将继续我们的使命,推动 LLM 培训技术的发展,并构建更好的 AI 模型。" 事实上,WizardLM 甚至也已发布一款混元模型:Hunyuan-TurboS 0416。在一篇 X 帖子中, 自称 WizardLM 团队联合创建者 Qingfeng Sun 表示,Hunyuan-TurboS 0416 的表现优于谷歌 Gemma 3 系列等"开放"AI 模型。 据知情人士向 AI 前线独家透露,WizardLM 团队有 6 名主力成员,大部分已经离开微软。 有趣的是,AI 前线留意到,WizardLM 宣布离开的时间点比较微妙,因为正值微软被曝出将在全 球范围内裁员 3%,也就是大约 6000 多人会受到影响, 外界 猜测或与 WizardLM 团队离开与 微软的裁员有关 。 但据知情人士透露, WizardLM 团队核心人物 Can Xu 和 Qingfeng Sun 早 ...