语言

Search documents
Bill Inmon:为什么你的数据湖需要的是 BLM,而不是 LLM
3 6 Ke· 2025-07-26 06:42
Core Insights - 85% of big data projects fail, and despite a 20% growth in the $15.2 billion data lake market in 2023, most companies struggle to extract value from text data [2][25] - The reliance on general-purpose large language models (LLMs) like ChatGPT is costly and ineffective for structured data needs, with operational costs reaching $700,000 daily for ChatGPT [2][25] - Companies are investing heavily in similar LLMs without addressing specific industry needs, leading to inefficiencies and wasted resources [8][10] Data and Cost Analysis - ChatGPT incurs monthly operational costs of $3,000 to $15,000 for medium applications, with API costs for organizations processing over 100,000 queries reaching $3,000 to $7,000 [2][25] - 95% of the knowledge in ChatGPT is irrelevant to specific business contexts, leading to significant waste [4][25] - 87% of data science projects never reach production, highlighting the unreliability of current AI solutions [7][25] Industry-Specific Language Models - Business Language Models (BLMs) focus on industry-specific vocabulary and general business language, providing targeted solutions rather than generic models [12][25] - BLMs can effectively convert unstructured text into structured, queryable data, addressing the challenge of the 3.28 billion TB of data generated daily, of which 80-90% is unstructured [21][25] - Pre-built BLMs cover approximately 90% of business types, requiring minimal customization, often less than 1% of total vocabulary [24][25] Implementation Strategy - Companies should assess their current text analysis methods, as 54% struggle with data migration and 85% of big data projects fail [27][25] - Identifying industry-specific vocabulary needs is crucial, given that only 18% of companies utilize unstructured data effectively [27][25] - Organizations are encouraged to evaluate pre-built BLM options and leverage existing analytical tools to maximize current infrastructure investments [27][28]
“AI教父”辛顿现身WAIC:称AI将寻求更多控制权
Di Yi Cai Jing· 2025-07-26 06:27
这是辛顿首次访问中国并进行演讲。77岁的辛顿长期受腰椎间盘疾病的困扰,身体欠佳的他几乎无法坐飞机。 谷歌团队曾为邀请他去英国考察DeepMind团队特地包下私人飞机,并改造了座椅。 辛顿还在WAIC开幕前一天参加了第四届人工智能国际安全对话(International Dialogues on Al Safety,IDAIS),并 与20余名人工智能行业专家联名签署发布了《AI安全国际对话上海共识》。 在最新的演讲中,他谈及"数字智能是否会取代生物智能"的问题,并讨论了AI可能带来的挑战与潜在的应对方 法。辛顿此前已多次在公开信和演讲中指出,当前AI系统已经具备自主学习和演化的潜能。 辛顿指出,在过去60多年里,AI发展存在两种不同的范式和路径--以符号型的逻辑性范式以及以生物为基础的 范式。1985年,辛顿做了一个小模型,尝试结合这两种理论,以解释人们如何理解词汇。 "我认为,如今的大语言模型就是我当年微型语言模型的衍生。"他表示,"它们使用更多词作为输入,采用更 多层的神经元结构,由于需要处理大量模糊数字,学习特征之间也建立了更复杂的交互模式。但和我做的小模 型一样,大语言模型理解语言的方式与人类相似-- ...
自驾一边是大量岗位,一遍是招不到人,太魔幻了......
自动驾驶之心· 2025-07-26 02:39
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 自动驾驶的"怪圈"?一边岗位虚位以待,一边人才难觅踪影! 最近不少星友私信吐槽:"柱哥,明明看到各家自动驾驶公司招聘信息满天飞,HC也不少,怎么投了简历就石沉 大海,面试后就没下文了?公司是真缺人还是假招聘?","某招聘网站上,3-5年薪资就上百万了,他们到底在 招什么人?" ,"端到端VLA,实验室没算力没实习,感觉毕业就是失业" 。 作为经历过否词行业起伏的人来看,这再正常不过。现在的自动驾驶行业,兜里有钱(或者刚融到钱)的公司, 花钱比以往谨慎太多了! 市场预期回归理性,资本眼光更挑剔,"活下去"、"跑通商业模式"成为首要目标。烧 钱扩张的时代过去了,精打细算、聚焦核心、追求落地和盈利才是王道。行业深度调整和洗牌,可能就在未来1- 3年见分晓。 一个认真做内容的社区,一个培养未来领袖的地方。 星球内部目前已4000人,聚集了近100+自动驾驶行业专家为大家答疑解惑,总结了30+自动驾驶技术的学习路 线!星球还为大家邀请了数十位自驾&大模型领域的嘉宾,都是活跃在一线产业界和工业界的大佬(经常出现的 顶会和 ...
股指期货短线高手是市场波动中的精准舞者,擅长从混沌中提炼规律
Sou Hu Cai Jing· 2025-07-25 13:02
股指期货短线高手是市场波动中的精准舞者,以敏锐的观察力捕捉日内趋势变化,用果断的操作在短周期波动中寻找机会,他们的成功并非依赖运气,而是 源于扎实的功底与理性的策略。 对他们而言,盘口语言是重要的信息源。分时图上的成交量变化、买卖挂单的动态调整,都被转化为判断短期方向的信号,这种对细节的敏感,让他们能在 行情启动初期便察觉端倪,抢占先机。 严格的纪律是短线操作的生命线。设定明确的止盈止损点,无论行情如何波动都坚决执行,不因贪心放过离场时机,也不因侥幸拖延止损,这种自律性让每 笔交易都有明确边界,避免情绪化操作。 他们擅长从混沌中提炼规律。通过大量复盘总结日内波动特征,比如特定时段的惯性走势、关键点位的支撑阻力效应,将这些规律转化为可复制的策略,让 操作从随机尝试变为有章可循。 快速决策能力是长期训练的成果。短线机会稍纵即逝,高手们能在几秒内完成对行情的判断与下单,这种反应速度背后,是对市场逻辑的深刻理解与肌肉记 忆般的操作熟练度。 他们的成长轨迹激励着后来者。从最初的频繁犯错到逐渐稳定盈利,从机械执行策略到灵活应变,这个过程证明短线操作的核心是可习得的技能,只要肯投 入时间打磨,普通人也能在短线交易中找到属于 ...
ICCV‘25 | 华科提出HERMES:首个统一驾驶世界模型!
自动驾驶之心· 2025-07-25 10:47
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 今天自动驾驶之心为大家分享 华中科技大学&旷视科技 最新的工作! 首个统一驾 驶世界模型HERMES,BEV+世界查询协同优化3D驾驶场景,生成误差降三成! 如果您有相关工作需要分享,请在文末联系我们! 自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一 步咨询 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 论文作者 | Xin Zhou等 编辑 | 自动驾驶之心 概述 自动驾驶领域中,驾驶世界模型(DWMs)已成为核心工具,但现有模型存在明显割裂:一类专注于场景 生成,能预测环境演化(figure 1(a)),却难以解读、描述环境或回答相关问题;另一类以视觉语言模型 (VLMs)为代表,擅长场景理解,可处理复杂查询、生成描述(figure 1(b)),但缺乏对未来场景的预测 能力。 为打破这种割裂,本文提出HERMES——一个能同时实现3D场景理解与未来场景生成的统一框架(figure 1(d))。其核心创新在于通过BEV表示整合多视图空间信息,并引入"世界查询"机制, ...
小米申请文本处理方法等相关专利,保证专项任务良好效果同时不降低其他任务处理效果
Jin Rong Jie· 2025-07-25 08:26
专利摘要显示,本公开是关于一种文本处理方法、文本处理装置及存储介质。文本处理方法包括:获取 文本描述信息,文本描述信息包含待处理文本和文本处理任务的任务类型,文本处理任务由大语言模型 执行,大语言模型用于处理待处理文本;通过预先训练的判别器判别文本描述信息,确定文本处理任务 的任务类型;基于文本处理任务的任务类型,通过大语言模型处理待处理文本,将处理后的待处理文本 确定为目标文本,并输出目标文本;其中,大语言模型包括前缀编码器。通过本公开,通过判别器判别 待处理文本的任务类型,通过包括前缀编码器的大语言模型根据任务类型执行文本处理任务,在保证针 对专项任务具备良好效果的同时,针对其他任务的处理效果也不会下降。 作者:情报员 天眼查资料显示,北京小米移动软件有限公司,成立于2012年,位于北京市,是一家以从事互联网和相 关服务为主的企业。企业注册资本148800万人民币。通过天眼查大数据分析,北京小米移动软件有限公 司共对外投资了4家企业,参与招投标项目137次,专利信息5000条,此外企业还拥有行政许可123个。 北京小米松果电子有限公司,成立于2014年,位于北京市,是一家以从事零售业为主的企业。企业注册 ...
港科大&北京人形提出LOVON:足式机器人开放世界全域目标追踪新范式!
机器之心· 2025-07-25 04:29
本文一作彭道杰,香港科技大学广州在读博士生;共同一作曹嘉航,北京人形机器人创新中心实习生;共同一作张强香港科技大学广州在读博士生,北京人形机 器人创新中心学术委员会主任;通讯导师马骏,香港科技大学广州&香港科技大学助理教授。 在复杂的开放环境中,让 足式 机器人像人类一样自主完成 「 先跑到椅子旁,再快速接近行人 」 这类长程多目标任务,一直是 robotics 领域的棘手难 题。传统方法要么局限于固定目标类别,要么难以应对运动中的视觉抖动、目标丢失等实时挑战,导致机器人在真实场景中常常 「 迷路 」 或 「 认错对象 」 。 香港科技大学广州联合北京人形创新中心 重磅推出的 LOVON(Legged Open-Vocabulary Object Navigator)框架,为这一难题带来了创新性的解决方 案。它首次将大语言模型(LLMs)的任务规划能力、开放词汇视觉检测的泛化能力,以及精准的语言 - 运动映射模型融合在一起,让 足式 机器人在动 态、非结构化环境中也能高效完成长程目标导航,实现了足式机器人在开放世界中对动态目标的长视野精准追踪,兼容 Unitree Go2、B2、H1-2 等主流 平台,用「即 ...
速递|高盛、红杉等持续跟投,AI合规独角兽Vanta获1.5亿美元融资,估值飙至41.5亿美元
Z Potentials· 2025-07-25 03:24
图片来源: Unsplash Vanta 在一轮 1.5 亿美元的新融资中估值达到 41.5 亿美元,其价值增加数十亿,表明投资者对运用人 工智能的企业充满兴趣。 本轮融资由新晋投资方威灵顿管理公司(Wellington Management)领投,现有投资方高盛另类投资旗下 的成长型股权基金、红杉资本、 摩根大通集团以及由投资人 David Sacks 联合创立的风投机构 Craft Ventures 也参与了本轮融资。 Vanta 的CEO 克里斯蒂娜·卡乔波( Christina Cacioppo )表示,公司计划利用新融资扩大人工智能产 品线,她指出近期 AI 技术突破使该初创企业的工具。标志着投资者对运用人工智能简化复杂企业流 程公司的浓厚兴趣。 此次交易使 Vanta 的估值从一年前融资时的 24.5 亿美元大幅提升,自 2021 年以来累计融资额已达约 5.04 亿美元。 成立于 2018 年的 Vanta 致力于开发帮助企业合规管理及存储客户数据的软件。这家初创企业已积累 12,000 家客户,覆盖科技、金融服务和医疗保健领域。目前 Vanta 正寻求将业务拓展至国家和地方政 府层面。 Chr ...
北大-灵初重磅发布具身VLA全面综述!一文看清VLA技术路线与未来趋势
机器之心· 2025-07-25 02:03
机器之心发布 机器之心编辑部 如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。研究者开始探索如何将这种智能从数字世 界延伸至 物理空间 ,以实现 具身智 能 。这其中最受关注的前沿方向之一,便是 视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA) 。此类模 型借助基础模型的通用能力与大规模学习范式,可以处理通用的视觉(Vision)与语言(Language)输入,并生成实时动作(Action),极大地赋能了机器人系 统。 近两年来,VLA 相关研究爆发式增长,技术路线日新月异 —— 但这也造成了认知碎片化与理解上的困难。现有分类方法如 "大脑 - 小脑"、"快慢系统"、"分层 - 端到端" 等,直觉清晰但本质仍不明确。 领域急需系统化的分析框架,以梳理研究现状,指明未来方向。 为此, 北京大学 - 灵初智能联合实验室首次从动作词元化(action tokenization)视角,提出统一理解 VLA 模型的新框架 。综述系统分析了八种主流 action token,探讨了不同动 ...
24小时环球政经要闻全览 | 7月25日
Sou Hu Cai Jing· 2025-07-25 00:17
| 市场 | 名称 | 现价 | 涨跌 | 涨跌幅 | | --- | --- | --- | --- | --- | | 欧美 | 道琼斯工业平均 | 44693.91 | -316.38 | -0.70% | | | 纳斯达克 | 21057.96 | 37.95 | 0.18% | | | 标普500 | 6363.35 | 4.44 | 0.07% | | | 欧洲斯托克50 | 5355.2 | 10.95 | 0.20% | | | 英国富时100 | 9138.37 | 76.88 | 0.85% | | | 法国CAC40 | 7818.28 | -32.15 | -0.41% | | | 德国DAX | 24295.93 | 55.11 | 0.23% | | | 俄罗斯RTS | 1121.55 | -19.37 | -1.70% | | | 上证指数 | 3605.73 | 23.43 | 0.65% | | | 深证成指 | 11193.06 | 134.02 | 1.21% | | | 创业板指 | 2345,37 | da 34.7 | 1.50% | | | 恒生指数 | 256 ...