Workflow
数据标注
icon
Search documents
一文读懂数据标注:定义、最佳实践、工具、优势、挑战、类型等
3 6 Ke· 2025-07-01 02:20
想知道自动驾驶汽车或语音助手等尖端人工智能系统如何实现其惊人的准确性吗?秘诀在于高质量的数据标注。这一过程确保数据被精确标记和分类,从而 使机器学习 (ML) 模型发挥最佳性能。无论您是人工智能爱好者、商业领袖还是技术远见者,本指南都将带您了解数据标注所需的一切知识 , 从基础知识 到高级实践。 一 为什么数据标注对于 AI 和 ML 至关重要 想象一下训练一个机器人识别一只猫。如果没有标记数据,机器人看到的只能是像素——一堆毫无意义的杂乱信息。但有了数据标注,这些像素就被赋予了 有意义的标签,例如"耳朵"、"尾巴"或"毛发"。这种结构化的输入使人工智能能够识别模式并做出预测。 关键数据:根据麻省理工学院的数据,80% 的数据科学家将超过 60% 的时间用于准备和注释数据,而不是构建模型。这凸显了 数据标注 作为人工智能基 础的重要性。 二 什么是数据标注 数据标注是指对数据(文本、图像、音频、视频或 3D 点云数据)进行标记的过程,以便机器学习算法能够处理和理解这些数据。为了使 AI 系统能够自主 工作,它们需要大量带标注的数据来进行学习。 它在现实世界的人工智能应用中是如何运作的 在新兴技术和新行业需求的 ...
一家数据标注公司,估值追上百度和理想汽车
雪豹财经社· 2025-06-24 15:53
最新估值2000亿 Fast Reading 作者 | 于米 一提到"数据标注公司",外界的印象通常是: 技术含量低、工作内容重复枯燥、依赖大量低成本人力完成简单机械的标注任务 ,例如给图片打标 ■ 数据标注公司Scale AI在2024年的营收为8.7亿美元,Meta出资143亿美元获得其49%股份,将 它的估值一举推高到了290亿美元。 ■ 这家公司的真正优势在于,它已经从一家单纯的数据标注公司,一跃成为能够深度参与数据 管理与模型训练流程的数据基础设施企业。 ■ 买数据、挖情报、抢人......Meta通过对Scale AI的收购,已经将硅谷的AI大战带到了新的高 度。 签、文本分类或音频转录。这类公司被视作AI产业链底层"苦力",利润微薄、附加值低,很难形成 核心竞争力或行业话语权。在公众眼中,它们更多是幕后无名的外包工厂,而非高科技创新企业。 你可能对290亿美元的估值没有概念。截至6月20日收盘,百度和理想汽车的市值分别是287.5亿美元 和263.6亿美元。 这是Meta历史上第二大投资,仅次于2014年以190亿美元收购WhatsApp。作为交易的一部分,Scale AI创始人兼CEO Ale ...
“数字蓝海”起宏图
Liao Ning Ri Bao· 2025-06-23 00:52
Core Insights - The company, Liaoning Hongtu Chuangzhan Surveying and Mapping Co., Ltd., has grown from a small startup with 4 employees and an annual output value of 500,000 yuan to a leading digital enterprise with thousands of employees and a peak annual output value of 800 million yuan, showcasing high growth potential and being recognized as a "gazelle enterprise" in Liaoning Province [1][2] - The company specializes in spatial information big data services and information system development, having obtained over 120 software copyrights and nearly 20 patents, along with more than 100 awards at national and provincial levels [1][3] - The company focuses on core technology areas of the future digital economy, including smart cities, high-precision navigation, autonomous driving, and digital twins, utilizing advanced technologies such as remote sensing, big data, IoT, cloud computing, and AI to provide high-quality, personalized solutions [1][3] Company Achievements - The company was recently recognized by the National Data Bureau as one of the four excellent cases from Liaoning Province for its project on high-quality spatial data collection for rural collective land, which has significantly improved land management efficiency and reduced land dispute rates by 42% [3][4] - The company has established partnerships with universities, including Wuhan University and Shenyang Agricultural University, to foster talent and technological innovation, contributing to the development of the spatial information field [5][6] - The company has obtained various industry certifications, including top-level surveying qualifications and multiple management system certifications, positioning itself as a comprehensive player in the data service market [6] Market Positioning - The company has successfully entered the intelligent driving sector by leveraging its expertise in navigation electronic maps, having obtained a top-level qualification in this area, and has built a robust service framework for various navigation and autonomous driving companies [7][8] - The company is actively investing in research and development in cutting-edge technologies related to three-dimensional digital twin data processing and sensor fusion, aiming to enhance the intelligence and adaptability of its smart driving maps [8][9] - The company has undergone mixed-ownership reform, setting a precedent for private surveying enterprises in the industry, reflecting its commitment to innovation and adaptability in a competitive market [9]
95后小伙的公司卖了1000亿,风向彻底改变
36氪· 2025-06-22 13:27
以下文章来源于盐财经 ,作者谭保罗 盐财经 . 洞察趋势,睿智人生。《南风窗》旗下专业财经媒体。 AI的风向变了。 文 | 谭保罗 编辑 | 江江 来源| 盐财经(ID: nfc-yancaijing ) 封面来源 | Pixabay 整个6月,全球科技界最受关注的事件,非Meta宣布收购Scale AI 49%的股权莫属。 如果不是担心美国越来越严格的反垄断法,这个股权占比或许更高。虽然没有绝对控股,但Meta志在掌控,所以施以"双重保险"——股权和人,都收入囊 中。 Scale AI的华裔创始人兼CEO Alexandr Wang将进入Meta工作,领导Meta的AI业务。 到底什么是数据标注?以自动驾驶业务为例,用一个简单场景来说明:自动驾驶AI模型需要用数据来训练,但厂商采集车采集的数据主要是道路影像,而现 有技术条件下,AI无法直接读取影像,因此就需要对影像进行标注。 原始影像经处理,变成三维的点云数据,标注就可以开始了。关键一步是标注语义信息,要让AI能识别这些信息,才能读懂图像。标注会很细,比如有车道 线标注、斑马线标注、红绿灯标注等。要知道,在很多技术条件平平的数据标注机构,标注是一帧一帧地完 ...
海天瑞声(688787):AI数据领军企业,全球化布局打造第二成长曲线
Soochow Securities· 2025-06-22 08:09
证券研究报告·公司深度研究·IT 服务Ⅱ 海天瑞声(688787) AI 数据领军企业,全球化布局打造第二成长 曲线 买入(首次) | [Table_EPS] 盈利预测与估值 | 2023A | 2024A | 2025E | 2026E | 2027E | | --- | --- | --- | --- | --- | --- | | 营业总收入(百万元) | 170.01 | 237.08 | 345.39 | 482.65 | 643.88 | | 同比(%) | (35.33) | 39.45 | 45.68 | 39.74 | 33.41 | | 归母净利润(百万元) | (30.39) | 11.34 | 31.69 | 55.70 | 90.63 | | 同比(%) | (203.16) | 137.31 | 179.54 | 75.77 | 62.71 | | EPS-最新摊薄(元/股) | (0.50) | 0.19 | 0.53 | 0.92 | 1.50 | | P/E(现价&最新摊薄) | (187.62) | 502.88 | 179.90 | 102.35 | 62.90 | [T ...
80后华人零融资创业:1/10人力营收规模超Scale AI,谷歌OpenAI大模型的“秘密武器”
3 6 Ke· 2025-06-21 00:02
零融资的"隐形数据标注之王",年收10亿超Scale AI。 智东西6月20日报道,多年来,数据标注在AI产业都处于较边缘地带。近期随着Meta斥资143亿美元收购Scale AI 49%股份,该领域成为人们关注的焦点。 但此类公司中营收规模最大的一家并非Scale AI,而是由一位80后华人埃德温·陈(Edwin Chen)创立的Surge AI。 Surge AI创立于2020年,定位高端数据标注服务,是谷歌、OpenAI、Anthropic等科技巨头的合作伙伴。 Surge AI的商业模式以高定价和高质量著称,收费 是Scale AI的2-5倍;2024年营收已达到10亿美元,高于Scale AI的8.7亿美元。但Surge AI至今仍未融资,且员工数仅为Surge AI的约1/10。 01.约1/10员工 实现超Scale AI的营收规模 37岁的埃德温·陈没有投资者,完全靠自己白手起家创办了这家至今已成立五年的公司。Surge AI拥有110名员工,在纽约和旧金山设有办事处。 陈将Surge AI打造成一家高端公司,收取高额费用,通常是Scale AI的2-5倍。Surge AI以其行业领先的声誉证 ...
Meta巨额投资Scale AI引连锁反应:AI数据标注市场需求激增
智通财经网· 2025-06-19 07:39
亚历克斯·拉特纳(Alex Ratner)把孩子哄睡后,正准备再工作几小时,突然得知Facebook母公司Meta Platforms Inc(META.US)将向AI数据标注领域领头羊——即AI初创公司Scale AI投资百亿美元。几分钟之 内,这位Snorkel AI掌舵者就接到了董事会数个电话,讨论如何争取那些担心Scale AI经营模式独立性的 客户们,尤其是像谷歌、微软以及OpenAI这样的超级客户。 接着是潜在客户们不断发起的询盘——他说短短一日内有数十家之多,在过去一周已形成"数千万美 元"级别的潜在交易,这些交易处于洽谈各阶段。"每一家负责任的大型语言模型(LLM)开发者都将在数 据服务供应商多元化上采取不少动作,"拉特纳表示,"市场将出现重大迁移和重大机会。" 毫无疑问,OpenAI 便是其中之一。这家因ChatGPT火爆全球而持续位列全球最顶级AI大模型开发者的 AI独角兽表示,正在逐步停止与Scale AI的业务合作。虽然 Scale AI仅占OpenAI 数据标注合同的一小部 分,但此举凸显出在Meta 庞大注资后,Scale AI面临的新挑战。 上周,Meta 宣布对AI独角兽Sca ...
扎克伯格豪掷150亿美元,投资28岁华裔“天才少年”
第一财经· 2025-06-14 16:01
2025.06. 14 目前,科技巨头正在开发尖端的AI大模型方面展开激烈的竞争。Meta于今年4月发布的首批Llama 4 大型语言模型被指未能达到预期性能,公司创始人扎克伯格面临投资人压力。为此,Meta正在奋力 反击。通过收购Scale AI并将亚历山大·王纳入麾下,Meta试图在尖端模型的开发方面赶超竞争对 手。 而由于担心Scale AI与Meta新建立的股权关系会令该公司失去中立性,导致数据外流风险,一些大 型客户正在考虑远离Scale AI。对此,Scale AI发言人在一份声明中表示,该公司致力于保护客户数 据,其业务涵盖与大型公司和政府的合作。 Scale AI的大部分收入来自向生成式AI模型构建者收取费用。有数据显示,2024年Scale AI的营收 约为8.7亿美元,谷歌在Scale AI的服务上花费了约1.5亿美元。由于Scale AI的核心业务集中在少数 客户身上,如果失去像谷歌这样的关键客户,该公司可能会遭受巨大损失。Scale AI未就此发表评 论。 本文字数:1954,阅读时长大约3分钟 作者 | 第一财经 钱童心 本周,Meta公司完成了一项金额高达近150亿美元的大型收购, ...
扎克伯格豪掷150亿美元,投资28岁华裔“天才少年”
第一财经· 2025-06-14 15:42
2025.06. 14 本文字数:1954,阅读时长大约3分钟 作者 | 第一财经 钱童心 本周,Meta公司完成了一项金额高达近150亿美元的大型收购,创下了该公司历史上的规模第二大 交易。这次Meta的收购标的是由华裔"天才少年"亚历山大·王(Alexandr Wang)创立的人工智能初 创公司Scale AI。 Meta将以高达148亿美元的资金获得Scale AI公司49%的无投票权股份,而作为交易的核心部分, 亚历山大·王将加盟Meta公司,有望领导Meta的"超级智能"部门。这位28岁的华裔"天才"也是这家硅 谷科技巨头收购Scale AI的主要目标所在。 谷歌等大客户流失风险激增题 亚历山大·王19岁那年从美国麻省理工学院辍学,创立Scale AI,并获得了包括Y Combinator、英伟 达、AMD风投、亚马逊、Meta等巨头科技公司投资。 Scale AI是一家数据标注公司。数据标注广泛应用于包括聊天机器人以及自动驾驶在内的人工智能的 各个领域。谷歌、微软、OpenAI以及马斯克的xAI都是Scale AI的大客户。今年年初,该公司的估 值已经达到140亿美元。在Meta入股后,Scale ...
入股Scale AI,扎克伯格为何豪掷150亿美元投资数据标注公司?
Di Yi Cai Jing· 2025-06-14 09:54
Meta将以高达148亿美元的资金获得Scale AI公司49%的无投票权股份,而作为交易的核心部分,亚历山 大·王将加盟Meta公司,有望领导Meta的"超级智能"部门。这位28岁的华裔"天才"也是这家硅谷科技巨 头收购Scale AI的主要目标所在。 本周,Meta公司完成了一项金额高达近150亿美元的大型收购,创下了该公司历史上的规模第二大交 易。这次Meta的收购标的是由华裔"天才少年"亚历山大·王(Alexandr Wang)创立的人工智能初创公司 Scale AI。 而由于担心Scale AI与Meta新建立的股权关系会令该公司失去中立性,导致数据外流风险,一些大型客 户正在考虑远离Scale AI。对此,Scale AI发言人在一份声明中表示,该公司致力于保护客户数据,其业 务涵盖与大型公司和政府的合作。 由于担心Scale AI与Meta新建立的股权关系会令该公司失去中立性,导致数据外流风险,一些大型客户 正在考虑远离Scale AI。 谷歌等大客户流失风险激增 亚历山大·王19岁那年从美国麻省理工学院辍学,创立Scale AI,并获得了包括Y Combinator、英伟达、 AMD风投、亚马 ...