Workflow
Whisper
icon
Search documents
北美匿名社交,为何总活不过三年?
创业邦· 2025-08-23 03:25
以下文章来源于霞光社 ,作者乌塔 霞光社 . 赋能企业全球化 来源丨 霞光社(ID:Globalinsights) 作 者|乌塔 编辑|李小天 图源丨Midjourney "北美还没有出现一个匿名社交的巨头。" 最近,某位社交类app的联合创始人如此向霞光社说道。 匿名社交在北美的历史并不短。 2012年,陌生人匿名社交App"Whisper "成立,仅两年月页面浏览量已经接近30亿。2013 年,"Secret"更是横空出世,一举拿下八个国家App Store下载榜第一。 它承载了大众自由表达的欲望,青少年用匿名应用讨论心理健康、性别认同等敏感话题,成年人用于 职场吐槽或表达政治观点。 藏匿着,暴走着 据We Are Social与Meltwater联合发布的《Digital 2025 July Global Statshot》,全球互联网用 户每周平均在社交媒体和短视频上消耗13小时48分钟,花在社交媒体上的时间已正式超过传统电 视。 毫无疑问的是,社交媒体正在成为最主流的沟通渠道。 弗洛伊德认为,压抑和宣泄是人的两种基本心理机制,人们需要向他人进行情感倾诉并从外界获得心 理慰藉和心理依靠。 在线下娱乐匮 ...
Anthropic天价赔款?大模型“盗版”的100000种花样
投中网· 2025-08-17 07:03
Core Viewpoint - The article discusses the ongoing legal battles surrounding AI companies and their use of copyrighted materials for training large models, highlighting the shift in focus from how data is used to how it is obtained [8][19]. Group 1: Legal Battles and Implications - In 2023, lawsuits against OpenAI and Microsoft initiated a wave of legal challenges in Silicon Valley, with major players like Meta and Anthropic also facing litigation for using copyrighted materials without authorization [8][9]. - The core issue revolves around whether the use of copyrighted works for AI training constitutes "transformative use" or "infringement" [8][19]. - A significant ruling in the Anthropic case indicated that while the training process may be transformative, the means of obtaining data, especially if involving piracy, is unlikely to be protected under fair use [9][19]. Group 2: Data Acquisition Methods - AI companies have employed various controversial methods to gather training data, often skirting legal boundaries [10]. - The initial method involved indiscriminate web scraping of publicly available content, which included copyrighted materials [11]. - A more severe issue arose when companies like OpenAI were accused of systematically removing copyright management information during data collection, indicating a deliberate intent to evade copyright laws [12]. Group 3: Innovative Yet Risky Techniques - As the availability of high-quality public data dwindled, companies began converting other formats, such as videos and books, into text for training purposes [13]. - OpenAI reportedly transcribed over one million hours of YouTube content using its Whisper tool, raising concerns over copyright infringement [13]. - Anthropic's approach involved purchasing physical books, scanning them, and then destroying the originals to argue that this was a legal format conversion rather than creating unauthorized copies [14]. Group 4: The Shadow Library and User Data - Some companies opted for high-risk strategies by directly utilizing resources from illegal libraries, such as "Library Genesis" [16]. - Others, like Google, leveraged user-generated content through privacy agreements, effectively internalizing user data for AI training without external scraping [17]. Group 5: Industry Transformation and Future Costs - The shift in litigation focus has transformed copyright holders from passive victims to key players with significant bargaining power in the AI industry [21]. - As AI companies face increasing legal scrutiny, the cost of acquiring compliant data is expected to rise significantly, marking the end of the "free data" era [20][21]. - The competition in the AI sector is evolving from purely algorithmic and computational prowess to include data supply chain management and legal compliance capabilities [21].
天罡智算“算力生态超市”上线,开启算力采购新篇
Sou Hu Cai Jing· 2025-05-13 14:37
一、为什么有算力生态超市? 在数字化浪潮中,算力已成为推动企业发展的核心动力。《"十四五"数字经济发展规划》提出构建全国 一体化算力网络体系等举措,为算力产业发展提供政策支持和广阔空间。沙利文预测2027年中国智能算 力总规模将升至1.5亿元,大模型的兴起成为这一增长的关键驱动力。 然而,当前算力市场面临诸多挑战,严重阻碍企业数字化转型。算力成本高、获取难、分配不均,AI 大厂存在"峰谷差",裸金属交易资源错配、流程繁琐。此外,市场交易以批发大宗为主,灵活性不足, 难以满足多样化的需求。响应速度也较慢,企业急需算力时难以及时获得,增加成本且易错失机遇。 为解决这些行业痛点,天罡智算"算力生态超市"应运而生,以创新的模式为企业提供一站式算力解决方 案,助力企业在数字化时代实现快速发展。 (二)AI市场——"智慧商品货架区" 传统超市的智慧商品货架摆放着前沿科技产品,为人们的生活带来便捷。"算力生态超市"的AI市场与之 相似,其核心"商品"为模型与数据集。自然语言处理领域的Llama、智能语音领域的Whisper、计算机视 觉领域的YOLO等,各搭配相应数据集,适配不同AI场景。 二、算力生态超市到底是什么?(算 ...
Qwen 3 发布,开源正成为中国大模型公司破局的「最优解」
Founder Park· 2025-04-29 12:33
阿里新一代的大模型 Qwen 3 今早发布,新旗舰 Qwen3-235B-A22B 的评测成绩,和 DeepSeek R1、Grok-3、Gemini-2.5-Pro 不相上下。这一代全系列模 型都支持混合推理,对 Agent 的支持也上了新台阶。 随着 Qwen 2.5 和 3 的发布,全球的开源模型生态也呈现了一种新形态:以 DeepSeek+Qwen 的中国开源组合,取代了过去 Llama 为主,Mistral 为辅的开 源生态。Qwen 系列的衍生模型目前已经是 HuggingFace 上最受欢迎的开源模型,衍生模型的数量也超过了 Llama 系列。而 DeepSeek 对于开源模型生态 的冲击和贡献,也有目共睹。 与大模型六小龙相比,主打开源的 Qwen 和 DeepSeek 无疑在国际市场赢得了更多开发者和创业者的关注,来自开源社区的代码贡献、更多优秀微调版本 的出现,也在以另外一种方式推动模型能力的进步。 可以说, 开源,正在成为中国大模型公司进入全球市场的最佳路径。 而对阿里云来说,Qwen+阿里云的配合,「模型-云-行业应用」的打法,走出了国内 MaaS 模式的新方向,也在很大程度上降低了国 ...
谷歌对齐大模型与人脑信号!语言理解生成机制高度一致,成果登Nature子刊
量子位· 2025-03-23 11:12
他们将真实对话中的人脑活动与语音到文本 LLM 的内部嵌入进行了比较,结果两者之间呈现线性相关关系。 比如语言理解顺序,首先是语音,然后是词义;又或者生成顺序:先计划,再发音,然后听到自己的声音。还有像在上下文预测单词,也表现 出了惊人的一致性。 白交 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌最新发现,大模型竟意外对应人脑语言处理机制?! 其论文发表在了Nature子刊。 网友表示:这个问题比大多数人意识到的要重要得多。 谷歌对齐大模型与人脑信号 他们引入了一个统一的计算框架,将声学、语音和单词级语言结构联系起来,以研究人脑中日常对话的神经基础。 他们一边使用皮层电图记录了参与者在进行开放式真实对话时 语音生成和理解 过程中的神经信号,累计100小时。另一边,Whisper中提取 了低级声学、中级语音和上下文单词嵌入。 然后开发编码模型,将这些嵌入词线性映射到语音生成和理解过程中的大脑活动上,这一模型能准确预测未用于训练模型的数小时新对话中语 言处理层次结构各层次的神经活动。 结果他们就有了一些有意思的发现。 对于听到的(语音理解过程中)或说出的(语音生成过程中)每个单词,都会从语音到文本模型中提 ...
OpenAI给所有模型做“身份卡”!一个页面读懂能力、速度、价格全指标
量子位· 2025-03-10 03:29
OpenAI的模型搞得太多太凌乱,官方自己都看不下去了。 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 为了厘清这些模型还有它们的各种版本,官方直接给做它们了一套 "身份卡" 。 每个模型"身份卡"都包含了能力、速度、支持模态、价格等信息,并且以图示+简单文本的形式呈现,既简洁又清晰。 而且还上线了对比功能,可以一次对比三个模型,直观比较之间各项指标的差异。 | GPT-4o mini | <> | GPT-4o Realtime | く) | GPT-4o mini Realtime | く> | | --- | --- | --- | --- | --- | --- | | | | Realtime | | | | | Fast, affordable small model for focused | | Model capable of realtime text and | | Smaller realtime model for text and | | | tasks | | audio inputs and outputs | | audio inputs and outputs | ...
速递|ElevenLabs发布独立语音检测模型,旨在精细化理解和转录语音
Z Potentials· 2025-02-27 04:09
图片来源: ElevenLabs AI 初创公司 ElevenLabs ,刚刚筹集了 1.8 亿美元巨额融资 ,主要以其音频生成能力而闻名。 该公司通过推出首个独立语音转文本模型 Scribe ,迈向了另 这家估值 33 亿美元的初创公司通过其庞大的语音库,已助力 众多企业提供语音转文本服务。 然而,该公司现正寻求进军语音检测领域,与 Gladia 、 Speechmatics 、 AssemblyAI 、 Deepgram 以及 OpenAI 的 Whisper 模型等竞争者一较高下。 ElevenLabs 的 Scribe 模型在发布时支持超过 99 种语言。 该公司将该模型中的超过 25 种语言归类为"优秀准确度"类别,其中词错误率低于 5% 。 该列表包括英语(声称准确率为 97% )、法语、德语、印地语、印度尼西亚语、日语、卡纳达语、马拉雅拉姆语、波兰语、葡萄牙语、西班牙语和越南 语。 其他语言则根据词错误率的高低分为不同类别:高( 5% 至 10% 词错误率)、良好( 10% 至 20% 词错误率)和中等( 25% 至 50% 词错误率)。 ElevenLabs 将 Scribe 的定价定为每小时 ...