Workflow
夸克AI相机
icon
Search documents
高搜商给 AI 应用带来新方向
雷峰网· 2025-05-13 12:24
" 深度搜索的推出,是夸克探索通用Agent的关键一步。 " 作者丨马晓宁 编辑丨陈彩娴 从互联网诞生至今,搜索技术的演进深刻改变了人类获取信息的方式,人们对于搜索的倚赖,即使经历了 web端到App端的变迁,也从来没有减弱过。从某种程度上说,搜索已经深刻重塑了人类的认知模式、决 策方式和社会关系。 谈到搜索,我们就不得不提到推荐引擎。这正好是人类与信息交互的两种方式。搜索是用户主动发起,推 荐是用户被动接受,搜索是一次性交互,而推荐是系统要记住用户长期的兴趣偏好。推荐引擎在移动互联 网时代大行其道,因为它比搜索更简单更便捷。 搜索仍然是一次性的、需要用户在检索结果中自行判断的信息获取方式。检索结果难以匹配需求、操作麻 烦这些问题一直存在。所以到了LLM时代,AI搜索的出现成为了一个搜索跃进的契机,是在原有搜索结果 的基础上,增加了一部分通过模型能力生成的答案,在某些搜索场景中,将生成式答案置顶,后面接续原 有的搜索结果,使搜索结果更加一目了然。 最近半年来,人类与信息的关系正在快速演进。在一位搜索大模型专家看来,"AI工程师们已经意识到, 通过把长期的思考和推理过程融入到搜索系统中,能够实现比以往任何时候都 ...
可凭一图精准定位,当AI化身“赛博侦探”,隐私如何防护?
Nan Fang Du Shi Bao· 2025-05-12 04:32
当AI拥有了"视觉",会展现出什么样的能力?日前,OpenAI发布了最新大模型ChatGPT o3和o4-mini, 不仅能识别、理解画面内容,还能通过画面细节关联公开数据库,一步步推理出结论。南方都市报、南 都大数据研究院实测发现,ChatGPT o3可根据一张普通街道照片,精准定位照片拍摄位置。在AI新"进 化"出的强大图像理解与推理能力面前,如何兼顾个人信息保护成为亟待解决的新问题。 当AI开始"思考"图像 可通过一张照片精准定位 "用上GPT o3,人人都能当福尔摩斯。"曾经流行的看图猜地点"网络谜踪"游戏再次在社交平台上兴起, 但这次的最大赢家成了AI。 近日,OpenAI发布的最新大模型ChatGPT o3和o4-mini更新了视觉推理能力。不同于简单的图像识别, AI会像人类侦探般执行"观察-分析-验证"的完整思维链。网友发现,ChatGPT o3可根据一张照片中的种 种细节,例如植被特征、标志性建筑、车牌、甚至是一个特殊定制的餐盘,精准定位照片拍摄地点。 南都记者选取了三张照片进行实测,发现ChatGPT o3的确展现出较为精准的定位能力。对于第一张公 交站附近随手拍摄的照片,AI准确捕捉到了 ...
阿里夸克深度搜索:让AI更懂普通人的每一次需求本质
Tai Mei Ti A P P· 2025-05-12 00:41
阿里AI 旗舰应用——夸克,这一次率先给出了一个答案是:深度搜索(DeepSearch)。 5月8日,夸克AI超级框推出国内首个"深度搜索"产品,通过深度思考能力、智能检索技术和精准回答功 能,为用户"高搜商"地解决多样化复杂问题。 这是国内第一个面对亿级用户推出"深度搜索"的AI应用,夸克正在通过产品的不断迭代,破解"浅层搜 索"困局,掀起AI Agent的认知和应用革命。 作为阿里集团AI to C门面担当的夸克,"进化"的动作明显加快了,近期更是动作频频:先是发布了"AI 超级框",而后又发布全新AI相机,上新了"拍照问夸克"功能,再到现在领同行之先扔出了"深度搜 索"这枚炸弹。 毕竟,当对话式AI从单轮回答进化到多轮对话,是AI大模型惊艳人类的开端,而时至今日,人类对AI 的心理预期的阈值,被各种情绪冲击和裹挟之下,已经被拉得看不见天花板。 此时,任务流AI逐步走向舞台中心,承担了一个更为复杂的使命——理解上下文,主动拆解复杂需求 为子任务,协调资源并动态调整路径,甚至可以调度与整合外部系统。 这是AI从辅助工具向"眼里有活"的主动执行者的一次演变,而深度思考的推理能力,多模态理解与交 互,以及模型自 ...
加码多模态能力,夸克发布全新“AI相机”
Guan Cha Zhe Wang· 2025-04-28 09:29
Core Viewpoint - Quark AI Super Box has launched a new AI camera feature called "Photo Ask Quark," enhancing the search experience through visual understanding and reasoning capabilities [1][12]. Group 1: Product Features - The AI camera can identify locations from photos, assist in travel planning, and provide translations for foreign menus [3]. - It can also remove unwanted objects from images, adjust facial expressions, and generate social media captions [3]. - The camera acts as a life assistant by diagnosing appliance issues and suggesting purchases for damaged items [5]. Group 2: Health Applications - The AI camera can interpret medical reports, generate personalized health plans, and provide medication guidelines [7]. - It can create a tailored weekly meal plan based on health conditions like high uric acid levels [7]. Group 3: Work and Learning Support - The AI camera can enhance productivity by completing contracts from handwritten notes, solving complex calculations from images, and assisting with coding by adding annotations [10]. Group 4: Industry Context - The launch of the AI camera aligns with the growing trend of multimodal capabilities in AI, with competitors like OpenAI and Google also enhancing their models [13].
阶跃星辰开源图像编辑模型Step1X-Edit;阿里巴巴AI旗舰应用夸克发布全新“AI相机”丨AIGC日报
创业邦· 2025-04-27 23:48
扫码订阅 AIGC 产业日报, 3.【Meta Token-Shuffle登场:自回归模型突破瓶颈,可AI生成 2048×2048 分辨率图像】报道称Meta AI创 新推出Token-Shuffle,目标解决自回归(Autoregressive,AR)模型在生成高分辨率图像方面的扩展难 题。在语言生成方面,自回归模型大放异彩,近年来也被广泛探索用于图像合成,然而在面对高分辨率 图像时,AR模型遭遇瓶颈。不同于文本生成仅需少量token,图像合成中高分辨率图片往往需要数千个 token,计算成本随之暴增。这让许多基于 AR 的多模态模型只能处理低中分辨率图像,限制了其在精细 图像生成中的应用。尽管扩散模型(Diffusion Models)在高分辨率上表现强劲,但其复杂的采样过程和 较慢的推理速度也存在局限。(搜狐) 4.【Adobe发布Firefly Image Model 4模型:AI生图再升级】Adobe发布博文,推出Firefly Image Model 4和 Firefly Image Model 4 Ultra两款文本生成图像AI模型,并预告针对Photoshop和Illustrator的Crea ...
阿里巴巴AI旗舰应用夸克发布全新“AI相机”
news flash· 2025-04-27 03:57
4月27日,阿里巴巴AI旗舰应用夸克AI超级框发布全新AI相机,上新"拍照问夸克"功能。基于AI超级框 背后的视觉理解和推理模型能力,全新的夸克AI相机能深入理解用户意图,更好地实现视觉搜索、多 轮问答、图像处理与创作。(人民财讯) ...