多模态数据处理

Search documents
来火山引擎「算子广场」,一键处理多模态数据
Cai Fu Zai Xian· 2025-08-15 10:59
为应对企业数据处理从单一模态向多模态需求的转变,火山引擎多模态数据湖方案持续升级。 8月13日,在 FORCE Link AI 创新巡展·青岛站,火山引擎宣布旗下产品AI 数据湖服务 LAS 上线"算子 广场",该功能进一步增强了企业对文本、图像及音视频的处理能力,加速企业知识资产的自动化流通 与增值。 以社交平台智能化内容审核为例,传统人工审核面临海量内容导致的效率瓶颈、人力成本高昂,以及内 容遗漏带来的合规风险。 火山引擎为该企业提供了多模态数据湖方案,在算子广场能力的支撑下构建了自动化审核体系: 1.视频逐帧解析: 自动抽取关键帧,分离画面、音频及字幕文本; 2.多模态特征提取: 利用OCR、语音识别、图像分析等算子提取文本、语音和视觉特征; 3.融合判定决策: 结合多模态模型联合分析特征,精准识别风险内容。 今年6月,火山引擎发布了AI数据湖服务LAS,作为大模型时代的数据底座,LAS适配多模态数据,提 供湖存储、湖管理、湖计算三大核心能力,助力企业释放数据资产的全部价值。火山引擎数据产品解决 方案负责人萧然表示:"企业数据就像冰山,水面上能用的结构化数据只是小部分,水面下90%以上的 非结构化数据长 ...
当虹科技正式发布BlackEye Vision机器人超远距离远程操控系统
Zheng Quan Ri Bao Wang· 2025-08-06 07:15
本报讯 (记者吴文婧)8月6日,杭州当虹科技股份有限公司(以下简称"当虹科技")发布消息,公司 于8月5日正式首发BlackEyeVision机器人超远距离远程操控系统并宣布已正式投入商用。 据了解,目前该系统已通过前装和后装两种方式,应用于机器狗、巡检机器人等产品,并在应急救援、 工业巡检等场景中快速发挥作用。未来,针对家庭等其他轻量化场景,也能实现实时互动并远程操控。 这一解决方案是目前国内极少数实现商业化的超低延时机器人远程操控方案,其具有超低延时RTC服 务、低码率高画质、超低延时音视频编解码、点云处理、边云结合AI能力、灵活设备控制、全场景服 务等能力。 当虹科技相关负责人表示,BlackEyeVision系统的发布和商用是当虹科技进军机器人领域的第一步,公 司将持续推动智能视频技术在多元场景的落地与创新。 此外,该系统方案可同时处理视频、音频、激光雷达、图像、信令、文本等多模态数据;支持关键信息 智能提取与环境语义理解;支持边端结合的AI赋能。 据悉,该系统建立在三大技术突破之上,直击当前机器人远程操控的痛点。当虹科技采用自研帧级编码 技术,实现端到端80毫秒内超低延时传输,比人类神经反应极限(约 ...