Workflow
图像
icon
Search documents
中国芯片首富掌舵,国产手机CIS巨头豪威集团冲刺A+H
Guan Cha Zhe Wang· 2025-07-01 10:20
6月27日,全球前十大Fabless(无晶圆厂)半导体公司之一、图像传感器巨头上海韦尔半导体股份有限 公司,继将公司名称变更为"豪威集成电路(集团)股份有限公司"(简称"豪威集团")后正式递表港交 所。 截止2024年12月31日,豪威集团共有超过5300名全球员工,超过4800项知识产权。公司设计和开发高性 能集成电路,主要涵盖图像传感器解决方案、显示解决方案和模拟解决方案三大产品线,能够满足智能 手机、汽车、医疗、安防及新兴市场等多种高增长行业的需求。公司的收入主要来源于图像传感器解决 方案、显示解决方案、模拟解决方案、半导体分销业务等。其中图像传感器解决方案是公司的核心业务 之一,2022年、2023年和2024年分别贡献了136.75亿元、155.36亿元和191.90亿元的收入,占总营业收 入的比例分别为68.3%、74.0%和74.7%。图像传感器广泛应用于智能手机、汽车、医疗、安防等领域, 随着这些市场的发展,图像传感器解决方案的市场需求持续增长。 豪威集团初始注册股本为人民币500万元。于多轮股份转让和注资完成后,直至A股于2017年5月在上海 证券交易所上市前,注册股本达到人民币3.744亿 ...
免费约饭!加拿大ICML 2025,相聚机器之心人才晚宴
机器之心· 2025-07-01 09:34
2025 年已经过半,AI 领域依旧发展迅速。 作为最直观、最具感官冲击力的技术方向之一,图像、视频生成也迎来了前所未有的突破与热潮。 以扩散模型为代表的生成方法不断刷新着图像合成的质量上限,使得 AI 创作在分辨率、风格控制、语义理 解等维度上实现跨越式提升。而在此基础上,视频生成进一步打开了人们的想象空间。比如 Google 最近发 布的 Veo 3,首次实现了原生音频的同步生成,真正将视频生成带入有声电影时代。 而这些技术的跃升,离不开研究者们不断的交流与合作。 ICML 作为 AI 领域最具影响力的学术会议之一,汇聚了世界顶尖的研究成果。今年 ICML 将于 7 月 13 日至 7 月 19 日在加拿大温哥华会议中心举行。 想必很多从业者将前往现场参会,除了密集高强度的会议日程之外,不妨也为自己预留一些时间,参与一 场更轻松、更自由的线下交流活动「云帆・ICML 2025 AI Talent Meetup」。 这是一次聚焦前沿技术与人才对话的特别聚会,由机器之心与上海人工智能实验室、东方菁汇、全球高校 人工智能学术联盟共同发起,诚邀大家参加「云帆・ICML 2025 AI Talent Meetup」 ...
一家店十个摄像头,被拍不知情?实测公共场所摄像头标识情况
Nan Fang Du Shi Bao· 2025-06-30 06:43
近日,北京市网信办对部分网络摄像头设备开展远程技术排查发现,仅未授权访问漏洞类问题就发现 200余个,这种情况下无需身份验证就可以获取摄像头控制权限,查看到实时监控画面。集成大量摄像 头设备的管理平台问题尤为突出,某监控系统综合管理平台问题检出率高达35%。 今年上半年,《公共安全视频图像信息系统管理条例》《人脸识别技术应用安全管理办法》相继施行, 保护摄像头图像信息安全有了更充分和具体的依据。前者规定,公共安全视频系统管理单位应当完善防 入侵、防病毒、防篡改、防泄露等安全技术措施,定期维护设备设施,保障系统连续、稳定、安全运行 等。 除了保障摄像头免遭入侵,上述两份文件还就公共场所监控设备、人脸识别相关技术应用提出更多合规 要求,包括公共安全视频系统管理单位应为图像采集设备设置显著的提示标识。近日,南都记者选取居 民小区、地铁站、高校、商场、公园、餐厅六类场所实地走访,实测发现了多数场景下的摄像头周围缺 乏相关标识等诸多问题。 多地出手整治摄像头人脸识别违规滥用 如今,公共场所的摄像头在守护公共安全方面发挥着巨大作用,但不法分子利用设备漏洞,将其变 成"窥私工具"的现象也时有发生,严重危害着个人权益。南都记 ...
图像界的DeepSeek!12B参数对标GPT-4o,5秒出图,消费级硬件就能玩转编辑生成
量子位· 2025-06-30 00:38
鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 图像模型开源还得是FLUX! Black Forest Labs刚刚宣布开源旗舰图像模型 FLUX.1 Kontext[dev] ,专为图像编辑打造,还能直接在消费级芯片上运行。 只有小小的 12B ,更少的参数,更快的推理,性能更是媲美 GPT-image-1 等一众闭源模型。 现在FLUX.1 Kontext[dev]可以让小狗迅速离开画面,为小老鼠戴上胡须,添加文字、修改背景也不在话下。 或者多次输入指令, 直到让小哥成为酒吧里最靓的崽(bushi) ,直到让画面符合咱们需求。 具体来说,FLUX.1 Kontext[dev]的主要特点有: 网友们也立马上手试玩,制作了一个旅行的CPU青蛙? 1. 可以根据编辑指令直接更改现有图像,以及进行精确的 本地和全局编辑 。 2. 不用做任何微调,就能 直接引用 里面的人物角色、风格样式和物品元素。 3. 允许用户通过 多次连续编辑 优化图像,同时将视觉漂移降到最低。 4. 专门为NVIDIA Blackwell进行了 权重优化 。 旅行必备的墨镜,还有抗寒的帅气红色毛衣也要准备妥当。 (蛙蛙:出片,我势在必 ...
玻色子采样用于量子AI图像识别 为现实应用打开新窗口
Ke Ji Ri Bao· 2025-06-29 23:22
十多年来,玻色子采样(一种基于光粒子的量子计算协议)一直被视为证明量子计算优于经典计算的重 要里程碑。尽管已有实验表明玻色子采样难以用经典计算机模拟,但其实际用途一直尚未明确。日本冲 绳科学技术大学院大学研究团队近日在《光学量子》期刊上报告,他们首次将玻色子采样用于图像识别 这一关键任务,为量子人工智能(AI)在现实世界中的应用打开了新窗口。 团队仅使用三个光子和一个线性光学网络,就构建出可用于图像分类的量子AI系统。图像识别广泛应 用于刑侦分析、医学诊断等领域。团队此次提出的低能耗、混合型量子方法展现出极强潜力,向量子 AI的落地迈出关键一步。 玻色子(如光子)遵循玻色—爱因斯坦统计。要理解玻色子采样的原理,可以想象一个"弹珠钉板"游 戏:把一颗颗弹珠从上方放下,弹珠会在钉子间碰撞、反弹,最后落到下方的格子里,落点多集中在中 间位置,形成一个类似钟形的分布图。但如果把弹珠换成光子,情况就完全不同了。光子不像弹珠那样 只是"撞来撞去",它们具有波动性,就像水波一样,可相互叠加、干涉。这种干涉效应让它们在穿过一 个复杂光学网络时,产生出极为复杂的落点分布,不再是简单的对称图形,而是一个连超级计算机都难 以准确预 ...
10 人 1600 万美金 ARR,华人团队 OpenArt 用了这 11 个 AI 技术栈
投资实习所· 2025-06-29 11:53
华人团队做的 OpenArt,在 10 人团队的情况下已经将 ARR 做到了 1600 万美金,其 CEO Coco Mao 陆 陆续续分享了不少经验,这几点我觉得挺有价值: 1.定位:如何找准自己的定位 早期,OpenArt 面临的问题是定位:在一个快速演进的市场中,如何找到自己的定位?当时的 AI 图像生 成市场群雄并起——Midjourney 凭借其艺术化的输出赢得了设计师的青睐,DALL-E 以技术实力著称,而 无数新创公司都在争夺这个看似无限大的蛋糕。 最初的几个月里,我们每天都在问自己同一个问题:OpenArt 与 Midjourney 或 Ideogram 有什么不 同?说实话,在核心功能和技术层面,所有产品都非常相似。 从表面看,OpenArt 确实很难与竞争对手区分开来——都提供文本到图像的生成功能,都使用类似的 AI 模型,都面向创意工作者。但很快她意识到, 真正的差异化往往不在于技术本身,而在于用户体验和使用 场景的精准把握。 经过几个月的探索和用户反馈,OpenArt 团队确定了三个核心用户群体: 2.增长:SEO 驱动的爆发式增长 到 2024 年底,OpenArt 已经在 AI 图 ...
浙大学霸夫妻创业,干出个龙头!如今要上市!
Guo Ji Jin Rong Bao· 2025-06-28 14:16
近日,长春长光辰芯微电子股份有限公司(下称"长光辰芯")递交港交所招股书,拟在港交所上市,中信证券和国泰君安国际是联席保荐人。 IPO日报注意到,长光辰芯在连亏两年后2023年实现了扭亏为盈,但仍未能登陆科创板,如今转道港交所。长光辰芯质地如何? 来源:张力 扭亏,毛利率下滑 据悉,长光辰芯成立于2012年,诞生于"新中国光学摇蓝"的中科院长春光机所,是国产高性能CMOS(互补金属氧化物半导体)图像传感器龙 头企业,目前主要提供机器视觉、科学仪器和专业影像应用领域的产品及定制服务。 长光辰芯提供九大产品系列,超过50种标准产品,广泛适用于工业成像、科学成像、专业影像和医疗成像等先进技术领域。此外,长光辰芯还 提供定制传感器解决方案。 根据咨询机构弗若斯特沙利文的资料,全球CIS(CMOS图像传感器)市场预计将于2024年至2029年加速增长,总收入预计将由2024年的1391 亿元增至2029年的2103亿元,复合年增长率约为8.6%。就2024年的工业成像收入而言,长光辰芯在全球CIS公司中排名第三,在中国CIS公司中排 名第一,占全球市场份额的15.2%。就2024年的科学成像收入而言,长光辰芯在全球CI ...
放榜了!ICCV 2025最新汇总(自驾/具身/3D视觉/LLM/CV等)
自动驾驶之心· 2025-06-28 13:34
Epona: Autoregressive Diffusion World Model for Autonomous Driving SynthDrive: Scalable Real2Sim2RealSensor Simulation Pipeline for High-Fidelity Asset Generation and Driving DataSynthesis 这次ICCV很热闹啊!ICCV25放榜了,陆续有工作放出。自动驾驶之心也给大家盘点下这次中稿的一些工作! 注:部分工作前期已经来到我们自动驾驶之心知识星球做过分享。更多内容欢迎扫码加入我们的自驾社区,第 一时间掌握所有动态。 【视频+解析】 DriveArena: A Controllable Generative Simulation Platform for Autonomous Driving Boost 3D Reconstruction using Diffusion-based Intrinsic Estimation StableDepth:Scene-Consistent andScale-Invariant Monocu ...
ICCV 2025不完全汇总(具身/自驾/3D视觉/LLM/CV等)
具身智能之心· 2025-06-27 09:41
【视频+解析】DriveArena: A Controllable Generative Simulation Platform for Autonomous Driving Boost 3D Reconstruction using Diffusion-based Intrinsic Estimation Epona: Autoregressive Diffusion World Model for Autonomous Driving SynthDrive: Scalable Real2Sim2RealSensor Simulation Pipeline for High-Fidelity Asset Generation and Driving DataSynthesis StableDepth:Scene-Consistent andScale-Invariant Monocular Depth CoopTrack: ExploringEnd-to-End Learning for EfficientCooperative Sequential Perception U-ViLAR: Uncertai ...
收到迪斯尼110页诉讼起诉,却让用户疯狂,Midjourney到底做了什么?
3 6 Ke· 2025-06-26 02:02
最近,一场围绕AI生成图像版权的风暴引爆了科技与创意圈。 迪士尼和环球影业联手对一家名叫Midjourney的初创公司发起法律诉讼,理由是它生成的图像可能侵犯了旗下视觉资产的版权。这是AI工具首次如此直接 地挑战好莱坞内容霸主的"审美主权"。 可讽刺的是,这家公司却在全球创作者社区持续爆火:它没有界面,没有按钮,甚至连App都没有,用户只需在Discord里输入几句英文,就能在几秒内生 成极具艺术感的图像——梦幻、瑰丽、富有想象力,甚至远超专业设计师的表现力。 什么是Midjourney?它做成了什么? Midjourney是一个AI图像生成平台,用户只需输入几行文字(Prompt),系统就能输出高质量的图像。其技术底层基于Diffusion模型(扩散式图像生 成),与DALL·E、Stable Diffusion类似,但更强调"风格化""美学控制"和"用户体验"。 这款产品从2022年开始公测,短短一年多就吸引了超过1600万注册用户。不同于传统AI工具冷冰冰的功能式界面,Midjourney将产品完全寄托在Discord社 群上,用户之间像"晒朋友圈"一样晒Prompt和生成图,不断启发和模仿彼此,形成了 ...