Workflow
图像
icon
Search documents
性能媲美GPT-4o 和 Gemini2 Flash,阶跃星辰开源通用图像编辑模型Step1X-Edit
AI科技大本营· 2025-04-27 07:12
首创 MLLM 与 DiT 深度融合,阶跃星辰发布开源图像编辑模型 Step1X-Edit。 整理 | 梦依丹 出品丨AI 科技大本营(ID:rgznai100) 在图像编辑领域,开源模型正在加速追赶顶级闭源模型。近日,阶跃星辰正式发布并开源了图像编辑大模型 Step1X-Edit,在性能上达到当前开源体系 的 SOTA 水平,且性能可与 GPT-4o 与 Gemini 2 Flash 等闭源模型相媲美。 GEdit‑Bench 中每个子任务的 VIEScore,所有结果均由 GPT‑4o 评估 Step1X-Edit 由 19B 参数构成(7B 多模态语言模型 MLLM + 12B 扩散图像 Transformer DiT),具备语义精准解析、身份一致性保持和高精度区域级 控制三项核心能力。模型支持包括文字替换、风格迁移、材质变换、人物修图在内的 11 类高频图像编辑任务,能够灵活应对复杂的编辑指令。 在技术路径上,Step1X-Edit 首次在开源体系中实现了多模态语言理解与扩散图像生成的深度融合。模型能够解析参考图像与用户编辑指令,提取潜在 嵌入,并与扩散式图像解码器协同工作,生成符合预期的高质量编辑图 ...
阶跃星辰开源图像编辑模型Step1X-Edit:一键改图大师,性能达到开源SOTA
Founder Park· 2025-04-27 04:05
一句话总结:Step1X-Edit, 不只能"改图",更能"听得懂、改得准、保得住"。 开源链接与体验地址: Github: https://github.com/stepfun-ai/Step1X-Edit HuggingFace: https://huggingface.co/stepfun-ai/Step1X-Edit ModelScope: https://www.modelscope . cn/models/stepfun-ai/Step1X-Edit/summary 技术 Report: https://arxiv.org/pdf/2504.17761 阶跃星辰 . Step1X-Edit 首次在开源体系中实现 MLLM 与 DiT 的深度融合,在编辑精度与图像保真度上实现大幅提升。在最新发布的图像编辑基准 GEdit- Bench 中,Step1X-Edit 在语义一致性、图像质量与综合得分三项指标上全面领先现有开源模型,比肩 GPT-4o 与 Gemini 2.0 Flash。 以下文章来源于阶跃星辰 ,作者拥抱开源的 智能阶跃,十倍每一个人的可能。 阶跃星辰正式发布 并开源 图像编辑大模型 ...
这款百万人下单的网红热敷贴,连代言人都是假的
Yang Shi Wang· 2025-04-27 04:00
电商热销产品"苗古金贴",号称由传承"千年秘方"的非遗传承人制作,专门解决膝盖、颈椎等出现的问题。有电商平台数据显示,该产品列"热敷贴回购榜"第一 名,在某平台旗舰店已经销售10万件以上。 然而,记者深入调查发现,该"非遗传承人"的照片实为AI生成,"非遗传承人"证书由一家机构违规炮制。AI生成的"假非遗传承人"是如何为产品代言的?这是一条 怎样的产业链? "苗古金贴传承人"竟是AI生成? 山西的赵先生反映,他从短视频平台上看到苗古金贴的广告,自称该产品"为解决膝盖问题研发,再厉害的滑膜炎积液问题,一贴下去治愈,病情不反复"。赵先生 点击视频链接后跳转到电商平台店铺进行购买,在使用该产品后,他发现自己的膝盖积液病情越来越严重。 发稿前,记者在短视频平台搜索相关视频已不存在,但在赵先生给记者发来的留存视频中,仍可以看到商家是如何宣传的。 记者搜索发现,在多个电商平台,苗古金贴产品正在热销,付款人数超百万。在产品介绍页面上写着"第56代苗古金贴传承人"唐付政,生于贵州苗医世家,早年进 入"国医大学"深造……还被中国非遗人才库评定为苗古金贴非遗传承人,形成了特有的苗古金贴治疗方法,享誉四方。 仔细查看这位所谓的非遗 ...
韦尔股份(603501):手机、汽车CIS高增长,2024年业绩创新高
Huaan Securities· 2025-04-27 03:41
Investment Rating - The investment rating for the company is "Accumulate" (maintained) [2] Core Views - The company reported a significant increase in performance for 2024, with operating revenue reaching 25.73 billion yuan, a year-on-year growth of 22.4%. The net profit attributable to the parent company was 3.32 billion yuan, up 498.1% year-on-year, and the net profit after deducting non-recurring gains and losses was 3.06 billion yuan, a staggering increase of 2114.7% [6][7] - The growth in revenue and profit is primarily attributed to the recovery in demand from the high-end smartphone and automotive markets, along with an increase in market share [7] - The company’s image sensor (CIS) business achieved operating revenue of 19.19 billion yuan, accounting for approximately 74.8% of total revenue, with a year-on-year growth of 23.5% [10] Financial Performance Summary - For 2024, the company achieved a gross profit margin of 29.4%, an increase of 7.7 percentage points year-on-year [6] - The quarterly performance for Q4 2024 showed revenue of 6.82 billion yuan, a year-on-year increase of 14.9%, and a net profit attributable to the parent company of 0.95 billion yuan, up 406.4% year-on-year [6] - The company expects net profits for 2025-2027 to be 4.69 billion, 6.13 billion, and 8.42 billion yuan respectively, with corresponding EPS of 3.86, 5.04, and 6.92 yuan per share [7][11] Revenue Breakdown - The smartphone CIS product revenue was approximately 9.80 billion yuan, growing by 26.0% year-on-year, while automotive CIS product revenue reached about 5.91 billion yuan, increasing by approximately 30.0% [10] - Emerging markets and IoT products generated revenue of about 760 million yuan, reflecting a year-on-year growth of 42.4% [10] Valuation Metrics - The price-to-earnings (P/E) ratios for 2025, 2026, and 2027 are projected to be 31.60, 24.19, and 17.62 respectively [7][11] - The company’s return on equity (ROE) is expected to improve from 13.7% in 2024 to 19.3% by 2027 [11]
阶跃星辰开源图像编辑模型Step1X-Edit
news flash· 2025-04-27 03:11
阶跃星辰开源图像编辑模型Step1X-Edit 智通财经4月27日电,阶跃星辰4月27日宣布开源图像编辑大模型Step1X-Edit,性能达到开源 SOTA。该 模型总参数量为19B(7B MLLM + 12B DiT),具备语义精准解析、身份一致性保持、高精度区域级控 制三项关键能力;支持11类高频图像编辑任务类型,如文字替换、风格迁移、材质变换、人物修图等。 ...
18岁高中生开发APP年入上亿,却被15所名校拒收?网友质疑上学是为了退学~
菜鸟教程· 2025-04-23 11:09
最近,一位年仅 18 岁的高中生扎克·亚德加里(Zach Yadegari)在他的社交平台上透露 申请的 18 所大学中有 15 所顶尖名校拒绝了他。 之前他开发的 AI 卡路里追踪应用 "Cal AI" 取得巨大成功, 下载量超过 100 万,年收入更是一度逆天达到 3000 万美元,折合人民币逾2亿元。 GPA 4.0、ACT 34分(满分 36),远超多数藤校录取标准, 18 所申请大学中,15 所顶尖院校(包括 8 所常春藤)均发来拒信,仅佐治亚理工 学院等三所院校伸出橄榄枝。 Zach Yadegari 7 岁自学编程,12 岁推出首个应用,16 岁以 10 万美元出售自研网页游戏公司。 17 岁创立 Cal AI ,这是一款基于AI图像识别的卡路里追踪应用,用户拍照即可计算热量。 Make calorie tracking easy with Al Cal Al 1250 Just snap a picture of your food Just snap a picture of your food 9-30 (← Then let us do the rest Cal AI 应用上线一年下载量 ...
18岁高中生开发APP年入上亿,却被15所名校拒收?网友质疑上学是为了退学~
菜鸟教程· 2025-04-23 11:09
之前他开发的 AI 卡路里追踪应用 "Cal AI" 取得巨大成功, 下载量超过 100 万,年收入更是一度逆天达到 3000 万美元,折合人民币逾2亿元。 GPA 4.0、ACT 34分(满分 36),远超多数藤校录取标准, 18 所申请大学中,15 所顶尖院校(包括 8 所常春藤)均发来拒信,仅佐治亚理工 学院等三所院校伸出橄榄枝。 Zach Yadegari 7 岁自学编程,12 岁推出首个应用,16 岁以 10 万美元出售自研网页游戏公司。 17 岁创立 Cal AI ,这是一款基于AI图像识别的卡路里追踪应用,用户拍照即可计算热量。 最近,一位年仅 18 岁的高中生扎克·亚德加里(Zach Yadegari)在他的社交平台上透露 申请的 18 所大学中有 15 所顶尖名校拒绝了他。 Cal AI 应用上线一年下载量超300万,年收入达2400万美元,被《福布斯》评为"挑战传统行业"的明星产品。 Cal AI 提供了通过拍照来记录食物和追踪卡路里摄入的功能,它还显示了用户的一些健康目标,如体重目标和卡路里摄入量。 此外,还提供了食物的营养信息,包括蛋白质、脂肪和碳水化合物的含量,以及一个健康得分。 M ...
可媲美GPT-4o的开源图像生成框架来了!腾讯联手InstantX解决角色一致性难题
量子位· 2025-04-23 04:50
InstantCharacter 投稿 量子位 | 公众号 QbitAI GPT-4o带火的漫画风角色生成,现在有了开源版啦! 腾讯混元携手InstantX团队合作打破次元壁,开源 定制化角色生成插件——InstantCharacter 。 以往针对角色驱动的图像生成方法,都存在一定的缺陷。 例如,基于适配器的方案虽然基本实现主体一致和文本可控,但在泛化性、姿势变化和风格转换的开放域角 色方面仍然存在困难。基于微调则需对模型进行重新训练,从而浪费过长的时间。更不必说,费用高昂的推 理时间的微调。 为了更好地适应DiT模型,研究员提出了一种可扩展的 full-transformer适配器 ,它作为角色图像与基础模 型潜在生成空间之间的关键连接,通过增加层深度和隐藏特征尺寸实现可扩展性。 而现在这个插件基于 DiTs(Diffusion Transformers) ,能在保证推理效率和文本可编辑性的同时,完 美实现角色个性化创作。 那么一起看看它具体是如何实现的? 方法介绍 现代 DiTs与传统的UNet架构相比,展现出前所未有的保真度和容量,为生成和编辑任务提供了更强大的基 础。基于此,InstantChara ...
OpenAI发新模型o3和o4-mini!首次实现“图像思维”,可利用所有ChatGPT工具
硬AI· 2025-04-17 15:09
点击 上方 硬AI 关注我们 OpenAI周三发布新款AI模型o3和o4-mini,模仿人类的推理过程,解决复杂编程和视觉任务的推理。这是该公司首次推 出能够独立使用全部ChatGPT工具的推理模型——包括网页浏览、Python编程、图像理解和图像生成能力。同时,该公 司也发布开源AI agent CodeX CLI,用于帮助用户执行编程任务,从而改善市场竞争能力。 硬·AI 作者 | 赵雨荷 编辑 | 硬 AI OpenAI周三发布新款AI模型o3和o4-mini,模仿人类的推理过程,解决复杂编程和视觉任务的推理。同 时,该公司也发布开源AI agent CodeX CLI,用于帮助用户执行编程任务,从而改善市场竞争能力。 OpenAI此次推出的主要新型推理模型名为o3,同时还发布了一款更小型的模型,命名为o4-mini。这一发 布延续了去年9月OpenAI首个推理模型o1的问世,当时o1主要专注于解决复杂问题,并通过多步骤的方式 进行思考和作答。 该公司表示,新发布的o3模型在响应用户提示之前会花费更多时间进行计算,目标是解决与科学、数学和 编程相关的更复杂的多步骤问题。借助o3,用户可以上传白板笔记、草 ...
美图公司AI视觉领域竞争力升级:七项图像编辑成果出炉
Zheng Quan Ri Bao· 2025-04-09 08:40
Core Insights - Meitu's MT Lab has achieved significant recognition with five research outcomes selected for the prestigious CVPR 2025 conference, which received over 13,000 submissions and has a low acceptance rate of 22.1% [2] - The lab also had two projects accepted at the AAAI 2025 conference, which had an acceptance rate of 23.4% from 12,957 submissions [2] - The seven research outcomes focus on image editing, including three generative AI technologies, three segmentation technologies, and one 3D reconstruction technology [2] Generative AI Technologies - GlyphMastero has been implemented in Meitu's app Meitu Xiuxiu, providing users with a seamless text modification experience [3] - MTADiffusion is integrated into Meitu's AI material generator WHEE, allowing for efficient image editing with simple commands [3] - StyO is utilized in Meitu Xiuxiu's AI creative and beauty camera features, enabling users to explore different dimensions easily [4] Segmentation and 3D Reconstruction Technologies - The segmentation breakthroughs include interactive segmentation and cutout technologies, which are applied in e-commerce design, image editing, and portrait beautification [4] - EVPGS represents advancements in 3D reconstruction, with increasing demand in new perspective generation, augmented reality (AR), 3D content generation, and virtual digital humans [4] Industry Position and Future Potential - Meitu's long-term investment in AI capabilities has allowed the company to integrate cutting-edge technologies into practical applications, enhancing its competitive edge in the core visual field [4] - The continuous iteration of product capabilities has led to increased user engagement and willingness to pay, indicating promising growth potential and expansion opportunities for the company [4]