Workflow
文生图
icon
Search documents
高速事故发酵,雷军首次回应;OpenAI估值3000亿美元,孙正义投的;金价连续新高,老铺黄金收入和利润也是丨百亿美元公司动向
晚点LatePost· 2025-04-01 15:36
雷军和小米汽车回应小米 SU7 高速交通事故。 4 月 1 日,小米公司发言人微博表示,2025 年 3 月 29 日 22 时 44 分,一辆小米 SU7 标准版在德上 高速公路池祁段行驶过程中遭遇严重交通事故,并造成 3 人死亡。据初步了解,事故发生前车辆处 于 NOA 智能辅助驾驶状态,以 116km/h 时速持续行驶。 据小米汽车公告,事发路段因施工修缮,用路障封闭自车道、改道至逆向车道。车辆检测出障碍物 后发出提醒并开始减速。约 1 秒后,驾驶员接管车辆进入人驾状态,NOA 功能退出。驾驶员持续 减速并操控车辆转向,随后车辆与隔离带水泥桩发生碰撞,碰撞前系统最后可以确认的时速约为 97km/h。 4 月 1 日晚间,小米汽车发布公告,称基于目前已知情况,仅能确定事故车起火并非自燃,推测系 猛烈撞击隔离带水泥桩后,整车系统严重受损导致,并表示由于尚未接触到事故车辆,暂时无法进 一步分析起火原因,以及事故时车门是否可以打开。雷军也首次公开回应此事,称 "代表小米承 诺:无论发生什么,小米都不会回避,我们将持续配合警方调查,跟进事情处理的进展,并尽最大 努力回应家属和社会关心的问题。" OpenAI 向免 ...
OpenAI复制吉卜力,大模型正在吞噬一切产品?
创业邦· 2025-03-28 10:32
Core Viewpoint - OpenAI's release of the GPT-4o model significantly enhances text-to-image generation capabilities, surpassing competitors in various aspects, including detail accuracy and user control [4][7][10]. Group 1: Product Features and Innovations - The GPT-4o model allows paid users to generate and modify images directly within ChatGPT, eliminating the need for separate models like DALL-E [4]. - The model's ability to generate images with high fidelity and detail consistency is a notable improvement over previous models, which often struggled with text clarity and image realism [7][10]. - GPT-4o introduces a more intuitive user experience, allowing users to provide simple conversational prompts rather than complex, precise instructions [10][20]. Group 2: Technical Advancements - The underlying technology of GPT-4o is based on a full-modal approach, enabling it to generate various data types, including text, images, audio, and video [13][14]. - The model employs an autoregressive method for image generation, contrasting with the diffusion model used by many competitors, which enhances the sequential creation of images [13][14]. - OpenAI has significantly improved the text-image alignment capability, allowing for more accurate interpretations of user prompts compared to traditional models [14][16]. Group 3: Market Impact and Competitive Landscape - The advancements in GPT-4o threaten existing startups in the text-to-image generation space, as the model's capabilities can render many previously developed tools obsolete [10][21]. - The rise of "Vibe Coding" reflects a shift in programming and creative processes, where users can generate code or images with minimal input, relying on the model's advanced capabilities [19][20]. - The competition in the AI space may increasingly favor larger companies with the resources to develop and train large models, potentially sidelining smaller startups that focus on niche optimizations [22][23].
OpenAI 复制吉卜力,大模型正在吞噬一切产品?
晚点LatePost· 2025-03-27 14:45
题图由 GPT-4o 生成,提示词是"请你根据下面这句话生成一个吉卜力风格的图像:周围有一圈人,看着一个机 器吐出图像"。 文 丨 贺乾明 编辑 丨 黄俊杰 新产品发布两天后,在 OpenAI 创始人山姆·阿尔特曼(Sam Altman)的推文下,有人祝贺他十年努力终 于带来了 AGI——社交网络上全是吉卜力图像 "All Ghibli Images"。 3 月 26 日,OpenAI 更新 GPT-4o 文生图功能。付费用户可以在 ChatGPT 直接调用 4o 生成、修改图 片,不再需要使用 OpenAI 的文生图模型 DALL-E。仅仅一天时间,近年影响较大的照片和 meme 图都 被 4o 重做了一遍,最流行的就是宫崎骏的画风。 左右滑动查看 人人都用生成吉卜力画风不仅仅因为宫崎骏对世界的卓绝贡献,也因为 OpenAI 的引导——阿尔特曼在 GPT-4o 新功能发布的直播里选择生成吉卜力风格的三人自拍照。但其实 GPT-4o 生成其他风格效果通常 也不错。 文生图已经不新鲜,此前也有文生图产品能实现风格化效果。比如 Midjourney 年付费用户可以改照片风 格,Stable Diffusion 也 ...
活动报名:我们凑齐了 LCM、InstantID 和 AnimateDiff 的作者分享啦
42章经· 2024-05-26 14:35
清华交叉信息研究院硕士,研究方向为多模态生成,扩散模型,一致性模型 代表工作有 LCM, LCM-LoRA, Diff-Foley · 王浩帆 硕士毕业于 CMU,InstantX 团队成员,研究方向为一致性生成 代表工作有 InstantStyle, InstantID 和 Score-CAM · 杨策元 42章经 AI 私董会活动 文生图与文生视频 从研究到应用 分享嘉宾 · 骆思勉 LCM、InstantID 和 AnimateDiff 这三个研究在全球的意义和影响力都非常之大,可以说是过去一整年里给文生图和文生视频相关领域带来极大突破或应用 落地性的工作,相信有非常多的创业者都在实际使用这些作品的结果。 这次,我们首次把这三个工作的作者凑齐,并且还请来了知名的 AI 产品经理 Hidecloud 做 Panel 主持,届时期待和数十位 AI 创业者一起交流下文生图、文生视频 领域最新的研究和落地。 PhD 毕业于香港中文大学,研究方向为视频生成 6/01 | 13:00-14:00 (周六) 北京时间 美西时间 5/31 | 22:00-23:00 (周五) 活动形式 线上(会议链接将一对一发送) ...