Midjourney V7

Search documents
腾讯研究院AI速递 20250617
腾讯研究院· 2025-06-16 14:55
生成式AI 一、 GPT-5训练背后隐藏大佬 , 靠一篇 Muon 博客入职OpenAI 1. 研究员Keller Jordan仅凭一篇关于Muon优化器的博客文章成功加入OpenAI,可能正用于 GPT-5训练; 2. Muon是针对神经网络隐藏层的优化器,采用牛顿-舒尔茨迭代法实现更新矩阵正交化,训 练速度比AdamW快; 3. Keller批评优化器研究文献充斥未 能 被采用的方法,提倡在竞争性训练任务中验证新方法 有效性。 https://mp.weixin.qq.com/s/_Fw2pT9Y4Gxb3z5Tmg6ogA 二、 谷歌AI路线图,要抛弃注意力机制?Transformer有致命缺陷 1. 谷歌AI路线图承认现有Transformer注意力机制无法实现无限上下文,需要在核心架构层 面进行全新创新; 2. Gemini未来将成为谷歌的"统一线程",连接所有服务并向"主动式AI"转变,支持全模态能 力和智能体功能; 3. 谷歌重组AI团队,将研究与产品团队整合到DeepMind,加速创新节奏,Gemini 2.5 Pro 是 重大转折点。 https://mp.weixin.qq.com/s/S ...
速递|用8000万授权数据挑战Midjourney,Freepik的生成式AI版权新解法
Z Potentials· 2025-04-30 04:25
图片来源: Freepik 在线平面设计平台 Freepik 于周二发布了一款新型"开放" AI 图像模型,该公司称该模型仅基于商业授权、"适合工作环境"的图片进行训练。 该模型名为 F Lite ,包含约 100 亿个参数——参数是构成模型的内部组件。 据 Freepik 透露, F Lite 是与 AI 初创公司 Fal.ai 合作开发,并利用 64 台 Nvidia H100 GPU 耗时两个月训练完成。 F Lite 加入了基于授权数据训练的小型但不断增长的生成式 AI 模型行列。 推特原文:我们已秘密研发数月!终于能分享它,感觉太棒了! • 常规版:更可预测且忠于提示,但艺术性较低: https://t.co/MyWsKer9Ir • 纹理版:更为混乱且易出错,但能呈现更佳的纹理效 pic.twitter.com/GX5mIpYE8O (@javilopen) 2025 年 4 月 29 日 生成式 AI 正成为针对 OpenAI 和 Midjourney 等 AI 公司的版权诉讼核心。 这类技术常利用来自网络公开渠道的海量内容(包括受版权保护的材料)进行开发。多数开发此类模型的公司主张合理使用原则 ...
AI视频进入「真4K时代」?近期AI新鲜事还有这些……
红杉汇· 2025-04-16 14:19
视频创作新巅峰! 谷歌DeepMind推出Veo 2 在AI视频生成的战场上,谷歌终于亮出了底牌:4月16日,Veo 2正式登陆Gemini Advanced。 Veo 2生成:一只戴着超大眼镜的小老鼠在舒适的森林巢穴里,在蘑菇的灯光下看书的动画镜头。 Veo 2可以最高生成8秒720P电影级视频 (理论上可生成4K分辨率视频,但受限于当前工具链,实际输出暂为 720p,谷歌计划年内开放4K长视频生成) ,在运镜、文本语义还原、物理模拟、动作一致性等方面非常优 秀,同时支持图片转视频功能——这是谷歌迈向多模态生成系统的重要一步。 Veo 2生成:太平洋海岸线宁静的美丽景致。 作为谷歌DeepMind团队的最新力作,Veo 2在原有基础上实现了大升级: 首先是 电影级创作工具 :Veo 2能 自动移除视频中的干扰元素 ,并利用Outpainting功能扩展画面,生成与 原视频无缝衔接的新片段。此外, 内置"无人机视角""延时摄影""镜头平移"等电影级拍摄参数 ,用户只需 输入文字描述,即可生成符合好莱坞叙事逻辑的分镜。再加上 静态图转视频 技术,这让AI视频创作更加便 捷。 其次是 多模态协同与数字水印保护 。 ...
一个万能文生图提示框架,人人都能成为专业AI设计师
Hu Xiu· 2025-04-07 07:45
Core Insights - The article introduces a universal prompt framework for AI image generation, aiming to bridge the gap between creative ideas and AI capabilities, enabling users to drive design with their thoughts [2][92] - The framework allows even novices to unlock professional-level AI creative abilities without prior knowledge of design or AI [5][6] - It enhances the efficiency and quality of image generation for professional creators by automatically generating and optimizing prompts based on user intent [6][9] Group 1: Framework Advantages - The framework alleviates the "black box" nature of AI image generation, improving the interpretability of prompts and allowing for manual adjustments while learning [7][42] - It automatically generates bilingual prompts in Chinese and English, eliminating the need for manual translation and reducing prompt distortion [8] - Users can achieve significant improvements in image generation quality, comparable to model iterations, by utilizing this framework [9] Group 2: User Interaction and Process - The process is intuitive, allowing users to input vague creative ideas into the framework, which then generates professional prompts for AI [35][39] - The AI can clarify ambiguous user requirements and provide multiple potential prompt options based on its understanding [44][45] - Users can modify and optimize generated images by simply providing additional instructions, making the process more efficient than traditional methods [62][63] Group 3: Application Examples - The article provides examples of how the framework can be applied across various design fields, including interior design, jewelry design, and product rendering, showcasing its versatility [71][75][82] - High-quality visual outputs are achieved through the framework, demonstrating its effectiveness in generating detailed and realistic images [56][60][88] Group 4: Future Implications - The framework represents a significant advancement in human-AI collaboration, transforming vague creative ideas into stunning visual works [92][96] - It emphasizes that AI is not merely a replacement for human creativity but a tool that liberates original creative impulses, enhancing the creative process [98][99]