歸藏的AI工具箱

Search documents
这宣传图也太上流了!藏师傅教大家如何用4o搭配提示词生成
歸藏的AI工具箱· 2025-05-19 08:58
今天橘子的新产品可以一分钟将任何内容变成播客的 ListenHub发布了,照例想用提示词为他做一张长图。 刚好这几天 Airbnb 的新拟物风格图标特别火,我就想能不能把拟物图标融合到长图网页里面去。 搞了一下结果真没问题,效果意外的非常好,整个图片的表现力高了非常多。 所以这篇内容教大家 如何用 4o 生成拟物图标搭配藏师傅网页提示词制作上流宣传图。 生成图标 首先我们需要生成对应的图标,这里模仿的是 Airbnb 的风格。 我们需要根据文章内容生成跟产品宣传内容搭配的图标这时候可以将 整篇文章 搭配下面的提示词都扔给 GP T,让他帮你分析出每部分用什么图标表示。 下面这是一篇产品介绍文章,如果我想要为他生成一个宣传图,上面主要介绍功能,我需要在卡片上生 成一些图标,帮我分析一下我应该生成哪些图标: 然后把 GPT 给出的图标对应物品填写到下面的提示词里面就行,右边就是我为ListenHub生成的九个图标。 然后将 GPT 推出来的图标词语放到提示词的[ ]里面,都是搭配左边第一张图片垫图使用。 几天我推了一个提示词出来,然后海外的一个设计师( x.com/hemeon/status/1923060589 ...
不会剪辑?一句话生成完整可编辑的视频:Medeo 带你看视频生成的未来
歸藏的AI工具箱· 2025-05-16 08:11
过去一年不断有人问我,"藏师傅有没有通过一个提示词生成整段视频的产品啊,我愿意付费"或者是"藏师 傅,我这里有口播稿和素材有没有能帮我剪辑的 AI 产品"。 我跟他们说的都是应该快了,马上就会有的,这次终于有了! Medeo( https://ai.medeo.app/create ):创作者的专属AI视频工作室。 无论你有多少素材,哪怕只有一句话,他都能帮你生成一个带口播、音乐的完整视频。 这篇内容我会用几个案例来展示这个产品有多强大,另外会介绍一些使用技巧。 先来看一些案例 最基础的能力是你提供素材或者口播稿,他会帮你完成剪辑并生成视频。 非常适合资讯类或者对内容控制要求高的需求。 而且你可以要求他严格按照你提供的口播稿生成视频,也可以提供信息之后让他自己发挥。 比如下面这个左边就是我提供了 Dia CEO 的发言之后让他自己发挥的,右边就是让他精准根据口播稿生成的 视频。 我还提供了一些 Dia 的截图和视频,如果不够的话他还会自己寻找素材匹配进去,整个成本非常低。 当别的信息搬运者还在复制文字的时候,你直接一个链接丢进去,已经出视频了。 下面这个科普视频,我整个提示词就只有这一段话,没有任何干预,所有 ...
Speech-02语音模型登顶国际榜单:完美复刻声音,同事听后难辨真伪
歸藏的AI工具箱· 2025-05-15 09:14
藏师傅很多时候早上上班和洗澡之前都是听音乐的,虽然我喜欢看小说, 但之前 对那种 AI 生成的音频听书 嗤之以鼻。 但是那天无意间用了一下起点新的听书功能 , 发现居然都这么牛了,前几天交流发现他们的语音生成服务居 然是用的 MiniMax 的 Speech 模型,而且就是我最喜欢那个「说书先生」的角色。 最近发现他们更新 的 Speech-02 音频模型, 在Artifici al Analysis 的 ELO 评价榜单上吊打 Open AI 和 Ele venLabs 一众海外音频模型,基本上霸榜了。 Hugging Face上,不出意外,也是第一名的成绩。 这次 Speech-02 最大的创新在于引入了可学习的说话人编码器,它能 从参考音频中提取音色特征,无需音 频转录 。基于这个就可以实现很多能力,比如 只需要一段 十几秒的 语言就能实现高质量的声音参考能力 ; 因为说话人编码器捕捉的是与语言无关的音色特征, 还能实现将音色迁移到别的语言上 ,这个对于内容出海 很有帮助; Speech-02还 带来了 非常高的可扩展性 ,音色可以用在情感控制、文本到音色、专业语音参考等下游任 务,不需要更换模型。 另 ...
不看这藏师傅篇深度拆解,你永远不知道Lovart AI有多可怕(有邀请码)
歸藏的AI工具箱· 2025-05-13 08:42
估计今天都被 Lovart AI 刷屏了,前段时间也受邀参加了测试,先看图了解一下产品基本能力。 当时看到 GPT-4o 的图片的时候,我就知道通用的设计 Agent产品出现的条件已经成熟,没想到是他们先掏了出来。 而且效果还这么好, 整个产品很好的兼顾了设计小白和专业用户,把设计门槛拉低到了令人发指的地步 。 无论你是个体户老板、营销人员、设计师、电商设计,只要你会打字,能够描述你的大致要求,哪怕只会打几个字你也可以获得高水准的设计产出。 流程深度拆解 先来看一个案例,这是个香水的视频广告,完成度非常高,,而我的提示词只有几十个字,而且从提示词来看我也没有指望他直接完成视频的制作,我写的都是为后 面做做视频做准备。 提示词:帮我为这个产品生成一个 30 秒广告需要的所有分镜图片,后续我会基于这些图片指导拍摄和生成视频 很多朋友可能对 AI 能全自动做出这个产品的难度没有概念。 我来一步一步深度拆解一下Lovart 的 Agent 是如何做的,同时看一下我的心路历程,后面我都傻了。 一般来说你肯定以为他要直接生成提示词开始画图了,但并没有,Lovart 进行了非常多的分析,比一些设计师都专业。 首先他根据我上 ...
AI也需要"记笔记":Karpathy从Claude 1.6万字提示词中看到的未来
歸藏的AI工具箱· 2025-05-12 08:28
LLM 的系统提示就是在对话一开始递给 AI 的"一页说明书",用来告诉它该扮演什么角色、遵守哪 些规则、用什么方式回答用户。 大概来看一下这么长的提示词里面主要都是一些什么内容: 而且整个提示词中充满了临时修改的的痕迹,这些修改往往没有使用 XML 或者 Markdown 格式的列表,就 是一段话,看起来像是针对一些热点事件或者问题修复打的补丁。 **Acknowledgments** I would like to thank my supervisor, for his kind of support. I would like to thank my supervisor, for his kind of support. 如果懒得看内容可以听一下,播客使用 listenhub 制作 前几天 Cluade 新的系统提示词泄露了,居然有 16,739 个单词,非常长。 相比之下,OpenAI 在 ChatGPT 中的 o4-mini 的系统提示有 2,218 个单词,只是 Claude 的 13%。 什么是系统提示词 Claude 整个系统提示词这么长维护和更新甚至版本控制应该都需要一个专门的流程,不然 ...
生成网页可以垫视频了?教你用 Gemini 2.5 最强大的能力
歸藏的AI工具箱· 2025-05-09 08:34
毕竟平时合作的前端开发给他视频不给参数的时候他连这个还原度都达不到。 我好像感觉自己发现了 Gemini 2.5 Pro 0506 版本最强的能力。 它可以根据你上传的网页交互视频,生成还原度非常高的网页效果!这篇内容顺便教大家如何更好地使用这个 能力。 这些效果往往是文字和图片难以描述的。 可以说这次的前端能力提升真正的将 Gemini 的多模态能力在开发领域释放了出来。 可以先看一下这个效果。 虽然在设计师看来他还原的还需要进行一些小优化,但是已经非常好了。 首先是一个前段时间看到的交互,一个邮箱地址包含了名字、网页、邮箱和 Ins 账号,同时 Hover 对应的图 标对应的文字就会高亮。 可以看到他搞的还是不错的,虽然有些小问题,比如图标不需要变色,有些细节丢了,比如虚线是需要保住一 部分文字的间距的。 先来介绍一下 Gemini 2.5 Pro 0506 这个版本 顾名思义这个是谷歌在五月六号发布的,他们也叫 I/O 版本,是为了 12 天之后的谷歌 I/O 大会发布准备 的。 谷歌说这个版本的主要更新内容是:在前端和用户界面开发方面实现显著改进,同时在基本编码任务如代码转 换和编辑以及创建复杂的智能 ...
设计师的 ChatGPT 时刻:Figma 这次把“设计即代码”玩成现实
歸藏的AI工具箱· 2025-05-08 08:55
自从 Cursor 和 AI 编程火了之后,AI 编程产品大概就分成了两类。 Cursor 和 Windsurf 这类 AI IDE: 这类产品具有本身 IDE 开发产品的所有能力,AI 是附加的,并且有补全、chat、Agents 三类主要的 AI 功 能,即使不使用这些 AI 能力你也可以用他们正常写代码开发。 V0 和 Lovable 这类 Vibe Coding 产品: 这类产品的特点是主要靠跟 AI 编码 Agents 对话来编码,所以他们虽然也有可以看代码的能力但是基本上也 就是只能看看了。 这两类产品面向的人群是完全不同的,但显然 Lovable 这种产品在用户群体的覆盖范围更大,毕竟人人都会 打字描述需求。 目前 Vibe Coding 的问题都挺明显的,很多时候很多需求只是通过语言不太好描述,而且不是所有人都懂开 发和设计中的一些术语。 当然 Lovable 之类的支持上传设计稿,但是目前的多模态模型还是不太能将单纯的图片信息映射到代码上, 尤其是一些设计细节,比如跟白色很接近的灰色,或者很细的描边。 Gemini 2.5Pro 的多模态和前端能力已经很强了,单纯从图片设计稿还原还是有些问题 ...
一图展示全部信息:提示词 + Figma 十秒精修,让长网页秒变封面(内有白嫖福利)
歸藏的AI工具箱· 2025-05-06 08:09
其实这个是从藏师傅的 3.0 网页生成提示词拓展而来的,如果你还没看 3.0 的提示词可以看看《 藏师傅的网 页生成提示词 3.0| 原来 Gemini 2.5 Pro 这么强 》。 上周 Orange 来找我说用我的 3.0 提示词把刚发布的千问 3 模型内容变成类似苹果发布会 PPT 的一图流展 示非常直观。 开头先来个福利: 我最近发现我自己的网页提示词在 Gemini 效果很好,但是 AI Studio 的 Gemini 2.5 是限速的。 谷歌现在 Gemini 应用会给学生免费到 2026 年,会在八月验证 edu 邮件,所以你起码 可以免费试 用三个月的 Gemini 高级版 ,这里点击 Get Offer 领取: https://gemini.google/students/ 上周发了个 DeepSeek-Prover-V2 的一图流介绍,一张图展示了 Prover-V2 的主要信息,非常清晰直观, 很多朋友都问怎么做的。 今天就教一下大家, 如何用提示词生成网页之后再将网页变成对应的图片,而且我还会教你怎么用 Figma 调 整生成之后的小问题,导出完美的图片 。 就是有个问题是生成的网页很 ...
设计速度提升100倍,质量翻10倍:豆包超能创意1.0体验
歸藏的AI工具箱· 2025-04-29 08:18
豆包前段时间新的图片模型的实力大家应该也看到了。 强大的提示词理解加上字体和营销图片生成能力直接让人人都能生成自己需要的营销图片或者进行字体设计。 就在前天 豆包又更新了超能创意 1.0 模式 ,我被灰度到了试了一下,给我整麻了。 图片的生成效率和修改效率大幅提升,让本来就很低的设计门槛又低了一大截。 我们可以先看个例子再介绍 我输入的提示词为: 参考下面的提示词帮我生成十个其他知名品牌的胶囊 16:9 图片,先基于品牌和主营业务更改提示词 中的内容然后在生成。 示例提示词为:一个高高的、外观逼真且充满活力的胶囊体水平漂浮着。它的左半边是标志性的星 巴克绿色,标有"Starbucks – Uplifting the Everyday"字样以及经典的美人鱼(Siren)标志。右半 边是透明的,里面填充着漂浮的烘焙咖啡豆、细腻的奶泡漩涡、手绘咖啡杯图标以及代表社区连接 的抽象暖色调线条,需要有背景色。 来看看他给我的结果,我根本没提要哪些品牌,也没提这些品牌的主营业务和典型产品。 他直接从LLM 模型拿到了这些知识然后还按照要求改了提示词 ,太离谱了,而且 这十张图片的生成速度比 4 o 一张都要快很多 。 我测 ...
AI 工具堆里最豪横的那一个:纳米 MCP 万能工具箱上手(内有邀请码和藏师傅手搓智能体)
歸藏的AI工具箱· 2025-04-28 10:45
上周真是 MCP 诞生以来热度最高的一周,大家扎堆发布 MCP 的 Agents 工具。 纳米也发布了自己基于 MCP 驱动的 Agents 服务 "MCP万能工具箱"。 这个工具箱不仅包含纳米AI自研的十几个MCP工具,还引入了近百个第三方MCP工具,工具总量目前位居国内第一。 MCP 工具覆盖办公协作、学术研究、生活服务、搜索引擎、金融、媒体娱乐、数据抓取等多个领域。 今天终于有空详细玩了一下,还基于纳米的能力做了一个 Agents 帮大家生成藏师傅同款的展示网页。 深度研究智能体 先来看一下深度研究智能体,这部分直接就可以用不需要你任何配置,直接调用纳米的规划、搜索能力最后帮你生成各种形式的展示内容。 你可以在纳米 AI 客户端左侧智能体的部分找到深度研究智能体的入口,然后点击使用就行。 这里除了可以搜索网上内容外,也支持搜索你自己个人知识库的内容,比如我这里就让他基于网络和我自己的知识库搜索 MCP 的相关内容并且生成对应的网页解 释和 PDF 文件。 他经过 20 分钟的搜索和思考之后给了一个非常详细的报告,PDF 里面的内容非常丰富,总共消耗了 47 万 Token,而且这些都是免费的。 比如 M ...