Workflow
歸藏的AI工具箱
icon
Search documents
从搜索到解决方案:解锁火山 DeepSearch 的“三连跳” MCP 玩法
歸藏的AI工具箱· 2025-04-24 09:34
最近真是捅了 MCP 窝了,上周火山开了一次开发者见面会,发布了挺多东西的,主要有: RTC 硬件这个也不太好测试,主要我也不懂,而且需要硬件,这次主要试一下 DeepSearch 服务。 其实现在所谓的 Agents 服务主要的任务和内容还是基于AI 搜索信息的加工和再整理,这部分是核心,也是 非常吃技术能力的地方。 火山把这部分能力变成应用之后对于开发者来说省了很多事情,人人都能搞 DeepSearch 了。 效果怎么样 先来一个最常见的问题和测试旅游规划。 即使这种看起来简单的任务很多 AI 搜索其实做的不好,看着内容输出很多,很多都是各个景点介绍的废话。 用户其实需要的是实时性比较强的信息,比如交通怎么安排,怎么样可以顺路,一些危险的项目需要准备哪些 东西等。 正式发布了豆包深度思考模型 Doubao-1.5-thinking-pro 和全新的视觉理解模型 Doubao-1.5-vision- pro,这个咱们上周介绍过了,视觉推理非常强大, 感兴趣可以去看我的测试 。 还发布了方舟 × RTC 硬件:把端侧自动唤醒与云端大模型语音能力一次打包,让玩具、家居、穿戴等设备 一键升级为能与人自然实时对话的 ...
藏师傅的网页生成提示词 3.0| 原来 Gemini 2.5 Pro 这么强
歸藏的AI工具箱· 2025-04-23 08:32
早上群里有个朋友说自己用 Gemini APP 里面的深度研究搞了一个特斯拉 Q1 财报的分析文档,另一个朋友 说转成网页,我就说我试试。 我直接把他的文档和我最近探索出来的提示词就放到了 Chatwise 里面,以往我都是用 Claude 3.7 生成网页 的,这次默认是 Gemini 2.5 Pro,我也没看就按下了回车。 没想到生成的网页炒鸡惊艳,Gemini 的网页内容很多同时理解了提示词提到的设计风格,非常漂亮。 可以看图也可以在这里预览: https://kueaqan0fo.app.yourware.so/ | | | | | | $0.41 | 可比 -13% YoY | 同比 -16% YoY 网比 +154% YoY | | Acknowledged uncertainty, 94 update planned. Unusual admission of political/brand impact. | | | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | | FRITTY les a 2025 01 ...
不会 3D 也行?教你用AI创建非常酷炫的 NFT 3D 卡片动画
歸藏的AI工具箱· 2025-04-23 08:32
昨天在推特上刷到一个老哥用 4o 和可灵做的的品牌 3D 卡片看起来很惊艳。 所以昨天下午就尝试复刻和发散看看有什么其他玩法,没想到真的搞出来了,整个工作流还是很有价值的,而 且这套思路可以用在很多其他地方,这里教大家一下。 先看一下结果,我这里发散的是生成类似 NFT 的装备卡片,然后我们可以给这些装备卡片编一个背景故事搞 一个网站展示,让这些视频看起来更具价值一些。 我们先来看第一部分这部分的主要学习的部分是 json 的提示词写法,他把需要修改的部分都抽象成了变量 名,这样我们就不需要管核心部分的提示,只需要在改变的时候填写下面卡片内容的部分就行。 另外这种方法也可以快速创建很多风格一致的图片,比如我上面的三个卡片都是一样的风格。 这里我改了一下提示词,将整套提示词的主题变为了游戏装备这样的话整体做成视频之后表现力会好些,而且 更加契合。 用 Json 方式的提示词,这样方便产出一致性很高的图片,只需要改参数部分的文案就行 将图片用可灵 1.6 的首尾帧生成视频,首帧和尾帧一样的图片和提示词写法需要学习 最后是视频的展示部分,这部分是我加的,教大家用剪映让你的视频更出彩 把跟展示无关的部分改为了中文方便 ...
沉浸式翻译再发神器,PDF翻译终极解决方案,重要的是依然良心
歸藏的AI工具箱· 2025-04-23 08:32
沉浸式翻译我相信只要是 AI 圈子的人基本上人手一个,甚至你如果经常看海外内容不可能没有。 他可以用 AI 或者常规翻译生成整个网页的多语言对照翻译,还有连按三下空格将输入框的中文翻译为英文这 个神级技能。 除了体验很好之外还非常良心,免费提供几乎无限量的谷歌翻译额度,而且几乎适配了所有的模型 API,你可 以随意填写自己的。 然后前几天我发现他们发了个新功能: Babeldoc,支持在翻译 PDF 的时候保持文件的原始排版,而且还能 完整提取 PDF 内嵌的图表、脚注、公式等⾮⽂本元素。 刚开始我是不信的,过去这一两年相信大家都用过很多类似 PDF 翻译工具了,都知道这玩意想要翻译的同时 保持排版有多难。 我随手拿一个论文 PDF 试了一下,我去这玩意真的,整个 PDF 的排版真的一点都不带差的。 之后就用我们最近比较热的几个 PDF 试了试,真的很猛,各位可以看一下详细的测试。 另外翻译好的 谷歌提示词 PDF 和 HAI 2025 年人工智能报告的文件我也会放在文章后面 ,感兴趣的可以领 取。 先来点低难度的常见的论文,一般都不会有非常复杂的排版,难点主要在图表和表格以及公式上。 比如常见的论文开头部分 ...
藏师傅 AI 编程全流程教学:Trae重磅更新MCP和Agent能力
歸藏的AI工具箱· 2025-04-22 03:08
在 Claude 3.7 和 Deepseek 之前我很少玩 AI 编程。因为自己是非专业开发者,AI 模型能力不够搞的很痛 苦。 Claude 3.7 和 Thinking 模型更新后我看到了新希望,也产出了一 系列网页生成提示词 ,让很多人认识到开 发尤其是简单的前端开发没那么难。 我之前的提示词主要还是让大家生成展示的网页的,涉及到复杂功能还是不太好搞。 最近也用 AI 做了很多小的工具网页,迭代了一套自己的 AI 编程(Vibe Coding)方案。 Trae 发布了四大重磅功能(MCP、自定义规则、智能体、上下文理解),其能力已与 Cursor、Windsurf 看 齐、甚至体验更胜一筹 。例如可以自定义智能体,配合上MCP和prompt,能一次集结多个专属AI专家,为我 所用。 先介绍一下Trae新增的4个功能: 所以我觉得是时候了, 这个教程将会用 Trae 教你如何写一个有相对复杂功能的网页,藏师傅精心编排下也 融入这四个能力顺便教会你怎么用。 智能体创建: 支持基于提示词和MCP工具自定义智能体,@即可使用,不需要每次都输入复杂指令 智能工具(MCP): 支持MCP,而且内置了常用的,只需要 ...
扣子空间体验-带你看没有繁琐配置的MCP有多强大!
歸藏的AI工具箱· 2025-04-21 02:57
还记得第一次被我的 MCP 案例惊艳到的瞬间吗? "MCP 真强,想象力无限"——这句话我说了太多次,但每次向朋友们展示时,却总被卡在了"你先装个 环境""申请个 API ""改一下命令"这些门槛前。前天晚上教橘子的时候折腾好久,他还算有技术能力 的。 对没有开发背景的普通人来说除了打字提需求前面的每一步都很难。 好在大厂都不是傻子,都从Demo里面看到了机会。 扣子空间( https://space.coze.cn/ )来了,它不只是一个工具,而是你的"AI工作搭子". 可以直接调用内置的MCP服务让AI结合多个MCP完成非常复杂的任务,比如调研之后把结果做成PPT 或者网页,甚至网页内还能嵌入生成的音频和图片。 用户对于AI能力的需求是没有止境的,显然在看到很多MCP的Agents案例轰炸后,大家已经都不满足 于只是用能够使用有限工具的模型了,周五一上线直接就爆火,每个群都在找邀请码。 这篇内容除了 介绍基础的使用方式 以外,藏师傅还会用自己之前玩MCP的经验 教你用三个案例探索 扣子空间的能力上限, 文章最后有邀请码 。 基础用法 先来简单介绍一下扣子空间怎么用。 进入到页面之后除了你输入提示词需要的输 ...