谷歌Gemini学会了看图作曲,你的朋友圈也能拥有专属BGM了
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 刚刚,Gemini摇身一变,成了专业的"唱作人"。 谷歌把最新的Lyria 3模型塞进了Gemini,直接在对话框里招呼一声,Gemini就能现场给你攒个乐团。 这套玩法主打一个有手就行,给它打一段天马行空的文字,或者干脆甩过去一张刚拍的照片,它几秒钟内就能根据你的想法,吐出一首带歌 词、旋律甚至人声演唱的完整作品,整个过程快得惊人。 而且还顺便拉来了Nano Banana模型当帮手,曲子刚生成完,一张风格特搭的专辑封面也就跟着出炉了。 总之,从你想出点子到拿到带封面的专属BGM,中间的步骤简化到了极点。 网友评价,48kHz的立体声质量,加上根据照片生成音乐的功能,可见DeepMind这一波非常注重创意工作流程。 你的照片能开口唱歌了 硬指标上,Lyria 3的音频采样率来到了48KHz的高保真级别。这种规格让生成的曲子底气特别足,每一声琴鸣都显得非常扎实,有了这个音 质底座,看图唱曲的功能才更有发挥空间。 你随手上传一张在森林徒步的照片,AI就能瞬间捕捉到那种静谧感,转手给你配上一段对味的民谣,让原本静止的风景瞬间有了自己的声音。 这下,你的朋友圈也 ...