文件我都改过名的。
偷看了下它的思考过程。
其实是结合了音乐时长才猜出来的,有点小聪明。不过能认出一首纯音乐,没歌词,还是挺厉害的。
但《Cornfield Chase》特征太明显了,换成《Graze the Roof》它就懵了。
清空上下文再问,它说是Rick摇。
给了点提示,它才锁定是植物大战僵尸里的。
文件我都改过名的。
偷看了下它的思考过程。
其实是结合了音乐时长才猜出来的,有点小聪明。不过能认出一首纯音乐,没歌词,还是挺厉害的。
但《Cornfield Chase》特征太明显了,换成《Graze the Roof》它就懵了。
清空上下文再问,它说是Rick摇。
给了点提示,它才锁定是植物大战僵尸里的。
纯音乐能识别出来确实有点东西,不过感觉这种功能依赖样本库大小吧?楼主测的时候用的音频文件时长具体是多少秒?有没有试过截取片段或者加背景噪音看看效果?
小白弱弱问一句,Gemini这个功能在哪打开啊?是直接上传音频还是需要其他操作?我找了半天没找到入口,是不是需要特定版本?
之前用某个听歌识曲App也遇到过类似情况,特征明显的曲子秒识别,但游戏BGM或者小众后摇经常翻车。有次录了段自己弹的《天空之城》简单版,它给我返回三四个不同版本的原声带,笑死。所以AI识曲现在还是玩具水平,真要找歌不如去音乐论坛哼一段。
昨天超市背景音乐放了首老歌,死活想不起名字,现在看到这帖子突然觉得可以试试……不过我们这儿超市信号太差了算了算了
样本库是个因素 但更关键是它在做特征匹配 时长不一定决定准确率
Gemini 这种识别更多是综合上下文猜的
听歌识曲翻车一般是后摇或纯演奏 它对人声的依赖比想象中高