【AI唱歌】再次进化！6分钟学会用AI唱歌，杀疯了！

作者: Jack-Cui分类: 计算机技术发布时间: 2023-04-24 17:35:00 浏览:471937 次

直奔诸葛孔明四轮儿车:
1.图是AI的[doge] 2.视频是AI的[doge] 3.音频是AI的[doge] 4.配音也是AI的[doge]

睡中仙躺中杰:
AI谱曲，AI填词，AI演唱，这样华语乐坛是不是有救了

【回复】哈哈哈，有了有了，至少能当死马医了[脱单doge]
【回复】嗯嗯这几年出现了不少这类的算法不过目前看人类还是完胜[doge]
【回复】回复 @我是深海鲸 :我更不会去听你家哥哥的垃圾唱功的，放心
阁屿:
我打算训练up，让他出我喜欢的视频[脱单doge]

【回复】那首先需要看下我所有的视频[doge][脱单doge]
【回复】回复 @Jack-Cui :这个广告打得深得我心，毫无反感，我觉得你说的对[给心心]
Aiden也叫阿登:
终于跑通了前来还愿，补充下可能会踩到的坑： 1.音频文件不要带中文或者奇怪的符号不然第二步就会报错 2.最后一步最终上传音频的时候，需要保证音频为16位，否则转换会报错，可以通过软件Audition打开音频，按F11直接转换

【回复】您好！训练聚类模型时发生了一个错误，没有生成Kmeans文件，最终音色转换没成功，请问怎么解决？谢谢！报错信息: ValueError: n_samples=6757 should be >= n_clusters=10000.
【回复】回复 @啊哈哈哈雀食 :大佬我问下我训练了一天一夜 44K显示0步数什么原因
【回复】第二步报错的是不是UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 20
东海帝皇vv:
声音是很像，就是身体不动只动嘴有点奇怪[笑哭]

【回复】再结合stablediffusion的真人转ai视频。甚至可以做个演唱会出来
【回复】回复 @Jack-Cui :前两天看到一个项目，可以让图片中的人物动起来，github搜animatedDrawings
Sand沙拉酱:
大佬我练了快23小时了模型权重文件都有83200步了但训练还没停止它要什么时候才会训练完自己停止呢还是说我现在可以直接关掉训练程序强制停止呢

【回复】看最上面的那串数字，越小越好，20以下差不多就行了
【回复】回复 @SandArt沙拉酱 :我也效果不好，不知道是训练音频太差，还是练太久了[辣眼睛]
楓の傷:
[doge]事实证明，冷门歌手的声音就是具有很高的辨识度，而且能够驾驭绝大部分的歌

【回复】回复 @飞翔的咖喱鱼丸 :这是梗啊
【回复】孙燕姿，冷门？？？？？？？？？看看我这一排问号，你是认真的？？？？？？？？？？？
【回复】回复 @飞翔的咖喱鱼丸 :梗都不知道？2G网冲浪的？
鲨鱼辣椒大战奥特曼:
想用王菲的声音读佛经，有没有类似的ai工具啊[脱单doge][脱单doge][脱单doge]

【回复】泠鸢有首歌就是唱的那个啥来着反正是佛教的还挺好听
【回复】回复 @潇潇暮雨江南春 :你直接搜泠鸢心经吧应该能搜出来
襾支沈梦溪:
我本人最近也在玩这个。其实缺点挺大的。最主要一个就是耗时。

【回复】一个人一个模型，都需要训练，但只要模型都做好了，就快了
【回复】然后至于像阿博主所说的，两个小时以上，其实并不重要。这个生源呢，它是重质而不重量。其实只要半个小时到一个小时的优质生源就好了。
【回复】回复 @Jack-Cui :我个人是有些问题，想问问阿婆主。我训练出来的模型，没办法唱高音。一唱高音，不然就是AI音，不然就是破音。我本身切出来的干声是没有问题的。这究竟是怎么回事呢？
Mr.field:
昨天我一边开车一边在想，我的有生之年到底能不能看到数字生命。ai可以把我当模型学习我的一切反应，但它能不能用我的声音唱歌呢？然后我就刷到了这个视频[笑哭]

【回复】但我唱的有没有ai那么好，我觉得我的数字生命可以随机设置几个跑调，进错拍。然后我的数字生命还会说“我是不是进错拍了”这样就完美了。
【回复】如果是和现在肉体的你一样的你，那就算等个几代人也看不到。但拟真出一个和现在的你有同样历史行为反应的你是可以的。
【回复】回复 @江浪淘 :嗯，我想的就是替代我自己的那种“永生”数字生命。我多次试图从理论上用人类的特性赋予AI。除了想唱歌的“抢拍”“慢半拍”。还曾设想过用cpu频率、温度去定义“情感”。非常期待ai可以复制我喜怒哀乐的一天出现。
不来抓上死给你看:
。。。。。好牛。。。但是不想学，懒。。。

【回复】QAQ后面的没看懂大佬可以留个QQ指导我一下吗
百采阁白澄彩是也:
想把我一个很喜欢的女孩的声音做成AI然后听她的声音唱的歌

【回复】我和我女友唱歌都不是很行，想用ai试试，后来发现，是我们声音天生不适合唱歌[捂脸]
【回复】回复 @Nowenr :女生又不一定喜欢他啊
小瓶罐:
看了UP主的手把手的教学我灵感了来了，我三分钟教会你们核武器如何制作[doge]最简单的枪式裂变核弹制造流程无非就是预设导轨，固定装药，固定引爆药，其实好简单的。因为裂变的条件就是铀-235达到足够质量。因为达到足够质量后就可以认为每时每刻都有一个原子衰变并放出一个中子。因为质量足够，即原子足够密集，产生的中子总是会撞到下一个原子，进而引发下一次裂变。由于制造工艺太简单，所以核武器的控制从来就不是从制造工艺上管控的，而是原料。如果用离心机分离法提纯核材料，提纯至武器级别99%左右，那提纯用掉的电比用这些核材料发电发的电都多！而大量的电量流失根本就是瞒不住的。

【回复】nnd为什么少了三分钟，抛开事实不谈，就不能多三分钟在某岛上展示下成果[脱单doge]
【回复】回复 @Eeuwigleven永恒君 : QAQ后面的没看懂大佬可以留个QQ指导我一下吗
悲剧近旁的青空:
模型难练，音频数据难处理，真要弄起来还是挺劝退的

【回复】QAQ后面的没看懂大佬可以留个QQ指导我一下吗
【回复】主要在数据处理上，音频需要一点一点试听，选出质量高的
【回复】回复 @依伍一 :不是，是要求你用ripx打开该干声文件后一点点把混响、鬼影都去掉，一首两分钟的干声花我大半小时才处理到差不多
爱思考的乌鸦:
有一个问题就是训练集的音准和生成音准什么关系啊？

【回复】音准主要看待转换的音频。我用自己视频录制的声音训练过，低音还可以，但是因为数据是我正常说话的声音，所以转化后的声音虽然不跑调，但音色很窄，并且高音上不去，可以参考我上期视频，那个是效果。所以显然无数首歌各一次更好，因为会覆盖的音域、唱法更全。
【回复】QAQ后面的没看懂大佬可以留个QQ指导我一下吗
【回复】举个例子，一首歌无数遍和无数首歌各一遍的采样效果哪个会更好？
嘉然今夭吃什幺:
有没有可能再加上模型动作软件实现人物唱歌肢体动作的，这样就完美了

【回复】回复 @滚开别挡着我晒太阳 :求个名字
【回复】目前没有看到比较好的生成肢体动作的算法or软件

翻唱技术宅人工智能唱歌科学计算机 AI 黑科技编程科技猎手2023

如果觉得我的文章对您有用，请随意打赏。您的支持将鼓励我继续创作！