世界首款人工智能 DAW 软件 WavTool
人工智能在 2023 年蓬勃发展。公众的大部分注意力都集中在ChatGPT、Dalle-2 和 Midjourney等文本和图像生成领域。 除了这些知名应用之外,还有数百个鲜为人知的AI工具可以完成从写代码、网站分析到创作AI音乐的各项任务。
原 YouTube 视频链接:
https://www.youtube.com/watch?v=pcPNeWUE9g0
WavTool(https://wavtool.com/)是市场上第一个文字输入AI辅助的DAW。它内含一个AI聊天助手,可以在工作站中帮你完成编写midi、生成乐器、控制效果器以及其他DAW控制功能。这个AI DAW并不是凭空出现的。上月Neutone(https://neutone.space/)发布,这是一个DDSP 和 RAVE2等人工智能算法运行的平台插件。Google的Magenta团队也提供了一系列 AI 音乐插件(https://www.midifan.com/modulenews-detailview-32199.htm?fromM=1)。有传言说声音设计工具Audio Design Desk(http://add.app/)即将推出AI功能。截止目前,WavTool 是唯一具有由GPT-4提供支持的作曲家助手的AI DAW。
ChatGPT可以生成和弦进行和旋律,但仅限于文本格式。WavTool则能使用GPT-4生成DAW可以执行的命令,包括从编写midi到波表合成。WavTool的聊天助手Conductor已经实现了生成midi音符、创建新的乐器音轨、配置侧链压缩等等功能。最棒的是,如果人工智能做得不好,你可以问它为什么做出这些决定。了解其思维过程后,你可以提供有关如何改进和实现其目标的建议,通过提示词微调来达成目标。
WavTool简介
原 YouTube 视频链接:
https://www.youtube.com/watch?v=UT9wY-Poj-Y
WavTool是一款由AI驱动的在线DAW。 没错,你不必下载就可以通过Google或Facebook一键注册。免费版提供的AI对话轮次有限。 在发稿时,完全版WavTool收费为每月20美元。WavTool包括一个可以随意显示和隐藏的嵌入式AI聊天机器人。这个名为Conductor的聊天机器人对音乐理论和音频制作知识掌握扎实,可以理解你的想法并尝试在DAW中实现。用户可以通过聊天机器人进行对话在歌曲片段上进行协作、生成或修改MIDI内容以及配置插件添加效果器。
原 YouTube 视频链接:
https://www.youtube.com/watch?v=W_9hz9MInbM
五大特色功能
- AI Conductor:WavTool将他们的AI聊天机器人称 Conductor,因为它能够指导您完成音乐制作。 它可以触及DAW的每个组件,就音乐与你进行深入交流并生成音符。
- 浏览器运行:你不需要在计算机上本地安装WavTool,因为它可以浏览器中直接使用。当前有一些bug,我们在后面会讨论。
- 自定义波表合成器:为你的midi轨道引入WavTool的乐器预设或从头开始构建自定义波表音色。 上面的视频详细介绍了用户如何制作新的乐器。
- 设备面板:WavTool 的面板可让您设置控制均衡、混响、延迟、动态、失真、LFO、侧链压缩和频谱仪等的设备。 与 Ableton Live Max/MSP不同,聊天机器人Conductor可以根据文本提示创建和编辑设备链。
- 电脑键盘和外接键盘:WavTool的钢琴卷帘包括一个键盘界面,可以显示你正在演奏的音符。 您可以在电脑键盘上直接演奏或使用常见的MIDI控制器。
使用WavTool做个beat有多快?
原 YouTube 视频链接:
https://www.youtube.com/watch?v=Cvl30rn03Hg
当您在 WavTool 中启动一个新项目时,聊天机器人Conductor会以极其简单的音乐表达提供灵感,例如基于大调音阶的8分音符。刚开始的体验可能会让一些人认为该工具毫无用处,但这不是WavTool的全貌。虽然WavTool短时间只能做出平庸的beats,但如果花30分钟通过后续对话命令完善提示,你可以引导聊天机器人更接近你想要表达的音乐。正如开发人员的介绍(https://wavtool.com/faq),WavTool 还有很长的路要走,他们每天都在努力让它变得更好。稍后,我将分享一些对话提示词,你可以使用这些提示词使Wavtool创作过程朝着正确的方向发展。 但首先,请思考一下是什么让这个工具如此具有革命性,即使在AI音乐软件领域。
聊天机器人Conductor:AI音乐作曲家
WavTool的AI音乐作曲家Conductor利用GPT-4与你就任何音乐主题进行深入而细致的对话。但它真正的天赋是能够根据 GPT的命令在 DAW 中采取行动实现需求。这种文本到音乐的功能是前所未见的。
让WavTool 优于Musenet的秘密武器
聊天机器人Conductor让人非常令人兴奋,因为它使AI DAW有别于其他主要的AI音乐生成工具。 与Google和OpenAI的音乐创作工具不同,WavTool知道为什么它以特定方式生成音乐并向您详细解释其推理过程,只要你问它。
以前的音乐生成工具不能进行对话或接受文本命令,这意味着我们永远不知道为什么AI会生成特定的旋律或和弦进行。除了请求更改之外,我们无法对其选择进行评价和微调。WavTool的AI Conductor可让您直接访问AI音乐作曲家的思想。为什么它会创造出那种糟糕的和弦进行或如此简单的旋律? 事实证明,即使是糟糕的AI音乐作品背后似乎也有一些潜在的逻辑。现在我们可以更深入地了解AI音乐模型的思想,与它像人类一样合作并指导它的方向。
使用文本到音乐提示微调AI
原 YouTube 视频链接:
https://www.youtube.com/watch?v=2zg3V66-Fzs
如果您最近一直在探索生成式 AI 工具,您可能听说过人们提示词工程师。 有公司以超过30 万美元的年薪雇用这些“工程师”。
提示词工程师的主要目标是为文本输入的人工智能工具选择正确的提示词,以获取公司期望的结果。作为WavTool用户,你无需成为出色的作家或提示词工程师即可开始使用。 尽管如此,你所使用的语言表达将决定其创作的质量和你的使用体验。
人们会出售AI音乐提示词吗?
提示词工程不仅是一份高收入工作。人们在PromptBase(https://promptbase.com/)等网站上销售AI提示词。 该站点已经有一个音乐类别和一小部分用于ChatGPT 的文本提示。 在我看来,像这样提示词销售感觉就像是Web3和音乐NFT场景。我没有在提示词交易网站上购买或出售任何东西,但我认为这是一个有趣的想法。 作为卖家,他们要求强制的支付工具集成和你的社安号,所以我没有入驻。 此外,作为一个喜欢写提示词的人,我并不热衷于从别人那里购买。根据我的经验,WavTool需要的不仅仅是提示词。 它需要一整套模式和策略。 专业用户可以提取出所有他最了解的术语和表达方式,以创建某种字典来使用。
WavTool中生成音乐的4个提示词序列
WavTool支持与DAW中的任何操作相关的提示词。 这个提示词序列旨在帮助WavTool专注于音乐创作。这里有四个AI提示词,您可以按顺序使用它们来开始深入研究。 用您自己的话替换插入符 <> 中的文本。
提示 #1:“Are you familiar with<流派、艺术家或歌曲>?”
提示 #2:“Id like you to create a<你想要的描述>。Before you start generating it, please name 5 defining features of <你的音乐选择> that you could emulate with a MIDI track here in WavTool?“
提示 #3:"Okay, generate it on three instrument tracks."
提示 #4:"Generate a new variation with <你想要的变化幅度>. "最后一个提示可以重复使用来微调midi输出。根据我的经验,需要5-10 次迭代来获得一个比较长且可用的音乐内容。
使用一段时间后,你会发现AI能帮助你,但也有一些缺点。 它有知识,但在任务执行上笨手笨脚,无法完成它打算做的所有事情。我最好的建议是要有耐心,并引导它达到你想要的结果。 挑战自己,找到更好的方法来尽可能准确地描述您想要的东西。您可能需要给出更明确的技术命令,例如“将钢琴和弦向上移动两个八度”或“使用四分音符、八分音符和十六分音符的组合”。当然,你可以随时放弃,自己动手操作DAW。音乐词汇表(https://viva.pressbooks.pub/openmusictheory/back-matter/glossary/)以及免费的音乐理论课程(https://www.musictheory.net/lessons)可以拓展你的词汇量。 AI对音乐理论概念有非常深入的了解。
使用WavTool时遇到的问题
WavTool 代表着一项了不起的成就。 这是同类产品中的第一个AI DAW,当您意识到它是独立开发时会更加令人印象深刻。也就是说,DAW有一些需要解决的bug。
- AI说一套做一套。 对话中AI可能会说它将创建一个带有和弦和旋律的MIDI文件,但事实上只生成了旋律。 它有可能会在单独的轨道上创建一个和弦进行,但调又是错误的。 这种不一致确实会花费一些时间并影响工作效率,除非你准备好收拾残局并自己更正。
- AI只完成一部分它承诺的事。 如果你提出太多要求,AI似乎会超载。 OpenAI的ChatGPT在面对音乐提示是有同样的问题。 要有耐心,一次一步地要求改进,以获得最佳结果。
- 如果请求太复杂,对话机器人将超时。 对话机器人的使用限制还不清楚,所以如果它一直超时,请缩减句子的长度。
- 对话机器人的按钮有时会失灵。 我注意到如果按钮是为后来被删除的乐器创建的,就会发生这种情况。 但有时它会无缘无故地失效。
- 钢琴卷帘的MIDI音符很难在上下拖动。 解决方法是选择音符并并使用键盘箭头来移动。
所有这些错误都能最终解决,所以主要的问题是时间效率。 我们期待GPT的对话速度提升和以及音乐生成质量的升级。AI作曲现在速度缓慢使它不如我自己创作。 当另一方面,文本到音乐的提示系统非常新颖,我真的不在乎它有多慢。 至少就目前而言,玩起来很有趣,我相信随着技术的成熟,这些问题会随着时间的推移而得到改善。
WavTool创始人专访
原 YouTube 视频链接:
https://www.youtube.com/watch?v=JAA4z7m-WZw
创始人Sam Watkinson可以在WavTool Discord频道上联系到,他非常友好地接受了采访。
记者:感谢您接受快速对话! 你能和我们的读者分享一下你在音乐制作和软件开发方面的背景吗?
Sam Watkinson:我在高中开始制作音乐,然后上大学学习音乐制作和音频工程。 毕业后,我自学了编程,这样我就可以帮助我的一些朋友创业。 之后编程变成了职业,音乐成为了的副业。我多年来一直在做配乐项目和原创音乐。 让我印象深刻的是,每个人,甚至是专业音乐人,在第一次接触 DAW 时都非常吃力。 我有很多朋友来找我学习制作,每次我都亲眼看到这种挣扎。 音乐制作是我生活中非常重要的一部分。 创作和DJ帮助我真正发现了自我并在高中时树立了个人信心。我有技术头脑和空闲时间,所以学习DAW对我来说很有趣。 但是很多才华横溢的音乐人并不具备这样的能力。我相信技术的力量可以帮助他们在音乐制作中找到快乐和意义。
记者:那么是什么驱使你走得更远去开发自己的DAW?
Sam Watkinson:几年前,我开始试验我所熟悉的网页开发,看看是否有可能构建满足DAW核心技术要求,包括信号路由、实时第三方效果器等。去年年底,我工作的初创公司受到经济衰退的打击,我发现自己失业了。 从那时起,我就全职从事这DAW开发方面的工作,在今年2月,我邀请前同事Keith作为联合创始人加入。 他的背景很相似,也是一名训练有素的制作人,从事软件工作的时间差不多一样长,而且还专注于创业并用技术支持创意产业的发展。
记者:您使用 GPT-4 的经历如何?
Sam Watkinson:GPT-4的集成是我们朝着降低音乐制作准入门槛迈出的第一步。 我们收到了很多反馈——正面的、负面的,以及介于两者之间的所有反馈——我们在前进的过程中非常认真地对待所有这些。 我们可能即将进入一个充满人工智能内容的未来,而我们与WavTool的使命是尽我们所能帮助人类创造力蓬勃发展。
结语,展望
我们正在见证一种全新的DAW诞生。今天使用的文本聊天很容易被语音输入所取代, 我们将与DAW交谈并描述我们的需求。 AI DAW将使用文本语音转换技术以自己的语音来回答。 听起来有点荒谬,但我认为我们可能比预期的更接近这项技术的实现。在这个新的环境下,我们的音乐词汇将是一种资产。 专业作曲家可能会因此获得竞争优势。
如果这些AI DAW变得足够先进,旋律生成工具和和弦进行软件也可能会受到冲击。 当你的AI音乐作曲家可以完成时,为什么要花钱购买随机音符生成器呢?话虽如此,GPT-4在真正对音乐生成软件构成威胁之前还有一些路要走。 音乐制作人还会依附于他们现有的 DAW和工作方式。 GPT 的音乐质量也需要变得更好才能登上舞台。
【打印此页】【返回首页】 |