关键在于如何使用。 |
01
AI音乐能为游戏研发
(资料图片仅供参考)
带来什么?
按音乐制作流程来看,无论是歌曲还是配乐,它们的基础环节包括了「创作、制作」两部分,当中又分「作曲、作词、编曲、配器、器乐录音、人声录音、混音、母带」等步骤。 不可避免地,每个环节都需要许多专业人员参与。一个项目若想把多个环节交由一个人处理,即便是数字音乐制作普及的今天,也需要此人具备多年的专业学习和项目经验。 原因在于,游戏音频的生产模式,离不开人的深度参与。 其实按传统,声音合成技术几十年前就已在应用,它的核心能力就是无中生有地创造出世界上从来没有的声音。但它的载体是合成器(乐器),便需要懂得专业知识的人来驾驭。 AI技术也是同理。回顾过去,AI生成音乐已经走过了很多阶段: 第一阶段,AI要输入大量的核心作曲信息。1990年,自动作曲软件Band-in-a-box就已诞生。我们也可以称其为「传统自动作曲」。在软件上,作曲家只要输入和声、曲风等设定,就可以获得一段音乐。 不过,「传统自动作曲」因为自身的特点与限制,逐渐被应用在音乐专业的学习教案,作为学生学习曲风的辅助工具。 第二阶段,AI需要模糊作曲信息。2016年,人工智能产品AIVA出现,它也被我们称为「AI自动作曲」。在作曲家设定好曲风、调式等参数后,软件就会生成完整的音乐工程文件。 接下来,作曲可以直接对作品编辑,也可以输出文件或音频分轨,导入音乐制作软件来做深度修改。这一时期的AI音乐技术,支持作曲者反复修改调整,也为音乐带来了更多可能性。 第三阶段,AI只需要文字或图片信息,就能完成作曲。 这也是如今AI技术的阶段,它不需要音乐理论,也不需要专业知识,只要输入文字、图片即可生成音乐……当然,音乐能否达到要求,还得看AI训练的具体情况,不过它已经可以带来许多超预期的价值了。 那么用如今的AI音乐,能为游戏音频做什么呢?我们可以结合实践结果来看这一问题。 首先,AI音乐能够作为辅助作曲的工具,为我们提供快捷的灵感与参考。 这一方向由难到易有三种模式: 第一种是ChatGPT+传统自动作曲。我们先在ChatGPT中提问,获得和声、调式、配器特点等信息,然后输入到传统自动作曲软件中。 在此过程中,我们也可以结合作曲软件的优势,来丰富这首音乐的更多设定。 第二种是AI自动作曲+专业编曲技能。基于前面的AI自动作曲软件,我们可以提前设定一些条件,比如曲风、调式等前提,并由此获得指定音乐。这之后,我们可以提供工程文件与音频分轨,让作曲家相对快速地创作。第三种则完全用AIGC来做。这一方法让音乐创作变得相当方便。这里以AIGC软件MusicLM举例,它在识别文字、音频、图片后,就能直接生成AI理解出来的音乐:
MusicLM官方演示
以上方式虽不能100%获得直接应用的音乐,但是可以让许多概念、想法,快速转变出对应的音乐灵感和创作参考。
其次,AI音乐能够产出风格化、类型化的音乐。 目前主流的AI音乐软件,优势在于生成这两种内容:第一种是大众化且风格突出的音乐,例如摇滚、爵士、嘻哈、史诗交响;第二种是填充背景,定义氛围的音乐。 在研发过程中,这一优势可以被应用到场景制作、玩法测试、用户研究等多个环节。目前,我们已经可以利用AI音乐,快速生成可以填充的素材,在项目的前中期帮助用研等部门测试游戏版本的音乐。 这里我可以举例一个内部项目案例。 根据谷歌调研与App id全球数据,我们该项目的用户对Hip-hop嘻哈音乐非常感兴趣。所以,我们决定在这个中世纪背景的游戏中,放一些嘻哈曲风的背景音乐。 这对音乐创作而言,是比较有挑战的。 按照传统的音乐制作流程,我们创作多首融合元素的背景音乐,从立项到完成,至少要几周时间。但是,我们通过Text to Music的AI音乐技术,仅用2小时就生成了全部需要的音乐,并且快速投入了游戏中做测试。02
AI语音已经在
逐步投入使用
在应用方面,AI语音软件的作用,主要是语音调试合成,以及语音克隆。 简单来说,语音调试合成,是对软件中已有素材,做参数调试,期间,我们可以按需对口音、语速、断句、句间、情绪——比如疑问、惊讶、生气——进行设置。而语音克隆,是用户自己投喂语音样本后,再做参数调试。 AI语音软件的操作比较简单。如果我们有已经训练好的声音角色,就可以快速为游戏广告、买量视频、旁白等完成语音生产。 而且,AI语音软件也可以完成不同语言的转化,还能保留原本录制人员的音色、口音、语气等要素。这里我们先录制不同口音的人诵读《红楼梦》的内容,然后将其在AI软件中转为英文:03
更多工具与未来发展
我们上面已经提到了许多AI工具,如大家耳熟能详的ChatGPT、AI自动作曲的AIVA、识别音频文字图片的MusicLM、输入文字就能转音乐或语音的Text to Music与Text to Voices,以及与之类似的AudioGPT。 但除此之外,我们还有很多AI工具,可以应用到游戏音频及游戏研发的各个方面。 在音频制作方面,我们就看到了不少产品,如混音、母带的AI工具:LANDR、OZONE等; 分离音乐中人声和器乐的AI技术:UVR5……。 而在声音引擎领域,AI技术是否也有介入如Wwise和CRI-ADX等引擎呢?尽管官方对我们的回复是「暂时未将AI应用在产品中」,但在翻阅官方博客时,我们也已经能看到了一些探索行为。 比如,CRI就曾使用AI来写Robot脚本。这一尝试可以在其博客中搜索文章题目《【ChatGPT x CRI Atom Craft】让AI来写Robot脚本!》来获取,感兴趣的朋友可以看看。 总的来说,AIGC技术以快速迭代发展的态势,正融入游戏行业中。 今年我们在趣加项目的AI落地过程中发现,随着使用经验的积累,AIGC也展现出比预想更强的能力。在相关工具的不断进化之下,相信AI对开发者、开发流程都会有比较深远的影响。 二十年多年前,音乐行业经历过由模拟到数字的改变,从而改变了整个音乐行业一直到今天,其激烈程度不亚于AI。作为这场变革的亲历者,我认为在当下学习AI、拥抱AI,适应其技术特性并使其转化为生产力是很有必要的。 如今的AI技术,虽然还做不到「一键生成很多剧情对话语音」,但作为创作和制作的助手,它是未来可期的。或许,随着技术快速更新,AI与游戏音频的结合还会有更大的想象空间。 我的分享就是这样,谢谢各位。 游戏葡萄招聘内容编辑,点击「阅读原文」可了解详情推荐阅读| | | | | |点击下方名片,将公众号设为星标(流程如上图)
可第一时间收到推送和完整封面!
