大AI时代即将到来?AI技术能解放多少技术力
6917
2023-04-10 09:44
如果要盘点今年互联网科技板块的第一话题,那么AI技术是当仁不让的第一。最开始人们都在争论关于AI作图的那些议题。从几个月前,AI作画只有几个模版来回变化,不会画手,甚至不会画拿筷子吃面的尴尬;但现在,已经可以个性化画风深度定制,写实的、3D化的、二次元的画风应有尽有,甚至还能针对各种个性化画风做出深度学习,完美复原,仅是几月发展就与当初不可同日而语。
曾经让AI学会画手是一个难以被攻克的问题,现在已经不是多难的事情
近期,随着美国OpenAI研发的聊天机器人程序ChatGPT(全名:Chat Generative Pre-trained Transformer)发布,AI进化的谱曲达到最高章。ChatGPT是特殊的一个。他是根据自然语言处理任务的人工智能,其运作逻辑可以根据学习人类的语言来进行对话,并能根据上下文理解而进行互动,并随着交流量的增加而不断智能化。同时,ChatGPT在这套学习思维的基础上,能够完成许多以前只有”人“才能做到工作,比如翻译、文案、程序脚本与各种影音化的处理任务,功能之丰富,简直就是AI界的百科全书。中国风,水墨画法与写实,Stable Diffusion各种风格都能尝试
也因为开源的优势,Stable Diffusion还能玩出更多玩法,比如它可以拿来压缩图片,且压缩图片的细节能够保留更多,这对于压缩技术来说也是一项大的突破。原图与加工新画风的AI图片对比,文字乱码依然是加工图片一个问题(图片来自二次元假小子控吧)
至于Midjourney则是一款收费作图工具。该工具的环境相对封闭,使用的图片素材也大多是版权图片。因此,能够调教和生产的图片并没有Stable Diffusion多样。但也得益于稳定的版本更迭,尤其是到了V5版本以后,Midjourney对于画幅比例、纹理效果以及AI处理手与牙齿等细节的局限做出了很多优化,因此让Midjourney总能生成出更加精美且没有破绽,足够以假乱真的美术产物让业内震撼。比方说之前有关Midjourney最大的新闻就是透过一些文字生成出一套背景是上世纪90年代、中国城市的年轻青年的老照片图片。经过这次更新,Midjourney变得非常强大
Midjourney V5做出90年代风格的AI照片
也因为Midjourney更定制与职业,目前已有不少从业者开始尝试利用Midjourney辅助创作,比如就在近期,国外一位从业20多年的独立开发者就分享了自己使用AI对人物建模设计的一些辅助创作成果,据他所言,人物建模设计上节省了40个小时,在场景构建上节省了3天的时间。目前是一个基于云数据的人工智能工具
替换效果对比
现在甚至能做到微表情处理
不仅如此,Wonder Studio还能导出分层、分析画面的数据与运动环境,让用户更多角度的跟踪修改,做出更理想的效果。还能对具体影片的情况去调整
03音频方面、模拟人声:VITSVITS全称Variational Inference with adversarial learning for end-to-end Text-to-Speech,是一种基于声学模型进行语音合成方法的AI音频类工具,它能根据用户提供的语音合成模型,配合使用训练好的语音编码器vocoder声码器对用户提供的文本进行转化,vocoder会根据发音规则与文本的标题符号作为生成语音信号的特征去表示,最后做出一段流畅的语音。只要文字的描述精准且丰富,无论是古典名画还是现实题材,都能识别出相应风格,与画面做出匹配。
不过即便没有扩散模型的作用,MusicLM目前依然可以做到很多意想不到的音频处理。比方说,工具不单可以透过文字生成音乐,还能以一段音频打底+形容的文字,比如乐器或者音乐风格去改编音乐的风格,输出想要的效果。- 与第三方应用程序连接,利用ChatGPT的机制完成包括日常行程、购物、导航等功能;
- 利用WolframAlpha等插件,让ChatGPT获得更强大的计算能力,让回复内容更加精准/丰富;
- 对表格、文档与视频音频文件进行内容的分析、绘制与可视化操作;
- 延展出更多精细的操作,包括计算力引擎、 视频剪辑、 图片PS、脚本设计与文字翻译,全面覆盖语言工具所能做到的极限。
现在的3A游戏项目的开发成本已经可以比肩大片,但很多游戏要靠单纯卖盘获得大片的收益可不容易
而游戏成本走高的一个原因就在于高昂的人力成本无法节省,尤其是业界对于游戏画面要求越来越高的现在,往往需要庞大的美术团队去做高精度美术与高模的精雕细琢工作。在很长一段时间高画质、高材质需要靠人力去填,以后就不好说了
那么这些批量精细活的工作就可以轮到绘图AI工具入场了。形成一套一个主美把控核心创作输出,利用AI去做批量生产与高精细化的工作流程。像Stable Diffusion目前就有插件去做类似的工作内容。只是目前可选择美术风格还不够多,制作出来的样品也不够精细,但如果继续发展下去的话,未来可期。另外,需要大人力资源去填的内容如果能够靠AI弥补,也一定程度降低了开发门槛。独立开发者能制造的游戏的范围能够进一步扩大。比方说,目前就有很多中日的同人游戏开发者开始尝试用AI去做一些低成本的同人游戏,毕竟很多同人游戏并没有商业化,很适合去做AI工具化的尝试。有的同人团队是利用AI作画,有的则是让AI几乎包办所有工作,比如B站up主“秋之雪华”就制作了一款名叫《夏末弥梦》的galgame,整段已公开的Demo视频中,从美术到培养配乐全是有AI完成。(图片来自PSN中文站用户heyoutui)
至于AI运营与客服系统,早在目前就已经开始普及开来,唯一的问题就在于表述过于机械、语言过于无感,还有适配的语言不足等不够智能的问题,但这些毛病如果接入ChatGPT与音频合成的VITS等进行适配与升级,那么,游戏的国服分发与运营压力将随着AI的进步而逐步减压。④宣发物料的效率提升与成本将降低常见的宣发,如短视频、海报、趣图与玩梗的文案和速递新闻也可以依靠AI速度生产,比如目前Adobe宣传的平面软件Firefly,主打的就是快速处理图片各种风格的AI机制,若能做到投入生产力的水平,无疑能让宣发更容易很多。一键处理想要的P图效果
其次,目前ChatGPT的文案处理能力已经越来越成熟,比方说你给他提案一个新闻/活动议题,它就已经能生成出一个还可以的模版,就当下来说,给予AI提供的模版去修正文案以获取自己想要的宣发文案,是已经可以做到的现实。根据某个游戏设计一场预计20人的现下活动(图片来自厦门UPGAME)
⑤音、视频成本也将大幅度降低游戏常备的音乐、配音与视频也将随着AI技术的成熟做到更多更方便的做法。比方说利用Wonder Studio让游戏的3D建模去适配视频,减少比如用手K去调整建模动作的工作量;比方说,利用VITS降低配音成本与配音的可适用范围,游戏公司只需要提取声优的音色,就能靠AI生成各种情感与台词;再比如利用MusicLM去为游戏的各种画面去适配音乐,即便无法直接商用,也能让主创更好抓准风格进行精细的修改。我想要井上喜久子与平野绫的声线,AI结合原型声音模型做出来就可以了
这方面的推进也是预期可见的进度。比如光线传媒的光线动画就在之前公开讨论AI补充动画作画的可行性,并放出了AI作图的宣发。来源:游资网
本网站登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。如有异议(包含但不限于文字、图片侵权)请联系工作人员删除文章。
标签:
相关文章
推荐
最多浏览
加入我们
小白也能寻找到乐趣,找到自己的圈子的社群。
加入我们一起建设吧
发布属于自己的圈子