在1956年的达特茅斯会议上,日后被称为“AI之父”的约翰·麦卡锡首先提出了“AI(Artificial Intelligence)”也就是AI这一概念。该会议确定了AI的目标是“实现能够像人类一样利用知识去解决问题”。
时至今日,AI涉及的领域众多,从语音合成到智能管家,而目前最为火热也最为“出圈”的则是以AIGC为代表的生成式AI应用,也就是由AI生成内容。本文选取了目前AIGC领域中两种最为主流的应用进行简述,并试图探讨AIGC与XR、元宇宙相互结合的可能性,希望能够抛砖引玉,激发更多有识之士对于AI、XR等领域的兴趣并促进相关领域的交流探讨。
ChatGPT
如今提到AI,有一个名字无疑会首先涌入人们的脑海,这就是ChatGPT——自2022年11月30日发布以来就因为其流畅的“对话能力”而火遍全网。
ChatGPT是一种基于AI技术的自然语言处理模型,可应用于多种场景,例如智能客服、聊天机器人、文章生成等等。就像我们熟知的Siri、小爱同学,ChatGPT可以流畅的与我们对话并回答我们的问题,而其真正强大之处则在于,它会联系对话的上下文,选择符合当前语境的内容作答。
当然,除了与用户对话,ChatGPT可做之事数不胜数,这里我想举一个B站热门视频的例子来进一步说明这点。
视频的内容是关于一款名为「RedEye」的游戏的demo测试,这款游戏需要玩家点击画面中浮动的文字方块,展开该物品的详情,再将关联的方块结合到一起进而推进剧情。
根据该视频的UP主也就是游戏制作者“人傻头秃”的描述,这款游戏的灵感来自于日本开发者的游戏「Nodes」。「Nodes」是由一名叫做岩崎的制作人使用Unity独立开发制作的,游戏短小却很独特,曾在Youtube上被众多知名游戏主播进行直播游玩。虽然「RedEye」的灵感和玩法都借鉴自「Nodes」,但其大致剧情及部分文本则是由ChatGPT生成的。
这款游戏不需要精美的立绘,只需在直白的文字配上恰到好处的音效,再配合一些编程和耐心便可制作出来。由此可见,有了AI的帮助,就算是对美术或者编剧一窍不通的人,也可以做出令人耳目一新的游戏。而对于不会编程的人来说,ChatGPT依然是最佳选择,因为他们甚至可以直接提出要求,让ChatGPT帮忙进行代码的编写。
目前ChatGPT已经更新到4.0版本,每一代更新都会让其语言库和数据库更为丰富和强大,其能够理解的词汇也就越多。尽管目前ChatGPT由于政策法规等原因未能在国内大规模普及,但其实已经在世界范围内被越来越多的人接受并应用在多个领域。
以我熟悉的游戏领域为例,我们已经能够看到将ChatGPT运用到游戏制作流程中的案例,比如更快更低成本的世界观设定、角色设计(文字部分)、剧情脚本生成等等。未来我们在游戏中的角色或许可以真的生活在一座“人工城市”中,每个人都有自己的作息和爱好,人们会在不同的时间对不同的事情做出不同的反应,所有玩家都将获得不同的游戏体验。
这样一个立体鲜活的虚拟世界随着AI的不断发展似乎就在前方不远的地方了。
Midjourney
说完了能够自动生成文字的AI,接下来自然要说说能自动生成图片的AI了。
Midjourney于2022年3月面世,创始人是David Holz。尽管它并不是第一个图片生成AI,但凭借其庞大的数据库,Midjourney很快就在众多AI工具中站稳脚步。
和其他AI工具不同的是,Midjourney的主站建立在Discord的聊天服务器之上,这也是为了避免被爬虫和镜像分流。因此用户想要使用Midjourney,就需要一个Discord账号才行。用户在拥有账号之后进入Midjourney服务器,在命令符后输入想要的描述文字(prompt),之后Bot(机器人)将会根据描述文字生成4张图片,而用户也可以选择最符合要求的那张继续进行修缮。
总的来说,Midjourney在图像生成方面具有很强的实用性和价值,可以广泛应用于计算机视觉、虚拟现实、游戏开发、电影制作等领域。而且由于美国版权局声明了Midjourney生成出来的图片不受版权保护,这也使得一些原先对AI十分抵制的创作者或将愿意使用Midjourney进行创作。
前一阵子就有国内作者利用Midjourney创作了一部漫画,并在视频网站上发布了以它的序章为内容的视频。虽然这部名为「五行归灵」的漫画实际上只是插图的堆砌,没有分镜可言,但已经让人们看到了AI绘图的可能性——不需要经年累月的练习,谁都可以进行艺术创作。
于我而言,几天的尝试让我觉得Midjourney对于我这种对绘画略知一二的人来说十分适用。因为我可以预先画好需要的草稿供AI参考,在AI生成图片之后也有能力根据自己的需要略加修改。而如果是毫无绘画基础的人想要流畅使用Midjourney,可能还需要一些额外的努力。
可以预见的是,未来Midjourney的应用前景将会更加广阔:人们能够更加轻松的将脑海中的图像表现出来,将其做成精美的画集或艺术品。
当ChatGPT遇见Midjourney
通过以上介绍,我们简单了解了目前AIGC的发展程度。现在我们可以用AI来生成文章,还可以用AI来生成图片,那么如果我们先用ChatGPT撰写文章,再用Midjourney生成对应的图片,我们会得到怎样的作品呢?
首先我决定让ChatGPT帮我写一个故事。童话故事是一个很好的题材,毕竟它适合所有人阅读。然而我又不希望ChatGPT从现有的童话故事中挑选一个给我,于是我增加了一点额外的要求——讲一个黑童话。下面就是它所创作出来的故事内容:
我本来以为会得到一个“黑暗白雪公主”或者“黑暗灰姑娘”的故事,没想到ChatGPT确实给我讲述了一个像是儿童睡前故事般的传统的吓唬人的童话。
接着,我再将故事中出现的女孩信息进行提取和总结,梳理出如下描述:“穿着病号服的小女孩抱着玩具熊,玩具熊很诡异,小女孩头发凌乱,表情疯狂,周围昏暗、不详,背景是精神病院的病房。”
将其转化为英文描述后,Midjoruney据此生成了这样的结果:
可以看出Midjourney成功提取了大部分信息,生成出来的图片十分真实,破败的精神病院中女孩抱着泰迪熊,或忧郁或面无表情的看着镜头。无论是人物的头发还是衣物表现都十分完美,女孩与背景的反差也令人心生怜悯。尽管每张画面上多多少少还是会有一些瑕疵,但如果对外行人声称这是一张“摄影作品”也足以蒙混过关。
而在使用了Midjourney另一种十分成熟的风格——“Niji version 5”模型之后,我得到了如下的图片:
可以看出这次的结果更加唯美和可爱。“niji”即“二次元”,这个模型参考了许多日本画师的作品,使得生成出来的结果更偏向动漫。
前者十分适合作为电影海报或者插图,后者则适用于各种轻小说、游戏、动漫作品。不过无论是哪种,效果都已经十分成熟且令人满意。
目前已经有人使用AI来生成剧本并配以画面,AI创作的游戏和漫画也开始层出不穷。或许在未来,AI真的可以替代人类进行创作,不过我还是相信,至少在创作层面,AI还无法完全替代人类优秀的想象力。
AIGC和XR
尽管AI从概念到应用已有几十余年时间,但像ChatGPT这种突破性应用的出现其实才有几个月。谁也不知道在将来的什么时候,AI就会迎来它的下一次突破,而接下来就是与XR发生交集的时候,因为这两项科技本身就存在千丝万缕的联系。
拿ChatGPT来说,它可以用于创建用户在虚拟世界里的智能助手,智能助手可以通过自然语言与用户进行交流,并提供帮助和指导;也可以用于虚拟环境下的自然语言生成,例如生成虚拟角色的对话内容或虚拟环境的文字描述等等。
而Midjourney作为一种图像生成AI应用,可以生成高质量、多样化的图像。这些图像可以构建虚拟世界的场景甚至是纹理贴图,从而让用户获得更加真实、细腻的虚拟环境并更好的沉浸其中。
尽管现在的Midjourney仅能通过输入文字和关键词的形式生成图片,但在未来与XR的结合下,用户或许可以使用语音与AI对话,通过语音转换等功能,用户只需动动嘴便可以生成需要的图片,甚至是360°的全景图或者3D模型。
众所周知,XR最重要的特点就是沉浸感,而单一重复的素材将有可能造成沉浸感的削弱,而AI所带来的可能性和不确定性将会让XR沉浸体验更上一层楼。毕竟谁不想有一个拥有独特外貌且不只是说一些套话的虚拟伙伴陪在身边呢?
写在最后:AI的罪与罚
最后我想简单探讨一下AI的负面影响。有趣的是,目前AI大部分的负面影响都是基于人们过去和现在的想象,而不是现实。生活中许多人对于AI抱有消极态度,而在科幻电影中,AI的暴走与革命更是一个经久不衰的主题。
毕竟,现阶段人们或多或少对AI存在担心和抵触。无论是技术人员对于职位被替代的恐惧,还是艺术家对于版权的担忧,又甚至是担心出现影视作品中所描绘的大规模“机器觉醒”,这些都是正常且可以理解的。再加上社会中的确存在一些激进分子,他们不顾一切的反对那些排斥AI的人,而这又使得现在使用AI的用户在人们眼中的形象进一步下降。
然而从目前来看,AI已经成为一种不可避免的趋势。它的快速、它的便捷、它的种种,已经决定了在可以预见的非常多的场景之中,人类将离不开AI的辅助。
AI的本质是工具,这就好像刀枪棍棒,发明的初衷并不是为了伤害他人,只有在不同的人手中才会体现其不同的价值。因此,比起AI是否应该存在,如何将AI为我所用、将其用在正确的方向上,才是接下来我们应该认真思考的问题。