employee
Peter the Great Saint-Petersburg Polytechnic University (Head of the Research Laboratory)
employee
Saint-Petersburg, Russian Federation
Saint-Petersburg, Russian Federation
This article provides an overview of research and practices on using neural network technologies in the field of procedural content generation for esports games. The authors explore the history, current approaches to using artificial neural networks in creating game elements, including levels, characters and scenarios, with the aim of enhancing the gaming experience and increasing the uniqueness of the virtual game world. The article covers various aspects of using neural network methods, such as generative models, autoencoders, generative adversarial networks, deep learning, and recurrent neural networks, for creating dynamic and unpredictable content. Examples of the successful implementation of these technologies in popular esports games are discussed, and potential challenges and issues related to applying neural networks in this context are explored. The authors discuss the prospects for the further development of neural network technologies in esports and offer recommendations for their optimal implementation. Overall, the article presents an analysis of the current state and future opportunities for using neural network approaches for procedural content generation in esports scenarios.
neural networks, generative networks, game content, artificial intelligence, esports
Введение
В настоящее время игровая индустрия является одним из наиболее быстрорастущих, востребованных и перспективных секторов мировой экономики. Оборот рынка видеоигр в 2023 году преодолел отметку в 200 млрд долларов США. Число геймеров превысило 3 млрд человек [1]. Интенсивно развиваются технологии компьютерных игр, на основе самых современных методов и алгоритмов искусственного интеллекта. Использование нейронных сетей при создании игрового контента базируется на необходимости постоянного развития игровой индустрии и создания новых, уникальных игровых продуктов, учитывающих индивидуальные свойства и потребности геймеров [2], эргономику и пользовательские свойства игровой среды [3, 4]. Использование нейронных сетей позволяет значительно повысить эффективность и качество игрового контента, обеспечивает новые возможности для разработки инновационных игровых проектов. В данной статье мы рассмотрим перспективы применения нейронных сетей при проектировании игрового контента и возможности, которые эта технология может предоставить разработчикам игр.
Базовые понятия области исследования
Для начала рассмотрим несколько основополагающих понятий, используемых в работе. Компьютерная игра – игра, организованная с помощью компьютера, включающая игровой мир, игровые правила, сюжет, цели, элементы интерфейса, и вызывающая игровую мотивацию. Для настоящей статьи важен тот факт, что в игре присутствует игровой контент – все, что может быть воспринято, интерпретировано и превращено в действие игроком в целях достижения игрового результата. Игровой контент может быть создан разработчиками игры, произведен игроками во время игры или сгенерирован алгоритмами искусственного интеллекта. Использование алгоритмических методов для производства игрового контента называется процедурной генерацией контента (ПГК) [5].
Исторические аспекты процедурной генерации контента
Процедурная генерация контента появилась еще в 80-х годах прошлого века и изначально была создана ради сжатия данных [6]. В 1980 году была выпущена игра «Rogue», породившая целый жанр rogue-like игр. Ее основной темой является исследование подземелий автоматическая генерация, которых позволила создать бесконечную игру, где каждое новое приключение отличалось от предыдущего. В 1984-м году вышла игра «Elite», где вселенная с восемью галактиками по 256 солнечных систем в каждой хранилась всего в одном псевдослучайном числе, которое при создании нового мира генерировалось заново, а при возвращении в сохраненную игру позволяло восстанавливать те же характеристики мира, которые были сохранены [7].
В 1990-х годах процедурная генерация контента стала использоваться для автоматического создания камней, деревьев и других аналогичных элементов игрового контента [6]. В 1996-м году вышла игра «Diablo», в которой вслед за «Rogue» использовались случайная генерация подземелий и случайное распределение по ним игровых предметов. Однако авторы «Diablo» перенесли процедурную генерацию на новый уровень, использовав ее для создания изометрического мира на основе 2-D-графики, а не мира на основе ASCII-символов, как это было в «Rogue».
Сейчас процедурная генерация контента используется как во время разработки игры, что называется оффлайн-генерацией [8] (например, инструменты «CityEngine» для генерации городской среды и «SpeedTree» для создания лесов), так и после выпуска игры – при онлайн-генерации (например, генерация целых игровых миров, как в «Minecraft») [6]. Кроме этого, ПГК используется и для создания поведения игровых агентов (игровой агент – сущность, воспринимающая игровую среду с помощью датчиков и воздействующая на нее за счет исполнительных механизмов [9]): для создания погоды, поведения группы или толпы. Например, такой подход использован в игре «S.T.A.L.K.E.R: Тени Чернобыля» [6].
Процедурная генерация контента: психологические основания
Главной задачей игрового контента является вовлечение игрока в игру и обеспечение высокого уровня игровой мотивации. С этим связано несколько психологических понятий:
– иммерсивность – это свойство игровой среды, характеризующее ее возможность вовлекать игрока в текущую систему отношений, определяемую содержанием среды [10-12];
– присутствие – ощущение нахождения в среде, в том числе той, которая отличается от среды непосредственного чувственного восприятия: в частности, ощущения нахождения в игровой среде [10-12];
– состояние потока – крайняя степень сфокусированности на игровой деятельности, абсолютная вовлеченностью и высокая степень мотивации для достижения поставленной цели [13].
Игровой контент может влиять на все три состояния:
– иммерсивность среды со временем уменьшается, и новый, отличающийся от предыдущего контент поднимает ее, что важно для удержания игрока в игре;
– тщательно проработанный контент (аудиовизуальный контент, сценарий, персонажи) приводит к тому, что человек начинает верить происходящим в игре событиям, что важно для появления эффекта присутствия и для погружения в состояние потока.
ПГК позволяет как создавать новый контент и поддерживать иммерсивность, так и облегчить работу разработчиков и тем самым улучшить качество контента при работе над большими играми с большим количеством различного контента.
Типы генерируемого контента в играх
Ряд авторов [5, 14] выделяют шесть типов генерируемого игрового контента (Game Content):
- Bits (биты): текстуры, звук, растительность, здания, поведение, системы частиц (огонь, вода, камни, облака);
- Space (пространство): indoor maps (карты внутренних помещений: ограниченных пространств внутри домов, в подземельях, пещерах), outdoor maps (карты внешнего мира), bodies of water (водные пространства), прочие карты (зоны телепортации, горы, овраги);
- Systems (системы): экосистемы, дорожные сети, городская среда, поведение сущностей (например, взаимодействие NPC с игроком);
- Scenarios (сценарии): головоломки, раскадровки, сюжет, уровни;
- Design (дизайн): системный дизайн (механики и правила), дизайн мира (сюжет, сеттинг, тема);
- Derived content (производный контент): новости, трансляции, доска лидеров.
В свою очередь, алгоритмы процедурной генерации контента можно разделить на три группы [5]:
– традиционные методы: генераторы псевдослучайных чисел, генеративные грамматики, фрактальная генерация;
– поисковые методы (search-based methods) – действуют по принципу «сгенерируй-и-протестируй», при котором генерируемый контент оценивается по заданной функции, и если он не удовлетворяет условиям, то генерация продолжается (пример: эволюционная генерация);
– машинное обучение: рекуррентные нейронные сети, автоэнкодеры, генеративно-состязательные сети (GAN) и другие.
В настоящей статье рассмотрена третья группа процедурной генерации контента, а именно – нейронные сети.
Типы нейронных сетей, используемых для генерации контента
Сверточные нейронные сети (convolutional neural networks, CNNs) – представляют класс нейронных сетей с глубокой прямой связью [15]. Они состоят из сверточных слоев, предназначенных для использования двумерных структур (например, изображений). Слои производят операции свертки между ядром определенного размера и входным сигналом; таким образом, выход каждого сверточного слоя представляет собой модифицированный фильтром входной сигнал. Сверточные нейронные сети активно используются для улучшения качества изображений: усиление контраста, раскрашивание, шумоподавление.
Реккурентные нейронные сети имеют три или более уровней: входной уровень, скрытые уровни и выходной уровень [16]. В момент времени t состояние в скрытом уровне зависит от скрытого состояния в момент времени t-1, в чем и заключается реккурентность сети. Реккурентные нейронный сети применяются для данных, распределенных во времени: распознавание речи, рукописного ввода, создание музыки [15].
Генеративные состязательные нейронные сети (generative adversarial network, GAN) – это модель порождения данных, основанная на состязании двух частей: генератора и дискриминатора [17]. Генератор создает новые экземпляры данных, а дискриминатор решает, принадлежит каждый новый экземпляр заданному набору данных или нет. Задача генератора – создать такие экземпляры данных, чтобы дискриминатор не отличил их от оригинальных. Задача дискриминатора – как можно более точно классифицировать поступающие данные, отделив оригинальные экземпляры от созданных генератором экземпляров.
Автокодеры – нейронные сети, задача которых – воссоздать входные данные в качестве выходных [18]. Они представляют собой прямую неповторяющуюся сеть, которая сначала постоянно уменьшает размерность входных данных до наименьшего скрытого слоя (часть кодера), а затем восстанавливает данные из этого слоя, повторяя структуру входных данных (часть декодера). При этом цель автоэнкодеров заключается не в точном повторении данных из ввода на вывод, а в использовании базовых шаблонов и характеристик распределения данных для генерации новых примеров из того же множества, что и обучающее.
В табл. 1 приведены типы нейронных сетей и примеры их использования при генерации контента для киберспортивных игр.
Таблица 1
Нейросети и примеры их использования при генерации контента
Table 1
Neural networks and examples of their use in content generation
Тип нейронной сети |
Описание |
Пример применения в киберспортивных играх |
GAN (Generative Adversarial Network) |
Состоит из генератора и дискриминатора, обучаются в соревновательном режиме. |
Создание реалистичных текстур для персонажей и окружения |
CNN (Convolutional Neural Network) |
Эффективно работает с визуальными данными, например, изображениями |
Распознавание объектов и текстур в игровых сценах |
RNN (Recurrent Neural Network) |
Хорошо подходит для работы с последовательными данными, такими как текст. |
Генерация диалогов, искусственный интеллект для NPC |
LSTM (Long Short-Term Memory) |
Расширение RNN с долгосрочной памятью, хорошо подходит для обработки долгих последовательностей |
Прогнозирование действий игроков на основе их предыдущих действий |
Transformer |
Основан на механизме внимания, эффективен для обработки длинных последовательностей |
Генерация описаний игровых событий, перевод игрового контента |
GPT (Generative Pre-trained Transformer) |
Основан на трансформере и предварительно обучается на больших объемах текстовых данных |
Генерация игровых сценариев, диалогов, текстового контента |
Результаты и обсуждение
В результате анализа научной литературы по теме получен ряд результатов, свидетельствующих о возможностях использования сетевых технологий при генерации различных видов игрового контента, даны общие рекомендации по применению нейронных сетей (табл. 2).
Таблица 2
Общие рекомендации по выбору нейронных сетей для генерации контента
Table 2.
General recommendations for choosing neural networks for content generation
Жанр игр |
Виды игрового контента |
Рекомендуемые сети |
Экшн |
Генерация текстур для персонажей и мира |
GAN, CNN |
|
Генерация анимаций и движений |
GAN, LSTM |
|
Генерация диалогов и сюжета |
RNN, LSTM, Transformer |
RPG |
Генерация персонализированных квестов |
GPT |
Стратегия |
Генерация игровых карт |
CNN, GAN |
|
Автоматическое создание уровней |
GAN, LSTM, Evolutionary Algorithms |
Гонки |
Генерация трасс и ландшафта |
GAN, CNN |
|
Генерация транспортных средств |
GAN, CNN |
Симуляторы |
Генерация 3D-моделей окружения |
GAN, CNN |
|
Генерация звукового сопровождения |
WaveGAN, GPT |
Спортивные симуляторы |
Генерация виртуальных игроков и команд |
GAN, CNN, RNN |
|
Генерация комментариев и статистики |
GPT, LSTM |
Игровые биты. В качестве игровых битов рассмотрим: изображения, которые могут быть использованы в качестве текстур, звук (музыка) и 3D-объекты. Создание изображений с помощью нейронных сетей на основе текстового ввода возможно несколькими способами, к которым относятся генеративные нейронные сети (GAN), диффузные методы и авторегрессивные методы [16]. Долгое время генеративные нейронные сети были способны создавать лишь небольшие и зачастую нереалистичные изображения, но в настоящее время разбиение процесса на несколько этапов, за каждый из которых отвечает отдельная нейронная сеть, позволяет генерировать реалистичные изображения высокого разрешения на основе неструктурированного текстового ввода [19].
Авторегрессивные методы вдохновлены сетями-трансформерами, соединяющими кодер и декодер с помощью механизма внимания, впервые предложенными в статье [20]. На основе такого подхода работает, в частности, нейросеть DALL-E [16]. Кроме изображений, трансформеры используются, например, при генерации музыки [21]. Создаваемая таким образом музыка не ограничена по жанрам и стилю, при определенных обучающих выборках она может повторять стиль конкретного композитора, кроме того, возможно задать настроение музыки с помощью изображений.
Диффузные модели состоят из последовательности шумоподавляющих автоэнкодеров [22] и сейчас привлекают к себе большое внимание (пример диффузной модели: Stable Diffusion) [16]. Кроме 2D- изображений, диффузные нейронные сети применяются для работы с 3D, например, в сети DreamFusion, генерирующей 3D-модель на основе текстового ввода через использование предварительно обученной 2D-модели диффузии текста в изображение [23]. Для уменьшения времени работы с 3D-графикой разработан инструмент Omniverse Audio2Face от компании Nvidia [24]. Он предоставляет возможность сократить время на анимацию мимики лица, генерируя ее на основе аудиодорожки. Использование этого инструмента позволяет избежать больших временных и финансовых затрат на работу специалистов по 3D-анимации.
Игровое пространство: Нейросети позволяют не только создавать уникальные трехмерные объекты или усложнять трехмерную геометрию на основе текстовых запросов, но использование нейронных сетей позволяет также расставлять объекты в 3D-сцене на основе текстового описания [25]. Применение такого рода инструмента дает возможность ускорить создание полноценной сцены. Например, временные затраты на генерацию десяти вариантов расстановки предметов составляет всего две секунды, а временные затраты на ручную расстановку предметов начинаются от шести минут.
Игровые системы: Игровые системы, например, дорожные сети или переходы состояний NPC, можно выразить с помощью графов. Генерация графов с помощью нейронных сетей – это сложный процесс, требующий особого внимания. Авторегрессивные методы генерации создают графы шаг за шагом, что повышает масштабируемость, но требует больших вычислительных ресурсов [16]. Автоэнкодеры неспособны точно генерировать информацию о такого рода структуре. Генеративные нейронные сети позволяют достичь более качественного результата, но их обучение в этой сфере нестабильно. Однако, применение диффузных нейросетей для создания графов позволяет, с одной стороны, создать структуры, похожие на обучающую выборку, а с другой стороны дают возможность генерировать графы, оптимизирующие заданные модели. Таким образом, технология генерации графов со временем развивается, что в будущем позволит не создавать вручную такие сложные игровые структуры, как, например, дорожные сети. К игровым системам также относят поведение персонажей, которое выражается в виде каких-либо действий или реплик (например, в ответ на действия игрока или в разговоре с ним). Для текстовых игр и действия, и реплики задаются текстом, который возможно генерировать с помощью нейронных сетей. В других случаях те же нейронные сети способны перевести текст в желаемое действие (например, с помощью классификации).
Так или иначе, имеется три варианта взаимодействий: между игроком и игровой средой, между игровой средой и неигровым персонажем, и между неигровым персонажем и игроком. Все эти взаимодействия основаны на диалогах, каждая сторона в которой (за исключением игрока) может быть представлена нейронной сетью.
Диалоговые системы, предоставляющие возможность улучшенной коммуникации между людьми и машинами, называются чат-ботами (chatbots) [16]. Чат-боты делятся на системы, ориентированные на задание (task-oriented systems) (пример: бронирование столика в ресторане) и системы с открытым доменом (open-domain systems), способные поддерживать диалог с пользователем без конкретных задач. В свою очередь, системы с открытым доменом подразделяются на поисковые (имеющие определенный корпус ответов), генеративные (генерирующие ответ) и ансамблевые (объединяющие предыдущие два типа: выбирающие наилучший ответ из корпуса или совершенствуя поисковую систему с помощью генерации). В настоящее время самой популярной диалоговой системой является ChatCPT, и уже существуют игры, основанные на его работе. Например, текстовое приключение AI Dungeon [26] на основе текстового ввода игрока генерирует ответ игрового мира [15]. Однако диалог, как уже упоминалось, может проходить и между игровой средой и NPC, что позволит создать систему, которая автономно живет «сама по себе» и генерирует неожиданные события, с которыми может столкнуться игрок (например, в играх с открытым миром) и которые могут повлиять на его игровой опыт.
Игровые сценарии: Создание игровых уровней долгое время является популярным занятием, о чем говорит, в частности, существование таких соревнований, как «Mario AI Level Generation Competition», «AI Birds Level Generation Competition», «Level Generation Competition», где различные алгоритмы использовались для создания игровых уровней заданных игр [27]. С появлением генеративных нейронных сетей возник вопрос применения их к решению данной задачи. В работе Volz V., Schrum J., Liu J., Lucas S. M., Smith A. & Risi, S. с помощью генеративной нейронной сети создаются уровни для игры «Super Mario Bros.»: несмотря на некоторые неточности (например, не всегда трубы генерируются полностью, иногда – лишь частично), нейросеть способна считывать базовую структуру уровня игры и на ее основе создавать новые уровни [27].
В работе A. Summerville & M. Mateas генерация уровней «Super Mario Bros.» реализуется с помощью рекуррентных нейронных сетей (RNNs) с долгой краткосрочной памятью (long short-term memory, LSTM). Такой подход позволяет создавать уровни, проходимость (playability) которых может достигать рекордных 97% при использовании информации о пути игрока по уровням в обучающей выборке. Кроме создания играбельных уровней, RNNs отличаются тем, что они всегда корректно создают согласованное расположение плиток от столбца к столбцу [28].
Таким образом, нейронные сети активно используются для создания игровых уровней и успешно справляются с поставленными задачами, что может значительно упростить работу разработчиков, а также позволить игрокам проходить новые динамически сгенерированные уровни игры, не дожидаясь обновления. Кроме этого, к данному типу игрового контента относится сценарий игры. Рассмотренная выше генерация текста может быть использована не только для генерации диалогов, но также для создания сценариев. При этом сценарии, которые создает нейронная сеть, базируются на знаниях структуры сценария и стиле его написания [15], поэтому не потребуют большого объема последующей обработки для соответствия жанру.
Производный контент: Нейронные сети в настоящее время активно используются, в частности, в новостной сфере [16]. Относительно игр это позволяет разработчикам избежать самостоятельного создания новостных текстов, предоставив это нейросети. Генеративные нейронные сети могут создавать тексты в ответ на событие, например, на новый рекорд прохождения подземелья или победу в битве. Кроме того, использование искусственного интеллекта позволяет замечать те детали, которые не замечают журналисты. Телеметрия дает возможность отмечать минимальные движения спортсменов и компьютеры собирают больший объем данных, чем журналисты [29]. При создании новостей по игровым событиям использование искусственного интеллекта для поиска данных и их обработки еще более существенно, чем для спорта. Например, при поиске контента в многопользовательской игре угол обзора человека ограничен, тогда как компьютер собирает сразу всю информацию, независимо от места нахождения на игровой карте. Точно также более точные алгоритмы сбора информации у компьютеров позволяют замечать больше событий в киберспорте.
Использование искусственного интеллекта при создании рекламы позволяет персонализировать рекламный контент и сделать его более привлекательным для конкретных пользователей [16]. Таким образом компании, разрабатывающие игры, могут получить не одну рекламу, созданную дизайнером, а сразу несколько десятков или даже сотен реклам, каждая из которых будет более точно подходить для своей целевой аудитории.
Заключение
Таким образом, наше исследование показывает широкие возможности применения нейронных сетей при создании игрового контента, тем самым ускоряя разработку игры или добавляя в нее элементы неожиданности и игровой привлекательности. В настоящее время нейронные сети способны создать качественный контент, который применяется во многих областях киберспорта, а при использовании в играх позволит игрокам наслаждаться игровым процессом, не теряя интереса и не сталкиваясь с недоработанными моментами. Приведены начальные рекомендации по выбору нейросетей для генерации контента в зависимости от игрового жанра.
Разумеется, исследования можно и нужно продолжать, углубляясь в каждую область применения искусственного интеллекта для процедурной генерации контента, однако целью настоящей работы был общий обзор, в котором были рассмотрены ключевые перспективы применения нейронных сетей при создании компьютерных игр и возможности, которые эти технологии могут предоставить разработчикам.
1. Usmanov D.R., Semenov R.E., Nigmatzyanova L.R. Computer Gaming Industry as a Factor in Economic Development. Scientific Discussions. 2023;3(2):92-96.
2. Sergeev S.F., Timokhov V.V., Baskakov A.S., et al. Comparative Analysis of Professionally Important Qualities of E-Sports Players in Basic Game Disciplines. In: Oboznova AA, Zhuravleva AL, editors. Proceedings of the Institute of Psychology of the Russian Academy of Sciences: Current Problems of Labour Psychology, Engineering Psychology and Ergonomics. Moscow: Publishing house of the Institute of Psychology RAS: 2020. 9. p. 316-337. DOIhttps://doi.org/10.38098/ergo.2020.018.
3. Sergeev S.F. The Ergonomics of the Esports: Non-Classical Views. Human Factor: Problems of Psychology and Ergonomics. 2018;3(88):28-34.
4. Sergeev S.F. Usability in Esports: Gaming Interfaces and Environments. Human Factor: Problems of Psychology and Ergonomics. 2018;3(88):43-47.
5. Barriga N.A. A Short Introduction to Procedural Content Generation Algorithms for Videogames. International Journal on Artificial Intelligence Tools. 2019;28(2). DOIhttps://doi.org/10.1142/s0218213019300011.
6. Amato A. Procedural Content Generation in the Game Industry. In: Korn O., Lee N. Game Dynamics. Springer, Cham; 2017. p. 15-25. DOIhttps://doi.org/10.1007/978-3-319-53088-8_2.
7. Darran J. The History of Elite. Retro Gamer. 2008;47:24-31.
8. Togelius J., Yannakakis G.N., Stanley K.O., Browne C. Search-Based Procedural Content Generation: A Taxonomy and Survey. IEEE Transactions on Computational Intelligence and AI in Games. 2011;3:172-186. DOIhttps://doi.org/10.1109/TCIAIG.2011.2148116.
9. Sotnikov I.Yu., Grigorieva I.V. Adaptive Behaviour of Software Agents in Multi-Agent Computer Game. Bulletin of Kemerovo State University. 2014;60(4-2):65-71.
10. Sergeev S.F. Ergonomics of Immersive Environments: Methodology, Theory, Practice. Extended Abstract of Doctor’s Thesis in Psychology. Saint Petersburg; 2010. 42 p.
11. Sergeev S.F. Presence and Immersiveness in Learning Environments. Saint Petersburg: Publishing House of Polytechnic University; 2011.
12. Sergeev S, Burmistrov I. Cybersport Within Non-Classical Ergonomics of Immersive and Interactive Environments. In: Proceedings of IOP Conference Series: Earth and Environmental Science; Saint-Petersbur: 2019. DOIhttps://doi.org/10.1088/1755-1315/337/1/012051.
13. Kazakova N.Yu. The Principles of Aspect to Achieve “a Stream State” in a Game Design. The Bulletin of the Adyghea State University. Series 2: Philology and the Arts. 2016;172(1):150-156.
14. Hendrikx M., Meijer S., Van Der Velden J., Iosup A. Procedural Content Generation for Games: A Survey. ACM Transactions on Multimedia Computing, Communications, and Applications. 2013;9(1):1-22. DOIhttps://doi.org/10.1145/2422956.2422957.
15. Anantrasirichai N., Bull D. Artificial Intelligence in the Creative Industries: a Review. Artificial Intelligence Review. 2022;55:589-656. DOIhttps://doi.org/10.1007/s10462-021-10039-7.
16. Zhang C, Zhang C, Zheng S, Qiao Y, Li C, Zhang M, et al. A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need? ArXiv (Cornell University) [Internet]. 2023. DOIhttps://doi.org/10.48550/arxiv.2303.11717.
17. Malakhov Yu.A., Androsov A.A., Averchenkov A.V. Analysis and Application of Generative Adversarial Networks for Producing High-Quality Images. Ergodesign. 2020;10(4):167-176. DOIhttps://doi.org/10.30987/2658-4026-2020-4-167-176.
18. Oussidi A., Elhassouny A. Deep Generative Models: Survey. International Conference on Intelligent Systems and Computer Vision; 2018. DOIhttps://doi.org/10.1109/isacv.2018.8354080.
19. Zhang H, Xu T, Li H, Zhang S, Wang X, Huang X, et al. StackGAN: Text to Photo-Realistic Image Synthesis With Stacked Generative Adversarial Networks. ArXiv (Cornell University). 2016. DOIhttps://doi.org/10.48550/arxiv.1612.03242.
20. Vaswani A. Attention Is All You Need. ArXiv (Cornell University) [Internet]. 2017. DOIhttps://doi.org/10.48550/arxiv.1706.03762.
21. Buryakova O.S., Reshetnikova O.A., Cherkesova L.V. Methods of Artificial Intelligence in the Generation of Algorithmic Musical Compositions. Modern Science-Intensive Technologies. 2022;8:82-91. DOIhttps://doi.org/10.17513/snt.39271.
22. Rombach R., Blattmann A., Lorenz D., Esser P., Ommer B. High-Resolution Image Synthesis With Latent Diffusion Models. ArXiv (Cornell University) [Internet]. 2021. DOIhttps://doi.org/10.48550/arxiv.2112.10752.
23. Poole B., Jain A., Barron J.T., Mildenhall B. DreamFusion: Text-to-3D Using 2D Diffusion. ArXiv (Cornell University) [Internet]. 2022. DOIhttps://doi.org/10.48550/arXiv.2209.14988.
24. Omniverse Audio2Face [Internet]. 2023 [cited 2023 Dec 25]. Available from: https://www.nvidia.com/ru-ru/omniverse/apps/audio2face/
25. Kozar B.A., Kugurakova V.V., Sakhibgareeva G.F. Structuring Natural Text Entities Using Neural Networks for Generating 3D-Scenes. Software and Systems. 2022;35(3):329-339. DOIhttps://doi.org/10.15827/0236-235x.139.329-339.
26. Text Adventure AI Dungeon [Internet] [cited 2023 Dec 25]. Available from: https://play.aidungeon.io/main/home.
27. Volz V., Schrum J., Liu J., Lucas S.M., Smith A., Risi S. Evolving Mario Levels in the Latent Space of a Deep Convolutional Generative Adversarial Network. Genetic and Evolutionary Computation Conference. 2018;221-228. DOIhttps://doi.org/10.1145/3205455.3205517.
28. Summerville A., Mateas M. Super Mario as a String: Platformer Level Generation Via LSTMs. ArXiv (Cornell University) [Internet]. 2016. doi:https://doi.org/10.48550/arXiv.1603.00930.
29. Miroshnichenko A. AI to Bypass Creativity. Will Robots Replace Journalists? (The Answer Is “Yes”). Information. 2018;9(7):183. DOIhttps://doi.org/10.3390/info9070183.