«ИИ — двигатель, я — режиссер», — стоит за тем, как певец взломал TikTok, но его не существует

«ИИ — двигатель, я — режиссер», — стоит за тем, как певец взломал TikTok, но его не существует

Лолита выглядит как «девушка», которую алгоритм без колебаний навязывает: идеальное лицо, дозированная уязвимость, кадры с мягким светом и эстетика, которая, кажется, создана для того, чтобы мгновенно собирать комплименты. Затем раздается голос — липкий вопль, ностальгический по платформам и мучительной любви, достаточно узнаваемый, чтобы застрять в голове после первой прокрутки. Для многих этой комбинации было достаточно: короткие фрагменты собирали сотни тысяч, а иногда и миллионы просмотров, и люди просили повторение полных песен на YouTube.

Вот только за феноменом стоит не артистка, готовящая свои концерты, не студия, не классическая биография и даже не физическое существование. Лолита — это проект искусственного интеллекта, и человек, который им «руководит», представляется просто: Том. В интервью ниже он объясняет, где именно заканчивается «волшебство» алгоритмов и начинается его работа — от текстов, полностью написанных им, до раскадровки каждого клипа с окончательным монтажом, выполненным в Premiere Pro.

Помимо закулисных курьезов, доклад также затрагивает трудные вопросы: как создать голос, который будет звучать уникально, используя только подсказки, как избежать любых серых зон, связанных с правами, сколько на самом деле стоит (в деньгах и часах) продвижение цифровой вселенной вперед, и, прежде всего, почему прозрачность остается для него красной линией. Если вы когда-нибудь задавались вопросом, как певец, которого «не существует», может передавать настоящие эмоции, вот ответы.

@ototototome Pã peronu’ на вокзале я сидел и курил сигарету. Так начинается конец истории любви #lolita #fy #aimusic #muzicatiktokro #fyp ♬ На платформе на вокзале — Том

Вы можете найти Тома в TikTok, Instagram и YouTube.

ИНТЕРВЬЮ с Томом, создателем Лолиты, певицы, которой не существует

Playtech (Озана Мазилу): Что именно делается с помощью ИИ в проекте «Лолита» (голос, инструментальная часть, изображение, сценарий, монтаж) и что такое ручная работа, шаг за шагом?

Том: Все, что означает Лолита, покидает мою голову. ИИ — это всего лишь механизм исполнения. Я руковожу, от раскадровки до окончательного редактирования в Premiere Pro. Я не позволяю ИИ решать историю; Я говорю ему, куда идти, кадр за кадром.

Playtech (Озана Мазилу): Тексты песен тоже созданы с помощью искусственного интеллекта или вы сами? Если они написаны вами, то как вы их пишете? Вы начинаете с реальной истории, фраз, взятых из комментариев, или с жанровой «атмосферы»?

Том: Обычно все начинается на открытом воздухе. Когда я выхожу на прогулку с Беллой, моей собакой, ко мне приходят идеи, и я быстро записываю их на телефон. Пока мы гуляем, я начинаю обрисовывать рассказ и искать нужные рифмы. Мой рабочий процесс очень интуитивен: иногда у меня появляется фиксированная идея, как в «Cercel», где сначала у меня был припев. В других случаях я начинаю с общей истории, как это было в случае с «Pe peronu’ de la găra», где я уже имел в виду нить повествования и стиль, в котором хотел его передать. Тексты полностью написаны мной; Обычно я работаю над несколькими произведениями параллельно.

Playtech (Озана Мазилу): Как выглядит ваш рабочий процесс, от идеи до финального клипа?

Том: Первое, что я делаю, это работаю над произведением. Забавный факт: «Pe peronu’ de la găra» была написана сразу после того, как я выпустил «Stau la gem», и я не выпускал ее, пока не прослушал ее много раз; это казалось немного более особенным, и я хотел убедиться, что все в порядке. После того, как произведение готово, я начинаю работать над раскадровкой. Я думаю: что за история? Это более простой клип или я делаю что-то более сложное? Затем я генерирую кадры: некоторые должна произносить Лолита, другие — рамки настроения, и, наконец, я редактирую в Premiere Pro.

Playtech (Озана Мазилу): Есть ли у вас еще какие-нибудь «художники» по искусственному интеллекту, над которыми вы сейчас работаете или о которых думаете в будущем?

Том: У меня также есть другие цифровые художники, одна из них — Амари, которая гораздо более интроспективна, чем Лолита. Амари родом из корпоративной сферы, ей надоело так много белого и структура в современном мире, и она нашла убежище на природе. Лолита и Амари — это две разные части меня, говорящие отдельно, каждая на своем языке. Я рад, что мир обретает себя в их голосе.

Playtech (Озана Мазилу): У вас есть музыкальное образование или вы самоучка? А за пределами школы, что сформировало тебя больше всего: старая скрипка, поп, манеле, трот, фолк, электроника?

Том: Я самоучка, именно поэтому я лучше всего учился самостоятельно. Я работаю в сфере визуального дизайна уже 12 лет и всему научился сам. После окончания средней школы я пытался поступить в UNATC на режиссуру кино, но не попал. В то время это было разочарованием, но я подтолкнул себя к цифровому визуальному дизайну. Тем временем я также научился монтажу видео, и теперь, когда технология достигла нужного уровня, я оказался на пересечении творческих и технических навыков, которые способствовали созданию «Лолиты». В старшей школе я много слушал рок, после чего начал разнообразить стили.

Playtech (Озана Мазилу): Какую музыку ты обычно любишь слушать, когда не работаешь? Дайте мне несколько конкретных указаний: художники/области/десятилетия, которые вас вдохновляют.

Том: Когда дело доходит до музыки, которую я слушаю, я очень эклектичен; Слушаю практически все направления, в зависимости от настроения. Еще мне нравится брать неизвестные винилы, слушать их дома и смотреть, как они звучат – так я открыл для себя такие группы, как Resonators и Voilaaa. Ниже приведены примеры песен и групп, которые мне сейчас нравятся:

  • Мас Ке Нада (Оливер Хелденс, Ян Ашер и Серхио Мендес)
  • Чамбаку
  • Кумбия Дель Ольвидо (Никола Крус)
  • Мона Ки Нги Шика
  • Речь королевы 4
  • Абатина (Калипсо Роза)
  • Гуверфонический
  • потухший
  • Око за око (Бослен)
  • ЗАТКНИСЬ (БУРЯ)
  • Перспектива
  • Здоб и Здуб
  • Детали от Cargo, Bosquito и Vama

Playtech (Озана Мазилу): Кажется, голос «Лолиты» вызывает очень специфические эмоции. Как вы строили голос: это модель преобразования голоса, обученная модель голоса, комбинация сэмплов? И как сделать так, чтобы не ущемлять чьи-то права?

Том: Песни, включая вокал, созданы на Suno.com. Я очень усердно работал над тем, чтобы голос Лолиты звучал так, чтобы он отличался от других творений, созданных с помощью этого инструмента. Все построено исключительно за счет сложных подсказок. Я никогда не использовал внешние сэмплы, заимствованные голоса или другие внешние инструменты. Я выбрал этот путь из глубокого уважения к искусству и из полной уверенности, что не ущемляю ничьих прав. Ее голос, по сути, является уникальным отпечатком пальца, рожденным по моему собственному рецепту, над которым я работал, пока не почувствовал, что в нем наконец появилась душа.

Playtech (Озана Мазилу): Что касается визуальной стороны: какие программы вы использовали для клипов (генерация видео, монтаж, раскрашивание, синхронизация губ, апскейлинг) и почему именно они?

Том: Что касается визуальной стороны, я нахожусь в постоянном исследовании. Мир ИИ движется невероятно быстро, поэтому я не застреваю в одной программе. Я меняю инструменты, которые использую для генерации, синхронизации губ или масштабирования, довольно часто, в зависимости от того, что нового на рынке и какая текстура мне нужна для конкретной истории. Мне нравится экспериментировать, проверять пределы каждой новой технологии. Но независимо от того, откуда берутся кадры, окончательную обработку я делаю в Premiere Pro.

Playtech (Озана Мазилу): Если бы вам нужно было прикинуть, сколько вам обошелся клип типа «На перроне от вокзала» (подписка, кредиты, активы, рабочее время)? Также укажите оценку часов, чтобы мы могли понять реальную «цену».

Том: Я не строго отслеживал расходы на этот клип; Я увлекся творческим потоком и вложил кое-какие ресурсы, но точной суммы у меня нет. Хочу отметить, что проект пока не монетизирован, и даже если бы он остался немонетизированным, я бы, наверное, продолжил этим заниматься. Я думаю, что это лучший клип на данный момент, и я стремлюсь сделать такой, который превзойдет его.

Playtech (Озана Мазилу): Какова ваша красная линия в отношении прозрачности: где вы четко говорите, что это ИИ и почему? У вас есть искушение превратить «Лолиту» в «цифровой проект» или вы хотите проверить, насколько далеко заходит иллюзия в Интернете?

Том: Моя красная линия — абсолютная честность. Я сразу говорю, что проект AI — это четко написано в описании страниц, я ставлю теги к каждому клипу и лично отвечаю людям в комментариях, когда они меня спрашивают. Я ни на секунду не хотел продавать ложную иллюзию или притворяться, что Лолита — это девушка, физически сидящая в студии. Для меня тот факт, что это проект в цифровой форме, не является проблемой и никоим образом не умаляет искусство. Лолита реальна благодаря своей музыке и чувствам, которые она передает.

Playtech (Озана Мазилу): Каким вы видите будущее ИИ в музыке через 2-3 года: станет ли он «дополнительным инструментом» для артистов или появится все больше проектов, полностью заменяющих человека (голос, композиция, образ)?

Том: Я вижу будущее искусственного интеллекта как освобождение творцов. Я думаю, это может помочь многим художникам раскрыть свой творческий потенциал и сократить количество мертвых часов, проведенных в студии, когда вам кажется, что ничего не выходит. Это как партнер, который дает вам искру, когда вы застряли. Я не думаю, что ИИ когда-либо заменит настоящих художников, потому что ни одна машина не может чувствовать или проживать тот опыт, через который мы проходим. Но это будет огромная помощь, как с визуальной стороны за счет создания кинематографических видеороликов, которые ранее было невозможно сделать самостоятельно, так и с музыкальной стороны. Для меня это инструмент, который позволил мне быть режиссером собственной вселенной, не дожидаясь чьего-либо одобрения.

Playtech (Озана Мазилу): Где вы проводите этическую линию при клонировании голосов и «заимствовании» стилей? Что вы считаете приемлемым, а что уже считаете замаскированным плагиатом, даже если результат технически «оригинален»?

Том: Клонирование реальных голосов без согласия этих людей — это воровство, а не искусство. Для меня приемлемо использовать ИИ для создания собственных инструментов, собственных голосов, которых не существует в реальности, точно так же, как дизайнер создает свои собственные кисти в Photoshop. Скрытый плагиат возникает, когда вы используете технологии только для того, чтобы «имитировать» чужой успех, ничего не делая самостоятельно.

Playtech (Озана Мазилу): Считаете ли вы, что должны быть четкие правила прозрачности (обязательное обозначение, если речь идет об искусственном интеллекте), и если да, то как бы вы это сделали, не убивая веселья и творчества? Что могло бы убедить вас в том, что регулирование (например, Закон об искусственном интеллекте) действительно помогает отрасли, а не просто усложняет ее?

Том: Что касается правил и прозрачности, я думаю, что обязательная надпись «Сделано с помощью ИИ» не должна рассматриваться как нечто, убивающее удовольствие. Я и так уже так делаю, везде разъясняю, что это за проект, потому что не хочу никого обманывать и горжусь тем, как мне удалось соединить все свои дизайнерские и режиссерские навыки с этой технологией. Такой нормативный акт, как Закон об искусственном интеллекте, убедил бы меня в том, что он действительно помогает, если он сосредоточен на защите художников у источника, то есть на том, как обучаются модели. Мне кажется справедливым, что ничья работа не должна использоваться без согласия.

Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии