Российские специалисты из Центра искусственного интеллекта Samsung AI Center-Moscow в сотрудничестве с инженерами из Сколковского института науки и технологий разработали систему, способную создавать реалистичные анимированные изображения лиц людей на основе всего нескольких статичных кадров человека. Обычно в таком случае требуется использование больших баз данных изображений, однако в представленном разработчиками примере, систему обучили создавать анимированное изображение лица человека всего из восьми статичных кадров, а в некоторых случаях оказалось достаточно и одного. Более подробно о разработке сообщается в статье, опубликованной в онлайн-репозитории ArXiv.org.
Как правило, воспроизводить фотореалистичную персонализированную модуль лица человека довольно сложно из-за высокой фотометрической, геометрической и кинематической сложности воспроизведения человеческой головы. Объясняется это не только сложностью моделирования лица в целом (для этого существует большое количество подходов к моделированию), но также и сложностью моделирования определенных черт: полости рта, волос и так далее. Вторым усложняющим фактором является наша предрасположенность улавливать даже незначительные недоработки в готовой модели человеческих голов. Такая низкая толерантность к ошибкам моделирования объясняет нынешнюю распространенность нефотореалистичных аватаров, использующихся в телеконференциях.
По словам авторов, система, получившая название Fewshot learning, способна создать очень реалистичные модели говорящих голов людей и даже портретных картин. Алгоритмы производят синтез изображения головы одного и того же человека с линиями ориентира лица, взятых из другого фрагмента видео, или с использованием ориентиров лица другого человека. В качестве источника материала для обучения системы разработчики использовали обширную базу данных видеоизображений знаменитостей. Чтобы получить максимально точную «говорящую голову», системе необходимо использовать более 32 изображений.
Для создания более реалистичных анимированных изображений лиц разработчики использовали предыдущие наработки в генеративно-состязательном моделировании (GAN, где нейросеть додумывает детали изображения, фактически становясь художником), а также подход машинного мета-обучения, где каждый элемент системы обучен и предназначен для решения какой-то конкретной задачи.
Схема мета-обучения
Для обработки статичных изображений голов людей и превращения их в анимированные использовались три нейросети: Embedder (сеть внедрения), Generator (сеть генерации) и Discriminator (сеть дискримитатор). Первая разделяет изображения головы (с примерными лицевыми ориентирами) на векторы внедрения, которые содержат независимую от позы информацию, вторая сеть использует полученные сетью внедрения ориентиры лица и генерирует на их основе новые данных через набор сверточных слоев, которые обеспечивают устойчивость к изменениям масштаба, смещениям, поворотам, смене ракурса и прочим искажениям исходного изображения лица. А сеть дискриминатор используется для оценки качества и подлинности работы двух других сетей. В результате система превращает ориентиры лица человека в реалистично выглядящие персонализированные фотографии.
Разработчики особо подчеркивают, что их система способна инициализировать параметры как сети генератора, так и сети дискриминатора индивидуально для каждого человека на снимке, поэтому процесс обучения может быть основан всего на нескольких изображениях, что повышает его скорость, несмотря необходимость подбора десятков миллионов параметров.
Келулердің саны: 1663
Қазақстан туған елім,ұлы өлкем
25 қазан Республика күніне орай, Ақтоғай аудандық кітапхана оқу залы бөлімінің ұйымдастыруымен "Қазақстан туған елім,ұлы өлкем"…
Мәңгілік жаса, қыран елім Қазақстан
Мәдениет үйінде Республика күніне орай өткен салтанатты шарада аудандық кітапхананың ұйымдастыруымен "Мәңгілік жаса, қыран елім…
Бүгін 24 — ші қазан кітапханашылар күні!
Бүгін 24 — ші қазан кітапханашылар күні! Кітапханалар – ғасырлар бойы келе жатқан биік парасаттылық пен білімділіктің…
Жылдың үздік кітапханашысы-2024
24- қазан кітапханашылар күніне орай "Жылдың үздік кітапханашысы-2024" аудандық байқауы өтті. Ашылу кезеңі Шашубай,Айыртас, Шабанбай,…
Жылдың үздік кітапханашысы-2024" аудандық байқауының жеңімпаздары
Үздік кітапханашы - Құлпейісова Жазира, Үздік жоба иегері - Сағындықова Нұршат, Үздік буктрейлер номинациясы бойынша Кенжебаева…
Гюго .В. Аласталғандар
Гюго .В. Аласталғандар/В Гюго ,ауд. ЗӘбдешов.-Нұр-сұлтан.Фолиант. 1-том. Роман .2020.-736 б. Француздың ұлы жазушысы В Гюгоның кең ауқымды…
Гюго В. Аласталғандар
Гюго В. Аласталғандар/ Виктор Гюго , ауд. С Абдрахманов. – Нұр-Сұлтан. Фолиант, 2- том.2021.-672 б. Француз жазушысы Виктор Гюгоның…
Мұқанов Сәбит . Аққан жұлдыз
Мұқанов Сәбит . Аққан жұлдыз . роман/С Мұқанов.- Нұр- Сұлтан. Фолиант, 1-кітап.- 2021.-448 б. С…
Диккенс Чарльз. Үміт құшағында
Диккенс Чарльз. Үміт құшағында . роман/Ч Диккенс , ауд. Г .Исмағұлова.-Астана. Фолиант, 2023.-488 б. Ағылшын жазушысы Чарльз Дикеннстің…
Кэрол Дуэк. Ойлау . Табысқа жетудің жаңа психологиясы.
Кэрол Дуэк. Ойлау . Табысқа жетудің жаңа психологиясы. Алматы. «Мазмұндама» қоғамдық қоры,2021.-260 б. Ғұмырыңыз мәнді, мағыналы…