Нейросети в российских компаниях: разработки и продвижение

27.04.2023 16:10

Нейросети вошли в нашу жизнь уже достаточно давно: их используют для создания как графического, так и текстового контента, "устраивают" на работу в колл-центры и на телеканалы, а сейчас внедряют в камеры видеонаблюдения для распознавания качества уборки дворов и обслуживания тяговых подвижных составов в депо.

Отечественные разработки

Сегодня Россия держит курс на замещение импортных продуктов и решений отечественными, и "Яндекс" решил не отставать. В начале апреля компания представила прототип собственного приложения "Шедеврум" для генерации изображений по текстовым запросам пользователей с помощью нейросети. Для обучения версии для бета-теста потребовалось 240 млн примеров картинок с текстовыми описаниями. 

Чтобы генерировать картинки по собственным запросам, нужно оставить заявку и дождаться ее подтверждения. Алгоритм работает по следующему принципу: сначала картинки формируются в соответствии с запросом, а затем нейросеть поэтапно увеличивает их разрешение, добавляя детали.

В приложении пользователь также может оценить изображения других юзеров в общей ленте. Самые популярные из них попадают в топ лучших на отдельной вкладке. 

В дальнейшем ожидается, что нейросеть сможет генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин и др., отметил руководитель управления машинного интеллекта и исследований "Яндекса" Алексей Гусаков.

 

 

Фото: Яндекс

Отечественный аналог зарубежных нейросетей создали и в Сбере. Ранее компания выпустила новую версию генеративной модели Kandinsky 2.1. Она за несколько секунд генерирует изображения по их текстовому описанию. Модель знает 101 язык. Она может смешать несколько рисунков, дорисовать изображение, создать картину в режиме бесконечного полотна.

Для обучения нейросети потребовалось создать 1 млрд пар "текст — изображение" и 170 млн пар "текст — изображение" высокого разрешения.

За несколько дней с помощью Kandinsky 2.1 было сгенерировано более 10 млн изображений, а количество уникальных пользователей достигло 2 млн.

 

 

Также Сбер представил собственную версию мультимодальной нейросети GigaСhat. Она умеет поддерживать беседу, писать тексты, выполнять инструкции, отвечать на фактологические вопросы и создавать изображения. "В отличие от ChatGPT, она изначально уже поддерживает мультимодальное взаимодействие и более грамотно общается на русском языке", - объявили в Телеграм-канале компании. Сейчас GigaСhat работает в бета-режиме. 

Российская ИТ-компания Sistemma на базе собственных разработок и результатов исследований Стэнфордского университета также разработала нейросеть. SistemmaGPT создана для внедрения искусственного интеллекта в бизнес-процессы. Она может анализировать большие объемы данных, самостоятельно обрабатывать заказы, общаться с клиентами в виде виртуального помощника, отвечать на входящие звонки/электронные письма, работать с пользователями в соцсетях, создавать персонализированную систему рекомендаций, управлять складом и др.

Также разработчики расширяют возможности нейросети для распознавания, анализа и подсчета объектов на изображениях и видео.

Об использовании нейросетей можно говорить много: их внедряют во многие сферы деятельности. Но все же вернемся к телеком- и медийному рынкам, где данный инструментарий стал особенно популярен среди телеканалов. С помощью нейросетей редакции меняют айдентику, перебивки, а сейчас к эфирам уже присоединяются виртуальные ведущие.

Стоить отметить, что в большинстве случае выбор падает на две зарубежные нейросети — Midjourney и ChatGPT. Объясним кратко их принцип работы. Midjourney создает изображения по текстовым описаниям. Также можно ввести команду "/imagine" в "Дискорде" и в поле Prompt вставить ссылки на две картинки в формате JPG, после чего нейросеть сгенерирует изображение, в которое возьмет что-то от обоих источников. Тем временем, ChatGPT может вести осознанный диалог с собеседником: отвечать на вопросы, давать советы и объяснять сложные понятия. Кроме того, нейросеть может писать сценарии, стихи, тексты и т. д.

Визуал и контент

Телеканал "Хабаровск" использовал нейросеть Midjourney, чтобы сделать заставки для перебивок во время программ. Из сгенерированной визуализации команда сделала заставки, которые ежедневно появляются в эфире. 

Для "Субботы!" при помощи собственной нейросетевой технологии NeuroHD "ВКонтакте" отреставрировал сериал "Королек — птичка певчая" 1986 года. Удалось повысить разрешение видеоряда до 1080 p, убрать шумы и сделать картинку ярче и насыщеннее, а движения актеров в кадре — более естественными и плавными. Для этого нейросеть проанализировала объекты на видео и их перемещение и достроила дополнительный кадр между каждой парой кадров исходного ролика.

Телеканал "Москва 24" с помощью нейронных сетей изменил оформление эфира. В компании отметили, что технологии были использованы исключительно в качестве продвинутого инструмента для "шлифовки" готовых идей, вариативности отдельных элементов, а также для ускорения процесса постпродакшена. Основой кампании со слоганом "Это Москва!" стали известные достопримечательности, в их числе памятники Александру Пушкину и Юрию Долгорукому, здание МГУ на Воробьевых горах, деловой квартал "Москва-Сити" и МЦД.

 

 

МТС провел акцию "Щелкунчик. Меньше слов — больше кода", где 1600 разработчиков со всей России перевели сказку на разные языки программирования — Python, C#, Java, JavaScript и Go. В результате получилась цифровая книга,14 глав которой рассказывают историю на этих языках. А уже на базе нейронных технологий Stable Diffusion 2 с помощью telegram чат-бота, разработанного командой MTS AI, были созданы иллюстрации для этой книги. 


Фото: МТС

СТС, в свою очередь, начал съемки ситкома "Сидоровы" по сценарию нейросети. Чтобы программа научилась самостоятельно генерировать основные структурные элементы сценария, авторы загрузили сценарии нескольких сериалов СТС — "Родком", "Воронины", "Дылды", "Восьмидесятые" и "Жена олигарха".

 

 

Фото: СТС

За рубежом также активно применяют новые технологии. Например, стартап Flawless AI синхронизирует движение губ в кадре с текстом дубляжа, удаляет нецензурную лексику. В представленном видео — фрагмент фильма "Падение" — удалили бранное слово, которое повторялось 30 раз. Благодаря чему кино получило "семейный" рейтинг. 

Актер Райан Рейнольдс продемонстрировал сценарий для рекламы мобильной сети Mint Mobile, написанный ChatGPT. Интеграция должна была содержать шутку, ругательство и информацию о праздничной акции бренда. 

Ведущие и другие сотрудники

В медиахолдинге "Ямал-Медиа" наняли нейросеть в качестве монтажера. Компьютерная программа "Быстрые новости" будет обрабатывать видео, текст и титры для дайджестов новостей. "Целый выпуск монтируется примерно час руками. Без использования этой программы. Ну а с ней время сокращается наполовину примерно", — заметил технический директор АНО "Ямал-Медиа" Юрий Легкий.

В эфире телеканала "Свое ТВ" несколько раз в день выходит программа "Прогноз будущего", созданная несколькими нейросетями. Одна генерирует текст, вторая — графическое сопровождение, третья — создает виртуального ведущего Снежану Туманову. 

Также в прогнозе погоды нейросеть использует и телеканал "360". Таким образом, команда хотела проверить, кто лучше предсказывает погоду — искусственный интеллект или команда метеорологов. По словам продюсера "Погоды на 360″ Ольги Филипповой, искусственный интеллект может не только транслировать метеорологические данные, но и реагировать на различные запросы, чтобы оживить передачу.

Другая виртуальная ведущая, Дарья, присоединилась к редакторам эфира вечернего канала "Прима". Все реплики для нее также сгенерировал искусственный интеллект. Новая ведущая задавала вопросы гостям передачи и прочитала новости. 

В тоже время, пермский телеканал "Рифей-ТВ" доверил виртуальному ведущему озвучить репортаж о технологических новинках в программе "Вечер на Рифее". 

 

В большинстве случаев виртуальных ведущих создают с помощью программы Movio. В ней уже загружены аватары, поэтому остается просто загрузить текст, выбрать понравившегося персонажа и голос и получить готовое видео.

Нейросеть и контент

Телеканал "Наука" не только показывает документальные фильмы о нейросетях, но и внедряет их в свою деятельность. С помощью нейросети редакция подготовила проморолик и релиз о праздничном эфире в честь 12-летия канала. Первый цикл программ, созданный с использованием нейросетей — "Истории болезней" — вышел в апреле 2021 года в эфире "Науки". Чтобы максимально погрузить зрителя в эволюцию медицины, была использована deepfake-технология "оживления" фотографий. За это время было "оживлено" более 50 исторических личностей.

"Использование ИИ — это в первую очередь оптимизация производственных процессов, главным образом понятных и рутинных, при условии сохранения должного уровня качества. Сокращение затрачиваемого на них времени — это и финансовая выгода, и возможность направить время специалистов на другие, более сложные задачи. Но есть и другая, менее очевидная цель. Работа с технологиями искусственного интеллекта и нейросетями дает возможность посмотреть на многие вещи нестандартно, выйти за рамки привычных решений", — рассказал "Кабельщику" заместитель генерального директора медиахолдинга "Цифровое Телевидение" по познавательному телевещанию и цифровым технологиям Григорий Ковбасюк.

Команда телекомпании "Губерния" из Хабаровска с помощью нейросети сгенерировала образы 10 городов Хабаровского края, визуализировав их реальными мужчинами, и запустила конкурс красоты среди них. Это привлекло 209 тыс. уникальных посетителей за две недели проведения конкурса.

 

 

Фото: Телекомпания "Губерния"

Онлайн-кинотеатры не отстают от каналов и также используют нейросеть для продвижения новых сезонов и сериалов. Так, видеосервис Premier представил тизер-постеры для нового сезона сериала "Мир! Дружба! Жвачка!", сгенерированные с помощью нейросети MidJorney. Проанализировав сценарий третьего сезона, искусственный интеллект представил на его основе серию изображений. 

Для создания креатива команда ОТТ-платформы использует две нейросети — Midjorney и Stable Diffusion. Stable сложнее, но в нем большой инструментарий по редактированию и генерации изображений, высокая точность запросов, множество дополнительных функций, а также возможность ускорить получение нужного результата. Для СММ используется MidJourney.

"Основная причина, по которой мы выбираем нейросеть — экономия ресурсов. Понятное дело, что человек всё равно выполнит работу лучше. Но если это "лучше" не требуется, то мы можем направить человеческие силы в более продуктивное русло, а простую работу доверить ИИ", — поделились с "Кабельщиком" в Premier.

 

 

Фото: Premier

Тем временем, Kion продемонстрировал постеры к новому сериалу "Раневская", сделанные при помощи нейросети Midjourney на основе цитат актрисы. Говорят, 10 итоговых постеров выбирали из 200 вариантов.

"Мы совместно с агентством Nectarin к премьере биографической драмы "Раневская" о жизни и судьбе актрисы решили провести эксперимент и показать широкой общественности необычные трактовки всем знакомых фраз в инновационной и фантастической форме. Каждая из картин по-своему раскрывала известную фразу актрисы", — рассказали "Кабельщику" в пресс-службе Kion. 

Нейросеть в проекте была использована в качестве маркетингового инструмента для создания изображений и привлечения дополнительной аудитории к сериалу в рамках промокампании.

 

 

Фото: Kion

На одной из станций недавно открытой Большой кольцевой линии московского метро пассажиры теперь могут наблюдать мультимедийную арт-инсталляцию, подготовленную МТС. Арт-объект был представлен в виде ковра-самолета, на котором визуальный контент, созданный с помощью нейросетей, показывает возможности мобильного интернета в метро. 


Фото: МТС

Помощники для бизнеса и общества

Тем временем, телеком-компании представляют новые продукты, в основе которых — нейросеть. Так, оператор связи, разработчик программных продуктов MCN Telecom соединил сервисы телефонии с ChatGPT. Теперь пользователи могут пообщаться и протестировать интеллектуального бота как в чате, так и голосом по телефону. 

"Вымпелком" разработал решение на основе нейросети, позволяющее оценивать состояние мусорных площадок с помощью видеокамер во дворах и оповещать о событиях в Telegram. Алгоритмы искусственного интеллекта анализируют степень заполнения контейнера, наличие мусора на территории и присваивают им соответствующий статус "чисто-грязно". Затем система уведомляет о результатах компанию-оператора, которая занимается вывозом мусора, или надзорные органы.

Еще один оператор, который начал внедрять нейронные технологии, — "ТрансТелеКом". Только здесь следить будут не за чистотой дворов, а за техническим обслуживанием тяговых подвижных составов в депо Анисовка Приволжской железной дороги. Таким образом, камеры фиксируют время нахождения локомотива на площадке, отслеживают выполнение обязательных операций и их продолжительность, производят подсчет персонала, участвующего в процессе. Полученные данные анализируются специальным программно-аппаратным комплексом и передаются в информационную систему РЖД.