Нейросети: практический угол зрения

0 0


                    Нейросети: практический угол зрения

До прошлого года искусственный интеллект занимал умы в основном ученых и IT-специалистов, но в 2023 инструменты на базе ИИ сделали огромный скачок, став важнейшим фактором развития бизнеса, и это только начало:

  • $400+ млрд – объем рынка искусственного интеллекта к 2027 году,
  • 37,3% – годовой прирост ИИ с 2023 по 2030 год,
  • 90% интернет-контента будет создаваться при помощи ИИ к 2026 году.

Рынок труда также изменится, и всем придётся освоить новые навыки: от 75 млн до 375 млн человек (по разным оценкам) переквалифицируются к 2030, и к 2025 году появится 90+ млн рабочих мест, связанных с ИИ.

Эта революция по масштабам сравнима с компьютеризацией 90‑х, когда новая технология полностью преобразовала все сферы жизни, оставив за бортом всех, кто не принял перемен. Но сегодня всё намного быстрее.

Весь год не утихали споры о невиданных возможностях и опасностях нейросетей, кто-то смеялся над их несовершенством, по интернету ходили мемы про шесть пальцев… Но пришло время от неприятия или восторга перейти в практическую плоскость: как именно приспособить новые инструменты, какие у них ограничения и какая в них польза в каждом конкретном случае.

Для начала: общий контекст использования ИИ в России.

  • Самые распространенные сервисы – иностранные, а это значит, что их легальное использование сильно ограничено: VPN + оплата картами зарубежных банков + незаконность работы с персональными данными, а также со всеми, что составляют коммерческую и государственную тайну. Некоторые люди даже в госорганизациях используют ChatGPT, но это до тех пор, пока службы безопасности не задумываются, что данные обрабатываются на серверах в США. И, конечно, любая иностранная корпорация может по своему усмотрению в любой момент ещё более ограничить и вовсе запретить использование своих сервисов в РФ.
  • Вероятны ограничения поставок иностранного оборудования для профессионального использования. США уже ввело подобные санкции для Китая. Сейчас львиная доля рынка у американской Nvidia – на их оборудовании и софте производятся почти все вычисления в области искусственного интеллекта и альтернатив пока не видно. Простые задачи можно делать на игровых видеокартах, но для масштабных проектов они не годятся.
  • Россия делает ставку на ИИ на самом высоком уровне, но отставание пока весьма заметно. Яндекс делает большие успехи, но добиться от него практически полезных текстов сложно. При этом у нас есть реальная возможность стать одной из ведущих стран в этой высокотехнологичной области. Не стоит забывать, что собственная интернет-инфраструктура есть только у США, России и Китая, у остальных – отдельные программы или сайты.
  • Велик риск монополизации отрасли: вспомним пассажирские перевозки – как хорошо все начиналось для пользователей, когда на рынке появился Яндекс такси, и что происходит с ценами сейчас, когда он стал почти монополистом. Для устойчивого развития бизнес-сообщества нужно несколько сильных независимых локальных игроков.
  • Наибольшие перспективы – у систем на базе open source (с открытым исходным кодом) решений. Это реальная альтернатива закрытым продуктам западных корпораций. Каждый может собрать и «допилить» продукт для себя или клиента из легально доступных решений. Это делает большинство компаний, ведь создать полностью свою нейросетевую экосистему уровня ChatGPT или Stable Diffusion не проще, чем написать альтернативу Windows с нуля.

Вот в таком контексте будет происходить выбор нейро-решений для каждого бизнеса: нахождение собственного баланса между возможностями с одной стороны, легальностью, надежностью и безопасностью с другой. Итак, что же можно делать с помощью визуальных генеративных нейросетей здесь и сейчас?

Кейс 1: Гламурная съемка со множеством моделей


                    Нейросети: практический угол зрения

Задача

Сделать комплект фотоматериалов для использования в рекламе премиального угля для кальянов. Произвести несколько десятков качественных изображений с разными моделями в разных премиальных локациях, к тому же, учитывая необходимость использования дорогой одежды и аксессуаров — очень дорого. Дополнительное ограничение — дым: чтобы получались красивые клубы дыма, нужно проветривать помещение после каждого кадра, иначе получится просто невнятный туман. Бюджет на подобную съемку измеряется сотнями тысяч рублей, что в данном случае было неприемлемо.

Решение

Мы подобрали стилистические референсы, на их основании создали «мир бренда», описав его в основном промпте (это текстовая задача для нейросети) и необходимых настройках для генерации. Это дало возможность далее задавать ситуации, локации, параметры моделей, но так, чтобы все это выглядело в едином стиле и могло продолжаться бесконечно — для разных аудиторий и рекламных носителей. В этом проекте мы использовали собственные решения и наработки на базе Stable Diffusion, а не общедоступные решения, такие как Midjourney, именно для того, чтобы не только создать уникальный образ, но и обеспечить возможность управляемой генерации изображений любого нужного размера.

Еще интересный нюанс этого проекта: для того, чтобы найти наиболее подходящие параметры, мы провели жесткое тестирование восприятия нейрофотографий в сравнении с обычными, подав 24 работы на несколько фотоконкурсов. 2800+ фотографов и любителей фотографии, то есть не случайных, а разбирающихся в теме людей, не только не распознали, что изображения сделаны с помощью нейросетей, но оценили их выше большинства работ других участников конкурса. Анализ статистики по голосованию за каждое изображению помог нам создать еще более вовлекающие образы.

Результат

У клиента есть база качественных изображений на несколько месяцев рекламной кампании, и, что немаловажно, возможность очень быстро сделать дополнительные для ситуативных рекламных кампаний, ведь такую съемку за сутки обычным способом не провести.

Кейс 2: История с идеальной резкостью


                    Нейросети: практический угол зрения

Задача

Купить рекламу Отключить

Создание изображения для оформления зала в творческом кластере «Арт-муза» необычным пресс-воллом на время проведения театральной конференции «Мнемотеатр», которая реализована в рамках гранта Президента Российской Федерации для поддержки творческих проектов общенационального значения в области культуры и искусства. «Мнемотеатр» – это интенсив-курс для специалистов сферы культуры, студентов и педагогов творческих вузов, участников театральных студий, посвящённый созданию, сохранению и распространению театрального наследия. Особенность задачи: большое изображение должно было хорошо восприниматься на любом расстоянии, а также на фотографиях в соцсетях, когда люди сделают селфи на его фоне.

Решение

Мы выбрали такой вариант только благодаря нейросети: издали виден древнегреческий амфитеатр, преходящий в современный город, а вблизи амфитеатр состоит из мельчайших деталей – дороги, мостов, машин и деревьев. Мы использовали собственные решения и наработки на базе Stable Diffusion, а не общедоступные варианты, такие как Midjourney, именно для того, чтобы не только создать уникальный образ, но и обеспечить возможность управляемой генерации огромного (11000 х 11000 пикселей) детализированного изображения.

Результат

[{"title":"","image":{"type":"image","data":{"uuid":"7f299bca-2d52-5837-9fd5-f113e0af4577","width":1500,"height":1500,"size":313035,"type":"jpg","color":"81573c","hash":"","external_service":[],"base64preview":"/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAUDBAQEAwUEBAQFBQUGBwwIBwcHBw8LCwkMEQ8SEhEPERETFhwXExQaFRERGCEYGh0dHx8fExciJCIeJBweHx7/2wBDAQUFBQcGBw4ICA4eFBEUHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh7/wAARCAAKAAoDASEAAhEBAxEB/8QAFwAAAwEAAAAAAAAAAAAAAAAABAUGB//EACcQAAEDAQYGAwAAAAAAAAAAAAECAwQFAAYREhNRFSEiMTJhQ4GR/8QAFgEBAQEAAAAAAAAAAAAAAAAABgQF/8QAGhEAAgMBAQAAAAAAAAAAAAAAAAECAxEhBP/aAAwDAQACEQMRAD8AXzLsSYVbVNkMGsU6T0xnQouKb26ueIHY/vqwL0q8TTq2uHUxGRRTlKxiMD28rHKfQowSi84I7KG23mm9zWmmzBCG0J13jq4JA1OR8t/u0DKp1PMp4mDFJzn4U7n1bLpfCqC1H//Z"}}},{"title":"","image":{"type":"image","data":{"uuid":"75f66495-d4df-57e8-8e4e-6cdf2bdca40b","width":1500,"height":1500,"size":323870,"type":"jpg","color":"48332e","hash":"","external_service":[],"base64preview":"/9j/4AAQSkZJRgABAQEBLAEsAAD/2wBDAAsICAoIBwsKCQoNDAsNERwSEQ8PESIZGhQcKSQrKigkJyctMkA3LTA9MCcnOEw5PUNFSElIKzZPVU5GVEBHSEX/2wBDAQwNDREPESESEiFFLicuRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUVFRUX/wAARCAAKAAoDAREAAhEBAxEB/8QAFwAAAwEAAAAAAAAAAAAAAAAAAwQFBv/EACEQAAIBAwMFAAAAAAAAAAAAAAECAwAEERIhQSMxkdHw/8QAFwEAAwEAAAAAAAAAAAAAAAAAAgQFA//EABsRAAICAwEAAAAAAAAAAAAAAAABAhEDEjFx/9oADAMBAAIRAxEAPwDO29ssGlokbONmf0KUllb6yhHElxX6NGKTJxcKBwPhWe8A9JlBYoym8a9hxSDbsoJKg4ijwOmvigthUj//2Q=="}}}]

Результат поражает воображение (моё, как минимум)). Действительно, мы привыкли, что изображение для восприятия издали (наружная реклама, например) вблизи выглядит не очень четко и наоборот. А тут: чем ближе подходишь, тем больше видишь деталей. Чудеса технологий!

Кейс 3: Самостоятельное создание изображений для упаковок и рекламы

[{"title":"u0421u044bu0440 u0441 u043fu043bu0435u0441u0435u043du044cu044e u0438 u043fu0440u043eu0432u0430u043du0441u043au0438u043cu0438 u0442u0440u0430u0432u0430u043cu0438. u0418 u0441 u0441u043eu0447u043du043eu0439 u043fu043eu043cu0438u0434u043eu0440u043au043eu0439!","image":{"type":"image","data":{"uuid":"98d441cc-422e-54b9-88f9-429db543bd5d","width":1024,"height":1024,"size":171019,"type":"jpg","color":"bdad9e","hash":"","external_service":[],"base64preview":"/9j/4AAQSkZJRgABAQEBLAEsAAD/2wBDAAcFBQYFBAcGBgYIBwcICxILCwoKCxYPEA0SGhYbGhkWGRgcICgiHB4mHhgZIzAkJiorLS4tGyIyNTEsNSgsLSz/2wBDAQcICAsJCxULCxUsHRkdLCwsLCwsLCwsLCwsLCwsLCwsLCwsLCwsLCwsLCwsLCwsLCwsLCwsLCwsLCwsLCwsLCz/wAARCAAKAAoDAREAAhEBAxEB/8QAFwAAAwEAAAAAAAAAAAAAAAAAAwQFBv/EACIQAAIBAwQCAwAAAAAAAAAAAAECAwAEEQUSITEGExZRYf/EABgBAAIDAAAAAAAAAAAAAAAAAAIEAQMF/8QAHBEAAgICAwAAAAAAAAAAAAAAAAECERNRAzJC/9oADAMBAAIRAxEAPwA1w81yLTUdWt7OZolCSBpNjITkjc3ZIH13is7JyXdjk1G5ONrSFHuvG2kZvivtyc71zhv0cUeeWiMT2TvPkVb9IgoEbTLuQDg99ih9jC6mmhijSCNVRVUKAABwKuBP/9k="}}},{"title":"","image":{"type":"image","data":{"uuid":"e1f0ddb7-b1ce-5845-a7f8-c5f33535b81b","width":512,"height":512,"size":26015,"type":"jpg","color":"161514","hash":"","external_service":[],"base64preview":"/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAUDBAQEAwUEBAQFBQUGBwwIBwcHBw8LCwkMEQ8SEhEPERETFhwXExQaFRERGCEYGh0dHx8fExciJCIeJBweHx7/2wBDAQUFBQcGBw4ICA4eFBEUHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh4eHh7/wAARCAAKAAoDASEAAhEBAxEB/8QAFgABAQEAAAAAAAAAAAAAAAAACAUH/8QAJBAAAQMEAQMFAAAAAAAAAAAAAQIDBAAGERIFEyExMkFCUZH/xAAWAQEBAQAAAAAAAAAAAAAAAAADAQL/xAAbEQEAAgIDAAAAAAAAAAAAAAABAAMCIRExQf/aAAwDAQACEQMRAD8AOS7BmRLda5TkFoiGQrWOy4Ds7jyRgYGMj9qK5anLIcUhXHyAUkgjWiqvLHIDp4iWVNYL7ETaz7z9kN9Z5x3poOm6ide3tnxWVS5Mgy3iX3fWr5n7qYG2ZydE/9k="}}},{"title":"","image":{"type":"image","data":{"uuid":"02755dd7-476f-5ce0-9489-54573d955ba5","width":1024,"height":1024,"size":211835,"type":"jpg","color":"463531","hash":"","external_service":[],"base64preview":"/9j/4AAQSkZJRgABAQEBLAEsAAD/2wBDAAcFBQYFBAcGBQYIBwcIChELCgkJChUPEAwRGBUaGRgVGBcbHichGx0lHRcYIi4iJSgpKywrGiAvMy8qMicqKyr/2wBDAQcICAoJChQLCxQqHBgcKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKir/wAARCAAKAAoDAREAAhEBAxEB/8QAFgABAQEAAAAAAAAAAAAAAAAABQME/8QAIhAAAgIBBAEFAAAAAAAAAAAAAQIDBBEABQYhEhMxQVFx/8QAFgEBAQEAAAAAAAAAAAAAAAAAAwQF/8QAGhEAAwADAQAAAAAAAAAAAAAAAAECERIhMf/aAAwDAQACEQMRAD8Az1bG1X+Pu+6RxvFYjJ9GWVWMSg+OQ3uDk9fmOs6zp2q3pk0rUzOKwExcAtNEjRWoghUFQZCDj41c00RpyQ2yKOKhtkscapILthQ6jBAAOBn60vi4F6+hht2WJZrEpY9klzk6EdH/2Q=="}}}]

Задача

Производитель пищевой продукции постоянно создает множество фотографий для упаковок и рекламы в своей дизайн-студии, но она загружена текущими задачами, а нанимать каждый раз внешнего подрядчика дорого и требует дополнительных ресурсов для управления проектами. К тому же, дизайн и фотография – важное конкурентное преимущество, и их надежнее делать внутри компании.

Решение

В данном случае пошли еще дальше по пути оптимизации производственного процесса, и установили у клиента рабочее место для самостоятельной генерации изображений с необходимым для его деятельности набором библиотек и настроек.

Результат

Дизайн команда получила нейро-помощника, которого можно использовать 24/7. Это очень удобно – ставишь задачу и переключаешься на другой проект или идешь домой. Потом смотришь сгенерированные варианты и выбираешь нужный или немного уточняешь задачу. Это намного дешевле дополнительного дизайнера, ретушера и фотографа со всем комплектом необходимого им оборудования. И ещё важный нюанс – настоящая еда редко бывает настолько идеальна, как на фотографии, каждый кадр надо ретушировать. Теперь большинство изображений создаются готовыми, «без фотошопа», это дает дизайн-студии возможность больше времени уделять поиску креативных решений.

В первую очередь, нейро продакшн — замена не творческой, а коммерческой фотосессии. Под натиском новых технологий традиционные жанры бизнес фотографии будут умирать один за другим. Первый кандидат – съемка всех новых (неиспользованных) предметов и объектов: уже сейчас в недвижимости и большинстве других бизнесов используется 3D графика вместо фотографий. Исключение: «вторичка» – съемка использованных объектов и вещей, так как важно показать реальное состояние товара (машины, например). Репортаж не умрет, скорее всего, никогда – в нем важен сам факт съемки. Пока держится традиционная рекламная фотосессия с людьми. Но лёд уже тронулся, ведь дешевые фотобанки с одинаковыми фотографиями всем уже надоели и больше не «цепляют», а уникальные фотографии – это долго и дорого. К тому же с нашего рынка ушли качественные международные фотобанки, которые порой обеспечивали разумный баланс между ценой и качеством.

В этой статье описаны лишь 3 из множества проектов последнего полугодия, но видно, что самые невероятные прорывы нейросети несут в креативные индустрии: театр, архитектуру, моду, дизайн – тысячекратно умножая творчество человека. Вот где настоящие чудеса!

Подул ветер перемен, подставляйте паруса!

Георгий Безбородов

Партнер 1Neuro.pro – профессиональные нейрорешения для бизнеса, основатель агентства устойчивого маркетинга Time4Brand, фотохудожник, фотограф. Закончил МАрхИ. В маркетинге с 1994: ADV Group, Grey, BBDO, Proximity, Yourbrand. Многократный призёр фестивалей рекламы и фотографии, член СФР, РГО, СФДП, НАПФ.
Частично опубликовано в журнале ОПТИЧЕСКИЙ MAGAZINE
№1 (88) 2024, Международное издание.

651 показ 82 открытия

Источник: vc.ru

Оставьте ответ

Ваш электронный адрес не будет опубликован.