Новый подход к архитектуре и наборам данных у Midjourney
В ближайшие недели запланировано очередное крупное обновление Midjourney, которое было анонсировано некоторое время назад. Во время встреч в офисе и на официальном канале в Discord было рассказано о том, что проводится перестройка системы, начиная с основ, предусматриваются планы передовой архитектуры, обновленные массивы данных, а также оптимизированные методы понимания пользовательских запросов. На данный момент работа находится на стадии внутреннего тестирования – процесса, занимающий от одной недели до месяца. Далее потребуется еще пара недель для доведения системы до рабочего состояния.
Сотрудники Midjourney говорят о том, что технология проходит глубинную переработку, поэтому почти каждая ее часть разрабатывается практически заново. Когда будет завершена тонкая конфигурация, в свет выйдет альфа-версия, имеющая ограниченный функционал. Если говорить о перспективах, то решено внедрить несколько дополнений:
- Возможность одновременной обработки нескольких изображений;
- Различные режимы дизайна;
- Специализированная версия v7, в которой можно выбирать между высоким качеством или быстрым результатом.
Специалисты компании не останавливают работу над изучением видеогенерации, при этом в Midjourney ведется работа над особой моделью, а также рассматриваются отношения в качестве партнеров с проектами, которые имеют открытый исходный код. Разработчики говорят о том, что генерация видео должна стать приятной для пользователей, объединив важнейшие факторы: скорость работы, цена и качество итогового продукта.
В Midjourney ведется работа над новым подходом к технологии 3D-генерации. Предполагается отойти от стандартных методов, в числе которых полигональное представление, сплатирование по Гауссу или NeRF, чтобы использовать собственный формат «NeRF-like». Пока нет информации о том, когда именно такая опция окажется открытой для пользователей.