Большая языковая модель от Т-Банка уже в открытом доступе
Т-Банк в рамках организованной им конференции, посвящённой машинному обучению, объявил об открытии общего доступа к разработанной AI-Центром Т-Банка большой языковой модели T-lite. Как заявили представители компании, имея размер в 8 млрд параметров, T-lite значительно опережает аналогичные модели в вопросе решения различных бизнес-задач при использовании русского языка.
В Т-Банке подчеркнули, что представленная языковая модель – это инструмент разработки, который позволит компаниям создавать различные бизнес-приложения, например: автоматические обработчики запросов потенциальных или реальных клиентов, инструменты для анализа отчётов и их обобщения или поиска ключевых мыслей текста (суммаризации) и т.д. При этом при создании подобных приложений у компаний не будет необходимости передавать какие-либо данные третьим лицам.
Языковая модель Т-Банка разработана в размере 8 млрд параметров, т.е. числовых значений, которые модель настраивает для понимания и генерирования текста. Считается, что чем большим количеством параметров оперирует модель, тем с более сложными задачами она способна справляться. Однако увеличение числа параметров в значительной степени ухудшает экономическую эффективность самой модели. Между тем разработчики T-lite, утверждают, что их модель частично лишена этого недостатка. В случае дообучения данной модели на решение конкретных бизнес-задач, связанных с обработкой естественного языка, она может выдавать результаты такого же качества, как и модели, выполненные в размере 20 млрд параметров и более. При этом эксплуатация T-lite будет обходится в несколько раз дешевле.
Кроме того, опять же по словам разработчиков, создана языковая модель от AI-Центра при использовании минимального количества вычислительных ресурсов. Составили они всего 3 % от того количества, которое требуется для подобных моделей. При этом как на индустриальных, так и на внутренних бенчмарках показатели T-lite были значительно выше, чем у таких зарубежных моделей как Chat-GPT 3.5 или 3-8B-Instruct.
Стоит отметить, что T-lite – это новый представитель семейства языковых моделей Gen-T, созданных AI-Центром Т-Банка. Все они способны к обучению для решения узкоспециализированных задач. Именно этим технология Gen-T и отличается от универсальных моделей искусственного интеллекта. Она ориентирована на решение задач в определённых областях, что позволяет пользователю получить максимально адаптированные под него решения.
Как заявил один из руководителей AI-Центра Артём Бондарь, существующие в настоящее время универсальные языковые модели не в состоянии удовлетворить растущие потребности. При этом модели семейства Gen-T уже доказали свою эффективность, работая во внутренних сервисах структур Т-Банка. Сейчас же компания готова поделиться своими технологиями со всем профессиональным сообществом.