Создан метод сжатия больших языковых моделей для мобильных устройств
Ученые из Принстонского и Стэнфордского университетов представили новый алгоритм сжатия больших языковых моделей (LLM), который обещает сделать использование таких моделей более доступным, экономичным и безопасным. ferra.ru »