МОСКВА, 11 июн — ПРАЙМ. «Яндекс» отворил разработчикам и исследователям по всему миру доступ к своей библиотеке для обучения больших языковых моделей YaFSDP, какая может ускорить процесс обучения на четверть, говорится в пресс-релизе компании. «Яндекс открыл для всех библиотеку YaFSDP. Она гораздо ускоряет обучение больших языковых моделей — как собственной разработки, так и сторонних, с открытым исходным кодом. Библиотека дает ускорение до 25% — итог зависит от архитектуры и параметров нейросети. С помощью YaFSDP также можно расходовать до 20% меньше ресурсов графических процессоров (GPU), какие требуются для обучения», — сказано в релизе. Библиотека в первую очередь рассчитана на текстовые модели, но подходит и для нейросетей, какие генерируют изображения. Теперь YaFSDP могут использовать компании, разработчики и исследователи по всему миру. Как уточнили в компании, это позволит сжать расходы на оборудование для обучения моделей, что особенно важно для стартапов и научных проектов. Также библиотека позволит разрешить одну из проблем в обучении больших языковых моделей, связанную с недостаточной загрузкой каналов коммуникации между графическими процессорами. «Библиотека оптимизирует использование ресурсов GPU (графический процессор — ред.) на всех этапах обучения… Благодаря этому YaFSDP задействует гладко столько графической памяти, сколько нужно для обучения, при этом коммуникацию между GPU ничто не замедляет», — отметили в «Яндексе».