Параметро-эффективное дообучение больших языковых моделей

Авторы

  • И.В. Бабич Донецкий национальный технический университет
  • К. Н. Ефименко Донецкий национальный технический университет

Ключевые слова:

параметро-эффективное дообучение, PEFT, LoRA, QLoRA, квантизация, спектр Гессиана

Аннотация

В статье приведён обзор теоретической основы parameter-efficient fine-tuning (PEFT) для больших языковых моделей (LLM). Рассмотрены ключевые методы низкоранговых адаптаций (LoRA) и их комбинация с низкобитной квантизацией (QLoRA). Дополнительно приведены рекомендации по выбору ранга адаптации и уровня квантизации на основе спектра Гессиана и эффективной размерности задачи. Успешность использования методов PEFT зависит от правильного выбора параметров, прежде всего ранга адаптации и глубины квантизации

Биография автора

К. Н. Ефименко, Донецкий национальный технический университет

кандидат технических наук, доцент, доцент кафедры прикладной математики и искусственного интеллекта факультета интеллектуальных систем и программирования ФГБОУ ВО «Донецкий национальный технический университет».

Библиографические ссылки

Федяев, О. И. Интеллектуальная систе-ма принятия решений в отделении медицинского учреждения на основе нейросетевых, продукционных и статистических моделей / О. И. Федяев, В. С. Бакаленко // Статистика и Экономика, 2019. – № 16(3). – С. 70-77. – URL: https://doi.org/10.21686/2500-3925-2019-3-70-77

Дворяткина, С. Н. Интеграция фрактальных и нейросетевых технологий в педагогическом контроле и оценке знаний обучаемых / С. Н. Дворяткина // Вестник РУДН. Серия : Психология и педагогика, 2016. - Том. 14. - № 4. – С. 451-465.

Федяев, О. И. Прогнозирование оста-точных знаний студентов по отдельным дисциплинам с помощью нейронных сетей / О. И. Федяев // Известия ЮФУ. Технические науки. – 2016. – С. 122-136.

AI в обучении: на что способны технологии уже сейчас? // EduTech. - 2022. - № 4 [49]. – 60 с.

Струнин, Д. А. Искусственный интеллект в сфере образования / Д. А. Струнин. — Текст : непосредственный // Молодой ученый. — 2023. — № 6 (453). — С. 15-16. — URL: https://moluch.ru/archive/453/99921/

Федяев, О. И. Автоматическая регистра-ция присутствия студентов на учебном занятии с помощью компьютерного зрения / О. И. Федяев, И. А. Коломойцева // XXI Национальная конференция по искусственному интеллекту с международным участием КИИ-2023 (Смоленск, 16-20 октября 2023 г.). Труды конференции. В 2-х томах. Т.1. – Смоленск: Принт-Экспресс, 2023. – С. 294-303.

Портал huggingface.co [Электронный ресурс] / Интернет-ресурс. – Режим доступа: https://huggingface.co/docs/text-generation-inference/conceptual/lora. – Загл. с экрана.

Портал huggingface.co [Электронный ресурс] / Интернет-ресурс. – Режим доступа: https://huggingface.co/blog/4bit-transformers-bitsandbytes. – Загл. с экрана.

Портал geeksforgeeks.org [Электронный ресурс] / Интернет-ресурс. – Режим доступа: https://www.geeksforgeeks.org/what-is-qlora-quantized-low-rank-adapter/. – Загл. С экрана.

Портал ru.wikipedia.org [Электронный ресурс] / Интернет-ресурс. – Режим доступа: https://ru.wikipedia.org.

Загрузки

Опубликован

10.11.2025

Как цитировать

Бабич, И., & Ефименко, К. Н. . (2025). Параметро-эффективное дообучение больших языковых моделей. Информатика и кибернетика, (1 (39), 56–60. извлечено от https://infcybdonntu.ru/article/view/575

Выпуск

Раздел

Информатика и вычислительная техника