Подробное описание документа

Статья

Чикишев А. Д., Белов Ю. С.
Повышение эффективности больших языковых моделей с использованием fine-tuning на примере GPT-3 / Чикишев А. Д., Белов Ю. С. // Наукоемкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе. : материалы Всероссийской научно-технической конференции, Калуга, 14-16 ноября 2023 года : в 2 т. / МГТУ им. Н. Э. Баумана (национальный исследовательский ун-т). Калужский филиал. - 2024. - Т. 1 : Секции 1-11. - С. 370-373.

Аннотация

Рассмотрен метод “fine-tuning” для совершенствования большой языковой модели GPT (Generative Pre-trained Transformer). GPT-3, как заранее предобученная модель, имеет огромный объем обучающих данных и может выполнять широкий спектр задач, связанных с естественным языком. Однако, чтобы достичь оптимальной производительности в конкретных задачах, требуется адаптация модели под эти задачи. Процесс fine-tuning включает в себя инициализацию заранее предобученной модели и последующее обучение на небольшом, специфическом для задачи, наборе данных.
Ключевые слова: генерация текста, большие языковые модели, fine-tuning, GPT

УДК
004.89 Прикладные системы искусственного интеллекта. Интеллектуальные системы, основанные на использовании знаний

Авторы МГТУ

Белов Юрий Сергеевич

Статья опубликована в следующих изданиях

с. 370-373

Наукоемкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе. : материалы Всероссийской научно-технической конференции, Калуга, 14-16 ноября 2023 года : в 2 т. / МГТУ им. Н. Э. Баумана (национальный исследовательский ун-т). Калужский филиал. - М. : Изд-во МГТУ им. Н. Э. Баумана, 2024. - ISBN 978-5-7038-6244-5.
Т. 1 : Секции 1-11. - 2024. - 426 с. : ил. - Библиогр. в конце статей. - ISBN 978-5-7038-6266-7.

подробнее