Герб МГТУ им. Н.Э. БауманаНаучно-техническая библиотека МГТУ им. Н.Э. Баумана

Подробное описание документа

   Статья

Корлякова М. О., Васенков П. А.
   Разработка системы аугментации данных для анализа речи / Корлякова М. О., Васенков П. А. // Наукоёмкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе : материалы Региональной научно-технической конференции (Калуга, 23 - 25 апреля 2024 года) : в 2 т. / МГТУ им. Н. Э. Баумана (национальный исследовательский университет). - 2025. - Т. 1. - С. 207-210.

Рассмотрены методы аугментации аудиоданных, разработана библиотека функций для расширения данных в речевом анализе. Проведена оценка скорости формирования примеров с аугментацией и сформированы датасеты аугментированных данных в соответствии с требованиями прикладной задачи. Предложены методы ускоре-ния работы процедуры аугментации. В работе использованы датасеты Dusha, RESD и датасет шумов разного типа. Все формируемые примеры гарантировано содержат речь человека и контролируемый уровень зашумления.
Ключевые слова: аугментация данных, распознавание речи, анализ звука, машинное обучение

004.934 Распознавание и преобразование речи

Статья опубликована в следующих изданиях

с. 207-210
   Наукоёмкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе : материалы Региональной научно-технической конференции (Калуга, 23 - 25 апреля 2024 года) : в 2 т. / МГТУ им. Н. Э. Баумана (национальный исследовательский университет). - М. : Изд-во МГТУ им. Н. Э. Баумана, 2025. - ISBN 978-5-7038-6513-2.
   Т. 1. - 2025. - 436 с. : ил. - Библиогр. в конце статей. - ISBN 978-5-7038-6513-2.