Подробное описание документа
Корлякова М. О.
Разработка системы аугментации данных для анализа речи / Корлякова М. О., Васенков П. А. // Наукоёмкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе : материалы Региональной научно-технической конференции (Калуга, 23 - 25 апреля 2024 года) : в 2 т. / МГТУ им. Н. Э. Баумана (национальный исследовательский университет). - 2025. - Т. 1. -
Рассмотрены методы аугментации аудиоданных, разработана библиотека функций для расширения данных в речевом анализе. Проведена оценка скорости формирования примеров с аугментацией и сформированы датасеты аугментированных данных в соответствии с требованиями прикладной задачи. Предложены методы ускоре-ния работы процедуры аугментации. В работе использованы датасеты Dusha, RESD и датасет шумов разного типа. Все формируемые примеры гарантировано содержат речь человека и контролируемый уровень зашумления.
Ключевые слова: аугментация данных, распознавание речи, анализ звука, машинное обучение
004.934 Распознавание и преобразование речи
Статья опубликована в следующих изданиях
Т. 1. - 2025. - 436 с. : ил. - Библиогр.