Подробное описание документа
Свидетельство о государственной регистрации программы для ЭВМ № 2022610174 Российская Федерация
Модуль автоматического парсинга данных и формирования датасетов : № 2021681789 : заявл. 24.12.2021 : опубл. 10.01.2022 / Нелюб В. А., Бородулин А. С., Гантимуров А. П. [и др.] ; правообладатель МГТУ им. Н.Э. Баумана.
Программа предназначена для получения данных из различных источников и формирования их в датасет неструктурированных данных. В программе используется алгоритм, который позволяет обратиться по указанному пути к директории с общим доступом, просканировать её на предмет наличия данных табличной формы в форматах csv, txt, xlsx, sheet и выполнить загрузку в память для дальнейшей обработки. Из полученных данных формируется датасет, как структурированных, так и неструктурированных данных. Программа может быть применяться для подготовки входных данных, используемых для обучения модели искусственного интеллекта. Тип ЭВМ: IBM PC-совмест. ПК; ОС: Linux.
