ПРИМЕНЕНИЕ НЕЙРОСЕТЕВЫХ МОДЕЛЕЙ ДЛЯ РАСПОЗНАВАНИЯ ЭМОЦИОНАЛЬНОЙ ОКРАСКИ РЕЧИ

  • Дарья Ивановна Карпенкова Казанский национальный исследовательский технический университет им. А.Н. Туполева-КАИ
  • Алексей Сергеевич Катасёв Казанский национальный исследовательский технический университет им. А.Н. Туполева - КАИ
Ключевые слова: нейросетевая модель, эмоциональная окраска речи, анализ аудиоданных, моделирование

Аннотация

В работе рассмотрено решение задачи распознавания эмоциональной окраски речи на основе построения и исследования нейросетевой модели. Проанализированы типовые методы классификации эмоций. Для решения задачи обоснована целесообразность использования категориальной модели представления эмоций как наиболее эффективной. В качестве объекта исследований выступают аудиозаписи человеческой речи. Для анализа значений параметров аудиозаписей, таких как мел-кепстральные коэффициенты, спектрограммы и хроматограммы, предложено использовать нейросетевую модель. В качестве исходных данных для анализа и нейросетевого моделирования использовано несколько наборов англоязычных аудиоданных, найденных на платформе kaggle. Исходный набор данных выделяет семь классов (эмоций): счастье, удивление, нейтральная эмоция, гнев, печаль, страх, отвращение. Общее число аудиозаписей в сформированном наборе составляет 48648. Исходные данные были представлены в виде аудиозаписей различной длины. Для обучения нейросетевой модели из аудиозаписей были извлечены характерные признаки и проведена аугментация. По исходным данным рассчитаны значения 162 параметров аудиозаписей с получением единой таблицы данных для анализа. Описан процесс подготовки данных к анализу и моделированию. Проведено разбиение данных на обучающее и тестовое множества, а также построение и исследование нейросетевой модели в виде сверточной нейронной сети. Для оценки эффективности построенной модели произведена оценка точности, полноты и F-меры построенной модели. Результаты исследований показали, что построенная модель является достаточно эффективной и может быть использована в составе интеллектуальной системы поддержки принятия решений.

Биографии авторов

Дарья Ивановна Карпенкова, Казанский национальный исследовательский технический университет им. А.Н. Туполева-КАИ

Аспирант кафедры систум информационной безопасности КНИТУ-КАИ.

Область научных интересов: нейросетевое моделирование, интеллектуальный анализ данных, системы поддержки принятия решений.

SPIN-код:3898-0624, AuthorID: 1219347, ORCID:0009-0008-3897-7286.

Алексей Сергеевич Катасёв, Казанский национальный исследовательский технический университет им. А.Н. Туполева - КАИ

Доктор технических наук, профессор, профессор кафедры систем информационной безопасности КНИТУ-КАИ.

Область научных интересов: нейросетевое и нейронечеткое моделирование, интеллектуальный анализ данных, мягкие вычисления, системы поддержки принятия решений.

SPIN-код: 9374-6690, AuthorID: 651038, ORCID:0000-0002-9446-0491.

E-mail: ASKatasev@kai.ru

Опубликован
2024-01-30
Как цитировать
Карпенкова, Дарья, & Катасёв, Алексей. (2024, январь 30). ПРИМЕНЕНИЕ НЕЙРОСЕТЕВЫХ МОДЕЛЕЙ ДЛЯ РАСПОЗНАВАНИЯ ЭМОЦИОНАЛЬНОЙ ОКРАСКИ РЕЧИ. Электроника, фотоника и киберфизические системы, 3(4), 37-46. извлечено от https://elphoto.kai.ru/article/view/599
Раздел
Киберфизические системы