USD
75
+0.41
EUR
87.97
+0.21
Категория: AI и робототехникаAI и робототехника
22 апреля 2026 г. в 19:46

ИИ-голоса оказались разборчивее человеческой речи в условиях шума

ИИ-голоса оказались разборчивее человеческой речи в условиях шума
habr.com
Учёные выяснили, что ИИ-голосовые клоны в ряде случаев воспринимаются человеком лучше, чем записи реальной речи, особенно при наличии фонового шума.
В исследовании приняли участие около 80 человек, которым предлагалось различать предложения в шумовой среде. ИИ-голоса, созданные на основе коротких аудиофрагментов, показали преимущество по разборчивости примерно на 13–20% в зависимости от уровня шума. Это связано с тем, что синтетическая речь имеет более ровный тембр, стабильную громкость и меньше случайных искажений.
В отличие от живого голоса, где присутствуют паузы, изменения интонации и колебания громкости, алгоритмически сгенерированная речь звучит более «ровно». В условиях шума это помогает слуховой системе легче выделять слова и смысл.
При этом исследователи отмечают, что естественные особенности человеческой речи в шумной среде могут мешать восприятию. Искусственные голоса частично обходят эту проблему за счёт упрощённой акустической структуры.
0 комментариев