O treinamento auditivo-cognitivo imersivo melhora a percepção da fala no ruído em adultos mais velhos com audição e memória de trabalho variadas
O envelhecimento traz mudanças na sensibilidade auditiva, resultando em maior prevalência de perda auditiva de alta frequência. Isso pode levar a consequências como depressão, isolamento social e declínio cognitivo, reduzindo a qualidade de vida. A dificuldade de compreender a fala em ambientes ruidosos agrava esses impactos e não afeta apenas indivíduos com perda auditiva, mas também aqueles com audição normal. Embora os aparelhos auditivos auxiliem na compensação da perda sensorial, sua eficácia na compreensão da fala no ruído é limitada, e sua subutilização impulsiona a busca por intervenções complementares, como treinamentos auditivos e cognitivos.
Os treinamentos auditivos buscam aprimorar a distinção de sinais acústicos por meio da exposição ativa a estímulos sonoros variáveis. Estudos mostram que esse tipo de treinamento melhora a detecção de informações acústicas degradadas e não degradadas no ruído. No entanto, a compreensão da fala não depende apenas da percepção auditiva, mas também do processamento multissensorial, linguístico e cognitivo, especialmente da memória de trabalho. Assim, a conexão entre cognição e percepção da fala motivou pesquisas sobre o potencial dos treinamentos cognitivos como estratégia complementar.
Treinamentos cognitivos desafiam funções mentais superiores, e alguns estudos sugerem que podem melhorar a percepção da fala por meio da transferência de habilidades. No entanto, evidências indicam que a combinação de treinamento auditivo e cognitivo pode ser mais eficaz, pois a compreensão da fala exige tanto processamento sensorial quanto cognitivo.
Essa abordagem integrada é sustentada por modelos teóricos que destacam a importância da alocação eficiente de recursos mentais para a percepção auditiva, sugerindo que uma estratégia combinada pode proporcionar melhores resultados do que treinamentos isolados.
Para maximizar os benefícios do treinamento auditivo-cognitivo, é essencial adotar um design que reflita situações reais de escuta. Isso inclui a incorporação de tarefas naturais de fala e elementos multissensoriais, como estímulos visuais derivados dos movimentos faciais do falante.
Evidências mostram que a percepção audiovisual pode aprimorar a inteligibilidade da fala, especialmente em ambientes ruidosos. Assim, integrar componentes auditivos, cognitivos e visuais pode otimizar a adaptação a desafios auditivos cotidianos, promovendo maior eficácia na comunicação.
O estudo investiga se um treinamento auditivo-cognitivo de curto prazo melhora a percepção da fala no ruído em adultos mais velhos, considerando diferentes níveis de acuidade auditiva e capacidade cognitiva. Para isso, foi desenvolvido um paradigma de fala-memória que manipula a carga cognitiva e a modalidade de apresentação da fala (auditiva ou audiovisual imersiva em realidade virtual). Os participantes passaram por uma sessão de treinamento (~42 min) ouvindo fala natural e respondendo a perguntas de compreensão, enquanto os limiares individuais de recepção de fala no ruído foram medidos antes e depois.
O design do estudo permitiu avaliar a influência da modalidade imersiva e da carga cognitiva na percepção da fala, além de controlar efeitos de exposição. A hipótese central é que o treinamento melhora a percepção da fala no ruído e que essa melhora é mais pronunciada no ambiente imersivo, que simula situações reais de escuta.
A análise comparou o desempenho de compreensão entre sessões de treinamento auditivo (AU) e imersivo (IM) para descartar efeitos de exaustão. Utilizando um modelo misto linear generalizado, observou-se um desempenho significativamente melhor na sessão imersiva em comparação à auditiva.
Além disso, houve uma interação significativa entre modalidade e bloco, indicando que o desempenho caiu no final do treinamento auditivo, mas permaneceu estável no treinamento imersivo. Esses resultados sugerem que a imersão facilitou o processamento sensorial e cognitivo, enquanto o treinamento auditivo exigiu maior esforço, levando a uma queda no desempenho ao longo da sessão.
O estudo analisou se um treinamento auditivo imersivo multissensorial melhora a percepção da fala no ruído mais do que um treinamento auditivo convencional. O modelo revelou uma melhora geral na percepção da fala após o treinamento, com uma redução média de 0,35 dB no SNR, indicando maior tolerância ao ruído. No entanto, a melhora foi significativa apenas após o treinamento imersivo (~0,6 dB), enquanto o treinamento auditivo resultou em uma redução insignificante (~0,12 dB).
Como todos os participantes realizaram ambos os treinamentos em ordem balanceada, esses achados sugerem que a imersão promove maior impacto na percepção da fala no ruído. Entre as variáveis de controle, apenas o limiar auditivo (PTA) teve associação significativa com o desempenho.
O estudo examinou se um treinamento auditivo imersivo multissensorial poderia melhorar a percepção da fala no ruído mais do que um treinamento auditivo convencional. A análise revelou um efeito significativo do tempo, com uma melhora geral na percepção da fala após o treinamento, refletida por uma redução média de 0,35 dB no SNR. No entanto, não houve efeito principal da modalidade, indicando que, em média, as duas abordagens não diferiram significativamente.
Apesar disso, a interação entre modalidade e tempo foi significativa, mostrando que a melhora no SNR ocorreu apenas após o treinamento imersivo (~0,6 dB), enquanto o treinamento auditivo convencional teve um impacto muito menor (~0,12 dB). Como todos os participantes passaram por ambas as sessões e a ordem foi balanceada, esses resultados reforçam a ideia de que a imersão sensorial contribui mais para a melhora na percepção da fala no ruído.
Além disso, foram incluídas variáveis de controle como limiar auditivo (PTA), idade, cognição geral (MoCA) e capacidade de memória de trabalho auditiva e visual. Apenas o PTA mostrou uma associação significativa com o desempenho da fala no ruído, enquanto as demais variáveis não explicaram diferenças relevantes. Isso sugere que a acuidade auditiva tem um papel central na percepção da fala no ruído, mas que a imersão sensorial pode oferecer um benefício adicional independente de outros fatores cognitivos.
O estudo investigou os efeitos do treinamento auditivo-cognitivo imersivo na percepção da fala no ruído em idosos, comparando-o a um treinamento auditivo convencional. Os participantes foram expostos a duas modalidades de treinamento – auditiva e audiovisual imersiva – e tiveram seu limiar de recepção de fala no ruído avaliado antes e depois das sessões. Os resultados mostraram que apenas o treinamento imersivo resultou em uma melhora significativa na percepção da fala no ruído, enquanto o treinamento auditivo tradicional não apresentou mudanças substanciais. Essa melhora foi mais pronunciada em indivíduos com perda auditiva ou menor capacidade de memória de trabalho, sugerindo que a exposição a um ambiente multissensorial pode otimizar a alocação de recursos sensoriais e cognitivos.
Os achados reforçam a importância de ambientes de treinamento mais realistas, nos quais a integração de informações visuais e auditivas pode facilitar a compreensão da fala. A teoria do sistema perceptual-cognitivo integrado sugere que o processamento sensorial e cognitivo compartilham recursos limitados, e um ambiente imersivo pode incentivar uma alocação mais eficiente desses recursos. No entanto, ainda há questões a serem exploradas, como o impacto do treinamento a longo prazo e o possível efeito de sobrecarga cognitiva.
Estudos futuros devem investigar a manutenção dos efeitos do treinamento e explorar abordagens neurofisiológicas para entender melhor como a integração multissensorial ocorre no cérebro.
O estudo investigou os efeitos de um treinamento auditivo-cognitivo imersivo de curto prazo em idosos, focando na percepção da fala em ambientes ruidosos. Os resultados indicaram que o treinamento imersivo reduziu significativamente os limiares de recepção da fala, sugerindo melhor percepção auditiva em ruído, enquanto o treinamento de controle não apresentou impacto significativo. Comparando com um estudo longitudinal, a melhora observada equivale a um atraso de cerca de três anos na deterioração auditiva relacionada à idade.
A pesquisa enfatiza a importância de designs de treinamento mais naturais e imersivos, que podem beneficiar especialmente indivíduos com maior perda auditiva ou menor capacidade de memória de trabalho auditiva. Além disso, sugere que ambientes multissensoriais aumentam a relevância do treinamento e potencializam seus efeitos.
O estudo envolveu 39 idosos saudáveis, falantes nativos de alemão suíço, sem distúrbios neurológicos ou auditivos significativos. A audiometria foi realizada para avaliar a acuidade auditiva dos participantes, confirmando que as diferenças interaurais em altas frequências não comprometeram a compreensão da fala.
Avaliação da fala no ruído
Para avaliar os limiares individuais de compreensão da fala no ruído, foi usado um Teste de Sentença de Matriz Alemã (Teste de Sentença de Oldenburger OLSA 83 :), que quantifica o limiar de percepção da fala (SRT) de 50% para fala no ruído. Durante o teste, 20 frases foram apresentadas em ruído de fundo em forma de fala, em que os níveis de ruído estão em um nível de apresentação constante de 65 dB SPL e o nível de estímulo foi adaptado nas 20 frases para determinar o SRT de 50% para cada participante.
Para o estudo atual, uma falante foi escolhida para apresentar o material de fala, já que o material de fala das sessões de treinamento também foi apresentado por uma falante. O teste contém um total de 40 listas de frases randomizadas (que foram randomizadas entre os participantes, para garantir que nenhum participante fosse exposto à mesma lista duas vezes), em que as frases seguem a mesma estrutura (nome-verbo-número-adjetivo-objeto), mas são colocadas juntas randomizadas a partir de um inventário de dez itens por categoria (por exemplo, dez nomes diferentes, dez verbos diferentes etc.). Para determinar o SRT de 50%, foi estabelecido o SNR no qual 50% das palavras apresentadas são compreendidas. Como tal, foi utilizado um procedimento adaptativo descrito por Brand e Kollmeier 84 , 85 .
A medição começa com uma relação sinal-ruído (SNR) de 0 dB. Se mais de 2 palavras forem corretamente compreendidas e repetidas, o sinal de fala foi diminuído em 0,3 dB ou aumentado em caso de mal-entendido. Este procedimento foi aplicado de forma adaptativa em todas as 20 frases para estabelecer o limite de 50% 84 . A medição ocorreu em uma cabine eletricamente blindada e com tratamento acústico por meio de uma implementação OLSA computadorizada fornecida pela Oldenburger Measurement Applications (Hörzentrale Oldenburg, Alemanha). O audiômetro Affinity Compact (Interacoustics, Middelfart, Dinamarca), com um fone de ouvido circumaural DD450 (Radioear, New Eagle, PA, EUA) foi utilizado para apresentar o material de fala (idêntico à avaliação audiométrica).
Triagem cognitiva
O Montreal Cognitive Assessment Score (MoCA, versão alemã 8.1 83 ) foi usado para estabelecer a capacidade cognitiva geral, em que as pontuações variam de 0 a 30 pontos (pontuações mais altas indicam melhores capacidades cognitivas). O MoCA é um instrumento de triagem frequentemente usado para comprometimento cognitivo leve (MCI), em que no contexto clínico uma pontuação de desempenho de ≤26 pontos sugere avaliação adicional para MCI. No estudo atual, os participantes foram incluídos com um ponto de corte de ≥23 pontos, com base em uma revisão recente de Carson e colegas 86 , sugerindo uma taxa menor de falsos positivos. Além disso, a redução do ponto de corte permitiu uma gama mais ampla de capacidade cognitiva dentro da amostra, o que era desejado para investigar potenciais efeitos induzidos pelo treinamento em uma amostra representativa de indivíduos mais velhos com capacidades cognitivas variadas. Um total de 11 participantes pontuou abaixo de 26 pontos ( M MoCA = 27, Faixa MoCA = 23–30, DP MoCA = 2).
Além disso, a capacidade da memória de trabalho foi avaliada usando um paradigma n -back sequencial computadorizado. Em geral, a tarefa n-back exige que os participantes armazenem e atualizem informações que foram apresentadas em posições back com um determinado estímulo alvo. Embora essa tarefa seja frequentemente usada para sondar funções da memória de trabalho 87 , é importante destacar que ela não reflete totalmente a capacidade da memória de trabalho, mas sim atualiza e mantém informações. No entanto, esses aspectos específicos da memória de trabalho são importantes para a percepção da fala, particularmente no contexto da fala natural, razão pela qual usamos essa tarefa para avaliar a capacidade da memória de trabalho. Além disso, optamos por avaliar a precisão da memória de trabalho nas modalidades visual e auditiva, pois elas refletem dois elementos importantes das sessões de treinamento. No entanto, considerando a medida de resultado usada, ou seja, a tarefa de fala no ruído, esperávamos encontrar uma relação mais forte entre a capacidade da memória de trabalho auditiva e os efeitos induzidos pelo treinamento.
Como foi demonstrado em estudos anteriores, a capacidade da memória de trabalho auditiva específica da modalidade parece ter o potencial de explicar a variação na percepção da fala em ambientes ruidosos 88 , 89 , 90 . A tarefa n-back apresentada incluiu duas modalidades (visual e auditiva), que foram administradas em uma ordem contrabalanceada entre os participantes. Quadrados coloridos foram usados como estímulos visuais, apresentados em uma tela branca (~50 cm de distância entre a tela e os olhos), enquanto letras alemãs faladas foram usadas para a tarefa n -back auditiva. As letras foram faladas por uma voz masculina por meio de uma interface de áudio RME Fireface UCX II (RME, Haimhausen, Alemanha) e entregues por meio de fones de ouvido de inserção ER-1 (Etymotic Research, Elk Grove Village, EUA) em um nível de apresentação fixo de 70 dB. Para garantir que o desempenho da memória de trabalho não fosse afetado pela perda auditiva individual, a correlação de Spearman Rank foi usada para avaliar a relação.
Embora houvesse uma tendência, indicando desempenho n-back reduzido, a correlação não foi significativa ( r (37) = −0,31, p = 0,061). A relação entre o desempenho n-back e o PTA4 é visualizada na Fig. 5 . Um total de três níveis de dificuldade foram avaliados (0-, 1- e 2-back), onde os blocos contendo os níveis de dificuldade (um total de 40 itens para cada bloco) foram randomizados. No início da tarefa, uma instrução verbal geral foi fornecida aos participantes e antes de cada bloco, uma instrução escrita adicional foi dada sobre o nível n-back seguinte. Em geral, os participantes tiveram que responder sempre que os estímulos atuais correspondessem ao apresentado nposições de volta. Dentro da condição de controle 0-back, os participantes foram instruídos com um estímulo alvo e tiveram que responder sempre que o alvo fosse apresentado.
Antes do início de cada modalidade, um teste de prática foi administrado para garantir que os participantes tivessem entendido a tarefa corretamente. A taxa de apresentação foi definida para 2,5 s (duração do estímulo, 500 ms; intervalo interestímulo, 2000 ms). A tarefa n -back foi programada e apresentada por meio do software Presentation® (versão 23.0, Neurobehavioral Systems, Inc., Berkeley, CA). A conclusão da avaliação n-back levou aproximadamente 10 min (incluindo ambas as modalidades e rodadas de prática). A partir dos dados obtidos, a precisão n-back para a condição 2-back foi usada para capacidade de memória de trabalho auditiva ( M AWM = 0,63, intervalo AWM = 0,2–1, DP AWM = 0,18) e capacidade de memória de trabalho visual ( M VWM = 0,47, intervalo VWM = 0,1–0,9, DP VWM = 0,17) como um indicador primário para memória de trabalho auditiva e visual.
Os participantes visitaram o laboratório três vezes. Na primeira consulta, foram submetidos a triagem de saúde, audiometria e avaliação cognitiva. As segunda e terceira consultas consistiram em sessões de treinamento auditivo-cognitivo, realizadas com uma semana de intervalo, no mesmo horário, para minimizar a fadiga. Antes e depois de cada sessão, o Teste de Sentença de Matriz Alemã (OLSA) foi aplicado para medir o limiar de percepção da fala (SRT).
Foram testadas duas abordagens de treinamento: **auditiva (AU)** e **imersiva audiovisual (IM)**. Ambas usaram uma tarefa de memória de fala, na qual os participantes ouviam sentenças naturais com diferentes cargas de memória e respondiam verbalmente a perguntas de compreensão. No treinamento AU, o material foi apresentado apenas por áudio, enquanto no IM foi exibido um vídeo estereoscópico tridimensional do orador em um visor de realidade virtual (HMD HP Reverb G2). O vídeo, filmado em um estúdio profissional, permitiu uma experiência imersiva em 180°.
A comparação entre os métodos visou avaliar os efeitos da imersão audiovisual na percepção da fala no ruído.
Durante o treinamento auditivo-cognitivo, os participantes ouviam frases e respondiam a perguntas de compreensão. O material de fala foi gravado por uma atriz treinada em alemão padrão, com uma taxa média de 4,34 sílabas por segundo. O conteúdo abrangeu 10 temas de conhecimento geral, como flora, fauna, culinária e história suíça, visando refletir situações de escuta realistas.
Foram apresentados 120 itens de fala, divididos em 60 de baixa carga de memória (frases únicas, ~9 s) e 60 de alta carga (duas frases, ~18 s). Cada sessão continha 30 itens de cada tipo, apresentados em ordem randomizada. Após cada item, os participantes respondiam verbalmente a uma pergunta, com as respostas gravadas para avaliação.
Para garantir o aumento da carga cognitiva, as perguntas dos itens de alta carga referiam-se sempre à primeira frase. Além disso, a cada 10 testes, um item simulado foi inserido, em que a pergunta abordava a segunda frase, impedindo estratégias de escuta previsíveis. Cada sessão iniciava com cinco testes práticos para garantir a compreensão da tarefa.
Que ler o artigo na íntegra? Acesse: https://www.nature.com/articles/s41539-025-00306-5
0 comentários