Supresión y cancelación de eco - Echo suppression and cancellation

La supresión y cancelación de eco son métodos que se utilizan en telefonía para mejorar la calidad de la voz evitando que se cree eco o eliminándolo después de que ya está presente. Además de mejorar la calidad de audio subjetiva, la supresión de eco aumenta la capacidad lograda a través de la supresión de silencio al evitar que el eco viaje a través de una red de telecomunicaciones . Los supresores de eco se desarrollaron en la década de 1950 en respuesta al primer uso de satélites para telecomunicaciones.

Los métodos de supresión y cancelación de eco se denominan comúnmente supresión de eco acústico ( AES ) y cancelación de eco acústico ( AEC ), y más raramente cancelación de eco de línea ( LEC ). En algunos casos, estos términos son más precisos, ya que existen varios tipos y causas de eco con características únicas, incluido el eco acústico (los sonidos de un altavoz son reflejados y grabados por un micrófono, que pueden variar sustancialmente con el tiempo) y el eco de línea ( impulsos eléctricos causados, por ejemplo, por acoplamiento entre los cables de envío y recepción, desajustes de impedancia, reflejos eléctricos, etc., que varía mucho menos que el eco acústico). En la práctica, sin embargo, se utilizan las mismas técnicas para tratar todos los tipos de eco, por lo que un cancelador de eco acústico puede cancelar tanto el eco de línea como el acústico. AEC en particular se usa comúnmente para referirse a canceladores de eco en general, independientemente de si fueron diseñados para eco acústico, eco de línea o ambos.

Aunque los supresores de eco y los compensadores de eco tienen objetivos similares (evitar que una persona que habla escuche el eco de su propia voz), los métodos que utilizan son diferentes:

  • Los supresores de eco funcionan detectando una señal de voz que va en una dirección en un circuito y luego silenciando o atenuando la señal en otra dirección. Por lo general, el supresor de eco en el extremo lejano del circuito hace este silenciamiento cuando detecta voz proveniente del extremo cercano del circuito. Este silenciamiento evita que el hablante escuche su propia voz regresando desde el otro extremo.
  • La cancelación de eco implica reconocer primero la señal transmitida originalmente que reaparece, con cierto retraso, en la señal transmitida o recibida. Una vez que se reconoce el eco, se puede eliminar restándolo de la señal transmitida o recibida. Esta técnica generalmente se implementa digitalmente usando un procesador de señal digital o software, aunque también se puede implementar en circuitos analógicos.

Las normas de la UIT G.168 y P.340 describen los requisitos y las pruebas para los compensadores de eco en aplicaciones digitales y RTPC , respectivamente.

Historia

En telefonía , el eco es la copia reflejada de la voz que se escucha algún tiempo después. Si el retraso es bastante significativo (más de unos pocos cientos de milisegundos), se considera molesto. Si el retraso es muy pequeño (decenas de milisegundos o menos), el fenómeno se denomina efecto local . Si el retardo es un poco más largo, alrededor de 50 milisegundos, los humanos no pueden escuchar el eco como un sonido distinto, sino que escuchan un efecto de coro .

En los primeros días de las telecomunicaciones, la supresión de eco se utilizó para reducir la naturaleza objetable de los ecos para los usuarios humanos. Una persona habla mientras la otra escucha, y hablan de un lado a otro. Un supresor de eco intenta determinar cuál es la dirección principal y permite que ese canal avance. En el canal inverso, coloca atenuación para bloquear o suprimir cualquier señal asumiendo que la señal es eco. Aunque el supresor se ocupa eficazmente del eco, este enfoque genera varios problemas que pueden resultar frustrantes para ambas partes de una llamada.

  • Habla doble : es bastante normal en una conversación que ambas partes hablen al mismo tiempo, al menos brevemente. Debido a que cada supresor de eco detectará entonces la energía de voz proveniente del extremo lejano del circuito, el efecto sería normalmente que la pérdida se insertara en ambas direcciones a la vez, bloqueando efectivamente a ambas partes. Para evitar esto, los supresores de eco se pueden configurar para que detecten la actividad de voz del altavoz del extremo cercano y no inserten la pérdida (o inserten una pérdida menor) cuando tanto el altavoz del extremo cercano como el del extremo lejano estén hablando. Esto, por supuesto, anula temporalmente el efecto principal de tener un supresor de eco.
  • Recorte: dado que el supresor de eco inserta y elimina alternativamente la pérdida, con frecuencia hay un pequeño retraso cuando un nuevo hablante comienza a hablar que resulta en recortar la primera sílaba del discurso de ese hablante.
  • Punto muerto: si el interlocutor del otro extremo de una llamada se encuentra en un entorno ruidoso, el altavoz del extremo cercano escuchará ese ruido de fondo mientras el altavoz del extremo lejano está hablando, pero el supresor de eco suprimirá este ruido de fondo cuando el -el orador final comienza a hablar. La repentina ausencia del ruido de fondo da al usuario cercano la impresión de que la línea se ha interrumpido.

En respuesta a esto, Bell Labs desarrolló la teoría del cancelador de eco a principios de la década de 1960, que luego resultó en canceladores de eco de laboratorio a fines de la década de 1960 y canceladores de eco comerciales en la década de 1980. Un cancelador de eco funciona generando una estimación del eco de la señal del hablante y resta esa estimación de la ruta de retorno. Esta técnica requiere un filtro adaptativo para generar una señal lo suficientemente precisa como para cancelar efectivamente el eco, donde el eco puede diferir del original debido a varios tipos de degradación en el camino. Desde la invención en AT&T Bell Labs, los algoritmos de cancelación de eco se han mejorado y perfeccionado. Como todos los procesos de cancelación de eco, estos primeros algoritmos fueron diseñados para anticipar la señal que inevitablemente volvería a entrar en la ruta de transmisión y la cancelaría.

Los rápidos avances en el procesamiento de señales digitales permitieron que los compensadores de eco se hicieran más pequeños y más rentables. En la década de 1990, los compensadores de eco se implementaron en conmutadores de voz por primera vez (en Northern Telecom DMS-250 ) en lugar de como dispositivos independientes. La integración de la cancelación de eco directamente en el conmutador significó que los canceladores de eco se podían encender o apagar de manera confiable llamada por llamada, eliminando la necesidad de grupos de troncales separados para llamadas de voz y datos. La tecnología de telefonía actual a menudo emplea canceladores de eco en dispositivos de comunicación pequeños o portátiles a través de un motor de voz de software , que proporciona la cancelación del eco acústico o del eco residual introducido por un sistema de puerta de enlace PSTN de extremo lejano; Estos sistemas suelen cancelar las reflexiones del eco con un retraso de hasta 64 milisegundos.

Operación

Un cancelador de eco adaptativo para un circuito telefónico. La función de H , el transformador híbrido , es enrutar la voz entrante desde el extremo lejano x k al teléfono local y enrutar la voz desde el teléfono al extremo lejano. Sin embargo, el híbrido no es nunca perfecto, por lo que su salida d k contiene tanto la voz deseada desde el teléfono local más habla filtrada desde el otro extremo. El cancelador de eco es el filtro adaptativo f k , que intenta minimizar la señal de error ε k filtrando la voz del extremo lejano entrante en una réplica y k de la voz del extremo lejano que se filtra a través del híbrido. Una vez que se completa la adaptación, la señal de error consiste principalmente en voz del teléfono local.

El proceso de cancelación de eco funciona de la siguiente manera:

  1. Se envía una señal de extremo lejano al sistema.
  2. Se reproduce la señal del extremo lejano.
  3. La señal del extremo lejano se filtra y retrasa para parecerse a la señal del extremo cercano.
  4. La señal filtrada del extremo lejano se resta de la señal del extremo cercano.
  5. La señal resultante representa los sonidos presentes en la habitación excluyendo cualquier sonido directo o reverberado.

El desafío principal para un cancelador de eco es determinar la naturaleza del filtrado que se aplicará a la señal del extremo lejano de manera que se parezca a la señal del extremo cercano resultante. El filtro es esencialmente un modelo de altavoz, micrófono y los atributos acústicos de la habitación. Los compensadores de eco deben ser adaptables porque las características del altavoz y el micrófono del extremo cercano generalmente no se conocen de antemano. Los atributos acústicos de la habitación del extremo cercano tampoco se conocen de antemano por lo general y pueden cambiar (por ejemplo, si el micrófono se mueve en relación con el altavoz o si las personas caminan por la habitación provocando cambios en los reflejos acústicos). Al utilizar la señal del extremo lejano como estímulo, los sistemas modernos utilizan un filtro adaptativo y pueden converger desde no proporcionar cancelación hasta 55 dB de cancelación en unos 200 ms.

Hasta hace poco, la cancelación de eco solo necesitaba aplicarse al ancho de banda de voz de los circuitos telefónicos. Las llamadas PSTN transmiten frecuencias entre 300 Hz y 3 kHz, el rango requerido para la inteligibilidad del habla humana. La videoconferencia es un área en la que se utiliza audio de ancho de banda completo. En este caso, se emplean productos especializados para realizar la cancelación de eco.

Debido a que la supresión de eco tiene limitaciones conocidas, en una situación ideal, solo se utilizará la cancelación de eco. Sin embargo, esto es insuficiente en muchas aplicaciones, especialmente en teléfonos de software en redes con gran retraso y escaso rendimiento. Aquí, la cancelación y supresión de eco pueden funcionar en conjunto para lograr un rendimiento aceptable.

Cuantificar el eco

El eco se mide como pérdida de retorno de eco (ERL). Esta es la relación, expresada endecibelios, del original y su eco. Los valores altos significan que el eco es muy débil, mientras que los valores bajos significan que el eco es muy fuerte. Negativo indica que el eco es más fuerte que la señal original, que si no se marca podría causarretroalimentación de audio.

El rendimiento de un cancelador de eco se mide en mejora de la pérdida de retorno de eco (ERLE), que es la cantidad de pérdida de señal adicional aplicada por el cancelador de eco. La mayoría de los compensadores de eco pueden aplicar ERLE de 18 a 35 dB.

La pérdida total de señal del eco (ACOM) es la suma de ERL y ERLE.

Usos actuales

Las fuentes de eco se encuentran en entornos cotidianos como:

  • Sistemas de telefonía manos libres para automóvil
  • Un teléfono estándar o un teléfono móvil en modo altavoz
  • Altavoces independientes dedicados
  • Instalación de sistemas de sala de conferencias que utilizan altavoces de techo y micrófonos en la mesa.
  • Acoplamiento físico donde las vibraciones del altavoz se transfieren al micrófono a través de la carcasa del auricular

En algunos de estos casos, el sonido del altavoz ingresa al micrófono casi inalterado. Las dificultades para cancelar el eco provienen de la alteración del sonido original por el espacio ambiental. Estos cambios pueden incluir ciertas frecuencias que son absorbidas por muebles blandos y el reflejo de diferentes frecuencias con diferente intensidad.

La implementación de AEC requiere experiencia en ingeniería y un procesador rápido, generalmente en forma de un procesador de señal digital (DSP), este costo en la capacidad de procesamiento puede ser muy elevado, sin embargo, muchos sistemas integrados tienen un AEC completamente funcional.

Los altavoces inteligentes y los sistemas de respuesta de voz interactivos que aceptan voz como entrada utilizan AEC mientras se reproducen las indicaciones de voz para evitar que el propio sistema de reconocimiento de voz reconozca falsamente las indicaciones repetidas y otras salidas.

Modems

Las líneas telefónicas estándar utilizan el mismo par de cables para enviar y recibir audio, lo que hace que una pequeña cantidad de la señal saliente se refleje. Esto es útil para las personas que hablan por teléfono, ya que proporciona una señal al hablante de que su voz llega a través del sistema. Sin embargo, esta señal reflejada causa problemas a un módem, que no puede distinguir entre una señal del módem remoto y el eco de su propia señal.

Por esta razón, los módems de marcación anteriores dividían las frecuencias de las señales, de modo que los dispositivos en cada extremo usaban tonos diferentes, lo que permitía que cada uno ignorara cualquier señal en el rango de frecuencia que estaba usando para la transmisión. Sin embargo, esto disminuyó la cantidad de ancho de banda disponible para ambos lados.

La cancelación de eco mitigó este problema. Durante el período de configuración y negociación de la llamada, ambos módems envían una serie de tonos únicos y luego escuchan su retorno a través del sistema telefónico. Miden el tiempo de retardo total y luego configuran una línea de retardo para ese mismo período. Una vez que se completa la conexión, envían sus señales a las líneas telefónicas como de costumbre, pero también a la línea de retardo. Cuando su señal se refleja, se mezcla con la señal invertida de la línea de retardo, lo que cancela el eco. Esto permitió que ambos módems usaran todo el espectro disponible, duplicando la velocidad posible.

Muchas empresas de telecomunicaciones también aplican la cancelación de eco a la propia línea, y puede provocar daños en los datos en lugar de mejorar la señal. Algunos conmutadores o convertidores telefónicos (como los adaptadores de terminales analógicos) desactivan la supresión o cancelación de eco cuando detectan los tonos de respuesta de 2100 o 2225 Hz asociados con dichas llamadas, de acuerdo con la recomendación UIT-T G.164 o G.165 .

Los módems ISDN y DSL que operan a frecuencias por encima de la banda de voz a través de cables telefónicos de par trenzado estándar también utilizan la cancelación automática de eco para permitir la comunicación de datos bidireccional simultánea. La complejidad computacional en la implementación del filtro adaptativo se reduce mucho en comparación con la cancelación de eco de voz porque la señal de transmisión es un flujo de bits digital. En lugar de una operación de multiplicación y suma para cada grifo del filtro, solo se requiere la suma. Un esquema de cancelación de eco basado en la tabla de búsqueda de RAM elimina incluso la operación de adición simplemente direccionando una memoria con un flujo de bits de transmisión truncado para obtener la estimación de eco. Con los avances en la tecnología de semiconductores, la cancelación de eco ahora se implementa comúnmente con técnicas de Procesador de señal digital (DSP).

Algunos módems usan frecuencias entrantes y salientes separadas o asignan ranuras de tiempo separadas para transmitir y recibir para eliminar la necesidad de cancelación de eco. Las frecuencias más altas más allá de los límites del diseño original de los cables telefónicos sufren una distorsión de atenuación significativa debido a las derivaciones del puente y la adaptación de impedancia incompleta . A menudo se producen brechas de frecuencia estrechas y profundas que no pueden remediarse mediante la cancelación de eco. Estos se detectan y mapean durante la negociación de la conexión.

Ver también

Referencias

enlaces externos