Portada » Informática » Fundamentos del Procesamiento de Señal Digital: Muestreo, Codificación y Corrección de Errores
En la conversión de analógica a digital, el proceso de muestreo es fundamental para transformar una señal continua en una discreta. Este proceso implica la captura de valores de la señal original en intervalos fijos.
La señal de entrada analógica puede contener frecuencias muy altas. Aunque estas frecuencias estén por encima del intervalo audible humano, si no se eliminan mediante un proceso de filtrado antes de la etapa de muestreo (sampling), se transformarán o se detectarán en el intervalo de las frecuencias audibles durante la grabación y la reproducción. Por ello, la señal de entrada debe pasar por un filtro pasabajos. Esta etapa, conocida como filtrado antialiasing, elimina las frecuencias altas no deseadas antes del muestreo y, por ende, antes de cualquier otro proceso. Si este fenómeno no se corrige, las frecuencias se solapan, lo que se conoce como aliasing. Los filtros utilizados para esta etapa suelen ser digitales y de muy alta selectividad, a menudo de 7º a 9º orden.
Los voltajes obtenidos del muestreo se convierten, mediante un proceso denominado codificación, en un código de dígitos binarios (bits) compuesto por una serie de impulsos. En la conversión analógica a digital (CAD), los 1s representan la presencia de voltaje y los 0s su ausencia. En un sistema de audio digital, las señales enviadas tienen dos estados y conmutan en tiempos predeterminados en función de una señal de reloj estable. Una cantidad expresada como un número binario se denomina palabra digital.
En un número binario, los dígitos representan el incremento de las potencias de 2 a partir del dígito menos significativo (LSB). También se definen el dígito más significativo (MSB) y la longitud de palabra. Existen dos formas principales de utilizar las señales binarias para transportar muestras de audio:
La cantidad de información que puede representarse depende del número de bits. Por ejemplo, una palabra de 3 bits, 4 bits (como 0101), etc. Cada bit permite representar dos niveles distintos de cuantificación. Por ejemplo, una palabra de 2 bits puede cuantificar 4 niveles diferentes (00, 01, 10, 11), y así sucesivamente. Una palabra digital de n bits produce 2n niveles discretos. Cuantos más niveles de cuantificación existan, mayor será la palabra digital y mejor la fidelidad con la señal original.
Las pérdidas de señal (dropouts) pueden hacer que un número significativo de bits en un área específica resulten defectuosos. A estos fallos se les denomina ráfaga de error. En el sistema binario, un bit presenta solo dos estados. Si uno de ellos es incorrecto, solo hay que invertirlo para que sea correcto. La principal dificultad radica en identificar los bits defectuosos, lo cual se consigue añadiendo bits redundantes para la codificación de los datos. Cuantos más fallos se esperen, más redundancia será necesaria. El nivel de redundancia debe ser proporcional al nivel de fallos que se desean corregir.
Las técnicas más usuales son Reed-Solomon y Viterbi FEC. Estas describen métodos para enviar suficientes bits redundantes que permitan reconocer la información afectada por errores y, en ciertas instancias, corregirla. Una comparación entre ellas se fundamenta en la relación entre la redundancia (que implica un incremento de la velocidad de transmisión) y la reducción de la tasa de error de bit (BER).
Las variantes más usadas de FEC a bloques son BCH y CIRC (Reed-Solomon). Se denomina Código Cíclico a un FEC a bloques que utiliza un polinomio generador con un registro de desplazamiento con realimentación (FSR). Existen ciertas variantes del FEC a bloques, las más usadas son:
Es el tipo de código más conveniente para errores independientes.
Es una variante del BCH y la más apropiada para ráfagas de errores, siendo la que se usa comúnmente en la grabación de sonido.
Este método aplica el algoritmo de Viterbi, también conocido como decodificación de máxima probabilidad, desarrollado en 1976.
La ocultación de errores es un proceso mediante el cual se puede calcular el valor de una muestra perdida a partir de las muestras circundantes. El valor de la muestra calculado no tiene por qué ser exactamente igual que el original, por lo que la ocultación puede ser percibida en algunos casos.
Existen cuatro técnicas muy utilizadas:
La ocultación es posible redistribuyendo o remezclando la secuencia de las muestras antes de la grabación. Por ejemplo, las muestras impares son separadas de las pares. Los grupos de muestras pares e impares pueden grabarse en lugares diferentes, de modo que si se produce una ráfaga de error, se vea afectado solo uno de los grupos.
Cuando la redundancia añadida es igual a la magnitud de la pérdida en cada código, el sistema puede resultar ineficaz. La eficacia del sistema puede mejorarse significativamente mediante la técnica del entrelazado, que distribuye los bits de datos de forma no secuencial para que una ráfaga de error afecte a bits no contiguos, facilitando su corrección.
Para altas densidades de grabación, se utilizan varios canales. Las tolerancias físicas pueden provocar desplazamientos de fase o errores de sincronización entre las pistas paralelas, por lo que cada una de ellas debe ser independiente hasta que se corrija la base de tiempos de la señal reproducida. El proceso de modulación de los datos en serie para que se auto-sincronicen con la frecuencia de reloj se denomina codificación del canal.
La codificación del canal también modela el espectro de la forma de onda en serie, con el fin de hacerla más eficaz. Con un buen código de canal, se puede almacenar una mayor cantidad de datos en un determinado soporte. El modelado del espectro se utiliza en los CD y en los DAT. La frecuencia mínima de la señal se producirá cuando tengamos un gran número de ‘0’ o ‘1’ seguidos, mientras que secuencias cambiantes de ‘0,1,0,1,0,1,0,1…’ provocarán una frecuencia muy elevada. Entre estos dos rangos, el margen es tan amplio que se deben establecer unos límites a la trama a grabar; para ello, se utiliza una técnica denominada modulación 8 a 14 (EFM). Se trata de sustituir muestras de 8 bits por otras de 14 bits.
Para poder almacenar la secuencia de 1s y 0s, variable del sistema, se emplea una técnica para asegurar el éxito: la modulación de no retorno a cero invertido (NRZI). En este sistema, los 1s son representados por transiciones que se producen justo a la mitad del tiempo que les corresponde. Si antes de que aparezca un 1 tenemos un nivel bajo, cuando llega este número (justo a la mitad del nivel que le corresponde) se pasa a nivel alto. Lo mismo ocurre si antes de que aparezca un 1 tenemos nivel alto, cuando llega este número (justo a la mitad del nivel que le corresponde), se pasa a nivel bajo. La sucesión de 0s no produce cambios. También, si tenemos un 1 y pasamos a 0, no se produce variación (permaneciendo en nivel alto en el caso de NRZI). La siguiente sucesión de 1s cambiará de nivel en cada media transición, salvo en el caso final de transición a 0, que no cambia de nivel.
En audio, una muestra de 16 bits se denomina Palabra, y media palabra indica un Símbolo de una muestra dada. Para corregir las deficiencias en la modulación NRZI, la secuencia binaria de una muestra cuantificada se convierte a otra secuencia distinta (también binaria). Este proceso de conversión actúa directamente sobre los símbolos que constituyen las muestras. Con este proceso, cada símbolo de 8 bits es convertido a una secuencia única de 14 bits (almacenada en una memoria ROM), lo que permite que el sincronismo del reloj de bits pueda ser regenerado a partir de los datos. La frecuencia de los niveles de voltaje tiene que ser limitada después de que se realice la NRZI. Los símbolos de 14 bits deben cumplir la siguiente regla: el número de ceros no debe ser mayor de 10 ni menor de 2 entre dos unos, y no puede contener unos contiguos entre símbolos. Esta es la Regla de 2 a 10. De las 277 combinaciones posibles, se eliminan las 21 más perjudiciales y se utilizan 256. Al final de cada símbolo de 14 bits se agregan 3 bits llamados bits de acoplamiento o fusión (merging bits). Los bits de acoplamiento hacen cumplir la Regla de 2 a 10 y mantienen los patrones libres de corriente continua (DC). A la señal resultante se le conoce como señal EFM-NRZI, EFM o EFMI, y es la señal que se graba en un CD o en una cinta digital.