Páginas

domingo, 30 de enero de 2011

¿Cuánta información contiene este artículo?


¿Cuánta información contiene este artículo? (I)

Vamos hacer un ejercicio de endogamia, o quizás de autoanálisis: ¿podríamos calcular cuánta información posee este artículo que ahora mismo estáis leyendo? No hablamos de lo valiosa que pueda ser esta información, ni tampoco de los cambios que podría producir en vuestra mente. Sencillamente de la información que contiene en bruto, independientemente de su valor informativo.
Ello se puede conseguir contando cuántos símbolos hacen falta para transmitir este artículo. Cuando hablamos de símbolos nos referimos a letras, palabras o números.
Imaginemos que este artículo está formado por 1.000 palabras. (Hasta aquí llevamos 95, incluyendo el título).

En la lengua inglesa, las palabras contienen en promedio 4,5 caracteres alfabéticos. Incluyendo los espacios que separan las palabras entre sí, la longitud media de una palabra es de 5,5 caracteres.
Es decir, que si este artículo estuviera escrito en inglés, siguiendo las indicaciones de Graham Tattersall, este artículo de 1.000 palabras es también un mensaje de 5.500 caracteres.
Lo habitual es transformar los caracteres en secuencias de símbolos binarios. Los símbolos binarios se usan de forma general en los sistemas informáticos y sólo está formado por ceros y unos. Por ejemplo, imaginemos la letra A. En binario, se escribiría con una serie de 8 símbolos: 01000001, según el código ASCII (Código Estadounidense Estándar para el Intercambio de Información). Un espacio entre palabras se representaría con la serie 00100000.
Cada uno de esos 1 y 0 cuenta como un bit.
Como hemos dicho, si cada palabra contiene de media 5,5 caracteres, este artículo de 1.000 palabras se calcularía así:
1.000× 8 = 44.000 bits.
En cada byte hay 8 bits, de forma que este artículo, almacenado en un ordenador, ocuparía 44.000 / 8 = 5,5 kilobytes de espacio en disco.
Es un poco confusa esa práctica consistente en emplear el término “bit” para dos cosas, ya que se usa tanto para describir el símbolo binario como a manera de unidad de información. Se hace así porque ambas cosas están muy relacionadas entre sí. De hecho, a menudo los símbolos binarios son portadores de 1 bit de información. Digo que ocurre a menudo, pero no siempre es así.

¿Cuánta información contiene este artículo? (y II)

Por ejemplo, echemos un vistazo a la información contenida en los sonidos y las imágenes, que también se cuentan con estas unidades: los bits.
Una llamada de teléfono corriente envía 64.000 bits de información por segundo.
La música almacenada en un CD tiene unos 750 kilobits por cada segundo de tiempo de audición.
La televisión digital usa alrededor de 1 millón de bits por segundo.

Estas cifras nos permiten hacen comparación asombrosas. Por ejemplo: si una hora de televisión digital posee 3.6000 millones de bits, y una palabra inglesa tiene un promedio de 44 bits, llegamos a la conclusión de que los bits usados para transmitir una hora de televisión digital son los equivalentes para transmitir 3.600 millones / 44 = 81,8 millones de palabras de texto.
1 hora de tele es igual a 80 millones de palabras.
Si un libro normal tiene unas 50.000 palabras, 1 hora de tele digital equivale a algo más de 1.700 libros. Incluso una hora del reality Gran Hermano equivale a una pequeña biblioteca. Pero recordad que hablamos de datos en bruto, no de valor informativo.
No hay que confundir ambos términos: la Biblia, por ejemplo, contiene unas 800.000 palabras. Como cada palabra dijimos que equivale a 5,5 caracteres, la Biblia posee unos 4.400.000 caracteres.
Si cada carácter equivale a 1 byte, entonces un archivo que contuviera toda la Biblia sólo ocuparía 4,4 MB.Menos del 1 % del espacio que puede almacenar un CD.

No hay comentarios:

Publicar un comentario