Todos los archivos se pueden clasificar en uno de dos formatos de archivo: binario o de texto. Los dos tipos de archivos pueden tener el mismo aspecto en la superficie, pero codifican datos de forma diferente. Mientras que tanto los archivos binarios como los de texto contienen datos almacenados como una serie de bits (valores binarios de 1s y 0s), los bits de los archivos de texto representan caracteres, mientras que los bits en los archivos binarios representan datos personalizados. Mientras que los archivos de texto contienen solamente datos de texto, los archivos binarios pueden contener tanto datos binarios personalizados y de texto.
Los archivos binarios
Los archivos binarios típicamente contienen una secuencia de bytes, o agrupaciones ordenadas de ocho bits. Al crear un formato de archivo personalizado para un programa, un desarrollador organiza estos bytes en un formato que almacena la información necesaria para la aplicación. Los formatos de archivos binarios pueden incluir múltiples tipos de datos en el mismo archivo, tales como datos de audio, imágenes y video. Estos datos pueden ser interpretados por los programas de apoyo, pero se mostrarán como texto ilegible en un editor de texto. A continuación se muestra un ejemplo de un archivo de imagen .PNG abierto en un visor de imágenes y en un editor de texto.
Visor de imágenes | Editor de texto |
---|---|
Como se puede ver, el visor de imágenes reconoce los datos binarios y muestra la imagen. Cuando la imagen se abre en un editor de texto, los datos binarios se convierten en texto irreconocible. Sin embargo, se puede notar que la parte del texto es legible. Esto se debe a que el formato PNG incluye pequeñas secciones para almacenar datos textuales. El editor de texto, mientras que no está diseñado para leer este formato de archivo, aún muestra este texto cuando se abre el archivo. Muchos otros tipos de archivos binarios incluyen secciones de texto legible así. Por lo tanto, puede ser posible encontrar algo de información acerca de un tipo de archivo binario desconocido abriéndolo en un editor de texto.
Los archivos binarios a menudo contienen encabezados, que son bytes de datos al comienzo de un archivo que identifica el contenido del archivo. Los encabezados a menudo incluyen el tipo de archivo y otra información descriptiva. Por ejemplo, en la imagen superior, el texto "PNG" indica que el archivo es una imagen PNG. Si un archivo tiene información de cabecera no válida, los programas de software no pueden abrir el archivo o pueden informar que el archivo está dañado.
Archivos de texto
Los archivos de texto son más restrictivos que los archivos binarios, ya que solamente pueden contener datos de texto. Sin embargo, a diferencia de los archivos binarios, son menos propensos a corromperse. Mientras que un pequeño error en un archivo binario puede hacer que sea ilegible, un pequeño error en un archivo de texto puede simplemente mostrarse una vez que el archivo ha sido abierto. Esta es una de las razones por las que Microsoft cambió a un formato XML basado en texto comprimido para los tipos de archivo de Office 2007.
Los archivos de texto se pueden guardar como texto sin formato (formato .TXT) o como texto enriquecido (formato .RTF). Un archivo de texto sin formato típico contiene varias líneas de texto, cada una seguida de un caracter de fin de línea (EOL). Un caracter de fin de archivo (EOF) se coloca después del último caracter, señalando el final del archivo. Los archivos de texto enriquecido utilizan una estructura de archivos similar, pero también pueden incluir estilos de texto, como negrita y cursiva, así como la página de información de formateo. Tanto el texto sin formato como los archivos de texto enriquecido incluyen un grupo de codificación de caracteres que determina cómo los caracteres son interpretados y qué caracteres se pueden mostrar.
Dado que los archivos de texto utilizan un formato simple, estándar, muchos programas de lectura y edición son capaces de abrir archivos de texto. Los editores de texto más comunes incluyen Microsoft Bloc de notas y WordPad, que se incluyen con Windows; y Apple TextEdit, que se incluye con Mac OS X.
Archivos desconocidos
Si se encuentra con un tipo de archivo desconocido, busque primero la extensión de archivo en FileInfo.com. Si el archivo no tiene una extensión o usted es incapaz de localizar el tipo de archivo, puede intentar abrir el archivo en un editor de texto. Si el archivo se abre y muestra el texto totalmente legible, es un archivo de texto que ha abierto con éxito.
Si el archivo se abre y muestra el texto ilegible en su mayoría, se trata de un archivo binario. Al abrirlo con el editor de texto puede encontrar algunas pistas en el texto que revelen información sobre el tipo de archivo, como en el ejemplo anterior PNG. Esto puede ayudarle a determinar qué programa es necesario abrir el archivo correctamente. Por último, si el archivo no se abre en un editor de texto, es un archivo binario que solamente puede ser abierto por el programa apropiado.