Representa «Unicode Formato de transformación «. UTF se refiere a varios tipos de Unicode codificaciones de caracteres, incluidos UTF-7, UTF-8, UTF-16 y UTF-32.
- UTF-7 – usa 7 los bits para cada personaje Fue diseñado para representar ASCII personajes en correo electrónico mensajes que requerían codificación Unicode.
- UTF-8 – El tipo más popular de codificación Unicode. Usa uno byte para letras y símbolos ingleses estándar, dos bytes para caracteres latinos y del Medio Oriente adicionales, y tres bytes para caracteres asiáticos. Se pueden representar caracteres adicionales usando cuatro bytes. UTF-8 es compatible con versiones anteriores de ASCII, ya que los primeros caracteres 128 se asignan a los mismos valores.
- UTF-16 – una extensión de la codificación Unicode «UCS-2», que utiliza dos bytes para representar caracteres 65,536. Sin embargo, UTF-16 también admite cuatro bytes para caracteres adicionales de hasta un millón.
- UTF-32 – una codificación multibyte que representa cada carácter con bytes 4.
La mayoría del texto en documentos y a la páginas web se codifica utilizando una de las codificaciones UTF anteriores. Muchos procesamiento de textos Los programas no le permiten ver la codificación de caracteres de los documentos abiertos, aunque algunos muestran la codificación en la parte inferior de la ventana del documento o dentro de las propiedades del archivo. Si desea ver el tipo de codificación de caracteres que utiliza una página web, puede seleccionar Ver → Ver fuente para ver el HTML de la página. La codificación de caracteres, si está definida, estará en la sección del encabezado, cerca de la parte superior del HTML. Una página que utiliza la codificación UTF-8 puede incluir uno de los siguientes fragmentos de texto a continuación, dependiendo de la versión del HTML.
XHTML:
HTML 5: