
- XML - Home
- XML - Información General
- XML - Sintaxis
- XML - Documentos
- XML - Declaración
- XML - Las Etiquetas
- XML - Elementos
- XML - Los Atributos
- XML - Comentarios
- XML - Entidades de Caracteres
- XML - CDATA Las Secciones
- XML - Espacios en Blanco
- XML - Procesamiento
- XML - Codificación
- XML - Validación
- Herramientas XML
- XML - Los Espectadores
- XML - Editores
- XML - Analizadores
- XML - Procesadores
XML - Codificacin
Codificacin es el proceso de convertir caracteres unicode en su equivalente representacin binaria. Cuando el procesador XML lee un documento XML, codifica el documento segn el tipo de codificacin.Por lo tanto, tenemos que especificar el tipo de codificacin en la declaracin XML.
Tipos de codificacin
Hay principalmente dos tipos de codificacin:
- UTF-8
- UTF-16
UTF significa Formato de transformacin UCS y UCS significa Conjunto de caracteres universal. El nmero 8 o 16 se refiere al nmero de bits utilizados para representar un carcter. Se trata de los de 8 (un byte) o 16 (dos bytes).Para los documentos sin informacin de codificacin UTF-8, se establece de forma predeterminada.
Sintaxis
Tipo de codificacin se incluye en el prlogo del documento XML. La sintaxis de codificacin UTF-8 es la siguiente:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
Sintaxis de codificacin UTF-16
<?xml version="1.0" encoding="UTF-16" standalone="no" ?>
Ejemplo
Ejemplo siguiente muestra declaracin de codificacin:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?> <contact-info> <name>Tanmay Patil</name> <company>TutorialsPoint</company> <phone>(011) 123-4567</phone> </contact-info>
En el ejemplo anterior encoding="UTF-8", especifica que 8 bits se utilizan para representar los caracteres. Para representar caracteres de 16 bits, UTF-16 codificacin se puede utilizar.
Los archivos XML codificados con UTF-8 tienden a ser de menor tamao que los codificados con formato UTF-16.