Esta es la segunda y última parte de la entrada publicada el otro día. Trataremos primero el formato de codificación Unicode que almacena los símbolos con longitud variables, UTF-8; y terminaremos comentando el collation u orden lexicográfico que seguro que habéis visto si manejáis algún gestor de base de datos como MySQL.
UTF-8
La aparición de UTF-8 supuso un antes y un después en la tecnología derivada de los juegos de caracteres. Sus dos creadores fueron: Robert C. Pike y Kenneth L. Thompson (el mismo que creó Unix y fue padre de B el antecesor de C).
Hace ya unos días iniciamos la serie de artículos de “Conceptos de informática” y comenzamos hablando del endian hoy seguimos con esta serie de post y hablaremos de los juegos de caracteres, los llamados charset y los collation que podríamos traducirlo como orden lexicográfico.
Juegos de caracteres
Cuando queremos almacenar información textual sobre una máquina que gestiona y almacena sólo información binaria, tenemos que decidir algún método para formalizar nuestra representación textual en forma de dígito que esta pueda almacenar.
Hoy comenzamos una serie de nuevos post temáticos llamados “Conceptos de informática” y en los que trataremos brevemente ciertos conceptos que consideramos interesantes para todos los que usamos tantas horas al día este tipo de máquinas.
No me atrevo a llamarlo sección porque ni va a tener una periodicidad constante como la Tira o el podcast. Por cierto, aprovecho para comentaros que la dormida sección de juegos volverá a tener actividad en breve, aunque esta vez sin una periodicidad constante.
Esta mañana me he enterado a través de la Web de la Escuela Politécnica Superior – Universidad de Córdoba, de que se ha creado un sindicato para defender los derechos de los Ingenieros Técnicos e Ingenieros en Informática. Realmente desconozco sus ventajas, salvo por lo que he estado leyendo a través de su página, si alguno de vosotros las conoce que comente para hacérnoslo llegar al resto.
Para más información: www.sitic.es.