Esempi di file di testo

  • latin1 in latin1.txt è un file contente solo caratteri rappresentabili nel set Latin 1, e codificato in Latin1
  • latin1 in UTF8.txt contiene le stesse informazioni, ma codificate in UTF-8

Notare come la versione Latin 1 usi un byte per carattere, mentre la versione UTF-8 usa un uno o due byte per carattere. I caratteri che fanno parte del codice ASCII standard sono codificati in maniera uguale in entrambi i file.

  • Unicode in UTF8.txt è un file contenente caratteri latini e giapponesi, codificato in UTF-8
  • Unicode in UCS4.txt è un file contenente caratteri latini e giapponesi, codificato in UCS-4 (anche noto come UTF-32)
La versione UTF-8 usa due o tre byte per carattere, mentre UCS-4 usa 4 byte per tutti i caratteri. La codifica di UCS-4 è big endian.