Cambiare una pagina HTML in Unicode

Quindi avete sentito dire che è utile usare l'Unicode (UTF-8) per le vostre pagine piuttosto che una codifica di caratteri legacy come Latin1 (Windows 1252 o ISO 8859-1) o Shift_JIS, e avete sentito che altri lo stanno facendo, ma non siete sicuri di come funziona.

Questa pagina ti aiuterà a cambiare la codifica dei caratteri della tua pagina HTML in UTF-8.

Risposta

Di seguito riassumiamo le informazioni necessarie per convertire una semplice pagina in una codifica Unicode. Segui i link ad altri articoli del sito se hai bisogno di ottenere informazioni dettagliate su qualsiasi passo.

Per consigli molto più dettagliati sulla conversione di siti complessi, software e dati in Unicode, vedere l'articolo Migrazione in Unicode.

Passo 1: Salvare i dati come UTF-8

Non sarà sufficiente cambiare le dichiarazioni all'interno delle vostre pagine per dire che la pagina è codificata in UTF-8. Dovete assicurarvi che i vostri dati siano effettivamente codificati, cioè salvati, in UTF-8.

Se si lavora con file modificati a mano allora si dovrebbero usare le opzioni del proprio editor per salvare il file in UTF-8 piuttosto che la codifica che si stava utilizzando. Se state costruendo file da script e database, dovreste assicurarvi che i dati siano convertiti come necessario e che i parametri corretti siano impostati nel vostro ambiente di scripting.

Si noti che potrebbe essere necessario assicurarsi che i dati non includano una firma UTF-8, nota anche come byte-order mark (BOM).

Passo 2: Dichiarare la codifica nella pagina

Dovresti cambiare la dichiarazione di codifica dei caratteri nella tua pagina (o aggiungerne una se non lo dichiari già).

Nella sua forma più semplice, questo appare come segue, e dovrebbe arrivare all'inizio dell'elemento head nel codice HTML.

<meta charset="utf-8">

Passo 3: Assicurarsi che il server faccia la cosa giusta

Anche se i tuoi dati sono in UTF-8 e tu li hai dichiarati nella pagina, il tuo server potrebbe ancora servire la pagina con un' intestazione HTTP di accompagnamento che dice che è qualcos'altro.

Provatelo mettendo l'URL della vostra pagina in questo modulo. Vi porterà al controllo dell' Internationalization Checker. Cerca nella tabella la riga con il titolo HTTP Content-Type, sotto Character Encoding, e controlla che dica o UTF-8 o No encoding information found.

Se il Content-Type dell'HTTP mostra una codifica diversa da UTF-8, è necessario prendere delle misure per correggerla, perché la dichiarazione nell'intestazione HTTP sovrascriverà le informazioni all'interno della pagina.

I privilegi di amministratore del server sono necessari per modificare la codifica inviata nell'intestazione HTTP, anche se si può essere in grado di farlo da soli, anche se si servono file tramite un ISP. Consultare il proprio amministratore del server. Vedere la spiegazione di un modo per farlo per un server Apache.