Hardware e software > Programmazione e scripting

Web UTF8 oppure ANSI ?

(1/1)

paolo321:
Nelle pagine del mio sito c'è
<meta http-equiv="content-type" content="text/html; charset=utf-8" />

Usando Notepad++ mi sono accorto che mostra come encoding del file HTML, in basso a destra, ANSI

Mi confermate che non è corretto?
Se salvo la home page di google ad esempio, vedo una riga come sopra, ma Notepad++ indica charset ANSI as UTF8 (cioè quello che Notepad++ indica come UTF8 without BOM, che da quanto ho letto è il meglio per le pagine web...)

Secondo me sarebbe corretto fare da Notepad++ -> Convert to UTF8 without BOM , ma vorrei conferma da qualcuno ...

PS:
Lo so che tutto funziona comunque, per le accentate uso le entities in ogni caso; si tratta più che altro di capire il metodo corretto di fare le cose :-)

ciao

dkdk_it:
mmmm... bizzarro questo comportamento... ti faccio una domanda banale: tu, all'inizio della pagina, dichiari di utilizzare l'UTF-8... ma poi, nel corpo della pagina, scrivi in questa codifica o torni a scrivere in ANSI?!?
Credo che Notepad++ rilevi qualcosa scritto in una codifica diversa nel corpo della pagina e quindi decida di selezionare un'evidenziazione del testo tipica della codifica ANSI.

Ho supposto che sia così e tale rimane (supposizione)... non utilizzo quel software e quindi non posso confermare quando detto.
Bye.

paolo321:
Da quanto ho capito, convertire le mie pagine in UTF without BOM sarebbe inutile, visto che le FAQ di Notepad++ riportano che:

----
I set new document opened as UTF-8 without BOM.
However, after saving the file, I close it and reopen it, it's in ANSI mode. What's going wrong?

Notepad++ "guesses" the encoding mode of the loaded file by seeing if the unicode characters is present in the file. If not, then the ANSI mode will be set automatically.
----

Mi sembra di capire che se non c'è il BOM e non ci sono caratteri "strani", usi ANSI a priori, perchè di fatto non cambierebbe niente...
Per i file Unicode without BOM, visualizza ANSI as UTF8 quindi solo se realmente ci sono caratteri non ascii

Ho letto che qualcuno mette un commento con caratteri Unicode per essere sicuro che l'editor tratti i file di testo come Unicode.
Ma è necessario? a quale scopo?
Ho letto anche di evitare Notepad di windows perchè aggiunge il BOM che nelle pagine web è problematico...

Ma se faccio un file html che dichiara codifica utf8, e il cui contenuto sia realmente utf8 without BOM, posso evitare tutte le entities per le accentate e simili? Mi sembra che si debbano usare per forza solo per < > & e alcuni caratteri "speciali" ...

dkdk_it:

--- Citazione da: paolo321 - 05/08/2008, 19:54 ---Ho letto che qualcuno mette un commento con caratteri Unicode per essere sicuro che l'editor tratti i file di testo come Unicode.
Ma è necessario? a quale scopo?
--- Termina citazione ---

Rispondo un po' in ritardo, ma, come ho già detto in altre discussioni, le ferie son ferie!!!
Credo che sia necessario proprio alla luce di quanto affermavo nel post precendente: il parser del software quando fa la scansione del file indentifica il tipo di codifica proprio dal contenuto... ergo, se ci metti dei commenti tipici da UTF, dovrebbe riconoscerlo come tale (diciamo che è un modo per fregarlo un po'...).


--- Citazione ---Ho letto anche di evitare Notepad di windows perchè aggiunge il BOM che nelle pagine web è problematico...
--- Termina citazione ---

A prescindere da UTF o meno, Notepad di Windows è un editor obsoleto e con funzionalità molto poco evolute. Esistono, anche per Windows, soluzioni gratuite molto più performanti (uno su tutti PSPad, da me molto apprezzato quando lavoro su Windows... emulato ovviamente!  ;D).


--- Citazione ---Ma se faccio un file html che dichiara codifica utf8, e il cui contenuto sia realmente utf8 without BOM, posso evitare tutte le entities per le accentate e simili? Mi sembra che si debbano usare per forza solo per < > & e alcuni caratteri "speciali" ...
--- Termina citazione ---

Così su due piedi ti direi di si... ma ho bisogno di verificare...

paolo321:
Non uso Notepad di Windows, uso Notepad++ e basta...
PSPad è un po' troppo mastodontico :)
Nel frattempo ho forse capito qualcosa...

se Notepad++ carica un file utf8 senza bom come ansi as utf8 è perchè "non ce n'è bisogno" di utf8 ...
Quindi dovrebbe essere corretto dichiarare utf8 negli header ...
A quel punto le accentate dovrebbero essere a posto, e anche altri caratteri, alla fine sono poche le entities necessarie in utf8, < > & e simili, quelli ambigui nel codice eccetera...

Però, diciamo, se metto le entities al posto delle accentate, non sbaglio...
Il vantaggio sarebbe solo fare prima a scrivere codice, ma per poche pagine forse è più semplice usare le entities...

Inoltre, avevo letto qualcosa che le entities "testuali" sono solo html e quelle numeriche anche se è lo stesso carattere sono gestite diversamente, ma non ricordo...

Navigazione

[0] Indice dei post

Vai alla versione completa