Caratteristiche e differenza tra HTML e XHTML in informatica

Caratteristiche e differenza tra HTML e XHTML in informatica

HTML

L'”Hyper Text Markup Language” è un linguaggio che viene utilizzato per descrivere la struttura dei documenti ipertestuali utilizzati nel World Wide Web (WWW). La maggior parte dei i siti web attuali sono scritti in codice HTML.
L’HTML (tradotto in: linguaggio di marcatura per ipertesti) è un linguaggio di markup, cioè un linguaggio che descrive il contenuto testuale, e non, di una pagina web. Questo codice viene letto dal browser dell’utente che, lo elabora, e genera la pagina che verrà visualizzata sullo schermo.
Il termine “markup”, tradotto in marcatura, deriva dall’ambito tipografico dove si marcavano con annotazioni le parti di un testo da evidenziare o da correggere.
Un linguaggio di markup descrive i meccanismi di rappresentazione (della struttura e per la rappresentazione vera e propria) del testo utilizzando convenzioni standardizzate, che possono essere utilizzate su più supporti.

La caratteristica fondamentale dell’ HTML è che esso è stato concepito per definire il contenuto logico di un documento e non l’aspetto estetico finale; può succedere dunque che uno stesso documento venga visualizzato in modi diversi in due browser diversi (questo succedeva fino a qualche tempo fa anche con browser diffusi quali Internet Explorer e Mozilla Firefox), ma questo fatto ha garantito la massima diffusione di Internet.
Attualmente l’HTML si è evoluto: i documenti sono più ricchi sia dal punto di vista grafico che dal punto di vista dell’interazione con l’utente. Essi inoltre supportano le tecnologie di linguaggi quali Java, JavaScript o CSS, che ne potenziano le funzionalità.

I documenti HTML, riconoscibili dalle estensioni dei nomi in “.html” o “.htm”, sono memorizzati su computer costantemente collegati alla rete Internet. Uno specifico software detto “web server” invia, tramite le regole del protocollo HTTP, i documenti ai browser degli utenti che li hanno richiesti. Ricevuto il documento, il browser lo visualizzerà quindi sul monitor.

Un’evoluzione dell’HTML è data dalle “pagine dinamiche”, tramite le quali possono essere compiute operazioni più avanzate quali, ad esempio, la ricerca di un libro all’interno di una catalogo on-line di una biblioteca. In questi casi, il documento HTML viene generato da un codice eseguibile, residente sul server web, ed in grado di interagire con altre applicazioni residenti sul server stesso e che, alla fine, invia il risultato finale all’utente. Esempi di ciò sono documenti scritti in linguaggi quali PHP e ASP.

Nell’HTML, dal punto di vista sintattico, il componente principale è l'”elemento”, che è la struttura base che deve indicare al browser le informazioni su come vanno formattate le pagine web.
Ogni elemento è a sua volta racchiuso in marcature dette “tag”. Un tag è una sequenza di caratteri che è racchiusa tra due parentesi angolari: < e >. Il tag più importante è <a>, che descrive il collegamento ad un altro documento ipertestuale.
Una sezione di testo o di codice deve essere sempre racchiusa tra un “tag di apertura” e un “tag di chiusura”, pena una segnalazione d’errore di tipo sintattico.

Un documento HTML è strutturato in tre parti fondamentali: il “Document Type Definition” (o DTD), l'”Header” ed il “Body”.
Il DTD contiene le informazioni per il browser relative alla definizione del tipo di documento HTML. L’Header (sezione d’intestazione del documento) contiene tutte quelle informazioni, non visualizzate dal browser, utili per le applicazioni esterne che accedono alla pagine, quali motori di ricerca, collegamenti a file esterni alla pagina, titolo della pagina ed altre informazioni per lo stile da applicare alla pagina stessa.

Il Body (corpo del documento) contiene la parte che verrà visualizzata della pagina e tutte quelle indicazioni per l’aspetto grafico della pagina stessa, quali pulsanti, menù, ecc. Anche i tag si dividono in due tipi: quelli dell’header e quelli del body, con scopi diversi.
Si rammenta infine che le tutte le specifiche aggiornate ed ufficiali dell’HTML si trovano sul sito del W3C nelle pagine relative all’HTML.

Caratteristiche e differenza tra HTML e XHTML in informatica

XHTML

L'”eXtensible Hyper Text Markup Language”, abbreviato in XHTML, è un linguaggio di marcatura che associa alcune delle proprietà dell’XML con le caratteristiche dell’HTML. Un documento XHTML è un documento HTML scritto conformemente allo standard XML. L’XML, che verrà analizzato in dettaglio nei prossimi capitoli, è un linguaggio che permette di creare tag personalizzati, permettendo agli utenti di aggiungere una struttura ai loro documenti.

L’XHTML (tradotto in: linguaggio di marcatura di ipertesti estensibile) prevede delle restrizioni nell’uso dei tag del HTML: esso esige una sintassi più corretta relativamente alla parte logica della pagina e obbliga l’uso dei “Cascading Style Sheets”, abbreviati in CSS (fogli di stile a cascata), per la grafica.

Questa nuovo linguaggio, ufficializzato nel Gennaio 2000, è nato dall’esigenza di avere una sintassi definita meglio rispetto a quella dell’HTML 4.01: questo è dovuto al fatto che alcuni nuovi dispositivi non hanno tutte quelle risorse hardware e software in grado di interpretare correttamente le specifiche dell’HTML. Dal punto di vista tecnico, non è altro che una riformulazione dell’HTML 4 in XML 1.0.

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: www.vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *