Indice


Nota sulla formattazione dei listati ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ...
IV

Nota sulle specifiche di riferimento ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
IV

1   CENNI STORICI
1.1
Linguaggi di markup ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
1
1.2
Nascita di SGML ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ...
3
1.3
La pi∙ utilizzata applicazione SGML: HTML 


1.3.1  Origine di HTML ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.
4

1.3.2  Il successo di HTML ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
4
1.4
Sviluppo di XML a partire da SGML


1.4.1  Problemi nellТintroduzione di SGML nel Web ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
5

1.4.2  Il gruppo di lavoro nel consorzio W3 ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
5

1.4.3  La situazione attuale ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
6

1.4.4  Composizione del gruppo di lavoro XML ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
6
1.5
Conclusioni ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
7

2   LIMITI DI HTML
2.1
HTML non ш estensibile


2.1.1  Tag e attributi in HTML ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
8

2.1.2  Fogli di stile in HTML ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
8

2.1.3  Estensioni non ufficiali di HTML ЕЕЕЕЕЕЕЕЕЕЕЕЕ...ЕЕЕЕЕЕ.
9
2.2
HTML ш orientato solo alla descrizione dei documenti ЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
9
2.3
HTML non consente visualizzazioni diverse dei documenti ЕЕЕЕЕЕЕЕЕЕЕЕ
10
2.4
HTML non ha una struttura semantica ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.
11
2.5
Problemi nella conversione in HTML da altri formati ЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.
11
2.6
Problemi relativi ai link


2.6.1  HTML consente solo collegamenti semplici ...ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
12

2.6.2  I link scomparsi ...ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
13
2.7
HTML si sta evolvendo anche troppo rapidamente ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
14
2.8
Conclusioni ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ...
15

3   STRUTTURA E SINTASSI DI XML
3.1
Il processo di codifica XML ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ...ЕЕ..
16
3.2
La sintassi di XML 


3.2.1  Sintassi dei tag ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ...Е.
17

3.2.2  Obblighi sintattici imposti da XML ЕЕЕЕЕЕЕЕЕЕЕЕ...ЕЕЕЕЕ......
18
3.3
Documenti validi e ben formati ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
19
3.4
Prologo ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..ЕЕЕЕЕЕЕЕЕЕЕЕ
20

3.4.1  Dichiarazione XMLЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..ЕЕ...Е.
20

3.4.2  Dichiarazione di tipo di documento Е...ЕЕЕЕЕЕЕЕЕЕЕ...ЕЕЕ...Е...
21
3.5
Entitр predefinite ЕЕЕЕЕЕЕЕ..ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.
22
3.6
Riferimenti ai caratteri ЕЕЕЕЕЕЕЕЕЕЕЕ.ЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.
23
3.7
Istruzioni di elaborazione ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
23
3.8
Commenti ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
24
3.9
Conversione di un documento HTML in un documento XML ben formato ЕЕЕЕЕЕ
24


4   DOCUMENT TYPE DEFINITION (DTD)
4.1
Dichiarazione degli elementi ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
31

4.1.1  Esempi di dichiarazione degli elementi ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
32
4.2
Dichiarazione degli attributi ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.
33

4.2.1  Riferimenti incrociati ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
35
4.3
Entitр 


4.3.1  Entitр interne ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
36

4.3.2  Entitр esterne ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ...ЕЕЕЕЕЕЕЕЕЕЕ...
38

4.3.3  Entitр parametro Е.ЕЕЕЕЕЕЕЕЕЕЕЕ...ЕЕЕЕЕЕЕЕЕЕЕЕ.
39
4.4
Annotazioni ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ...
40
4.5
Creazione della DTD per un documento XML ben formato ЕЕЕЕЕЕЕЕЕЕЕЕ
40
4.6
Spazi dei nomi ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ...
42
4.7
UnТalternativa alla DTD: lo schema XML-Data 


4.7.1  Difetti della DTD ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
43

4.7.2  Uso dello schema ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
44

4.7.3  Dichiarazione degli elementi ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ...ЕЕЕЕЕ...
44

4.7.4  Dichiarazione degli attributi ЕЕЕЕЕЕЕЕЕЕЕЕЕ...ЕЕЕЕЕЕЕЕ
46
4.8
Conclusioni ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ...
46

5   EXTENSIBLE STYLESHEET LANGUAGE (XSL)
5.1
Associazione di tag HTML agli elementi XML ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ...
48
5.2
Visualizzazione di pi∙ elementi con lo stesso nome ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.
49
5.3
Visualizzazione dei valori degli attributi ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
50
5.4
Fogli di stile contenenti pi∙ modelli ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.
51
5.5
Visualizzazione dei nomi di elementi ed attributi. Carattere jolly ЕЕЕЕЕЕЕЕЕЕ
53
5.6
Costruzione di un foglio di stile ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
55
5.7
Isole di dati XML ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
57
5.8
Trasformazione di documenti XML attraverso XSL


5.8.1  Estrazione di un sottoalbero da un documento XML  ЕЕЕЕЕЕЕЕЕЕЕЕ.
59

5.8.2  Aggiunta di nuovi nodi ad un documento XML ЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
60
5.9
Conclusioni ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ...
61

6   GESTIONE DI UNA SEMPLICE BASE DI DATI CON XML
6.1
Spazio dei nomi datatypes ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.
62

6.1.1  Tipi di attributi negli schemi di XML-DataЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.
64
6.2
Rappresentazione in XML di una semplice base di dati


6.2.1  Definizione dello schema ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
64

6.2.2  Definizione dello schema tramite una DTD ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
66

6.2.3  Documento XML contenente i dati ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ...ЕЕЕ..
67

6.2.4  Foglio di stile per la visualizzazione dei dati ЕЕЕЕЕЕЕЕЕЕЕЕЕ...Е..
69
6.3
Pattern di XSL ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ...
71
6.4
Interrogazioni semplici con XSL 


6.4.1  Interrogazione 1 ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
73

6.4.2  Interrogazione 2 ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
73

6.4.3  Interrogazione 3 ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
74
6.5
Join di tabelle 


6.5.1  Interrogazione 4 ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
75

6.5.2  Interrogazione 5 (Join completo) ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
76
6.6
Interrogazioni di tipo matematico 


6.6.1  Interrogazione 6 ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
78

6.6.2  Interrogazione 7 ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
79

6.6.3  Interrogazione 8 ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
80
6.7
Ordinamenti ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.Е.
81

6.7.1  Interrogazione 9 ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
81

6.7.2  Interrogazione 10 ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
82
6.8
Costrutti condizionali di XSL ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ...
84

6.8.1  Utilizzo dell'elemento xsl:if ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.Е
84

6.8.2  Utilizzo dell'elemento xsl:choose ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
85
6.9
Conclusioni ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ...
87

7   XLINK, XPOINTER E MATHML
7.1
XLink ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
90
7.2
Collegamenti semplici ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ
90
7.3
Collegamenti estesi 


7.3.1  Sintassi ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
93

7.3.2  Introduzione degli archi nei collegamenti estesi ЕЕЕЕЕЕЕЕЕЕЕЕЕ..
94
7.4
Gruppi di collegamenti estesi ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.
95
7.5
Cenni sul linguaggio XPointer


7.5.1  Compatibilitр con XPath ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
97

7.5.2  Selezione di un gruppo di elementi  ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
98

7.5.3  Selezione di stringhe ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.
98
7.6
Prime applicazioni di XML


7.6.1  Vocabolari XML ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ...
99

7.6.2  Cenni sul linguaggio MathML ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
100


Appendice A: Guida rapida ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ.
103




Appendice B: Riferimenti bibliografici ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ..
108


Nota sulla formattazione dei listati

Tutti i listati di questa tesina sono scritti con il carattere УCourier NewФ. Per migliorare la loro 
leggibilitр, ho pensato di utilizzare diversi formati di questo carattere, allo scopo di distinguere le 
parti con significati diversi allТinterno di ciascun listato. Ho seguito questo criterio:

? Grassetto: markup imposto dai linguaggi, compresi simboli e segni di punteggiatura. Parole 
chiave degli script.
? Grassetto corsivo: markup definito dall'utente. Funzioni definite dallТutente negli script.
? Normale: testo contenuto nel documento e costanti degli script.
? Corsivo: valori degli attributi, esclusi quelli imposti dai linguaggi. Variabili degli script.

Nota sulle specifiche di riferimento

XML ш uno standard approvato dal W3C. Al contrario, i linguaggi ad esso collegati sono ancora in 
fase di sviluppo: infatti  il W3C pubblica continuamente nuove bozze di lavoro, talvolta molto di-
verse dalle loro versioni precedenti. Per questo motivo vorrei precisare che la stesura di questa te-
sina ш stata completata il 30 settembre 1999 e quindi si basa sulle specifiche riportate in questa ta-
bella:

Linguaggio
Versione
Tipo di specifica
Data
Riferimento bibliografico
XML
1.0
Raccomandazione
10/2/1998
[6]
XSLT
1.0
Bozza di lavoro
13/8/1999
[26]
XPath
1.0
Bozza di lavoro
13/8/1999
[38]
XLink

Bozza di lavoro
26/7/1999
[39]
XPointer

Bozza di lavoro
9/7/1999
[43]
MathML
1.01
Raccomandazione
7/7/1999
[45]


1  CENNI STORICI

1.1	Linguaggi di markup

I documenti elettronici, compreso il file di questa tesina, contengono dei codici di formattazione, 
ossia dei caratteri o delle stringhe speciali, generati dal programma di scrittura, che indicano i modi 
di visualizzazione e di stampa del testo. Tali codici sono diversi a seconda del programma che ha 
generato il file, e rendono il documento inutilizzabile, se non si dispone di un programma compati-
bile con quello che ha prodotto il file. Queste incompatibilitр sono un problema attuale, basti pensa-
re:

? alla miriade di formati esistenti (HTML, RTF, LaTe?, documenti di Word, file di Acrobat, 
ecc.);
? alle incompatibilitр fra versioni diverse dello stesso programma (chiunque ha Office Т95 puЄ 
avere problemi ad utilizzare un documento scritto con Office Т97, se per questТultimo non ш stata 
seguita unТopportuna procedura di salvataggio).

In generale, i formati di memorizzazione dei documenti elettronici si possono dividere in due cate-
gorie [19]:

1) Formati chiusi o proprietari, ideati da una software house per i propri programmi e non resi 
pubblici. Ad esempio, Microsoft Word aggiunge al testo dei codici di formattazione secondo re-
gole che la Microsoft tiene riservate. I file del Word vengono salvati in formato binario, dunque 
non possono essere visualizzati ed elaborati da programmi di aziende diverse dalla Microsoft. In 
realtр esistono numerosi visualizzatori e filtri di conversione freeware o prodotti da altre azien-
de, ma non sempre danno risultati soddisfacenti.
2) Formati aperti, le cui specifiche sono di pubblico dominio. Qualsiasi software house puЄ pro-
durre programmi di elaborazione per tali formati; inoltre, un utente che ne conosca le regole puЄ 
scrivere documenti in questi formati con un semplice editor di testi, senza bisogno di un pro-
gramma specifico.

Tralasciamo i formati chiusi e tra i formati aperti soffermiamoci in particolare sui linguaggi di 
markup. 
Un linguaggio di markup ha la caratteristica di avere i codici di formattazione costituiti da marca-
tori o tag, che sono stringhe di caratteri aggiunte al testo, per darne unТinterpretazione semantica. 
AllТinterno dei tag possono comparire ulteriori informazioni, che vengono associate al testo tramite 
gli attributi, ciascuno dei quali ha un valore. Il testo con lТaggiunta dei marcatori si definisce codi-
ce del documento.
Per avere unТidea delle enormi differenze fra i vari linguaggi di markup, consideriamo un breve do-
cumento con qualche elemento di formattazione:

A: Alessandro
Da: Luca 
CC: Ezio
Titolo: Prova

Questo ш un esempio di e-mail, che serve a mostrare le differenze fra i linguaggi di markup.

Vediamo il codice corrispondente a questo documento nei tre pi∙ usati linguaggi di markup:

1) Rich Text Format (RTF), linguaggio per la descrizione di testi formattati supportato da tutti i 
word processor:

{\rtf1\ansi\deff0\deftab720{\fonttbl{\f0\fswiss MS Sans Serif;} 
{\f1\froman\fcharset2 Symbol;}
{\f2\froman\fprq2 Times New Roman;} 
{\f3\froman Times New Roman;}}
{\colortbl\red0\green0\blue0;}
\deflang1040\pard\plain\f2\fs24\b A: \plain\f2\fs24 Alessandro
\par \plain\f2\fs24\b Da: \plain\f2\fs24 Luca 
\par \plain\f2\fs24\b CC: \plain\f2\fs24 Ezio
\par \plain\f2\fs24\b Titolo: \plain\f2\fs24\i 
Prova\plain\f2\fs24\b 
\par 
\par \plain\f2\fs24 Questo \'e8 un esempio di e-mail, che serve 
a mostrare le differenze fra i linguaggi di markup.
\par \pard\plain\f3\fs20 
\par }

La sintassi ш pesante e rende il documento poco leggibile: il markup supera abbondantemente il 
testo, anche in un documento cosь semplice. I tag sono molto lunghi e si notano frequenti ripeti-
zioni delle stesse informazioni, come il tipo di font (f2) o il formato del carattere (fs24). Que-
sto perchщ viene specificata completamente la formattazione di tutte le stringhe di testo. 

2) LaTe?, linguaggio utilizzato nellТambiente scientifico per scrivere libri e articoli:

\documentclass[12pt]{article}
\begin{document}
\textbf{A: }Alessandro		\\
\textbf{Da: }Luca		\\
\textbf{CC: }Ezio		\\
\textbf{Titolo: }\textit{Prova}	\\	\\
Questo \`e un esempio di e-mail, che serve a mostrare le 
differenze fra i linguaggi di markup.
\end{document}

Il documento ш decisamente pi∙ leggibile rispetto allТequivalente RTF. I tag sono brevi ed inse-
riti solo dove servono. Il testo normale ш privo di tag e questi ultimi vengono inseriti solo in cor-
rispondenza di cambiamenti nella formattazione.

3) HyperText Markup Language (HTML), linguaggio con cui sono scritte le pagine Web:

<HTML>
<HEAD>
<TITLE>Prova</TITLE>
</HEAD>
<BODY>
<P><B>A: </B>Alessandro</P>
<P><B>Da: </B>Luca </P>
<P><B>CC: </B>Ezio</P>
<P><B>Titolo: </B><I>Prova</I></P>
<P>Questo &egrave; un esempio di e-mail, che serve a 
mostrare le differenze fra i linguaggi di markup.</P>
</BODY>
</HTML>

La distribuzione dei tag ш analoga a quella di LaTe?. I tag sono racchiusi fra parentesi angolari, 
favorendo la distinzione immediata fra testo e markup e rendendo ancora pi∙ semplice la lettura 
del codice. Inoltre i nomi dei tag sono molto semplici da interpretare: ш pi∙ facile associare <B> 
a bold (grassetto), piuttosto che textbf. La sintassi dei tag di HTML ш presentata nel з 2.1.1.

Le differenze sono molto evidenti e, ovviamente, si ripercuotono in difficoltр di conversione tra un 
formato e lТaltro.

1.2	Nascita di SGML

Il problema dellТincompatibilitр tra formati era giр sentito negli anni Т60 ed ha portato alla defini-
zione di SGML (Standard Generalized Markup Language) ad opera di Charles Goldfarb. Da 
SGML sono stati inoltre sviluppati sia HTML, sia XML, linguaggio, questТultimo, che dovrebbe di-
ventare il formato universale di scambio di dati su Web, affiancandosi allТHTML e superandone i 
limiti [2].
Nella tabella che segue, riassumiamo lТevoluzione di SGML e delle sue prime applicazioni [4]:

Fine anni С60
Progetto УGenCodeФ. Lo scopo era quello di diffondere lТutilizzo 
di codici di formattazione descrittivi, al posto di caratteri poco 
comprensibili.
1969
Charles Goldfarb, Edward Mosher e Raymond Lorie svilupparono 
per conto della IBM il GML (Generalized Markup Language), il 
primo linguaggio adatto a documenti di qualsiasi tipo.
1974
Goldfarb ideЄ il concetto di analizzatore di validitр, strumento in 
grado di verificare la correttezza del markup.
1980
Prima bozza di lavoro su SGML.
1984
LТInternational Organization for Standardization (ISO) autorizzЄ 
la produzione dello standard SGML.
1985
Nacque il primo gruppo internazionale di utenti SGML. SGML 
venne adoperato dalla Comunitр Europea per le comunicazioni 
ufficiali.
1986
SGML divenne uno standard internazionale (ISO 8879)
1987
LТassociazione degli editori americani (AAP) sviluppЄ 
unТapplicazione SGML per la pubblicazione di articoli, giornali e 
libri.
1988
Il dipartimento della difesa degli Stati Uniti sviluppЄ lo standard 
militare CALS (Computer-aided Acquisition and Life-cycle Sup-
port), basato su SGML.


1.3	La pi∙ utilizzata applicazione SGML: HTML

1.3.1 Origine di HTML

Nel 1989, un ricercatore del CERN di Ginevra, Tim Barners Lee, presentЄ ai dirigenti del laborato-
rio una relazione intitolata УInformation Management: a proposalФ [7]. Lo scopo di Barners Lee era 
di sviluppare un sistema di pubblicazione e reperimento dell'informazione distribuito su una rete 
geografica, in grado di tenere in contatto la comunitр mondiale dei fisici.
Un collega di Barners Lee, Anders Berglund, uno dei primi sostenitori di SGML, gli consigliЄ di 
utilizzare una sintassi simile a quella di SGML [1]. Essi partirono da una  semplice definizione di 
tipo di documento (DTD) SGML, contenuta in un manuale IBM scritto nel 1978 da Goldfarb. 
Nacque cosь l'HyperText Markup Language (HTML), sul quale Barners Lee costruь il proprio si-
stema ipertestuale, che chiamЄ World Wide Web (WWW).

Tim Barners Lee, attuale direttore del W3 Consortium

La DTD ш di fondamentale importanza sia per SGML, che per XML, in quanto fornisce la descri-
zione formale della struttura di un documento. Il concetto di DTD sarр trattato esplicitamente nel 
capitolo 4. 
Si noti che la DTD di HTML fu definita formalmente solo tra il 1992 e il 1993 da Dan Connolly, 
con il nome di УHTML 1.0Ф. Quando arrivЄ questa prima DTD, esistevano giр nel Web migliaia di 
pagine contenenti codice HTML non conforme ad essa.

1.3.2 Il successo di HTML

In confronto allo sviluppo di SGML, che aveva richiesto quasi vent'anni, la realizzazione di HTML 
richiese pochissimo tempo, grazie alla sua semplicitр. E fu sicuramente tale semplicitр la causa fon-
damentale dello strepitoso successo di HTML e, con esso, del Web, divenuto in pochi anni il siste-
ma informativo pi∙ completo, sebbene caotico, che sia mai esistito.
In questa tabella sono riassunti le principali tappe dell'evoluzione di HTML [9]:

1989
╚ proposto il progetto WWW al CERN di Ginevra
Ottobre 1991
Viene creata la mailing list www-talk@info.cern.ch, per rac-
cogliere suggerimenti utili allo sviluppo di HTML
Marzo 1992
Inizia lo sviluppo di HTML 1.0
1993
Versione finale di HTML 1.0. Si inizia a lavorare immediata-
mente alla versione 2.0
Inizio 1993 
Viene rilasciato il primo browser: NCSA Mosaic. ╚ l'evento 
che segna il decollo del Web
Settembre 1995
HTML 2.0
Novembre 1995
Viene implementato l'invio di file utilizzando i form
Marzo 1996
Bozza di HTML 3.0
Maggio 1996
Viene introdotta la gestione di tabelle in HTML
Gennaio 1997
HTML 3.2. Internazionalizzazione di HTML
Dicembre 1997
HTML 4.0
Agosto 1999
XHTML 1.0 (vedi з3.9) ed HTML 4.01

Lo sviluppo di HTML ш stato portato avanti dal 1994 dall'IETF working group (IETF ш l'acronimo 
di Internet Engineering Task Force), che si ш poi rivelato insufficiente per la mole di lavoro necessa-
ria, ed ш stato assorbito alla fine del 1996 dal W3 Consortium [8].

1.4	Sviluppo di XML a partire da SGML

1.4.1 Problemi nell'introduzione di SGML nel Web

Grazie allТesplosione in tutto il mondo della popolaritр del Web, molti utilizzatori di HTML si sono 
resi conto dei numerosi limiti di cui soffre:

? non estensibilitр, 
? impossibilitр di fornire visualizzazioni differenziate,
? mancanza di una struttura semantica,
? presenza dei soli collegamenti unidirezionali;

limiti che verranno discussi in dettaglio nel prossimo capitolo. Con il passare degli anni (e delle 
versioni di HTML), gli esperti di SGML pensarono di poter utilizzare il loro linguaggio per la pub-
blicazione di documenti su Web [10]. Infatti HTML ш una semplice applicazione di SGML.
Ma gli stessi esperti, in seguito, stabilirono che introdurre direttamente SGML su Web avrebbe 
comportato dei notevoli problemi [11]:

? LТuso generico di SGML avrebbe richiesto una vera e propria ristrutturazione dell'attuale archi-
tettura del World Wide Web;
? LТimplementazione di un browser SGML per tutte le possibili applicazioni sarebbe stata note-
volmente complicata dal punto di vista computazionale rispetto ad un browser HTML. Pur ri-
solvendo i problemi tecnici, la complessitр di un programma simile, e del linguaggio SGML 
stesso, avrebbero limitato notevolmente l'efficienza del trasferimento di informazioni attraverso 
Internet.
? LТapprendimento di SGML ш decisamente pi∙ ostico rispetto a quello di HTML. Questo ш un 
grosso ostacolo per gli sviluppatori di pagine Web in HTML.

I pi∙ noti browser SGML sono Panorama SGML e MultidocPro, sviluppati rispettivamente dalle 
software house Interleaf e Citec.

1.4.2 Il gruppo di lavoro nel Consorzio W3

Nell'estate del 1996, Jon Bosak, attualmente a capo del settore informativo della Sun Microsystem, 
convinse il W3C a formare un gruppo di lavoro sull'uso di SGML sul Web [10]. Egli fu il presi-
dente di questo comitato, chiamato inizialmente УSGML Editorial Review BoardФ e scelse perso-
nalmente i migliori specialisti di SGML.
Nell'agosto del 1996 si svolse una conferenza sull'implementazione di SGML nel Web [12]. I risul-
tati della discussione furono due:

1) la necessitр di introdurre SGML sul Web, dato che per alcune applicazioni HTML si rivelava 
ormai inadeguato e che SGML sarebbe stato in grado di portare delle informazioni strutturate 
sul Web;
2) una radicale revisione di SGML per avvicinarlo ad un pubblico pi∙ vasto. Gli esperti stabilirono 
una lista di elementi non essenziali di SGML, che andavano modificati o eliminati completa-
mente.

Giр nel novembre del 1996, il gruppo di lavoro del W3C creЄ una forma semplificata di SGML, 
comprendente le caratteristiche giр ampiamente sperimentate di SGML con una complessitр ridotta 
[10]. Questo linguaggio fu chiamato XML (eXtensible Markup Language), proprio per enfatizza-
re la principale differenza con HTML, che ш un linguaggio di markup con dei tag definiti e non mo-
dificabili.

1.4.3 La situazione attuale

La nascita УufficialeФ di XML risale al marzo del 1997, quando Jon Bosak pubblicЄ il suo 
УmanifestoФ: un articolo intitolato УXML, Java e il futuro del WebФ [15]. Il gruppo di lavoro da lui 
diretto stabilь che la composizione delle specifiche di XML si sarebbe svolta in tre fasi:

1) definizione della sintassi di XML;
2) definizione della semantica dei collegamenti ipertestuali, tramite l'implementazione di un appo-
sito linguaggio, chiamato XLL (eXtensible Linking Language);
3) definizione della presentazione di XML, anch'essa affidata ad un apposito linguaggio: XSL (eX-
tensible Stylesheet Language).

Si noti che XLL ed XSL furono concepiti come dei particolari linguaggi derivati da XML, con le 
proprie DTD. La situazione dello sviluppo di questi linguaggi ш la seguente:

1) Lo standard XML 1.0 ш stato approvato dal W3C il 18 febbraio 1998 [12].
2) Il linguaggio XLL ш stato diviso in 2 parti, chiamate XLink ed XPointer. Le ultime bozze di la-
voro rilasciate risalgono al 26 luglio 1999 per XLink [39] e al 9 luglio 1999 per XPointer [43].
3) Il W3C ha rilasciato la terza bozza di lavoro di XSL il 21 aprile 1999 [13]. Da XSL sono nati 
altri due linguaggi, chiamati XSLT ed XPath. Per entrambi le ultime bozze di lavoro risalgono 
al 13 agosto 1999.

Per quanto riguarda XSL, la standardizzazione si puЄ ritenere abbastanza vicina, basti pensare che 
XSL, insieme ad XML, ш parzialmente supportato da Explorer 5, il nuovo browser della Microsoft 
rilasciato nel marzo 1999. Viceversa, la situazione sui collegamenti ш in costante mutamento e si 
puЄ affermare che il modo esatto in cui i collegamenti dovrebbero essere implementati nell'XML ш 
ancora in fase di discussione [5]. 

1.4.4 Composizione del gruppo di lavoro XML

Per quanto si ш visto finora, sembra che lo sviluppo di XML riguardi esclusivamente il W3C. Vice-
versa, il gruppo di lavoro per la standardizzazione di XML ш formato dai rappresentanti di numerose 
importanti organizzazioni, ciascuna delle quali ha un forte interesse nel produrre ed utilizzare stru-
menti basati su XML [6]. Le pi∙ famose tra esse sono:

1) Adobe, 
2) Fuji Xerox, 
3) Hewlett-Packard,
4) Microsoft,
5) NCSA, 
6) Netscape, 
7) SoftQuad, 
8) Sun Microsystems,
9) Universitр dellТIllinois,
10) W3C.
 
1.5	Conclusioni

Al termine di questa introduzione storica su XML ш essenziale ribadire la distinzione fra SGML, 
HTML ed XML [10]:

? SGML ш un linguaggio per la descrizione di documenti di qualsiasi tipo;
? HTML ш una particolare applicazione di SGML per la presentazione di documenti attraverso 
Уpagine WebФ;
? XML ш un linguaggio per la descrizione dei documenti su Web, ottenuto semplificando SGML.


2  LIMITI DI HTML

2.1	HTML non ш estensibile

2.1.1 Tag e attributi in HTML

HTML non permette agli utenti di specificare dei propri tag o attributi nei documenti, allo scopo di 
personalizzarli o di introdurvi una propria semantica [15].
Per capire che cosa siano precisamente tag ed attributi in HTML, mostriamo un semplicissimo 
esempio:

<h1 align=center>Titolo Principale</h1>

il cui risultato ш:

Titolo Principale

Il tag nel nostro caso ш <h1>, che significa intestazione (header) di tipo 1, cioш di massima impor-
tanza. L'attributo ш align, con valore center ed indica al browser che il testo etichettato dal 
tag va allineato centralmente. Il testo associato al tag ш semplicemente la stringa "Titolo Prin-
cipale" contenuta tra il tag di apertura <h1> e il tag di chiusura </h1>. 
Se avessimo bisogno di un titolo con un carattere ancora pi∙ grande? Il tag <h0> non ш previsto e 
noi non abbiamo la possiblitр di definirlo. Naturalmente ш possibile ottenere caratteri pi∙ grandi di 
quelli appena visti, ma bisogna utilizzare degli altri tag previsti dal linguaggio HTML, oppure dei 
fogli di stile, introdotti da HTML 4.0, che ci consentono di ridefinire la visualizzazione (ma solo 
quella) associata ai tag.

2.1.2 Fogli di stile in HTML

HTML 4.0 supporta il linguaggio CSS (Cascading Style Sheet) per i fogli di stile [5]. Questo lin-
guaggio consente di definire la visualizzazione del contenuto dei vari tag di HTML senza utilizzare 
nuovi tag o attributi, ma associando delle norme di stile a ciascun tag. I fogli di stile possono essere 
sia contenuti allТinterno del tag <STYLE> del documento HTML, che posti in file esterni.
Vediamo come si riesce a modificare la visualizzazione del tag <h1> per mezzo di alcune semplici 
norme di stile:

<h1 align=center>Titolo Principale</h1>
<STYLE>
H1 {background:yellow; color: red; font-family: Arial; font-size: 
20pt;}
</STYLE>

Il risultato che si ottiene ш ben diverso da quanto visto nel paragrafo precedente:

Titolo Principale

2.1.3 Estensioni non ufficiali di HTML

HTML ш un linguaggio chiuso e non modificabile. L'autore di un documento puЄ soltanto scegliere 
tra un insieme prefissato di elementi, anche se la struttura del suo documento richiederebbe di espli-
citarne altri, o di qualificarli in modo diverso [11].
Il W3C ш l'unico ente che ш in grado di aggiungere nuovi elementi ad HTML e, come abbiamo visto 
nel з 1.2.3, lo ha fatto diverse volte, portando HTML alla versione 4.01. In realtр, negli anni prece-
denti erano stati i produttori dei browser, Microsoft e Netscape, a sostituirsi al W3C, aggiungendo 
arbitrariamente vari elementi ad HTML e creando le cosiddette Уestensioni non ufficialiФ di HTML, 
che hanno messo in serio pericolo la standardizzazione dei documenti Web [7]. Queste estensioni 
non standardizzate del linguaggio hanno causato seri problemi come:

? documenti che per essere letti necessitavano di Explorer o di Netscape e che, nel caso fossero 
stati visualizzati in modo alternativo, risultavano diversi o addirittura illegibili; 
? siti ottimizzati per alcune versioni di browser e non per altre;
? documenti che non erano accessibili con versioni precedenti dei browser.

Il W3C ha cercato di porre rimedio a questa situazione inserendo i fogli di stile, una tecnica intro-
dotta proprio da SGML e utilizzata, ovviamente, anche in XML [1].
Infine la struttura rigida e non estensibile di HTML si rivela un problema per le grandi industrie, 
che sono state costrette a:

1) creare standard differenti per ogni applicazione diversa;
2) utilizzare dei software particolari per elaborare i dati e trasferirli sul Web [17].

2.2	HTML ш orientato solo alla descrizione dei documenti

HTML fu creato come un linguaggio di descrizione del documento, che consentisse agli utenti di 
condividere le informazioni su sistemi differenti [5]. Il presupposto di HTML era che quelle infor-
mazioni fossero testo con in pi∙ alcune immagini e collegamenti ipertestuali. Attualmente, invece, 
nel Web si trova di tutto:

? database,
? suoni,
? filmati,
? programmi interattivi

ed altro ancora. Un linguaggio nato sostanzialmente per la pubblicazione di documenti semplici si 
trovava a dover assicurare potenzialitр impensabili al momento della sua nascita e cosь, non poten-
do, lasciava il campo allo sviluppo di tecnologie parallele che potessero assicurare la sua sopravvi-
venza e il supporto per i nuovi contenuti del Web [7]. 
Tra nuovi linguaggi tipo Javascript e plug-in tipo Shockwave o Acrobat reader, in pratica HTML ш 
diventato pian piano un assemblatore di tecnologie piuttosto che un linguaggio vero e proprio e 
questo ha comportato anche problemi di portabilitр delle applicazioni Web, poichщ tutte queste nuo-
ve tecnologie non sono standard, bensь soluzioni proprietarie pi∙ o meno diffuse che necessitano per 
essere utilizzate di software  specifici o di particolari versioni di esso. Tutto ciЄ ш lontanissimo dalla 
filosofia iniziale ma anche dalla tendenza, tipica dell'informatica distribuita che in questo periodo si 
sta affermando, a costruire ambienti standard in grado di permettere lo sviluppo di applicazioni 
portabili a prescindere dallТhardware o dal sistema operativo.
HTML non ш mai stato progettato per il controllo della formattazione e quindi manca dei meccani-
smi adatti: esso dovrebbe semplicemente fornire una descrizione del documento, dando cosь solo 
delle indicazioni generiche sulla formattazione, che resterebbe compito del browser, o del pro-
gramma che deve visualizzare il file [5]. I tag aggiunti nel corso degli anni, specialmente quelli 
delle estensioni non ufficiali, erano dei veri e propri tag di formattazione. Ad esempio, nellТHTML 
originale esiste il tag <STRONG>, che significa Уmolto evidenziatoФ [16]. Il testo in esso racchiuso 
viene in genere visualizzato in neretto, ma ш un tag che dр indicazioni sullТimportanza del suo con-
tenuto, senza entrare esplicitamente nel merito della formattazione. Successivamente ш stato intro-
dotto il tag <B> (Bold = Neretto), il cui significato ш evidentemente limitato rispetto al precedente. 
Alcuni di questi hanno avuto origine come tag proprietari di uno dei due principali produttori di 
browser (Microsoft e Netscape) e la loro diffusione nelle pagine Web ш stata tale da УcostringereФ il 
consorzio W3 ad approvarli nelle successive versioni di HTML.
Il W3C  si rese conto che lТintroduzione di una moltitudine di nuovi tag che rispondessero ad ogni 
possibile esigenza di formattazione era irreale e incoerente con i principi di HTML. Il primo vero 
strumento di formattazione per HTML ш stato introdotto solo con la versione 4.0 ed ш costituito dai 
fogli di stile, per i quali sono stati definiti due linguaggi specifici: CSS1 e CSS2. I fogli di stile sono 
separati dal codice HTML, cosь come gli script, e riescono ad ottenere la distinzione tra forma e 
struttura del documento. I linguaggi CSS1 e CSS2 sono molto semplici e sono adattabili anche 
allТXML, ma sono molto meno potenti di XSL, ideato appositamente per XML.
In conclusione, bisogna notare che finora i browser Web sono stati le principali piattaforme di svi-
luppo per il linguaggio Java. Per unТinterazione migliore con Java, sarebbe opportuno un linguaggio 
pi∙ sofisticato e pi∙ orientato al trattamento dei dati di HTML, limitato alla descrizione dei testi 
[12].

2.3	HTML non consente visualizzazioni diverse dei documenti

╚ difficile scrivere del codice HTML che mostri gli stessi dati in modi differenti, a seconda delle 
esigenze dellТutente [10]. ╚ ancora pi∙ difficile realizzare delle viste personalizzate di dati diversi 
dal testo, come ad esempio i risultati dellТinterrogazione di una base di dati. Non ш un caso che per 
la creazione di siti dinamici e in grado di interagire con dati, come per esempio un catalogo che 
permette ordinazioni, sia necessario l'uso di tecnologie esterne alle specifiche HTML, come le CGI,  
Javascript o addirittura Java [7].
Una possibile soluzione di questi problemi ш nellТHTML dinamico (DHTML). DHTML non ш un 
linguaggio di markup come HTML, ma semplicemente un insieme di regole che permettono di usa-
re i fogli di stile e un linguaggio di script al fine di modificare l'aspetto ed il contenuto di una pagina 
Web al verificarsi di un dato evento (ad esempio il click o lo spostamento del mouse, o il trascorrere 
di un periodo di tempo) [11]. DHTML, perЄ, ha dei notevoli difetti:

? richiede degli script lunghi e complicati;
? ш un sistema orientato alla creazione di effetti visivi, piuttosto che alla formattazione dei dati.

LТavvento di XML dovrebbe superare definitivamente questa ennesima estensione di HTML. Del 
resto ш giр possibile associare ad un solo documento HTML diversi fogli di stile, per adattare un 
unico contenuto a diversi tipi di presentazione, come quelle ottenute con:

? i normali browser grafici,
? i vecchi browser testuali,
? gli schermi televisivi, per i quali sono richiesti caratteri pi∙ visibili,
? i sistemi braille per non vedenti,
? i sistemi vocali per non udenti,
? ecc.

╚ bene ricordare che la tecnologia dei fogli di stile viene da SGML ed ш implementata anche in 
XML.

2.4	HTML non ha una struttura semantica

La maggior parte delle applicazioni Web trarrebbe beneficio dalla possibilitр di catalogare i dati in 
base al loro significato, piuttosto che in modo descrittivo, come fa HTML [10]. Ad esempio, noi 
sappiamo che:

<h2>Apple</h2>

si presenterр in un certo modo in un browser, ma non sappiamo se Apple sia un frutto, lТazienda 
produttrice di computer, un cognome o qualcosТaltro [12]. 
Una possibilitр per specificare la semantica di un documento ш data dal tag <META>, il quale [10]:

? ш utilizzabile solo nellТintestazione del documento, quindi non si puЄ associare a particolari dati 
significativi contenuti in esso;
? ш uno dei tag meno usati di HTML.

In questo modo, si perdono molte delle potenzialitр dei motori di ricerca, costretti ad esaminare 
tutto il testo a paritр di importanza, proprio nel momento in cui la mole dei documenti in rete di-
venta tale da richiedere un meccanismo pi∙ puntuale [7]. Purtroppo perЄ lТassenza di tag semantici 
non permette questa possibilitр e obbliga a ricerche che spesso restituiscono migliaia di documenti 
senza dire nulla del significato del termine invocato.
HTML non ha alcun modo di specificare che cosa significhi una certa stringa o un certo dato nella 
pagina Web [10]. Non solo: HTML non ha alcuno strumento di analisi di validitр di un documento, 
cosa di fondamentale importanza per importare ed utilizzare un documento in altre applicazioni. 
QuestТesigenza, imprevedibile alla  creazione del Web, ш diventata di estrema necessitр a causa  
delle nuove applicazioni che si servono di Internet, come ad esempio il commercio elettronico [15]. 
Viceversa XML:

1) associa a tutti gli elementi un significato esplicito;
2) consente un controllo formale del documento, attraverso il confronto con la sua DTD;
3) permette di ottenere molteplici visualizzazioni delle informazioni grazie allТXSL.

2.5	Problemi nella conversione in HTML da altri formati

Molte organizzazioni pubblicano le stesse informazioni in diversi formati [14]. Accade di frequente, 
infatti, che esistano almeno due versioni di uno stesso documento:

1) per la stampa e la lettura su carta;
2) per la presentazione su Web;

basti pensare ai numerosi giornali che offrono una loro versione elettronica su Web. Solitamente la 
versione originale dei documenti viene scritta con un software specifico, ad esempio un word pro-
cessor, e la traduzione in HTML viene effettuata automaticamente da opportuni programmi [10]. 
Purtoppo queste conversioni non sono sempre perfette e richiedono delle correzioni da effettuare 
manualmente, come ш noto a chi ha provato l'opzione Уsalva come HTMLФ di Word. CiЄ significa 
che al cambiare del documento originario bisogna ripetere tali aggiustamenti, con conseguente di-
spendio di energia e di tempo [14]. DТaltra parte queste aziende non hanno alcun interesse a produr-
re documenti direttamente in HTML, poichщ la pubblicazione su Web non ш la loro attivitр princi-
pale.
La causa di questi problemi ш nella scarsa flessibilitр di HTML, che offre molti meno strumenti ri-
spetto ai moderni word processor e ai programmi professionali per lТeditoria, come Adobe Acrobat. 
Alcuni siti evitano il problema a priori lasciando sul Web i documenti in formato Acrobat e costrin-
gendo gli utenti ad avere l'apposito lettore. 
XML ш la soluzione ideale per questi problemi. Esistono delle potenti applicazioni per l'editoria 
elettronica basate su SGML che possono essere utilizzate senza difficoltр per XML, tra le quali ci-
tiamo FrameMaker, realizzato proprio dalla Adobe, lТazienda produttrice di Acrobat [1].

2.6	Problemi relativi ai link

2.6.1 HTML consente solo collegamenti semplici

HTML, attraverso il tag <A> (ancora), assicura la possibilitр di saltare da un punto ad un altro del 
documento o dellТintero Web [7]. Questo elemento, perЄ, utilizza solo la pi∙ semplice delle diverse 
tipologie di link: il link unidirezionale. Vediamo un esempio di link HTML:

<a href=Фhttp://www.w3.org/Ф>Consorzio WWW</a>

Questo collegamento ш unidirezionale, poichщ sono definiti:

? lТorigine, che ш semplicemente il testo contenuto tra i tag di apertura e chiusura;
? la destinazione, che ш il valore dellТattributo href.

Non ш possibile con il solo HTML percorrere a ritroso questo link, anche se ш semplicissimo farlo 
utilizzando il tasto УindietroФ del browser, oppure usando la funzione Javascript histo-
ry.back() [18].
Sin dagli anni settanta, invece, ш stata sviluppata una complessa tipologia di collegamenti iperte-
stuali, che corrispondono a diverse relazioni semantiche [11]:

? link bidirezionali;
? link con destinazioni e origini multiple (uno a molti e molti a uno);
? link che puntano su sezioni strutturali di un documento di destinazione;
? link in grado di incorporare la destinazione nel documento sorgente;
? link definiti in un documento esterno a quello di partenza;
? link a scelta multipla

ed altro ancora. Alcune di queste possibilitр sono giр state realizzate grazie allТapporto di Java. Di 
per sщ, HTML consente solo di aprire la risorsa destinazione di un collegamento allТinterno del do-
cumento di origine con la tecnica dei frame, che presenta vari problemi [5]:

? le pagine con diversi frame sono incomprensibili a bassa risoluzione;
? se la connessione a Internet ш lenta, la pagina con i frame richiede un lungo tempo di carica-
mento;
? talvolta, per degli errori nella trasmissione dei dati, non tutti i frame vengono caricati e la pagina 
ш inutilizzabile.

XML, tramite i suoi linguaggi XLink ed XPointer, supporta pienamente tutti questi tipi di collega-
mento. XPointer, in particolare, riesce ad indirizzare qualsiasi parte di un documento, rappresentan-
do gli elementi del documento allТinterno di una struttura ad albero, cosь come i moderni file system 
fanno con le directory ed i file (vedi з 7.5).
 
2.6.2 I link scomparsi

Una delle esperienze pi∙ comuni tra coloro che utilizzano abitualmente il World Wide Web ш 
lТapparizione del messaggio :ФHTTP/1.0: 404 Oggetto non trovatoФ, quando si cerca di accedere a 
un documento attraverso un link ipertestuale o mediante il suo URL (Uniform Resource Locator) 
[11]. CiЄ significa semplicemente che il file corrispondente non si trova pi∙ nella posizione indicata 
dal suo indirizzo, poichщ ш stato spostato, cancellato o rinominato. 
In questo caso non si tratta di una scelta dello standard, quanto piuttosto di un Уeffetto collateraleФ 
della struttura sintattica dellТelemento <A> in HTML [7]. Infatti lТindirizzo della risorsa di destina-
zione viene riportato esplicitamente nel documento HTML come valore dellТattributo HREF, e non 
in un database o in un altro documento, generando notevoli problemi di manutenzione. In caso di 
cancellazione della risorsa di destinazione o anche di semplice modifica del suo path, diventa allora 
necessario modificare tutti i documenti che a quella risorsa avevano un riferimento, se si vuole evi-
tare di lasciare in circolazione testi contenenti link scomparsi. Questo problema si puЄ arginare so-
lamente utilizzando nei documenti dei semplici identificativi contenuti fuori dal documento stesso, 
in archivi che, modificati in seguito ad un cambiamento dellТindirizzo della risorsa, aggiornano im-
mediatamente tutti i collegamenti. 

La schermata presentata da Explorer 5 nel caso sia selezionato un link scomparso

Per rispondere a questa esigenza, vari enti ed organizzazioni che si occupano dello sviluppo degli 
standard su Internet hanno proposto una architettura ad hoc denominata Uniform Resource Name 
(URN) [11]. In realtр con questa sigla viene indicata una serie di tecnologie, ancora in fase speri-
mentale, nate in ambiti diversi e caratterizzate da diversi approcci e finalitр immediate.
Un URN ш un identificatore che puЄ essere associato ad ogni risorsa disponibile su Internet, e che 
dovrebbe essere utilizzato in tutti i contesti che attualmente fanno uso degli URL. In generale, esso 
gode delle seguenti caratteristiche: 

? unicitр: due risorse distinte non possono avere lo stesso URN; 
? validitр globale: un URN ш indipendente dalla localizzazione della risorsa; 
? persistenza: una volta assegnato un URN ad una risorsa esso rimarrр associato ad essa per 
sempre, anche se la risorsa non sarр pi∙ disponibile; nessuna altra risorsa in futuro potrр ave-
re un URN giр assegnato;
? scalabilitр: ogni tipo di risorsa su Internet, presente e futura, potrр avere un URN che gode 
delle caratteristiche elencate sopra.

Ciascuna risorsa individuata da un URN puЄ essere disponibile in molteplici copie, distribuite su 
diversi luoghi della rete: conseguentemente ad ogni URN possono corrispondere molteplici URL. 
Attualmente le risorse dotate di URN sono poche, ma tra queste vi sono gli spazi dei nomi di cui 
fanno uso alcune applicazioni XML. Un esempio di URN ш il seguente:

urn:schemas-microsoft-com:xml-data

ed ш lТURN che contiene lo spazio dei nomi di XML-Data. Torneremo nei зз 4.6 e 4.7 sia sugli spa-
zi dei nomi che su XML-Data.

2.7 	HTML si sta evolvendo anche troppo rapidamente

Come abbiamo visto, HTML ш uno standard in continua evoluzione [14]. Finora le sue capacitр so-
no state continuamente estese attraverso lТintroduzione di nuovi tag. Per le organizzazioni che gesti-
scono grandi quantitр di informazioni in HTML, il rilascio di nuove versioni di questo linguaggio 
provoca in genere notevoli problemi di manutenzione dei documenti esistenti, non tanto perchщ 
venga meno la compatibilitр nei confronti delle versioni precedenti, quanto per la necessitр di offri-
re pagine Web sempre Уal passo con i tempiФ e quindi in grado di sfoggiare le novitр portate 
dallТultima versione di HTML.
Recentemente Microsoft e Netscape hanno aumentato lТintervallo di tempo fra i rilasci di una ver-
sione e della successiva dei loro browser, portandola da sei mesi a circa un anno. Molti webmaster 
malignamente pensano che ciЄ sia dovuto al tempo impiegato da queste due software house per ag-
giornare i loro enormi siti, al fine di ottimizzarli per la navigazione con il rispettivo nuovo browser, 
operazione che forse richiede pi∙ tempo dello sviluppo del browser stesso.
Per evitare completamente questo problema, molte grandi organizzazioni giр da tempo scrivono i 
propri documenti in formato SGML, effettuando automaticamente la traduzione in HTML con ap-
positi programmi. LТaggiornamento di un traduttore di questo tipo per una nuova versione di HTML 
richiede un tempo enormemente inferiore rispetto alla ricostruzione di tutti i documenti di interi siti.
LТavvento di XML, che ш una semplificazione di SGML, agevola enormemente coloro che vogliono 
pubblicare su Web i propri documenti SGML. Molti affermati prodotti software per comporre do-
cumenti SGML supportano giр lТesportazione in formato XML [5]. La possibilitр di usare XML di-
rettamente su Web permette di confinare i tag presenti e futuri di HTML ai soli fogli di stile: even-
tuali aggiornamenti di HTML si ripercuoteranno solo sulla presentazione su Web del documento, 
lasciando inalterata la sua versione in XML.

2.8	Conclusioni

Finora abbiamo evidenziato solamente i limiti e i difetti di HTML, notando come XML sia in grado 
di superarli. Potrebbe sembrare cosь che XML debba sostituire completamente HTML, ma ciЄ non ш 
assolutamente necessario. HTML ha numerosi punti a suo vantaggio, i pi∙ importanti dei quali sono 
[17]:

? ha una struttura molto semplice, che consente di progettare e realizzare rapidamente i documen-
ti;
? ш molto veloce e quindi adatto per le applicazioni su Web;
? puЄ essere visualizzato su qualsiasi computer, indipendentemente dallТhardware e dal sistema 
operativo;
? ш supportato da moltissimi programmi: persino i word processor pi∙ recenti esportano in for-
mato HTML;
? non necessita di validazione.

Per le applicazioni pi∙ semplici del Web passare allТXML potrebbe risultare addirittura uno svan-
taggio. Esistono numerosissime pagine Web che:

? non contengono dati strutturati o con un particolare significato;
? non hanno interesse a comparire nei motori di ricerca;
? non hanno bisogno di collegamenti estesi o multidirezionali.

Quasi sicuramente il linguaggio di queste pagine resterр HTML. Del resto se io ho una homepage 
personale visitata al pi∙ da qualche mio amico, chi me lo fa fare a:

1) convertire il codice da HTML in XML,
2) aggiungere un foglio di stile per permettere la visualizzazione con un browser,
3) aggiungere la DTD per avere la mia homepage validata secondo la specifica del W3C?

Al termine di questo lavoro avrei lo svantaggio che i miei amici con browser vecchi non riuscireb-
bero neanche pi∙ ad accedere alla pagina.
In realtр HTML ed XML sono complementari tra loro e trattano i dati su livelli differenti [19]:

? XML ш usato per strutturare e descrivere i dati;
? HTML ш usato per visualizzarli sul Web.

Infatti XSL, che si occupa della rappresentazione dei dati, prevede la possibilitр di utilizzare tag di 
HTML. La cosa non ш indispensabile, visto che si potrebbero usare anche dei tag propri di XSL, 
chiamati oggetti di formattazione, ma ш molto utile, poichщ i tag di HTML sono molto pi∙ cono-
sciuti e semplici da usare (vedi з 5.9). Si puЄ concludere che:

? se HTML soddisfa le proprie esigenze, non cТш alcuna necessitр di passare ad XML.
? Se HTML ш ritenuto insufficiente, si possono superare i suoi limiti:

1) sostituendo XML ad HTML nelle fasi di memorizzazione e descrizione dei dati;
2) riutilizzando il codice HTML relativo alla formattazione dei documenti, mediante 
lТinserimento allТinterno dei fogli di stile XSL.


3  STRUTTURA E SINTASSI DI XML

3.1	Il processo di codifica XML

Il seguente diagramma illustra i componenti fondamentali di un documento XML completo e come 
questi interagiscano fra loro [5]:




Questo schema non ш lТunico possibile, in quanto:

1) La DTD nellТXML ш facoltativa. PerЄ senza la DTD ш impossibile validare il documento.
2) Il foglio di stile XSL (o CSS) ш la soluzione pi∙ immediata per portare su Web documenti 
XML. Comunque cТш anche la possibilitр di accedere ai documenti XML per mezzo di file 
HTML con lТaggiunta di script, applet Java, controlli ActiveX ecc.

╚ appena il caso di notare che i file XML, DTD ed XSL possono trovarsi nello stesso computer, co-
sь come in tre continenti diversi: questa ш una caratteristica di tutte le tecnologie correlate ad Inter-
net.
In questo capitolo ci occuperemo esclusivamente della composizione dei documenti XML. Il capi-
tolo 4 sarр dedicato alle DTD e i capitoli 5 e 6 al linguaggio XSL.

3.2	La sintassi di XML

3.2.1 Sintassi dei tag

In XML viene definito elemento:

? tutto ciЄ che ш racchiuso tra un tag di apertura ed un tag di chiusura:

<Nome attributo=ФvaloreФ>Esempio di elemento non vuoto</Nome>

Gli elementi possono essere anche nidificati lТuno dentro lТaltro, ossia un elemento puЄ conte-
nerne un altro al suo interno.
? lТelemento vuoto, che non ha contenuto ed ha una sintassi leggermente diversa:

<Vuoto attributo=ФvaloreФ/>

Riassumiamo le sintassi dei due tipi di elementi per mezzo di questo schema [10]:

<Nome attributo=ФvaloreФ>
</Nome>

<Vuoto attributo=ФvaloreФ/>

Ogni attributo associa ad un elemento un valore, il quale ш unТinformazione che non fa parte del 
contenuto dellТelemento stesso. Come in HTML, gli attributi possono essere un numero qualsiasi, 
eventualmente anche nessuno. Se gli attributi sono pi∙ di uno, le coppie formate da attributo e valo-
re vengono semplicemente elencate allТinterno del tag di apertura o del tag di elemento vuoto:

<Nome attributo1=Фvalore1Ф attributo2=Фvalore2Ф>Contenuto</Nome>

3.2.2 Obblighi sintattici imposti da XML

Apparentemente la sintassi di XML ш la stessa di HTML. Ci sono, invece, alcune differenze di fon-
damentale importanza.

1) In un elemento non vuoto il tag di chiusura deve essere sempre presente.
2) Il nome del tag deve essere esattamente identico nei tag di apertura e chiusura. XML distingue 
fra maiuscole e minuscole e pertanto:

Nome ? NOME ? nome ? NoMe

3) Dato che ш obbligatorio il tag di chiusura, gli elementi devono essere nidificati correttamente 
lТuno nellТaltro. Se allТinterno di un elemento cТш il tag di apertura di un altro elemento, deve per 
forza trovarvisi anche il tag di chiusura. Una nidificazione corretta ш la seguente:

<ESTERNO>
<INTERNO>Contenuto</INTERNO>
</ESTERNO>

mentre ш sbagliata:

<ESTERNO>
<INTERNO>Contenuto</ESTERNO>	NO!
</INTERNO>

4) I valori degli attributi devono essere obbligatoriamente racchiusi tra virgolette o apici.
5) Deve essere presente un solo elemento di livello pi∙ esterno. Tale elemento costituisce la radice 
del documento XML e tutti gli altri elementi devono essere contenuti in esso. La radice ha lo 
stesso significato dellТelemento <HTML> di HTML, ma il suo tag puЄ avere un nome qualun-
que.


3.3	Documenti validi e ben formati

HTML definisce un insieme di elementi, ciascuno con un proprio significato ed un proprio effetto 
sulla visualizzazione del documento. XML non detta regole di questo tipo, ma lascia due possibilitр:

1) Fare riferimento ad una DTD interna o esterna. In questo caso il documento XML puЄ contenere 
solo elementi e attributi esplicitamente indicati nella DTD e strutturati secondo quanto stabilito 
nella DTD stessa. Se il documento rispetta tutte le regole della DTD ш chiamato valido.
2) Non utilizzare la DTD. In questo modo la scelta di attributi ed elementi ш libera e gli unici vin-
coli sono il rispetto delle regole sintattiche appena elencate. Un documento che ш privo di DTD 
e non contiene errori di sintassi ш detto ben formato [1] o anche ben formattato o accettabile.

Come in tutti i linguaggi, anche in XML esistono delle parole riservate che non possono essere uti-
lizzate liberamente come nomi di elementi, attributi o per markup di altro tipo [5]. Secondo la speci-
fica XML del W3C, sono parole riservate le stringhe:

XML, xml, Xml, xML, Е

e tutte le altre possibili combinazioni con lettere maiuscole e minuscole [6]. Nessun nome puЄ ini-
ziare con una di queste stringhe, o essere uguale ad una di esse [1].
Per il resto la scelta dei nomi ш molto flessibile, in quanto:

? i nomi possono iniziare con una qualsiasi lettera maiuscola o minuscola;
? possono contenere una qualsiasi sequenza di lettere maiuscole, minuscole e cifre. Sono ammessi 
anche i caratteri: У.Ф, У-У e  У_Ф;
? il carattere У:Ф ш ammesso, ma puЄ essere utilizzato solo per dichiarare lТappartenenza ad uno 
spazio dei nomi (vedi з 4.6).

Ricordiamo che un documento scritto con un linguaggio di markup ш composto dal testo e dal 
markup.


Mentre il markup segue delle regole sintattiche precise, il testo deve poter contenere qualsiasi ca-
rattere. In XML, perЄ, alcuni caratteri non dovrebbero essere inseriti direttamente nel testo, poichщ 
possono confondersi con il markup. Essi sono:

	<	>	&	'	"	 

XML consente di sostituire questi caratteri con entitр predefinite. Vedremo in seguito come ш pos-
sibile far riferimento a tali entitр e quindi utilizzare anche questi caratteri nel testo.

3.4	Prologo

I documenti XML possono cominciare con un prologo, il quale ш composto da:

? una dichiarazione XML,
? una dichiarazione di tipo di documento

entrambe facoltative.

3.4.1 Dichiarazione XML

La dichiarazione XML ш composta da 3 parti:

1) Numero della versione. Una dichiarazione XML che contiene solo il numero della versione ш 
detta minima.La sua sintassi ш:

<?xml version=Ф1.0Ф?>

Per il momento lТunica versione di XML ш la 1.0, dunque lТunico valore possibile per il numero 
di versione ш У1.0Ф. Si noti inoltre che la stringa УxmlФ deve essere scritta in lettere minuscole.

2) Dichiarazione della codifica. Descrive quale codifica dei caratteri viene utilizzata. La sintassi ш 
la seguente:

<?xml version="1.0" encoding="UTF-8" ?>

Alcune possibili codifiche sono rappresentate dalle seguenti stringhe [6]:

? UTF-8: Unicode ad 8 bit (ш la codifica normalmente utilizzata);
? UTF-16: Unicode a 16 bit (ш una codifica comprendente 65.536 caratteri non supportata da 
tutti i sistemi operativi);
? EUC-JP: caratteri giapponesi.

3) Dichiarazione di documento indipendente. Consente di specificare se debba essere recuperata 
o meno la parte esterna della DTD per analizzare correttamente la validitр del documento [1]. 
La sintassi ш:

<?xml version="1.0" standalone='yes'?>

dove:

? standalone='yes': il documento ш indipendente e non vanno considerate eventuali 
DTD o parti di DTD esterne ad esso;
? standalone='no': il documento dipende dalla parte esterna della DTD.

Se non vi sono DTD o parti di DTD esterne al documento, questa dichiarazione non ha senso 
[6]. Se ш presente un riferimento ad una DTD esterna, il valore УnoФ ш assunto come default.

3.4.2 Dichiarazione di tipo di documento

La dichiarazione di tipo di documento, se presente, stabilisce la conformitр del documento ad una 
certa DTD. Le possibili sintassi sono due:

1) DTD interna al documento:

<!DOCTYPE RADICE [DTD]>

supponendo che RADICE sia il nome dellТelemento radice del documento. CiЄ significa che 
nellТassociazione alla DTD, il documento XML viene identificato per mezzo del nome del suo 
elemento radice. Tra le parentesi quadre va scritta per esteso la DTD del documento. Tratteremo 
la composizione delle DTD nel prossimo capitolo.

2) DTD in un file esterno al documento [19]:

<!DOCTYPE RADICE SYSTEM Уdocumento.dtdФ>

Уdocumento.dtdФ ш il file dove si trova la DTD del documento. La parola chiave SYSTEM 
indica che il nome del file ш un identificatore di sistema. Ovviamente tale nome puЄ essere an-
che un indirizzo Internet [1]:

<!DOCTYPE RADICE SYSTEM Уhttp://www.inform.unian.it/documento.dtdФ>

Infine cТш la possibilitр che la DTD abbia un identificatore pubblico, che consente al software di 
utilizzare una propria copia della DTD oppure di reperire questa su determinati server veloci di 
sua conoscenza. In questo caso ш utilizzata la parola chiave PUBLIC:

<!DOCTYPE RADICE PUBLIC У-//SGMLSOURCE//DTD MEMO//ENФ 
Уhttp://www.sgmlsource.com/dtds/memo.dtdФ>

LТindirizzo Internet compare ugulamente e viene utilizzato nel caso il software non riesca ad 
interpretare lТidentificatore pubblico.

Un documento XML puЄ anche avere la sua DTD, che ш unica per definizione, divisa in un sottoin-
sieme interno ed un sottoinsieme esterno [19]. In questo caso la sintassi  ш:

<!DOCTYPE RADICE SYSTEM Уesterna.dtdФ [Sottoinsieme_interno_DTD]>

Se ci sono conflitti tra i due sottoinsiemi, viene data prioritр al sottoinsieme interno della DTD, 
ignorando eventuali dichiarazioni esterne in contrasto con quelle allТinterno del documento. In que-
sto modo chi scrive un documento XML ha la possibilitр di modificare una DTD esterna, senza che 
debba riscriverla completamente.

3.5	Entitр predefinite

Il linguaggio XML prevede cinque entitр predefinite, che possono sostituire i cinque caratteri che 
non andrebbero utilizzati allТinterno del testo di un documento (<,>,&,',") [1]. Esse sono:

ENTIT└
CARATTERE
&amp;
&
&lt;
<
&gt;
>
&apos;
С
&quot;
У
	
Vediamo un esempio:

<ESEMPIO>
   <Titolo>
Come inserire del codice HTML in un documento XML
   </Titolo>
   <Codice>
&lt;HTML&gt; &lt;HEAD&gt; &lt;TITLE&gt;Titolo&lt;/TITLE&gt; 
&lt;/HEAD&gt; &lt;BODY&gt;Contenuto&lt;/BODY&gt;&lt;/HTML&gt;
   </Codice>
</ESEMPIO>

Per rendersi conto della sostituzione delle entitр predefinite con i corrispondenti caratteri, ecco co-
me Explorer 5 mostra questo documento XML:


Si noti la distinzione tra il markup, che ш colorato, ed il testo del documento, mostrato in nero. Tutti 
i tag del codice HTML sono in nero, dunque sono considerati come semplice testo e non analizzati 
come elementi di XML.
La sostituzione dei caratteri <,>,&,' e " con le entitр predefinite non ш obbligatoria, ma diventa ne-
cessaria nel caso siano possibili confusioni tra markup e testo, come nellТesempio precedente. ╚ una 
buona norma usare comunque le entitр predefinite, poichщ il comportamento dei vari programmi  
alla presenza dei caratteri <,>,&,' e " nel testo puЄ essere imprevedibile.
La sintassi delle entitр predefinite:

	&nome;

dove УnomeФ ш il nome dellТentitр, viene utilizzata in XML per i riferimenti alle entitр generali. Le 
entitр, ad eccezione delle cinque entitр predefinite, devono essere dichiarate nella DTD, quindi ver-
ranno discusse nel prossimo capitolo.

3.6	Riferimenti ai caratteri

I documenti XML sono costituiti esclusivamente da caratteri con codice ASCII dal 32 al 127. Per 
inserire in un documento XML caratteri con codice ASCII superiore al 127, esistono due possibili-
tр:

1) dichiarare questi caratteri come entitр nella DTD;
2) utilizzare il riferimento numerico al carattere. ╚ lТunica scelta possibile per un documento senza 
DTD.

Il riferimento numerico ha la seguente sintassi:

	&#Codice;

dove Codice ш il numero di codice del carattere secondo la codifica utilizzata. ╚ possibile anche 
scrivere questo numero in esadecimale, utilizzando la sintassi:

	&#xCodice_hex;

Vediamo un piccolo esempio:

<ESEMPIO>
In XML si pu&#242; far riferimento a caratteri speciali 
utlizzando le ENTIT&#192; oppure i RIFERIMENTI NUMERICI.
</ESEMPIO>

e come viene visualizzato da Explorer 5:

<ESEMPIO>In XML si puЄ far riferimento a caratteri speciali utilizzando 
le ENTIT└ oppure i RIFERIMENTI NUMERICI.</ESEMPIO> 

LТelenco completo dei codici dei caratteri nella codifica UTF-8 si puЄ trovare in [5] o in qualsiasi 
manuale di HTML.

3.7	Istruzioni di elaborazione

Le istruzioni di elaborazione, dette anche PI (Processing Instructions) forniscono indicazioni al 
programma che elabora il documento XML [19]. Queste istruzioni sono normalmente posizionate 
nel prologo, ma possono comparire in un punto qualsiasi del documento. La sintassi ш questa:

	<?Istruzione?>

dove УIstruzione Ф dipende dal software che utilizza il file XML. Ad esempio, lТistruzione di 
elaborazione:

<?xml-stylesheet type="text/xsl" href="documento.xsl"?>

indica che il documento XML deve essere visualizzato per mezzo del foglio di stile XSL nel file 
Уdocumento.xslФ. Il W3C ha standardizzato le istruzioni di elaborazione per lТassociazione dei 
fogli di stile ai documenti XML con una raccomandazione del giugno 1999 [20]. 
Un altro esempio di istruzione di elaborazione ш [19]:

<?AVI CODEC=ФVIDEO1Ф COLORS=Ф256Ф?>

che fornisce indicazioni al browser sulla riproduzione dei filmati in formato AVI.
Formalmente, anche la dichiarazione XML ш unТistruzione di elaborazione, visto che segue la stessa 
sintassi delle PI:

<?xml version=Ф1.0Ф?>

3.8	Commenti

I commenti in XML sono aperti dalla sequenza di caratteri У<!--Ф e chiusi dalla sequenza У-->Ф 
[1]. Possono contenere qualsiasi stringa, ad eccezione della coppia di caratteri У--Ф. Esempio:

<!--Commento-->

AllТinterno dei commenti possono essere utilizzati direttamente i cinque caratteri <,>,&,' e ", senza 
bisogno di ricorrere alle entitр predefinite, dato che gli  elaboratori XML non analizzano il conte-
nuto dei commenti alla ricerca di markup:
 
<!--Questo e' un commento con un numero di caratteri <100-->

Per lo stesso motivo non ш possibile inserire i caratteri con codice ASCII maggiore di 127, neanche 
utilizzando i riferimenti numerici o le entitр. Infatti, nellТesempio precedente abbiamo sostituito il 
carattere УшФ con la stringa УeТФ. 
 
3.9	Conversione di un documento HTML in un documento XML 
ben formato

Consideriamo un breve documento HTML, che contiene lТelenco dei docenti di un dipartimento di 
informatica, con delle sommarie informazioni su ciascuno di essi:

<HTML>
<HEAD>
<TITLE>Universit&agrave; di QualchePosto - Docenti del dipartimento di 
Informatica </TITLE>
</HEAD>
<BODY>
<FONT COLOR="#0000ff"><H1 ALIGN=CENTER>Universit&agrave; degli studi di 
QualchePosto</H1>
<H2 ALIGN="CENTER">Dipartimento di Informatica</H2>
</FONT><I><FONT COLOR="#ff00ff"><H3 ALIGN=CENTER>Elenco dei docenti</H3>
</I></FONT><B><P> 
<FONT COLOR="#ff0000"><P>Gianni Brahms</B> : Professore Ordinario 
</FONT><P>Gruppo di ricerca: <I>Intelligenza Artificiale</I> 
<P>Curriculum vitae: Nato nel 1936 e laureato nel 1961. Dal 1974 &egrave; 
titolare della cattedra di Intelligenza Artificiale. Dirige il Dipartimento dal 
1996. 
<P>Elenco pubblicazioni: 
<UL>
<LI>Uso delle variabili semantiche nella logica fuzzy (1986) 
<LI>Regole di produzione ed EBNF (1988) 
<LI>Utilizzo della logica fuzzy in problemi di scheduling della CPU (1991) 
<LI>Tecniche di I.A. per i motori di ricerca (1997) </UL>
<P> 
<HR>
<B><FONT COLOR="#ff0000"><P>Ermanno Grieg</B> : Professore Associato 
</FONT><P>Gruppo di ricerca: <I>Reti Neurali</I> 
<P>Curriculum vitae: Nato nel 1949 e laureato nel 1973. Dal 1978 &egrave; 
titolare della cattedra di Algoritmi per il controllo dei segnali. 
<P>Elenco pubblicazioni: 
<UL>
<LI>L'importanza dell'apprendimento nei percettroni multistrato (1980) 
<LI>Reti neurali autoorganizzantisi: un approccio statistico (1986) 
<LI>Simulazioni al Matlab di reti neurali non lineari (1991) </UL>
<HR>
<B><FONT COLOR="#ff0000"><P>Federico Mendelzon</B> : 
</FONT><P>Gruppo di ricerca: <I>Visione delle macchine</I> 
<P>Curriculum vitae: Nato nel 1971 e laureato nel 1998. Collabora con il prof. 
Brahms nel corso di Intelligenza artificiale. 
<P>Elenco pubblicazioni: 
<UL>
<LI>Progetto di un software in grado di riconoscere i tombini (1999)</UL>
<HR>
<B><FONT COLOR="#ff0000"><P>Riccardo Strauss</B> : 
</FONT><P>Gruppo di ricerca: <I>Basi di Dati</I> 
<P>Curriculum vitae: Nato nel 1968 e laureato nel 1996. Collabora con il prof. 
Verdi nel corso di Basi di dati. 
<P>Elenco pubblicazioni: 
<UL>
<LI>Modello Reticolare nei database orientati agli oggetti (1997) </UL>
<HR>
<B><FONT COLOR="#ff0000"><P>Giuseppe Verdi</B> : Professore Associato 
</FONT><P>Gruppo di ricerca: <I>Basi di Dati</I> 
<P>Curriculum vitae: Nato nel 1945 e laureato nel 1970. Nel 1984 ha ottenuto la 
cattedra di Basi di dati. 
<P>Elenco pubblicazioni: 
<UL>
<LI>Utilizzo di Oracle per l'amministrazione di piccole aziende (1991) 
<LI>Come convertire un database gerarchico in un database relazionale (1994) 
<LI>XML e le basi di dati su Internet (1998) </UL>
<HR>
<B><FONT COLOR="#ff0000"><P>Sebastiano Bach</B> : Professore Associato 
</FONT><P>Gruppo di ricerca: <I>Ricerca Operativa
</I><P>Curriculum vitae: Nato nel 1941 e laureato nel 1970. Dal 1986 &egrave; il 
titolare della cattedra di Ricerca operativa. 
<P>Elenco pubblicazioni: 
<UL>
<LI>L'euristica per problemi di previsioni di mercato (1993) 
<LI>Un problema di sfrido a 3 dimensioni (1995) 
<LI>Una proposta per la composizione automatizzata degli orari ferroviari (1998) 
</UL>
</BODY>
</HTML>

La trasformazione del documento da HTML ad XML ben formato si puЄ ricondurre fondamental-
mente a quattro operazioni:

1) Rendere il documento HTML conforme alle restrizioni sintattiche di XML giр elencate in detta-
glio nel з3.2.2. I documenti di questo tipo appartengono, oltre che allТHTML, ad un particolare 
linguaggio, chiamato XHTML (eXtensible HyperText Markup Language), la cui versione 1.0 ш 
stata definita da una specifica del W3C nellТagosto 1999 [21]. XHTML 1.0 ш semplicemente 
una riformulazione di HTML 4.0 come unТapplicazione di XML (oltre che di SGML).
La trasformazione di un documento HTML in uno XHTML (e quindi XML) ш effettuata auto-
maticamente da alcuni software, tra cui il browser Amaya del W3C [22]. Vediamo un esempio 
di questa conversione. Il codice HTML:

<P>Curriculum vitae: Nato nel 1968 e laureato nel 1996. Collabora con il 
prof. Verdi nel corso di Basi di dati. 
<P>Elenco pubblicazioni: 
<UL>
<LI>Modello Reticolare nei database orientati agli oggetti (1997) </UL>
<HR>

in cui gli elementi <P> e <LI> non hanno il tag di chiusura e lТelemento <HR> non segue la 
sintassi di XML per gli elementi vuoti, diventa:

<p>Curriculum vitae: Nato nel 1968 e laureato nel 1996. Collabora con il 
prof. Verdi nel corso di Basi di dati.</p> 
<p>Elenco pubblicazioni:</p>
<ul>
<li>Modello Reticolare nei database orientati agli oggetti (1997)</li> </ul>
<hr/>

Si noti che lТXHTML impone lТuso delle lettere minuscole per tutti i tag di HTML, rispettando 
la case-sensitivity di XML.

2) Dopo il primo passo abbiamo un documento XML sintatticamente corretto, ma semanticamente 
molto povero, come il documento HTML di partenza (vedi з 2.4). ╚ a questo punto che deve 
avvenire la trasformazione fondamentale: la sostituzione degli elementi di HTML, orientati alla 
presentazione del documento su Web, con degli elementi di XML in grado di descrivere la se-
mantica e la struttura del documento. 
Occorre inoltre sopprimere:

? alcuni elementi ed attributi di formattazione privi di qualsiasi semantica,
? alcune parti del testo ripetute di frequente.

Queste parti del documento non vengono eliminate definitivamente, poichщ sono utili alla pre-
sentazione e alla formattazione del documento stesso, ma saranno inserite successivamente nel 
foglio di stile XSL utilizzato per la presentazione su Web. 
Purtroppo non esistono regole precise per estrarre il contenuto significativo da un documento 
HTML ed assegnare ad esso i tag XML, quindi sarр compito di chi si occupa della conversione 
seguire i criteri ritenuti opportuni. Nel nostro semplice esempio, proponiamo i seguenti cam-
biamenti (ovviamente non sono i soli possibili):

HTML

XML
<html>
?
soppresso
<head>
?
<?xml version=Ф1.0Ф encoding=ФUTF-8Ф?>
<title>
?
soppresso
<body>Е</body>
?
<DOCENTI>Е</DOCENTI>
<font color="#0000ff">
?
soppresso
<h1>, <h2>, <h3>
?
soppressi
<font color="#ff00ff">
?
soppresso
<font color="#ff0000">
?
<PERSONA>
<p><b>nome</b>
?
<NOME>nome</NOME>
:titolo_accademico</p>
?
<TITOLO>titolo_accademico</TITOLO>
Gruppo di ricerca: <i>Е</i>
?
<GRUPPO>Е</GRUPPO>
<p>Curriculum vitae: Е</p>
?
<CURRICULUM>Е</CURRICULUM>
<p>Elenco pubblicazioni:</p>
?
soppresso
<ul>Е</ul>
?
<PUBBLICAZIONI>Е</PUBBLICAZIONI>
<li>Е</li>
?
<PUBBLICAZIONE>Е</PUBBLICAZIONE>
<hr/>
?
</PERSONA>

3) Sostituire i riferimenti ai caratteri speciali di HTML (&agrave;, &egrave; ecc.) con i rife-
rimenti numerici di XML. Si noti che i riferimenti di HTML sono utilizzabili anche in XML, ma 
vanno definiti nella DTD. Per un documento senza DTD ш possibile solo usare i riferimenti nu-
merici descritti nel з 3.6. Nel nostro documento occorre una sola sostituzione:

HTML

XML
&egrave;
?
&#232;

4) Sostituire eventuali occorrenze dei cinque caratteri <,>,&,' e " nel testo con le rispettive entitр 
predefinite. Come abbiamo giр detto, questТoperazione non ш indispensabile, ma ш consigliata, 
specie se si pensa che il documento possa essere utilizzato da vari programmi. Anche in questo 
caso cТш una sola sostituzione da fare:

HTML

XML
С
?
&apos;

Al termine di queste trasformazioni abbiamo il seguente documento XML ben formato:

<?xml version="1.0" encoding="UTF-8" ?>
<DOCENTI>
   <PERSONA>
      <NOME>Gianni Brahms</NOME>
      <GRUPPO>Intelligenza Artificiale</GRUPPO>
      <TITOLO>Professore Ordinario</TITOLO>
      <PUBBLICAZIONI>
        	<PUBBLICAZIONE>Uso delle variabili semantiche nella logica fuzzy
            (1986)</PUBBLICAZIONE>
      	<PUBBLICAZIONE>Regole di produzione ed EBNF (1988)</PUBBLICAZIONE>
      	<PUBBLICAZIONE>Utilizzo della logica fuzzy in problemi di scheduling 
della CPU (1991)</PUBBLICAZIONE>
<PUBBLICAZIONE>Tecniche di I.A. per i motori di ricerca (1997) 
</PUBBLICAZIONE>
      </PUBBLICAZIONI>
<CURRICULUM>Nato nel 1936 e laureato nel 1961. Dal 1974 &#232; titolare 
della cattedra di Intelligenza Artificiale. Dirige il Dipartimento dal 
1996.</CURRICULUM>
   </PERSONA>
   <PERSONA>
      <NOME>Ermanno Grieg</NOME>
      <GRUPPO>Reti Neurali</GRUPPO>
      <TITOLO>Professore Associato</TITOLO>
      <PUBBLICAZIONI>
      	<PUBBLICAZIONE>L&apos;importanza dell&apos;apprendimento nei
percettroni multistrato (1980)</PUBBLICAZIONE>
      	<PUBBLICAZIONE>Reti neurali autoorganizzantisi: un approccio 
statistico (1986)</PUBBLICAZIONE>
<PUBBLICAZIONE>Simulazioni al Matlab di reti neurali non lineari 
(1991)</PUBBLICAZIONE>
      </PUBBLICAZIONI>
      <CURRICULUM>Nato nel 1949 e laureato nel 1973. Dal 1978 &#232; 
titolare della cattedra di Algoritmi per il controllo dei 
segnali.</CURRICULUM>
   </PERSONA>
   <PERSONA>
      <NOME>Federico Mendelzon</NOME>
      <GRUPPO>Visione delle macchine</GRUPPO>
      <PUBBLICAZIONI>
<PUBBLICAZIONE>Progetto di un software in grado di riconoscere i 
tombini (1999)</PUBBLICAZIONE>
      </PUBBLICAZIONI>
      <CURRICULUM>Nato nel 1971 e laureato nel 1998. Collabora con il prof. 
Brahms nel corso di Intelligenza artificiale.</CURRICULUM>
   </PERSONA>
   <PERSONA>
      <NOME>Riccardo Strauss</NOME>
      <GRUPPO>Basi di Dati</GRUPPO>
      <PUBBLICAZIONI>
      	<PUBBLICAZIONE>Modello Reticolare nei database orientati agli 
oggetti (1997)</PUBBLICAZIONE>
      </PUBBLICAZIONI>
      <CURRICULUM>Nato nel 1968 e laureato nel 1996. Collabora con il prof. 
Verdi nel corso di Basi di dati.</CURRICULUM>
   </PERSONA>
   <PERSONA>
      <NOME>Giuseppe Verdi</NOME>
      <GRUPPO>Basi di Dati</GRUPPO>
      <TITOLO>Professore Associato</TITOLO>
      <PUBBLICAZIONI>
		<PUBBLICAZIONE>Utilizzo di Oracle per l&apos;amministrazione di 
piccole aziende (1991)</PUBBLICAZIONE>
		<PUBBLICAZIONE>Come convertire un database gerarchico in un database 
relazionale (1994)</PUBBLICAZIONE>
<PUBBLICAZIONE>XML e le basi di dati su Internet (1998) 
</PUBBLICAZIONE>
      </PUBBLICAZIONI>
      <CURRICULUM>Nato nel 1945 e laureato nel 1970. Nel 1984 ha ottenuto la 
cattedra di Basi di dati.</CURRICULUM>
   </PERSONA>
   <PERSONA>
      <NOME>Sebastiano Bach</NOME>
      <GRUPPO>Ricerca Operativa</GRUPPO>
      	<TITOLO>Professore Associato</TITOLO>
      <PUBBLICAZIONI>	
      	<PUBBLICAZIONE>L&apos;euristica per problemi di previsioni di 
mercato (1993)</PUBBLICAZIONE>
<PUBBLICAZIONE>Un problema di sfrido a 3 dimensioni 
(1995)</PUBBLICAZIONE>
<PUBBLICAZIONE>Una proposta per la composizione automatizzata degli 
orari ferroviari (1998)</PUBBLICAZIONE>
      </PUBBLICAZIONI>
<CURRICULUM>Nato nel 1941 e laureato nel 1970. Dal 1986 &#232; il titolare 
della cattedra di Ricerca operativa.</CURRICULUM>
   </PERSONA>
</DOCENTI>

Questo documento ha una precisa struttura ad albero, che si puЄ giр intuire dalle diverse indentature 
dei vari elementi nel listato. Mostriamo pi∙ in dettaglio questa struttura, servendoci della rappre-
sentazione grafica fornita dal programma XML Notepad della Microsoft:


Per motivi di spazio sono stati completamente espansi solo i rami relativi a tre dei sei elementi 
PERSONA. Vediamo, infine, la struttura ad albero utilizzando un grafo УtradizionaleФ:



In questo caso, per motivi di spazio, abbiamo espanso solamente il ramo relativo al secondo ele-
mento PERSONA (Ermanno Grieg).


4  DOCUMENT TYPE DEFINITION (DTD)

4.1	Dichiarazione degli elementi

La DTD di un documento definisce gli elementi, gli attributi e le entitр consentiti al suo interno. 
Inoltre essa esprime come questi debbano essere combinati, affinchщ il documento sia valido [1].
La sintassi per la dichiarazione di un elemento NOME in un documento XML ш:

	<!ELEMENT NOME CONTENUTO>

dove CONTENUTO puЄ avere i seguenti valori:

Valore di CONTENUTO
Contenuto consentito
EMPTY
Nessuno. LТelemento devТessere vuoto e seguire la sintassi per 
gli elementi vuoti.
ANY
Qualsiasi. LТelemento puЄ contenere qualunque combinazione 
di sottoelementi e testo. 
(FIGLIO)
LТelemento puЄ contenere solo un sottoelemento di nome 
FIGLIO. Il nome del sottoelemento deve essere racchiuso fra 
parentesi tonde.
(#PCDATA)
LТelemento puЄ contenere solo una stringa di testo di qualsiasi 
lunghezza o, eventualmente, essere vuoto. Anche in questo ca-
so sono obbligatorie le parentesi. 

Il contenuto di un elemento puЄ essere specificato con precisione utilizzando degli operatori che 
consentono di combinare le possibilitр appena elencate [19]. Per chiarire lТuso di questi operatori, 
supponiamo che A e B siano sottoelementi. Si ha:

Operatore
Valore di 
CONTENUTO
Contenuto consentito
|
(A|B)

(#PCDATA|A)
LТelemento deve contenere uno solo tra A e B, senza ripeti-
zioni.
LТelemento puЄ contenere una stringa di testo oppure un 
solo sottoelemento A.
,
(A,B)
LТelemento deve contenere prima A e poi B, per una sola 
volta e nellТordine specificato.
?
(A?)
LТelemento puЄ contenere A o essere vuoto. Non sono 
ammesse ripetizioni di A.
*
(A*)
LТelemento puЄ contenere un numero qualsiasi di occorren-
ze di A o essere vuoto.
+
(A+)
LТelemento deve contenere A, che puЄ essere ripetuto per 
un numero qualsiasi di volte.

╚ formalmente possibile usare gli operatori ?, * e + anche con la parola chiave #PCDATA, anche se 
non hanno alcun effetto su essa.
Gli operatori possono essere combinati in vari modi, utilizzando anche parentesi multiple. ╚ im-
portante che la parola chiave #PCDATA, se utilizzata, sia posta allТinizio di CONTENUTO [5].

4.1.1 Esempi di dichiarazione degli elementi

Esempio 1. Per evidenziare meglio la collocazione della DTD allТinterno di un documento XML, 
analizziamo il seguente documento XML valido, che realizza lТesempio di e-mail del з1.1 [19]:

<?xml version="1.0"?>
<!DOCTYPE EMAIL [
	<!ELEMENT EMAIL (A,DA,CC,TITOLO,TESTO)>
	<!ELEMENT A (#PCDATA)>
	<!ELEMENT DA (#PCDATA)>
	<!ELEMENT CC (#PCDATA)>
	<!ELEMENT TITOLO (#PCDATA)>
	<!ELEMENT TESTO (#PCDATA)>
]>
<EMAIL>
	<A>Alessandro</A>
	<DA>Luca</DA>
	<CC>Ezio</CC>
	<TITOLO>Prova</TITOLO>
	<TESTO>
Questo &#232; un esempio di e-mail, che serve a 
mostrare le differenze fra i linguaggi di markup.
</TESTO>
</EMAIL>

Abbiamo diviso il documento in definizione (DTD) e istanza, seguendo la terminologia delle basi 
di dati [3]. In XML il documento coincide con lТistanza, mentre la definizione, se presente, ш sepa-
rata dalla struttura ad albero del documento, essendo racchiusa allТinterno del prologo (vedi 
з 3.4.2). 
Affinchщ il documento sia valido, lТistanza deve seguire le regole dettate dalla definizione. Nel no-
stro esempio, lТelemento radice del documento ш EMAIL, che contiene nellТordine i cinque sottoe-
lementi A, DA, CC, TITOLO e TESTO. Questi a loro volta contengono solo testo. 
La DTD presentata ш estremamente rigida: i cinque sottoelementi devono comparire tutti, essere 
nellТordine stabilito e contenere testo. Una possibile variazione della DTD pi∙ conforme alla realtр 
si puЄ ottenere introducendo alcuni operatori nella dichiarazione della radice [19]:

<!ELEMENT EMAIL (A+,DA,CC*,TITOLO?,TESTO?)>

in questo modo:

? lТelemento A ш obbligatorio e puЄ essere ripetuto pi∙ di una volta;
? lТelemento CC puЄ o non comparire, o essere presente una o pi∙ volte;
? gli elementi TITOLO e TESTO sono facoltativi, ma se presenti non possono essere ripetuti;
? lТordine degli elementi rimane fissato: se ci sono pi∙ elementi A, DA deve trovarsi dopo lТultimo 
di questi e cosь via.

Esempio 2. 

<!ELEMENT paragrafo (#PCDATA|grassetto|corsivo)*>

LТelemento paragrafo puЄ contenere stringhe di testo e degli elementi grassetto e corsi-
vo, in qualsiasi numero ed in qualsiasi ordine [1]. Eventualmente lТelemento puЄ anche essere 
vuoto. Per evitare questa possibilitр basta sostituire lТoperatore + allТoperatore *. 
Come abbiamo detto, #PCDATA, se presente, deve trovarsi allТinizio della stringa che definisce il 
contenuto dellТelemento. CiЄ significa che la dichiarazione:

<!ELEMENT paragrafo (grassetto|corsivo|#PCDATA)*>		NO!

sarebbe scorretta, mentre risulta corretta quella precedente.

Esempio 3. ╚ possibile utilizzare pi∙ coppie di parentesi. Esse assumono lo stesso valore che hanno 
nelle espressioni matematiche:

<!ELEMENT FAQ (INTRODUZIONE,(DOMANDA,RISPOSTA)+,COPYRIGHT?)>

LТelemento FAQ deve contenere:

1) un elemento INTRODUZIONE obbligatorio;
2) una o pi∙ coppie di elementi DOMANDA e RISPOSTA. Tali coppie sono ordinate: al termine 
dellТelemento RISPOSTA dovrр trovarsi il successivo elemento DOMANDA (se esiste).
3) Un elemento COPYRIGHT facoltativo e non ripetibile.

Esempio 4. Chiudiamo con una dichiarazione di elemento vuoto:

<!ELEMENT VUOTO EMPTY>

Per inserire un elemento opzionale non si puЄ usare la dichiarazione:

<!ELEMENT prova (EMPTY|paragrafo)>		NO!

poichщ EMPTY viene interpretato in questo caso come il nome di un sottoelemento di prova, non 
come parola chiave. Dunque lТelemento cosь definito deve contenere un elemento EMPTY o un ele-
mento paragrafo e non puЄ essere vuoto. Ovviamente la dichiarazione giusta ш:

<!ELEMENT prova (paragrafo?)>

4.2	Dichiarazione degli attributi

Oltre a definirne il contenuto, la DTD consente di associare attributi a ciascun elemento [19]. Gli 
attributi forniscono informazioni aggiuntive relative ad un elemento o al suo contenuto. A differen-
za degli elementi, gli attributi possono contenere solo testo, e non markup, al loro interno [1]. Per-
tanto non esistono УsottoattributiФ, nщ in XML, nщ in SGML (e quindi in HTML).
Nel linguaggio XML, gli attributi vengono dichiarati nella DTD utilizzando la seguente sintassi 
[19]:

	<!ATTLIST ELEMENTO NOME TIPO IMPOSTAZIONE>

dove:

? ELEMENTO ш lТelemento al quale viene applicato lТattributo. Si possono trovare attributi con lo 
stesso nome, ma associati ad elementi diversi.
? NOME ш il nome dellТattributo;
? TIPO ш il tipo di attributo;
? IMPOSTAZIONE ш lТimpostazione predefinita dellТattributo.

Elenchiamo in questa tabella i possibili valori di TIPO:

Valore di TIPO
Valore consentito per lТattributo
CDATA
Stringa di testo di qualsiasi lunghezza, eventualmente anche vuota.
NMTOKEN
Stringa composta da lettere, numeri e caratteri У.Ф, У-У, У:Ф e У_Ф di 
qualsiasi lunghezza, ma non vuota.
NMTOKENS
Consente lТutilizzo di pi∙ valori di tipo NMTOKEN separati da spazi.
 (valore1|valore2|Е)
Deve essere uno dei valori specificati nella lista.
ENTITY
Riferimento ad unТentitр esterna (vedi з 4.4).
ENTITIES
Riferimenti a diverse entitр esterne separati da spazi.
ID
Identificatore univoco (vedi з 4.2.1).
IDREF
Riferimento ad un identificatore univoco.
IDREFS
Riferimenti a diversi identificatori univoci.
NOTATION
Riferimento ad unТannotazione dichiarata in un altro punto della DTD 
(vedi з 4.4).

Il campo IMPOSTAZIONE puЄ assumere i seguenti valori:

Valore di IMPOSTAZIONE
Significato
#REQUIRED
LТattributo ш richiesto. 
#IMPLIED
LТattributo ш opzionale.
#FIXED Уvalore_fissatoФ
LТattributo deve avere il valore valore_fissato. Questo puЄ 
essere specificato nel documento, oppure sottinteso. 
LТassegnazione di un valore diverso provoca un errore.
УdefaultФ
Se lТattributo non viene specificato, gli viene assegnato il 
valore default.

Sono ammesse dichiarazioni di attributi multipli per un singolo elemento [1]. Ad esempio, un ele-
mento PERSONA potrebbe avere la seguente dichiarazione:

<!ATTLIST PERSONA EMAIL CDATA #IMPLIED
			   TELEFONO CDATA #REQUIRED
			   FAX CDATA #IMPLIED>

che risulta sicuramente pi∙ compatta rispetto a tre dichiarazioni singole.
LТordine degli attributi non ш importante. Infatti, lТelemento:

<PERSONA TELEFONO="071/84315" FAX="071/2810841" 
EMAIL="mrossi@unian.it">Е</PERSONA>

ш compatibile con la dichiarazione precedente.
Vediamo un esempio riguardante gli attributi predefiniti:

<!ATTLIST MAGLIETTA TAGLIA (SMALL|MEDIUM|LARGE) "MEDIUM">

In questo caso i valori che puЄ assumere lТattributo TAGLIA sono solo i tre elencati. Il valore pre-
definito ш "MEDIUM". Se nel documento abbiamo:

? <MAGLIETTA TAGLIA="LARGE">Е</MAGLIETTA>

il valore dellТattributo TAGLIA ш posto uguale a УLARGEФ;

? <MAGLIETTA>Е</MAGLIETTA>

anche se non compare, lТattributo TAGLIA ш comunque associato allТelemento MAGLIETTA 
ed il suo valore ш quello predefinito, cioш УMEDIUMФ. In questo caso Explorer 5 mostra il se-
guente output:

<MAGLIETTA TAGLIA="MEDIUM">Е</MAGLIETTA> 

? Se si tenta di inserire un valore non previsto nellТelenco, si ottiene un errore: 

<MAGLIETTA TAGLIA="XL">Е</MAGLIETTA> 	NO!

Infatti УXLФ non compare nellТelenco dei possibili valori di TAGLIA. 

4.2.1  Riferimenti incrociati

AllТinterno di un documento XML ш possibile effettuare riferimenti incrociati per mezzo degli attri-
buti di tipo ID e IDREF. Nel documento, lТattributo di tipo ID ш in grado di dare un identificatore 
unico ad un certo elemento, pertanto i valori che esso puЄ assumere sono soggetti alle stesse limita-
zioni dei nomi di elementi e di attributi, descritte nel з 3.3. Ad esempio, supponiamo di dichiarare il 
seguente attributo per un elemento SEZIONE:

<!ATTLIST SEZIONE argomento ID #IMPLIED>

e supponiamo che vi siano pi∙ istanze dellТelemento SEZIONE nel documento, in tal caso sarр pos-
sibile riferirsi ad uno di questi utilizzando il suo identificatore univoco. Esso ш rappresentato dal 
valore del suo attributo argomento di tipo ID e deve essere unico allТinterno del documento. 
Naturalmente un elemento non puЄ avere pi∙ di un attributo di tipo ID.
LТimpostazione #IMPLIED indica che non tutti gli elementi SEZIONE necessitano di un attributo 
di tipo ID. Se avessimo voluto associare ad ogni elemento SEZIONE un identificatore univoco, 
avremmo dovuto utilizzare lТimpostazione #REQUIRED.
LТassegnazione dellТidentificatore allТelemento avviene in questo modo:

<SEZIONE argomento="Caratteristiche_di_XML">Е</SEZIONE>

Lo spazio ш uno dei caratteri non ammessi per i nomi degli identificatori in XML. Dunque 
lТassegnazione:

<SEZIONE argomento="Caratteristiche di XML">Е</SEZIONE>	NO!

ш scorretta.
I riferimenti agli identificatori univoci avvengono per mezzo degli attributi di tipo IDREF. Vedia-
mo la dichiarazione di un attributo di questo tipo, assegnato ad un apposito elemento vuoto 
RIFERIMENTO:

<!ATTLIST RIFERIMENTO A IDREF #REQUIRED>

Il riferimento allТinterno del documento ш dato da:

<RIFERIMENTO A="Caratteristiche_di_XML"/>

Chiaramente, se il valore dellТattributo A di tipo IDREF non ш uguale ad alcun identificatore univo-
co, si ottiene un errore. 
I riferimenti a ciascuno degli identificatori univoci del documento possono essere un numero qual-
siasi. ╚ compito del foglio di stile gestire i vari riferimenti, utilizzando presumibilmente dei colle-
gamenti ipertestuali.

4.3	Entitр

4.3.1 Entitр interne

Le entitр sono parti del documento XML che fungono da УcontenitoriФ. I loro contenuti possono es-
sere:
 
? caratteri speciali;
? stringhe di testo;
? frammenti di documento, composti da testo e markup;
? documenti XML situati in file esterni;
? file di testo e binari.

╚ possibile inserire ciascuno di questi oggetti nel documento tramite un semplice riferimento al no-
me dellТentitр che lo contiene.
Le entitр vengono definite nella DTD in questo modo [19]:

<!ENTITY Nome Definizione>

e i riferimenti ad esse allТinterno del documento seguono la sintassi:

	&Nome;

dove Nome ш il nome dellТentitр.
Nel caso delle entitр interne, Definizione ш una parte di documento XML racchiusa tra virgo-
lette o apici, e puЄ contenere [1]:

? testo;
? markup;
? riferimenti a caratteri (vedi з 3.6);
? riferimenti ad altre entitр, comprese le entitр predefinite (vedi з 3.5).

Vediamo due esempi:

? <!DOCTYPE EDITORIALE [
	[Е]
	<!ENTITY IAT "<TITOLO>Insieme a tavola</TITOLO>">
	<!ENTITY eacute "&#233;">
	<!ENTITY egrave "&#232;">
	<!ENTITY agrave "&#224;">
]>
<EDITORIALE>
<par>Care amiche,</par> 
<par>realizzare oggi una nuova rivista di cucina potrebbe 
sembrare quanto meno fuori luogo.</par>
	<par>Perch&eacute;, allora, pubblicare &IAT;?</par>
	<par>La risposta &egrave; semplice. &IAT; sar&agrave; 
monotematico: ogni mese vi proporremo un ingrediente in base 
al quale sviluppare una serie di piatti.</par> [Е]
</EDITORIALE>

Vengono definite quattro entitр: eacute, egrave ed agrave, associate rispettivamente ai 
caratteri УщФ, УшФ ed УрФ come in HTML, e IAT, associata allТelemento TITOLO. Ad ogni rife-
rimento &IAT; viene inserito allТinterno del documento lТintero elemento, completo del conte-
nuto:

<TITOLO>Insieme a tavola</TITOLO>

? <!DOCTYPE ESEMPIO [
	[Е]
	<!ENTITY agrave "&#224;">
	<!ENTITY uno "Questa entit&agrave; usa &due;, comprese le
  &quot;predefinite&quot;!">
	<!ENTITY due "<enfatizzato>altre entit&agrave;</enfatizzato>">
]> 
[Е]
<ESEMPIO>&uno;</ESEMPIO>

Il risultato di questo esempio, visualizzato per mezzo di un opportuno foglio di stile, ш un fram-
mento di documento XML, composto di testo e markup:

<ESEMPIO>Questa entitр usa 
<enfatizzato>altre entitр</enfatizzato> 
, comprese le "predefinite"!</ESEMPIO>

si puЄ notare che:

1) lТelemento ESEMPIO nel documento fa riferimento allТentitр uno;
2) lТentitр uno fa riferimento alle entitр due, agrave e allТentitр predefinita quot;
3) lТentitр due fa riferimento allТentitр agrave.

Qualsiasi elemento eventualmente contenuto in unТentitр devТessere completo. In caso contrario il 
documento non ш ben formato. Non ш possibile iniziare un elemento in unТentitр e finirlo in unТaltra: 

<!DOCTYPE ESEMPIO [
	[Е]
	<!ENTITY inizio "<TITOLO>Questo esempio ">		NO!
	<!ENTITY fine "risulta sbagliato.</TITOLO>">
]>
<ESEMPIO>&inizio;&fine;</ESEMPIO>

Lo stesso vale per gli altri tipi di markup: istruzioni di elaborazione, commenti, ecc.
Naturalmente il documento ш valido solo se risulta conforme alla sua DTD una volta sostituiti i 
contenuti delle entitр interne ai riferimenti.

4.3.2  Entitр esterne

Il linguaggio XML consente di utilizzare file esterni in formato XML o in altri formati per mezzo 
delle entitр esterne. La sintassi della dichiarazione di unТentitр esterna ш analoga a quella della di-
chiarazione di una DTD esterna (vedi з 3.4.2). Vediamo un esempio [19]:

<!ENTITY dipartimento SYSTEM "dipartimentobf.xml">

se il file esterno ha un identificatore pubblico, la descrizione dellТentitр ш composta dalla parola 
chiave PUBLIC, dallТidentificatore pubblico e da un identificatore di sistema da utilizzare nel caso 
lТidentificatore pubblico non sia riconosciuto [6]:

<!ENTITY open-hatch
PUBLIC "-//Textuality//TEXT Standard open-hatch boilerplate//EN"
"http://www.textuality.com/boilerplate/OpenHatch.xml">

Se lТentitр esterna ш un file XML, o un file di testo che puЄ far parte del documento XML senza 
causare errori, essa ш detta analizzata e viene riferita con la stessa sintassi delle entitр interne 
(&Nome;). Le entitр esterne analizzate consentono di raggruppare vari file in un unico documento 
XML, come in questo esempio:

<!DOCTYPE TESTO [
	<!ELEMENT TESTO (CAPITOLO)+>
	<!ELEMENT CAPITOLO (#PCDATA)>
	<!ENTITY CAP1 SYSTEM "Capitolo1.xml">
	<!ENTITY CAP2 SYSTEM "Capitolo2.xml">
	<!ENTITY CAP3 SYSTEM "Capitolo3.xml">
]>
<TESTO>&CAP1; &CAP2; &CAP3;</TESTO>

AllТinterno del documento vengono sostituiti i tre riferimenti con i contenuti dei file corrispondenti. 
Mostriamo la visualizzazione di Explorer 5:

<!DOCTYPE TESTO (View Source for full doctype...)> 
<TESTO>
<CAPITOLO>Iniziamo con il capitolo 1.</CAPITOLO> 
<CAPITOLO>Proseguiamo con il capitolo 2.</CAPITOLO> 
<CAPITOLO>Terminiamo il testo con il capitolo 3.</CAPITOLO> 
</TESTO> 

Per usare le entitр (escluse quelle predefinite) devТessere presente la DTD, che serve a definirle. 
Pertanto, affinchщ il documento sia valido, le entitр esterne analizzate devono:

? essere file privi di una loro DTD, poichщ non ш ammessa pi∙ di una dichiarazione di tipo di do-
cumento (DOCTYPE);
? rispettare la DTD del documento che le richiama.

A questo tipo di entitр si contrappongono le entitр esterne non analizzate. Queste ultime servono ad 
inserire allТinterno di un documento XML immagini, suoni, filmati o altri oggetti multimediali [1]. 
Si puЄ far riferimento a queste entitр per mezzo degli attributi di tipo ENTITY o ENTITIES, in-
sieme ad una dichiarazione di annotazione, come vedremo nel з 4.4.

4.3.3  Entitр parametro

Le entitр interne ed esterne vengono chiamate entitр generali, poichщ esse sono definite nella DTD 
e richiamate allТinterno del documento. Oltre a queste esistono anche le entitр parametro, che ven-
gono definite e richiamate allТinterno della DTD.
La sintassi della dichiarazione di unТentitр parametro ш la seguente:

	<!ENTITY % Nome Definizione>

e il riferimento ad essa avviene in questo modo:

	%Nome;

AllТinterno della dichiarazione il simbolo У%Ф e il nome dellТentitр vanno separati da uno spazio, 
mentre nel riferimento essi devono essere uniti. Il significato di Definizione ш identico a quello 
delle entitр generali.
LТentitр parametro non puЄ essere una stringa qualsiasi, ma deve contenere almeno una dichiarazio-
ne completa di un elemento o di un attributo, ecc. Vediamo un esempio:

<!DOCTYPE TESTO [
	<!ENTITY % parte1 SYSTEM Уdichiarazioni1.entФ>
	<!ENTITY % parte2 SYSTEM Уdichiarazioni2.entФ>
	%parte1; %parte2;
]>
[Е]

Le entitр parametro esterne, presenti in questТesempio, permettono di avere parti della DTD in di-
versi file esterni. Si supera cosь il limite della DOCTYPE, che consente di dichiarare un unico file 
come sottoinsieme esterno della DTD (vedi з 3.4.2). 

4.4	Annotazioni

LТannotazione ш un nome che la DTD assegna ad un certo tipo di file binari. Nella sua dichiarazione 
cТш unТindicazione per lТelaboratore XML su come operare con tali file [19]. Le dichiarazioni delle 
varie annotazioni si trovano nella DTD e seguono la sintassi: 
	
<!NOTATION Annotazione Descrizione>

Per incorporare in un documento XML unТentitр esterna non analizzata, occorre associarla ad 
unТannotazione, utilizzando la parola chiave NDATA come in questo esempio:

<!ENTITY sfondo SYSTEM "palloncini.jpg" NDATA IMMAGINI>

IMMAGINI ш il nome dellТannotazione, che deve essere a sua volta dichiarata nella DTD. Una 
possibile dichiarazione di annotazione per lТesempio precedente ш:

<!NOTATION IMMAGINI SYSTEM "Iexplore.exe">

la quale indica al software che sta elaborando il documento XML di utilizzare il programma 
УIexplore.exeФ (Internet Explorer) per gestire i file di tipo IMMAGINI.
Una volta dichiarate, sia le entitр esterne che le annotazioni possono comparire nel documento 
XML come valori di particolari attributi. Ad esempio, possiamo associare ad un elemento 
ESEMPIO lТentitр esterna non analizzata sfondo in questo modo:

<!ATTLIST ESEMPIO FILE ENTITY #REQUIRED>
[Е]
<ESEMPIO FILE="sfondo">Е</ESEMPIO>

Questo non significa che il documento XML avrр come sfondo il file associato allТentitр esterna 
sfondo. Le annotazioni, infatti, si limitano a fornire informazioni allТelaboratore del documento, 
che ha il compito di stabilire come lТentitр esterna debba essere effettivamente utilizzata, in base:

? alle caratteristiche del sistema di calcolo;
? alla disponibilitр del programma indicato nellТannotazione;
? alle indicazioni del foglio di stile.

4.5	Creazione della DTD per un documento XML ben formato

Nel з 3.9 abbiamo visto un esempio di conversione di un documento HTML in un documento XML 
ben formato. Occupiamoci ora di scrivere una DTD compatibile con tale documento, al fine di ren-
derlo valido. Analizzando il codice del documento, si nota che esso rispetta questo schema:

? LТelemento radice ш DOCENTI. Esso contiene sei elementi PERSONA.
? Ciascun elemento PERSONA contiene, nellТordine:

1) un elemento NOME;
2) un elemento TITOLO facoltativo;
3) un elemento GRUPPO;
4) un elemento PUBBLICAZIONI;
5) un elemento CURRICULUM.

Questi elementi contengono esclusivamente testo, ad eccezione di PUBBLICAZIONI.
? LТelemento PUBBLICAZIONI contiene uno o pi∙ elementi PUBBLICAZIONE, che a loro 
volta hanno stringhe di testo come contenuto.

Infine ш opportuno definire unТentitр per il carattere УшФ, che viene utilizzato pi∙ volte allТinterno del 
documento. Per comoditр chiameremo egrave questa entitр, come in HTML.
La DTD che esplicita queste regole ш la seguente:

<!ELEMENT DOCENTI (PERSONA*)>
<!ELEMENT PERSONA (NOME,GRUPPO,TITOLO?,PUBBLICAZIONI,CURRICULUM)>
<!ELEMENT NOME (#PCDATA)>
<!ELEMENT GRUPPO (#PCDATA)>
<!ELEMENT TITOLO (#PCDATA)>
<!ELEMENT PUBBLICAZIONI (PUBBLICAZIONE+)>
<!ELEMENT PUBBLICAZIONE (#PCDATA)>
<!ELEMENT CURRICULUM (#PCDATA)>
<!ENTITY egrave "&#232;" >

Supponiamo di scrivere questa DTD in un file chiamato Уdipartimento.dtdФ. Per associarla al 
documento, occorre aggiungere questa riga al prologo:

<!DOCTYPE DOCENTI SYSTEM "dipartimento.dtd">

inoltre nel documento XML occorre sostituire i riferimenti al carattere УшФ (&#232;) con i riferi-
menti allТentitр egrave (&egrave;). Abbiamo cosь ottenuto un documento XML valido.
Il documento resta valido se effettuiamo modifiche conformi alla DTD. Ad esempio, possiamo ag-
giungere un nuovo elemento PERSONA allТinterno dellТelemento DOCENTI:

<PERSONA>
<NOME>Antonio Vivaldi</NOME>
<GRUPPO>Sistemi operativi</GRUPPO> 
<PUBBLICAZIONI>
<PUBBLICAZIONE>Confronto tra Linux e Windows NT(1998)
</PUBBLICAZIONE>
</PUBBLICAZIONI>
<CURRICULUM>Nato nel 1972 e laureato nel 1998. Collabora con 
il Prof. Grieg nel corso di Algoritmi per il controllo dei
segnali.</CURRICULUM>
</PERSONA>

ma l'elemento deve contenere quanto precisato nella DTD. Se, ad esempio il Dott. Vivaldi apparte-
nesse a due gruppi di ricerca:

<PERSONA>
<NOME>Antonio Vivaldi</NOME>
<GRUPPO>Sistemi operativi</GRUPPO>		NO! 
<GRUPPO>Reti Neurali</GRUPPO>
[...]
</PERSONA>

il documento non sarebbe pi∙ valido. Occorrerebbe la seguente modifica alla DTD, che consente di 
avere pi∙ di un elemento GRUPPO all'interno di PERSONA:

<!ELEMENT PERSONA (NOME,GRUPPO+,TITOLO?,PUBBLICAZIONI,CURRICULUM)>

╚ chiaro che elencare tutti gli elementi e gli attributi e analizzarne il contenuto, al fine di scrivere 
una DTD compatibile, puЄ diventare un lavoro lungo e difficile per documenti di grandi dimensioni. 
Una buona idea ш quella di partire da DTD molto УlargheФ, per poi renderle pi∙ ristrette ed aderenti 
al documento. Per il nostro esempio, ш giusta anche la definizione:

<!ELEMENT PERSONA (NOME|GRUPPO|TITOLO|PUBBLICAZIONI|CURRICULUM)*>

secondo cui PERSONA puЄ contenere un numero qualsiasi (eventualmente nessuno) di elementi 
NOME, GRUPPO, ecc. in un qualsiasi ordine. La semantica di questa definizione ш molto povera, pe-
rЄ ш un buon punto di partenza per evitare errori ed ottenere in seguito una DTD pi∙ aderente al do-
cumento.

4.6	Spazi dei nomi

Il linguaggio XML consente di assegnare nomi personalizzati ad elementi, attributi, entitр, ecc. col 
vantaggio di una grande flessibiltр, ma con il rischio di generare confusione, utilizzando in diversi 
documenti di una stessa organizzazione elementi con lo stesso nome e significati diversi. 
La soluzione a questo problema ш offerta dagli spazi dei nomi XML, che sono УraccolteФ di nomi 
identificate univocamente da un URI (Uniform Resorce Identifier). In XML un URI puЄ essere:

? un URL (Uniform Resource Locator), che ш un usuale Уindirizzo InternetФ ;
? un URN (Uniform Resource Name), che ш un particolare identificatore associato a ciascuna ri-
sorsa in Internet, giр discusso nel з 2.6.2.

La dichiarazione standard per uno spazio dei nomi segue la sintassi [23]:

<ELEMENTO xmlns=ФURIФ>Е</ELEMENTO>

In questo caso tutti gli elementi e gli attributi di ELEMENTO devono appartenere allo spazio dei 
nomi identificato da URI. Se ELEMENTO ш la radice del documento, tutto il documento apparterrр 
allo spazio dei nomi specificato. LТattributo xmlns ш una parola chiave di XML e puЄ essere usato 
solo per dichiarare gli spazi dei nomi.
Vediamo un esempio [24]:

<Schema xmlns="urn:schemas-microsoft-com:xml-data">
  <ElementType name="rate" content="textOnly"/>
[Е]
</Schema>

In questo caso lТelemento Schema e tutti gli elementi ed attributi al suo interno appartengono allo 
spazio dei nomi urn:schemas-microsoft-com:xml-data, relativo a XML-Data, 
unТapplicazione XML che tratteremo nel prossimo paragrafo.
Se il software che elabora il documento XML ш in grado di:

? riconoscere gli spazi dei nomi dichiarati nel documento stesso;
? verificare lТeffettiva appartenenza di elementi ed attributi agli spazi dei nomi dichiarati;

allora la DTD diventa superflua, poichщ le regole che il documento XML deve seguire sono giр de-
finite negli spazi dei nomi.
Gli spazi dei nomi possono essere dichiarati anche per mezzo di una dichiarazione esplicita, la cui 
sintassi ш [23]:

<ELEMENTO xmlns:prefisso=ФURIФ>Е</ELEMENTO>

In questo modo vengono dichiarati appartenenti allo spazio dei nomi identificato da URI solo gli 
elementi e gli attributi interni ad ELEMENTO il cui nome inizia con la stringa Уprefisso:Ф, che 
funge da identificatore dello spazio dei nomi. Questo tipo di dichiarazione ш particolarmente utile se 
si desidera far riferimento a pi∙ spazi dei nomi nello stesso documento.
Vediamo un esempio in cui viene considerato HTML come spazio dei nomi di XML:

<esempio xmlns:HTML="http://www.w3.org/TR/REC-html40">
<titolo>HTML allТinterno di XML</titolo> 
<logo>
<HTML:A href="javascript:alert('HTML come spazio dei nomi di XML')">
<HTML:IMG src="palloncini.gif" height="50" width="200" /> 
</HTML:A>
</logo>
</esempio>

Solo gli elementi il cui nome ш preceduto dalla stringa УHTML:Ф appartengono allo spazio dei nomi 
HTML. Utilizzare i tag di HTML in un documento XML puЄ rivelarsi utile per incorporare nel do-
cumento elementi di formattazione di HTML, che il foglio di stile potrр lasciare inalterati o affinare 
ulteriormente. Chiaramente questo ш possibile solo se il software supporta anche il linguaggio 
HTML. Nel nostro esempio HTML ш usato per gestire un file grafico ed un brevissimo script, in 
maniera sicuramente pi∙ pratica rispetto allТutilizzo delle entitр esterne (si noti che non serve la 
DTD). ╚ importante che il codice HTML inserito rispetti i vincoli sintattici di XML descritti nel 
з 3.2.2. 

4.7	UnТalternativa alla DTD: lo schema XML-Data

4.7.1  Difetti della DTD

La DTD rappresenta la struttura del documento XML e descrive le regole osservate dai dati conte-
nuti in esso [19]. Tuttavia essa presenta alcuni difetti:

1) la sua sintassi deriva da SGML ed ш piuttosto complicata;
2) non prevede  tipi di dati diversi dalle stringhe, come dati numerici, booleani, ecc.;
3) non si adatta allТinterscambio con i formati di dati pi∙ recenti, poichщ quando fu ideato SGML 
tali formati non esistevano;
4) ammette come unico strumento di semplificazione le entitр paramentro, poco flessibili e difficili 
da gestire.

Per questo motivo alcune importanti organizzazioni, tra le quali Microsoft, Data Channel e Univer-
sitр di Edimburgo, hanno ideato XML-Data, unТapplicazione di XML che ha le stesse funzioni di 
base della DTD, ma supera i suoi limiti.

4.7.2  Uso dello schema

In XML-Data, la DTD viene sostituita dallo schema, che ш a sua volta un documento XML ben 
formato, con la seguente struttura [24]:

<?xml version=Ф1.0Ф ?>
<Schema xmlns="urn:schemas-microsoft-com:xml-data">
[Dichiarazioni di elementi e attributi]
</Schema>

Supponiamo che questo schema sia il contenuto del file Уschema.xmlФ. Per associare un docu-
mento XML ad esso si usa la seguente dichiarazione [23]:

<PROVA xmlns="x-schema:schema.xml">...</PROVA> 

In questo modo lТelemento PROVA e tutto il suo contenuto devono rispettare lo schema del file 
Уschema.xmlФ. Non ш indispensabile che lТelemento PROVA sia la radice del documento, visto 
che si utilizza una dichiarazione di appartenza ad uno spazio di nomi, che puЄ trovarsi in qualsiasi 
parte del documento. Inoltre, utilizzando una dichiarazione esplicita come questa:

<PROVA sch:xmlns="x-schema:schema2.xml">...</PROVA>

sono solo gli elementi: 

? figli di PROVA; 
? il cui nome contiene il prefisso Уsch:Ф

a dover rispettare lo schema del file Уschema2.xmlФ. ╚ evidente che un documento XML puЄ far 
riferimento ad un numero qualsiasi di schemi, ciascuno dei quali stabilirр le regole per una certa 
parte del documento stesso.

4.7.3  Dichiarazione degli elementi

Gli elementi vengono dichiarati nello schema con la sintassi:

<ElementType name=ФNOMEФ content=ФcontenutoФ>Е</ElementType>

dove:

? NOME ш il nome dellТelemento dichiarato;
? contenuto puЄ assumere i seguenti valori:
? УemptyФ se lТelemento ш vuoto,
? УtextOnlyФ se lТelemento deve contenere solo testo,
? УeltOnlyФ se lТelemento deve contenere solo sottoelementi,
? УmixedФ se lТelemento puЄ contenere sia testo che sottoelementi.

Se contenuto vale УeltOnlyФ o УmixedФ, NOME deve avere degli elementi figli, i quali ven-
gono specificati come contenuto di ElementType utilizzando la sintassi:

	<element type=Фnome_figlioФ/>

dove nome_figlio ш il nome di un elemento dichiarato altrove nello schema, che diventa figlio 
dellТelemento NOME. Oltre allТattributo type possono comparire i seguenti attributi opzionali:

? minOccurs, che indica il numero minimo di elementi nome_figlio allТinterno di NOME; 
? maxOccurs, che indica il numero massimo di elementi nome_figlio allТinterno di NOME.

Entrambi possono assumere come valore un qualsiasi numero intero, oppure il simbolo У*Ф, che ha 
il significato di Уnumero qualsiasiФ. Se questi attributi non sono specificati assumono entrambi il 
valore di default У1Ф. 
Questa trattazione non esaurisce le possibili dichiarazioni di elementi previste da XML-Data, per le 
quali si rimanda a [19], ma ш sufficiente a realizzare lo schema per il documento XML ben formato 
del з 3.9: 

<?xml version="1.0"?>
<Schema xmlns="urn:schemas-microsoft-com:xml-data">
  <ElementType name="DOCENTI" content="eltOnly">
	<element type="PERSONA" maxOccurs="*"/>
  </ElementType>
  <ElementType name="PERSONA" content="eltOnly">
	<element type="NOME"/>
	<element type="GRUPPO"/>
	<element type="TITOLO" minOccurs="0"/>
	<element type="PUBBLICAZIONI"/>
	<element type="CURRICULUM"/>
  </ElementType>
  <ElementType name="NOME" content="textOnly"/>
  <ElementType name="TITOLO" content="textOnly"/>
  <ElementType name="GRUPPO" content="textOnly"/>
  <ElementType name="CURRICULUM" content="textOnly"/>
  <ElementType name="PUBBLICAZIONI" content="eltOnly">
	<element type="PUBBLICAZIONE" maxOccurs="*"/>
  </ElementType>
  <ElementType name="PUBBLICAZIONE" content="textOnly"/>
</Schema>

Questo schema sostituisce totalmente la DTD del з 4.5, ad eccezione della dichiarazione dellТentitр 
per il carattere УшФ, in quanto XML-Data non supporta le entitр. 
Se lo schema viene salvato nel file Уschema_dipartimento.xmlФ, lТunica modifica necessa-
ria al documento ш la sostituzione del tag di apertura dellТelemento radice <DOCENTI> con:

<DOCENTI xmlns="x-schema:schema_dipartimento.xml"> 

Pur essendo conforme allo schema, il documento non risulta valido, poichщ secondo le specifiche di 
XML 1.0, un documento ш valido solo se rispetta una DTD.

4.7.4  Dichiarazione degli attributi

La dichiarazione degli attributi ш analoga a quella degli elementi. Segue la sintassi:

<AttributeType name=ФATTRIBUTOФ/>

dove ATTRIBUTO ш il nome dellТattributo. Diversamente dalla DTD, gli attributi vengono dichia-
rati indipendentemente dagli elementi. LТassegnazione di un attributo ad un elemento avviene in 
questo modo:

<ElementType name=ФNOMEФ content=ФcontenutoФ>
<attribute type=ФATTRIBUTOФ/>
[Eventuali riferimenti ad altri attributi ed elementi]
</ElementType>	

Cosь abbiamo assegnato ATTRIBUTO allТelemento NOME.
Sia AttributeType che attribute possono avere i seguenti attributi:

? default, che ш il valore assegnato allТattributo se questo non compare nel documento;
? required, che vale УyesФ se lТattributo ш obbligatorio.

Vediamo attraverso alcuni esempi la differenza fra le due possibili collocazioni di questi attributi. 
Se abbiamo:

<AttributeType name=ФEMAILФ required=ФyesФ/>

LТattributo EMAIL ш obbligatorio per tutti gli elementi del documento che lo prevedono. Viceversa, 
se required compare in attribute, anzichщ in AttributeType:

<ElementType name=ФPERSONAФ content=ФtextOnlyФ>
<attribute type=ФEMAILФ required=ФyesФ/>
</ElementType>	

lТattributo EMAIL ш obbligatorio solo per lТelemento PERSONA.
Altre caratteristiche degli attributi possono essere definite utilizzando lo spazio dei nomi datatypes, 
che tratteremo nel capitolo 6, insieme a XML-Data. 

4.8	Conclusioni

Per descrivere la struttura di un documento XML ш meglio utilizzare la DTD o lo schema di XML-
Data? La risposta non ш scontata. Gli schemi sono pi∙ potenti e flessibili delle DTD, ma non sono 
ancora uno standard approvato dal W3C, a differenza delle DTD, che sono parte integrante della 
specifica di XML 1.0. DТaltra parte, XML-Data ш unТapplicazione ideata dalla Microsoft e suppor-
tata dal suo browser Explorer 5, quindi la sua diffusione potrebbe spingere il W3C verso una rapida 
approvazione, come ш giр accaduto in passato con le estensioni di HTML.
Pertanto, se si prevede di utilizzare software della Microsoft o di altre aziende in grado di supporta-
re XML-Data, ш sicuramente preferibile ricorrere agli schemi, mentre in caso contrario ш meglio af-
fidarsi alle УtradizionaliФ DTD, riconosciute da tutti i software in grado di elaborare XML.

5  EXTENSIBLE STYLESHEET LANGUAGE (XSL)

5.1	Associazione di tag HTML agli elementi XML

XSL ш unТapplicazione XML che puЄ essere usata per manipolare, ordinare e filtrare i dati di un do-
cumento XML [25]. I risultati di queste trasformazioni possono essere:

1) documenti HTML visualizzabili da un browser;
2) nuovi documenti XML.

Affinchщ un documento XML abbia una visualizzazione analoga a quella di HTML, XSL consente 
di utilizzare tutti i tag di HTML 4.0, seguendo perЄ anche per essi le restrizioni sintattiche di XML 
esposte nel з 3.2.2. 
Vediamo un semplicissimo esempio di foglio di stile XSL [19]:

<?xml version="1.0" ?> 
<xsl:template xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<H1><xsl:value-of select="DOCENTI/PERSONA/NOME"/></H1>
	<H2><xsl:value-of select="DOCENTI/PERSONA/TITOLO"/></H2>
</xsl:template>

in esso compaiono due elementi XSL [36]:

1) xsl:template, che definisce un modello per lТoutput di una parte del documento;
2) xsl:value-of, che inserisce il valore della parte di documento selezionata dallТattributo 
select nellТoutput sottoforma di testo.

Nel tag di apertura di xsl:template viene dichiarato lo spazio dei nomi di XSL. ╚ indispensa-
bile la dichiarazione esplicita, poichщ nei documenti XSL si assume HTML come spazio dei nomi 
predefinito. Questa scelta permette di inserire i tag di HTML senza alcun prefisso, cosь come ab-
biamo fatto con <H1> ed <H2>.
AllТinterno dellТelemento H1 di HTML viene inserito il valore definito dal pattern di selezione 
DOCENTI/PERSONA/NOME. Analogamente, in <H2> viene inserito il valore identificato dal pat-
tern DOCENTI/PERSONA/TITOLO. Il significato dei pattern ш identico a quello dei percorsi 
(path) nelle directory di un disco: basta considerare lТalbero costituito dal documento XML al posto 
dellТalbero delle directory. Pertanto DOCENTI/PERSONA ш il sottoelemento PERSONA 
dellТelemento DOCENTI. 
In sostanza, il foglio di stile effettua le seguenti associazioni fra elementi XML individuati dai pro-
pri pattern e tag di HTML:

Il contenuto dellТelementoЕ

viene assegnato al tagЕ
DOCENTI/PERSONA/NOME	
?
H1
DOCENTI/PERSONA/TITOLO	
?
H2

Se nellТalbero esistono elementi con lo stesso nome e lo stesso percorso, viene selezionato il primo 
in ordine di apparizione nel documento. ╚ il caso del nostro esempio illustrato nel з 3.9, in cui 
lТelemento DOCENTI ha sei sottoelementi PERSONA. Il pattern DOCENTI/PERSONA seleziona il 
primo elemento PERSONA, cioш quello relativo al prof. Gianni Brahms, dal quale vengono estratti i 
valori dei due sottoelementi NOME e TITOLO.
Salvando il nostro foglio di stile con il nome di Уdipartimento.xslФ e aggiungendo al docu-
mento XML del з 3.9, preferibilmente dopo il prologo e prima dellТelemento radice, lТistruzione di 
elaborazione:

<?xml-stylesheet type="text/xsl" href="dipartimento.xsl"?>

si ottiene il seguente output:


che ш lo stesso di questo documento HTML:

<H1>Gianni Brahms</H1>
<H2>Professore Ordinario</H2>

Un foglio di stile XSL puЄ essere usato da un numero qualsiasi di documenti, per questo motivo al 
suo interno non si trovano riferimenti ai file XML che esso deve trasformare.

5.2	Visualizzazione di pi∙ elementi con lo stesso nome

Per assegnare un tag HTML a tutti gli elementi XML corrispondenti ad un determinato pattern, oc-
corre utilizzare lТelemento xsl:for-each [19]. Anche esso ш dotato di un attributo select, il 
cui valore deve essere uguale al pattern ripetuto, che nel nostro caso ш DOCENTI/PERSONA. A tal 
proposito applichiamo questТaltro foglio di stile al nostro documento:

<?xml version="1.0" ?> 
<xsl:template xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<xsl:for-each select="DOCENTI/PERSONA">
		<B><FONT SIZE="5">
<xsl:value-of select="NOME"/>
</FONT><FONT SIZE="4">
(<xsl:value-of select="GRUPPO"/>)
</FONT></B><P></P>
	</xsl:for-each>
</xsl:template>

LТoutput che si ottiene ш:

Gianni Brahms (Intelligenza Artificiale) 

Ermanno Grieg (Reti Neurali)
 
Federico Mendelzon (Visione delle macchine)
 
Riccardo Strauss (Basi di Dati) 

Giuseppe Verdi (Basi di Dati) 

Sebastiano Bach (Ricerca Operativa) 


Il valore dellТattributo select del primo elemento xsl:value-of ш semplicemente УNOMEФ, 
anzichщ lТintero pattern. Questo perchщ  xsl:for-each ha spostato il contesto di applicazione 
degli elementi XSL dalla radice (DOCENTI) agli elementi PERSONA, ciascuno dei quali ha NOME 
come figlio. Scrivere УDOCENTI/PERSONA/NOMEФ al posto di УNOMEФ avrebbe fatto scomparire 
tutti i nomi dei docenti, poichщ il foglio di stile sarebbe andato a cercare gli elementi DOCENTI/ 
PERSONA/DOCENTI/PERSONA/NOME, che non esistono. Pertanto, ogni volta che si utilizza un 
elemento XSL, occorre prestare attenzione al contesto di applicazione.
Si noti, infine, che le parentesi che racchiudono i valori di GRUPPO sono scritte esplicitamente nel 
foglio di stile.

5.3	Visualizzazione dei valori degli attributi

Se vogliamo visualizzare il valore di un attributo associato ad un elemento, dobbiamo utilizzare 
lТoperatore У@Ф allТinterno del pattern, in questo modo [25]:

	<xsl:value-of select=ФPATTERN/@ATTRIBUTOФ/>

dove PATTERN ш il percorso associato allТelemento ed ATTRIBUTO ш il nome dellТattributo.
Consideriamo, ad esempio, questo breve documento XML:

<?xml version="1.0" ?> 
<?xml-stylesheet type="text/xsl" href="studenti.xsl"?>
<STUDENTI>
	<STUDENTE Matricola="200768">Verdi Fabio</STUDENTE>
	<STUDENTE Matricola="937653">Rossi Luca</STUDENTE>
	<STUDENTE Matricola="485745">Neri Anna</STUDENTE>
</STUDENTI>

Il foglio di stile per visualizzare sia i nomi che le matricole degli studenti ш il seguente:

<?xml version="1.0" ?> 
<xsl:template xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<xsl:for-each select="STUDENTI/STUDENTE">
		<DIV>Studente: <B><xsl:value-of/></B></DIV>
		Matricola: <B><xsl:value-of select="@Matricola"/></B>
		<P></P>
	</xsl:for-each>
</xsl:template>

da cui si ottiene il seguente output:

Studente: Verdi Fabio
Matricola: 200768 

Studente: Rossi Luca
Matricola: 937653 

Studente: Neri Anna
Matricola: 485745


Si noti come lТelemento xsl:for-each sposti il contesto dalla radice ai tre elementi 
STUDENTE, che contengono le informazioni da visualizzare. In questo caso il pattern da inserire 
negli elementi xsl:value-of ш nullo e pertanto:

? nellТelemento xsl:value-of relativo a STUDENTE bisogna eliminare lТattributo select;
? nellТelemento xsl:value-of relativo allТattributo Matricola, il pattern ш semplicemente 
У@MatricolaФ, che individua lТattributo Matricola dellТelemento corrispondente al conte-
sto corrente.

5.4	Fogli di stile contenenti pi∙ modelli

Il linguaggio XSL puЄ definire diversi modelli di rappresentazione da applicare indipendentemente 
alle diverse sezioni del documento XML [19]. In questo caso, ciascun modello ш contenuto 
allТinterno di un elemento xsl:template e lТelemento radice del documento XSL diventa 
xsl:stylesheet, nel quale viene dichiarato lo spazio dei nomi XSL. 
La parte del documento alla quale applicare il modello definito allТinterno di xsl:template ш 
identificata da un pattern di uguaglianza, che ш il valore dellТattributo match [26]. 
Il modello da applicare a tutto documento deve avere come pattern di uguaglianza il simbolo У/Ф, 
che rappresenta lТintero documento ed ha come УfiglioФ lТelemento radice del documento. CiЄ signi-
fica che, se DOCENTI ш la radice del documento, i due pattern У/DOCENTIФ e УDOCENTIФ sono 
equivalenti.
Gli altri modelli vengono richiamati attraverso lТelemento xsl:apply-templates, ma vengo-
no applicati solo se viene trovato il loro pattern di uguaglianza a partire dal contesto corrente. 
LТelemento xsl:apply-templates puЄ trovarsi allТinterno di qualsiasi modello.
Questo meccanismo ш pi∙ difficile da descrivere che da applicare. Vediamo quindi un foglio di stile 
con pi∙ modelli per il documento del з 3.9:

<?xml version="1.0" ?> 
<xsl:stylesheet xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<xsl:template match="/">
		<xsl:apply-templates/>
	</xsl:template>
	<xsl:template match="DOCENTI">
		<xsl:for-each select="PERSONA">
			<TABLE BORDER="2"><TR><TD></TD><TD><B>
			<xsl:value-of select="NOME"/>
			<SMALL><I><xsl:value-of select="TITOLO"/>
</I></SMALL></B></TD></TR>
<xsl:apply-templates/></TABLE><P></P>
		</xsl:for-each>
	</xsl:template>
	<xsl:template match="GRUPPO">
		<TR><TD>Gruppo di ricerca:</TD>
		<TD><xsl:value-of/></TD></TR>
	</xsl:template>
	<xsl:template match="CURRICULUM">
		<TR><TD>Curriculum vitae:</TD>
		<TD><xsl:value-of/></TD></TR>
	</xsl:template>
	<xsl:template match="PUBBLICAZIONI">
		<TR><TD>Pubblicazioni:</TD>
		<TD><xsl:for-each select="PUBBLICAZIONE">
			<DIV><xsl:value-of/></DIV>
		</xsl:for-each></TD></TR>
	</xsl:template>
</xsl:stylesheet>

I modelli presenti in questo documento sono cinque:

? il primo ш applicato allТintero documento e si limita a richiamare gli altri modelli;
? il secondo ш applicato allТelemento radice DOCENTI e si occupa di:
? visualizzare il contenuto degli elementi NOME e TITOLO,
? richiamare gli altri modelli;
? gli altri tre modelli visualizzano il contenuto, rispettivamente, degli elementi GRUPPO, 
CURRICULUM e  PUBBLICAZIONI.

LТoutput che si ottiene ш il seguente:


Si noti che il contenuto dellТelemento CURRICULUM viene visualizzato dopo quello dellТelemento 
PUBBLICAZIONI, nonostante lТordine dei modelli nel foglio di stile. Questo perchщ lТelemento 
xsl:apply-templates segue lТordine del documento XML quando confronta i nomi dei pat-
tern incontrati con il valore del suo attributo match. Nel documento, infatti, compaiono prima 
lТelemento PUBBLICAZIONI e poi lТelemento CURRICULUM (vedi з 3.9). 
Comunque ш possibile scegliere quale modello applicare aggiungendo lТattributo select, giр visto 
per xsl:for-each, allТelemento xsl:apply-templates. Per far comparire il curriculum 
prima delle pubblicazioni, basta sostituire questi tre elementi:

<xsl:apply-templates select="GRUPPO"/>
<xsl:apply-templates select="CURRICULUM"/>
<xsl:apply-templates select="PUBBLICAZIONI"/>

allТunico xsl:apply-templates del modello associato a DOCENTI.

5.5	Visualizzazione dei nomi di elementi ed attributi. Carattere 
jolly

XSL ci consente di visualizzare qualsiasi parte del documento XML, utilizzando un linguaggio di 
script ed il modello ad oggetti DOM (Document Object Model) [47]. Il DOM ш unТinterfaccia indi-
pendente da piattaforme e linguaggi che permette a programmi e script di accedere dinamicamente 
ai documenti HTML ed XML ed aggiornarne il contenuto, la struttura e lo stile. Non entriamo nei 
dettagli di questo modello, ma ci limitiamo ad introdurre la proprietр nodeName, che restituisce il 
nome dellТelemento o dellТattributo corrispondente al contesto corrente. ╚ chiamata cosь perchщ il 
DOM considera elementi, attributi, entitр, commenti, ecc. come nodi dellТalbero associato al docu-
mento XML.
Per supportare gli script, la Microsoft ha introdotto due elementi aggiuntivi ad XSL [36]. Essi sono 
[19]: 

? xsl:script: contiene gli script che verranno richiamati allТinterno del foglio di stile. 
? xsl:eval: valuta lo script al suo interno.

Fatte queste premesse, consideriamo il seguente foglio di stile, da abbinare al documento del з 3.9:

<?xml version="1.0" ?> 
<xsl:stylesheet xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<xsl:template match="/">
		<TABLE BORDER="3"><xsl:apply-templates/></TABLE>
	</xsl:template>
	<xsl:template match="*">
		<TR><TH><xsl:eval>nodeName;</xsl:eval></TH></TR>
		<xsl:for-each select="PERSONA">
			<TR><TD><xsl:value-of select="*"/>
			<SMALL><I>
<xsl:value-of select="TITOLO"/>
</I></SMALL></TD></TR>
		</xsl:for-each>
	</xsl:template>
</xsl:stylesheet>

Il titolo della tabella, contenuto allТinterno del tag <TH> di HTML, ш posto uguale al nome 
dellТelemento radice, identificato con il carattere jolly У*Ф, anzichщ con il suo nome. Torneremo sul 
carattere jolly e sugli operatori consentiti allТinterno dei pattern nel з 6.3. LТoutput che si ottiene ш:


Il carattere jolly У*Ф rappresenta il primo sottoelemento disponibile, qualsiasi nome abbia. Chiara-
mente, il primo sottoelemento di У/Ф, che rappresenta lТintero documento XML, ш proprio 
lТelemento radice DOCENTI. Inoltre abbiamo usato il carattere jolly anche al posto di NOME, che ш 
il primo sottoelemento di PERSONA.
N.B. In Explorer 5, lo stesso risultato di:

<xsl:eval>nodeName;</xsl:eval>

si puЄ ottenere con lТelemento [19]:

<xsl:node-name/>

Tuttavia, anche questo elemento ш unТaggiunta della Microsoft e non compare nella bozza di lavoro 
del W3C [26]. Stranamente, tale elemento non viene citato nemmeno nella guida di XSL della Mi-
crosoft, sebbene utilizzato in alcuni esempi allТinterno di questa [36].

5.6	Costruzione di un foglio di stile

Pur avendo esaminato solo una parte degli elementi di XSL, abbiamo giр gli strumenti necessari per 
introdurre i dati di un documento XML in una Уpagina WebФ. Possiamo cosь concludere il lavoro 
sul documento XML introdotto nel з 3.9, fornendo ad esso un foglio di stile XSL che lo visualizzi 
in maniera simile al documento HTML dal quale lo avevamo convertito.
╚ importante reinserire nel foglio di stile tutti quelle parti del documento HTML che avevamo sop-
presso nella conversione allТXML. In questo modo viene realizzata una delle caratteristiche pi∙ im-
portanti di XML, cioш la separazione fra:

? i dati del documento, descritti formalmente dalla DTD e dalla struttura ad albero imposta da 
XML; 
? la presentazione del documento, costituita da un foglio di stile XSL formato da elementi che 
stabiliscono le relazioni con il documento XML e tag di HTML. Nel foglio di stile devono com-
parire anche quelle parti di testo che rendono pi∙ leggibili i dati, ma che non fanno parte di essi.

Ecco un foglio di stile per il УnostroФ documento XML che si avvicina al documento HTML dal 
quale eravamo partiti:

<?xml version="1.0" ?>
<HTML xmlns:xsl="http://www.w3.org/TR/WD-xsl">
<HEAD><TITLE>
Universit&#224; di QualchePosto - Docenti del dipartimento di Informatica 
</TITLE></HEAD>
<BODY>
<FONT COLOR="#0000ff">
<H1 ALIGN="CENTER">Universit&#224; degli studi di QualchePosto</H1>
<H2 ALIGN="CENTER">Dipartimento di Informatica</H2>
</FONT>
<I><FONT COLOR="#ff00ff"><H3 ALIGN="CENTER">Elenco dei docenti</H3></FONT></I>
<DIV STYLE="font-family:Times, helvetica, sans-serif; background-color:#EEEEEE">
  <xsl:for-each select="DOCENTI/PERSONA"> 
	<DIV STYLE="background-color:red; color:white; padding:4px">
   	<B COLOR="WHITE"><xsl:value-of select="NOME"/></B>:
   	<xsl:value-of select="TITOLO"/>
</DIV>
	<DIV STYLE="margin-left:15px;">
  	Gruppo di ricerca: <I><xsl:value-of select="GRUPPO"/></I>
</DIV>
	<P STYLE="margin-left:15px;">
 	Curriculum vitae: <xsl:value-of select="CURRICULUM"/>
</P>
	<P STYLE="margin-left:15px;">Elenco pubblicazioni:<UL>
	<xsl:for-each select="PUBBLICAZIONI/PUBBLICAZIONE">
		<LI><xsl:value-of/></LI>
	</xsl:for-each>
	</UL></P>
  </xsl:for-each>
</DIV>
</BODY>
</HTML>

La visualizzazione che si ottiene ш la seguente:


Per migliorare la presentazione della pagina, abbiamo aggiunto ad alcuni tag di HTML lТattributo 
STYLE, che ci consente di assegnare ai singoli tag gli attributi di formattazione di CSS (vedi 
з 2.1.2). Questa tecnica ш detta CSS in linea ed ш uno dei metodi forniti da HTML 4.0 per imple-
mentare i fogli di stile CSS [27]. ╚ possibile utilizzarla allТinterno di un documento XSL, poichщ in 
esso si puЄ inserire tutto ciЄ che puЄ trovarsi in un documento HTML, come fogli di stile CSS, ap-
plet Java, script vari, ecc.
In generale, la stesura di un foglio di stile XSL si puЄ riassumere in questi punti:

1) associazione delle parti del documento XML che si vuole visualizzare a semplici tag di HTML 
(<P>, <B>, <DIV>, ecc.), attraverso gli elementi XSL;
2) aggiunta di testo che spieghi il significato dei dati (titoli, commenti, ecc.);
3) affinamento della visualizzazione ottenuta per mezzo dei tag di HTML dedicati alla formatta-
zione (<FONT>, <TABLE>, <STYLE>, ecc);
4) inserimento di eventuali immagini ed elementi multimediali.

Si noti che gli elementi di XSL servono solo per il punto 1). Per le altre operazioni ш sufficiente co-
noscere HTML ed eventualmente anche Javascript o DHTML, nel caso si voglia realizzare una pa-
gina Web sofisticata.
Quanto abbiamo visto finora ш una piccola parte delle potenzialitр di XSL. Esso ш capace anche di:

? trasformare un documento XML in un altro documento XML, come vedremo nel з 5.8;
? effettuare filtraggi, ordinamenti ed interrogazioni sui dati di un documento XML. Di questo ci 
occuperemo ampiamente nel prossimo capitolo.

5.7	Isole di dati XML

Internet Explorer 5 consente lТelaborazione dei documenti XML per mezzo delle isole di dati XML 
[19]. Grazie alle isole di dati, ш possibile introdurre interi documenti XML direttamente allТinterno 
di una pagina HTML. LТisola di dati XML ш contenuta allТinterno dellТelemento <XML>, e puЄ es-
sere identificata tramite il valore dellТattributo ID:

	<XML ID=ФNomeФ>Documento_XML</XML>

Vediamo un esempio:

<HTML>
<HEAD><TITLE>XML all'interno di HTML</TITLE></HEAD>
<BODY>
<XML ID="Studenti">
<?xml version="1.0" ?> 
<STUDENTI>
	<STUDENTE Matricola="200768">Verdi Fabio</STUDENTE>
	<STUDENTE Matricola="937653">Rossi Luca</STUDENTE>
	<STUDENTE Matricola="485745">Neri Anna</STUDENTE>
</STUDENTI>
</XML>
</BODY>
</HTML>

In alternativa, lТisola di dati puЄ contenere un documento XML esterno, il cui indirizzo ш specificato 
dallТattributo SRC:

<HTML>
<HEAD>
<TITLE>XML all'interno di HTML</TITLE>
</HEAD>
<BODY>
<XML ID="Dipartimento" SRC="dipartimentobf.xml"></XML>
</BODY>
</HTML>

Caricando con il browser i due precedenti documenti HTML, si ottengono due pagine vuote, poichщ 
non ш specificato quali dati dellТisola debbano essere mostrati. Explorer 5 consente di visualizzare 
ed elaborare il contenuto di unТisola XML utilizzando il modello ad oggetti DOM insieme ad un 
linguaggio di script [25]. Mostriamo un documento HTML che [26]: 

? carica un documento XML nellТisola di dati source;
? carica un foglio di stile XSL nellТisola di dati style;
? visualizza il documento XML attraverso il foglio di stile XSL:

<HTML>
<XML id=source src="dipartimento.xml"></XML>
<XML id=style src="dipartimento.xsl"></XML>
<SCRIPT event=onload for=window>
    xslTarget.innerHTML = source.transformNode(style.XMLDocument);
</SCRIPT>
<BODY><SPAN id=xslTarget></SPAN></BODY>
</HTML>

Se Уdipartimento.xmlФ ш il documento XML del з 3.9 e Уdipartimento.xslФ ш il foglio 
di stile del paragrafo precedente, il documento HTML ci dр lo stesso output prodotto dal documento 
XML visualizzato con il foglio di stile. LТunica eccezione ш il titolo della pagina HTML, che resta 
indefinito e non diventa quello specificato nel documento XSL. Per risolvere questo piccolo incon-
veniente, inseriamo la seguente modifica:

<HTML>
<XML id=source src="dipartimento.xml"></XML>
<XML id=style src="dipartimento.xsl"></XML>
<SCRIPT event=onload for=window>
   document.write(source.transformNode(style.XMLDocument));
</SCRIPT>
</HTML>

Tale sistema presenta anche un altro vantaggio: se chiediamo al browser di mostrarci il codice sor-
gente del documento, non otteniamo le righe scritte qui sopra, bensь questo listato:

<HTML xmlns:xsl="http://www.w3.org/TR/WD-xsl">
[Е]
<DIV STYLE="font-family:Times, helvetica, sans-serif; background-
color:#EEEEEE">
<DIV STYLE="background-color:red; color:white; padding:4px">
<B COLOR="WHITE">Gianni Brahms</B>:
   	Professore Ordinario</DIV>
<DIV STYLE="margin-left:15px;">
  	Gruppo di ricerca: <I>Intelligenza Artificiale</I></DIV>
<P STYLE="margin-left:15px;">
 	Curriculum vitae: Nato nel 1936 e laureato nel 1961. Dal 1974 
ш titolare della cattedra di Intelligenza Artificiale. Dirige il 
Dipartimento dal 1996.</P>
[Е]

che ш il documento HTML ottenuto dallТapplicazione del foglio di stile XSL al documento XML. 
Tale risultato ш particolarmente utile per visualizzare ed archiviare i risultati delle trasformazioni di 
documenti XML in altri documenti XML che XSL ш in grado di effettuare. QuestТaspetto sarр trat-
tato nel prossimo paragrafo. 

5.8	Trasformazione di documenti XML attraverso XSL

5.8.1  Estrazione di un sottoalbero da un documento XML

Il linguaggio XSL mette a disposizione un insieme di elementi in grado di operare trasformazioni 
sui documenti XML. Tra questi il pi∙ semplice ш xsl:copy, che include una copia del nodo speci-
ficato dallТattributo select nel documento destinazione [19].
Il foglio di stile che presentiamo estrae il terzo elemento PERSONA con tutto il suo contenuto dal 
documento del з 3.9 [25]:

<?xml version="1.0" ?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/TR/WD-xsl">
    <xsl:template match="/">
		<xsl:apply-templates select="DOCENTI/PERSONA[2]">
              <xsl:template>
                <xsl:copy>
                  <xsl:apply-templates select="@* | * | text()"/>
                </xsl:copy>
              </xsl:template>
      	</xsl:apply-templates>
    </xsl:template>
</xsl:stylesheet>

Questo foglio di stile funziona grazie allТapplicazione ricorsiva dei modelli XSL. In particolare:

1) Il modello applicato a tutto il documento seleziona il terzo elemento PERSONA allТinterno di 
DOCENTI, grazie al pattern УDOCENTI/PERSONA[2]Ф, ed applica ad esso gli altri modelli. 
Se in un documento ci sono pi∙ elementi consecutivi con lo stesso nome, XSL permette di sele-
zionare lТn-esimo di questi mediante il pattern:

NOME[n-1]

2) LТaltro modello copia il contenuto del nodo corrente e richiama se stesso, fino ad esaurire il 
contenuto dellТelemento PERSONA precedentemente selezionato. Il pattern di selezione cerca un 
elemento qualsiasi (*), un attributo qualsisi (@*), o un testo (text()). AllТinterno del pattern il 
simbolo У|Ф ha il significato logico di УoppureФ.

Il documento XML che si ottiene ш:

<PERSONA>
<NOME>
Federico Mendelzon
</NOME>
<GRUPPO>
Visione delle macchine
</GRUPPO>
<PUBBLICAZIONI>
<PUBBLICAZIONE>
Progetto di un software in grado di riconoscere i tombini (1999)
</PUBBLICAZIONE>
</PUBBLICAZIONI>
<CURRICULUM>
Nato nel 1971 e laureato nel 1998. Collabora con il prof. Brahms 
nel corso di Intelligenza artificiale.
</CURRICULUM>
</PERSONA>

5.8.2  Aggiunta di nuovi nodi ad un documento XML

Oltre ad estrarre parti di un documento XML, XSL ш in grado di aggiungere ad esso nuovi compo-
nenti, per mezzo degli elementi [26]:
 
? xsl:element: genera un elemento con il nome specificato dallТattributo name;
? xsl:attribute: genera un attributo con il nome specificato dallТattributo name;
? xsl:pi: genera unТistruzione di elaborazione con il nome specificato dallТattributo name;
? xsl:comment: genera un commento.

Vediamo, a tal proposito, il seguente foglio di stile:

<?xml version="1.0" ?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/TR/WD-xsl">
  <xsl:template match="/">
    <xsl:pi name="xml">
      <xsl attribute name="version">1.0</xsl:attribute>
    </xsl:pi>
    <xsl:element name="SCHEDA">
      <xsl:attribute name="Codice">D375K</xsl:attribute>
      <xsl:comment>
        Questa e' la terza scheda dell'archivio DOCENTI
      </xsl:comment>
      <xsl:apply-templates select="DOCENTI/PERSONA[2]">
        <xsl:template>
          <xsl:copy>
            <xsl:apply-templates select="@* | * | text()"/>
          </xsl:copy>
        </xsl:template>
      </xsl:apply-templates>
    </xsl:element>
  </xsl:template>
</xsl:stylesheet>

Il foglio di stile produce il documento XML dellТesempio precedente, con le seguenti aggiunte:

1) un elemento SCHEDA che contiene un attributo Codice e racchiude lТelemento PERSONA 
estratto dal documento di partenza;
2) la dichiarazione XML minima (vedi з 3.4.1)
3) un commento, contenuto allТinterno dellТelemento SCHEDA.

Il documento XML che risulta da queste trasformazioni ш, infatti:

<?xml version="1.0"?>
<SCHEDA Codice="D375K">
<!--Questa e' la terza scheda dell'archivio DOCENTI-->
<PERSONA>
<NOME>
Federico Mendelzon
</NOME>
[Е]
</PERSONA>
</SCHEDA>

5.9	Conclusioni

Il linguaggio XSL consente di visualizzare i documenti XML non solo tramite i tag di HTML, ma 
anche utilizzando gli oggetti di formattazione (Formatting Object). Questi sono descritti in dettaglio 
da una enorme bozza di lavoro del W3C [28]: 249 pagine, nelle quali non compare nemmeno un 
esempio. Viceversa, gli elementi di XSL visti finora, e che continueremo ad utilizzare nel prossimo 
capitolo, sono definiti nella specifica XSL Transformations [26].
Vediamo un semplice esempio nel quale viene richiamato un oggetto di formattazione, perceduto 
dal prefisso УfoФ [29]:

<xsl:template match="synopsis//emphasis">
<fo:inline-sequence font-weight="bold">
<xsl:apply-templates/>
</fo:inline-sequence>
</xsl:template>

Questo modello XSL si occupa di trovare tutti gli elementi emphasis allТinterno di synopsys e 
di formattarli in grassetto. LТoperatore У//Ф estende la ricerca non solo ai figli di synopsys, ma 
anche ad elementi pi∙ in profonditр.
SullТutilitр degli oggetti di formattazione si ш aperto un acceso dibattito nellТambiente degli svilup-
patori XML. In particolare, Michael Leventhal della Citec ha pubblicato una vera e propria 
Уdichiarazione di guerraФ ad XSL [30]. 
Il mio parere personale ш che le trasformazioni permesse da XSL siano molto utili e che la possibi-
litр di produrre un output HTML a partire da un documento XML sia sufficiente per la maggior 
parte delle applicazioni Web. Queste funzionalitр sono giр offerte da diversi software, primo fra 
tutti Explorer 5. Viceversa, gli oggetti di formattazione sono al momento supportati solo da un paio 
di programmi, che non permettono la visualizzazione diretta del documento formattato, ma lo con-
vertono in un file che deve essere successivamente letto con Acrobat [31]. Risulta evidente, pertan-
to, che gli oggetti di formattazione di XSL costituiscono un linguaggio molto complesso, che ha 
scarse possibilitр di affermarsi nel Web, almeno a breve termine.

6  GESTIONE DI UNA SEMPLICE BASE DI DATI 
CON XML

6.1	Spazio dei nomi datatypes

In questo capitolo tratteremo lТutilizzo del linguaggio XML come fonte di dati. In particolare ci oc-
cuperemo della rappresentazione in XML di una semplice base di dati, definendone lo schema e i 
tipi di dati contenuti in essa. Successivamente vedremo come XSL consenta di effettuare interroga-
zioni, ordinamenti e filtraggi anche piuttosto complessi sui dati contenuti nel documento XML. 
Chiuderemo con alcune considerazioni sullo stato attuale dello sviluppo di XSL.
Iniziamo dalla УtipizzazioneФ dei dati. Lo spazio dei nomi:

urn:schemas-microsoft-com:datatypes

permette di specificare il formato dei dati contenuti negli elementi e negli attributi [23]. Esso puЄ 
essere utilizzato insieme agli schemi di XML-Data in questo modo:

<Schema name="mio_schema"
        xmlns="urn:schemas-microsoft-com:xml-data"
        xmlns:dt="urn:schemas-microsoft-com:datatypes">
[Е]
</Schema>

AllТinterno dello schema, ci sono due possibilitр per specificare il tipo di dati di un elemento o di un 
attributo:

1) Usando lТattributo dt:type direttamente in ElementType o AttributeType, come in 
questo esempio:

<ElementType name="pagine" dt:type="int"/>

che definisce lТelemento pagine, il quale deve avere un numero intero (int) come contenuto.
2) Usando dt:type allТinterno dellТapposito elemento datatype, come in questТaltro esempio:

<ElementType name="pagine">
  <datatype dt:type="int" />
</ElementType>

equivalente al precedente.

LТaltro metodo per specificare i tipi di dati consiste nel dichiarare lo spazio dei nomi datatypes di-
rettamente nel documento XML [24]. Solitamente, per comoditр, viene associato ad esso il prefisso 
УdtФ:

<elemento xmlns:dt="urn:schemas-microsoft-com:datatypes"> 
[Е]
</elemento>

In questo caso, perЄ, ш possibile specificare solo i dati contenuti negli elementi, e non i valori degli 
attributi. La dichiarazione dello spazio dei nomi, che abbiamo appena visto, deve essere 
nellТelemento radice o, comunque, in un elemento che abbia come figli tutti gli elementi di cui vo-
gliamo specificare il contenuto. Questa dichiarazione ci consente di utilizzare lo spazio dei nomi 
datatypes anche in documenti ben formati, privi di schema o DTD.
La sintassi per specificare il contenuto dellТelemento NOME ш:

	<NOME dt:dt=ФtipoФ>Contenuto</NOME>

Contenuto deve essere un dato del tipo specificato da tipo. Chiaramente NOME non puЄ avere 
sottoelementi.
I tipi di dati disponibili sono i seguenti [32]:

tipo
Descrizione 
Esempio
string 
Stringa
Questa eТ una stringa.
bin.base64 
Blocco binario codificato in base 64
O
bin.hex 
Cifra esadecimale
E
boolean 
0 (equivale a УfalsoФ) o 1 (equivale a УveroФ)
1
char 
Carattere (stringa di un solo carattere)
X
date 
Data in formato ISO 8601
1999-06-24
dateTime 
Data e ora (opzionale) in formato ISO 8601
1999-06-24 T10:26:15.44
dateTime.tz 
Data e ora (opzionale) in formato ISO 8601, 
con indicazione opzionale del fuso orario
1999-06-24 T10:26:15+02:00
fixed.14.4 
Numero decimale, con un massimo di 14 
cifre intere e 4 decimali
12.0044
float 
Numero decimale in virgola mobile
1.7976931348623157E+308
int 
Numero intero
58502
number 
Numero (identico a УfloatФ)
3.14
time 
Ora in formato ISO 8601
06:15:31
time.tz 
Ora in formato ISO 8601, con indicazione 
opzionale del fuso orario
10:39:42.7571+02:00
i1 
Numero intero rappresentato in un byte
127
i2 
Numero intero rappresentato in 2 byte
-32768
i4 
Numero intero rappresentato in 4 byte
148343
r4 
Numero reale rappresentato in 4 byte
3.141592
r8 
Numero reale rappresentato in 8 byte 
(identico a УfloatФ e УnumberФ)
2.2250738585072014E-308
ui1 
Numero naturale rappresentato in un byte
255
ui2 
Numero naturale rappresentato in 2 byte
65535
ui4 
Numero naturale rappresentato in 4 byte
3000000000
uri 
Universal Resource Identifier (URI)
urn:schemas-microsoft-
com:datatypes
uuid 
Sequenza di cifre esadecimali, che possono 
essere separate da trattini
333C7BC4-460F-11D0-
BC04-0080C7055A83

Vediamo un esempio [1]:

<vestito xmlns:dt="urn:schemas-microsoft-com:datatypes">
[Е]
	<taglia dt:dt="ui1">42</taglia>  
</vestito>

La taglia di un vestito si puЄ rappresentare con un numero naturale di un solo byte. Abbiamo usato, 
pertanto, il tipo di dati corrispondente, che ш Уui1Ф.
 
6.1.1 Tipi di attributi negli schemi di XML-Data

Lo spazio dei nomi datatypes viene usato per definire i tipi di attributi allТinterno degli schemi di 
XML-Data. I valori degli attributi possono appartenere, oltre che ai tipi elencati nel paragrafo pre-
cedente, anche ai tipi di dati УprimitiviФ definiti da XML [19]. Rivediamo questi tipi di dati e come 
possono essere dichiarati allТinterno dellТelemento AttributeType:

Tipo primitivo
Dichiarazione allТinterno di AttributeType
CDATA
dt:type=ФstringФ
NMTOKEN
dt:type=ФnmtokenФ
NMTOKENS
dt:type=ФnmtokensФ
(valore1|valore2|Е)
dt:type=ФenumerationФ dt:values=Фvalore1 valore2 ЕФ
ENTITY
dt:type=ФentityФ
ENTITIES
dt:type=ФentitiesФ
ID
dt:type=ФidФ
IDREF
dt:type=ФidrefФ
IDREFS
dt:type=ФidrefsФ
NOTATION
dt:type=ФnotationФ

Questi tipi di dati sono stati illustrati nei зз 4.2 e 4.4. Vediamo, ad esempio, come si definisce un 
identificatore univoco argomento per lТelemento SEZIONE in XML-Data:

<Schema xmlns="urn:schemas-microsoft-com:xml-data"
	   xmlns:dt="urn:schemas-microsoft-com:datatypes">
<AttributeType name="argomento" dt:type="id" required="no"/>
<ElementType name="SEZIONE" content="mixed">
		<attribute type="argomento"/>
[Е]
</ElementType>
[Е]
</Schema>

6.2	Rappresentazione in XML di una semplice base di dati

6.2.1  Definizione dello schema 

Consideriamo una piccola base di dati contenente due tabelle [3]:

IMPIEGATO (Matricola, Nome, Cognome, Dipart, Ufficio, Stipendio)
DIPARTIMENTO (Nome, Indirizzo, Cittр)

Ogni tabella ш rappresentata del suo nome, seguito dallТelenco dei nomi delle sue colonne racchiuso 
fra parentesi. Sono sottolineate le chiavi primarie delle due tabelle. La chiave primaria ш un insie-
me di colonne, i cui dati sono in grado di identificare univocamente ciascuna riga della tabella. La 
tabella IMPIEGATO ha come chiave primaria la colonna Matricola, mentre la tabella 
DIPARTIMENTO ha come chiave primaria la colonna Nome.
I database consentono la definizione di chiavi primarie multiparte, costituite da pi∙ di una colonna 
[5]. Questa possibilitр ш prevista nella bozza di lavoro di XML-Data presentata al W3C, ma, al mo-
mento, non ш ancora implementata in Explorer 5 [33]. Per questo motivo ci limitiamo ad utilizzare 
colonne singole come chiavi, realizzandole per mezzo degli identificatori univoci di XML (vedi 
з 4.2.1).
Nella terminologia delle basi di dati, le righe della tabella sono chiamate tuple, mentre i nomi delle 
colonne sono detti attributi. Per evitare confusione con gli attributi di XML, continueremo a usare il 
termine generico Уnomi delle colonneФ. Fatte queste premesse, vediamo lo schema XML-Data che 
descrive la nostra base di dati:

<?xml version="1.0"?>
<Schema name="DataBase"
	   xmlns="urn:schemas-microsoft-com:xml-data"
   	   xmlns:dt="urn:schemas-microsoft-com:datatypes">
  <ElementType name="DATABASE" content="eltOnly">
	<element type="IMPIEGATI"/>
	<element type="DIPARTIMENTI"/>
  </ElementType>
  <ElementType name="IMPIEGATI" content="eltOnly">
	<element type="IMPIEGATO" maxOccurs="*"/>
  </ElementType>
  <AttributeType name="Matricola" dt:type="id" required="yes"/>
  <AttributeType name="Dipart" dt:type="idref" required="yes"/>
  <ElementType name="IMPIEGATO" content="eltOnly">
	<element type="Nome"/>
	<attribute type="Matricola"/>
	<element type="Cognome"/>
	<attribute type="Dipart"/>
	<element type="Ufficio"/>
	<element type="Stipendio"/>
  </ElementType>
  <ElementType name="Nome" content="textOnly"/>
  <ElementType name="Cognome" content="textOnly"/>
  <ElementType name="Ufficio" dt:type="ui1"/>
  <ElementType name="Stipendio" dt:type="r4"/>
  <ElementType name="DIPARTIMENTI" content="eltOnly">
	<element type="DIPARTIMENTO" maxOccurs="*"/>
  </ElementType>
  <AttributeType name="Nome" dt:type="id" required="yes"/>
  <ElementType name="DIPARTIMENTO" content="eltOnly">
	<attribute type="Nome"/>
	<element type="Indirizzo"/>
	<element type="Citta"/>
  </ElementType>
  <ElementType name="Indirizzo" content="textOnly"/>
  <ElementType name="Citta" content="textOnly"/>
</Schema>

Alcuni commenti:

? la tabella IMPIEGATI ш rappresentata dallТomonimo elemento e ciascuna sua tupla ш conte-
nuta in un elemento IMPIEGATO.
? La chiave primaria Matricola di IMPIEGATI ш realizzata con un identificatore univoco (at-
tributo di tipo УidФ).
? La colonna Dipart ш realizzata con un attributo di tipo УidrefФ, poichщ contiene riferimenti 
alle tuple della tabella DIPARTIMENTI, tramite le loro chiavi primarie.
? LТelemento Ufficio deve contenere un numero intero compreso tra 0 e 255 (dato di tipo 
Уui1Ф).
? LТelemento Stipendio deve contenere un numero reale rappresentato in 4 byte (dato di tipo 
Уr4Ф). 
? Gli elementi Nome e Cognome contengono stringhe di testo.
? La tabella DIPARTIMENTI ш rappresentata dallТomonimo elemento e ciascuna sua tupla ш 
contenuta in un elemento DIPARTIMENTO.
? La chiave primaria Nome di DIPARTIMENTI ш un identificatore univoco.
? Gli elementi Indirizzo e Citta contengono stringhe di testo. Ricordiamo che i nomi degli 
elementi XML non possono contenere lettere accentate, nщ apostrofi, dunque non possono esi-
stere in XML tag <Cittр> o <CittaТ>.

La bozza di lavoro di XML-Data prevede altre caratteristiche per gli schemi, non ancora imple-
mentate in Explorer 5, tra cui la possibilitр di definire la lunghezza massima di ciascuna stringa e di 
limitare entro un particolare intervallo i valori numerici. Non sappiamo se lo sviluppo di XML-Data 
sarр portato a termine, poichщ il W3C sta lavorando su un altro linguaggio per la definizione degli 
schemi, chiamato XML-Schema [34]. 
 
6.2.2 Definizione dello schema tramite una DTD 

Lo schema presentato nel paragrafo precedente equivale alla seguente DTD:

<!ELEMENT DATABASE (IMPIEGATI,DIPARTIMENTI)>
<!ELEMENT IMPIEGATI (IMPIEGATO+)>
<!ELEMENT IMPIEGATO (Nome,Cognome,Ufficio,Stipendio)>
<!ATTLIST IMPIEGATO Matricola ID #REQUIRED
                    Dipart IDREF #REQUIRED>
<!ELEMENT Nome (#PCDATA)>
<!ELEMENT Cognome (#PCDATA)>
<!ELEMENT Ufficio (#PCDATA)>
<!ATTLIST Ufficio xmlns:dt CDATA #FIXED "urn:schemas-microsoft-com:datatypes"
		  	dt:dt CDATA #FIXED "ui1">
<!ELEMENT Stipendio (#PCDATA)>
<!ATTLIST Stipendio xmlns:dt CDATA #FIXED "urn:schemas-microsoft-com:datatypes"
                    dt:dt CDATA #FIXED "r4">
<!ELEMENT DIPARTIMENTI (DIPARTIMENTO+)>
<!ELEMENT DIPARTIMENTO (Indirizzo,Citta)>
<!ATTLIST DIPARTIMENTO Nome ID #REQUIRED>
<!ELEMENT Indirizzo (#PCDATA)>
<!ELEMENT Citta (#PCDATA)>

Lo spazio dei nomi datatypes ш stato realizzato per essere richiamato dagli schemi di XML-Data, 
oppure da documenti XML privi di schema. Dunque il suo utilizzo con le DTD risulta difficoltoso. 
In particolare, lo spazio dei nomi deve essere dichiarato per ogni elemento di cui vogliamo specifi-
care il tipo di contenuto. Nel nostro caso gli elementi sono solo due: Ufficio e Stipendio, e le 
rispettive dichiarazioni sono evidenziate in giallo nel precedente listato; in generale, perЄ, questo 
sistema risulta scomodo. LТalternativa migliore consiste nel dichiarare lo spazio dei nomi e i tipi 
degli elementi direttamente nel documento, come abbiamo visto nel з 6.1 per i documenti privi di 
schema, eliminando cosь dalla DTD le righe evidenziate in giallo.
La scarsa compatibilitр con gli spazi dei nomi ш uno dei difetti principali delle DTD, e deriva dal 
fatto che le DTD sono nate con SGML, mentre gli spazi dei nomi sono una tecnologia molto pi∙ re-
cente [35]. ╚ evidente, pertanto, la necessitр di implementare un linguaggio per la definizione degli 
schemi pienamente compatibile con gli spazi dei nomi e che offra le potenzialitр dei moderni data-
base, altrimenti sarр impossibile realizzare delle vere basi di dati tramite XML. Vedremo se XML-
Data o XML-Schema riusciranno in questa difficile impresa.

6.2.3  Documento XML contenente i dati

Supponiamo che le tabelle definite precedentemente siano riempite da questi dati [3]:

IMPIEGATI
Matricola
Nome
Cognome
Dipart
Ufficio
Stipendio
RSSMRA
BNCCRL
VRDGSP
NREFRN
RSSCRL
LNZLRN
BRRPLA
FRNMRC
Mario
Carlo
Giuseppe
Franco
Carlo
Lorenzo
Paola
Marco
Rossi
Bianchi
Verdi
Neri
Rossi
Lanzi
Borroni
Franco
Amministrazione
Produzione
Amministrazione
Distribuzione
Direzione
Direzione
Amministrazione
Produzione
10
20
20
16
14
7
75
20
45
36
40
45
80
73
40
46

DIPARTIMENTI
Nome
Indirizzo
Cittр
Amministrazione
Produzione
Distribuzione
Direzione
Ricerca
Via Tito Livio, 27
P.le Lavater, 3
Via Segre, 9
Via Tito Livio, 27
Via Morone, 6
Milano
Torino
Roma
Milano
Milano

Notiamo che:

? la matricola ш composta dalle prime sei lettere del codice fiscale. Non sarebbe stato possibile 
utilizzare un numero, visto che gli identificatori univoci di XML devono obbligatoriamente ini-
ziare con una lettera.
? Nella colonna Stipendio compare lo stipendio annuo in milioni di lire.

Vediamo il documento XML che contiene questi dati, strutturati secondo lo schema del з 6.2.1 o, 
equivalentemente, secondo la DTD del paragrafo precedente:


<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="DB.xsl"?>
<DATABASE xmlns="x-schema:DBschema.xml">
	<IMPIEGATI>
		<IMPIEGATO Matricola="RSSMRA" Dipart="Amministrazione">
			<Nome>Mario</Nome>
			<Cognome>Rossi</Cognome>
			<Ufficio>10</Ufficio>
			<Stipendio>45</Stipendio>
		</IMPIEGATO>
		<IMPIEGATO Matricola="BNCCRL" Dipart="Produzione">
			<Nome>Carlo</Nome>
			<Cognome>Bianchi</Cognome>
			<Ufficio>20</Ufficio>
			<Stipendio>36</Stipendio>
		</IMPIEGATO>
		<IMPIEGATO Matricola="VRDGSP" Dipart="Amministrazione">
			<Nome>Giuseppe</Nome>
			<Cognome>Verdi</Cognome>
			<Ufficio>20</Ufficio>
			<Stipendio>40</Stipendio>
		</IMPIEGATO>
		<IMPIEGATO Matricola="NREFRN" Dipart="Distribuzione">
			<Nome>Franco</Nome>
			<Cognome>Neri</Cognome>
			<Ufficio>16</Ufficio>
			<Stipendio>45</Stipendio>
		</IMPIEGATO>
		<IMPIEGATO Matricola="RSSCRL" Dipart="Direzione">
			<Nome>Carlo</Nome>
			<Cognome>Rossi</Cognome>
			<Ufficio>14</Ufficio>
			<Stipendio>80</Stipendio>
		</IMPIEGATO>
		<IMPIEGATO Matricola="LNZLRN" Dipart="Direzione">
			<Nome>Lorenzo</Nome>
			<Cognome>Lanzi</Cognome>
			<Ufficio>7</Ufficio>
			<Stipendio>73</Stipendio>
		</IMPIEGATO>
		<IMPIEGATO Matricola="BRRPLA" Dipart="Amministrazione">
			<Nome>Paola</Nome>
			<Cognome>Borroni</Cognome>
			<Ufficio>75</Ufficio>
			<Stipendio>40</Stipendio>
		</IMPIEGATO>
		<IMPIEGATO Matricola="FRNMRC" Dipart="Produzione">
			<Nome>Marco</Nome>
			<Cognome>Franco</Cognome>
			<Ufficio>20</Ufficio>
			<Stipendio>46</Stipendio>
		</IMPIEGATO>
	</IMPIEGATI>
	<DIPARTIMENTI>
		<DIPARTIMENTO Nome="Amministrazione">
			<Indirizzo>Via Tito Livio, 27</Indirizzo>
			<Citta>Milano</Citta>
		</DIPARTIMENTO>
		<DIPARTIMENTO Nome="Produzione">
			<Indirizzo>P.le Lavater, 3</Indirizzo>
			<Citta>Torino</Citta>
		</DIPARTIMENTO>
		<DIPARTIMENTO Nome="Distribuzione">
			<Indirizzo>Via Segre, 9</Indirizzo>
			<Citta>Roma</Citta>
		</DIPARTIMENTO>
		<DIPARTIMENTO Nome="Direzione">
			<Indirizzo>Via Tito Livio, 27</Indirizzo>
			<Citta>Milano</Citta>
		</DIPARTIMENTO>
		<DIPARTIMENTO Nome="Ricerca">
			<Indirizzo>Via Morone, 6</Indirizzo>
			<Citta>Milano</Citta>
		</DIPARTIMENTO>
	</DIPARTIMENTI>
</DATABASE>

La struttura ad albero del documento XML ш la seguente:


Dal grafo si nota che lТattributo Dipart dellТelemento IMPIEGATO ш un riferimento ad uno degli 
elementi DIPARTIMENTO.

6.2.4  Foglio di stile per la visualizzazione dei dati

Vediamo, infine, il foglio di stile УDB.xslФ, al quale ш associato il documento XML. Esso rappre-
senta i nostri dati mediante due tabelle identiche a quelle viste nel paragrafo precedente:

<?xml version="1.0"?>
<xsl:template xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<HTML>
	<HEAD><TITLE>Database</TITLE></HEAD>
	<BODY>
<H3>IMPIEGATI</H3>
	<TABLE BORDER="1"><TR>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL"><U>Matricola</U></FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Nome</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Cognome</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Dipart</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Ufficio</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Stipendio</FONT></TD>
	</TR>
	<TR>
	<TD ALIGN="CENTER">
	<xsl:for-each select="DATABASE/IMPIEGATI/IMPIEGATO">
		<DIV><xsl:value-of select="@Matricola"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
	<xsl:for-each select="DATABASE/IMPIEGATI/IMPIEGATO">
		<DIV><xsl:value-of select="Nome"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
	<xsl:for-each select="DATABASE/IMPIEGATI/IMPIEGATO">
		<DIV><xsl:value-of select="Cognome"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
	<xsl:for-each select="DATABASE/IMPIEGATI/IMPIEGATO">
		<DIV><xsl:value-of select="@Dipart"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
	<xsl:for-each select="DATABASE/IMPIEGATI/IMPIEGATO">
		<DIV><xsl:value-of select="Ufficio"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
	<xsl:for-each select="DATABASE/IMPIEGATI/IMPIEGATO">
		<DIV><xsl:value-of select="Stipendio"/></DIV>
	</xsl:for-each>
	</TD>
	</TR></TABLE>
	<H3>DIPARTIMENTI</H3>
	<TABLE BORDER="1"><TR>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL"><U>Nome</U></FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Indirizzo</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Citt&#224;</FONT></TD>
	</TR>
	<TR>
	<TD ALIGN="CENTER">
	<xsl:for-each select="DATABASE/DIPARTIMENTI/DIPARTIMENTO">
		<DIV><xsl:value-of select="@Nome"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
	<xsl:for-each select="DATABASE/DIPARTIMENTI/DIPARTIMENTO">
		<DIV><xsl:value-of select="Indirizzo"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
	<xsl:for-each select="DATABASE/DIPARTIMENTI/DIPARTIMENTO">
		<DIV><xsl:value-of select="Citta"/></DIV>
	</xsl:for-each>
	</TD>
	</TR></TABLE>
	</BODY>
</HTML>
</xsl:template>

6.3	Pattern di XSL

Occupiamoci ora di come utilizzare XSL per effettuare delle interrogazioni su una base di dati. Per 
prima cosa occorre introdurre gli operatori e i caratteri speciali che ш possibile inserire nei pattern di 
XSL [36]:

Operatore
Nome
Significato
/
Figlio
Seleziona un figlio dellТelemento alla sua sinistra. Se ш 
da solo, o allТinizio del pattern, rappresenta lТintero do-
cumento e alla sua destra deve comparire lТelemento 
radice.
//
Discendente 
ricorsivo
Seleziona lТelemento alla sua destra tra tutti i discen-
denti (a qualsiasi profonditр) dellТelemento alla sua sini-
stra
.
Contesto 
corrente
Indica il contesto corrente. La sequenza У./Ф allТinizio del 
pattern si puЄ sottintendere.
..
Padre
Seleziona il nodo padre del contesto corrente.
*
Jolly
Seleziona il primo elemento disponibile, quando ш pos-
sibile scegliere tra pi∙ elementi alla stessa profonditр.
@
Attributo
Deve precedere il nome degli attributi, per distinguerli 
dagli elementi.
[n]
Indice
Se ci sono pi∙ elementi con lo stesso nome e allo stesso 
livello, seleziona lТ(n-1)esimo.
[end()]
Ultimo 
Se ci sono pi∙ elementi con lo stesso nome e allo stesso 
livello, seleziona lТultimo.
[espr]
Espressione 
booleana
Seleziona gli elementi per cui lТespressione booleana 
espr risulta vera.
text()
Testo
Seleziona il contenuto testuale del nodo corrispondente 
al contesto corrente
index()
Valore 
dellТindice
Seleziona lТindice dellТelemento corrispondente al conte-
sto corrente.
context()
Contesto  
iniziale
Fa riferimento al valore che aveva il contesto prima del 
pattern corrente.
id(ID)
Identificatore
Seleziona lТelemento con ID come identificatore univoco.
ancestor(pattern)
Antenato
Seleziona lТantenato pi∙ vicino al contesto corrente che 
soddisfi il pattern indicato.

Vediamo ora gli operatori consentiti allТinterno delle espressioni booleane:

Simbolo
Operatore
and o $and$ o &&
And
or o $or$ o || 
Or
not() o $not$
Not
= o $eq$
Uguale
$ieq$
Uguale indipendentemente dalle lettere maiuscole o minuscole
Simbolo
Operatore
!= o $ne$
Diverso
$ine$
Diverso indipendentemente dalle lettere maiuscole o minuscole
$all$
Per ogni
$any$
Esiste
< o $lt$
Minore
$ilt$
Minore indipendentemente dalle lettere maiuscole o minuscole
<= o $le$
Minore o uguale
$ile$
Minore o uguale indipendentemente dalle lettere maiuscole o minuscole
> o $gt$
Maggiore
$igt$
Maggiore indipendentemente dalle lettere maiuscole o minuscole
>= o $ge$
Maggiore o uguale 
$ige$
Maggiore o uguale indipendentemente dalle lettere maiuscole o minuscole

Per chiarire le idee, vediamo alcuni esempi di pattern, con riferimento al documento XML del 
з 6.2.3:

./Nome

Seleziona tutti gli elementi Nome a partire dal contesto corrente. ╚ equivalente al pattern УNomeФ.

/DATABASE

Seleziona la radice del documento. Se il contesto ш lo stesso dellТinizio del documento, si puЄ 
omettere lТoperatore У/Ф, come nel foglio di stile del paragrafo precedente.

//Nome

Seleziona tutti gli elementi Nome a qualunque profonditр a partire dal contesto corrente.

IMPIEGATO[@Dipart='Amministrazione']

Seleziona gli elementi IMPIEGATO con lТattributo Dipart uguale ad Amministrazione.

IMPIEGATO[@Dipart = //DIPARTIMENTO[2]/@Nome]

Seleziona gli elementi IMPIEGATO con lТattributo Dipart uguale al valore dellТattributo Nome 
del terzo elemento DIPARTIMENTO.

*/*

Seleziona tutti gli elementi УnipotiФ del contesto corrente.

*/@*

Seleziona tutti gli attributi УnipotiФ del contesto corrente.

IMPIEGATO/*[1]

Seleziona i secondi elementi figli di IMPIEGATO, cioш gli elementi Cognome.

IMPIEGATO/*[end()]

Seleziona gli ultimi elementi figli di IMPIEGATO, cioш gli elementi Stipendio.

IMPIEGATO[Cognome>='M']

Seleziona i gli elementi IMPIEGATO, con il contenuto del sottoelemento Cognome che inizia per 
УMФ o per una lettera successiva nellТordine alfabetico. 

6.4	Interrogazioni semplici con XSL

6.4.1  Interrogazione 1

Si deve individuare lo stipendio degli impiegati di cognome УRossiФ [3]. Il risultato ш contenuto 
nella colonna Salario. LТinterrogazione ш realizzata dal seguente documento XSL:

<?xml version="1.0"?>
<xsl:template xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<HTML>
	<HEAD><TITLE>Query</TITLE></HEAD>
	<BODY>
	<TABLE BORDER="1"><TR>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Salario</FONT></TD>	
	</TR>
	<TR>
	<TD ALIGN="CENTER">
	<xsl:for-each select="DATABASE/IMPIEGATI/IMPIEGATO[Cognome='Rossi']">
		<DIV><xsl:value-of select="Stipendio"/></DIV>
	</xsl:for-each>
	</TD>
	</TR></TABLE>	
	</BODY>
</HTML>
</xsl:template>

e lТoutput che si ottiene ш:
	
Salario
45
80

6.4.2  Interrogazione 2

Si vogliono ottenere il nome ed il cognome degli impiegati che lavorano nellТufficio У20Ф del di-
partimento УAmministrazioneФ. Il documento XSL realizza la query sfruttando lТoperatore booleano 
УandФ :


<?xml version="1.0"?>
<xsl:template xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<HTML>
	<HEAD><TITLE>Database</TITLE></HEAD>
	<BODY>
	<TABLE BORDER="1"><TR>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Nome</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Cognome</FONT></TD>
	</TR>
	<TR>
	<TD ALIGN="CENTER">
<xsl:for-each select="//IMPIEGATO[Ufficio='20' and @Dipart 
='Amministrazione']">
		<DIV><xsl:value-of select="Nome"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
<xsl:for-each select="//IMPIEGATO[Ufficio='20' and @Dipart 
='Amministrazione']">
		<DIV><xsl:value-of select="Cognome"/></DIV>
	</xsl:for-each>
	</TD>
	</TR></TABLE>
	</BODY>
</HTML>
</xsl:template>

Si ottiene il seguente risultato:

Nome
Cognome
Giuseppe
Verdi

6.4.3  Interrogazione 3

Si vogliono ottenere i nomi e i cognomi degli impiegati che lavorano nel dipartimento 
УAmministrazioneФ o nel dipartimento УProduzioneФ. Applichiamo il seguente foglio di stile:

<?xml version="1.0"?>
<xsl:template xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<HTML>
	<HEAD><TITLE>Query</TITLE></HEAD>
	<BODY>
	<TABLE BORDER="1"><TR>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Nome</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Cognome</FONT></TD>
	</TR>
	<TR>
	<TD ALIGN="CENTER">
<xsl:for-each select="//IMPIEGATO[@Dipart='Amministrazione' or 
@Dipart='Produzione']">
		<DIV><xsl:value-of select="Nome"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
<xsl:for-each select="//IMPIEGATO[@Dipart='Amministrazione' or 
@Dipart='Produzione']">
		<DIV><xsl:value-of select="Cognome"/></DIV>
	</xsl:for-each>
	</TD>
	</TR></TABLE>
	</BODY>
</HTML>
</xsl:template>

il risultato che si ottiene ш:
 
Nome
Cognome
Mario
Carlo
Giuseppe
Paola
Marco
Rossi
Bianchi
Verdi
Borroni
Franco

6.5	Join di tabelle

6.5.1  Interrogazione 4

Il join ш un operatore che correla dati in diverse tabelle, sulla base di valori uguali. 
UnТinterrogazione che effettua un join sulle nostre due tabelle ш: per ogni impiegato, trovare nome, 
cognome e cittр in cui lavora. La cittр viene reperita dalla tabella DIPARTIMENTI, grazie ai rife-
rimenti ad essa che la tabella IMPIEGATI contiene nella colonna Dipart. Vediamo il foglio di 
stile XSL che realizza questa query:

<?xml version="1.0"?>
<xsl:template xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<HTML>
	<HEAD><TITLE>Query</TITLE></HEAD>
	<BODY>
	<TABLE BORDER="1"><TR>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Nome</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Cognome</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Citt&#224;</FONT></TD>
	</TR>
	<TR>
	<TD ALIGN="CENTER">
	<xsl:for-each select="//IMPIEGATO">
		<DIV><xsl:value-of select="Nome"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
	<xsl:for-each select="//IMPIEGATO">
		<DIV><xsl:value-of select="Cognome"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
	<xsl:for-each select="//IMPIEGATO">
 		<DIV><xsl:value-of select="id(@Dipart)/Citta"/></DIV>
	</xsl:for-each>
	</TD>
	</TR></TABLE>
	</BODY>
	</HTML>
</xsl:template>

Per realizzare il join abbiamo utilizzato lТoperatore id, che realizza i riferimenti incrociati di XML 
introdotti nel з 4.2.1. Infatti, ciascun elemento IMPIEGATO fa riferimento ad un elemento 
DIPARTIMENTO tramite lТattributo Dipart, di tipo IDREF. Il pattern Уid(@Dipart)Ф corri-
sponde esattamente allТelemento DIPARTIMENTO УpuntatoФ da Dipart [36]. Per ottenere 
lТinformazione che cerchiamo, cioш la cittр dove si trova il dipartimento in cui lavora lТimpiegato, 
basta utilizzare il pattern Уid(@Dipart)/CittaФ. Il risultato dellТinterrogazione ш:

Nome
Cognome
Cittр
Mario
Carlo
Giuseppe
Franco
Carlo
Lorenzo
Paola
Marco
Rossi
Bianchi
Verdi
Neri
Rossi
Lanzi
Borroni
Franco
Milano
Torino
Milano
Roma
Milano
Milano
Milano
Torino

6.5.2  Interrogazione 5 (Join completo)

Il join completo consiste nellТinserimento in unТunica tabella di tutti i dati delle due tabelle [3]. 
Nella nostra base di dati, ad ogni impiegato deve corrispondere un dipartimento, come risulta dallo 
schema/DTD, che prevede un attributo Dipart obbligatorio per ogni elemento IMPIEGATO. 
Questi attributi, come abbiamo visto, sono riferimenti ai vari elementi DIPARTIMENTO. Il riferi-
mento inverso non esiste e, infatti, nella tabella DIPARTIMENTI, si trova il dipartimento 
УRicercaФ, del quale non fa parte nessun impiegato (vedi з 6.2.3).
Per realizzare il join completo occorre, dunque, basarsi sulla tabella DIPARTIMENTI:

1) associando a ciascuna sua riga le varie tuple della tabella IMPIEGATI che vi puntano;
2) associando valori nulli alle righe alle quali non corrisponde alcuna tupla di IMPIEGATI.

Questo procedimento ш seguito dal seguente foglio di stile XSL:

<?xml version="1.0" ?> 
<xsl:template xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<HTML>
	<HEAD><TITLE>Join</TITLE></HEAD>
	<BODY>
	<TABLE BORDER="1">
	<TR>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL"><U>Dipartimento</U></FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Indirizzo</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Citt&#224;</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Matricola</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Nome</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Cognome</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Ufficio</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Stipendio</FONT></TD>
	</TR>
	<xsl:for-each select="//DIPARTIMENTO">
		<TR>
		<TD ALIGN="CENTER"><xsl:value-of select="@Nome"/></TD>
		<TD ALIGN="CENTER"><xsl:value-of select="Indirizzo"/></TD>
		<TD ALIGN="CENTER"><xsl:value-of select="Citta"/></TD>
		<TD ALIGN="CENTER">
<xsl:for-each select="//IMPIEGATO[@Dipart=context()/@Nome]">
			<DIV><xsl:value-of select="@Matricola"/></DIV>
		</xsl:for-each>
</TD>
		<TD ALIGN="CENTER">
<xsl:for-each select="//IMPIEGATO[@Dipart=context()/@Nome]">
			<DIV><xsl:value-of select="Nome"/></DIV>
		</xsl:for-each>
</TD>
		<TD ALIGN="CENTER">
<xsl:for-each select="//IMPIEGATO[@Dipart=context()/@Nome]">
			<DIV><xsl:value-of select="Cognome"/></DIV>
		</xsl:for-each>
</TD>
		<TD ALIGN="CENTER">
<xsl:for-each select="//IMPIEGATO[@Dipart=context()/@Nome]">
			<DIV><xsl:value-of select="Ufficio"/></DIV>
		</xsl:for-each></TD>
		<TD ALIGN="CENTER">
<xsl:for-each select="//IMPIEGATO[@Dipart=context()/@Nome]">
			<DIV><xsl:value-of select="Stipendio"/></DIV>
		</xsl:for-each>
</TD>
		</TR>
	</xsl:for-each>
	</TABLE>
	</BODY>
	</HTML>
</xsl:template>

In questo caso, il riferimento deve essere Уpercorso al contrarioФ: da Nome a Dipart, dunque non 
ш possibile utilizzare lТoperatore id(), ma occorre lТoperatore context(), che corrisponde di 
volta in volta allТelemento DIPARTIMENTO selezionato dallТelemento xsl:for-each pi∙ ester-
no [36].
LТoutput che si ottiene ш il seguente:


6.6	Interrogazioni di tipo matematico

6.6.1  Interrogazione 6

Trovare nome, cognome e stipendio degli impiegati che guadagnano pi∙ di 40 milioni [3]. Il docu-
mento XSL che esprime questa query ш:

<?xml version="1.0"?>
<xsl:template xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<HTML>
	<HEAD><TITLE>Query</TITLE></HEAD>
	<BODY>
	<TABLE BORDER="1"><TR>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Nome</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Cognome</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Stipendio</FONT></TD>
	</TR>
	<TR>
	<TD ALIGN="CENTER">
	<xsl:for-each select="//IMPIEGATO[Stipendio>40]">
		<DIV><xsl:value-of select="Nome"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
	<xsl:for-each select="//IMPIEGATO[Stipendio>40]">
		<DIV><xsl:value-of select="Cognome"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
	<xsl:for-each select="//IMPIEGATO[Stipendio>40]">
 		<DIV>
		<xsl:value-of select="Stipendio"/>
		</DIV>
	</xsl:for-each>
	</TD>
	</TR></TABLE>
	</BODY>
	</HTML>
</xsl:template>

e ci restituisce la seguente tabella:

Nome
Cognome
Stipendio
Mario
Franco
Carlo
Lorenzo
Marco
Rossi
Neri
Rossi
Lanzi
Franco
45
45
80
73
46

Si noti che non compaiono i due impiegati che hanno lo stipendio esattamente uguale e 40 milioni, 
cioш Giuseppe Verdi e Paola Borroni.

6.6.2  Interrogazione 7

Vediamo unТinterrogazione in cui il foglio di stile deve effettuare dei calcoli: trovare lo stipendio 
mensile degli impiegati di cognome УBianchiФ. Questo foglio di stile XSL mostra il risultato in lire, 
anzichщ in milioni:

<?xml version="1.0"?>
<xsl:template xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<HTML>
	<HEAD><TITLE>Query</TITLE></HEAD>
	<BODY>
	<TABLE BORDER="1"><TR>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Stipendio Mensile</FONT></TD>
	</TR>
	<TR>
	<TD ALIGN="CENTER">
	<xsl:for-each select="//IMPIEGATO[Cognome='Bianchi']/Stipendio">
		<DIV><xsl:eval>
formatNumber(this.nodeTypedValue*1000000/12,"#,###")
</xsl:eval></DIV>
	</xsl:for-each>
	</TD>
	</TR></TABLE>
	</BODY>
	</HTML>
</xsl:template>

Per calcolare lo stipendio mensile, abbiamo fatto ricorso ad un brevissimo script, contenuto 
allТinterno dellТelemento xsl:eval. Questo si basa sullТoggetto this che, nel nostro caso, ш il 
nodo selezionato dallТelemento xsl:for-each in cui ш contenuto xsl:eval [25]. Il nodo in 
questione ш lТelemento Stipendio. Applicando ad esso la proprietр nodeTypedValue, 
estraiamo il suo valore numerico, che moltiplichiamo per un milione e dividiamo per dodici, proprio 
per ottenere lo stipendio mensile in lire [19]. 
Al valore numerico ottenuto abbiamo applicato, infine, il metodo formatNumber, che ш uno dei 
metodi del modello XML DOM a poter essere richiamato direttamente da un foglio di stile XSL 
[37]. La stringa di formattazione У#,###Ф indica allТelaboratore XSL di rappresentare il numero 
dividendo le migliaia. Il separatore utilizzato (punto, virgola, ecc.) dipende dalle impostazioni inter-
nazionali del software o del sistema operativo.
Il risultato della query ш:

Stipendio Mensile
3.000.000

infatti nella tabella IMPIEGATI cТш un solo impiegato di cognome УBianchiФ, che guadagna 36 
milioni allТanno (vedi з 6.2.3).

6.6.3  Interrogazione 8

Vediamo infine unТinterrogazione in cui si effettuano operazioni su pi∙ dati della tabella: trovare la 
somma degli stipendi del dipartimento УAmministrazioneФ [3]. Il foglio di stile che la realizza ш:

<?xml version="1.0"?>
<xsl:template xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<xsl:script>
	    function somma(nodo)
	    {
		totale=0;
stipendi = nodo.selectNodes("//IMPIEGATO[@Dipart 
='Amministrazione']/Stipendio");
		for (i=stipendi.nextNode();i;i=stipendi.nextNode())
			totale +=i.nodeTypedValue;
		return formatNumber(totale*1000000,"#,###");
	    }
	</xsl:script>
	<HTML>
	<HEAD><TITLE>Query</TITLE></HEAD>
	<BODY>
	<TABLE BORDER="1"><TR>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Somma stipendi</FONT></TD>
	</TR>
	<TR>
	<TD ALIGN="CENTER">
	<DIV><xsl:eval>somma(this)</xsl:eval></DIV>
	</TD>
	</TR></TABLE>
	</BODY>
	</HTML>
</xsl:template>

In questo caso il УcuoreФ dellТinterrogazione ш costituito da uno script, contenuto allТinterno 
dellТapposito elemento xsl:script, equivalente al tag <SCRIPT> di HTML [36]. Lo script de-
finisce la funzione somma, avente come parametro un generico nodo del documento XML. Essa:

1) Seleziona dal documento gli elementi Stipendio associati ai vari impiegati del dipartimento 
УAmministrazioneФ. Tale selezione avviene grazie al metodo selectNodes, che restituisce i 
nodi corrispondenti al pattern specificato, cioш: У//IMPIEGATO[@Dipart 
='Amministrazione']/StipendioФ [19]. Gli elementi selezionati vengono inseriti 
nella variabile stipendi.
2) Somma i contenuti degli elementi contenuti in stipendi tramite un ciclo for. Per passare da 
un elemento al successivo ш impiegato il metodo nextNode, applicato a stipendi.
3) Restituisce il totale in lire, formattato come nel foglio di stile precedente.

LТoutput che si ottiene ш:

Somma stipendi
125.000.000


6.7	Ordinamenti

XSL permette di ordinare i dati di un documento XML associando lТattributo order-by agli ele-
menti xsl:for-each o xsl:apply-templates. Il valore di order-by ш uguale al path 
dellТelemento o attributo che viene scelto come chiave per lТordinamento, preceduto:

? dal segno pi∙ У+Ф, se si desidera un ordinamento cresente;
? dal segno meno У-Ф, se si desidera un ordinamento decrescente.

╚ possibile specificare pi∙ chiavi di ordinamento separandole con un punto e virgola У;Ф [25]. Le 
varie chiavi vengono elencate in ordine di importanza e ciascuna devТessere preceduta dal segno 
У+Ф o У-Ф, che definisce il tipo di ordinamento. 

6.7.1  Interrogazione 9

Vediamo unТinterrogazione con ordinamento: restituire il contenuto della tabella IMPIEGATI or-
dinato in modo decrescente secondo la colonna Cognome (chiave principale) e in modo cresente 
secondo la colonna Nome (chiave secondaria) [3]. Il foglio di stile che occorre ш il seguente:

<?xml version="1.0"?>
<xsl:template xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<HTML>
	<HEAD><TITLE>Ordinamento</TITLE></HEAD>
	<BODY>
	<TABLE BORDER="1"><TR>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Matricola</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Nome</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL"><U>Cognome</U></FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Dipart</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Ufficio</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Stipendio</FONT></TD>
	</TR>
	<TR>
	<TD ALIGN="CENTER">
	<xsl:for-each select="//IMPIEGATO" order-by="-Cognome; +Nome">
		<DIV><xsl:value-of select="@Matricola"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
	<xsl:for-each select="//IMPIEGATO" order-by="-Cognome; +Nome">
		<DIV><xsl:value-of select="Nome"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
	<xsl:for-each select="//IMPIEGATO" order-by="-Cognome; +Nome">
		<DIV><xsl:value-of select="Cognome"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
	<xsl:for-each select="//IMPIEGATO" order-by="-Cognome; +Nome">
		<DIV><xsl:value-of select="@Dipart"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
	<xsl:for-each select="//IMPIEGATO" order-by="-Cognome; +Nome">
		<DIV><xsl:value-of select="Ufficio"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
	<xsl:for-each select="//IMPIEGATO" order-by="-Cognome; +Nome">
		<DIV><xsl:value-of select="Stipendio"/></DIV>
	</xsl:for-each>
	</TD>
	</TR></TABLE>
	</BODY>
</HTML>
</xsl:template>

Il risultato ш:

Matricola
Nome
Cognome
Dipart
Ufficio
Stipendio
VRDGSP
RSSCRL
RSSMRA
NREFRN
LNZLRN
FRNMRC
BRRPLA
BNCCRL
Giuseppe
Carlo
Mario
Franco
Lorenzo
Marco
Paola
Carlo
Verdi
Rossi
Rossi
Neri
Lanzi
Franco
Borroni
Bianchi
Amministrazione
Direzione
Amministrazione
Distribuzione
Direzione
Produzione
Amministrazione
Produzione
20
14
10
16
7
20
75
20
40
80
45
45
73
46
40
36

6.7.2  Interrogazione 10

Passiamo ad unТinterrogazione pi∙ complessa: ordinare i dipartimenti in modo discendente in base 
alla somma degli stipendi pagati. In questo caso occorrono due documenti XSL. Il primo realizza 
una vista delle due tabelle della base di dati, in cui compaiono solamente il nome e la somma degli 
stipendi pagati agli impiegati di ciascun dipartimento:

<?xml version="1.0"?>
<xsl:template xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<xsl:script>
	    function somma(nodo)
	    {
		totale=0;
		path = "//IMPIEGATO[@Dipart ='"+nodo.text+"']/Stipendio";
		stipendi = nodo.selectNodes(path);
		for (i=stipendi.nextNode();i;i=stipendi.nextNode())
			totale +=i.nodeTypedValue;
		return formatNumber(totale*1000000,"#,##0")
	    }
	</xsl:script>
	<xsl:pi name="xml-stylesheet">
		<xsl:attribute name="type">text/xsl</xsl:attribute>
		<xsl:attribute name="href">Query26b.xsl</xsl:attribute>
	</xsl:pi>
	<xsl:element name="VISTA">
		<xsl:for-each select="//DIPARTIMENTO/@Nome">
			<xsl:element name="DIPARTIMENTO">	
				<xsl:element name="Nome"><xsl:value-of/></xsl:element>
				<xsl:element name="SommaSt">
					<xsl:eval>somma(this)</xsl:eval>
				</xsl:element>
			</xsl:element>
		</xsl:for-each>
	</xsl:element>
</xsl:template>

Abbiamo fatto qualche modifica alla funzione somma del paragrafo scorso, per permetterle di cal-
colare le somme degli stipendi di tutti i dipartimenti. In particolare, abbiamo estratto i nomi di cia-
scun dipartimento dai nodi che li contengono grazie alla proprietр text [19]. Inoltre, abbiamo 
cambiato la stringa di formattazione in У#,##0Ф, per mostrare il valore nullo relativo al diparti-
mento УRicercaФ [37].
Il risultato di questo foglio di stile ш il seguente documento XML, ottenuto con il metodo spiegato 
nel з 5.7:

<?xml-stylesheet  type="text/xsl" href="Query26b.xsl"?>
<VISTA>
<DIPARTIMENTO>
<Nome>Amministrazione</Nome>
<SommaSt>
125.000.000
</SommaSt>
</DIPARTIMENTO>
<DIPARTIMENTO>
<Nome>Produzione</Nome>
<SommaSt>
82.000.000
</SommaSt>
</DIPARTIMENTO>
<DIPARTIMENTO>
<Nome>Distribuzione</Nome>
<SommaSt>
45.000.000
</SommaSt>
</DIPARTIMENTO>
<DIPARTIMENTO>
<Nome>Direzione</Nome>
<SommaSt>
153.000.000
</SommaSt>
</DIPARTIMENTO>
<DIPARTIMENTO>
<Nome>Ricerca</Nome>
<SommaSt>
0
</SommaSt>
</DIPARTIMENTO>
</VISTA>

Questo documento realizza la vista e ad esso bisogna applicare un altro foglio di stile per avere il 
risultato dellТinterrogazione. Tale foglio di stile ш indicato con il nome УQuery26b.xslФ ed ш:


<?xml version="1.0"?>
<xsl:template xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<HTML>
	<HEAD><TITLE>Ordinamento</TITLE></HEAD>
	<BODY>
	<TABLE BORDER="1"><TR>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL">Dipartimenti</FONT></TD>
	<TD ALIGN="CENTER"><FONT FACE="ARIAL"><U>Somma stipendi</U></FONT></TD>
	</TR>
	<TR>
	<TD ALIGN="CENTER">
	<xsl:for-each select="VISTA/DIPARTIMENTO" order-by="-number(SommaSt)">
		<DIV><xsl:value-of select="Nome"/></DIV>
	</xsl:for-each>
	</TD>
	<TD ALIGN="CENTER">
	<xsl:for-each select="VISTA/DIPARTIMENTO" order-by="-number(SommaSt)">
		<DIV><xsl:value-of select="SommaSt"/></DIV>
	</xsl:for-each>
	</TD>
	</TR></TABLE>
	</BODY>
</HTML>
</xsl:template>

Si noti la presenza del metodo number nel valore dellТattributo order-by. I metodi number e 
date possono essere utilizzati per ordinare numeri e date, nel caso questi non siano УtipizzatiФ tra-
mite lo spazio dei nomi datatypes [25]. Questo ш il caso della nostra vista, che ш priva sia dello 
schema, sia della dichiarazione di tale spazio dei nomi.
Finalmente, applicando alla vista il secondo foglio di stile, otteniamo il risultato dellТinterrogazione:

Dipartimenti
Somma stipendi
Direzione
Amministrazione
Produzione
Distribuzione
Ricerca
153.000.000
125.000.000
82.000.000
45.000.000
0

6.8	Costrutti condizionali di XSL

Il linguaggio XSL, oltre allТordinamento e al filtraggio dei dati, consente di effettuare test condizio-
nali su di essi, utilizzando gli elementi xsl:if, xsl:choose, xsl:when ed 
xsl:otherwise [19].

6.8.1  Utilizzo dellТelemento xsl:if

LТelemento xsl:if effettua il test di esistenza sul pattern contenuto nel suo attributo test [36]. 
Se il pattern supera il test, entra a far parte dellТoutput il contenuto di xsl:if, viceversa questa 
parte di documento viene ignorata. Il pattern deve contenere unТespressione booleana racchiusa tra 
parentesi quadre, secondo la sintassi vista nel з 6.3. Se si vuole effettuare un test a partire dal conte-
sto corrente, non ш possibile sottintendere lТoperatore У.Ф che lo rappresenta.
Vediamo, ad esempio, un foglio di stile che elenca in ordine alfabetico gli impiegati del documento 
XML del з 6.2.3, contrassegnando con un asterisco quelli appartenenti al dipartimento 
УAmministrazioneФ [25]:

<?xml version="1.0"?>
<xsl:template xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<HTML>
	<HEAD><TITLE>Elenco impiegati</TITLE></HEAD>
	<BODY>
	<H1>Impiegati <SMALL>(in ordine alfabetico)</SMALL>:</H1>	
	<xsl:for-each select="//IMPIEGATO" order-by="+Cognome; +Nome">
		<DIV>
		<I><xsl:value-of select="Cognome"/>
		<xsl:value-of select="Nome"/></I>
		<xsl:if test=".[@Dipart='Amministrazione']">
			<BIG>*</BIG>
		</xsl:if>
		</DIV>
	</xsl:for-each>
	<P><BIG>*</BIG>
Impiegati appartenenti al dipartimento "Amministrazione".
 	</P>
	</BODY>
	</HTML>
</xsl:template>

La visualizzazione che si ottiene ш:

Impiegati (in ordine alfabetico):

Bianchi Carlo 
Borroni Paola * 
Franco Marco 
Lanzi Lorenzo 
Neri Franco 
Rossi Carlo 
Rossi Mario * 
Verdi Giuseppe * 

* Impiegati appartenenti al dipartimento "Amministrazione".

6.8.2  Utilizzo dellТelemento xsl:choose

LТelemento xsl:choose consente di verificare contemporaneamente pi∙ condizioni e controllare 
lТoutput in base al risultato [19]. Grazie ad esso ш possibile impostare relazioni condizionali analo-
ghe ai costrutti Уif-then-elseФ e Уcase ofФ presenti in molti linguaggi di programmazione. Tali rela-
zioni si realizzano in combinazione con gli elementi xsl:when ed xsl:otherwise (facoltati-
vo) secondo questa sintassi [25]:

<xsl:choose>
<xsl:when test="condizione_1">contenuto_1</xsl:when>
<xsl:when test="condizione_2">contenuto_2</xsl:when>
[Е]
<xsl:when test="condizione_n">contenuto_n</xsl:when>
<xsl:otherwise>contenuto_0</xsl:otherwise>
</xsl:choose>

LТelaboratore XSL agisce in questo modo:

? valuta lТespressione booleana condizione_1: 
? se ш vera, inserisce contenuto_1 nellТoutput e passa agli elementi del foglio di stile posti 
dopo il tag di chiusura di xsl:choose; 
? se ш falsa valuta condizione_2.
? Ripete il procedimento per gli altri elementi xsl:when e, solo se tutte le condizoni sono false, 
inserisce nellТoutput contenuto_0, se presente.

Il seguente foglio di stile utilizza lТelemento xsl:choose per evidenziare con colori diversi gli 
impiegati appartenenti ai vari dipartimenti:

<?xml version="1.0"?>
<xsl:template xmlns:xsl="http://www.w3.org/TR/WD-xsl">
	<HTML>
	<HEAD><TITLE>Elenco impiegati</TITLE></HEAD>
	<BODY>
	<H1>Impiegati <SMALL>(in ordine alfabetico)</SMALL>:</H1>
	<TABLE>	
	<xsl:for-each select="//IMPIEGATO" order-by="+Cognome; +Nome">
	   <TR><xsl:attribute name="BGCOLOR">
		<xsl:choose>
		   <xsl:when test=".[@Dipart='Amministrazione']">
lightcoral
   </xsl:when>
		   <xsl:when test=".[@Dipart='Direzione']">cyan</xsl:when>
 		   <xsl:when test=".[@Dipart='Produzione']">lightgreen</xsl:when>
		   <xsl:otherwise>yellow</xsl:otherwise>
		</xsl:choose>
	   </xsl:attribute>
	   <TD><I>
	   <xsl:value-of select="Cognome"/>
	   <xsl:value-of select="Nome"/>
	   </I></TD></TR>
	</xsl:for-each>
	</TABLE>
	<P/>
	<DIV>
I colori indicano il dipartimento di appartenenza degli impiegati:
</DIV>
	<TABLE><TR>
	<TD BGCOLOR="lightcoral">Amministrazione</TD>
	<TD BGCOLOR="cyan">Direzione</TD>
	<TD BGCOLOR="lightgreen">Produzione</TD>
	<TD BGCOLOR="yellow">Altri dipartimenti</TD>
	</TR></TABLE>
	</BODY>
	</HTML>
</xsl:template>

LТoutput prodotto ш questo:

 
6.9	Conclusioni

Tutti i fogli di stile mostrati in questo e nel precedente capitolo si basano essenzialmente sulla bozza 
di lavoro di XSLT del 16 dicembre 1998, che ш quella supportata da Explorer 5. Da allora il lin-
guaggio XSL si ш evoluto ancora, pur senza raggiungere una versione definitva. Tralasciando gli 
oggetti di formattazione, ai quali abbiamo accennato nel з 5.9, le attuali specifiche riguardanti XSL 
sono due:

1) bozza di lavoro di XSLT del 13 agosto 1999 [26];
2) bozza di lavoro di XML Path Language, anchТessa del 13 agosto 1999 [38].

Una delle differenze principali fra i documenti XSL visti finora e le specifiche del W3C ш nella rea-
lizzazione degli ordinamenti. La specifica prevede lТelemento xsl:sort, dotato di un proprio at-
tributo select, al posto dellТattributo order-by [25].
Per fare un esempio, vediamo un frammento di un foglio di stile visto nel з 6.7.2:

<xsl:for-each select="VISTA/DIPARTIMENTO" order-by="-number(SommaSt)">
<DIV><xsl:value-of select="Nome"/></DIV>
</xsl:for-each>

secondo la specifica del W3C, occorre modificarlo in questo modo [26]:

<xsl:for-each select="VISTA/DIPARTIMENTO">
	<xsl:sort select=ФSommaStФ data-type=ФnumberФ order=ФdescendingФ/>
	<DIV><xsl:value-of select="Nome"/></DIV>
</xsl:for-each>

dove:

? data-type=ФnumberФ indica che lТordinamento devТessere fatto considerando i dati come 
valori numerici, piuttosto che come stringhe;
? order=ФdescendingФ indica che lТordinamento devТessere decrescente.

Nel caso si debbano utilizzare pi∙ chiavi per lТordinamento, il primo elemento xsl:sort indiche-
rр la chiave principale, il secondo la chiave secondaria, e cosь via.
Oltre a questa differenza, lТultima bozza di XSLT prevede numerosi elementi in pi∙ rispetto a quelli 
che abbiamo introdotto. Tra questi, vale la pena di citare xsl:output, che consente di definire il 
risultato dellТapplicazione del foglio di stile al documento XML. Utilizzando:

? <xsl:output method="html"/> 

avremo un documento HTML come output;

? <xsl:output method="xml"/> 

il foglio di stile darр come risultato la trasformazione del documento originario in un nuovo do-
cumento XML;

? <xsl:output method="text"/> 

si avrр un file di testo.

LТelemento xsl:output va inserito subito dopo la dichiarazione dello spazio dei nomi di XSL.
Passiamo ora allТXML Path Language, noto con lТabbreviazione XPath [38]. Esso non ш 
unТapplicazione XML, come XSL o XML-Data, ma un linguaggio che definisce i pattern per indi-
rizzare le parti di un documento XML. XPath ш stato progettato per essere utilizzato sia con XSL 
che con XPointer e dispone di due sintassi: una estesa ed una abbreviata. La sintassi abbreviata, pi∙ 
semplice da utilizzare, ш costituita sostanzialmente dagli operatori introdotti nel з 6.3.
Una modifica importante portata dalle ultime bozze di lavoro ш nella numerazione degli indici degli 
elementi УfratelliФ dotati dello stesso nome. In precedenza, tale numerazione partiva da 0, mentre 
lТultima specifica del W3C la fa iniziare da 1. Pertanto, il pattern:

DOCENTI/PERSONA[2]

che compare negli esempi del з 5.8, dovrebbe selezionare il secondo elemento PERSONA 
allТinterno di DOCENTI, e non il terzo, come fa lТelaboratore XSL contenuto in Explorer 5, al quale 
abbiamo fatto riferimento.
Gli esperti del W3C stanno lavorando da ormai pi∙ di due anni su XSL, XSLT ed XPath ma, per il 
momento, non esistono ancora versioni definitive di tali linguaggi. ╚ auspicabile che le specifiche 
finali non siano pi∙ complesse delle attuali. Infatti bisogna tener presente che il successo di HTML 
ш dovuto principalmente alla sua semplicitр; pertanto, associare un linguaggio per i fogli di stile 
troppo complicato ad XML potrebbe avere delle ripercussioni negative per la diffusione di 
questТultimo su Web.

7  XLINK, XPOINTER E MATHML

7.1	XLink

LТXML Linking Language, noto con lТabbreviazione di XLink, ш un linguaggio in grado di descri-
vere sia i collegamenti semplici e unidirezionali di HTML, sia collegamenti pi∙ sofisticati, utiliz-
zando la sintassi di XML [39]. Il markup di XLink ш realizzato per essere inserito sia negli schemi 
che nelle istanze dei documenti XML.
Cosь come XSL, anche XLink ш associato ad uno spazio dei nomi, che ш:

http://www.w3.org/XML/XLink/0.9

e devТessere dichiarato esplicitamente nel documento. Solitamente il prefisso utilizzato ш УxlinkФ. 
Pertanto, se si intende utilizzare XLink dovrр comparire la seguente dichiarazione di spazio dei no-
mi:

<ELEMENTO xmlns:xlink="http://www.w3.org/XML/XLink/0.9">
[Е]
</ELEMENTO>

ELEMENTO devТessere la radice del documento o, quantomeno, un elemento che comprenda al suo 
interno tutti i link.
XLink permette di scegliere come definire i collegamenti:

1) utilizzando degli elementi specifici, cosь come in HTML;
2) inserendo lТattributo xlink:type allТinterno di qualsiasi elemento di XML. Il tipo di link ш 
indicato dal valore di questТattributo.

In questa tabella sono elencati gli elementi di XLink ed i valori corrispondenti da assegnare a 
xlink:type nel caso si vogliano inserire i collegamenti in elementi qualunque di XML:

Elemento
Attributo equivalente
Significato
xlink:simple
xlink:type="simple"
Collegamento semplice (vedi з 7.2)
xlink:extended
xlink:type="extended"
Collegamento esteso (vedi з 7.3)
xlink:arc
xlink:type="arc"
Arco (vedi з 7.3)
xlink:locator
xlink:type="locator"
Localizzatore (vedi з 7.3)
xlink:group

Gruppo di collegamenti estesi (vedi з 7.4)
xlink:document

Localizzatore di un documento apparte-
nente ad un gruppo di collegamenti estesi 
(vedi з 7.4)
 
7.2	Collegamenti semplici

Iniziamo dai collegamenti semplici. Essi sono analoghi a quelli realizzati dal tag <A> di HTML, 
come questo:

<A HREF="http://space.tin.it/io/lucposti/">Home page di Luca Postiglione</A>

La conversione in XLink di tale collegamento ш:

<xlink:simple href="http://space.tin.it/io/lucposti/">
Home page di Luca Postiglione
</xlink:simple>

Lo stesso collegamento, inserito in un elemento XML definito da noi, diventa:

<Ancora xlink:type="simple" xlink:href="http://space.tin.it/io/lucposti/">
Home page di Luca Postiglione
</Ancora>

Si noti che lТattributo href devТessere dichiarato appartenente allo spazio dei nomi di XLink. In 
generale, gli attributi di XLink:

? non hanno bisogno del prefisso УxlinkФ, se utilizzati in un elemento di XLink, il cui nome giр 
contiene tale prefisso;
? richiedono il prefisso УxlinkФ, se presenti in altri elementi.

Passiamo alla descrizione degli attributi previsti per i collegamenti semplici:

? href

Indica il localizzatore della risorsa, in grado di identificare la risorsa alla quale il collegamento 
fa riferimento [19]. ╚ lТunico attributo obbligatorio di un collegamento semplice. La sua sintassi 
ш [43]:

href=ФURI#xptr(Xpointer)Ф

dove URI ш un Uniform Resource Identifier (vedi з 4.6) e Xpointer ш unТespressione del lin-
guaggio XPointer, in grado di selezionare una parte del documento XML identificato da URI 
(vedi з 7.5). La presenza di У#XpointerФ ш facoltativa e, in generale, se la risorsa non ш un 
documento XML, il valore di href  si riduce al solo URI.

? role

Descrive il ruolo del collegamento allТinterno del documento e del sistema ipertestuale [1]. Pi∙ 
precisamente ш una stringa usata per fornire al software informazioni semantiche sul link [39]. 

? title

LТattributo title contiene del testo che puЄ essere visualizzato per fornire informazioni sup-
plementari allТutente [19]. Mentre il valore dellТattributo role viene interpretato dal software, 
lТattributo title fornisce informazioni semantiche allТutente. title ha uno scopo simile 
allТattributo ALT che HTML prevede per i tag <IMG> e <APPLET> ma, purtroppo, non per 
<A> [16].

? show

Descrive il modo in cui il collegamento deve funzionare [19]. PuЄ assumere questi tre valori:

1) replace: indica che la risorsa locale verrр sostituita da quella remota. In pratica, attivando 
il collegamento, una nuova pagina sostituisce la precedente nella stessa finestra del browser. 
╚ il valore di default [39].
2) new: specifica che la risorsa di destinazione del link deve essere caricata in una nuova fine-
stra del browser. Il documento di partenza del collegamento rimane inalterato [1].
3) parsed: indica che la risorsa remota devТessere integrata nel documento da cui ha origine 
il link, sostituendo il link stesso [39]. ╚ quello che succede quando viene inclusa in un do-
cumento unТentitр esterna analizzata (vedi з 4.3.2).

? actuate

Specifica il modo in cui il collegamento devТessere attuato [19]. Ammette due possibili valori:

1) auto: indica che il collegamento devТessere attivato automaticamente, non appena viene 
elaborato dallТapplicazione.
2) user: indica che il link devТessere attivato dallТutente con un opportuno meccanismo, co-
me, ad esempio, un click del mouse. ╚ il valore di default [39].

Vediamo un esempio di collegamento semplice in cui compaiono tutti gli attributi:

<DIPARTIMENTO xlink:type="simple"
              xlink:href="dipartimento.xml" 
              xlink:role="list"
              xlink:title="Informatica - Elenco docenti" 
              xlink:show="new" 
              xlink:actuate="user">
	Elenco dei docenti del Dipartimento di Informatica
</DIPARTIMENTO>

alternativamente, usando lТelemento xlink:simple, lo stesso collegamento diventa:

<xlink:simple href="dipartimento.xml" 
	         role="list"
	         title="Informatica - Elenco docenti" 
	         show="new" 
	         actuate="user">
	Elenco dei docenti del Dipartimento di Informatica
</xlink:simple>

Questo ш un collegamento al file Уdipartimento.xmlФ, che viene indicato al browser come una risor-
sa di tipo УlistФ. Essa, invece, ш indicata allТutente con il titolo УInformatica Ц Elenco 
docentiФ. Questo titolo puЄ, ad esempio, comparire accanto al puntatore del mouse quando passa 
sopra la visualizzazione data al link dal foglio di stile. Infine, il collegamento sarр attuato aprendo la 
risorsa in una nuova finestra solo quando lТutente lo attiverр, cliccando il mouse sulla sua rappre-
sentazione [40].

7.3	Collegamenti estesi

7.3.1  Sintassi

Un collegamento esteso si differenzia da un collegamento semplice, in quanto ш in grado di collega-
re un numero qualsiasi di risorse, sia locali che remote [39]. Ciascun collegamento esteso ш costi-
tuito da un elemento xlink:extended, che puЄ avere come figli localizzatori 
(xlink:locator) ed archi (xlink:arc). Vediamo in dettaglio il significato e gli attributi sup-
portati da questi tre elementi:

? xlink:extended

Rappresenta lТintero collegamento esteso. PuЄ contenere un numero qualsiasi di elementi 
xlink:locator ed xlink:arc, ma nientТaltro. Prevede i seguenti attributi: 

? role e title, giр visti per i collegamenti semplici;
? showdefault ed actuatedefault: definiscono i valori di default degli attributi show 
ed actuate per tutti gli archi del collegamento esteso. Non hanno valori predefiniti.

Non ammette lТattributo href, riservato agli elementi xlink:locator.

? xlink:locator

Individua una singola risorsa del collegamento esteso grazie al localizzatore contenuto nel suo 
attributo obbligatorio href. Per estensione, lТintero elemento viene chiamato УlocalizzatoreФ. 
Gli altri attributi sono: 

? id (obbligatorio): ш un identificatore univoco assegnato alla risorsa, che puЄ essere utiliz-
zato dagli archi per individuare le varie risorse. ╚ un attributo di tipo УIDФ (vedi з 4.2.1).
? role e title.

PuЄ contenere sia sottoelementi che testo.

? xlink:arc
 
Rappresenta un arco. Gli archi definiscono gli attraversamenti fra le risorse gestite da un colle-
gamento esteso. Gli attributi di questТelemento sono:

? from e to: sono attributi obbligatori di tipo УIDREFФ (vedi з 4.2.1). Indicano rispettiva-
mente la risorsa di origine e di destinazione dellТarco, facendo riferimento agli attributi id 
dei localizzatori.
? show ed actuate, giр visti per i collegamenti semplici. Se questi attributi sono presenti, 
lТattraversamento associato allТarco ш eseguito nel modo definito dai loro valori; viceversa si 
utilizzano i valori degli attributi showdefault ed actuatedefault dellТelemento 
УpadreФ xlink:extended.

Anche questТelemento puЄ contenere sia sottoelementi che testo.

7.3.2  Introduzione degli archi nei collegamenti estesi

Gli archi sono la grande novitр dellТultima bozza di lavoro su XLink del W3C, datata 26 luglio 
1999. In precedenza, i collegamenti estesi contenevano esclusivamente i localizzatori e si presenta-
vano in questo modo (anche se con una sintassi diversa) [41]:

<Esempi xlink:type="extended"> 
	<Collegamenti 	xlink:type="locator" 
				xlink:href="Elink.xml" 
				xlink:role="source"/>
	<Dipartimento 	xlink:type="locator"
				xlink:href="Dipartimento.xml" 
				xlink:role="code"/>
	<Database xlink:type="locator" 
	          xlink:href="DB.xml" 
	          xlink:role="code"/>
</Esempi>

Questo markup non specifica il tipo di connessione che deve esistere fra i tre localizzatori. CiЄ si-
gnifica che il browser devТessere in grado di supportare tutti i possibili collegamenti fra le risorse, 
anche quelli che, magari, sono ritenuti superflui da chi ha scritto il collegamento esteso. Rappresen-
tiamo la situazione in questo grafo, che raffigura le risorse come nodi e i collegamenti come archi:


Come vediamo dal grafo, gli attraversamenti fra le risorse sono sei; essi, perЄ, diventano addirittura 
nove se includiamo i collegamenti di ciascuna risorsa con se stessa, teoricamente possibili. In gene-
rale, se il collegamento esteso comprende n risorse, gli attraversamenti da gestire sono n2. In questa 
situazione il browser deve fare affidamento solo sul valore dellТattributo role, che definisce la 
funzione di ciascuna risorsa e permette di trascurare eventuali link privi di significato.
Viceversa, gli archi consentono allТautore del documento di specificare i link che egli ritiene utili, 
riducendo notevolmente il tempo di elaborazione. Torniamo al nostro esempio, e supponiamo che ci 
interessino solamente i due attraversamenti dalla risorsa locale УElink.xmlФ alle altre due risorse 
(remote). Il collegamento esteso diventa:

ed il markup che lo descrive ш il seguente:

<Esempi xlink:type="extended"> 
	<Collegamenti xlink:type="locator"
	              xlink:href="Elink.xml" 
	              xlink:id="menu"/>
	<Dipartimento xlink:type="locator"
	              xlink:href="Dipartimento.xml" 
	              xlink:id="esempio1"/>
	<Database xlink:type="locator" 
	          xlink:href="DB.xml" 
	          xlink:id="esempio2"/>
	<Link1 xlink:type=ФarcФ xlink:from=ФmenuФ xlink:to=Фesempio1Ф/>
	<Link2 xlink:type=ФarcФ xlink:from=ФmenuФ xlink:to=Фesempio2Ф/>
</Esempi>

Il browser deve essere in grado, comunque, di attivare su richiesta dellТutente anche i collegamenti 
non previsti dallТautore del documento, chiamati archi impliciti [39].
XLink non ш al momento supportato nщ da Explorer 5, nщ da altre applicazioni commerciali [42]. 
Inoltre, lТintroduzione degli archi e il cambiamento della sintassi hanno reso obsoleti tutti i pro-
grammi sperimentali basati sulla versione di XLink del marzo 1998, tra i quali possiamo citare il 
browser УHyBrickФ, prodotto dalla Fujitsu. Gli esempi su XLink sono ricavati direttamente dalla 
specifica, e non ш detto che funzioneranno sui futuri browser compatibili con questo linguaggio.

7.4	Gruppi di collegamenti estesi

Un gruppo di collegamenti estesi ш un elemento contenente un elenco di riferimenti a documenti 
correlati fra loro [19]. Due documenti УfileA.xmlФ e УfileB.xmlФ sono correlati se УfileA.xmlФ con-
tiene dei link estesi che fanno riferimento a УfileB.xmlФ e/o viceversa [40].
Il gruppo di collegamenti estesi ш realizzato in XLink dallТelemento xlink:group [39]. Esso ha 
come figli un numero qualsiasi (al limite anche zero) di elementi xlink:document, ciascuno dei 
quali individua, grazie allТattributo obbligatorio href, uno dei documenti correlati.
Questo costrutto di XLink indica al browser di  elaborare insieme tutti i documenti correlati e di at-
tivare i collegamenti in essi presenti [1]. Alcuni possibili risultati sono:

1) La creazione di un database dei link contenuti nei documenti.
2) La visualizzazione di due documenti correlati in finestre diverse, in cui sono evidenziati i rife-
rimenti reciproci.
3) La rappresentazione dellТinsieme dei documenti correlati in unТunica finestra [19].

LТelemento xlink:group puЄ contenere lТattributo steps, il cui valore ш un numero intero che 
indica al browser quanti livelli di collegamenti estesi esso debba risolvere per completare lТelenco 
dei link del gruppo [40]. Per chiarire meglio questo concetto vediamo un esempio [39]:

<xlink:group steps="2">
	<xlink:document href="fileA.xml"/>
	<xlink:document href="fileB.xml"/>
	<xlink:document href="fileC.xml"/>
</xlink:group>

Supponiamo di voler costruire un elenco dei link contenuti nei tre documenti XML correlati 
УfileA.xmlФ, УfileB.xmlФ e УfileC.xmlФ. ╚ possibile che questi file contengano a loro volta gruppi di 
collegamenti estesi riferiti a documenti con al loro interno ulteriori gruppi di collegamenti, e cosь 
via. In un caso simile diventa praticamente impossibile ottenere lТelenco di link desiderato.
LТattributo steps impedisce questo processo potenzialmente infinito, specificando quanti livelli di 
gruppi di collegamenti elaborare [19]. Il seguente schema, riferito al nostro esempio, mostra i file di 
cui occorre elaborare i collegamenti, a seconda dei valori di steps:

Poichщ steps ha valore У2Ф, il browser deve comporre la lista dei collegamenti estesi presenti nei 
file contenuti allТinterno dellТellisse rosso, ignorando gli altri documenti correlati. Si noti, infine, 
che gli altri valori di steps presenti negli elementi xlink:group dei documenti correlati al do-
cumento iniziale sono ignorati. 

7.5	Cenni sul linguaggio XPointer

7.5.1  Compatibilitр con XPath

LТXML Pointer Language, chiamato per praticitр XPointer, indirizza le parti interne di un docu-
mento XML, utilizzando delle opportune estensioni allТURI del documento [1]. Queste, come ab-
biamo accennato nel з 7.2, si trovano dopo lТURI, e seguono la sintassi [43]:

URI#xptr(Xpointer)

In particolare, XPointer permette il riferimento ad elementi (dotati o meno di un identificatore uni-
voco), attributi e stringhe di testo di un documento XML.
LТultima bozza di lavoro di XPointer ш stata pubblicata il 9 luglio 1999 dal W3C e si differenzia 
sensibilmente dalla precedente, del luglio 1997, in quanto la sintassi delle espressioni di XPointer ш 
stata resa compatibile con XPath, il linguaggio che definisce i pattern di indirizzamento utilizzati da 
XSL. Pertanto, attualmente, non esistono ancora programmi che supportino questТultima versione di 
XPointer e non necessariamente gli esempi riportati funzioneranno nei software futuri compatibli 
con tale linguaggio.
Abbiamo giр elencato nel з 6.3 i principali operatori di XPath, introducendoli direttamente nella lo-
ro forma abbreviata. Vediamo alcuni esempi di localizzatori che fanno riferimento al file УDB.xmlФ, 
che si trova nel з 6.2.3 [19]:

DB.xml#xptr(/DATABASE/IMPIEGATI/IMPIEGATO[2])

Indirizza il secondo tra gli elementi IMPIEGATO, figlio dellТelemento IMPIEGATI e nipote di 
DATABASE, che devТessere la radice del documento. La numerazione degli elementi fratelli con lo 
stesso nome parte da 1, come nella specifica di XPath (vedi з 6.9).

DB.xml#xptr(id(ТAmministrazioneТ))

Indirizza lТelemento avente УAmministrazioneФ come identificatore univoco, cioш il primo 
elemento DIPARTIMENTO.

DB.xml#xptr(//IMPIEGATO/@Nome)

Indirizza lТattributo Nome del primo elemento IMPIEGATO trovato nel documento a qualsiasi li-
vello.

DB.xml#xptr(//IMPIEGATO[@Dipart='Amministrazione'])

Indirizza il primo elemento IMPIEGATO con lТattributo Dipart uguale ad Amministrazione.
Si noti che XPointer indirizza solo la prima parte di documento rispondente alle caratteristiche del 
pattern. In questo senso, il suo funzionamento ш pi∙ simile a quello dellТelemento xsl:value-of 
(vedi з 5.1), che a quello dellТelemento xsl:for-each, che seleziona tutte le parti di documento 
che soddisfano il pattern (vedi з 5.2).

7.5.2  Selezione di un gruppo di elementi

Occupiamoci ora di alcune caratteristiche che XPointer aggiunge ad XPath. Iniziamo dal termine 
range, la cui sintassi ш [43]:

range::inizio,fine

Esso indirizza un sottoinsieme del documento XML che parte dalla locazione corrispondente al 
pattern inizio e termina in quella corrispondente al pattern fine.
Vediamo un esempio:

DB.xml#xptr(id(СNREFRNТ)/range::*[1],*[3])

Indirizza i primi tre figli dellТelemento avente УNREFRNФ come identificatore univoco. Gli elementi 
selezionati sono NOME, COGNOME ed UFFICIO corrispondenti allТimpiegato УFranco NeriФ, la cui 
matricola ш, appunto, УNREFRNФ (vedi з 6.2.3).

7.5.3  Selezione di stringhe 

Il termine string indirizza una stringa allТinterno del testo di un documento XML, ignorando il 
markup. Esso ha la seguente sintassi:

	string::occorrenza,stringa,posizione,lunghezza

dove:

? occorrenza (obbligatorio): stabilisce quale occorrenza di stringa debba essere cercata.
? stringa (obbligatorio): definisce la stringa da cercare. In caso di stringa vuota, viene cercato 
lТn-esimo carattere del testo, con n posto uguale al valore di occorrenza. 
? posizione: definisce la posizione da cui far iniziare lТindirizzamento. Si assume come rife-
rimento la stringa selezionata dalla coppia di parametri occorrenza,stringa. 
? Se il valore ш un numero positivo n, lТindirizzamento parte dallТn-esimo carattere di tale 
stringa.
? Se il valore ш un numero negativo -n, lТindirizzamento parte dallТn-esimo carattere a sini-
stra della fine della stringa. 
Il valore di default ш 1, corrispondente al primo carattere selezionato. Il valore 0 non ш consen-
tito. 
? lunghezza: indica il numero di caratteri da selezionare. Il valore di default ш 1.

Consideriamo ora il frammento del documento УDipartimento.xmlФ del з 3.9 indirizzato dal localiz-
zatore:

Dipartimento.xml#xptr(/DOCENTI/PERSONA[3]/CURRICULUM)

Esso ш:

<CURRICULUM>Nato nel 1971 e laureato nel 1998. Collabora con il 
prof. Brahms nel corso di Intelligenza artificiale.</CURRICULUM>

e lo utilizziamo per mostrare alcuni esempi di indirizzamento di stringhe.

Dipartimento.xml#xptr(/DOCENTI/PERSONA[3]/CURRICULUM/string::3,ТТ)

Indirizza il terzo carattere del testo, che ш УtФ.

Dipartimento.xml#xptr(/DOCENTI/PERSONA[3]/CURRICULUM/string::3,ТnelТ,5,5)

Indirizza una stringa di cinque caratteri, presa dopo cinque caratteri a partire dalla terza occorrenza 
di УnelФ. Questa stringa ш la parola УcorsoФ.

Dipartimento.xml#xptr(/DOCENTI/PERSONA[3]/CURRICULUM/string::1,Т.Т,-5,4)

Indirizza una stringa di quattro caratteri, scelta cinque caratteri a sinistra della fine dalla prima oc-
correnza del punto  У.Ф. Tale stringa ш У1998Ф.
La selezione delle stringhe effettuata da XPointer ш sensibile alla differenza fra lettere maiuscole e 
minuscole, cosь come tutto il linguaggio XML. Pertanto se si cerca la stringa УintelligenzaФ:

Dipartimento.xml
#xptr(/DOCENTI/PERSONA[3]/CURRICULUM/string::1,ТintelligenzaТ) NO!

si avrр un errore, perche nel testo compare УIntelligenzaФ con la УIФ maiuscola.
XPath ed XPointer hanno varie funzioni pi∙ avanzate di quelle viste in questo paragrafo e nel з 6.3, 
ma sono ancora in fase di sviluppo e potrebbero cambiare con le future bozze di lavoro [1]. Per que-
sto motivo abbiamo presentato solo unТintroduzione a questi due linguaggi, che evidenziasse i loro 
principi ed il loro funzionamento.

7.6	Prime applicazioni di XML

7.6.1  Vocabolari XML

XML puЄ essere utilizzato per creare linguaggi di markup compatti e potenti, in grado di rispondere 
a qualunque esigenza di gestione e distribuzione di dati ed informazioni [5]. Tali linguaggi sono ap-
plicazioni XML, definite tramite particolari DTD e chiamate vocabolari XML [19]. Infatti, tutti 
questi linguaggi si differenziano per gli elementi e gli attributi che ne costituiscono il УvocabolarioФ, 
ma hanno in comune la grammatica di XML, composta dalle regole sintattiche esposte nel capi-
tolo 3.
Elenchiamo brevemente le pi∙ importanti applicazioni di XML finora definite:

? CDF (Channel Definition Format). Descrive il comportamento dei canali, pagine Web inviate 
su richiesta degli utenti ed aggiornate automaticamente con una certa frequenza. ╚ una delle 
prime applicazioni XML, ed ш supportata addirittura da Explorer 4.
? CML (Chemical Markup Language). ╚ un linguaggio in grado di rappresentare disposizioni 
complesse di atomi e molecole e di gestire documenti di tipo scientifico [5].
? SMIL (Synchronized Multimedia Integration Language). ╚ un linguaggio di presentazione 
multimediale, sviluppato allo scopo di fornire uno standard per la sincronizzazione degli ele-
menti multimediali allТinterno di una pagina Web [19].
? RDF (Resource Description Framework). Definisce i metadati, che descrivono in modo effica-
ce le varie fonti di informazioni contenute nel Web, come documenti, immagini, ecc. [1].
? SVG (Scalable Vector Graphics). ╚ un linguaggio di codifica delle immagini vettoriali, in grado 
di consentirne la visualizzazione allТinterno delle pagine Web [44]. 
? XHTML (eXtensible HyperText Markup Language). Ridefinisce HTML come applicazione 
XML. ╚ stato introdotto nel з 3.9.

In questo elenco manca una delle applicazioni pi∙ interessanti a livello scientifco: MathML 
(Mathematical Markup Language), al quale ш dedicato lТultimo paragrafo della tesina.
 
7.6.2  Cenni sul linguaggio MathML

MathML ш un linguaggio di markup basato su XML in grado di rappresentare su Web anche le for-
mule matematiche pi∙ complesse [5]. Esso comprende numerosi elementi, attributi ed entitр, orien-
tati a definire sia il contenuto che la rappresentazione delle formule [45]. Il browser Amaya, realiz-
zato dal W3C, supporta un sottoinsieme di MathML, costituito dagli elementi di presentazione 
[46]:

Tag
Significato
<math>
Radice del documento MathML
<mrow>
Riga. Tutto il contenuto di questo tag devТessere allineato orizzontal-
mente.
<mi>
Identificatore (variabile, costante, ecc.) 
<mn>
Numero
<mo>
Operatore matematico
<mroot>
Radice
<msqrt>
Radice quadrata
<mfrac>
Frazione
<msubsup>
Apice e pedice
<msup>
Apice
<msub>
Pedice
<munderover>
Sovrascrittura e sottoscrittura
<mover>
Sovrascrittura
<munder>
Sottoscrittura
<mmultiscripts>
Espressioni con indici multipli
<mtable>
Matrice (analogo a <TABLE> di HTML).
<mtr>
Riga di una matrice (analogo a <TR> di HTML).
<mtd>
Elemento di una matrice (analogo a <TD> di HTML).

In MathML lТinserimento dei simboli matematici viene effettuato tramite opportune entitр. Per mo-
tivi di spazio, ne introduciamo solo alcune:


Entitр
Significato
Simbolo
&florin;
Funzione di
?
&infin;
Infinito
?
&Integral;
Integrale
?
&Sum;
Sommatoria
?
&alpha;
Alfa minuscola (ш disponibile tutto lТalfabeto greco)
?
&PartialD;
Derivata parziale
?
&dtri;
Operatore nabla
?

Vediamo un esempio di documento MathML:

<math><mrow>      
	<mo>&florin;(</mo><mi>x</mi><mo>)=</mo>      
	<munderover>        
		<mo>&Sum;</mo>        
		<mrow>          
			<mi>n</mi><mo>=</mo><mn>0</mn>      			
		</mrow>        
		<mo>+&infin;</mo>      
	</munderover>      
	<mfrac>        
		<mrow>       
			<msup>
				<mo>&florin;</mo>
				<mrow>
					<mo>(</mo><mi>n</mi><mo>)</mo>
				</mrow>
          	</msup>
			<mrow>
				<mo>(</mo>
				<msub><mi>x</mi> <mi>0</mi></msub>
				<mo>)</mo>
			</mrow>
		</mrow>        
		<mrow>          
			<mi>n</mi><mo>!</mo>        
		</mrow>      
	</mfrac> 
	<msup>
		<mrow>  
			<mo>(</mo><mi>x</mi><mo>-</mo>
			<msub><mi>x</mi> <mi>0</mi></msub>      
			<mo>)</mo>    
		</mrow>
		<mi>n</mi>    
	</msup>
</mrow></math>

Esso produce la formula dello sviluppo in serie di Taylor di una funzione ?(x), che Amaya mostra in 
questo modo:


Dal confronto fra il listato e il risultato ottenuto, MathML sembra un linguaggio fin troppo compli-
cato. In realtр, il documento ш cosь lungo perchщ ш realizzato con i soli elementi di presentazione. 
MathML prevede numerosi altri elementi, chiamati elementi di contenuto, in grado di semplificare 
notevolmente la stesura delle formule matematiche [45]. Purtroppo essi non sono supportati 
dallТattuale versione di Amaya.

Appendice A: Guida rapida
  
In questТappendice sono elencate brevemente le sintassi dei vari markup dei linguaggi XML, XSL, 
XLink, ecc. introdotti nella tesina. Per ognuno di essi sono riportati i paragrafi da consultare per 
maggiori informazioni.

XML
 
Elemento contenente un attributo:
<Nome attributo=ФvaloreФ>Contenuto</Nome>

з 3.2.1
Elemento vuoto:
<Vuoto attributo=ФvaloreФ/>

з 3.2.1
Dichiarazione XML:
<?xml version="1.0" encoding="codifica" standalone=Фyes|noФ?>

з 3.4.1
Dichiarazione di tipo di documento:
<!DOCTYPE RADICE SYSTEM УIdentificatore_di_sistemaФ
[Sottoinsieme_interno_DTD]>

з 3.4.2
Dichiarazione di tipo di documento con identificatore pubblico:
<!DOCTYPE RADICE PUBLIC УIdentificatore_pubblicoФ 
УIdentificatore_di_sistemaФ [Sottoinsieme_interno_DTD]>

з 3.4.2
Riferimento ad un entitр generale:
&Nome;

зз 3.5 e 4.3
Riferimento ad un carattere:
&#Codice; oppure &#xCodice_hex;

з 3.6
Istruzione di elaborazione:
<?Istruzione?>

з 3.7
Associazione ad un foglio di stile XSL:
<?xml-stylesheet type="text/xsl" href="documento.xsl"?>

з 3.7
Commento:
<!--Commento-->

з 3.8
Dichiarazione standard per uno spazio dei nomi:
<ELEMENTO xmlns=ФURIФ>

з 4.6
Dichiarazione esplicita per uno spazio dei nomi:
<ELEMENTO xmlns:prefisso=ФURIФ>
з 4.6


DTD
 
Dichiarazione di un elemento:
<!ELEMENT NOME CONTENUTO>

з 4.1
Dichiarazione di un attributo:
<!ATTLIST ELEMENTO NOME TIPO IMPOSTAZIONE>

з 4.2
Dichiarazione di unТentitр generale:
<!ENTITY Nome Definizione>

зз 4.3.1 e 4.3.2
Dichiarazione di unТentitр parametro:
<!ENTITY % Nome Definizione>

з 4.3.3
Riferimento ad unТentitр parametro:
%Nome;

з 4.3.3
Dichiarazione di unТentitр esterna non analizzata:
<!ENTITY Nome SYSTEM "nome_file" NDATA Annotazione>

з 4.4
Annotazione:
<!NOTATION Annotazione Descrizione>
з 4.4

Spazi dei nomi
 
XSL:
http://www.w3.org/TR/WD-xsl

з 5.1
XLink (non supportato da Explorer 5):
http://www.w3.org/XML/XLink/0.9

з 7.1
HTML:
http://www.w3.org/TR/REC-html40

з 4.6
XML-Data:
urn:schemas-microsoft-com:xml-data

зз 4.7 e 6.1
Datatypes:
urn:schemas-microsoft-com:datatypes
з 6.1

XML-Data
 
Schema di XML-Data:
<Schema name="mio_schema"
        xmlns="urn:schemas-microsoft-com:xml-data"
        xmlns:dt="urn:schemas-microsoft-com:datatypes">

зз 4.7.2 e 6.1
Associazione ad uno schema:
<ELEMENTO xmlns="x-schema:schema.xml">

з 4.7.2
Associazione di alcuni elementi ad uno schema:
<ELEMENTO prefisso:xmlns="x-schema:schema.xml">

з 4.7.2
Dichiarazione di un elemento:
<ElementType name=ФNOMEФ content=Фempty|textOnly|eltOnly|mixedФ>
  <element type="nome_figlio" 
           minOccurs=ФminФ 
           maxOccurs=ФmaxФ
           dt:type="tipo"/>
[Eventuali riferimenti ad altri sottoelementi]
  <attribute type=ФATTRIBUTOФ 
             required=Фyes|noФ 
             default=Фvalore_di_defaultФ/>
[Eventuali riferimenti ad altri attributi]
</ElementType>

зз 4.7 e 6.1
Dichiarazione di un attributo:
<AttributeType name=ФATTRIBUTOФ
               required=Фyes|noФ 
               default=Фvalore_di_defaultФ
               dt:type="tipo"/>

зз 4.7.4 e 6.1
Tipo di dati di un elemento o attributo:
<datatype dt:type="tipo" />
зз 6.1 e 6.1.1
 
XSLT
 
Foglio di stile:
<xsl:stylesheet>

з 5.4
Modello:
<xsl:template match="pattern">

з 5.4
Applicazione degli altri modelli:
<xsl:apply-templates select="pattern" order-by=ФchiaviФ>

зз 5.4 e 6.7
Contenuto di un nodo:
<xsl:value-of select="pattern"/>

з 5.1
Selezione di pi∙ nodi:
<xsl:for-each select="pattern" order-by=ФchiaviФ>

зз 5.2 e 6.7
Script:
<xsl:script>

з 6.6.3
Valutazione di script:
<xsl:eval>

зз 5.5 e 6.6
Nome di un nodo:
<xsl:node-name/>

з 5.5

Copia di un nodo:
<xsl:copy select=ФpatternФ>


з 5.8.1
Generazione di un elemento: 
<xsl:element name=Фnome_elementoФ>

з 5.8.2
Generazione di un attributo: 
<xsl:attribute name=Фnome_attributoФ>

з 5.8.2
Generazione di unТistruzione di elaborazione:
 <xsl:pi name=Фnome_piФ>

з 5.8.2
Generazione di un commento: 
<xsl:comment>

з 5.8.2
Costrutto condizionale УifФ:
<xsl:if test="condizione">

з 6.8.1
Costrutto condizionale УchooseФ:
<xsl:choose>
<xsl:when test="condizione_1">contenuto_1</xsl:when>
<xsl:when test="condizione_2">contenuto_2</xsl:when>
[Е]
<xsl:when test="condizione_n">contenuto_n</xsl:when>
<xsl:otherwise>contenuto_0</xsl:otherwise>
</xsl:choose>

з 6.8.2
Ordinamento (sostituito in Explorer 5 dallТattributo order-by):
<xsl:sort select=ФpatternФ 
          data-type=Фtext|numberФ 
          order=Фascending|descendingФ/>

з 6.9
Risultato dellТapplicazione del foglio di stile (non supportato da Explorer 5):
<xsl:output method="html|xml|text"/>
з 6.9

XPath
 
I principali operatori di XPath sono elencati nella loro forma abbreviata nella tabella del з 6.3.

XLink (non supportato da Explorer 5)
 
Collegamento semplice:
<xlink:simple href="localizzatore"
              role=ФsignificatoФ
              title=ФtitoloФ
              show=Фreplace|new|parsedФ
              actuate=Фauto|userФ>

з 7.2


Collegamento esteso:
<xlink:extended role=ФsignificatoФ
                title=ФtitoloФ
                showdefault=Фreplace|new|parsedФ
                actuatedefault=Фauto|userФ>
  <xlink:locator href="localizzatore_1"
                 id=Фidentificatore_1Ф
                 role=Фsignificato1Ф
                 title=Фtitolo_1Ф/>
[Eventuali altri localizzatori]
  <xlink:arc from=Фidentificatore_iФ
             to=Фidentificatore_jФ
             show=Фreplace|new|parsedФ
             actuate=Фauto|userФ/>
[Eventuali altri archi]
</xlink:extended>



з 7.3
Introduzione di un collegamento in un elemento qualsiasi:
<ELEMENTO xlink:type=Фsimple|extended|locator|arcФ 
[Altri attributi relativi al collegamento, preceduti dal prefisso УxlinkФ] >

зз 7.1 e 7.2
Gruppo di collegamenti estesi:
<xlink:group steps="livelli_da_elaborare">
	<xlink:document href="localizzatore_1"/>
[Е]
</xlink:group>
з 7.4


Appendice B: Riferimenti bibliografici
  
Bibliografia

[1]
Charles F. Goldfarb, Paul Prescod. XML. McGraw-Hill, 1999.

[3]
Paolo Atzeni, Stefano Ceri, Stefano Paraboschi, Riccardo Torlone. Basi di dati. Concetti, 
linguaggi e architetture. McGraw-Hill, 1996.

[5]
Ed Tittel, Norbert Mikula, Ramesh Chandak. XML For Dummies. Apogeo, 1998.

[18]
Emily A. Vander Veer. JavaScript For Dummies Espresso. Apogeo, 1997.

[19]
William J. Pardi. XML in Action. Mondadori Informatica, 1999.


Bibliografia "on-line"

[2]
Dan Suciu. Semistructured data and XML. 1998.
http://www.research.att.com/~suciu/strudel/external/files/_F593433959.ps

[4]
Charles F. Goldfarb. A Brief History of the Development of SGML. SGML UsersТGroup, 
1990.
http://www.oasis-open.org/cover/sgmlhist0.html

[6]
Tim Bray, Jean Paoli, C. M. Sperberg-McQueen. Extensible Markup Language (XML) 1.0 
- W3C Recommendation 10-February-1998. W3C, 1998.
 http://www.w3.org/TR/1998/REC-xml-19980210.html

[7]
Paolo De Lazzaro. XML eXtensible Markup Language. HTML point, 1998.
 http://www.html.it/xml/index.html

[8]
Andrea Conti, Andrea Corsini, Massimo Vaglini. SGML. Universitр degli Studi di Firenze, 
1996. 
http://telemat.die.unifi.it/book/Internet/Sgml/indsgml.htm

[9]
Dave Raggett. XHTML:The Extensible Hypertext Markup Language. Da: March 1999 
W3LA event in Stockholm.
 http://www.w3.org/Talks/1999/03/24-stockholm-xhtml

[10]
Mark Johnson. XML for the absolute beginner. Web Publishing, 1999.
http://www.javaworld.com/javaworld/jw-04-1999/jw-04-xml_p.html

[11]
Marco Calvo, Fabio Ciotti, Gino Roncaglia, Marco Zela. Internet Т98. Laterza, 1998.
http://www.laterza.it/internet/internet98/online/00_indic.htm

[12]
Todd Freter. XML: Mastering Information on the Web. Sun Microsystem, 1998.
 http://www.sun.com/980310/xml

[13]
Chris Lilley, Vincent Quint. Extensible Stylesheet Language (XSL). W3C, 1999.
 http://www.w3.org/Style/XSL

[14]
XML for Managers. ArborText, 1998.
http://www.arbortext.com/Think_Tank/XML_Resources/XML_for_Managers/xml_for_ma
nagers.html

[15]
Jon Bosak. XML, Java, and the Future of the Web. 1997.
 http://www.xml.com/xml/pub/w3j/s3.bosak.html

[16]
Kevin Werbach. La guida Bare Bones di HTML. 1999.
http://werbach.com/barebones/it/it_barebone.html

[17]
Pierdomenico Corongiu. eXtensible Markup Language. 1999.
 http://control.dsi.unifi.it/corongiu/last-xml.html

[20]
James Clark. Associating Style Sheets with XML documents. W3C, 1999.
 http://www.w3.org/1999/06/REC-xml-stylesheet-19990629

[21]
Steven Pemberton, Murray Altheim, Daniel Austin et al. XHTMLЩ 1.0: The Extensible 
HyperText Markup Language. W3C, 1999.
 http://www.w3.org/TR/1999/xhtml1-19990505

[22]
Irшne Vatton. Amaya New Features History. W3C, 1999.
 http://www.w3.org/Amaya/User/New.html

[23]
XML Developer's Guide. Microsoft Corporation, 1999.
http://msdn.microsoft.com/xml/xmlguide/default.asp

[24]
Charles Heinemann. How Much Is That in Balboas? Accessing the Typed Value of XML 
Elements via Visual Basic. Microsoft Corporation, 1999.
http://msdn.microsoft.com/xml/articles/xml061598.asp

[25]
XSL Developer's Guide. Microsoft Corporation, 1999.
http://msdn.microsoft.com/xml/XSLGuide/default.asp

[26]
James Clark. XSL Transformations (XSLT) Specification. W3C, 1999.
 http://www.w3.org/1999/08/WD-xslt-19990813.html

[27]
Massimiliano Valente. Fogli di stile. HTML Point, 1999.
http://www.html.it/css/index.html

[28]
Stephen Deach. Extensible Stylesheet Language (XSL) Specification. W3C, 1999.
http://www.w3.org/TR/1999/WD-xsl-19990421

[29]
Norman Walsh. The XSL Debate: One Expert's View. 1999.
http://www.arbortext.com/Think_Tank/Norm_s_Corner/Issue_One/issue_one.html

[30]
Michael Leventhal. XSL Considered Harmful. 1999.
http://xml.com/xml/pub/1999/05/xsl/xslconsidered.html

[31]
Robin Cover. XSL/XSLT Software Support. Oasis, 1999.
http://www.oasis-open.org/cover/xslSoftware.html

[32]
XML Data Types Reference. Microsoft Corporation, 1999.
http://msdn.microsoft.com/xml/reference/schema/datatypes.asp

[33]
XML Schema Reference. Microsoft Corporation, 1999.
http://msdn.microsoft.com/xml/reference/schema/start.asp

[34]
Dan Connolly. Extensible Markup Language (XMLTM). W3C, 1999.
http://www.w3.org/XML/

[35]
James Clark. XML Namespaces.1999.
http://www.jclark.com/xml/xmlns.htm

[36]
XSL Reference. Microsoft Corporation, 1999.
http://msdn.microsoft.com/xml/reference/xsl/start.asp

[37]
XML DOM Reference. Microsoft Corporation, 1999.
http://msdn.microsoft.com/xml/reference/xmldom/start.asp

[38]
James Clark, Steve DeRose. XML Path Language (XPath) Version 1.0. W3C, 1999.
http://www.w3.org/1999/08/WD-xpath-19990813

[39]
Steve DeRose, David Orchard, Ben Trafford. XML Linking Language (XLink). W3C, 1999.
http://www.w3.org/1999/07/WD-xlink-19990726

[40]
Justin Ludwig. An Investigation of XML with Emphasis on Extensible Linking Language 
(XLL). College of Wooster, 1999.
http://pages.wooster.edu/ludwigj/xml/thesis.html

[41]
Gabe Beged-Dov. XArc (a.k.a. XLink--++).1998.
http://www.jfinity.com/xarc/spec-981221 

[42]
Robin Cover. XML Linking and Addressing Languages (XPath, XPointer, XLink). Oasis, 
1999.
http://www.oasis-open.org/cover/xll.html

[43]
Steve DeRose, Ron Daniel Jr. XML Pointer Language (XPointer). W3C, 1999.
http://www.w3.org/1999/07/WD-xptr-19990709

[44]
Chris Lilley. W3C Scalable Vector Graphics (SVG). W3C, 1999.
http://www.w3.org/Graphics/SVG/

[45]
Patrick Ion, Robert Miner. Mathematical Markup Language (MathMLЩ) 1.01 Specifica-
tion. W3C, 1999.
http://www.w3.org/1999/07/REC-MathML-19990707/

[46]
Vincent Quint, Irшne Vatton. Using Amaya. W3C, 1999.
http://www.w3.org/Amaya/User/Manual.html

[47]
Lauren Wood, Arnaud Le Hors, Vidur Apparao et al. Document Object Model (DOM) Le-
vel 2 Specification. W3C, 1999.
http://www.w3.org/TR/WD-DOM-Level-2/

II

111
I