Jak převést soubor XML, aby byl dobře formován

click fraud protection

Tento článek vysvětluje, jak psát dobře tvarované XML ukázáním příkladu. Zpravodaj Web Writer je psán ve formě XML; říkáme tomu AML nebo About Markup Language. I když se jedná o pracovní dokument, nejde o dobře vytvořený nebo platný dokument XML.

Dobře formovaný

Existují některá konkrétní pravidla pro vytvoření dobře vytvořeného dokumentu XML:

  • Deklarace XML musí být v každém dokumentu na prvním místě.
  • Komentáře nejsou ve značce platné. Komentáře nemusí obsahovat dvě pomlčky za sebou, kromě začátku a konce komentáře.
  • Značky musí mít například koncovou značku, nebo musí být uzavřeny v samotné singletonové značce.
  • Všechny atributy značek musí být uvozeny, nejlépe dvojité uvozovky, pokud samotný atribut neobsahuje uvozovky.
  • Každý dokument XML musí obsahovat jeden prvek, který zcela obsahuje všechny ostatní prvky.

Existují pouze dva problémy s dokumentem, díky nimž není dobře formovaný:

  • První věcí, kterou dokument AML potřebuje, je prohlášení XML.
  • Druhým problémem je, že žádný prvek zcela neuzavírá všechny ostatní prvky. Abychom to napravili, přidáme prvek externího kontejneru:
instagram viewer

Provedení těchto dvou jednoduchých změn (a zajištění toho, aby všechny prvky obsahovaly pouze CDATA) promění dobře vytvořený dokument na dobře vytvořený dokument.

Platný dokument XML je ověřen podle definice typu dokumentu (DTD) nebo schématu XML. Jedná se o sadu pravidel vytvořených vývojářem nebo organizací pro standardy, která definují sémantiku dokumentu XML. Tito řeknou počítači, co má dělat se značkami.

V případě About Značkovací jazyk, protože se nejedná o standardní jazyk XML, jako je XHTML nebo SMIL, DTD by vytvořil vývojář. Ten DTD by s největší pravděpodobností byl na stejném serveru jako dokument XML a odkazoval se na něj v horní části dokumentu.

Než začnete s vývojem DTD nebo schématu pro vaše dokumenty, měli byste si uvědomit, že jednoduše tím, že je dobře formovaný, dokument XML sám popisuje, a proto nepotřebuje DTD.

Například s naším dobře vytvořeným dokumentem AML existují následující značky:

Pokud jste obeznámeni s zpravodajem Web Writer, můžete poznat různé části zpravodaje. Díky tomu je velmi snadné vytvářet nové dokumenty XML ve stejném standardním formátu. Do značky bychom vždy vložili název celé délky a do značky adresu URL první sekce.

DTD

Pokud se od vás vyžaduje, abyste napsali platný dokument XML, a to buď pro použití dat, nebo pro jejich zpracování, zahrnuli byste jej do svého dokumentu se značkou. V této značce definujete základní značku XML v dokumentu a umístění DTD (obvykle webový identifikátor URI).

Například:

Jedna hezká věc na deklaracích DTD je, že můžete deklarovat, že DTD je lokální v systému, kde Dokument XML obsahuje „SYSTÉM“. Můžete také ukázat na veřejnou DTD, například s dokumentem HTML 4.0:

Když použijete obojí, říkáte dokumentu, aby použil konkrétní DTD (veřejný identifikátor) a kde ho najde (identifikátor systému).

Nakonec můžete zahrnout interní DTD přímo do dokumentu v rámci značky DOCTYPE. Například (nejedná se o úplný DTD pro dokument AML):

Schéma XML

Chcete-li vytvořit platný dokument XML, můžete také definovat XML pomocí dokumentu schématu XML. Schéma XML je dokument XML, který popisuje dokumenty XML. Zjistěte, jak napsat schéma.

Poznámka

Pouhé ukázání na schéma DTD nebo XML nestačí. XML, který je v dokumentu, se musí řídit pravidly v DTD nebo schématu. Použití ověřovacího analyzátoru je jednoduchý způsob, jak zkontrolovat, zda vaše XML dodržuje pravidla DTD. Mnoho takových analyzátorů najdete online.

instagram story viewer