Langage de balisage
Saviez-vous ...
SOS Enfants a essay?? de rendre le contenu plus accessible Wikipedia par cette s??lection des ??coles. Les enfants SOS est le plus grand don de charit?? du monde enfants orphelins et abandonn??s la chance de la vie familiale.
Un langage de balisage est un langue artificielle en utilisant un ensemble d'annotations au texte qui d??crivent comment le texte doit ??tre structur??, am??nag??, ou format??. Les langages de balisage ont ??t?? en usage depuis des si??cles, et ces derni??res ann??es ont ??galement ??t?? utilis??s dans les syst??mes de composition de l'informatique et de traitement de texte.
Un exemple bien connu d'un langage de balisage en usage aujourd'hui dans l'informatique est Langage Signal??tique Hyper Text ( HTML), l'un des plus utilis?? dans le World Wide Web . HTML suit certaines des conventions de balisage utilis??s dans l'industrie de l'??dition dans la communication de travail imprim?? entre auteurs, ??diteurs et imprimeurs.
Histoire
Le terme balisage est d??riv?? de la pratique de l'??dition traditionnelle de "baliser" 'un manuscrit, qui consiste ?? ajouter symbolique les instructions de l'imprimante dans les marges d'un manuscrit de papier. Pendant des si??cles, cette t??che a ??t?? effectu??e principalement par les typographes qualifi??s connus comme des ??hommes de balise" qui ont marqu?? jusqu'?? texte pour indiquer ce que police, le style et la taille doit ??tre appliqu?? ?? chaque partie, puis pass?? le manuscrit ?? d'autres pour la composition ?? la main. Markup a ??galement ??t?? couramment appliqu??e par les ??diteurs, correcteurs, et graphistes.
GenCode
L'id??e de langages de balisage a apparemment ??t?? d'abord pr??sent?? par la direction publication William W. Tunnicliffe lors d'une conf??rence en 1967, bien qu'il pr??f??re l'appeler ??codage g??n??rique." Tunnicliffe plus tard diriger l'??laboration d'une norme appel??e GenCode pour l'industrie de l'??dition. concepteur du livre Stanley Fish a ??galement publi?? la sp??culation dans le m??me sens ?? la fin des ann??es 1960. Brian Reid, dans sa th??se ?? 1980 Carnegie Mellon University, a d??velopp?? la th??orie et la mise en oeuvre de travail de balisage descriptif en utilisation r??elle. Toutefois, IBM chercheur Charles Goldfarb est plus commun??ment consid??r??e aujourd'hui comme le ??p??re?? des langages de balisage, en raison de son travail sur IBM GML, puis en tant que pr??sident de la Organisation internationale pour les comit?? de normalisation qui se est d??velopp??e SGML, le premier syst??me de marquage descriptif largement utilis??. Goldfarb a eu l'id??e de base tout en travaillant sur un projet t??t pour aider un journal informatiser son flux de travail, m??me si le dossier publi?? ne pr??cise pas quand. Il est ensuite devenu familier avec le travail de Tunnicliffe et Fish, et a entendu un expos?? d??but par Reid qui a d??clench?? outre son int??r??t.
Les d??tails de l'histoire des d??buts de langages de balisage descriptives sont chaudement d??battus. Cependant, il est clair que la notion ??tait ind??pendamment d??couvert ?? plusieurs reprises tout au long des ann??es 70 (et peut-??tre la fin des ann??es 60), et est devenu une pratique importante dans les ann??es 80.
Certains des premiers exemples de langages de balisage disponibles en dehors de l'industrie de l'??dition peuvent ??tre trouv??s dans les outils de composition sur Unix syst??mes tels que troff et nroff. Dans ces syst??mes, les commandes de formatage ont ??t?? ins??r??s dans le texte du document afin que le logiciel de composition pourrait formater le texte selon les sp??cifications de l'??diteur. C'??tait un essais et erreurs processus it??ratif pour obtenir un document imprim?? correctement. Disponibilit?? des WYSIWYG (??ce que vous voyez est ce que vous obtenez") logiciel de publication supplant?? beaucoup d'utilisation de ces langues parmi les utilisateurs occasionnels, si le travail d'??dition s??rieuse utilise encore balisage pour sp??cifier la structure non-visuelle de textes.
TeX
Une autre norme de publication majeure est TeX , cr???? et constamment perfectionn?? par Donald Knuth dans les ann??es 1970 et 80. TeX concentr??e sur la disposition d??taill??e des descriptions de textes et de police afin de composer des livres math??matiques en qualit?? professionnelle. Cette n??cessaire Knuth passer un temps consid??rable enqu??ter sur l'art de composition. Cependant, TeX a une courbe d'apprentissage abrupte, de sorte qu'il est principalement utilis?? dans le milieu universitaire, o?? il est le standard de facto dans de nombreuses disciplines scientifiques. Un ensemble de macros TeX appel?? LaTeX fournit un syst??me de balisage descriptive sur le dessus de TeX, et est largement utilis??.
Scribe, GML et SGML
La premi??re langue de faire une distinction claire et nette entre la structure et la pr??sentation ??tait certainement Scribe, d??velopp?? par Brian Reid et d??crit dans sa th??se de doctorat en 1980. Scribe ??tait r??volutionnaire dans un certain nombre de fa??ons, pas moins qu'il a introduit l'id??e de styles s??par??s du document balis??, et d'un grammaire contr??le de l'utilisation d'??l??ments descriptifs. Scribe influenc?? le d??veloppement de Generalized Markup Language (SGML tard) et est un anc??tre direct en HTML et LaTeX.
Au d??but des ann??es 1980, l'id??e que le balisage devrait ??tre ax??e sur les aspects structurels d'un document et de laisser la pr??sentation visuelle de cette structure ?? l'interpr??te a conduit ?? la cr??ation de SGML. La langue a ??t?? ??labor?? par un comit?? pr??sid?? par Goldfarb. Il a int??gr?? les id??es de nombreuses sources diff??rentes, y compris le projet de Tunnicliffe, GenCode. Sharon Adler, Anders Berglund, et James A. Marke ??taient ??galement membres cl??s du comit?? SGML.
SGML sp??cifi?? une syntaxe pour y compris le balisage dans les documents, ainsi que l'un pour d??crire s??par??ment ce que les balises ont ??t?? autoris??s, et o?? (la Document Type Definition ( DTD) ou sch??ma). Cela a permis aux auteurs de cr??er et d'utiliser toutes les balises qu'ils souhaitaient, en s??lectionnant les balises qui ont fait le plus de sens pour eux et ont ??t?? nomm??s dans leurs propres langues naturelles. Ainsi, SGML est proprement une m??ta-langage, et de nombreux langages de balisage particuliers sont d??duits. De la fin des ann??es 80 sur, la plupart des importants nouveaux langages de balisage ont ??t?? bas?? sur le syst??me SGML, y compris par exemple TEI et DocBook. SGML a ??t?? promulgu??e en tant que Norme internationale par Organisation internationale de normalisation, ISO 8879, en 1986.
SGML trouv?? une large acceptation et l'utilisation dans les champs avec les exigences de documentation tr??s grande ??chelle. Cependant, il a ??t?? g??n??ralement jug??e lourde et difficile ?? apprendre, un effet secondaire d'essayer d'en faire trop et trop souple. Par exemple, SGML fait fin tags (ou start-tags, ou m??me les deux) en option dans certains contextes, parce qu'il pensait que le balisage serait fait manuellement par le personnel de soutien surmen??s qui appr??cieront frappes ??pargne.
HTML
En 1991, il est apparu ?? beaucoup que SGML serait limit??e ?? des applications commerciales et fond??es sur des donn??es tout en Outils WYSIWYG (qui documents enregistr??s dans des formats binaires propri??taires) suffirait pour d'autres applications de traitement de documents.
La situation a chang?? lorsque Sir Tim Berners-Lee , l'apprentissage ?? partir de SGML coll??gue Anders Berglund et d'autres ?? CERN, utilis?? la syntaxe SGML pour cr??er HTML. HTML ressemble ?? d'autres langues en fonction tag-SGML, m??me si elle a commenc?? comme simple que la plupart et une DTD formelle n'a pas ??t?? d??velopp?? plus tard. DeRose fait valoir que l'utilisation de HTML de balisage descriptif (et SGML en particulier) a ??t?? un facteur majeur dans le succ??s du Web, en raison de la flexibilit?? et l'extensibilit?? qui lui a permis (autres facteurs comprennent la notion d'URL et la distribution gratuite de navigateurs). HTML est fort probable langage de balisage le plus utilis?? dans le monde d'aujourd'hui.
Toutefois, le statut de HTML comme un langage de balisage est contest?? par certains scientifiques informatiques. L'argument est que HTML restreint le placement des ??tiquettes, les obligeant ?? ??tre enti??rement imbriqu?? dans d'autres balises, ou la balise racine du document. Pour cette raison, ces chercheurs ne sugg??rent plut??t que HTML est un langage de r??cipient, suite ?? un Mod??le hi??rarchique.
XML
XML (Extensible Markup Language) est un langage de balisage m??ta qui est maintenant largement utilis??. XML a ??t?? d??velopp?? par le Consortium World Wide Web, dans un comit?? cr???? et pr??sid?? par Jon Bosak. Le but principal de XML ??tait de simplifier SGML en se concentrant sur un probl??me particulier - documents sur Internet. XML reste un m??ta-langage comme SGML, permettant aux utilisateurs de cr??er des balises n??cessaires (d'o?? "extensible") et puis en d??crivant ces balises et leurs utilisations autoris??es.
adoption de XML a ??t?? aid?? parce que chaque document XML peut ??tre ??crit de telle mani??re que ce est aussi un document SGML, et les utilisateurs et les logiciels SGML existants pourrait passer ?? XML assez facilement. Cependant, XML ??limin?? un grand nombre des caract??ristiques plus complexes et orient?? l'homme de SGML pour simplifier la mise en ??uvre (tout en augmentant la taille de balisage et de r??duire la lisibilit?? et modifiable). Autres am??liorations rectifi??es certains probl??mes SGML dans les milieux internationaux, et ont permis d'analyser et d'interpr??ter hi??rarchie des documents m??me si aucun DTD est disponible.
XML a ??t?? con??u principalement pour les environnements semi-structur??s tels que des documents et publications. Cependant, il est apparu de frapper un sweet spot entre la simplicit?? et la flexibilit??, et a ??t?? rapidement adopt?? pour de nombreux autres usages. XML est maintenant largement utilis?? pour communiquer donn??es entre applications. Comme HTML, il peut ??tre d??crit comme une langue ??conteneur??.
XHTML
Depuis Janvier 2000, tous Recommandations W3C pour le HTML ont ??t?? bas?? sur XML plut??t que SGML, en utilisant l'abr??viation XHTML (E x H tensible yper T ext M arkup L anguage). La sp??cification du langage exige que les documents Web XHTML doivent ??tre des documents XML bien form??s - ce qui permet pour les documents plus rigoureuses et robustes tout en utilisant les balises famili??res du HTML.
Une des diff??rences les plus notables entre HTML et XHTML est la r??gle que toutes les balises doivent ??tre ferm??es: Les balises HTML vides tels que
doivent soit ??tre ferm?? avec une balise de fin r??guli??re, ou remplac?? par une forme particuli??re:
(L'espace avant le ' /
'sur la balise de fin est facultative, mais souvent utilis?? car il permet ?? certains navigateurs Web pr??-XML, SGML et analyseurs, ?? accepter l'??tiquette). Une autre est que toutes valeurs d'attributs dans les balises doivent ??tre indiqu??s. Enfin, tous les noms de balises et attributs doivent ??tre en minuscules pour ??tre valide; HTML, d'autre part, ??tait insensible ?? la casse.
Autres applications XML
Beaucoup d'applications XML existent maintenant, y compris Resource Description Framework (RDF), XForms, DocBook, SOAP et la (Web Ontology Language OWL). Pour une liste partielle de ces voir Liste des langages de balisage XML.
Caract??ristiques
Une caract??ristique commune ?? de nombreux langages de balisage, ce est qu'ils m??langent le texte d'un document avec des instructions de balisage dans le m??me flux de donn??es ou un fichier. Ceci ne est pas n??cessaire; il est possible d'isoler balisage du contenu du texte, l'utilisation de pointeurs, les d??calages, IDS, ou d'autres m??thodes pour coordonner les deux. Cette ??balisage impasse" est typique pour les repr??sentations internes des programmes utilisent pour travailler avec des documents annot??s. Cependant, int??gr?? ou "inline" balisage est beaucoup plus fr??quent ailleurs. Voici, par exemple, est une petite section de texte balis?? en HTML:
Anatid??s
La famille des anatid??s comprend notamment les canards, les oies et les cygnes, mais pas les hurleurs ??troitement li??s.
Les codes enferm??s dans des ??querres En revanche, le Le Text Encoding Initiative (TEI) a publi?? des lignes directrices d??taill??es sur la fa??on de coder textes d'int??r??t dans les sciences humaines et sociales, d??velopp??s par des ann??es de travail de coop??ration internationale. Ces lignes directrices sont utilis??es par les projets codant documents historiques, les travaux des sp??cialistes particuliers, les p??riodes ou les genres, et ainsi de suite. Si l'id??e de langage de balisage origine avec les documents texte, il ya une utilisation croissante des langages de balisage dans des domaines comme des graphiques vectoriels, services Web, syndication de contenu, et des interfaces utilisateur. La plupart de ces applications XML parce que ce est une langue bien d??finie et extensible. L'utilisation de XML a ??galement conduit ?? la possibilit?? de combiner plusieurs langages de balisage dans un seul profil, comme XHTML + SMIL et XHTML + MathML + SVG h1
, p
, et em
sont des exemples de balisage structurel, en ce qu'ils d??crivent la destination ou la signification du texte, ils comprennent. Plus pr??cis??ment, h1
signifie ??ce est un titre de premier niveau", p
signifie ??ce est un paragraphe" et em
signifie ??ce est un mot ou une phrase soulign??". Un programme interpr??ter un tel balisage structurel peut appliquer ses propres r??gles ou des styles de pr??sentation des diff??rents morceaux de texte, en utilisant des polices de caract??res differents, l'audace, la taille, l'indentation, la couleur, ou d'autres styles, comme vous le souhaitez. Une ??tiquette comme ??H1?? (titre de niveau 1) pourrait ??tre pr??sent?? dans un grand gras sans-serif, par exemple, ou dans un document ?? espacement fixe (machine ?? ??crire), il pourrait ??tre soulign?? - ou il pourrait ne pas changer la pr??sentation au tout. i
balise HTML est un exemple de balisage de pr??sentation; il est g??n??ralement utilis?? pour sp??cifier une caract??ristique particuli??re du texte (dans ce cas, l'utilisation d'un italique) sans pr??ciser la raison de cette apparence. Utilisation alternative