Реферат по предмету "Лингвистика"


Стандарт XML. (Укр)

Стандарт XML. Призначення та структура. Вдмнност вд HTML. Що таке XML XML eXtensible Markup Language - це розширювана мова розмтки тексту, запропонована W3C у 1996 роц. Це мова, яка повною мрою визнача логчну структуру документа. Задача XML поляга в тому, щоб дан тексти, зображення або нш частини Web-документа могли бути визначен структурован незалежно вд платформи , що х вдтворю, постачальника


його програмного забезпечення, наприклад Web-браузерв. При створенн документв з використанням XML, ви можете використовувати ваш власн елементи структури для розмтки вмсту ваших документв. Можливо визначити DTD a Document Type Definition, тобто визначення типу документа. DTD визнача те, що можна назвати граматикою документа - це список рзномантних елементв хнх утворень


для використання у визначених документах, у чомусь це нагаду використання CSS, тобто ви можете зробити посилання на DTD, що знаходиться або в мереж або написати його безпосередньо у вашому документ. Таким чином, вмст документа, його структура, типи використвуваних у ньому елементв його видгляд визначаться окремо, тобто незалежно один вд одного. Чому XML Потрбно сказати, що XML корисний для автоматизованих програмних засобв, що шукають у


Web. Недосконалсть HTML призвела до того, що мережа перетворилася в мшанину тексту, повну рзномантних елементв тегв, часто використовуваних, що називаться Pro Forma нчого не значущих. XML ма величезний потенцал для удосконалення гпертекста. Наприклад у HTML для створення звязку використовуться елемент A, XML же дозволя створити не просто посилання, а наприклад, двонаправлений звязок.


Перспектива XML поляга в тому, що вн буде використовуватися для опису нших мов розмтки, наприклад, JavaScript, що використовуться в HTML-документах. XML розроблений для того, щоб спростити полегшити використання SGML, при цьому збергши його велик можливост по створенню, поширенню публкац Web-документв мереж. Вступ Незважаючи на те, що XML дуже молода


W3C затвердила специфкацю Extensible Markup LanguageXML 1.0 на початку лютого 1998 г окрем компоненти ц мови знаходяться ще в стад доробки, уже сьогодн зявляються нов мови, створен на основ XML, виникають численн Web-сервери, що використовують цю технологю для органзац нформац , що збергаться на них. Для чого потрбна нова мова розмтки Мова розмтки документв - це набр спецальних нструкцй, називаних тегами, призначених для формування в документах якось структури визначення вдношень мж рзномантними


елементами ц структури. Теги мови, або, як х нод називають, управляюч дескриптори, у таких документах якимось чином кодуються, видляються щодо основного вмсту документа служать у якост нструкцй для броузера. Всю красу XML можна зрозумти тльки при порвнянн його з HTML. Формалзована у RFC 1866 у 1995 роц, HTML найбльш популярною мовою розмтки у всьому свт. Термн розмтка стосовно до документа означа звичайно усе, що не вдноситься до його нформацйного наповнення.


У ранню пору свого розвитку мова HTML пдносилася як засб масштабованого форматування документв, яку можна було б використовувати для обмну нформацю практично на будь-якй платформ. У основ HTML лежить украй проста дея ви визначате нескладну мову, що опису структуру документа, чекате, коли компан розроблять програмн засоби, спроможн подавати так документи в рзномантних операцйних середовищах з урахуванням обраних користувачем параметрв. За допомогою


HTML можна було б створювати матерали, що допускають представлення в будь-якому взуальному або звуковому формат. Проте поступово ставало ясно, що ця дея, незважаючи на свою простоту, йде врозрз з узвичаною практикою видавничих систем. Традицйний механзм пдготування публкацй передбача, що графчн дизайнери компоновщики повинн брати до уваги специфчн особливост презентацйного середовища, включаючи розмр листа, яксть друку, палтру кольорв т.п. Виявилося, що переключитися з такого методу на бльш простий, при якому


автор вдповда лише за вмст логчну структуру документа, перекладаючи презентацйн обовязки на користувацьк програми, досить важко. У файл HTML у його вихдному вид теги форматування перемшан з звичайним текстом. Головною особливстю розмтки HTML , звичайно, можливсть вставки посилань на зовншн документи або на внутршн роздли того ж самого документа. HTML процвтав не тльки як адаптована мова розмтки, але й у якост промжного програмного забезпечення. Завдяки свой дешевизн поширеност браузери


Web являють собою вдмнних клнтв за посередництвом HTML вони можуть сплкуватися з найрзномантншими серверами. Проте HTML стикнувся з певними труднощами. Його обмежен можливост форматування намагалися перебороти за допомогою CSS, нцативи TrueDoc вд Bitstream звсно ж множини специфчних розширень для браузера а його обмежен можливост в якост промжного ПО - за допомогою Java, Active т.п. Проте все це не усува його фундаментальн недолки.


По сут, HTML - це технологя представлення нформац, вона опису те, як браузер повинний скомпонувати текст графк на сторнц. У результат те, що ви бачите це усе, що ви одержуте. Нема някого способу описати дан незалежно вд вдображення цих даних за винятком надзвичайно слабко системи ключових слв у заголовку сторнки Web. Байдужнсть до структури документа призводить до того, що пошук або аналз нформац усередин нього нчим не буде вдрзнятися вд роботи з суцльним, не розбитим на елементи


текстовим файлом. Це головна причина, чому так важко знайти потрбну нформацю за допомогою механзму пошуку. Клнт не ма няких менше прийнятних засобв витягу даних з сторнки Web для подальшо роботи з ними. Дал, на будь-який конкретнй сторнц Web клнт одержу тльки одне представлення конкретно множини даних. Припустимо, що ви переглядате список аукцонв eBay, упорядкований по дат вдкриття торгв.


Якщо ви захочете глянути на той же список, але вдсортований по дат закриття торгв, то вашому браузеру прийдеться посилати новий запит серверу. У свою чергу серверу прийдеться наново вдправляти повну сторнку HTML з списком аукцонв. Такого роду манпулювання даними веде до значного збльшення числа звертань до серверв Web утрудню, таким чином, х подальше масштабирование. нша проблема з HTML у тому, що це плоска мова, тобто автори не можуть використовувати для надання нформац про рархю


даних. Дал, вона непослдовна тому утрудня розбр тексту програмним забезпеченням. Наприклад, хоча бльшсть вдкриваючих тегв, так, як B або H1 ма вдповдн закриваюч теги, деяк наприклад, P х не мають. стотним недолком HTML можна назвати обмеженсть набору його тегов. DTD-правила для HTML визначають фксований набр дескрипторв тому в розробника нема можливост вводити


власн, спецальн теги. Простим ршенням для деяких з перерахованих проблем було би введення додаткових тегв HTML, таких, як NAME , DATE або PRICE . З хньою допомогою клнт мг би визначити, що собою являють дан, вдображати х по-рзному або експортувати по запиту користувача. Якщо ж ви виршите не чекати змни стандарту, то майте на уваз, що ви створюте щось сво, нестандартне тим самим вдмовлятеся вд одн з головних переваг HTML.


Тому в 1996 роц члени робочо групи Консорцуму World Wide Web W3C повернулися до розгляду стандартно узагальнено мови розмтки Standard Generalized Markup Language, SGML, сильно спрощеним нащадком якого HTML. Запропонована у 1974 роц Чарльзом Голдфарбом, SGML явля собою метамову - систему для опису нших мов.


Ця мова призначена для створення нших мов розмтки, вн визнача припустимий набр тегв, хн атрибути внутршню структуру документа. При всх свох можливостях вона занадто складна для бльшост браузеров Web одна специфкацй SGML займа понад 500 сторнок. Спростивши SGML для використання з Web, група запропонувала XML рекомендаця W3C по статусу на лютий 1998 року. XML пдмножина SGML, причому любий дйсний документ


XML дйсним документом SGML як SGML, XML - це метамова, що визнача нш мови розмтки для специфчних цлей. Наприклад, мова синхронзовано нтеграц мультимеда Synchronized Multimedia Integration Language, SMIL базуться на XML. Консорцум W3C, закликаючи до використання XML у Web, фактично пропону кожному сконструювати особисту мову для свох гпертекстових документв, причому для рзних документв це будуть рзн мови.


XML дозволя визначити формальний синтаксис мови, наприклад правила вкладення елементв. Семантику можна, звичайно, описувати на звичайнй англйськй мов. XML використовуться для розмтки стандартних документв багато в чому так само, як HTML. Проте XML перевершу його при робот з структурованими даними, такими, як результати запиту, метанформаця про вузол Web або елементи типи схеми. Документ XML вигляда багато в чому схожим на


HTML. Вн також складаться з текстових фрагментв, анотованих вкладеними в кутов дужки тегами. Проте, на вдмну вд HTML, змст тега залежить вд регстра, а кожний вдкриваючий тег повинний в усх випадках мати парний закриваючий тег. XML Extensible Markup Language-э те мова розмтки, що опису цлий клас обктв даних, називаних XML- документами. Ця мова використовуться в якост засобу для опису грамматики нших мов контролю за правильнстю


впорядкування документв. XML не мстить няких тегв, призначених для розмтки, а просто визнача порядок х створення. Таким чином, якщо, наприклад, ми вважамо, що для позначення елемента rose у документ необхдно використовувати тег flower , то XML дозволя вльно використовувати обумовлений нами тег ми можемо включати в документ фрагменти, подбн такому flower rose flower Таким чином, у розробникв зявляться ункальна можливсть визначати власн команди, що дозволяють м найбльш


ефективно визначати дан, що збергаються в документ. Автор документа створю його структуру, буду необхдн звязки мж елементами, використовуючи т команди, що задовольняють його вимогам домагаться такого типу розмтки, що необхдно йому для виконання операцй перегляду, пошуку, аналзу документа. Ще одною з очевидних переваг XML можливсть використання в якост унверсально мови запитв до сховищ нформац.


Сьогодн в глибинах W3C знаходиться на розгляд робочий варант стандарту XML-QL або XQL, що, можливо, у майбутньому складе серйозну конкуренцю SQL. Крм того, XML-документи можуть виступати в якост ункального засобу збереження даних, що мстить у соб одночасно засоби для розбору нформац й представлення на сторон клнта. У цй област одним з перспективних напрямкв нтеграця


Java XML - технологй, що дозволя використовувати мць обох технологй при побудов машинно-незалежних додаткв, що використовують, крм того, унверсальний формат даних при обмн нформацю. XML дозволя також здйснювати контроль за коректнстю даних, що збергаються в документах, робити переврки рархчних спввдношень усередин документа встановлювати диний стандарт на структуру документв, умстом яких можуть бути сам рзномантн дан. Це означа, що його можна використовувати при побудов складних нформацйних


систем, у котрих дуже важливим питання обмну нформацю мж рзномантними додатками, що працюють в однй систем. Створюючи структуру механзму обмну нформац на самому початку роботи над проектом, менеджер може позбути себе в майбутньому вд багатьох проблем, повязаних з несумснстю використовуваних рзномантними компонентами системи форматв даних. На основ XML уже сьогодн створен так вдом спецалзован мови розмтки, як SMIL, CDF, MathML, XSL, список робочих проектв нових мов, що знаходяться на розгляд


W3C, постйно поповнються. Структура документа Не обмежуючи автора яким-небудь фксованим набором тегв, XML дозволя йому вводити будь-як мена. Ця можливсть ключовою для активного манпулювання даними. Приклад для порвняння представлення списку мен адрес на HTML на XML. От фрагмент HTML H1 Еditor Сontacts H1 H2 мя Джонатан Эйнджел H2 P Посада старший редактор


P P Видання Network Magazine P P Вулиця будинок Гарсона, 600 P P Мсто Сан-Франциско P P Штат Калфорня P P ндекс 94107 P P Електронна пошта jangelmfi. com P Теги розмщають дан на екран, але нчого не повдомляють про хню структуру. У випадку XML той же самий фрагмент буде поданий у такий спосб збережений у файл EDITORS. XML. xml version 1.0 xml-stylesheet typetextxsl hrefeditors.xsl editorcontacts editor firstname


Jonatan firstname lastname Andjel lastname title chif editor title publication Network Magazine publication address street Garissona, 600 street city San-Francisko city state California state zip 94107 zip address email jangelmfi.com email editor editorcontacts У XML теги не можуть накладатися, як у HTML, проте вони можуть бути вкладен один в одний.


Насправд, вкладення навть рекомендуться як засб створення рарх даних пдпорядкован або рвноправн вдношення. Як очевидно з приведеного приклада, так елементи, як firstname email , мстять дан, у той час як нш address присутн тльки з метою структурування. Теги початку кнця елемента основними використовуваними в XML розмтками, але ними справа не вичерпуться. Наприклад, елементам можуть бути привласнен атрибути. Ця можливсть аналогчна наявнй в HTML, де, наприклад, елементу table може бути привласнений атрибут


aligncenter. У XML елемент може мати один або бльше повязаних з ним атрибутв, причому при упорядкуванн документа ви можете видумати х стльки, скльки побажнете, наприклад publication topicnetworking circulationcontrolled . Документи XML можуть мстити посилання на нш обкти. Посилання являють собою рядок, що починаться з амперсанта закнчуться . Ц посилання дозволяють, зокрема, вставити в документ спецальн символи.


Посилання XML на обкти надають набагато бльше можливостей, тому що вони можуть посилатися на визначен автором роздли тексту в тому ж самому або в ншому документ. Наприклад, посилання на обкти дозволяють застосувати обктно-орнтований пдхд при створенн журнально статт article introduction sidebar conclusion resources article Найпростший XML- документ може виглядати так, як це показано в


Приклад 1 xml version1.0 listofitems item id1 first Перший item item id2 Другий subitem пдпункт 1 subitem item item id3 Третй item item id4 last Останнй item listofitems У XML снують вдкриваюч, закриваюч порожн теги у HTML поняття порожнього тэга теж сну, але спецального його позначення не потрбно. Тло документа XML складаться з елементв розмтки markup безпосередньо вмсту


документа - даних content. XML - теги призначен для визначення елементв документа, хнх атрибутв нших конструкцй мови. Любий XML-документ повинний завжди починатися з нструкц xml , усередин яко також можна задавати номер верс мови, номер кодово сторнки й нш параметри, необхдн програм-аналзатору в процес розбору документа. Правила створення XML- документа У загальному випадку XML- документи повинн задовольняти таким вимогам У заголовку документа помщаться оголошення


XML, у якому вказуться мова розмтки документа, номер верс додаткова нформаця Кожний вдкриваючий тег, що визнача деяку область даних у документ обовязково повинний мати вдповдний закриваючий тег У XML враховуться регстр символв Вс значення атрибутв, використовуваних у визначенн тегв, повинн бути взят в лапки Вкладенсть тегв у XML строго контролються, тому необхдно стежити за порядком слдування вдкриваючих закриваючих тегв Вся нформаця, що розташовуться мж початковим кнцевими тегами,


розглядаться в XML як дан тому враховуються вс символи форматування Якщо XML- документ не порушу приведен правила, то вн називаться формально-правильним вс аналзатори, призначен для розбору XML- документв, зможуть працювати з ним коректно. З XML-документом повязан три рвн коректност Правильно побудований XML-документ - це такий, у якому елементи правильно структурован у вигляд дерева з коректно розставленими


вдкриваючих закриваючих тегами. Дючий XML-документ правильно побудований мстить теги, що вдповдають оголошенню типу документа. Вн мстить тльки елементи значення атрибутв, що вдповдають DTD. Хоча XML-документ може пдготовлятися читатися без DTD, DTD стотно для встановлення двост. Синтаксически коректний XML-документ знаходиться поза контролем XML. Розробник такого документа вдповда за його логчну структуризацю.


Проте крм переврки на формальну вдповднсть граматиц мови, у документ можуть бути присутнм засоби контролю над вмстом документа, за дотриманням правил, що визначають необхдн спввдношення мж елементами формуючою структурою документа. Наприклад, наступний текст, будучи цлком правильним XML- документом, буде абсолютно безглуздим country title Russia title city title Novosibirsk country title city


Для того, щоб забезпечити переврку коректност XML-документв, необхдно використовувати аналзатори, що роблять таку переврку називаються верифкованими. На сьогодншнй день сну два способи контролю правильност XML-документа DTD - визначення Document Type Definition схеми даних Semantic Schema. Визначення DTD- правил у XML не необхднстю. Конструкц мови Вмст XML- документа явля собою набр елементв, секцй


CDATA, директив аналзатора, коментарв, спецсимволв, текстових даних. Елементи даних Елемент - це структурна одиниця XML- документа. Вкладаючи слово rose в у тэги flower flower , ми визначамо непустий елемент, названий flower , вмстом якого rose. У загальному випадку в якост вмсту елементв можуть виступати як простий текст, так нш, вкладен, елементи документа, секц CDATA, нструкц з опрацювання, коментар тобто практично будь-як частини


XML- документа. Любий непустой елемент повинний складатися з початкового, кнцевого тегов даних, мж ними заключених. Наприклад, наступн фрагменти будуть бути елементами flower rose flower city Novosibirsk city ,а ц - н rose flower rose Набором всх елементв, що мстяться в документ, задаться його структура визначаються вс рархчн спввдношення. Плоска модель даних перетворються з використанням елементв у складну рархчну систему з множиною можливих звязкв мж елементами.


Наприклад, у такому приклад ми описумо мсце розташування Новосибрських унверситетв вказумо, що Новосибрський Унверситет розташований у мст Новосибрську, що, у свою чергу, знаходиться в Рос, використовуючи для цього вкладенсть елементв XML country idRussia cities-list city title Новосибрськ title state Siberia state universities-list university id2 title


Новосибрський Державний Технчний Унверситет title noprivate address URLwww.nstu.ru description дуже гарний нститут description university university id2 title Новосибрський Державний Унверситет title noprivate address URLwww.nsu.ru description теж не погано description university universities-list city cities-list country Проводячи пошук у цьому документ, програма клнта буде спиратися на нформацю, закладену в його структуру


- використовуючи елементи документа. Тобто, якщо, наприклад, потрбно знайти потрбний унверситет у потрбному мст, використовуючи приведений фрагмент документа, то необхдно буде переглянути вмст конкретного елемента university , що знаходиться всередин конкретного елемента city . Пошук при цьому, природно, буде набагато бльш ефективним, нж знаходження потрбно послдовност по всьому документу. У XML документ, як правило, визначаться хоча б один елемент, названий кореневим з нього програми-


аналзатори починають перегляд документа. У приведеному приклад цим елементом country У деяких випадках теги можуть змнювати й уточнювати семантику тих або нших фрагментв документа, по рзному визначаючи ту саму нформацю, тим самим надаючи додатку-аналзатору цього документа зведення про контекст використання описуваних даних. У випадку, якщо елемент не ма вмсту, тобто нема даних, як вн повинний визначати, вн називаться порожнм. Необхдно тльки памятати, що початковий кнцев теги порожнього елемента


нби обднуться в один, треба обовязково ставити косу риску перед кутовою закриваючою наприклад, empty Коментар Коментарями будь-яка область даних, помщена мж послдовностями символв Коментар пропускаються аналзатором тому при розбор структури документа в якост значущо нформац не розглядаться. Атрибути Якщо при визначенн елементв необхдно задати яксь параметри, що уточнюють його характеристики, то можливсть використовувати атрибути елемента. Атрибут - це пару назва значення, що треба задавати


при визначенн елемента в початковому тегу. Приклад color RGBtrue ff08ff color color RGBfalse white color або author id0 Ivan Petrov author Прикладом використання атрибутв у HTML опис елемента font font colorwhite nameArial Black font Cпецальн символи Для того, щоб включити в документ символ, використовуваний для визначення яких-небудь


конструкцй мови не викликати при цьому помилок у процес розбору такого документа, потрбно використовувати його спецальний символьний або числовий дентифкатор. Наприклад або 036десяткова форма запису, x1a шестнадцатеричная т.д. Директиви аналзатора нструкц, призначен для аналзаторв мови, описуються в XML документ за допомогою спецальних тегв Програма клнта використову ц нструкц для керування процесом


розбору документа. Найбльше часто нструкц використовуються при визначенн типу документа наприклад, Xml version1.0 або створенн простору мен. CDATA Роздли символьных даних - це частини документа, аналзован винятково як символьные дан, що не пддаються розборов, але, у вдмнност вд коментарв, використовуються застосуванням, виглядають так CDATA Цей текст, навть якщо вн мстить нструкц JavaScript або елементи коду HTML, так, як B жирныйшрифт


B або H1 заголовок H1 , не пддаться граматичному розборов. Замсть цього вн вдображаться як сти. Таблиц стилв Таблиц стилв узагал, каскадн таблиц стилв Cascading Style Sheets, CSS зокрема, дозволяють вдокремити структуру й вмст документа вд рвня представлення. У застосуванн до Web HTML це означа, що мова HTML не мстить у соб презентацйних можливостей характер


представлення формуться окремими нструментальними засобами. Технологя CSS помтно спрощу упорядкування супровд документв. Створивши одну таблицю стилв, ви зможете використовувати в сотнях документв. Вже в CSS1, першо верс CSS, були передбачен елементи уявлення, узагал немислим в HTML наприклад, регулювання фзичних розмрв шрифтв.


XMLCSS як метод публкац можна зставити з використанням програмного засобу опрацювання текств, що пдтриму стил або макрокоманди XMLCSS здйсню структурування документв, але виникаюча структура не ма незалежну загальнодоступну семантику. CSS можуть служити для форматирования документв XML, але це не дуже удалий вибр. Головна перевага XML у тому, що вона пода формат документа, для можливих манпуляцй, у вид деревоподбно структури. На жаль, CSS не спроможн взамодяти з деревом можуть тльки форматувати


документи XML як вони . Ви можете вивести документ на екран у будь-якому формат, але не можете здйснити якесь вибркове представлення його даних без застосування мови сценарв. Дан обмеження призвели до створення XSL. Найбльше важлива особливсть XML супутньо йому технолог розширювано мови таблиц стилв Extensible Stylesheet Language, XSL складаться у вддленн форматирования вд нформацйного наповнення.


Таблиц стилв XSL описують, як документи XML повинн перетворюватися в нш формати, так, як HTML або RTF. Але таблиц стилв XML - це щось бльше, нж просто перетворювач форматв вони також надають механзм для манпулювання даними. Наприклад, дан можна сортувати, робити по ним пошук, видаляти або додавати прямо з браузера. XSL спроможна також здйснювати умовну трансформацю виведення в залежност вд значень рзномантних елементв або атрибутв. Бльш того, вона дозволя запитувати дан з використанням множини рзномантних


операторв шаблонв, символв пдстановки, фльтрв, булевых операторв виражень множини. XML XSL няким чином не призначен для замни SQL, до того ж навряд чи знайдеться багато бажаючих берегти сво бази даних безпосередньо у формат XML. Проте XSL вдчиня можливсть рзномантного пошуку по даним псля х завантаження в браузер. Вам нколи вже не знадобиться використовувати для пошуку нформац примтивну вмонтовану команду браузера Find. Значний потенцал


XML у якост промжного програмного забезпечення пдкрплються обктною моделлю документа Document Object Model, DOM, верся 1.0 якиа була прийнята в якост рекомендац W3C у жовтн 1998 року. Визначення Типу Документв DTD Якщо теги й елементи XML використовуються винятково заради зручност на вашому власному вузл Web, то не ма някого значення, що ви дате цим елементам тегам мена, змст яких вдрзняться вд стандартного


вдомий тльки вам. Якщо ж, з ншого боку, ви хочете надавати дан зовншньому свту й одержувати нформацю вд партнерв по бизнесу, те ця обставина набува величезне значення. Елементи й атрибути повинн вживатися вами точно так само, як всма ншими людьми, або принаймн ви повинн документувати те, що робите. Для цього використовуться визначення типв документв Document Type Definition DTD. Збережен на початку файла


XML або назовн у вид файла .DTD, ц визначення описують нформацйну структуру документа. DTD перераховують можлив мена елементв, визначають наявн атрибути для кожного типу елементв описують сполучувансть одних елементв з ншими. Кожний рядок у визначенн типу документа може мстити декларацю типу елемента, менувати елемент визначати тип даних, що елемент може мстити. Вона ма такий вигляд ELEMENT мяелемента типданих Наприклад, деклараця визнача


ELEMENT publication PCDATA елемент з мям publication, що мстить символьн дан тобто текст. Деклараця ELEMENT specialreport article1, article2, article3 визнача елемент з мям specialreport, що мстить пделементи article1, article2 article3 у зазначеному порядку, наприклад specialreport article1 XMLчас прийшов article1 article2 XML перевершу саме себе article2 article3 Керування мережами системами за допомогою XML article3 specialreport


Псля визначення елементв DTD можуть також визначати атрибути за допомогою команди ATTLIST. Вона вказу елемент, мену повязаний з ним атрибут потм опису його припустим значення.ATTLIST дозволя управляти атрибутами багатьма ншими засобами задавати значення по замовченню, знищувати пробли т.д. DTD можуть також мстити декларац ENTITY, де визначаються посилання на обкти, а також декларац NOTATION, що вказують, що робити з двйковими файлами не у формат


XML. Серйозне дещо надзвичайне обмеження DTD поляга в тому, що вони не припускають типзац даних, тобто обмежують дан конкретним форматом таким, як дата, цле число або число з плаваючою точкою. DTD використовують нший синтаксис, нж XML, не дуже-то нтутивно зрозумл. По названих причинах DTD будуть, напевно, замнен на бльш потужн прост у використанн схеми XML, робота над який ведеться в даний час. Схеми даних


Схеми даних Schemas альтернативним засобом створення правил побудови XML-документв. У порвнянн з DTD, схеми мають бльш потужн засоби для визначення складних структур даних, забезпечують бльш зрозумлий засб опису грамматики мови, спроможн легко модернзуватися розширюватися. Безумовною перевагою схем також те, що вони дозволяють описувати правила для XML- документа засобами самого ж XML. Проте це не означа, що схеми можуть цлком замнити


DTD-описи - цей засб визначення грамматики мови використовуться зараз практичними всма верифкуючими аналзаторами, XML , бльш того, сам схеми, як звичайн XML- елементи, теж описуються DTD. Але серйозн можливост ново мови вдносно простоти, безумовно, дають пдстави пдтверджувати, що майбутнй стандарт знайде широке застосування в якост зручного й ефективного засобу переврки коректност упорядкування документв.


В даний час у W3 консорцум йде робота над першою специфкацю схем даних. Консорцум World Wide Web W3C не збираться давати сво благословення няким додаткам XML у термнолог XML додатком називаться опис галузевих термнв за допомогою деякого набору тегов XML. ншими словами, конкретн вертикальн ринки повинн самостйно узгодити усередин галуз мена для свох обктв. Щоб сприяти вдкритост передбачуваност при упорядкуванн схем


XML у вертикальних галузях, Microsoft висунула нцативу, названу BizTalk. За станом на серпень 1999 року цю нцативу пдтримало понад 25 компан. Почасти BizTalk явля собою не що нше, як суспльний сервер Web, де публкуються вс схеми, запропонован для використання в рзномантних галузях. Проте BizTalk не ставить свою цллю обднати вс галуз в спроб скласти одну ггантську схему для усх використовуваних


у якому б то н було бзнес даних. BizTalk складаться з трьох окремих елементв. По-перше, це сховище на сервер Web разом з рекомендацями тегами XML, використовуваними для додавання нових схем у сховище. По-друге, це розробка програмного продукту, серверу BizTalk. по-трет, це будуть нтерактивн послуги на баз технолог


BizTalk. Вдмова вд DTD У тому, що стосуться вдображення галузевих даних, BizTalk виходить з безперспективност визначень типв документв Document Type Definition, DTD. Замсть того щоб заохочувати розробку XML DTD, прихильники BizTalk описують сво рарх даних за допомогою XML Schema як передбачаться, цей стандарт повинний прийти на змну


DTD. В даний час W3C намагаться узгодити рзномантн пдходи до схем, але запропонована верся стандарту - XML Schema - да достатньо ясне уявлення про те, як буде виглядати замна DTD. XML Schema ма значно бльш широк можливост, нж DTD, причому описи даються за допомогою безпосередньо XML, без створення ще одн системи розмтки, як того потребу


DTD. DTD цлком достатньо для базового визначення документа, але вони мають деклька недолкв. По-перше, вони даються не на XML. З огляду на високий ступнь адаптованост розширювансть XML, наявнсть ще одного формату для визначення документв зайвою. По-друге, елементи DTD усередин документа XML потребують повного визначення усього, що знаходиться усередин цих елементв. ншими словами, няк пделементи на перспективу не припускаються - якщо так будуть


присутн в документ, те, по визначенню, документ не буде бути правильно складеним. Тим часом визначення XML Schema використовують модель вдкритого нформацйного наповнення, у котро невизначен елементи цлком припустим. По-трет, DTD обмежуються тльки граматикою синтаксисом тобто вдношенням одного елемента до ншого, тод як XML Schema може також задавати безпосередн обмеження на тип даних, що елемент може мстити. Це значно спрощу реалзацю передач даних додатка в порвнянн з бльш традицйним текстовим


документом. Наприклад, точно так само, як це роблять розроблювач в мовах програмування, ви можете явно зазначити, що дана область збереження може мстити тльки целочисленные дан. Нарешт, розроблювачам, що працюють у середовищах Wintel, буде дуже зручно те обставина, що XML Schema легко вдображаться на Microsoft Document Object Model. Таким чином, що працю з документами XML програма може запросити у вдповдно схеми наявне


визначення для елемента документа по свому вибор. Код вигляда в такий спосб var bookNode doc. documentElement Проте як же буде виглядати сам документ, що мстить схему, зсередини По-перше, вн буде мстити теги XML, що повдомляють, що це схема, на зразок Schema nameschemasample1 вмст схеми Schema Кожний пункт усередин схеми обявляться потм ндивдуально, причому особливост кожного елемента розшифровуються за допомогою вкладених тегв, наприклад


ElementType namePERSONA contenttextOnly визнача елемент Inventor як здатний мстити тльки текстов дан. Подбн схеми можуть виявитися дуже важк для читання, але вони легко пддаються розборов за допомогою нструментв XML. ншими словами, вам не буде потрбно спецальний редактор для роботи з документом XML Schema, як у випадку DTD. У випадку правил на баз


XML для форматв комерцйних даних можна використовувати для вдображення одн схеми на другу вмонтован функцональн можливост перетворення XML - розширювана мова таблиць стилв Extensible Stylesheet Language, XSL. На загальному рвн BizTalk Framework потребу, щоб видавц XML Schema притримувалися визначених рекомендацй. Так, тегам пропонуться давати осмислен мена з зрозумлим нескороченим написанням ц мена повинн вдповдати


функцональному призначенню нформац, а не мсцю в приватнй структур даних наприклад, PartLocation замсть PartFieldFourteen, а нформаця, що мститься в тегу, не повинна потребувати спецального, вдмнного вд XML, декодування наприклад, позначення валюти грошово суми повинно збергатися у вид елемента XML, а не приднуватися до суми як у 30US. Необхдними складовими BizTalk Framework спецальн, загальн для всх галузей теги


XML. Ц теги покликан звльнити розроблювачв вд турбот з приводу трьох найважливших проблем взамод додаткв. По-перше, вд того, як дан передаються з одного додатка в нший по-друге, вд того, як викликати нший додаток - вдправлення додатку даних у формат XML повинно бути достатньо по-трет, вд того, у якому порядку повинн випливати елементи даних. Один з тегв визнача код, за допомогою якого XML програма, що прийма дан у формат, може встановити, що за схема


BizTalk використовуться. За допомогою нших тегв додаток може зясувати, хто вдправником даних, що вдправник вд нього хоче кому дан повинн бути потм передан. Для забезпечення сумсност документ BizTalk повинний починатися , вдповдно, закнчуватися тегом BizTalk, щоб одержувач знав, що вн вступив у сектор BizTalk. Тег MsgType зада простр мен XML вашу конкретну схему, що визнача припустим елементи документа.


Тому що ваша схема використову формат даних XML, то тип даних, котрими ви наповняте свй документ, буде легко встановити. Нарешт, ви можете також вставити блок маршрутних документв, наприклад Route From locationID1 locationTypeDUNS process path handle3 To locationID2 locationTypeDUNS process path handle23CF15 Route BizTalk Framework нчого не говорить про те, як дан повинн входити в чотирьох атрибута тегв


FROM TO , вона просто встановлю призначення кожного з них. Теги location дентифкують мережний вузол можливо, за допомогою URL, куди направляться документ, у той час як теги process handle визначають додаток конкретний примрник наприклад, номер транзакции, до якого вдносяться дан. Тег path служить свого роду вмстилищем, де промжн сервери можуть берегти вдомост про дату й ншу нформацю,


щоб маршрут за допомогою розширення зворотний маршрут був видимий усм серверам уздовж шляху. Бзнес-модель BIZTALK Microsoft випустить серверний продукт для регулювання обмну BizTalk-сумсними повдомленнями XML мж партнерами по бзнесу бета-верся наприкнц осен 1999 року готовий продукт повинний вийти псля Windows 2000. Як це вигляда нструкц в схемах складають набр правил, використовуючи який, програма-клнт буде робити висновок про те, коректний документ або н.


Схема даних, наприклад, може виглядати таким чином schema idOurSchema elementType idtitle string elementType elementType idphoto element typetitle attribute namesrc elementType elementType idgallery element typephoto elementType schema Якщо ми включимо приведен правила всередину XML- документа, програма-клнт зможе використовувати х для переврки. Тобто, вона тепер зможе визначити, що правильним буде бути такий фрагмент gallery photo id1 title


My computer title photo photo id2 title My family title photo photo id3 title My dog title photo gallery , а некоректним цей gallery photo id1 photo index2 title My family title photo photo index3 title My dog title dogname Sharik dogname photo gallery Вс конструкц мови схем описуються правилами XML DTD for XML-Data-Schema. Область схеми даних Створюючи схеми даних, ми визначамо в документ спецальний


елемент, schema , усередин якого мстяться описи правил schema idOurSchema послдовнсть нструкцй schema Якщо використовувати окремий простр мен, то повний XML-документ, що мстить у соб схему даних, буде виглядати в такий спосб XML version1.0 xmlnamespace hrefhttpwww.mrcpk.nstu.ruschemas ass sschema idOurSchema послдовнсть нструкцй sschema Опис елементв Для визначення класу елемента, до якого надал будуть застосовуватися нструкц,


що описують його вмст структуру, призначений спецальний елемент схеми elementType, elementType idissue descript Елемент мстить нформацю про черговий випуск часопису descript elementType Назва елемента задаться атрибутом id. Вс подальш нструкц, що ставляться до описуваного класу, визначають його внутршню структуру набр припустимих даних, мстяться всередин блока, заданого тегами elementType elementType . Як очевидно з приклада, при визначенн класу елемента, можна також використовувати коментар


до нього, що заключають у тэги descript descript Атрибути елемента Для того, щоб в опис елемента визначити його атрибути й описати властивост цих атрибутв ми повинн використовувати елемент attribute elementType idphoto attribute namesrc empty elementType У даному приклад елементу photo визначаться атрибут src, значенням якого може бути будь-яка послдовнсть дозволених символв photo src0 photo srcsome text Подбно


DTD, схеми даних дозволяють встановлювати обмеження на значення засб використання атрибутв. Для цього в дескриптор attribute необхдно використовувати параметр atttype. Наприклад, якщо ми хочемо зазначити, що значення атрибута повинно використовуватися програмою-аналзатором як ункальний дентифкатор, то нам необхдно створити таке правило elementType idbouquet attribute nameid atttypeID elementType Якщо ж потрбно задати список можливих значень атрибута, то приклад будет виглядати


в такий спосб attribute nameflower atttypeENUMERATION valuesred green blue defaultred Модель вмсту елемента Пд моделлю вмсту в схем даних розумють опис усх припустимих обктв XML- документа, використання котрих усередин даного елемента коректним. Модель вмсту визначаться нструкцями, розташованими всередин блока elementType . elementType idarticle attribute nameid atttypeID element typetitle string elementType


Для цього правила коректним буде бути такий фрагмент документа article id0 title Психи маняки в нтернет title article Вкладен елементи описуються за допомогою нструкц element, у якй параметром type указуться клас обкта - посилання на його визначення elementType idarticle element typetitle element typeauthor elementType Якщо потрбно зазначити режим використання вкладеного елемента, то треба визначити параметр occurs elementType idarticle element typetitle occursREQUIRED element typeauthor


occursOPTIONAL element typesubject occursONEORMORE elementType Можлив значення цього параметра так REQUIRED - елемент повинний бути обовязково визначений OPTIONAL - використання елемента не обов язковим ZEROORMORE - вкладений елемент може зустрчатися деклька разв або жодного разу ONEORMORE - елемент повинний зустрчатися хоча б один раз Приклади правильних XML-документв, що використовують приведену вище схему article title


Навщо вн потрбний, XML title author ван Петров author subject Що таке XML subject subject потрбний чи вн нам subject article або article title Навщо вн потрбний, XML title subject Що таке XML subject article Крм елементв, вмстом XML-документа можуть також бути звичайним текстом областями CDATA. Для позначення типв вмсту поточного елемента в схемах використовуються так нструкц string - вказу


на те, що вмстом елемента тльки вльна текстова нформаця секця PCDATA elementType idflower string elementType any - вказу на те, що вмстом елемента повинн бути тльки елементи, без тексту, незаключенного н в один елемент elementType idissue any elementType mixed - будь-яке сполучення елементв тексту elementType idcontacts mixed elementType empty - порожнй елемент Приклад elementType idtitle string elementType elementType idchapter string elementType elementType


idchapters-list any elementType elementType idcontent element typechapters-list occursOPTIONAL elementType elementType idarticle mixed element typetitle mixed element typecontent occursOPTIONAL elementType Що в мен твому Розширювана мова розмтки Extensible Markup Language, XML дозволя вам створювати сво власн теги, документувати х за допомогою визначень типв документв Document Type Definition, DTD або схеми XML потм без проблем обмнюватися даними з ншими джерелами.


Все це добре, але може виявитися, що нш використовують т ж сам, що ви, мена для елементв атрибутв, але при цьому спираються на нш DTD. Це прямий шлях до проблем. Щоб уникнути подбних конфлктв W3C розробив концепцю просторв мен ключового слова xmlns. Завдяки м в одному документ можуть використовуватися мена елементв атрибутв, що накше вступили б у конфлкт один з одним. Тепер же вони рзняться рзними префксами простору мен визначаються по рзномантним


DTD або схемах. От, наприклад, фрагмент коду XML з використанням просторв мен inventory xmlnsstorea httpwww.knowknew.com books.dtd xmlnsstoreb httpwww.amazon.comschema storeamagazine storeatitle Network Magazine storeatitle storeamagazine storebmagazine storebmagazine storebtitle Data Communications storebmagazine inventory У визначенн DTD магазина А назва книги пделементом часопису. У схем магазина


Б назва атрибутом часопису. Завдяки розрзненню мен за допомогою рзних префксв просторв мен вони можуть застосовуватися разом. Мсцезнаходження DTD схеми вказуться в даному приклад за допомогою URL, але воно може також визначатися за допомогою Uniform Resource Name URN, див. RFC 2141 або Uniform Resource Identifier URI, див. RFC 2396. Використання для опису даних


Intelligent Enterprise, August 03, 1999, Volume 2, Number 11 Одню з особливостей XML, що приверта увагу промисловост, можливсть опису структур даних даних, що збергаються. З використанням XML можна визначити нов теги спецально для опису екввалента таблиць стовпчикв або сутностей атрибутв у структур реляцйно бази даних. Ще бльш стотно те, що теги для набору стовпчикв або атрибутв можуть звязуватися з тегами для хньо батьквсько


таблиц або сутност. Хоча теговая структура здаться гарним механзмом для опису розумння структури бази даних, спосб органзац даних потребу як нколи ранше суворо дисциплни. XML не забороня мати повторюван групи, жахлив структури даних т.д. OMG сформувала набр тегов, названий XML Metadata Interchange XMI, з метою надання можливост опису в стандартних термнах структури даних про дан метаданих.


Цей стандарт буде корисний для обмну метаданими мж CASE-засобами для опису репозиторя метаданих у проектах сховищ даних. Рухаючись у тому ж напрямку, група компанй щовключа, зокрема, IBM Oracle знаходиться в процес визначення Common Warehouse Metadata Interchange CWMI, пдмножини XMI для пдтримки сховищ даних.


Це означа, що два пдходи до опису структури бази даних на XML По-перше, прикладну базу даних може описувати DTD XML-документа. У цьому випадку операцйн дан бази даних можуть бути розмщен мж наборами описаних тегв. Таке DTD може, наприклад, генеруватися одним CASE-засобом, а читатися ншим, забезпечуючи засб передач структури даних. По-друге, можна розмстити сам визначення таблиц стовпчикв мж тегами


XMI, визначеними на бльш високому рвн абстракц. Цей пдхд трохи бльш хитрий, оскльки метамодель XMI дуже абстрактна, але використання метамодел XMI дозволя описувати набагато бльше, чим таблиц стовпчики. Проте зауважимо, що проблема визначення репозиторя метаданих або обмну метаданими мж CASE-засобами не повязаний з використанням XML або якогось ншо мови. Проблемою структура семантика бази даних. Важливе питання поляга не в тому, як буде представлятися


унверсальний репозиторй метаданих. Можна легко уявити репозиторий у вид набору реляционных таблиць або даграм сутнстьзвязок. Питання поляга в тому, що знаходиться в репозитори що це означа Як обкти стотними повинн бути описан Це набагато складша тема, вона усе ще знаходиться в стад обговорення. Наявнсть ново мови не вносить стотний внесок у це обговорення. Насправд при наявност розумння, що XML гарним засобом для опису структури бази даних, найбльше очевидним


висновком те, що використання ц мови наклада велику вдповдальнсть на адмнстраторв даних з приводу коректност визначення даних. XML не забезпечу таку коректнсть XML усього лише рестру будь-який проект даних, що надходить вд розробника. Поява XML пдвищу важливсть моделювання проектування даних.



Не сдавайте скачаную работу преподавателю!
Данный реферат Вы можете использовать для подготовки курсовых проектов.

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Пишем реферат самостоятельно:
! Как писать рефераты
Практические рекомендации по написанию студенческих рефератов.
! План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом.
! Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач.
! Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты.
! Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ.

Читайте также:
Виды рефератов Какими бывают рефераты по своему назначению и структуре.

Сейчас смотрят :