|
МУ_ЛР_ЛиПОАС. Методические указания по выполнению лабораторных работ по дисциплине (модулю) Лингвистическое и программное обеспечение автоматизированных систем
5. Содержание отчета
1) Титульный лист
2) Задание
3) Описание грамматики в любой форме.
4) Описание выделяемых лексем и метода синтаксического анализа.
5) Описание ошибок, выдаваемых в процессе анализа.
6) Алгоритм работы лексического анализатора.
7) Алгоритм работы синтаксического анализатора.
8) Скриншоты с демонстрацией работы программы.
9) Выводы по работе
10) Список используемой литературы
11) Приложение – текст программы.
Лабораторная работа № 3
Работа с XML
1. Цель и задачи работы Цель работы – освоить навыки работы с XML в C#.
Для достижения поставленной цели необходимо выполнить следующие задачи:
- Освоить язык XML.
- Освоить средства DTD.
- Освоить язык XSD.
- Освоить принципы работы с XML в C# с использованием DOM.
- Разработать программу в соответствии с заданием.
2. Общие положения (теоретические сведения) Расширяемый язык разметки XML (eXtensible Markup Language) приобрел известность в конце 1990-х гг., когда он начал широко использоваться для переноса данных между различными информационными системами и описания бизнес-транзакций.
XML — это язык разметки документов, предназначенный для хранения структурированных данных, обмена информацией между программами, а также для создания на его основе специализированных производных языков [17, 15, 35].
XML описывает определенный класс объектов, называемых XMLдокументами. Документ представляется в виде дерева элементов, каждый из которых может иметь набор атрибутов, а также содержать другие элементы или текст.
XML-документ описывается в терминах логической и физической структуры. Приведем краткие сведения об элементах логической и физической структуры XML-документов.
2.5. Логическая структура XML-документа Логическая структура состоит из следующих элементов:
объявление; определения типа документа; элементы; комментарии; ссылки; инструкции по обработке документа.
В табл. 2.1 представлены основные требования спецификации XML 1.0, предъявляемые к синтаксису XML-документов.
Приведем пример XML-документа.
<Контрагенты>
<Контрагент Код="Ю023">
<Наименование>Рога и копытаНаименование>
<ИНН>1232345678ИНН>
<КПП>775003657КПП>
<Адрес Индекс="118200" Город="Москва" Улица="Широкая"
Дом="100">
Адрес>
<КонтактноеЛицо ФИО="Иванов Иван Иванович" >
<Телефон>
<СлужебныйТелефон>74952113477СлужебныйТелефон>
<МобильныйТелефон>79056784523МобильныйТелефон>
Телефон>
КонтактноеЛицо>
Контрагент>
Контрагенты>
Таблица 2.1
Синтаксис XML
Элемент логической структуры
| Описание
| Пример
| Объявление
| Размещается в начале документа.
Ограничивается тегами .
Включает атрибуты:
version — номер версии спецификации XML, обязательный атрибут; е ncoding — кодировка символов документа (по умолчанию encoding="UTF-8"), необязательный атрибут. Если имена тегов задаются на русском языке, необходимо установить encoding="windows-1251"; s tandalone — указание на наличие внешних описаний структуры документа, по умолчанию standalone="no", необязательный атрибут. Атрибуты должны следовать в указанном выше порядке.
Если атрибуты не определены, то им присваивается значение по умолчанию
|
| Определения типа документа
| DTD (Document Type Declaration) заключается между символами и может занимать несколько строк. В этой части объявляются теги, использованные в документе, или приводится ссылка на файл, в котором записаны такие объявления.
Секция DTD должна располагаться перед корневым элементом
| Пример см. в п. «Языки описания структуры»
| Элементы
| Элементы являются основными составляющими XML-документа; бóльшая часть данных в XMLдокументах содержится в элементах. Элемент представляется в XML-документе с помощью открывающего (<>) и закрывающего (>) тэгов. Открывающий тэг записывается в формате <ИмяЭлемента>, а закрывающий тэг — в формате ИмяЭлемента>.
Имя элемента не может содержать пробелов.
Содержимым элемента могут быть символьные данные (текст), другие элементы (известные как дочерние элементы), а также оно может отсутствовать (пустой элемент).
XML-документ должен содержать обязательный корневой элемент.
Элемент может содержать любое число атрибутов, содержащих дополнительную информацию о данных, которые представляет элемент. Атрибуты указываются в виде пар «название-значение» в открывающем тэге элемента. Значения атрибутов заключаются в кавычки.
Названия атрибутов уникальны в рамках одного элемента (в одном элементе не может быть двух атрибутов с одинаковым именем)
| <Книга>
Книга>
<Книга isbn="978-5-
9775-0778-3"> Книга>
| Комментарии
| Ограничиваются тегами . Используются для документирования. Могут располагаться в любом месте документа
|
| Ссылки
| Ограничиваются символами «&» и «;». Используются для подстановки вместо них символов (ссылки на символы) или различных данных (ссылки на сущности), описанных в определении DTD.
Ссылки на символы позволяют вставить в текст документа некоторый символ, который, например, отсутствует в раскладке клавиатуры либо может быть неправильно истолкован анализатором.
| код_символа_в_ Unicode
Шестнадцатеричный_код_символа имя_сущности
|
| Ссылки на сущности позволяют включать любые строковые константы в содержание элементов или значения атрибутов. Ссылки на сущности указывают программе-анализатору подставить вместо них строку символов, заранее заданную в определении типа документа.
Для включения в XML-документ символьных данных, которые не следует обрабатывать, используется секция
|
| Инструкции по обработке
| Ограничиваются тегами и ?>. Предназначены для передачи информации приложению, работающему с XML-документом. За начальным вопросительным знаком записывается имя программного модуля, которому предназначена инструкция. Далее через пробел записывается инструкция, передаваемая программному модулю
|
Эта инструкция предназначена программе, обрабатывающей документ XML. Инструкция передает ей номер версии и кодировку, в которой записан документ
| |
|
|