Главная страница
Навигация по странице:

  • УСЛОВНОСТЬ КАРТ И БАЗЫ ДАННЫХ ГИС

  • ОСОБЕННОСТИ НЕКОТОРЫХ ВИДОВ КАРТ

  • Почвенные карты

  • Зоологические карты

  • Изображения дистанционного зондирования

  • Рисунок 3.12. Квантование географического пространства.

  • Временные ряды карт

  • ИДЕЯ ПРЕДСТАВЛЕНИЯ ПРОСТРАНСТВЕННЫХ ДАННЫХ

  • Майкл ДМерс ГИС. Инициаторы проведения этого новаторского события надеются привлечь к нему внимание мировой общественности и широких масс пользователей географических информационных систем из всех стран.


    Скачать 4.47 Mb.
    НазваниеИнициаторы проведения этого новаторского события надеются привлечь к нему внимание мировой общественности и широких масс пользователей географических информационных систем из всех стран.
    АнкорМайкл ДМерс ГИС.doc
    Дата14.03.2018
    Размер4.47 Mb.
    Формат файлаdoc
    Имя файлаМайкл ДМерс ГИС.doc
    ТипДокументы
    #16650
    страница7 из 38
    1   2   3   4   5   6   7   8   9   10   ...   38
    Глава 3

    было обозначено, но их пространственная детализация ограничена с тем, чтобы их все-таки можно было показать на карте. Ввод таких карт в ГИС приводит к менее чем удовлетворительным результатам измерений длин, форм, площадей и других геометрических характеристик. Но поскольку результаты геоинформационного анализа часто представляются в картографическом виде, мы можем счесть эти две формы упрощения полезными при создании конечного результата нашего анализа.
    УСЛОВНОСТЬ КАРТ И БАЗЫ ДАННЫХ ГИС

    Масштаб карты ограничивает объем данных, которые могут быть представлены на одном картографическом документе. Именно масштаб определяет степень генерализации объектов и их смещения относительно точного положения для обеспечения читабельности карты [Robinson et al., 1995]. Это необходимо учитывать при перенесении собрания картографических документов с их информационным содержанием, масштабами, типами отображения и символизации, в соответствующее компьютерное представление, компьютерную БД.

    Данные картографического документа, то есть символы, представляющие объекты, являются условным представлением реальности. Их размер и размещение часто являются приближенными, менее точными, чем точность устройств компьютерного ввода в определении их характеристик. Следовательно, переходя от карты к цифровой базе данных, мы должны решать, какой именно участок точечного, линейного или площадного символа должен использоваться для определения координат представляемого им объекта. Если, например, положение точечного символа физически смещено от истинного положения, чтобы дать место для другого символа, то при вводе в ГИС мы получим точные координаты символа, которое на самом деле не соответствуют точному положению объекта. Вдобавок, сам символ занимает какую-то площадь, нам нужно будет решить, является ли, например, центр символа наиболее точным положением.

    С другой стороны, если мы создаем географическую базу данных, скажем, с помощью геодезических приборов, то сталкиваемся с противоположной проблемой. Точность такого инструмента может быть порядка нескольких сантиметров и даже миллиметров, но компьютерное представление зачастую не может фиксировать эту информацию с такой же точностью.

    Хотя каждым из этих вопросов можно заниматься по отдельности, при их взаимодействии во время создания БД ГИС возникают более сложные проблемы. Вот характерный пример. Специалист по живой природе создал базу данных, показывающую связь между положениями дорог и гнездовий птиц, населяющих территории вокруг этих дорог. Создание покрытия дорожной сети в составе БД ГИС на основе существующих имеющихся топографических карт USGS масштаба 1:24'ООО оказалось самым простым и доступным решением.

    Естественно, что на карте не были отмечены местоположения отдельных гнезд, в данном случае норных сов, поэтому они регистрировались с использованием GPS с разрешением 1 метр. Когда же два покрытия были одновременно отображены, положения нор, которые находились в пределах 10 метров от дорог, оказались смещены, по меньшей мере, на 100 метров от этих дорог. Таким образом, это расхождение демонстрирует проблему возможной несовместимости данных из источников различной точности, которая в данном случае привела к неудаче с анализом взаимосвязи расположения дорог и гнезд норных сов.

    Та же проблема возникает при создании картографической БД из карт разных масштабов. Как мы уже видели, на картах очень мелкого масштаба символы занимают гораздо большие площади поверхности земли, чем на крупномасштабных картах с такими же символами. Поэтому масштабы вводимых карт должны быть по возможности близки.
    ОСОБЕННОСТИ НЕКОТОРЫХ ВИДОВ КАРТ

    Вскоре после начала работы с ГИС вы встретите множество видов карт, представляющих огромное разнообразие возможных тем. Многие виды карт распространены вследствие их доступности, низкой цены и общей полезности для геоинформационных проектов. Поскольку многие приложения ГИС включают пространственные данные, связанные с природными ресурсами, возможно, вследствие исторических корней ГИС, большинство из этих часто используемых типов карт связаны с природной средой. Это не значит, что только карты природного окружения имеют специфические проблемы. Скорее, именно потому, что они так популярны, вам нужно знать о проблемах, с которыми вы встретитесь, используя эти карты. Кроме того, многие из проблем, свойственных этим картам, могут встречаться при работе с картами других типов.
    Почвенные карты

    Почвенные карты - среди наиболее легкодоступных карт во всем мире, и, конечно, в США. Картографирование почв США приобрело большое значение после засушливых 1930-х годов, когда поверхностный слой почвы был уничтожен на сотнях миль плодородных пашен и пастбищ, особенно на Великих равнинах. Тогда были предприняты усилия по картографированию сельскохозяйственных земель по всей стране для снабжения информацией как индивидуальных фермеров, так и федеральных агентств, ответственных за сохранение этих угодий. В результате почвенные карты повсеместно распространены и часто оказываются в базах данных ГИС.

    Почвенные карты создаются в результате наземных измерений и отбора профилей почвы (вертикальных сечений почвы, извлекаемых при бурении). Чаще всего типы почв обозначаются полигонами, заполненными визуально различимыми крапами, или штриховками, нанесенными на аэрофотоснимки исследуемой области, обычно в масштабе приблизительно 1:20'000. Тип почвы полигона определяется анализом одного или более кернов, выбранных в его пределах. Большинство полученных таким образом почвенных карт представлены прямо на копиях аэрофотоснимков, хотя некоторые округа имеют версии без снимков в качестве фона. Каждый тип почвы идентифицируется кодом, который связан с табличными данными для этого типа. Наличие этой системы существенно облегчает создание почвенных баз данных.

    Хотя эти карты имеют очевидные преимущества готовности и доступности, большого пространственного покрытия и легко получаемых атрибутивных данных, они представляют несколько серьезных проблем для ввода и анализа в ГИС. Во-первых, поскольку карты обычно рисуются прямо на нетрансформированных аэрофотоснимках, на точности положений границ полигонов сильное влияние оказывают вертикальные перемещения самолета с фотокамерой, снижение точности по краям фотографий и искажения положений объектов, вызванные перепадами высот [Avery, 1973]. Короче говоря, все проблемы, связанные с использованием аэрофотоснимков в качестве средств для создания карт, применимы и к почвенным картам. Конечно, поскольку аэрофотоснимки снимаются непосредственно с самолета, пролетающего над земной поверхностью, нет и определенной проекции для этих карт, что затрудняет точные измерения. Вдобавок, так как нет определенной проекции, на этих картах отсутствует и координатная сетка. Все эти условия затрудняют обеспечение совмещения точек на других картах вашей ГИС с соответствующими точками на почвенных картах. Таким образом, удачность любой попытки связать объекты любой карты с объектами на почвенных картах будет в значительной степени зависеть от требуемой точности. Бывает даже трудно ввести эти карты в ГИС, не имея определенной координатной системы и картографической проекции. Некоторые ГИС-продукты не будут работать, если не определить их явно. Дело осложняется еще и тем, что сами почвы, сильно варьирующиеся от места к месту, в природе не встречаются как полигоны с четкими границами. Вместо этого, как многие другие природные феномены, почвы образуют непрерывно изменяющийся континуум.

    Проведение резких границ между областями различных типов почв является изменением мерности, которое также снижает ценность существующих почвенных карт для анализа.

    Некоторые из упомянутых выше проблем могут быть ослаблены, чтобы почвенные карты внесли свой вклад в геоинформационный анализ. Один из методов коррекции включает устранение искажений, обусловленных рельефом, которые особенно велики при больших перепадах высот. Здесь применяются математические методы, использующие цифровую модель рельефа для геометрической коррекции аэрофотоснимков, в результате которой получаются так называемые ортофотоснимки (orthophoto). Такие геометрически скорректированные снимки более точны, чем их некорректированные собратья, но на них все равно еще нет проекций или координатных сеток. Для малых областей можно пренебречь сферичностью земной поверхности, рассматривая эти изображения как планы. Для помещения вашего снимка в ГИС вместе с другими картами для достижения их пространственного совмещения, вы должны будете выбрать отдельные объекты, которые встречаются на этом снимке и на одной или нескольких картах, которые будут включены в БД ГИС. С помощью таких опорных точек (control points) вы можете собрать данные для выполнения ряда математических преобразований, имитирующих прибор для переноса аэрофотоснимков на проецированные карты, который выполняет повороты и растяжения снимка с тем, чтобы он состыковался с другими картами в вашей базе данных.

    Ни один из методов коррекции не устраняет полностью все упомянутые проблемы, но они позволяют использовать аэрофотоснимки, и, в частности, изображенные на них почвенные карты, если вы достаточно осторожны и помните о недостатках этих карт в представлении почв вообще.
    Зоологические карты

    Существует вид карт, которому уделяют слишком мало внимания в географическом сообществе, несмотря на частое их использование среди зоологов и специалистов по охране дикой природы. Речь идет о зоологических картах, которые бывают двух общих типов - карты площадных и точечных распределений. Критерии выбора того или другого типа карт для картографирования местоположений животных плохо разработаны, оставляя специалиста по ГИС перед выбором среди широкого спектра методов отбора данных. Конечно, главной проблемой здесь является подвижность животных, их точное положение меняется каждую минуту. Радиотелеметрия часто используется для отбора местоположений млекопитающих, давая довольно точные положения в выбранные интервалы времени. С другой стороны, для картографирования местоположений птиц используются визуальные наблюдения с некоторого расстояния, и даже аудиозаписи звучания птиц. Хотя существуют стандартные методы записи таких данных для научных исследований, возникает проблема, когда мы пытаемся зафиксировать точечное положение объекта, неопределенность положения которого может составлять десятки метров.

    Карты ареалов, использующие площадные символы для отображения области распространения определенного животного, иногда компилируются из информации, собираемой десятки лет многими людьми, а иногда данные собираются одним человеком за один сезон, месяц и даже день. При построении карт ареалов, как во многих других ситуациях, требуется агрегировать точечные местоположения для создания областей (площадных символов). Для решения этой задачи могут применяться простые методы компьютерной графики, такие как построение наименьшей выпуклой оболочки вокруг имеющихся точек (мы рассмотрим его подробнее в дальнейшем), однако формально построенные с помощью этих методов полигоны необязательно отражают реальное группирование животных, которое биолог назвал бы ареалом. Вместо этого, для отображения областей на основе точек с большей пользой могут использоваться другие методы, основанные на математике, интуиции и, возможно, некоторой "ловкости рук" [Rapoport, 1982]. Какой бы вы ни выбрали, вам нужно будет знать о поведении животных или иных точечных объектов.
    Изображения дистанционного зондирования

    Данные дистанционного зондирования (ДДЗ) все шире используются для ввода в базы данных геоинформационных систем, особенно там, где требуется анализ больших территорий или анализ изменений на поверхности Земли. Датчики, или сенсоры, дистанционного зондирования, используемые для наблюдения наземных объектов, могут воспринимать различные участки электромагнитного спектра, как в видимом диапазоне, так и вне его. Они обеспечивают повторную съемку тех же участков поверхности Земли через некоторый интервал времени, а также могут создавать стерео изображения. Каждая система ДЗ уникальна и характеризуется своими особенностями. Но независимо от типа используемых чувствительных элементов, сенсоры передают изображения в виде прямоугольной матрицы пикселов (от англ. "picture elements"). Размер порции земной поверхности, покрываемой одним пикселом, называется пространственным разрешением, и чем меньше размер пиксела - тем выше пространственное разрешение. В зависимости от назначения, изображения дистанционного зондирования могут иметь размер пиксела от нескольких сантиметров до нескольких километров.

    Количество электромагнитной энергии, попадающее в один пиксел, преобразуется в число и в двоичном виде передается на землю. Число двоичных разрядов (битов), которыми кодируется каждый пиксел, называется радиометрическим разрешением, и чем больше битов используется на каждый пиксел - тем выше радиометрическое разрешение. Для каждого пиксела определяются несколько отсчетов - по одному на каждый участок (зону) спектра. Поскольку каждая система ДЗ работает в определенных участках спектра электромагнитных волн, чтобы выбрать подходящий сенсор, нужно точно знать не только требуемые значения пространственного и радиометрического разрешений, но и то, в каких участках спектра отражаются интересующие вас явления. Детальную информацию по функционированию и возможностям этих систем можно найти в книгах, посвященных дистанционному зондированию [Lillesand and Kieffer, 1995].

    Среди наиболее трудных задач, связанных с использованием ДДЗ, находятся геометрическая коррекция и извлечение полезной информации из снимков (дешифрирование). Рассмотрим эти два вопроса по отдельности.

    Для пользователя ГИС проблемы, возникающие при использовании устройств дистанционного зондирования, двояки. Во-первых, квантование пространства на прямоугольные пикселы добавляет еще один уровень упрощения наземных объектов. Объекты, которые существенно меньше размера пикселов, не могут быть обнаружены (случай недостаточного разрешения), однако их присутствие влияет на количество излучения, которое попадает на сенсор, создавая проблему так называемых смешанных пикселов. Смешанные пикселы часто могут использоваться для обнаружения групп объектов, которые существенно отличаются от своего окружения по спектральным характеристикам, но размеры которых оказываются меньше пространственного разрешения сенсора. Практически всегда пикселы содержат большее или меньшее число различных объектов, - вопрос лишь в том, как такое смешение влияет на наш анализ. Когда на снимке оказывается территория с относительно небольшой долей мелких "инородных" объектов, можно принять, что такие объекты меньше разрешающей способности не влияют на результаты анализа. Но в случае, например, городской среды, снимки низкого разрешения могут существенно исказить результаты дешифрирования, так как в отдельных пикселах будут смешиваться многие существенно разные объекты, и после суммирования их характеристик мы можем получить что-то совсем другое, отличное от всего того, что внесло вклад в значения пиксела. Здесь мы подходим ко второй проблеме использования ДДЗ.

    Второй проблемой использования ДДЗ является то, что исходные данные, получаемые со спутника, мало о чем говорят, пока они не подвергнуты обработке -дешифрированию. Процедуры обработки делятся на две группы: процедуры улучшения читаемости снимков (enhancement) и процедуры классификации (categorization). Назначение первых - облегчение восприятия изображения человеком-аналитиком. Сюда входят такие действия как изменение яркости и контрастности всего изображения или отдельных его частей, сглаживание (в основном для удаления шума, создающего эффект съемки через снегопад), подчеркивание контуров и мелких деталей.

    Классификация, используемая по отношению к ДДЗ, подобна всем другим видам классификации в ГИС тем, что она вносит дополнительное упрощение данных в конечный продукт. Она переводит данные из шкалы отношений в более грубые шкалы измерения данных - интервальную, порядковую и номинальную. Тем не менее, аналитическая парадигма требует обеспечения доступности исходных данных для пользователя, чтобы он имел возможность извлекать из них максимум информации. Поэтому недешифрированные снимки также все чаще становятся частью БД ГИС, особенно связанных с экологией, контролем состояния растительности и Других.


    Рисунок 3.12. Квантование географического пространства. Квантование участка земной поверхности в виде прямоугольных пикселов для снимков с различным разрешением.
    Все методы классификации, применяемые в дистанционном зондировании, имеют один результат: группирование пикселов по категориям, которым могут быть присвоены названия.

    Используются три основных вида классификации: автономная, по эталонам и интерактивная. В первом случае для определения интервалов классификации используются специальные алгоритмы, обеспечивающие те или иные условия распределения пикселов по классам, одни из них требуют от пользователя ввести только число классов, другие действуют полностью самостоятельно. Во втором случае оператор выбирает набор заранее установленных эталонов, определяемых, например, по характеристикам указанных пользователем областей снимка, после чего программа автоматически классифицирует все пикселы снимка. В третьем случае пользователь указывает программе несколько пикселов (может быть даже только один), которые должны представлять выделяемый объект, после чего программа отыскивает и показывает все другие соседние пикселы с подобными значениями. Все методы классификации в большей или меньшей степени автоматизированы, но даже автономные методы классификации требуют от пользователя некоторого представления о том, что изображено на снимке, не говоря уже об интерактивных.

    Проблема при использовании ДДЗ в ГИС состоит еще в том, что полученные категории могут плохо соотноситься с теми, что создавались при ручной интерпретации аэрофотоснимков, прежних карт растительности и других картографических покрытий, с которыми их придется сравнивать в среде геоинформационной системы. Эта несовместимость особенно заметна, когда ДДЗ используются для обновления карт. Существуют также трудности сравнения снимков одной территории с одного спутника, сделанных в разное время при разных погодных условиях. Для большинства из этих проблем имеются относительно простые решения, если для сравнений используются исходные данные, а не их классифицированные версии.

    Упомянем и другие проблемы использования ДДЗ. Изменение атмосферных условий, например, появление облаков над особенно важными участками области изучения, или различия в прозрачности дымки в воздухе, могут иметь огромное влияние на качество изображений и их пригодность к картографированию. Вдобавок, поскольку и спутник и Земля постоянно движутся, нужно как-то корректировать возникающие от этого геометрические и временные искажения. Все эти проблемы будут еще упомянуты в Главе 15, где мы будем рассматривать проектирование ГИС.

    Несмотря на относительную сложность использования ДДЗ в ГИС, эти две когда-то совершенно раздельные технологии сегодня все больше интегрируются. Низкая стоимость изображений единицы площади и возможность быстрого создания актуальных карт - преимущества, которые сильно перевешивают только что рассмотренные проблемы. К тому же, сообщество пользователей ДДЗ разрабатывает всё более совершенные методы обработки изображений, а многие его члены вовлечены также и в работу с ГИС. Такая тенденция может значительно помочь обеим областям исследования.

    Карты растительности

    Сегодня для создания карт растительности для больших площадей широко используется спутниковое дистанционное зондирование, наряду с традиционным подходом, состоящим из комбинации аэрофотосъемки и полевых работ. Существуют многие потенциально ценные карты растительности, среди которых особый интерес для исследования изменений растительности со временем могут представлять карты, созданные за предшествующие десятилетия. Среди этих карт имеются три распространенные категории, как они были установлены в 1940-х-50-х годах [Kuchler, 1956].

    Одни карты растительности основаны исключительно на классификации видов (флористические карты растительности), в то время как другие классифицируют типы растительных сообществ [Kuchler, 1949], третьи используют различные комбинации этих методов [Kuchler, 1955]. В результате широкого разнообразия таких комбинаций возник странный набор сильно отличающихся карт растительности, затрудняющий сравнения с современными картами. Даже сегодня, несмотря на установленные соглашения [Kuchler and Zonneveld, 1988], существует огромное различие в методах отбора и классификации, используемых для картографирования растительности.

    Как и большинство других картографических документов, созданных в рамках традиционной парадигмы сообщения, карты растительности обусловлены интеллектуальным фильтром, действующим при создании этих документов, основанным в значительной степени на предполагаемой цели использования этих карт [Kuchler, 1956]. Это создает определенные трудности включения карт растительности в качестве части картографической базы данных, особенно если нет полного объяснения метода классификации. В свою очередь, современные карты растительности, вводимые в ГИС для сравнения с картографическими документами прошлого, должны быть основаны на совместимой системе классификации. В идеале должны быть доступны данные полевых наблюдений, чтобы пользователь ГИС мог восстановить исходную базу данных на основе этих материалов [DeMers, 1991]. Жизненный опыт подводит к тому, что эти данные должны сохраняться для тех, кто может счесть их полезными для своего картографического проекта. Мы вернемся к этой теме при обсуждении проектирования ГИС в Главе 15.
    Временные ряды карт

    Как говорилось при обсуждении карт растительности, временные ряды карт всех видов потенциально полезны для пространственно-временного анализа территорий [Hodgson and Alexander, 1990; Hunter et al., 1990; Vrana, 1989]. Однако этот потенциал ослабляется тем, что в разные годы использовались разные инструменты сбора данных, назначения карт были несколько разными, изменялись системы классификации и, как мы видели, набор базовых знаний создает ограничения достоверности карт, которые создавались при его актуальности.

    В конечном итоге наиболее важен вопрос достоверности. Если, например, временные ряды карт используются для определения изменений границ, то следует проверить точность размещения границ, а также внутренней классификации очерченного региона. Если сравниваются сами классификации, то должны быть разработаны правила сравнения различных классификаций. И еще нам нужно помнить, особенно когда мы имеем дело с такими картами, что изменения в картографическом представлении, оказавшие большое влияние на эти карты, как и на любые другие карты, могут воздействовать и на наш географический анализ.
    Вопросы

    1. Какое влияние оказывает развитость графического мышления на нашу способность работать в качестве специалиста по ГИС?

    2. Что такое парадигма сообщения? Какова ее главная цель? Как она влияет на идеологию построения и использования ГИС? Приведите пример ее использования для традиционных карт.

    3. Что такое аналитическая парадигма? Чем она отличается от парадигмы сообщения? Приведите пример ее использования в картографии. Как эта парадигма влияет на ГИС?

    4. Каковы основные способы обозначения масштаба на карте? Опишите их. Каковы относительные преимущества каждого вида сообщения масштаба при использовании в ГИС?

    5. Каковы потенциальные проблемы ввода в БД ГИС карт разных масштабов? Как они могут повлиять на анализ и измерения?

    6. Каково назначение легенды карты? Как легенда карты показывает связи между объектами и атрибутами?

    7. Что такое картографические проекции? Каково их назначение? Каковы три основные семейства картографических проекций?

    8. Какие основные геометрические характеристики изменяются при использовании картографических проекций? Какие виды проекции лучше всего подходят для сохранения каждой из этих характеристик?

    9. Основываясь на ответе на предыдущий вопрос, предложите некоторые основные решения, которые вам нужно будет принять при выборе проекций для различных видов географического анализа.

    1. Опишите координатную сетку UTM. Каковы ее преимущества и недостатки при использовании в ГИС?

    2. Какое влияние оказывает выбор интервалов классификации на ввод карт в ГИС и дальнейший анализ?

    3. Как влияет размер картографических символов на точность карт? Что вы можете сказать о взаимном влиянии двух или более символов?

    4. Какова разница между целенаправленным и пассивным упрощением? Как упрощение влияет на использование существующих карт для создания БД ГИС?

    5. На что вам следует обратить внимание по отношению к картам почв, растительности, ДДЗ и временных рядов карт при их применении в ГИС?

    6. Как могут использоваться ДДЗ для ввода в ГИС без необходимости в классификации?


    Картографические и геоинформационные структуры данных



    До сих пор мы рассматривали географию только в ее традиционных формах, как ориентированных на полевые исследования, или как картографически представленные и в дальнейшем анализируемые через картографические измерения или отдельные пространственно-аналитические и статистические методы. Вместе эти традиции внесли свой вклад в понимание того, как функционируют распределенные по поверхности Земли объекты. С развитием компьютерной техники, географы начали экспериментировать с автоматизированными методами исследований. Эти методы включают и анализ картографического представления объектов и пространственный анализ без применения карт. Трудно, или даже невозможно, отделить любой из этих методов исследования от развития геоинформационных систем. Да это и ни к чему. И те и другие являются частью большего инструментария компьютерной географии.

    Одни коммерческие ГИС-продукты имеют прямую связь с множеством статистических программ, что позволяет выполнять анализ характеристик объектов отдельно от самой карты. Другие используют специальные форматы данных для передачи данных карты в отдельные статистические или аналитические программы для самостоятельного анализа. В обоих случаях цель одна - дать аналитику доступ к широчайшему набору методов исследования пространственных данных. Эта интеграция компьютерных методов укрепляется по мере развития данной отрасли и расширения знакомства пользователей с компьютерной географией. Как специалистам по геоинформатике вам следует приветствовать эти перемены и поощрять все новые комбинации, например, геостатистические программы, программы специального моделирования и т.п.

    Для эффективного выполнения нашей работы нам необходимо понимание структурного строения ГИС. Каждая система имеет свои собственные уникальные структуры, методы представления и способы анализа пространственных данных. К счастью, они могут быть сгруппированы в относительно небольшое число основных типов структур данных, каждый из которых используется теми или иными системами.

    Поскольку за время своей карьеры вы скорее всего будете работать с разными системами, вам нужно познакомиться со всеми основными типами. У вас будет достаточно возможностей сконцентрироваться на конкретной системе, с которой вы будете чаще всего работать, уже в процессе самой работы.

    Представление пространственных данных - еще один формализм, подобный тем, что мы рассматривали при переходе от реальных земных объектов к ограниченному набору геометрических примитивов, называемых точками, линиями, областями и поверхностями. Разница всего лишь в том, как мы представляем их внутри компьютера таким образом, чтобы мы могли их редактировать, измерять, анализировать и выводить в какой-либо удобной форме. В этой главе мы рассмотрим некоторые основные структуры компьютерных файлов. Затем мы перейдем к структурам баз данных, которые обеспечивают организацию, поиск и анализ больших объемов данных. Мы рассмотрим основные концепции, связанные с представлением пространства и его объектов с помощью графических структур данных. Затем мы выработаем детальные модели данных, которые позволяют связать множественные наборы картографических данных с их атрибутами для образования завершенной БД ГИС.

    По мере чтения главы вы будете знакомиться с этими структурами в порядке роста их сложности. Не пожалейте время на понимание простых типов структур данных прежде чем переходить к более сложным моделям данных ГИС. Если в вашем распоряжении имеется несколько геоинформационных программ, вам следует определить, какие структуры данных каждая из них использует и как они работают. Исследуя эти программы, задайте себе вопрос, каковы возможные преимущества одного типа перед другим. Какие из них лучше подходят для экономии дисковой памяти? Какие более точны в пространственном отношении? Какие лучше всего представляют точки, линии, области или поверхности? Каковы преимущества каждой системы с точки зрения географических вопросов, которые вы могли бы задать? Ответы на эти вопросы окажутся полезными вам как аналитикам (т.е. пользователям ГИС) и неоценимыми, если ваша карьера будет связана с разработкой систем для потенциальных пользователей ГИС.
    ИДЕЯ ПРЕДСТАВЛЕНИЯ ПРОСТРАНСТВЕННЫХ ДАННЫХ

    Перед тем как приступить к новому уровню представления реальности, который позволяет компьютеру оперировать с пространственными данными, будет неплохо вспомнить, как мы перешли от реальной Земли к более отвлеченным представлениям, которыми мы можем оперировать в уме. Когда мы путешествуем по изучаемой области, пешком или используя


    устройства дистанционного зондирования, мы начинаем процесс отвлечения с простейшего представления наблюдаемого как групп точек, линий, областей и поверхностей. Этот процесс, как вы помните, преломляется через вопросы, которые мы задаем, и то, как мы собираемся на них отвечать. Мы принимаем решения о том, какие объекты принять во внимание, а какие - проигнорировать. Затем мы выбираем метод сбора данных, будь то полная перепись или какой-либо выборочный метод. Некоторым объектам мы присваиваем имена, другие измеряются на более высоких шкалах (т.е. порядковой, интервальной и отношений).


    Собрав данные, мы принимаем решение о представлении их в графической форме. Мы сравниваем и группируем данные, выбираем проекцию и систему координат и т.д. В некоторых случаях, особенно при отсутствии ГИС, мы создаем карту непосредственно из этих данных, и только позднее вводим их картографическую базу данных для использования в ГИС. Сегодня данные чаще вводятся прямо в ГИС, образуя географическую базу данных, основанную на прямых наблюдениях.

    Упомянутые процессы включают вначале обзор окружения и решение о том, какое его концептуальное представление необходимо, и дальнейшее его абстрагирование либо в форме карты, либо в некой форме для прямого ввода в ГИС (Рисунок 4.1). При этом компьютер вынуждает нас к определенному взгляду на наши данные. Компьютеры не мыслят как мы это понимаем, не оперируют они непосредственно и с визуальными или графическими объектами, как мы бы изображали их на листе бумаги. Вместо этого к компьютерам нужно обращаться на каком-либо языке программирования вроде Фортрана, Си или Паскаля.

    Когда мы сформировали наше представление о пространстве и пространственных отношениях, мы можем организовать наши данные таким образом, чтобы в этом был какой-то смысл. Некоторое время карта была графическим языком, который мы использовали для визуализации пространства и его объектов. Но наш графический язык имеет определенно другую структуру, нежели то, что имеется в компьютере. Возьмите в качестве простого примера процесс исследования карты для определения отношений между озером внутри острова, покрытого деревьями на севере, и с чистым пляжем на юге.

    Словесное описание мгновенно порождает визуальный образ, а карта легко понимается с небольшими явными указаниями. Мы ясно видим, что озеро находится "внутри" острова, что остров "окружен" океаном, что деревья занимают его северную часть, а пляж - южную. Опять же, нам не требуется явных инструкций, чтобы обнаружить эти факты. Но компьютер ничего не знает об озерах, островах, лесах, пляжах или направлениях. Мы должны создать формальный язык, который позволит компьютеру использовать его цифровое (из нулей и единиц) видение мира для определения пространственной протяженности каждого объекта, его положения в какой-либо координатной системе, различения смежных объектов и опознавать и сортировать объекты по ориентации, размеру, положению и т.д. Это похоже на попытку объяснить кому-то в мельчайших подробностях выполнение задачи посещения магазинов. Должна быть включена каждая деталь, от поворота дверной ручки, до управления автомобилем, определения маршрута по улицам, обнаружения магазина и выбора покупки. Такие вещи, требующие аналогового мышления для их выполнения, очень просты для нас, но очень трудны для компьютера.

    К счастью, мы, изучая геоинформатику, не собираемся начинать с нуля в объяснении всех деталей представления и операций с географическими объектами в пространственном контексте. Но чтобы разобраться с ГИС, нам нужно познакомиться с некоторыми основными приемами, придуманными другими для того, чтобы компьютеры делали все это. Мы начнем с элементарного уровня компьютерных структур, но не с машинного уровня.

    Вместо этого мы начнем с рассмотрения традиционных структур компьютерных файлов, обеспечивающих хранение, упорядочивание и поиск элементов данных. Потом мы перейдем к более высокому уровню организации данных в компьютере, называемому базами данных, которые состоят из комбинаций файловых структур для поддержки более сложных методов управления данными. Затем мы рассмотрим способ явного представления географического пространства в форме графических структур данных, и в конце концов расширим его для включения множественных графических слоев данных и их атрибутивных БД в то, что мы называем ГИС.
    ОСНОВНЫЕ СТРУКТУРЫ КОМПЬЮТЕРНЫХ ФАЙЛОВ

    Если вы уже проходили курс компьютерной грамотности или программирования, то среди первых вещей, с которыми вы познакомились, были простые структуры компьютерных файлов. Файлы - всего лишь простая система учета, позволяющая компьютеру отслеживать записи данных, которые вы в него вводите, и получать эти записи в любом угодном вам порядке. То же самое для ГИС. Одна из важнейших функций ГИС -хранение объектов и их атрибутов таким образом, который позволяет нам выбирать, например, для отображения, любую комбинацию этих объектов. Это требует от компьютера способности хранить, отыскивать и выбирать записи, устанавливать перекрестные ссылки. Другими словами, каждый графический объект должен храниться в явном виде, вместе со своими атрибутами, так, чтобы мы могли выбирать нужную их комбинацию за приемлемое время. Это подобно списку имен, адресов и номеров телефонов с перекрестными ссылками.
    Неупорядоченные файлы

    Простейшей структурой файла является неупорядоченный массив записей. В нашем примере с именами и адресами это аналогично созданию отдельной карточки для каждого имени в картотеке, причем вместо того, чтобы организовывать имена в некотором определенном порядке, вы помещаете карточки в картотеку в последовательности их ввода (Рисунок 4.2). Единственным преимуществом такой структуры файла является то, что для добавления новой записи нужно просто поместить ее в конец файла, позади всех других записей.

    Очевидно, что все введенные карточки имеются в картотеке и вы можете отыскать любое имя, но отсутствие упорядоченности делает поиск довольно длительным. Если вам приходилось создавать картотеку, то вы наверняка попытались бы сделать это как-то иначе, особенно если количество карточек велико.



    Рисунок 4.2. Неупорядоченный файл. Иллюстрация структуры файла как неупорядоченной картотеки.
    Допустим, ваша база данных содержит 200'000 записей. Если файл неупорядочен, то вам, возможно, потребуется просмотреть все 200'000 записей, чтобы найти нужную. Если, например, для выборки одной карточки требуется одна секунда, то поиск займет (в среднем) (п+1)/2 операций [Burrough, 1983], то есть почти 28 часов для поиска одной записи. Кажется, нам нужно провести какие-то организационные мероприятия для повышения эффективности поиска.
    Последовательно упорядоченные файлы

    Как вы знаете, большинство картотек, как, например, телефонные справочники, упорядочены по алфавиту (Рисунок 4.3). Этот метод использует сравнение каждой новой записи с имеющимися для определения того, где ее место. Такие последовательно упорядоченные файлы (drdered sequential files) могут использовать буквы алфавита, как в нашем примере с картотекой, или числа, которые тоже имеют определенную последовательность. Обычной стратегией поиска здесь является так называемый поиск делением пополам (или дихотомия). Поиск начинается

    1   2   3   4   5   6   7   8   9   10   ...   38


    написать администратору сайта