Майкл ДМерс ГИС. Инициаторы проведения этого новаторского события надеются привлечь к нему внимание мировой общественности и широких масс пользователей географических информационных систем из всех стран.
Скачать 4.47 Mb.
|
Глава 2 Некоторое число традиционных приборов теперь модернизированы для гораздо большей точности, легкости использования и считывания результатов на цифровом дисплее. Одним из примеров являются современные цифровые теодолиты. Все эти улучшенные инструменты, как и их прежние собратья, имеют ограниченное применение, для больших территорий. С другой стороны, время, которое требуется для съемок этими приборами, значительно перевешивается ценностью высокоточных позиционных данных, которые могут быть важны для таких работ, как определение границ землевладений. А это гарантирует их дальнейшее использование. Технические новшества улучшили методы, с помощью которых мы можем получать позиционную информацию, особенно для больших участков земли. Сегодня вокруг Земли вращаются спутники, положение которых известно с большой точностью. Эти спутники принимают радиосигнал от наземных управляющих станций с информацией об их местоположении, и передают ее полевому прибору (field unit), который определяет по ним свои координаты, отражающие позицию и высоту приемника. По-видимому, наиболее перспективной и наиболее используемой сегодня такой системой является упомянутая в Главе 1 Глобальная система позиционирования (GPS) NAVSTAR*. (Рисунок 2.11). Точность ее зависит от числа видимых спутников, сервиса и объема информации, модели полевого устройства (GPS-приемника) и методики измерений. Имеющиеся сегодня системы обеспечивают точность определения местоположения от относительно грубых ста метров до 10 см и лучше. При этом не требуется прямой видимости управляющей станции от полевого прибора, однако требуется видимость спутника. Это создает определенные трудности применения таких приборов в местах с ограниченной видимостью спутников, например, в густом лесу, горных ущельях, крупных городах. * Существует аналогичная российская система ГЛОНАСС. Сегодня уже имеются GPS-приемники, способные работать одновременно с обеими .системам. — прим. ред. Для полевых исследований животных существуют устройства для отслеживания перемещений оленей, птиц, мелких млекопитающих и даже пчел (если устройства достаточно малы). Традиционно такие устройства прикрепляются к животным, и их положение определяется наблюдением за постоянно излучаемым сигналом с помощью полевой станции, которая может быть наземной или размещенной на летящем самолете. Последним развитием этого радиотелеметрического (radiotelemetry) способа сбора данных, является интеграция его с GPS, что позволяет наблюдать объекты на гораздо больших территориях и с большей точностью. Поскольку эти технологии продолжают улучшаться в качестве, легкости использования и цене, больше данных лучшего качества будет доступно для ввода в ваши ГИС. Рисунок 2.11. Полевой комплект GPS (GPS-приемник). Когда нашим делом является сбор информации о распределении объектов, растений, животных и даже людей, а не об индивидуальных местоположениях, мы используем другой способ сбора данных, называемый переписью (census), техника выполнения которого зависит от природы собираемых данных. Например, мы могли бы использовать непосредственный контакт с целью физически определить точные положения и характеристики отдельных кустов на открытой местности. Но, как подразумевает пример, целью метода является получение информации обо всей популяции объектов в пространстве. Наиболее общим примером, конечно, является перепись населения, проводимая государством. Эти методики направлены на получение как позиционных (locational), так и описательных (attribute) данных о людях с тем, чтобы можно было сделать обобщения о популяциях в выбранных областях или районах, Собираемые сведения часто включают семейное положение, доход, жилищные условия, возраст, пол. Из таких обобщений можно определить, по меньшей мере приблизительно, какие области имеют наименьший подушный годовой доход, становится ли население в целом старше, каково соотношение людей живущих в квартирах и отдельных домах и т.д. Эти результаты, в свою очередь, позволяют органам власти предлагать Глава 2 пути реагирования на изменяющиеся условия. Другими словами, теперь власти имеют методику планирования, основанную на знании пространственного распределения населения. Потенциал переписи в описании пространственных отношений внутри населения страны вызвал движение в сторону автоматизации этого процесса. Перепись стала компьютеризованной, тем самым и получая преимущества от компьютеризованной географии, и внося вклад в нее. В главе 4 мы увидим, как Бюро переписи США создало методику обновления данных с тем, чтобы сделать переписную информацию доступной для большинства коммерческих ГИС-продуктов. Однако, иногда ни наземные измерения, ни перепись не подходят для сбора данных и получения адекватной пространственной информации о больших участках земной поверхности. Это утверждение особенно применимо к природным явлениям, но также верно и для многих антропогенных феноменов. Получение информации в региональном или даже континентальном масштабе может потребовать использования косвенных методов (indirect methods) сбора данных. Эти косвенные методы часто используют датчики (sensing devices), значительно удаленные от исследуемых объектов, и поэтому называются обобщенно дистанционным зондированием (remote sensing). Хотя термин часто подразумевает использование в некоторой форме спутникового зондирования, мы будем использовать его более широко, включая сюда и аэрофотосъемку, которая иногда исключается из этого определения вследствие существовавшего различия методов интерпретации данных. Если в дистанционном зондировании датчик удален от объекта измерения, то в телеметрических методах от датчика удален получатель информации. Такие устройства часто располагаются на стратегических позициях, которые должны представлять характер окружающей местности. Кроме того, датчики могут устанавливаться по всему интересующему региону для того, чтобы получить информацию о как можно большей его части. Автоматическая метеорологическая станция является, наверное, наиболее известным представителем устройства телеметрического сбора данных. Существуют целые сети датчиков для непрерывного или периодического сбора данных о температуре, влажности и других важных параметрах почвы. Чаще всего такие сети подключаются через сети передачи данных к базовой станции, которая получает и хранит информацию либо на бумажной ленте, либо в виде цифровых данных в компьютере. Разработаны и более экзотические устройства для записи траекторий полета насекомых, движения пресмыкающихся, перемещения частиц песка, или для наблюдения за загрязнением воды и атмосферы, сейсмической активностью и, конечно, похитителями драгоценностей. Все вместе, эти устройства могут дать широкую картину явлений, на которые они реагируют. В отличие от телеметрии использование аэрофотосъемки, как и космической съемки, позволяет собирать информацию о непрерывных изменениях феноменов от места к месту, делая ненужным опираться на наблюдения только в отдельных точках. Этот тип дистанционного зондирования чаще всего использует фотоаппарат аналогичные цифровые устройства на борту самолета или спутника, регистрирующие участки спектра электромагнитных волн. Фотоаппараты бывают различных видов и могут использовать разные виды пленки - от традиционной черно-белой до цветной и спектрозональной (псевдо-цветной инфракрасной (false-color infrared)) - в зависимости от требуемых данных. Во многих случаях используются специальные комбинации пленок и фильтров для устранения нежелательных участков спектра и выделения областей спектра, более информативных для изучаемых феноменов. Цифровые устройства также могут вести съемку как в одном, так и в нескольких зонах спектра одновременно. Аэрофотосъемка, опора многих видов пространственного анализа, имеет давнюю традицию использования для оценки и управления лесами и другими природными ресурсами, поскольку фотографии позволяют аналитикам охватывать большие участки земли одним взглядом. Почвоведы используют эти фотографии для распознавания небольших изменений типов почв на больших площадях, а также в качестве основы для почвенных карт. Специалисты по урбанистике используют их для оценки величины населения через подсчет жилых строений при известном среднем числе жителей на одно строение. Геологи давно уже используют аэрофотосъемку в качестве источника информации о пространственном распределении форм рельефа, а также глубинных феноменов, таких как соляные купола и зоны разломов. Военные, конечно, используют аэрофотосъемку в целях разведки. На самом деле, цветная спектрозональная пленка, сначала названная пленкой обнаружения маскировки, была разработана в значительной степени при участии военных. На самолетах устанавливаются и другие, более экзотические приборы, такие как радары бокового обзора (side-looking airborne radar (SLAR)), сканирующие радиометры (scanning radiometers), цифровые видеокамеры и цифровые фотоаппараты. Таким образом, использование аэросъемки как средства сбора географической информации давно существует и все еще актуально для небольших площадей. Для больших же территорий, таких как целые страны, затраты средств и времени слишком велики. Однако, большие площади могут исследоваться другими методами, многие из которых реализованы с помощью спутников, летающих за сотни километров от обозреваемой земной поверхности, причем некоторые из них используют те же технологии, что сегодня используются на самолетах. Большое расстояние между чувствительным прибором и его объектом позволяет спутникам обозревать большие площади одновременно. Вдобавок, поскольку спутниковые приборы дистанционного зондирования обращаются вокруг Земли, они способны собрать информацию почти обо всей планете за небольшую долю того времени, которое потребовалось бы для аэросъемки. Как указывалось, имеется широкий диапазон зондирующих устройств, каждое со своими спектральными, временными и пространственными характеристиками. Некоторые спутники созданы для наблюдений за погодой, другие же могут "видеть" и наземные объекты. Например, спутник SEASAT был разработан главным образом для исследования морских феноменов, таких как волны и айсберги. Спутниковые камеры дальнего инфракрасного диапазона, например, используемые в составе AVHRR на борту спутника NOAA, позволяют геологам обнаруживать горячие точки и предсказывать вулканическую активность. А приборы спутника GOES, находящегося на высокой орбите, позволяют увидеть сразу поверхность целого полушария планеты. Следует помнить, что данные дистанционного зондирования не являются непосредственными. То, что получается от аэрофотосъемки, радаров и цифровых снимков дистанционного зондирования, больше или меньше представляет то, что находится на поверхности. Хотя в них нет, например, типов растительности или видов человеческой деятельности, аналитики могут использовать эти данные в качестве косвенных признаков того, что реально находится на земле. В большинстве случаев эти данные должны быть обработаны специалистами, опытными в их дешифрировании (interpretation), прежде чем категории объектов будут адекватно установлены. Чаще всего в базу данных ГИС вводятся результаты такой классификации, нежели сами необработанные данные. Как мы увидим позднее, возможность человека или машины-интерпретатора правильно идентифицировать объекты в пространстве сильно связана с ценностью таких данных для принятия решений (decision making). Область спутникового дистанционного зондирования огромна и изменчива, как благодаря внедрению новых систем с новыми чувствительными устройствами, или сенсорами (sensing devices), так и потому, что специалисты изобретают все новые пути их использования. При этом каждая из таких систем видит вещи по-своему. Специалисты по дистанционному зондированию продолжают разрабатывать всё новые применения этих устройств, так что каждый специалист по ГИС должен быть в курсе потенциальных возможностей этой технологии. ПОПУЛЯЦИИ И СХЕМЫ ОТБОРА Остается одна проблема перед тем, как мы будем готовы объяснить то, что мы видим в нашем путешествии. Теперь в нашем распоряжении есть пространственный язык, который дает нам знание о том, где и что искать, когда мы исследуем наше окружение. И мы знаем об устройствах, которые позволяют нам собирать большие объемы данных с помощью спутников. Но сложность нашей планеты может часто становиться подавляющей просто потому, что существует так много объектов и так много факторов, которые могут быть подвергнуты исследованию. И хотя приборы дистанционного зондирования позволяют нам видеть большие территории одним взглядом, разрешение, при котором они снимают землю, часто ограничивает размеры объектов, которые мы можем увидеть. Некоторые объекты, например, норы животных в степи, находятся далеко за пределами видимости многих приборов. А поскольку такие объекты разбросаны по большой территории, получение детальных аэрофотоснимков оказывается чрезмерно дорогим. Поэтому нам придется выполнять наши наблюдения и оценки на земле. И это возможно, поскольку интересующие нас объекты достаточно многочисленны, чтобы визуально доминировать на ландшафте. Но их слишком много, чтобы мы могли учесть каждый и записать его координаты. Чтобы выяснить, почему эти объекты имеют определенное распределение, нужно прежде всего знать, что некоторое распределение существует, что в идеале выполняется поиском и записью местоположений объектов. Но поскольку мы не можем создать полную перепись всех нор, мы должны отобрать некоторую из них, то есть сделать выборку (sample), для того, чтобы получить выводы обо всей популяции на основе меньшего, представительного подмножества. Выборки могут производиться разными путями; некоторые из них труднее других, некоторые дают лучшую возможность делать выводы о популяции в целом. Хотя выборки эффективны как для пространственных, так и для непространственных данных, мы ограничимся только пространственными, так как ГИС имеют дело с явно пространственной информацией. Мы выбираем данные двумя главными способами: направленным и ненаправленным отбором (directed and nondirected sampling). Каждый метод определяется как ограничениями на получение пространственных данных, так и выводами, которые мы хотим получить о популяции данных при использовании выборок. Направленная выборка, как подразумевает название, требует принятия решений о том, какие объекты должны быть просмотрены и позднее внесены в список. Другими словами, мы направляем наш отбор на основе нашей возможности брать образцы из изучаемой совокупности объектов. Изучаемая совокупность занимает некоторую область отбора, в пределах которой мы делаем выборку [McGrew and Monroe, 1993]. Вместе, изучаемая совокупность и область отбора составляют базу выборки, которая включает типы интересующих нас объектов, ограниченных определенными пространственными координатами. В рамках направленного выбора, иногда называемого целевым, мы используем совместно знание исследуемой области и ее изучаемой совокупности, доступности объектов, которые мы желаем исследовать, вероятности получения адекватной информации о каждом индивиде (например, используя только данные опросных форм от людей, которым они были посланы), и исследования конкретных ситуаций с целью демонстрации определенного феномена. Хотя этот метод выборок часто называют "ненаучным", он все же часто необходим. Рассмотрим следующие ситуации. Вы планируете пространственное исследование типов растительности для территории, которая была расчищена от растительности, использована в сельском хозяйстве, а затем заброшена. Вам известен некоторый большой участок, который прошел через эти этапы, и поэтому вы планируете исследовать его вместо всех участков в вашем регионе или государстве, которые находятся в аналогичных условиях. Ваше исследование является более сосредоточенным, поскольку добраться до всех участков, подвергнутых очистке и забвению, было бы невозможно. Посетив один такой, вы обнаруживаете, что половина его окружена колючей проволокой, и владелец не желает, чтобы вы шатались по его собственности. Площадь вашего исследования еще более ограничивается. Вдобавок вы узнаете, что многие из имеющихся участков недоступны для транспорта. Теперь вам приходится сосредоточить исследование только на регионах в разумной удаленности от дорог. Таким образом, вам пришлось сосредоточиться на небольшом тестовом участке, прошедшем интересующий вас путь, и вам приходится ограничивать даже его из-за проблемы доступа. Такая ситуация типична и она ограничивает стратегию отбора (sampling strategy). Другая ситуация уже упоминалась в связи с использованием исследований популяций. Если, например, вы желаете определить пространственную распространенность пользователей кабельного телевидения и узнать, какие программы они смотрят, вы применяете обычный метод исследования, состоящий из набора вопросов о том, какие программы смотрят респонденты. Вопросники рассылаются жителям вашего города (целевая область). Однако вам нужно помнить, что некоторые люди не имеют телевизора, а многие имеющие их не подписываются на кабельные программы. Вы же хотите опросить только тех, кто смотрит кабельные программы (ваша изучаемая совокупность), возможно связавшись с кабельными компаниями с целью получить списки их клиентов, желающих принять участие в опросе. Составив список респондентов, вы посылаете каждому опросный лист с просьбой ответить на вопросы и указанием, как вам его вернуть. Поскольку большинство из нас получали такие анкеты, нам известно, что многие потенциальные респонденты их не возвращают. Очень вероятно, что в вашем случае произойдет то же самое. Что вам осталось, так это направленная выборка, сосредоточенная только на тех пользователях кабельного телевидения, которые вернули вам анкеты. Можно привести много других примеров, но каждому из вас придется принимать решения на основе собственной ситуации. Хотя ненаправленный, вероятностный отбор (nondirected, probability-based sampling) в общем случае более предпочтителен, поскольку он устраняет систематическую ошибку, смещение (bias) получаемых оценок, иногда этот подход будет невозможен. Перед тем как начать процедуру отбора, попытайтесь определить, возможен ли сбор данных средствами вероятностной процедуры отбора. Только в том случае, когда это невозможно, вы должны обращаться к направленному отбору. Если у вас есть возможность использования вероятностного пространственного отбора, каждый объект, выбираемый из базы выборки, предполагается имеющим известную вероятность отбора для исследования. Эта вероятность используется для построения процедуры отбора. Иначе говоря, вы используете известную вероятность для установления метода отбора, который обеспечит всем объектам равную вероятность попадания в выборку. Методы вероятностного отбора могут быть легко разбиты на четыре общие категории: случайный, систематический, стратифицированный и однородный отбор (random, systematic, stratified, homogeneous sampling) (Рисунок 2.12). Конечно, они могут быть скомбинированы для образования гибридного метода организации выборки, если это нужно, однако сейчас мы рассмотрим только простейшие виды, которые вы сможете модифицировать позже при подходящих условиях. Случайный отбор является самым основным методом. Его целью является обеспечение каждому отдельному точечному, линейному, площадному или поверхностному объекту такой же вероятности отбора, как и соседнему. Если пространственные данные, которые вы отбираете, дискретны, такие как деревья, озера, или люди, то вашей целью является наблюдение за некоторыми из них, выбранными случайно. В таких случаях каждый объект получает уникальный номер, скажем от 1 до 1000. С помощью генератора случайных чисел, имеющегося почти во всех компьютерах и многих карманных калькуляторах, или набора таблиц случайных чисел, достаточно легко выбрать часть из них, опять же случайно. Мы могли бы, например, отобрать 100 из 1000 номеров пространственно распределенных объектов для измерения. Если же данные являются непрерывными, такими как в случае рельефа, атмосферного давления или температуры почвы, мы случайным образом выберем точки, в которых можно измерить эти величины и перенумеруем их, выбрав точки для исследования как и прежде. В обоих случаях возможен выбор случайных точек, случайных областей, называемых квадратами (они часто используются для определения количества надземной биомассы трав) или пересечений линиями для использования в отборе объектов изучения. Рисунок 2.12. Методы пространственного отбора. Случайная, систематическая, послойная и однородная схемы отбора. Систематические схемы действуют почти так же, как и случайные, но сейчас в качестве основы отбора мы используем повторяющийся шаблон вместо случайных чисел. Для точечных данных мы могли бы, например, выбрать каждое десятое дерево, или деревья, расположенные примерно в двадцати метрах друг от друга. Для исследования небольших делянок или квадратов мы выбирали бы их таким же образом - каждый энный или через каждые n метров. Аналогично, если мы используем пересечения линий для отбора, популярный метод для исследования растительных ассоциаций, мы могли бы по системе определить, где окажется каждое пересечение, и сделать перепись растительности вдоль каждой такой секущей линии. Или, если мы желаем полностью осмотреть отдельные делянки или квадраты, мы можем опять же выбрать их, используя систематический, повторяющийся шаблон отбора каждого квадрата для исследования. Стратифицированный пространственный отбор вносит дополнительное измерение выбором малых областей, внутри которых отбираются отдельные ячейки или объекты. Стратифицирование упрощает процесс взятия проб через разделение всей задачи на малые области, которые могут, например, быть исследованы одним человеком или за один день взятия выборок (опробывания). Внутри каждого слоя мы можем решить, какой метод использовать - случайный или систематический. Есть модификация этого метода, в которой мы вначале определяем, сгруппированы объекты исследования, или они рассеяны по всей области исследования. Затем каждая из этих групп может быть выбрана в качестве подобласти исследования, наподобие того, как мы поступали при разбиении на слои всей нашей области исследования. Опять же, мы можем использовать подходы с точками, квадратами или секущими и выбирать систематический или случайный метод опробывания внутри каждой подобласти. Этот подход имеет определенное преимущество в случаях, когда однородность объектов обусловлена неким процессом. Выбор подобластей для индивидуального изучения может дать нам более детальные сведения об этом процессе, нежели рассмотрение всей области исследования как целого, в случае чего мы подразумеваем, что на всем исследуемом пространстве в действующих процессах практически нет вариаций. Однако, этот подход имеет и трудность, состоящую в том, что нам приходится принимать решения о том, какие из областей более представительны для данного процесса, чем другие, что может оказаться ошибочным. ОБОБЩЕНИЕ РЕЗУЛЬТАТОВ ВЫБОРОК Пространственные данные, полученные в результате пространственного отбора, подвергаются манипуляциям трех типов: характеристики не отобранных местоположений могут быть предсказаны из характеристик отобранных; данные внутри границ региона могут быть агрегированы (так, что им может быть назначен один класс характеристик); данные из одного набора пространственных единиц могут быть преобразованы в другие с иными пространственными очертаниями (configurations) [Muehrcke and Muehrcke, 1991]. Изучая далее геоинформатику, вы обнаружите множество ситуаций, где используется предсказание, поэтому общее понимание проблем предсказания сохранит вам время и усилия в дальнейшем. Выборочное обследование сокращает время, необходимое на сбор данных о регионе, однако оно оставляет пробелы в нашем знании мест, не вошедших в выборку. С учетом того, что большинство ГИС-программ в значительной степени полагается на идею областей, нежели точек, мы должны быть способны определить или предсказать недостающие точечные значения. Эта необходимость обычно возникает, когда мы собираем информацию о поверхностях, используя точечные отсчеты. Чтобы получить представление о том, как выглядит вся поверхность, например поверхность рельефа, мы могли бы выбрать некоторое количество точек для измерения высоты. Когда мы смотрим на топографические карты, как контурные, так и в трехмерном представлении, отсутствующие данные не измеряются, а вместо этого пространственно предсказываются [Muehrcke and Muehrcke, 1992]. В таких случаях существуют два общих типа предсказательных моделей. Интерполяция используется для определения недостающих значений, находящихся в пространстве между известными точками выборки. Предсказание значений за пределами области выборки на основе выявленных внутри нее закономерностей называется экстраполяцией. Интерполяция может быть простой, при предположении, что существует линейная взаимосвязь между известными величинами и неизвестными величинами, заполняющими промежуток. Более сложные методы основываются либо на предположении о нелинейной взаимосвязи между этими величинами, либо на взвешенном расстоянии (weighted distance), когда более близкие точки считаются более значащими в предсказании недостающих значений, чем более удаленные точки. Модели подбора поверхностей (surface fitting models) включают подстановку полученных в результате наблюдений величин в некоторое подобранное уравнение, решение этого уравнения, и затем нахождение каждого недостающего значения [Muehrcke and Muehrcke, 1992]. Эти модели полезны также и для экстраполяции, поскольку уравнение может быть легко расширено за пределы известных данных. Все эти методы позволяют предсказывать недостающие значения, однако следует помнить, что предсказания - не измерения, и каждое предсказание имеет свой собственный набор проблем и ошибок. Мы рассмотрим эти методы более подробно позднее, при изучении поверхностей. Возможна ситуация интерполяции или экстраполяции, когда задано некоторое деление на области, и точки выборки лежат не во всех имеющихся областях. Имея их, мы хотим сделать предсказания о точках в других областях, которые не были отобраны, Допустим, мы определяем плотность деревьев в нескольких малых областях и хотим иметь возможность предсказания плотности в других близлежащих областях. Такая задача обычно требует от нас выполнения трех этапов. Первое, мы подсчитываем средние плотности для каждой области с тем, чтобы исключить влияние на них размера областей. Затем, мы присваиваем каждую величину плотности одной точке внутри каждой из этих областей (обычно некой центральной точке). Тогда, выполнив эти шаги, мы можем вернуться к методам точечной интерполяции для предсказания средних значений плотности деревьев для каждой пропущенной области. Еще одно преобразование, которое может относиться к выборкам, должно быть рассмотрено здесь, хотя оно применимо и к полной переписи популяции. Предположим, что вы отбираете дискретные объекты, такие как местоположения животных. Отметив их положения (а в целях простоты мы предположим, что животные особо не двигаются), вы хотите узнать, какую часть территории они обычно занимают. Другими словами, вам нужно узнать их область обитания. Это обычная задача, например, для специалистов, занятых охраной дикой природы, которые используют приборы радиотелеметрии для определения местоположений животных и часто должны иметь дело с теми ГИС, которые плохо приспособлены к работе с точечными данными, но хорошо работают с площадными. Здесь могут быть применены некоторые относительно простые компьютерные методы, а также некоторые статистические подходы, которые мы позже рассмотрим подробнее. И последнее замечание, касающееся предсказания областей с использованием наложений. Для выполнения таких штучек нам нужна одна вещь, которая упоминалась только вкратце, но будет главной темой следующей главы, а именно - карта. Карта - это основной механизм, которым мы представляем пространство вокруг нас, и в рамках которого ГИС будет работать для его анализа. И в следующей главе мы расширим наш пространственный лексикон и улучшим наш пространственный фильтр, изучая, как мы можем от пространственных данных в общем, концептуальном смысле к пространственным данным в графическом смысле. |