Главная страница

Аналитика. 2004_Курносов ЮВ, Конотопов ПЮ_Аналитика_3,9 Mb. Рецензенты


Скачать 3.9 Mb.
НазваниеРецензенты
АнкорАналитика
Дата16.03.2023
Размер3.9 Mb.
Формат файлаpdf
Имя файла2004_Курносов ЮВ, Конотопов ПЮ_Аналитика_3,9 Mb.pdf
ТипДокументы
#995619
страница41 из 62
1   ...   37   38   39   40   41   42   43   44   ...   62
принципе лингвистической экономии
Г.К. Зипфа, что делает полученный текст пригодным для выполнения процедуры автореферирования на основе анализа статистических характеристик. Однако статистические критерии здесь приобретают более объективный характер, благодаря восстановлению системы умолчаний, используемых источником сообщения с целью сокращения синтаксической избыточности.
Использование спектрального представления сообщений позволяет упростить процедуры построения (связывания) и отображения системы логических связей сообщений и событий, упоминаемых в сообщении и его контексте, а также построить развернутые во времени и пространстве системы связей с привлечением сообщений, образующих внешний контекст (исходящих от других источников).
Важной особенностью такого подхода является то, что с его применением могут быть построены модели двух типов:
- модели динамики потока сообщений;
- модели динамики событий.

354
В этом случае преобразованный массив сообщений может быть представлен в виде логико-лингвистической модели, в графической интерпретации приобретающей вид ветвящегося графа, где ветвления указывают на наличие логических противоречий, разрешение которых возможно с применением мажоритарных и иных методов.
Серьезной проблемой при проведении автоматизированного анализа с применением формально-логических методов является проблема неоднородности представления высказываний. Одни и те же сущности и отношения могут быть выражены в различных терминах, зачастую принадлежащих к разным уровням терминологической иерархии. Например, слова «автомобиль» и «грузовик», не являясь синонимами и имея различный объем понятия, в тексте могут означать одно и то же. Решению этой проблемы может способствовать применение иерархических тезаурусов. То есть, синтезируемые в ходе ИАР модели должны обладать возможностью применения к ним многоуровневого иерархического тезауруса, реализованного в виде совокупности семантических сетей, построенных в терминах различного уровня абстракции. За счет этого модели позволяют осуществлять над ними операцию смены уровня абстракции (общности) описаний и приобретают свойства масштабируемости во времени.
Ситуационные модели, полученные с применением таких представлений позволяют использовать для анализа непротиворечивости сообщений совокупность стандартизированных процедур формального логического анализа. Более того, методы решения полисиллогизмов, предложенные
Б.А. Куликом, позволяют выявить факт неполноты системы аксиом и сформировать множество высказываний, которыми может быть дополнена аксиоматическая система, а также сформулировать полное множество логических выводов из системы посылок. Благодаря этому могут быть сформулированы задания на компенсацию неполноты массива исходных данных, а также определить комплекс противоречивых высказываний, сопоставить их с источниками и сформулировать гипотезу о степени достоверности сведений, поставляемых ими.
Несмотря на то, что это не позволяет сделать вывод о достоверности сведений, поставляемых конкретным источником (за исключением случая наличия внутренней противоречивости в его сообщениях), подобные методы позволяют оценить степень непротиворечивости сведений, полученных от группы источников. В результате чего, при наличии источников более достоверной информации может быть сформулирован комплекс мероприятий, направленных на устранение противоречивости.

355
8.2
НЕТЕКСТОВЫЕ МОДЕЛИ КАК ИНСТРУМЕНТ ВЕРИФИКАЦИИ
ДАННЫХ
Сколь бы совершенны ни были средства логического анализа достоверности данных, однако при условии, что стратегии дезинформации разработаны высококвалифицированными специалистами, располагающими столь же совершенными
«электронными помощниками», реальной возможности верификации данных они не предоставляют.
При проведении анализа достоверности данных о состоянии или тенденциях изменения состояния систем в отраслях, не сопряженных с
целенаправленным управлением параметрами процесса, либо имеющих
систему жестких ограничений, обусловленных спецификой протекания
базисных процессов, используются знания о наиболее общих закономерностях, определяющих поведение таких систем. Здесь широко применяются методы: теории вероятностей, математической статистики, формальной логики, теории измерений, а также законы, открытые в частных разделах естественнонаучных дисциплин.
Для таких систем, как правило, существует возможность синтеза модели, учитывающей диапазоны возможных значений и предельные динамические характеристики, на основе применения которой можно судить о достоверности/ошибочности данных, наличии искажений, вызванных теми или иными возмущающими воздействиями.
Ранее, рассматривая вопросы, связанные с моделированием систем, мы указывали, что модель является инструментом проверки гипотез. То есть, модель — это всегда инструмент верификации некоторой совокупности высказываний. Так что, вывод о возможности использования моделей для анализа достоверности сообщений является вполне естественным.
Очень часто, используя модели в реальной жизни, мы даже не задумываемся о том, что это действительно происходит. Многим людям, которым доводилось разрабатывать бизнес-планы, и в голову не приходило, что они занимались моделированием. Бухгалтер, составляющий балансовую отчетность, тоже редко задумывается о том, что он решает задачу оптимизации на достаточно сложной модели. Иными словами, модели — не есть нечто чуждое практике, вопрос лишь в том, сознаем ли мы факт их применения.
Допустим, что некая организация предлагает на сверхвыгодных условиях вложить деньги в «верное» дело. Зачастую наши сограждане, выяснив, сколько просят и что обещают, вкладывают и... теряют. Соображения их таковы: если просят немного, а обещают изрядно, то можно и дать — авось получится?
Такой подход представляет собой подмену моделирования примитивным сравнением альтернатив, не учитывающим рисков, связанных с ошибочным

356 выбором. Другое дело — взвешенный подход, связанный с оцениванием производственных затрат, спроса на продукцию, емкости рынка и иных характеристик социально-экономической системы. Объектом риска здесь, являются уже отнюдь не личные сбережения, а корпоративные финансы и ресурсы, соответственно требуется серьезное исследование, стоящее не малых средств. В последние годы в России появилось множество организаций, занятых проведением опросов общественного мнения, в нашу страну пришли и зарубежные фонды и институты, проводящие маркетинговые, социологические и иные исследования, например, Институт Гэллапа. Данные, получаемые в ходе подобных исследований, представляют высочайшую ценность, поскольку позволяют прибегнуть к аппарату математики, теории вероятности и математической статистики, то есть, воспользоваться инструментами повышения объективности выводов, вырваться из цикла эмоциональной вовлеченности и здраво оценить ситуацию.
Модели аналитические и имитационные, полунатурные и натурные, модели реального времени и допускающие временное масштабироване — значение их в том, что они являются инструментом «выращивания» нового знания, причем знания более «дешевого», нежели знание, полученное ценой полномасштабного эксперимента.
Проблема состоит в том, что затраты на синтез адекватной модели иногда оказываются сопоставимы с ценой ошибки. Поэтому, руководители часто отказываются от моделирования, забывая о том, что в случае ошибки
средства просто теряются, в то время, как затраты на моделирование
аккумулируются в модели. Модель-то остается и может быть использована вновь!
Проводя исследования в различных системах, сталкиваясь с разными по своей природе процессами, аналитик выбирает наиболее пригодный для решения задач анализа инструментарий исследования. Например, для моделирования результативности рекламной кампании, зачастую используется математический аппарат теории клеточных автоматов, аналогичный математический аппарат используется и в многоуровневом маркетинге (с линейной и нелинейной системой перераспределения прибыли). В других случаях оказывается эффективен математический аппарат теории линейного программирования. Однако единственное, ради чего используются все эти изощренные математические средства — это проверка истинности или ложности некоторого комплекса суждений.
Неслучайно в конце этой книги мы поместили приложение «Вариант организации процесса перспективного планирования на примере плана USAF-
2025» — там наглядно показана процедура построения дерева целей и задач для дальнейшего перехода от качественных оценок к оценкам количественным. Как только мы получаем модель, использующую некоторую метрику, пригодную для сравнения альтернатив, мы получаем инструмент, обеспечивающий

357 возможность аргументированной оценки утверждений на основе вычисления логических переменных.
9
СРЕДСТВА АВТОМАТИЗАЦИИ ИАР
В самом начале первого раздела этой главы нами была приведена классификация средств автоматизации информационной работы. В соответствии с этой классификацией средства автоматизации делились на средства сбора, доставки, хранения и обработки данных, средства формирования и согласования тезауруса, средства интеграции и анализа данных, средства моделирования, средства интерпретации результатов, средства прогнозирования, средства синтеза целей управления, средства отображения данных, средства поддержки принятия решений и доведения управляющих воздействий.
Совершенствованию этих средств уделяется большое внимание: сегодня конкуренция в области создания средств поддержки ИАР превратилась из привычного соревнования фирм-разработчиков в гонку информационных технологий на государственном уровне. Безусловно, гонка вооружений также подстегивает развитие информационных технологий, однако практика показывает, что по поражающей мощи вооружений и точности средств доставки боевых зарядов государства, стремящиеся к мировому лидерству, пребывают примерно на одинаковом уровне. Сейчас дорога к лидерству не может быть расчищена исключительно боевым потенциалом вооруженных сил государства — этого недостаточно, да и слишком велика цена такого лидерства.
Собственно, войны никогда не выигрывались исключительно оружием — это всегда было суровое испытание, в котором экономика, идеология, система управления государства доказывали свою жизнеспособность. Оружие массового поражения ненадолго поколебало уверенность в том, что это так, но когда оно перешло в категорию средств сдерживания нападения, все вернулось на круги своя. Теперь информационные технологии как инструмент повышения эффективности и оперативности процессов управления стали одним из основных элементов системы обеспечения экономической (и военной) безопасности государства, его граждан и субъектов экономической деятельности.
Говоря о средствах автоматизации и информатизации ИАР, следует выделять следующие классы:
- средства обеспечения ИАР, непосредственно не предназначенные для обработки и анализа информации (телекоммуникационное обеспечение
ИАР, средства сбора, накопления и хранения данных, средства отображения информации);
- средства ведения ИАР, непосредственно предназначенные для обработки и анализа информации (различного рода пакеты статистической обработки

358 данных, автоматизированные системы поддержки процессов моделирования сложных систем и анализа данных, лингвистические инструменты и т. д.).
В этой книге мы не будем рассматривать аппаратные и программные средства поддержки ИАР с такой степенью детализации, с какой они обычно рассматриваются в специальной литературе. Здесь нас интересуют не столько тонкости технической реализации, сколько идеи, заложенные в основу их функционирования, а также те положительные и отрицательные черты, которые эти средства способны привнести в ИАР.
Наиболее обширным и разнообразным по составу является класс средств обеспечения ИАР. Средства ведения ИАР отстают в своем развитии — оно и понятно: сложность аналитических процессов крайне высока...
9.1
СРЕДСТВА СБОРА ИНФОРМАЦИИ
Едва ли стоит перечислять все то многообразие средств сбора информации, которое имеется в распоряжении профессионального аналитика, тем более, что в зависимости от класса систем, в отношении которых ведется
ИАР, и бюджета субъекта ИАР комплектация существенно варьируется.
Многое из арсенала средств сбора информации лишь дублирует возможности органов чувств человека, обеспечивая лишь «эффект присутствия» — это разнообразные системы теленаблюдения и иные инструментальные средства, позволяющие осуществлять дистанционный сбор информации, которая могла бы быть воспринята и без инструментария сбора данных, будь аналитик непосредственным участником неких событий. Другая группа средств сбора данных существенно расширяет и дополняет «ощущения», за счет придания свойств наблюдаемости тем феноменам, которые принципиально не могут наблюдаться посредством органов чувств человека: это расширение частотных/временных и энергетических диапазонов чувствительности человека
(инфра- до ультра- звукового диапазона механических колебаний, от радиочастотного диапазона до ультрафиолетового диапазона электромагнитных колебаний, от микрообъектов до макрообъектов и т. д.). Арсенал этих средств чрезвычайно богат
92
Остановимся на средствах сбора наиболее очевидных и наименее достоверных данных — данных языковых коммуникаций и знаковых данных. В последние годы в этой отрасли развитие средств сбора происходит доселе невиданными темпами. Созданы средства распознавания и преобразования к символьному виду речевых сигналов, средства распознавания графических
92
Для тех, кто интересуется современными разведывательными технологиями, мы можем порекомендовать специализированный раздел (увы, англоязычный), посвященный технологическому обеспечению разведывательной деятельности «Intelligence Resources» на
Интернет-сайте Федерации Американских Ученых (Federation of American Scientists) http://www.fas.org/irp/

359 начертаний символов (оптические распознающие системы — сканеры), средства считывания картографических данных и т. п. графической информации. Создание этих средств дало мощный толчок развитию систем компьютерной обработки знаковых данных: сегодня, благодаря их использованию, аналитики получили доступ к неисчерпаемым ресурсам научно-технической, политической, экономической и иной информации. Пока лишь малая толика того, что хранится в глобальной телекоммуникационной сети (ГСТК) Интернет, набрана вручную — преимущественно эти ресурсы получены методом сканирования самых разнообразных печатных источников, хотя, наиболее вероятно, что постепенно ситуация будет меняться в пользу ресурсов, полученных методом голосового ввода.
В последние годы силами энтузиастов в ГСТК размещены электронные копии уникальных изданий. Мощные массивы англоязычных электронных документов сосредоточены в рамках некоммерческого проекта электронной библиотеки Project Gutenberg (http://www.gutenberg.net/). Российские ресурсы электронных копий научных, учебных и художественных изданий и также весьма обширны: здесь и Библиотека Мошкова (http://lib.ru/), и Big Information
System Project (http://nmsf.sscc.ru/), и Открытая Русская Электронная
Библиотека (http://orel.rsl.ru/), и Домашняя электронная библиотека
(http://kniga.bibirevo.net/), и многие другие ресурсы. Однако в силу стремления к личной известности начинателей бесплатных электронных библиотек (следует отдать им должное — это достойные люди), в российском сегменте Интернет, получившем название «Рунет», отсутствует единый каталог, а система каталогизации далека от совершенства. За рубежом интенсивно развиваются проекты, направленные на стандартизацию поисковых интерфейсов и формата представления электронных документов. Так, например, в библиотечном деле широко внедряется стандарт представления текстовых данных для организации поисковых интерфейсов Z39.50 и его международная версия ISO 23950, развивается проект TEI — Text Encoding Initiative, выпустивший уже четвертую спецификацию стандарта — в России же этот процесс существенно запаздывает. Такое отставание снижает ценность информационных ресурсов, поскольку отсутствие четких правил формализации приводит к снижению эффективности поисковых процедур.
Интересный класс электронных информационных ресурсов оперативного плана — это электронные СМИ, размещающие и распространяющие свою информационную продукцию с применением инфраструктуры глобальных и национальных телекоммуникационных сетей.
В
ГСТК
Интернет функционируют СМИ и информационные агентства, предоставляющие оперативную информацию, используя on-line (интерфейсы функционирующие в режиме непосредственного доступа) и off-line
(интерфейсы

360 функционирующие в режиме неоперативного доступа, например, рассылка новостей за некоторый интервал времени посредством электронной почты). В настоящее время в ГСТК представлены ведущие мировые информационные агентства (Associated Press, CNN, France Press, Интерфакс, АПН «Новости»,
ИТАР-ТАСС и многие другие) и газеты (New York Times, Washington Post,
Газета.RU и иные). Чрезвычайно информативны ленты новостей, предоставляемые информационными агентствами в режиме on-line с периодичностью обновления порядка единиц минут, биржевые рейтинги, публикуемые крупнейшими финансовыми и фондовыми биржами и крупными брокерскими объединениями.
Инструментарий сбора информации из подобных источников информации представляет собой преимущественно программно-аппаратные комплексы, обеспечивающие подключение к ресурсам телекоммуникационных сетей в соответствии с действующими протоколами обмена данными (как правило, это протоколы TCP/IP, PPP, SLIP, ISDN) и востребование данных с применением как профессионального, так и непрофессионального специализированного и общего программного обеспечения. Этот класс программного обеспечения весьма многообразен и включает в себя: интеллектуальные поисковые программы, неинтеллектуальные интерфейсы просмотра данных, программы, осуществляющие периодическое сканирование наиболее информативных источников, программы потокового ввода и иные.
Финансовые механизмы обеспечения оплаты информационных услуг могут существенно разниться от условно-бесплатного предоставления информации
(подача в сопровождении рекламы) до заключения договоров на информационное обслуживание.
Говоря об ГСТК Интернет,
1   ...   37   38   39   40   41   42   43   44   ...   62


написать администратору сайта