Аналитика. 2004_Курносов ЮВ, Конотопов ПЮ_Аналитика_3,9 Mb. Рецензенты
Скачать 3.9 Mb.
|
гуманитарные науки, из которых аналитика позаимствовала некоторые рабочие методы: психология и психоанализ, социология, политология, история, источниковедение, библиотечное дело, лингвистика, педагогика, криминалистика, юриспруденция и многие другие. Практически полный комплекс наук, которые когда-либо предпринимали попытки научного инвариантного описания особенностей поведения индивида или группы в различных ситуациях: при групповой и индивидуальной деятельности, при изложении мыслей, при синтезе целей и выборе методов их достижений и в иных ситуациях. Заимствовались методы, позволяющие оценить физическое и эмоциональное состояние человека, соотнести некие письменные документы с конкретным источником, выявить скрытые мотивы поведения, методы организации быстрого поиска информации, выявления противоречий в аргументации неких поступков или декларируемых намерений. Аналитика пополняла свой арсенал всем, что могло способствовать интенсификации процессов переработки информации, извлечению максимального объема полезной информации из имеющегося объема данных. Приведем интересный пример: многим известна теория Ломброзо о существовании некоторого «порочного типа» человека, который может быть выявлен в результате физиономического анализа. Эта теория стала столь известной благодаря интуитивной очевидности и, увы — бесславно окончившимся опытам ее применения. Но мало кому известна история, связанная с успешным решением проблемы каталогизации фотографий преступников А. Бертильоном (1880-е годы). Он предложил стандартизовать процедуру фотосъемки (сигналетическая проекция), а при помещении снимков в каталог ввести индексацию, учитывающую несколько 113 объективных параметров: длину и ширину головы, расстояние между скуловыми костями, длину и ширину правого уха. Метод каталогизации А. Бертильона живет и поныне, воплощенный в технологиях распознавания личности по совокупности базовых точек, в число которых входят скулы, цвет и форма глаз, ширина переносицы и губ. Как показывает практика, для достоверного определения личности достаточно 15-20 таких точек. Сейчас такими системами оборудуются аэропорты, вокзалы и прочие места скопления людей, где возможно проведение террористических акций. Правда, все атрибуты «бертильонизации» — специальные стулья с зажимами, обеспечивавшими фиксацию головы в заданном положении — вскоре отошли в прошлое, а методы идентификации по фотографии до поры были вытеснены дактилоскопией… Но с точки зрения аналитики ценность идей Бертильона заключается и в еще одном новшестве: была предложена стандартизированная методика составления словесного портрета. Благодаря этому новшеству в конце XIX века полицейские специалисты всех стран, изучив методику составления словесного портрета, смогли наладить эффективное взаимодействие при ведении оперативно-розыскной работы, что дало весьма положительные результаты. Тогда А. Бертильон писал: «...до тех пор, пока та или другая анатомическая особенность наружности индивидуума, отличающая его от тысячи других лиц и дающая возможность запечатлеть ее в памяти, не получит точного названия, она остается незамеченной и как бы не существует. Уже давно известно, что мы не можем представить себе того, чего не можем выразить словами, также запечатлеть в мозгу то, чего не можем описать». Эта методика послужила прототипом для множества полезных процедур, связанных с нормализацией терминологии, которые получили широкое применение в аналитике для уточнения понятийного аппарата предметной области исследований. Однако отвлечемся от криминалистики и перейдем к рассмотрению основных идей, пришедших в аналитику из гуманитарных наук. Следует заметить, что гуманитарные науки настолько взаимоувязаны, что отнести некоторый метод к конкретной научной дисциплине чрезвычайно сложно. По этой причине мы не будем акцентировать внимание на истоках метода, а сконцентрируемся на самих методах. МЕТОДЫ АТТЕСТАЦИИ ТЕКСТОВ Эти методы, как и большинство других, являются комплексными и основываются как на структурных и статистических методах, так и на методах качественного анализа. При аттестации текстов решаются следующие задачи: 114 - установление источника (и получателя), его пространственных и временных координат; - установление логико-фактографической компоненты текста, его тематики; - анализ полноты и непротиворчивости аргументации в рамках сообщения; - установление эмоциональной компоненты текста и системы оценочных суждений источника; - установление специфики лексикона источника в интересах паспортизации источника; - выявление ценностной ориентации источника; - установление категории текста; - установление цели генерации текста; - установление достоверности излагаемых фактов. Весомый вклад в развитие этих методов внесли практически все перечисленные выше науки. Для специфических классов информационно- аналитической работы этот список может приобретать специфические черты за счет изъятия тех или иных пунктов. Полный комплекс задач, как правило, подлежит решению лишь в весьма специфических отраслях, как правило — связанных с решением задач обеспечения безопасности. Задача установления источника (и получателя), его пространственных и временных координат может иметь очевидное решение, содержащееся в самом тексте, однако в ряде случаев может вызывать серьезные затруднения. В этом случае приходится применять достаточно сложные процедуры, связанные с анализом распределения служебных терминов, определением специфики лексикона источника. В частности, может строиться «спектр», а вернее — распределения частот употребления слов, принадлежащих к эталонному словарю, сопоставление с имеющимися спектрами-паспортами известных источников с целью отнесения к профессиональной/социальной, этнической/диалектной группе и т. п. Исследуются все имеющиеся в сообщении указания на его принадлежность к некоторому временному интервалу, отраженному в ссылках на некоторые значимые события, времена и даты которых известны или могут быть установлены (в том числе, такую информацию могут нести ссылки на цитируемые источники и т. п.). Определяется область пространства, из которой могло исходить сообщение, либо область, в которой имели место события, описываемые в сообщении. В некоторых случаях рассматривается схема построения адресации, используемая для описания размещения источника (такие задачи могут встречаться, например в глобальной телекоммуникационной сети Интернет, где по адресам серверов может быть установлена государственная принадлежность источника, опубликовавшего те или иные данные и т. д.). Задача установления логико-фактографической компоненты текста, его тематики представляет собой задачу высокой сложности. Это связано с тем, 115 что статус факта в сообщении может быть придан не только реальным событиям и явлениям, но и тем, которые на самом деле к этому разряду отнесены быть не могут. Такие искажения могут быть обусловлены множеством причин, в число которых могут входить и непреднамеренные ошибки логического плана, и некорректное построение грамматических конструкций, и преднамеренные искажения аргументации. Особый класс проблем возникает в связи с эмоциональной окрашенностью повествования, способной вызвать впечатление реальности факта, упоминание которого даже не встречалось в сообщении. Здесь важно выявить в тексте те маркеры, которые указывают на присутствие в тексте конструкций, соответствующих причинно- следственным, временным и пространственным отношениям, установить модальные конструкции типа «вероятно», «очевидно» и т. п., отсылающие к некоторой субъективной интерпретационной модели (редко декларируемой источником сообщения). На основе такого анализа текст может быть разделен на: 1) компоненты, которые могут быть отнесены к разряду фактов на основе объективных критериев; 2) компоненты, которые потенциально могут быть отнесены к разряду фактов (в существенной степени зависящие от совместимости субъективных моделей мира источника и потребителя сообщения); 3) компоненты, которые не могут быть интерпретированы как факт, но отражают специфику модели мира источника суждения. Задача анализа полноты и непротиворечивости аргументации в рамках сообщения, чаще всего, требует формализации текста, приведения его к нормализованной лексике, исключающей метафорическое или некорректное употребление терминов. Для этого могут быть использованы методы, широко применяемые в современной лингвистике и теории формальных языков, реализованные на базе аппарата формальных грамматик в сочетании с семантическими сетями. После выполнения процедуры формализации текст становится пригоден для производства анализа логической корректности системы аргументов на основе применения формально-логических процедур. Задача установления эмоциональной компоненты текста и системы оценочных суждений источника требует применения методов контент-анализа, основанных на детальном анализе текста с целью выявления слов, терминов или специфических ситуаций их употребления, способных воздействовать на эмоциональное состояние потребителя сообщения. При этом анализ должен проводиться на различных уровнях иерархии смысловыражающих и словообразующих единиц — от уровня морфем до уровня связных цепочек терминов, включая также выявление ритмического рисунка и аллитераций. Явным образом представленная расстановка эмоциональных акцентов в тексте (их соотнесение с терминами, выступающими в различных семантических ролях) позволяет выявить систему ценностей источника сообщения, сопоставить ее с набором классификационных эталонов и — в некоторых случаях — предсказать поведенческие особенности источника, а также более 116 точно определить цели, преследуемые источником при генерации сообщения. Для этого могут использоваться различные методы — от традиционных методов морфологического разбора и анализа контекста употребления до новейших нейросетевых методов (в данном случае механизмы реализации несущественны). Задача установления специфики лексикона источника в интересах паспортизации источника является существенной в приложениях, связанных с решением задачи сбора априорной информации об источнике сообщения (например, для дальнейшего взаимодействия с ним или выявления общеобразовательного уровня и/или профессиональной подготовленности в некоторой предметной области). В большинстве случаев эта задача может быть решена на основе статистического анализа текста и сопоставления с набором эталонов, полученных в результате анализа текстов аналогичной тематики, порожденных людьми с известными исследователям уровнем специальной подготовки и психологическими особенностями. При работе с текстами средств массовой информации, генерируемыми одной и той же группой авторов может быть сформирована адаптивная стратегия отбраковки текстов по авторам и тематике с учетом их квалификации в той или иной области знаний, а также для выявления «заказных» статей, написанных «под диктовку». Настоящий аналитик в состоянии оценить полезность подобных знаний. Здесь может быть использован опыт анализа принадлежности текстов перу того или иного автора или исторической эпохи, приобретенный в области источниковедения — специального раздела науки, лежащего на стыке исторической науки и лингвистики. Задача выявления ценностной ориентации источника связана с решением задачи эмоциональной оценки текста. Ее успешное решение позволяет предвидеть поведенческие реакции источника сообщения, типы событий, оказывающие на него влияние и побуждающие к генерации сообщений. При наличии известных навыков, аттестация источника (выявление его ценностной ориентации) по порождаемым им текстам позволяет сформировать социальный, мировоззренческий портрет автора, его менталитет, позволяющий при использовании специальных методик осуществить информационное управление им. Здесь, в частности, могут быть использованы социальные технологии А.А. Шияна. Еще одно — весьма важное — приложение знаний о специфике ценностной ориентации источника сообщения — это фильтрация оценочных суждений источника. Кроме того, на основе анализа ценностной ориентации источника может быть сформирована гипотеза о мотивационных доминантах, определяющих процессы целеполагания автора. Задача установления категории текста является задачей, решение которой целесообразно проводить в два этапа: формальный экспресс-анализ и детальный анализ. Экспресс-анализ направлен на оценивание целесообразности дальнейшей обработки текста, для чего в зависимости от целей анализа могут 117 быть введены различные эталонные модели, позволяющие по ряду формальных признаков отнести текст к той или иной категории. К числу таких признаков могут быть отнесены: длина и степень сложности предложений, характеристика частотно-рангового распределения длин слов, пунктуационная специфика и иные. В литературе по лингвистике функциональная категория текста часто отождествляется со стилистическими особенностями, однако это именно тот подход, который реализуется на первом этапе установления категории текста. Детальный же анализ позволяет отнести текст именно к функциональной категории на основе более объективных критериев, возможность оценивания которых может быть получена лишь в результате решения всех задач, перечисленных ранее. При этом классификация функциональных категорий текста примерно соответствует функциональной классификации предложений и выделяет следующие категории текстов: - информативные тексты, содержащие изложение фактов и/или нейтральных в эмоциональном плане суждений (эта категория примерно соответствует повествовательным предложениям), реализующие функцию передачи информации; - проблемно-постановочные тексты, содержащие логическую аргументацию, направленную на выделение проблемы или комплекса проблем, однако не предлагающие путей решения проблемы (эта категория примерно соответствует вопросительным предложениям); - побудительные тексты, содержащие побуждение к действиям, подкрепленные логической и/или эмоциональной аргументацией, реализующие функцию побуждения к действию. Задача установления цели генерации текста непосредственно связана с предыдущей задачей установления функциональной категории текста, однако требует анализа прагматической компоненты и оснований для реализации функции целеполагания источником сообщения. Учитывая, что любое информационное взаимодействие направлено на формирование/модификацию модели мира потребителя сообщения, при решении этой задачи целью является установление того, направлен ли данный текст на синхронизацию модели мира потребителя с моделью мира источника или же целью источника является внесение рассогласования, десинхронизация моделей мира. Задача установления достоверности излагаемых фактов является задачей, для решения которой требуется привлечение дополнительных источников информации, обладающих иным уровнем доказательности фактов, в том числе — использования результатов наблюдения за физическими проявлениями деятельности или пребывания некоторых объектов и систем в декларируемом состоянии. 118 АНАЛИЗ ИСТОРИЧЕСКИХ ПРЕЦЕДЕНТОВ Политология, исторические, социальные и экономические науки способны предоставить немало примеров того, сколь мало разнообразия вносят в наиболее распространенные политические и экономические стратегии различные технологические нововведения. Особенно ярко это демонстрируют военная история и политология — наиболее эффективные стратегические решения остаются неизменными на протяжении многих веков и их арсенал пополняется крайне редко. Здесь стоит привести известное изречение: «Что было, то и будет; что делалось, то будет делаться, и ничего нового нет под солнцем. Бывает нечто, о чем говорят: смотри, вот новое; но это было уже в веках, бывших прежде нас» (Экклезиаст, 1.8, 1.9). Многие прогнозы, сделанные на основе анализа исторических прецедентов, поражают своей точностью. Зачастую, стратегии, которые по сей день используются в общественно-политической сфере, на некотором уровне абстракции могут быть сведены к ограниченному набору сценариев. Работы по приведению комплекса сюжетов к минимальному набору сценариев в литературоведении были проделаны в 1928 году В.Я. Проппом на примере формального исследования русских народных сказок 50 . Интересно, что практически те же самые сюжеты-сценарии с некоторыми вариациями могут быть рассмотрены и применительно к большинству реальных ситуаций. В связи с последним замечанием нельзя не упомянуть знаменитые китайские стратагемы. Их системное собрание впервые предстало взорам читателей еще в VI веке до нашей эры в трактате о военном искусстве китайского полководца Сун-Цзы, указывавшего на величайшее значение в военном искусстве так называемого Гунь-Дао (Пути Обмана). В связи с началом исследований, посвященных синтезу теории информационно- психологических операций, в конце 20 века стратагемный подход вновь приобрел высочайшую актуальность. Появилось множество публикаций, посвященных вопросам стратагемного мышления и поведения 51 . Стратагемы, представлявшие собой краткие афористичные высказывания-наставления, содержавшие иносказательную формулировку стратегии обманного достижения поставленной цели. Считается, что китайский менталитет построен на 36 основных стратагемах, имеющих немалое число толкований, приложимых к большинству жизненных ситуаций. 50 см. Пропп В.Я. Морфология «волшебной» сказки. Исторические корни волшебной сказки. (Собрание трудов В.Я. Проппа.). — Издательство «Лабиринт», М.:, 1998. 51 см. Зенгер Х. Стратагемы. — М.: Прогресс, 1993.; Боршевич В., Тудос В. Информационные и системные аспекты стратагемного поведения и мышления. — Кишинев: Evriсa, 1998. 119 Характерно, что сопоставление базовых стратагем с большинством успешных стратегий, используемых в современной политике, военном деле и бизнесе позволило прийти к выводу, что будучи соответствующим образом формализованы, стратагемы могли бы выступать в качестве инвариантных концептуальных моделей высшего уровня, положенных в основу функционирования систем ситуационного анализа. Они могли бы служить интересам распознавания стратегий и ситуаций на основе применения метода исторических прецедентов. При использовании метода исторических прецедентов (аналогий) речь, как правило, идет об анализе потока сообщений, описывающих некие объекты, системы, ситуации, процессы и явления. Если предполагается осуществлять некие аналитические операции, в том числе и над данными, не приведенными к виду символьных (текстовых) сообщений, то на этапе предшествующем анализу, эти данные подвергаются процедуре преобразования к символьному виду. Это объясняется тем, что операции над данными, имеющими единую модель представления и интерпретации, вызывают меньшие затруднения. В принципе, вне зависимости от степени избыточности и уровня формализации описаний, любую развернутую во времени совокупность различным образом представленных сообщений можно рассматривать в качестве модели, описывающей последовательную смену состояний, процессов и явлений в некоторой сложной системе. Для исходной (произвольной) совокупности текстовых сообщений, полученных за некоторый промежуток времени, это утверждение справедливо лишь отчасти, поскольку эта совокупность, не отвечает требованию упорядоченности во времени и не избирательна (то есть, над ней не выполнена процедура отбора сообщений, релевантных, соответствующих задаче исследования). Однако, при условии, что процедуры отбора релевантных сообщений и их упорядочивания во времени выполнены и привели к получению непустого массива, справедливым становится утверждение о том, что полученный массив сообщений будет содержать некий набор альтернативных моделей ситуации. Правда, на этом этапе модели будут иметь вид, весьма отдаленный от того, что принято считать строгой моделью, но существует несколько способов их поэтапного приведения к той степени строгости, которая могла бы обеспечить возможность автоматизированного перехода к иным способам представления либо непосредственно к этапу экспертной оценки. Интенсивные исследования в этой области ведутся известным белорусским ученым В.В. Мартыновым, американцем Д. Ленатом (D. Lenat), П.Ю. Конотоповым и рядом других, чьи исследования сконцентрированы на несколько иных аспектах обработки текстов. К сожалению, в России это направление исследований пока представлено существенно меньшим числом исследователей, нежели за рубежом, а многие российские исследователи после сокращения финансирования науки были поставлены перед выбором: прекратить работу 120 или продолжить ее в зарубежных исследовательских центрах. В настоящее время многие отечественные ученые работают в университетских и государственных исследовательских центрах США, Великобритании и других западных стран, где руководство уже осознало возможные последствия информационного бума. Однако вернемся к обработке текстов. Мы уже отметили, что полученные вербальные модели могут быть приведены к некоторому представлению, являющемуся промежуточной стадией между формальной моделью и текстом. Следует отметить, что такое представление дает ряд преимуществ, поскольку модели на этом этапе еще доступны пониманию эксперта и способны активизировать его творческую активность, но уже близки по своим свойствам к строгим формальным моделям и могут обрабатываться с помощью средств вычислительной техники. |