Аналитическая разведка в бизнесе. И. Ю. Нежданов Аналитическая разведка для бизнеса Издательство "Ось89"
Скачать 1.66 Mb.
|
Выявление дополнительных данных (по возможности) Когда вы получили какое-то сообщение, обычно возникают дополнительные вопросы, связанные с содержанием сообще- ния. Например, упоминание неизвестного объекта, события, 132 свойств или еще чего-то. В таких случаях необходимо (по воз- можности, конечно) задать дополнительные вопросы и как-то прокомментировать поступившие сведения. Этот комментарий становится дополнительным атрибутом информации, но исход- ный текст сообщения должен остаться неизменным. Такой ком- ментарий имеет два направления: — выяснение дополнительной информации у источника ин- формации; — получение дополнительной информации иными способа- ми. Хранение данных Каким должно быть хранилище информации Зачем нужно накапливать и хранить информацию? Для чего надо тратить силы и время на создание хранилища и поддержа- ния его в исправном состоянии? Сумев четко ответить на эти вопросы, вы сможете определиться с целями при создании хра- нилища информации. Итак, у нас есть два основных типа работ: постоянные и разовые. К постоянным относим то, что нужно делать ежедневно, — это, например, наблюдение за рынком и его составляющими. К разовым относим те, которые возника- ют «вдруг» и по окончании не требуют внимания. Если изучать постоянные, то получается, что время от времени возникает си- туация, когда нужно вернуться немного назад и уточнить неко- торые детали. Детали, которые тогда были не важны, а сейчас перешли в разряд первостепенных, детали, которые позволят взглянуть иначе на имеющийся материал, детали, упущенные ранее, и т.д. Эти самые детали можно почерпнуть только в хра- нилище данных. А поскольку, работая над проблемой, вы не мо- жете предполагать, что вам понадобится впоследствии, важно сохранить информацию в первозданном виде — в том виде, в ка- ком она к вам поступила. Ситуация с разовыми мероприятиями несет в себе еще один важный элемент. Он заключается в том, что, закончив работу по одному проекту, вы не можете и предпо- лагать, с чем эта информация может скоррелировать в будущем, 133 где еще могут пригодиться собранные вами сведения. Именно неопределенность будущего и заставляет скрупулезно накапли- вать собранную информацию. Исходя из этого и нужно подхо- дить к разработке и созданию базы данных. Каким требованиям должна отвечать создаваемая база? По- пробуем их сформулировать. К пользовательским требованиям можно отнести: — легкий и быстрый доступ к искомому материалу; — возможность хранения в базе огромных объемов информа- ции; — возможность хранения в одной записи значительного объ- ема информации с возможностью полноценного поиска. В качестве общих требований нужно упомянуть: — простота управления базой, в т.ч. копирования и архивиро- вания данных; — надежность хранилища; — максимально возможное сжатие материала. Требования по своей сути простые и понятные. Но в сочета- нии с особенностями планируемого к хранению материала они становятся достаточно жесткими. Возьмем, к примеру, «воз- можность хранения в одной записи значительного объема ин- формации с возможностью полноценного поиска». В общем- то нормальное требование, но вспомним, что мы собираемся хранить в этой базе. Это в основном текст. А его размеры мо- гут колебаться от нескольких предложений до нескольких то- мов. Соответственно и размеры одной записи будут колебать- ся от нескольких килобайт до десятков (а иногда и сотен) ме- габайт. При таком разбросе нельзя, чтобы база резервирова- ла огромный объем всякий раз при создании пустой записи. В противном случае такая база очень быстро станет занимать огромное дисковое пространство. Поэтому размер записи дол- жен быть переменный и зависеть от объема внесенной в эту за- пись информации. Простая файловая система Самый простой способ хранения текстовых данных на ПК — это обычная файловая система. Один файл — один информаци- 134 онный блок. При этом нельзя все файлы сваливать в одну ди- ректорию, дав им названия «Инфо-1», «Инфо-2», «Инфо-3» и т.д. При таком подходе очень скоро вы не сможете ориентиро- ваться в своем хранилище. А само хранилище превратится ско- рее в кладбище информации. Для недопущения такой ситуации необходимо придержи- ваться нескольких простых правил: — во-первых, присваивайте файлам осмысленные имена - название объекта интереса, благо современные системы поддер- живают длинные имена файлов. Структура же самого имени должна быть следующей: первая часть имени — название объ- екта интереса, а вторая — характеристика содержания файла. Например, «РАО ЕЭС СМИ 2005» или «Бендукидзе Состав ФПГ». — во-вторых, каждому проекту должна соответствовать своя директория (папка) с названием, соответствующим объекту ин- тереса. При большом количестве материала, в каждой такой папке-проекте можно создать подпапки: «СМИ», «Новости», «Отчетность», «Аналитика»; — если объект попадает в несколько проектов, то основной файл должен храниться в папке одного проекта, а во всех ос- тальных местах присутствия создается ярлык этого файла. При соблюдении этих правил вы сможете ориентироваться в своем хранилище и пусть не мгновенно, но все же достаточно быстро находить нужную информацию. Такой способ хране- ния подходит для незначительных объемов данных и вполне приемлем на начальном этапе работ, но в дальнейшем вам все равно придется перейти на иной способ организации храни- лища. Можно несколько развить данный способ хранения ин- формации. Например, создав виртуальные папки под каждый проект и поместив в них ярлыки соответствующих файлов или папок. То есть для каждого нового объекта создается своя пап- ка с соответствующим названием, а объединение объектов в проект происходит посредством виртуальных папок и ярлы- ков. А в операционной системе VI 51а предусмотрены свои (внутрисистемные) виртуальные папки. Правда, их заполне- ние происходит в основном по ключевым словам, но тем не 135 менее это достаточно удобно. Особенно если взять за правило в каждом документе указывать ключевые слова, в том числе и неявные. Файловая система с программной надстройкой Рано или поздно, несмотря на все усилия, файловый способ хранения данных не сможет обеспечить оперативность и точ- ность ориентирования в массиве данных. Функции поиска не- обходимо передавать от человека компьютеру. Можно развивать уже сложившуюся файловую систему хранения данных, допол- нив ее некой программной надстройкой. Такая программная надстройка должна выполнять следующие функции: — присвоение неких (заранее вами определенных) хранимым атрибутов файлам; — виртуальная группировка файлов по принятым блокам (проектам, папкам, группам и т.п.); — визуальное представление этой виртуальной файловой системы; — поиск по атрибутам файлов; — поиск по содержимому файлов, в т.ч. с поддержкой логи- ческих операторов. Такая надстройка значительно облегчит работу с информа- цией. Во-первых упростится поиск нужной информации — не нужно будет вспоминать, где оно может быть, а просто ввести искомый термин. Во-вторых, не нужно будет отвлекаться на со- здание и поддержание файловой структуры — это сделает сама программа. Но и такой способ хранения информации имеет свои ограничения, хотя и наиболее удачные программные ре- шения в данной области позволяют перерабатывать огромные объемы информации. База данных А можно пойти по пути создания полноценной базы данных (БД). Этот путь сложнее, но и эффективность такого хранили- ща будет выше. Например, цифровую информацию можно бу- дет легко обрабатывать средствами СУБД. Можно использовать 136 статистические функции СУБД. Для такой БД нужно значи- тельно меньше дискового пространства в силу специфического формата хранения данных и исключения дублирования данных, а значит, и поиск будет вестись быстрее, особенно при опериро- вании миллионами объектов. В настоящее время это наиболее прогрессивный метод хранения данных. Вопрос в том, какова должна быть структура такой базы данных. Именно от структу- ры будет зависеть ее эффективность. Наиболее простая и функ- циональная структура БД состоит из следующих таблиц: — «Информация», — «Организация», — «Лицо», — «Адрес», — «Телефон», — «Проект». В таблицу «Информация» попадают все информационные блоки, которые признаны вами интересными или полезными. Здесь будет храниться вся исходная информация. По-хорошему, сюда же должны попадать сведения о событиях значимых и не очень, о ваших работах и результаты этих работ (отчеты, справ- ки, письма и т.п.). В дальнейшем этот блок имеет все шансы пе- рерасти в вашу базу опыта. Не забывайте присваивать каждой информации все необходимые атрибуты. Фактически нужно создать поля с этими самыми атрибутами. Какие атрибуты вы задействуете, будет зависеть от поставленных задач. Наиболее востребованными являются следующие атрибуты: — дата ввода информации; — дата публикации; — автор; — источник; — канал поступления; — название. И никогда не меняйте однажды введенную информацию - лучше уж ввести дополнительную с необходимыми изменения- ми и соответствующим комментарием. В таблице «Организация» будут храниться структурирован- ные данные об организациях. Под эту категорию подпадают юридические лица, неформальные объединения (в т.ч. и ОПГ) — 137 в общем, все, что относится к организациям в широком смысле этого слова. А структура данной таблицы полностью зависит от решаемых вами задач. В таблице «Лицо» должна храниться структурированная ин- формация о людях. Структура также зависит от ваших задач. Таблица «Проект» необходима для того, чтобы вы не поте- рялись в вашей информации, когда число записей будет исчис- ляться тысячами и более, и всегда могли понять, в связи с чем изучался тот или иной объект. Отдельного пояснения требуют таблицы «Адрес» и «Телефон». Поскольку и та и другая сущность может принадлежать несколь- ким объектам, для исключения дублирования информации и, как следствия, путаницы необходимо исключить двойной ввод данных. А принципиально исключить такую ситуацию можно ведением персонального реестра или, иначе говоря, выделени- ем этих сущностей в отдельные таблицы. Дополнительно нужно сказать о связях внутри базы данных. Они создаются программными средствами в зависимости от особенностей используемой СУБД. Есть два принципиальных способа создания связей в БД: — создание между двумя таблицами одной-единственной связи с комментарием и внесение этого комментария в зависи- мости от ситуации; — создание между двумя таблицами всех возможных вариан- тов связей и активирование необходимых в зависимости от си- туации. У каждого подхода есть свои плюсы и минусы, поэтому отда- вать предпочтение какому-то из них необходимо исходя из кон- кретных условий. Изложение без искажений или вычерпывание смысла Достаточно важным в работе с текстами является умение пе- редавать смысл сообщения без искажений, понимать, что напи- сал автор и что он хотел сказать. Если у вас есть возможность пе- редать точную копию текста — отлично, так и нужно поступить. 138 Но чаще бывает так, что нужно сжать содержимое нескольких страниц в несколько фраз или запомнить их содержимое, а ведь далеко не все обладают столь феноменальной памятью. В этом случае на помощь приходит методика понимания со- держимого. Это не что иное, как выявление из текста неоспо- римых фактов; выдвижение гипотез, которые могут подтверж- даться наличием опор в тексте; предположения по поводу не- возможного, также имеющего опоры в тексте. Упрощая смысл сказанного, видим, что получатель инфор- мации должен сжать текст, обосновывая свое мнение (гипотезу) только посредством имеющихся в тексте сигналов (опор) или попросту не выходить в своих суждениях за границы, очерчен- ные текстом, — не интерпретировать. Например, вы услышали часть разговора — всего одну репли- ку. Что можно сказать, опираясь на эту реплику? — По голосу — пол говорившего, — возможно, его возраст и настроение, — возможно, чем вызван разговор, — и с большой долей вероятности, о чем шла речь... Главное, чтобы все ваши выводы были обоснованы, т.е. име- ли опору в услышанном. Нельзя, ни на чем не основываясь, за- явить, например, что говоривший не местный: если вы это ут- верждаете, значит, отметили особенность выговора (акцент), если особенность акцента не замечена — никаких гипотез и тем более выводов. То же самое и с текстами. С той лишь разницей, что в тек- стах нужно использовать иные сигналы — сигналы лингвисти- ческие. Для упрощения понимания нужно немного отвлечься. Рассматривайте изучаемый текст не как произведение чьего-то творчества, а как простой набор символов. При таком подходе к сигналам можно отнести: — значение отдельных слов; — особенности соединения слов (словосочетаний и словооб- разований); — порядок расстановки слов; — знаки препинания. Любые другие сигналы — это проявление личности читающе- го, а никак не исследуемый текст. 139 Варианты сигналов: 1) значения отдельных слов: — собственно значение слова (например в соответствии со словарем Ожегова); — вид слова (штамп, несуществующее слово, книжное, экзо- тическое); — лексическая принадлежность (профсленг, научный лекси- кон, уличный сленг); 2) соединение слов: — ранее используемое образование (цитата); — нормальное сочетание слов или необычное; — рифмованное или нет; 3) порядок слов: — правильный синтаксис (порядок слов) - как в учебнике; — неправильный (здесь важно понять эту особенность — не- правильность); 4) знаки препинания: — наличие пауз; — обращение внимания на слово, словосочетание или фразу; — незаконченность. Важно вначале увидеть этот сигнал, а затем его понять. Помните — любое сообщение состоит из следующих элемен- тов: автор, создавший сообщение, предмет, о котором сообще- ние, лицо, которому адресовано сообщение, текст сообщения и вы — тот, кто анализирует сообщение. И только проработка всех этих элементов позволит качественно изучить получен- ные данные. Что может вам помешать при использовании информации Что может повлиять на ваше восприятие информации Информация, поступающая к аналитику, подвергается воз- действию, которое изменяет ее полностью или частично. Это может быть случайное воздействие или целенаправленное, оно 140 может изменить информацию полностью или частично, но та- кое воздействие есть всегда. Воздействовать на информацию может канал передачи, ретрансляторы, сам получатель и т.п. Последствия такого воздействия имеют широкий спектр от при- нятия в общем то правильного, но недостаточно оптимального решения, до катастрофы. Можно выделить следующие типы информационного воз- действия на аналитика: 1) искажение описания (частичное или полное); 2) неточный (частично или полностью) перевод; 3) идеализация объекта описания (анализа), чаще чрез- мерная; 4) подмена понятий; 5) ошибки при установлении объекта интереса; 6) несогласованность каналов восприятия — неспособность воспринять информацию (недостаток опыта, образования, пси- хологические барьеры, давление авторитетного мнения, стерео- типы и т.п.); 7) отсутствие информации как таковой; 8) недоступность информации (частичная или полная); 9) старение информации; 10) ошибки при математической обработке; 11) дезинформация; 12) недоиспользование по каким-то причинам информа- ции; 13) режимные ограничения на доступ к информации. Возможны несколько вариантов влияния на потребителя (объект воздействия) изменений информации: — Изменение не доступно потребителю информации; — Изменение прямо воздействует на потребителя; — Изменение скрытно воздействует на потребителя. Ситуация, когда изменение недоступно потребителю инфор- мации, возникает, если: — сам источник с измененной информацией недоступен по- требителю (языковой барьер, режимные ограничения, неизвес- тность источника, неизвестный носитель и т.п.); — источник доступен, но изменение выявлено и отброше- но, или изменение не воспринято потребителем в силу каких то 141 причин или информация не представляет ценности для потре- бителя. В случае прямого воздействия измененной информации на потребителя возможно: — измененная информация принята как достоверная (нане- сен ущерб, возможный ущерб не допущен, заложены возмож- ности нанесения ущерба и т.п.); — измененная информация выявлена (информация отброше- на, информация используется для игры, информация использу- ется для идентификации «исказителя» и его целей). При скрытом воздействии искаженной информации проис- ходит неявное воздействие на принятие решения (авторитетное мнение, часто используемый штамп и т.п.). Работая с информацией, необходимо также помнить то, что разного рода искажения, направленные в том числе и не на вас, циркулируют в каналах обмена информацией, на- капливаются в базах данных, претерпевают изменения как внешние, так и внутренние, эти искажения повторяют (дуб- лируют), они множатся. Поэтому очень важно правильно их идентифицировать и отсекать. Такое искажение, будучи даже выявленным и удаленным, все равно где-то (в какой-то базе, на каком-то носителе) останется и в один прекрасный день вновь увидит свет. Искажение, созданное для воздействия на вас, будет воздействовать и на тех, кто получил эту искажен- ную информацию. Теперь необходимо глубже обсудить варианты воздействия на аналитика искаженной информации. Искажение описания (полное или частичное) Такие искажения могут быть преднамеренными и непред- намеренными, могут определяться аморальными целями или «благими намерениями», могут быть полными или частичными. Самое простое искажение - это частичное умолчание, т.е. не- упоминание отдельных деталей или чего-то целиком. Причины такого рода умолчаний могут быть разные: — желание показать объект описания в выгодном свете; — нежелание получить взыскание; |