Главная страница
Навигация по странице:

  • Тема: Информативно-целевой анализ содержания текстовых источников

  • Традиционный анализ документов.

  • Методы формализованного анализа документов.

  • Кр1. КР1. Контрольная работа 1 Студент гр. 990951 Щерба А. С. Карпович Е. Б. Минск 2020 Тема Информативноцелевой анализ содержания текстовых источников


    Скачать 135.68 Kb.
    НазваниеКонтрольная работа 1 Студент гр. 990951 Щерба А. С. Карпович Е. Б. Минск 2020 Тема Информативноцелевой анализ содержания текстовых источников
    Дата22.05.2021
    Размер135.68 Kb.
    Формат файлаpdf
    Имя файлаКР1.pdf
    ТипКонтрольная работа
    #208467

    Министерство образования Республики Беларусь
    Учреждение образования
    БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
    ИНФОРМАТИКИ И РАДИОЭЛЕКТРОНИКИ
    Факультет компьютерного проектирования
    Кафедра инженерной психологии и эргономики
    Дисциплина: Основы информационно-аналитической деятельности
    КОНТРОЛЬНАЯ РАБОТА №1
    Студент: гр.990951 Щерба А. С.
    Руководитель: Карпович Е. Б.
    Минск 2020

    Тема: Информативно-целевой анализ содержания текстовых
    источников
    Получение информации из вторичных источников осуществляется различными методами, которые получили название методов анализа документов.
    Совокупность методов анализа документов может быть разделена на две большие группы:
    • традиционный анализ
    • формализованный анализ
    Первая группа методов исходит из предположения о том, что эксперт, изучающий документ, в состоянии переработать информационные массивы документов и может определить содержание главной информации.
    Вторая группа методов исходит из положения о том, что интуиции и опыту эксперта доверять нельзя и необходимо в максимальной степени формализовать поиск и выявление информации.
    Разберём более подробно каждый из этих методов.
    Традиционный анализ документов.
    Традиционный анализ документа осуществляется высококвалифицированным экспертом, который дает свою интерпретацию изученному материалу. Этот метод основан на интуиции исследователя и поэтому подвержен опасности субъективных смещений в восприятии и интерпретации материалов. Кроме того, различные эксперты могут одну и ту же информацию, содержащуюся в тексте, по-разному интерпретировать и придавать ей различную степень значимости.
    В то же время никакой формализованный анализ не позволит получить информацию, содержащуюся «между строк». Это - прерогатива только традиционного анализа документов.
    Для максимальной объективности результатов традиционного анализа документов его стараются максимально формализовать. Для этого разработана строгая процедура проведения анализа документа.

    Выделяют два этапа исследования документа: внешний анализ и внутренний анализ документа.
    Следует отметить, что на практике маркетинговых исследований в подавляющем большинстве случаев маркетологи сразу же приступают к внутреннему анализу документа. Следует указать на ошибочность такого подхода.
    Внешний анализ необходим для того, чтобы изучить причину публикации документа, достоверность изложенного материала, квалификацию автора публикации, а, значит, обоснованность выводов и информации, содержащейся в документе. Именно эта часть традиционного анализа документов позволяет определить необходимость дальнейшего анализа документа, возможность использования материалов документа для целей поставленного маркетингового исследования.
    Внутренний анализ составляет главную часть исследования. Она тяжело формализуется и все же есть некоторые рекомендации, которых следует придерживаться.
    Во-первых, необходимо кратко и четко сформулировать цель анализа документа, то есть определить, что именно в нем интересует исследователя, и записать полученную формулировку перед началом анализа документа. При проведении анализа документа письменная формулировка цели должна находиться постоянно перед глазами исследователя, чтобы он всегда мог сверяться с критерием оценивания содержания документа.
    Во-вторых, перед изучением текста он помечается экспертом таким образом, чтобы с помощью символов идентификации текста исследователь легко мог найти любой отрезок текста. Чаще всего для этого используют нумерацию абзацев. При этом возможны два способа нумерации - сплошная нумерация и нумерация постраничная. Первый способ используют при анализе небольших текстов.
    В-третьих, при изучении документа необходимо выделять абзацы, в которых находится информация, имеющая отношение к сформулированной цели. Предполагается, что правильно скомпонованный текст расположен так, что каждый отдельный абзац содержит в себе законченную мысль, или самодостаточную информацию. Поэтому эксперт, после прочтения абзаца текста, выявив его содержательный смысл, принимает решение о том, соответствует ли его содержание цели исследования. Если возникают сомнения, то эксперт возвращается к сформулированной ранее в письменной форме цели исследования и
    проверяет сложившееся у него мнение о содержании абзаца с критерием отбора, заключающемся в сформулированной цели.
    В-четвёртых, после выделения абзацев, в которых находится информация, имеющая отношение к сформулированной цели, эксперт должен сформулировать их краткое содержание в терминах исследовательской цели. Эта формулировка осуществляется, очевидно, в письменной форме.
    При этом эксперт указывает номер абзаца.
    Краткое изложение сути информации, содержащейся в выделенном абзаце, позволяет сжать содержание информации до пределов, поддающихся более тщательному анализу.
    В-пятых, после изучения текста и записи краткой информации по выделенным абзацам этого текста, анализируется суть полученной в сжатой форме маркетинговой информации и готовится итоговый документ о результатах анализа документа.
    В результате такой формализации результатов анализа содержания документов их выводы становятся максимально объективными. К тому же легко могут быть подвергнуты повторной экспертизе, как сами документы, так и результаты экспертизы. Для этого можно по тексту отчёта задать некоторые контрольные точки, например, выделенные и пронумерованные абзацы документа и подвергнуть эти абзацы повторной экспертизе с помощью другого специалиста. Если результаты совпали, следует говорить о высокой объективности анализа документа. В другом случае документ отправляется на повторную экспертизу. Однако, несмотря на существенную формализацию текста, объективной экспертизы текста добиться всё же не удаётся. Это вызвано тем, что информация, содержащаяся в документе, изучается и оценивается экспертом, психология которого весьма индивидуальна. Поэтому восприятие текста и его содержания каждым экспертом различны, также как различны эмоции, которые вызывает текст. Существенное влияние на объективность результатов анализа оказывают такие субъективные и мало управляемые факторы, как самочувствие эксперта и его настроение. К тому же эксперт должен внимательно и полностью прочитывать текст, поэтому скорость обработки информации мала, а затраты на получение маркетинговой информации из текста весьма велики. В то же время, нельзя требовать от эксперта чтения текста «по диагонали», так как главное преимущество традиционного анализа документов является в способности эксперта выявить не только явно содержащуюся в тексте документа информацию, но и ту информацию, которая находится «между строк» документа.

    Методы формализованного анализа документов.
    Суть методов формализованного анализа сводится к тому, чтобы найти легко распознаваемые черты и свойства документа, которые отражают часть информации, относящуюся к цели исследования. Наиболее распространен среди методов формализованного анализа документов
    «контент-анализ».
    Сам термин «анализ содержания», как и первые попытки проведения статистически точных измерений содержания материалов массовой информации, ведут своё начало от исследований в области американской журналистики в конце XIX и начале XX века. Одна из первых работ в этой области была выполнена Дж. Спидом в 1893 году. Он проанализировал воскресные выпуски нью-йоркских газет за 1881–1883 гг. Сравнивая содержания материалов этих двух лет, он выяснил, какие изменения произошли в нью-йоркской прессе за это время. Дж. Спид классифицировал содержание материалов по темам (литература, политика, религия, сплетни, скандалы, бизнес и т. д.) и измерил длину газетных колонок, отводимую для освещения этих тем. Сравнив данные по годам, он пришел к ряду выводов. Так, газета «Нью-Йорк Таймс» стала публиковать гораздо больше материалов, содержащих пересказ различных скандальных историй, сплетен и слухов. Именно это послужило причиной того, что расширилась читательская аудитория газеты, увеличился ее тираж, и газета смогла на треть снизить цену за каждый номер (с трёх центов до двух центов), увеличив при этом её общий объём.
    Успех проведённого исследования положил начало бурному росту числа работ, посвящённых практике и теории контент-анализа. Уже к началу 30х годов ХХ века были сформулированы основные принципы теории контент-анализа. В Советском Союзе контент-анализ стал применяться на практике и развиваться лишь в конце 60х годов. В процедуре его проведения выделяют три важных элемента.
    Первый элемент процедуры - выработка категорий анализа. Под категориями анализа понимаются понятия, в соответствии с которыми будет осуществляться отбор и сортировка единиц анализа. Эти категории в свою очередь могут быть предметом анализа (разложения на составные части). К числу таких категорий может быть отнесён, например доход.
    Система категорий анализа должна строиться таким образом, чтобы дать возможность проводить сравнения между различными источниками, содержащими искомую информацию, то есть к категориям анализа предъявляется требование универсальной сравнимости, высокой стандартизации категорий, что и позволяет использовать статистические методы анализа документов.

    При формулировании категорий анализа следует следить за тем, чтобы они полностью описывали выявляемую в результате анализа и потребную информацию, а также не оставляли возможностей для нечеткой градации.
    Система категорий анализа должна давать максимум точности и сводить элемент субъективности к минимуму.
    Второй элемент процедуры - выделение единиц анализа. Вопрос о единице анализа является с методологической точки зрения исходным при построении методики любого конкретного исследования содержания.
    Каждая выделенная категория анализа разбивается по какому-либо критерию на неделимые единицы анализа. Именно эти единицы анализа и выявляются в процессе изучения документа. Здесь необходимо помнить о том, что они выступают в качестве своеобразных индикаторов счета, значит, они должны быть четко формализуемы и легко определяемы. Так, если в качестве категории анализа был выбран доход, то единицами анализа могут быть: низкие доходы, малые доходы, средние доходы, высокие доходы и сверхвысокие доходы.
    В тексте единица анализа может быть обозначена словом, словосочетанием, в наиболее сложном случае она может и не иметь терминологического выражения, ее наличие определяется по скрытому смыслу. Обычно к единицам анализа относят:
    - понятие, выраженное отдельным словом или словосочетанием,
    - тема, выраженная в отдельных суждениях, абзацах, кусках текста,
    - имена нарицательные или названия событий.
    Третий элемент процедуры выделение единиц счета. Единицами счета могут выступать число появлений единиц анализа, число строк с этими единицами, число абзацев, квадратных сантиметров площади, колонок в печатных текстах и т. п.
    После того, как выбраны все указанные элементы, можно осуществить анализ документа. В результате выделения и подсчёта элементов содержания создаётся модель содержания текста, которая может служить объектом анализа. Когда получены модели всех анализируемых текстов, их можно сопоставить друг с другом и проследить тенденции изменения или сохранения содержания текстов во времени, в различных источниках информации и т. п. Сравнительный анализ таких моделей позволяет выявить наиболее характерные тенденции движения информации.

    Иногда большую информативность несут другие способы переработки результатов анализа документа, например, весьма важным показателем может оказаться соотношение между объёмом интересующей маркетолога информации, содержащейся в тексте документа, и объёмом самого текста, некоторые другие статистические показатели.
    Общая структура контент-анализа может быть модифицирована несколькими различными способами. Американский социолог Р. Мертон выделяет шесть типов контент-анализа.
    Первый тип контент-анализа основан на элементарном выделении и исследовании единиц анализа, содержащихся в документе. Это, безусловно, весьма важная информация, которая характеризует, например, важность анализируемой информации для составителей анализируемого документа. Можно выделить и другие свойства документа (например, сравнительным анализом). Этот тип контент-анализа весьма прост в практическом применении в ходе проведения маркетинговых исследований, но его результаты далеки от полного всеобъемлющего знания об объекте анализа.
    Второй тип контент-анализа представляет собой усложненную модификацию первого типа. Его называют иногда «классификацией по отношению». Единицы анализа отражают не просто наличие искомой информации, но и отношение к ней - они классифицируются в благоприятном и неблагоприятном аспекте по отношению к объекту исследования.
    Третий тип анализа — это анализ по единицам анализа. При использовании этого типа анализа выделяются главные и второстепенные единицы анализа с позиций проводимого исследования. Единицы анализа можно классифицировать не просто на главные и второстепенные, но выстроить сложную систему иерархии важности единиц анализа для целей маркетингового исследования. Таким образом, модель документа оказывается более богатой по своим исследовательским свойствам.
    Когда возникает необходимость определить совокупное значение ряда частей анализируемого документа, то используется четвёртый тип контент-анализа - тематический анализ. Он в известной степени позволяет выявить явные и скрытые цели публикации документа, дать полное представление о содержании документа. Для этого совокупность категорий анализа расширяется таким образом, чтобы охватить всю совокупность тем, относящихся к данному предмету исследования. Каждая категория анализа полностью описывается единицами анализа. Полученная совокупность данных наиболее широко представляет содержание текста,
    причём легко проследить его тематическое содержание, изменение тем, их взаимосвязь и взаимообусловленность.
    Пятый тип контент-анализа - структурный анализ носит общий характер и его название связано не со способом получения информации, а с целью исследования. Так как его главной целью является анализ взаимоотношений различных тем и отношений в анализируемом тексте, то есть анализ структуры документа, он и получил соответствующее название.
    Шестой тип анализа связан с изучением совокупности документов, подготовленных одним источником или несколькими родственными источниками. Этот тип контент-анализа получил название анализа пропаганды, так как совокупность документов, посвящённых одной теме, преследует какую-либо цель, причём эта цель может быть полностью раскрыта только в случае содержательного анализа всей совокупности документов. При этом строится модель каждого документа, и выявляются общая направленность документов, система причинно-следственных связей между документами и темами документов, тенденции и способы представления информация в выявленном направлении.
    Высокая степень формализованной процедуры позволяет широко использовать для её проведения вычислительную технику. Это приводит к тому, что количество перерабатываемых с помощью контент-анализа документов и объёмы изучаемой вторичной информации на несколько порядков превышают количество документов и объёмы информации, изучаемые с помощью традиционного анализа документов. Маркетолог может использовать для этих целей специальное программное обеспечение, но может использовать и другие программные средства.
    К недостаткам формализованного анализа следует в первую очередь отнести то обстоятельство, что содержание документа может раскрываться выражениями, которые не вошли в число легко распознаваемых свойств.
    Например, написанный хорошим литературным стилем документ содержит значительное количество синонимов, часть из которых может быть упущена. Вторым принципиальным недостатком является то обстоятельство, что очень важные, но единичные сообщения об объекте исследования могут быть не охвачены в результате контент-анализа или просто проигнорированы в большом массиве информации. Устранить данный недостаток может применение традиционного анализа документа.


    написать администратору сайта