Главная страница

Информационные технологии в психологии. Синергия.. IT в психологии. Литература по теме Тема Информационная безопасность и защита данных


Скачать 1.49 Mb.
НазваниеЛитература по теме Тема Информационная безопасность и защита данных
АнкорИнформационные технологии в психологии. Синергия
Дата05.11.2022
Размер1.49 Mb.
Формат файлаdocx
Имя файлаIT в психологии.docx
ТипЛитература
#771453
страница4 из 10
1   2   3   4   5   6   7   8   9   10
Тема 4. Виды компьютерных информационных технологий

 

Цели и задачи:

Цели и задачи изучения темы – получение представления об информационных технологиях обработки разных видов информации, об информационных технологиях поддержки принятия решений и добычи знаний.

 

В результате успешного изучения темы Вы:

Узнаете:

·     об особенностях обработки массивов данных;

·     об особенностях обработки графической и мультимедийной информации;

·     об информационных технологиях поддержки принятия решений;

·     о моделях и моделировании;

·     о технологиях Data mining и Text mining.

 

Приобретете следующие профессиональные компетенции:

·     знания об основных методах и способах хранения и переработки информации;

·     знания об основных методах и способах получения, хранения и обработке знаний.

 

В процессе освоения темы акцентируйте внимание на следующих ключевых понятиях:

База данных – это совокупность сведений о конкретных объектах реального мира, в какой-либо предметной области.

Система управления базами данных (СУБД) – это комплекс программных и языковых средств, необходимых для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации.

Модель данных – это совокупность взаимосвязанных структур данных и операций над этими структурами.

Сущность – это некоторый объект, идентифицируемый в рабочей среде пользователя, нечто такое, за чем пользователь хотел бы наблюдать.

Атрибуты сущности или, как их иногда называют, свойства, которые описывают характеристики сущности. Взаимоотношения сущностей выражаются связями.

Ключ – это атрибут или группа атрибутов, которые уникальным образом идентифицируют строку (запись).

Компьютерная графика – специальная область информатики, занимающаяся методами и средствами создания и обработки изображений с помощью программно-аппаратных вычислительных комплексов.

Растровое изображение – способ представления изображения в виде совокупности отдельных точек (пикселов) различных цветов или оттенков.

Пиксел – неделимая точка в графическом изображении.

Разрешение – мера четкости деталей растрового изображения, имеющая размерность пиксел на дюйм (ppi).

Векторное изображение представляет собой базу данных описаний примитивов (точка, прямая, ломаная, дуга, полигон) и наложенных на них эффектов.

Трехмерная графика представляет собой сочетание растровой и векторной компьютерной графики с алгоритмами для быстрой перерисовки основного графического профиля и внешнего вида.

Фрактал – объект, в котором один и тот же мотив повторяется в последовательно уменьшающемся масштабе.

Дискретизация – превращение непрерывного спектра звукового сигнала в дискретный (оцифровка).

Видеоплеер – программа, предназначенная для воспроизведения видео на компьютере.

 

Вопросы темы:

1.  Информационная технология баз данных.

2.  Информационные технологии обработки графической и мультимедийной информации.

3.  Информационные технологии поддержки принятия решений.

 

Теоретический материал по теме

Вопрос 1. Информационная технология баз данных.

 

Любая профессиональная деятельность в информационном обществе связана с компьютерными технологиями. В теме 5 вы подробно изучите технологии обработки текстовой и численной информации инструментарием MS Office. А пока вы познакомитесь с обработкой других видов информации и знаний.

В настоящее время жизнь человека настолько насыщена различного рода информацией, что для ее обработки требуется создание огромного количества хранилищ информации различного назначения. Современные информационные системы характеризуются огромными объемами хранимых данных, сложной организацией, необходимостью удовлетворять разнообразные требования многочисленных пользователей. Целью любой информационной системы является обработка данных об объектах реального мира.

В широком смысле слова база данных – это совокупность сведений о конкретных объектах реального мира, в какой-либо предметной области.

Система управления базами данных (СУБД) – это комплекс программных и языковых средств, необходимых для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации.

Классификация СУБД имеет много критериев:

а)       по сфере применения: универсальные и специализированные;

б)       по мощности: настольные (MS AccessCorel Paradox, Borland dBase, Microsoft FoxPro), и корпоративные (Oracle, Informix, Sybase, MS SQL server);

в)       по степени распределённости: локальные СУБД (все части локальной СУБД размещаются на одном компьютере) и распределённые СУБД (части СУБД могут размещаться на двух и более компьютерах);

г)        по способу доступа к БД: файл-серверные (файлы данных располагаются централизованно на файл-сервере, а СУБД располагается на каждом клиентском компьютере) и клиент-серверные (СУБД располагается на сервере вместе с БД и осуществляет доступ к БД непосредственно, в монопольном режиме, а все клиентские запросы на обработку данных обрабатываются клиент-серверной СУБД централизованно).

Модель данных – это совокупность взаимосвязанных структур данных и операций над этими структурами. Например, модель «сущность-связь» содержит следующие элементы:

·     сущности;

·     атрибуты;

·     идентификаторы;

·     связи.

 

Сущность – это некоторый объект, идентифицируемый в рабочей среде пользователя, нечто такое, за чем пользователь хотел бы наблюдать. Например, ПРЕДМЕТ, РАСПИСАНИЕ и т.п. Если взять несколько однотипных сущностей, получится класс сущностей. Таким образом, класс сущностей ПРЕДМЕТ будет содержать все сущности ПРЕДМЕТ. Важно понимать разницу между классом сущности и экземпляром сущности. Класс сущностей представляет собой совокупность сущностей, описываемая структурой или форматом сущностей, составляющих класс. Экземпляр сущности – это конкретная сущность, описываемая значениями атрибутов данной сущности. Примером класса сущностей ПРЕДМЕТ может быть следующая структура:
ПРЕДМЕТЫ.

Название.

Группа.

Количество часов.

Экземпляр класса сущностей ПРЕДМЕТЫ будет иметь вид:

ПРЕДМЕТЫ.

Английский язык.

ДБН-101.

64.

 

У сущностей есть атрибуты или, как их иногда называют, свойства, которые описывают характеристики сущности. Примерами атрибутов могут быть Фамилия, Имя, Отчество студента. В исходном определении модели «сущность связь» имелись композитные атрибуты и многозначные атрибуты Примером композитного атрибута может быть адрес, состоящий из города, улицы, дома. Примером многозначного атрибута может быть атрибут Увлечения студента. Возможно существование композитных многозначных атрибутов. Например, телефон, которых может быть несколько и каждый из которых может состоять из кода города и т.п. В большинстве реализаций модели «сущность-связь» однозначные композитные атрибуты игнорируются, а также требуется, чтобы многозначные атрибуты (будь они составные или нет) преобразовывались в сущности.

Идентификатор – атрибут, с помощью которого можно определить сущность. Как правило, это атрибуты, гарантированно отличающиеся для каждого экземпляра сущности. Идентификаторы могут состоять из нескольких атрибутов сущности. Идентификаторы, состоящие из нескольких атрибутов, называются композитными идентификаторами.

Взаимоотношения сущностей выражаются связями. Модель «сущность-связь» включает в себя классы связей и экземпляры связей. Классы связей – взаимоотношения между классами сущностей, а экземпляры связи –взаимоотношения между экземплярами сущностей. У связей могут быть атрибуты. Класс связей может затрагивать несколько классов сущностей. Количество классов сущностей, участвующих в связи, называется степенью связи. Наибольшее распространение получили связи класса 2, называемые так же бинарными связями. На Рис. 7 показана схема данных, прямоугольники представляют таблицы, а линии – связи таблиц.

 



 

Рис. 7. Связи таблиц на схеме данных

 

Ключ – это атрибут или группа атрибутов, которые уникальным образом идентифицируют строку.

Пользователь может добавлять и редактировать содержимое таблиц БД с помощью экранных форм, создавать запросы (правила обработки данных), формировать отчеты. Отчеты дают возможность распечатать данные на бумаге или сгруппировать их в виде, удобном для анализа.

 

Вопрос 2. Информационные технологии обработки графической и мультимедийной информации.

 

Специальную область информатики, занимающуюся методами и средствами создания и обработки изображений с помощью программно-аппаратных вычислительных комплексов, называют компьютерной графикой.

Компьютерную графику можно классифицировать по нескольким критериям:

1.  в зависимости от способа формирования изображений:

а)       растровая;

б)       векторная;

в)       фрактальная;

 

2.  в зависимости от координат измерения:

а)       плоская, двухмерная;

б)       трехмерная (или 3D-графика);

 

3.  в зависимости от специализации в отдельных областях:

а)       инженерная графика;

б)       научная графика;

в)       Web-графика;

г)        компьютерная полиграфия и т.д.

 

В результате развития современных информационных технологий и посредством объединения компьютерных, телевизионных и кинотехнологий сформировалась относительно новая область компьютерной графики – интерактивная (анимационная) графика.

 

Особенности растровой графики.

Растровое изображение – способ представления изображения в виде совокупности отдельных точек (пикселов) различных цветов или оттенков. Это наиболее простой способ представления изображения, потому, что именно таким образом видит его наш глаз.

Пиксел – неделимая точка в графическом изображении. Пиксел характеризуется прямоугольной формой и размерами, определяющими пространственное разрешение изображения.

Разрешение. Размеры в пикселах изменяют общее число пикселов по ширине и длине изображения. Разрешение является мерой четкости деталей растрового изображения и исчисляется в пикселах на дюйм (ppi). Чем больше пикселов на дюйм, тем выше разрешение. В целом изображение с более высоким разрешением позволяет получить более высокое качество при печати.

Однако разрешение изображения не должно превышать возможности принтера. Разрешение принтера отличается от разрешения изображения, но связано с ним. Чтобы напечатать высококачественную фотографию на струйном принтере, необходимо, чтобы разрешение изображения было не менее 220 ppi. Сервис-центры для печати фото обычно требуют разрешение 300 ppi. Схемы и штриховые рисунки требуют еще более высокого разрешения.

Достоинством растрового способа представления изображений является возможность получения фотореалистичного изображения высокого качества в различном цветовом диапазоне.

Недостаткомявляется ресурсоемкость: чем выше качество, тем больше объем файла для хранения изображения и оперативной памяти для его обработки.

Наиболее распространенные форматы растровых файлов:

а)       универсальные (TIFF, GIF, BMP, JPEG, PNG, RAW);

б)       связанные с редактором (PSD, CRD).

 

Для уменьшения размера файла применяют сжатие. Для лучшего сжатия пренебрегают небольшими потерями качества. Формат GIF позволяет уменьшать количество цветов, а форматы JPEG, PNG частично усреднять цвета близко расположенных пикселей.

 

Особенности векторной графики.

Для векторной графики характерно разбиение изображения на ряд графических примитивов – точка, прямая, ломаная, дуга, полигон. Таким образом, появляется возможность хранить не все точки изображения, а координаты узлов примитивов и их свойства (цвет, связь с другими узлами и т.д.).

При использовании векторного представления изображение представляет собой базу данных описаний примитивов. То есть, в составе изображения могут быть отрезки, окружности, овалы, точки, кривые Безье и так далее. А изображение будет представлять из себя массив описаний – нечто типа: отрезок (20,20-100,80); окружность (50,40-30); кривая Безье (20,20-50,30-100,50).

При редактировании векторной графики вы изменяете параметры прямых и изогнутых линий, описывающих форму этих элементов. Вы можете переносить элементы, менять их размер, форму и цвет, но это не отразится на качестве их визуального представления. Векторная графика не зависит от разрешения, т.е. может быть показана в разнообразных выходных устройствах с различным разрешением без потери качества.

Достоинством векторной компьютерной графики является:

а)       Она экономна в плане объемов дискового пространства, необходимого для хранения изображений: это связано с тем, что сохраняется не само изображение, а только некоторые основные данные, используя которые программа всякий раз воссоздает изображение заново. Кроме того, описание цветовых характеристик несильно увеличивает размер файла.

б)       Объекты векторной графики просто трансформируются и ими легко манипулировать, что не оказывает практически никакого влияния на качество изображения.

в)       Векторная графика максимально использует возможности разрешающей способности любого выводного устройства: изображение всегда будет настолько качественным, насколько способно данное устройство.

Недостатком векторной компьютерной графики является:

1.  Программная зависимость: каждая программа сохраняет данные в своем собственном формате, поэтому изображение, созданное в одном векторном редакторе, как правило, не конвертируется в формат другой программы без погрешностей.

2.  Сложность векторного принципа описания изображения не позволяет автоматизировать ввод графической информации и сконструировать устройство подобное сканеру для растровой графики.

3.  Векторная графика действительно ограничена в чисто живописных средствах и не предназначена для создания фотореалистических изображений.
На рис. 8 показан рисунок, выполненный в векторном редакторе.



 

Рис. 8. Векторное изображение, созданное в редакторе CorelDraw

 

Форматы векторных изображений:

1.  Чаще всего векторные изображения сохраняются в собственном формате векторного редактора (ai, cdr, fla).

2.  SVG, работает со шрифтами, векторной и растровой графикой и анимацией. Применяется в веб-дизайне.

3.  WMF, EMF – универсальный векторный формат Windows.

4.  EPS – используется для обмена данными в полиграфии.

 

Особенности трехмерной графики.

Трехмерная графика представляет собой сочетание растровой и векторной компьютерной графики с алгоритмами для быстрой перерисовки основного графического профиля и внешнего вида, позволяющими оперативно изменять перспективу и точку наблюдения, – процесс, названный трехмерной визуализацией. Любое изображение на стандартном мониторе, в силу его плоскости, становится растровым, так как монитор – это матрица, он состоит из столбцов и строк. Если не рассматривать 3D-монитор, то трёхмерная графика существует лишь в нашем воображении: то, что мы видим на мониторе — это проекция трёхмерной фигуры на 2D-экран, а уже создаём пространство мы сами.

Применение 3-мерной графики:

1.  Медицина: компьютерная диагностика, протезирование.

2.  Наука: моделирование молекул, взаимодействий.

3.  Техника: системы автоматизированного проектирование, моделирование краш-тестов, презентации.

4.  Реклама.

5.  Кино-, теле-индустрия: создание спецэффектов, фантастических персонажей, пространства сцены.

6.  Архитектурное моделирование: виртуальная археология.

7.  Компьютерные игры, виртуальная реальность.

8.  Бытовое: создание объектов, напечатанных на 3-мерном принтере.

 

3-мерная сцена включает в себя целый набор элементов

Элементы 3d-графики

1)       Геометрия:

·     Примитивы.

·     Полигональные сетки.

 

2)       Связи (обратная кинематика, кости).

3)       Частицы:

·     Физические характеристики (упругость, масса, действующие силы).

·     Природные явления (туман, снег, дождь).

·     Анимация.

·     Материалы.

·     Шероховатость.

·     Прозрачность

·     Отражение.

·     Источники света.

 

После построения 3-мерной модели и (при необходимости) добавления анимации готовый проект надо визуализировать (процесс рендеринга), т.е. создать 2-мерное изображение или фильм. Только в этом случае можно увидеть фотореалистичную сцену.

На рис. 9 показаны этапы создания 3-мерного персонажа.

 



 

Рис. 9. Этапы создания 3d-модели

 

Особенности фрактальной графики.

 



 



 

Рис. 10. Примеры фракталов

 

Фрактал — объект, в котором один и тот же мотив повторяется в последовательно уменьшающемся масштабе (Рис. 10). Поскольку более детальное описание элементов меньшего масштаба происходит по простому алгоритму, описать такой объект можно всего лишь несколькими математическими уравнениями. На основе уравнения последовательно генерируются все новые и новые элементы фрактала.

Фракталы позволяют описывать многие классы изображений с использованием относительно малой памяти. С другой стороны, фракталы слабо применимы к изображениям вне этих классов.

Фрактальная графика применяется в:

·     компьютерных играх;

·     компьютерной графике (облака, горы);

·     математике для аппроксимирования сложных поверхностей (молний, деревьев);

·     акустике, физике, механике;

·     механике для моделирования разрушения кластерных материалов.

 

Особенности технологий обработки аудиоинформации.

Технологии обработки аудиоинформации состоят из:

Оцифровка à Преобразование à Сжатие à Воспроизводство.

 

Основные характеристики звука:

·     Амплитуда, громкость, динамический диапазон.

·     Частота, частотный диапазон.

·     Фаза.

 

При этом в цифровом представлении звук также обладает следующими характеристиками, связанными с его качеством: частота дискретизации, битрейд.

Все виды обработки звука можно разделить на несколько категорий:

·     Амплитудные преобразования.

·     Частотные преобразования.

·     Временные преобразования.

·     Другие преобразования (смешанные, фазовые, панорамы, частоты дискретизации, битрейда и.т.д.)

 

Рассмотрим более подробно каждую из разновидностей обработки звука. В дискретном виде звук отображается с помощью кривых, которые в свою очередь несут информацию о громкости звука (амплитуде колебаний кривой) и частоте звука (период колебания волны). Под динамической обработкой звука понимается как простое увеличение громкости композиции, так и сужение и расширение динамического диапазона, при котором определённые звуки понижают свою громкость, а другие, наоборот, становятся более громкими.

Обработка звука это также моделирование процессов, происходящих с волнами в реальном, акустическом мире.

·     Эхо, реверберация.

·     Обработка частот.

·     Удаление шумов.

 

В записях почти всегда есть шум. Для его подавления используются специальный инструменты. Выделяется часть аудио файла, где нет ничего кроме шума, сохраняется образ (распределение шума по частотам и уровень шума). После чего выделяется весь аудиофайл, импортируется шумовой образ и файл очищается от шума.

Старайтесь использовать только качественные записи или полностью подавляйте шум, иначе шумы вылезут пи сужении динамического диапазона. Невозможно добиться качественного звучания композиции, созданной из некачественных материалов, с помощью плохих инструментов, без наличия опыта у автора.

Форматы аудиофайлов.

Форматы связаны с определенным способом записи звука, а оболочки могут содержать дополнительную информацию.

Чаще всего используются:

.wav – чаще используется как оболочка несжатого сигнала, при котором на каждый отсчет амплитуды выделяется определенное количество бит.

FLAC – свободный кодек обеспечивающий сжатие без потерь. При использовании этого кодека не происходит удаления «лишней» информации, поэтому он подходит для воспроизведения музыки на аппаратуре высокого качества. Формат имеет поддержку большинства аудио приложений.

.mp3 – на данный момент один из самых популярных форматов сжатия с потерями. Формат предназначен для значительного уменьшения объема данных, который необходим для прослушивания записи и сохранения качества звука максимально близкого к исходному.

 

Особенности обработки видео.

Компьютерная обработка видео – процесс редактирования файлов видео на компьютере, с помощью специальных программ – видеоредакторов. Весь процесс компьютерной обработки видео включает в себя четыре последовательных и взаимосвязанных действия: захват видео, монтаж, финальное сжатие.

Захват видео.

Для того чтобы конечное изображение получилось максимально возможного качества, необходимо делать захват видео, при котором осуществляется оцифровка каждого фрагмента данного видео, что даст возможность покадрово редактировать весь видеоролик и придать готовой работе дополнительные элементы.

Монтаж.

Видеомонтаж может осуществляться двумя способами: используя линейный либо нелинейный видеомонтаж:

Линейный монтаж происходит чаще в реальном времени. Видео из нескольких источников (проигрывателей, камер т. д.) поступает через коммутатор на приёмник (эфирный транслятор, записывающее устройство). В этом случае переключением источников сигнала занимается режиссёр линейного монтажа. О линейном монтаже также говорят в случае процесса урезания сцен в видеоматериале без нарушения их последовательности.

При нелинейном монтаже видео разделяется на фрагменты (предварительно видео может быть преобразовано в цифровую форму), после чего фрагменты записываются в нужной последовательности, в нужном формате на выбранный видеоноситель. При этом фрагменты могут быть урезаны, то есть не весь исходный материал попадает в целевую последовательность; подчас сокращения бывают очень масштабными.

Сжатие.

На последней стадии компьютерной обработки видео происходит сжатие с необходимой плотностью отредактированного видео.

Кодеки – специальные программы для кодирования потока/сигнала (часто для передачи, хранения или шифрования), и раскодирования — для просмотра или изменения в формате, более подходящем для этих операций. Кодеки часто используются при цифровой обработке видео и звука. Большинство кодеков для звуковых и визуальных данных используют сжатие с потерями, чтобы получать приемлемый размер готового (сжатого) файла.

Воспроизведение.

Видеоплеер – программа, предназначенная для воспроизведения видео на компьютере. В ее задачу входит, в частности, распаковка сжатого видео.

Форматы видеофайлов:

Чаще всего используются:

.avi разработан Microsoft для хранения и воспроизведения видеороликов, представляет собой контейнер, в котором может быть использован любой кодек. Может содержать в себе потоки четыре типов - Video, Audio, MIDI, Text.

.fla - формат файлов, используемый для передачи видео через Интернет. Используется такими сервисами, как YouTube, Google Video, RuTube, Tube.BY.

.mov - формат Apple Quicktime, может содержать любой кодек.

.mp4 (MPEG4) – фильм или видео клип, сжатый в MPEG-4 стандарт, обычно используется для обмена и передачи видео-файлов в Интернете, видеотелефонах, мультимедийной электронной почте, электронных информационных изданиях и т.п. В этом формате используется раздельное сжатие для аудио и видео дорожекПроигрыватель Windows Media не поддерживает воспроизведение таких файлов. Для воспроизведения файлов MP4 с помощью проигрывателя Windows Media необходимо установить декодер MPEG-4, совместимый с DirectShow.

 

Вопрос 3. Информационные технологии поддержки принятия решений.

 

Системы поддержки принятия решений – это автоматизированные информационные системы для помощи лицам, принимающим решения, сделать оптимальный выбор.

К первому классу относятся системы, в которых на основе готовых моделей решаются задачи оптимизации или прогнозирования. Лицо, принимающее решение (ЛПР), используя результаты расчетов, выбирает вариант решения.

Ко второму классу относятся OLAP-системы, с помощью которых ЛПР может визуализировать различные группы данных и выдвигать гипотетические модели связи параметров.

К третьему классу относятся системы интеллектуального анализа данных, в результате которых создаются новые, неизвестные пользователю модели. К ним относятся технологии Data Mining, Text Mining, задачи распознавания образов, экспертные системы.

Экспертные системы.

Содержат базу знаний, сформированную на основе знаний эксперта. Например, набор правил. ЛПР вносит в экспертную систему сведения о параметрах исследуемой системы (результаты опросов общественного мнения, политическую и экономическую обстановку) и получает рекомендуемое решение (проведение тех или иных реформ).

Задачи, решаемые технологией Data Mining, также основаны на анализе данных об окружающей среде, но имеют другое применение:

1.  Классификация на основе обучающей выборки позволяет построить модель принадлежности к тому или иному классу. Это метод обучения с «учителем»: в выборке указано заранее, к какому классу относится тот или иной набор признаков. После обучения система сама сможет определить, к какому классу относится новый объект. Например, выделить косвенные признаки сдерживаемой агрессии (мимические, физиологические, динамические).

2.  Кластеризация не требует обучения с готовыми классами. Этот метод дает представление о существовании нескольких обособленных групп (кластеров). Например, групп населения, страдающих определенным набором болезней. Дальнейший анализ, возможно, свяжет эти группы с территорией, национальностью или образом жизни. Методы кластеризации могут, дают разные результаты при использовании разных алгоритмов.

3.  Поиск ассоциативных правил широко применяется маркетологами для предсказания последовательности покупок клиента. Однако он может найти применение для анализа связей различных факторов. Например, оказывается, что люди, достигшие больших успехов в профессиональной области, в школьные годы много времени уделяли занятиям спортом.

4.  Прогнозирование основано на статистической обработке данных и позволяет предсказывать численные значения фактов (демография, экономика и пр.) в будущем.

 

Технология глубинного анализа текста – Text Mining – позволяет анализировать большие объемы текстовой информации в поисках тенденций, шаблонов и взаимосвязей, способных помочь в принятии стратегических решений. Кроме того, Text Mining – это новый вид поиска, который в отличие традиционных подходов не только находит списки документов, формально релевантных запросам, но и помогает понять смысл, разобраться с проблематикой.

Задачи, решаемые технологией Text Mining:

1.  Классификация текста, в которой используются статистические корреляции для построения правил размещения документов в предопределенные категории. Например, автоматическая рубрикация текстов – отнесение текста к той или иной известной рубрике.

Метод используют для группировки документов в intranet-сетях и на Web-сайтах, размещения документов в определенные папки, сортировки сообщений электронной почты, избирательного распространения новостей подписчикам.

 

2.  Кластеризация текста – выделение компактных подгрупп объектов с близкими свойствами. Система должна самостоятельно найти признаки и разделить объекты по подгруппам.

Метод используют при реферировании больших документальных массивов, определение взаимосвязанных групп документов, упрощения процесса просмотра при поиске необходимой информации, нахождения уникальных документов из коллекции, выявления дубликатов или очень близких по содержанию документов.

 

3.  Нахождение исключений, то есть поиск объектов, которые своими характеристиками сильно выделяются из общей массы. Для этого сначала выясняются средние параметры объектов, а потом исследуются те объекты, параметры которых наиболее сильно отличаются от средних значений.

Как известно, поиск исключений широко применяется, например, в работе спецслужб. Подобный анализ часто проводится после классификации, для того чтобы выяснить, насколько последняя была точна.

 

4.  Поиск связанных признаков (полей, понятий) отдельных документов. От предсказания эта задача отличается тем, что заранее не известно, по каким именно признакам реализуется взаимосвязь; цель именно в том и состоит, чтобы найти связи признаков. Эта задача сходня с кластеризацией, но не по множеству документов, а по множеству присущих им признаков. Например, путем анализа текста были выявления изменения стиля письма, которые могут возникать при попытке исказить или скрыть информацию. Тем самым анализировалась клиентская почта компании.

 

Вопросы для самопроверки:

1.  Что такое база данных?

2.  Как различаются разные виды компьютерной графики?

3.  В чем состоят основные задачи обработки мультимедийной информации?

4.  Как компьютерные технологии могут помочь специалисту в принятии решений?

5.  Для чего создаются модели?

6.  Какие задачи позволяют решить технологии Data mining?

7.  Какие знания можно получить, анализируя тексты?

 

Литература по теме:

 

Основная литература:

1.  Алехина Г.В., Борзунова Т.Л., Козлов М.В. и др. Компьютерная геометрия и графика –. – CD. Гл.1.

2.  Богдановская И.М., Зайченко Т.П., Проект Ю. Л. Информационные технологии в педагогике и психологии. Стандарт третьего поколения. – СПб.: Питер, 2015. – С. 68–81, 233–253.

 

Дополнительная литература:

1.  Т. В. Алексеева, Ю. В. Амириди, В. В. Дик. Информационные аналитические системы. – М. Синергия, 2013. Тема 6.

 

Интернет-ресурсы:

1.  Data Mining / Интересные публикации / Хабрахабр // http://habrahabr.ru/hub/data_mining/.

2.  Top software for text analysis text mining text analytics // http://www.predictiveanalyticstoday.com/top-30-software-for-text-analysis-text-mining-text-analytics/.

 

1   2   3   4   5   6   7   8   9   10


написать администратору сайта