Билеты на экзамен по информатике (ХТФ, ПНИПУ). инфа билеты. 1. Определение информатики как науки. Данный термин получил распространение в 80х г г. Хх века. Производное от латинских inform информация
Скачать 1.51 Mb.
|
1. Определение «информатики» как науки. Данный термин получил распространение в 80-х г.г. ХХ века. Производное от латинских inform – «информация» и matic – «наука о …». Таким образом, информатика – это наука об информации. В англоязычных странах используется понятие computer science – наука о компьютерах. Информатика является наукой молодой и быстро развивающейся. Информатика – это наука, изучающая методы реализации информационных процессов (сбор, хранение, обработка и передача данных) средствами вычислительной техники (СВТ); состав, структуру, и общие принципы функционирования СВТ; принципы управления СВТ. Информатика является прикладной и практической наукой, т.к. занимается не только изучением данных вопросов, но и поиском путей их решения:
Информация (от лат. informatio – сведения, разъяснение, изложение): – это набор символов, графических данных, звуковых данных – это сведения, которые кого-либо интересуют и которые получает или передает человек. Все окружающие нас физические объекты являются либо телами, либо полями. Физические объекты, взаимодействуя друг с другом, порождают сигналы, которые могут иметь различные характеристики. В свою очередь сигналы могут порождать в физических телах изменения свойств. Данное явление называется «регистрацией сигнала». Сигналы, зарегистрированные на материальном носителе, называются данными. Данные несут информацию о событии, но не являются самой информацией. Чтобы получить информацию, имея данные, необходимо применить методы, которые преобразуют данные в понятия, воспринимаемые человеческим сознанием. Следовательно, «информация» – продукт взаимодействия данных и адекватных методов. Общая характеристика процессов сбора, передачи, обработки и накопления информации 1. Сбор информации – это процесс получения информации из внешнего мира и приведение ее к стандарту для данной информационной системы. 2. Передача информации – целенаправленный процесс, в результате которого информация передается от одного объекта к другому. 3. Обработка информации – внесение изменений в набор данных, вычисления, информационный поиск, сортировка, построение графиков и т.д. 4. Накопление информации - это процесс формирования исходного, несистематизированного массива информации. Информация обладает свойствами: 1. Объективность Информация объективна, если не зависит от чьего-либо мнения или суждения. Объективную информацию можно получить с помощью датчиков, измерений, приборов. Отражаясь в человеческом сознании, информация может искажаться в зависимости от мнения, суждения, опыта конкретного объекта и таким образом перестать быть объективной. 2. Достоверность Информация достоверна, если отражает истинное положение дел. Объективная информация всегда достоверна, но достоверная информация может быть как объективной, так и субъективной. Достоверная информация помогает принять правильное решение. Причины недостоверности: 1) преднамеренное искажение, дезинформация субъективного свойства; 2) искажение в результате помех и недостаточно точных средств ее фиксации. 3.Полнота Полнота информации характеризует качество информации и определяет достаточность данных для принятия решений или для создания новых данных на основе имеющихся. Чем полнее данные, тем проще подобрать метод, вносящий минимум погрешностей в ход информационного процесса. 4. Точность Определяется степенью близости ее к реальному состоянию объекта, процесса, явления. 5. Актуальность Степень соответствия информации текущему моменту времени. 6. Полезность/ценность Зависит от потребностей конкретных людей и от тех задач, которые можно решить с помощью полученной информации 7. Рост информации Информации с течением времени во всем мире растет, накапливается, систематизируется, оценивается и обобщается. 8. Старение информации Уменьшение ценности с течением времени. Старит не время, а получение новой информации. 2. Данные. Операции с данными. Данные - сигналы, зарегистрированные на материальном носителе. Чтобы получить информацию, имея данные, крайне важно применить методы, которые преобразуют данные в понятия, воспринимаемые человеческим сознанием. Информация — это продукт взаимодействия данных и адекватных методов. Момент слияния данных и методов – информационный процесс. В ходе информационного процесса данные преобразуются из одного вида в другой с помощью методов. Операции с данными: -сбор данных - накопление информации с целью обеспечения достаточной полноты для принятия решений. Соединяясь с адекватными методами, данные рождают информацию, способную помочь в принятии решения. -формализация данных - приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, т.е. повысить их уровень доступности -фильтрация данных - отсеивание «лишних» данных, в которых нет необходимости для принятия решений; при этом должен уменьшится уровень «шума», а достоверность и адекватность данных должны возрастать -сортировка данных - упорядочение данных по заданному признаку с целью удобства использования; повышает доступность информации -архивация данных - организация хранения данных в удобной и легкодоступной форме; служит для снижения экономических затрат по хранению данных и повышает общую надежность информационного процесса в целом -защита данных - комплекс мер, направленных на предотвращение утраты, воспроизведения и модификации данных -транспортировка данных - прием и передача (доставка и поставка) данных м/у удаленными участниками инф. процесса; при этом источник данных - сервер, потребитель - клиент -преобразование данных - перевод данных из одной формы в другую или из одной структуры в другую одной структуры в другую. Преобразование данных часто связано с изменением типа носителя: например, книги хранить в бумажной форме, но можно использовать для этого и электронную форму. Необходимость в преобразовании данных возникает при их транспортировке. Например, для транспортировки цифровых потоков данных по каналам телефонных сетей необходимо преобразование цифровых данных в некое подобие звуковых сигналов, чем и занимаются специальные устройства — телефонные модемы. Основные структуры: линейные, табличные, иерархические. -линейные списки - простейшая упорядоченная структура данных, отличающаяся тем, что каждый элемент определяется своим номером в массиве. -табличные - это упорядоченные структуры, в которых адрес элемента определяется номером строки и номером столбца, на пересечении которых находится ячейка, содержащая искомый элемент. Табличные структуры отличаются от списочных тем, что элементы данных определяются адресом ячейки, который состоит не из одного параметра, как в списках, а из нескольких. Существуют двумерные и многомерные таблицы. Многомерные - это упорядоченные структуры данных, в которых адрес элемента определяется тремя и более измерениями. Для отыскания нужного элемента в таких таблицах необходимо знать параметры всех измерений. -иерархические: Нерегулярные данные, которые трудно представить в виде списка или таблицы, часто представляют в виде иерархических структур. В иерархической структуре адрес каждого элемента определяется путем доступа (маршрутом), ведущим от вершины структуры к данному элементу. Мы очень хорошо знакомы по обыденной жизни. Иерархическую структуру имеет система почтовых адресов. Единицы представления данных: существует множество систем представления данных. Одна из них - двоичный код. Наименьшей единицей такого представления является бит (двоичный разряд). Совокупность двоичных разрядов, выражающих числовые или иные данные, образует некий битовый рисунок. С битовым представлением удобнее работать, если этот рисунок имеет регулярную форму. В настоящее время в качестве таких форм используются группы из восьми битов, которые называются байтами. Единицы измерения данных: Наименьшей единицей измерения является байт. Поскольку одним байтом кодируется один символ текстовой информации, то для текстовых документов размер в байтах соответствует лексическому объему в символах (исключение универсальная кодировка UNICODE). Более крупные единицы измерения — килобайт, мегабайт, гигабайт, терабайт 1 Кбайт = 1024 байт = 210 байт; 1 Мбайт = 1024 Кбайт = 220 байт; 1 Гбайт = 1024 Мбайт = 230 байт; 1 Тбайт = 1024 Гбайт = 240 байт Единицы хранения данных: При хранении данных решаются две проблемы: как сохранить данные в наиболее компактном виде и как обеспечить к ним удобный и быстрый доступ. В качестве единицы хранения данных принят объект переменной длины, называемый файлом. Файл — это последовательность произвольного числа байтов, обладающая уникальным собственным именем. Обычно в отдельном файле хранят данные, относящиеся к одному типу. В этом случае тип данных определяет тип файла. 3. Кодирование текстовых, числовых, графических данных. Кодирование данных – представление различных типов данных в виде, удобном для СВТ. Кодирование данных необходимо для того, чтобы можно было работать с различными типами данных (числовыми, текстовыми, графическими и др.) на компьютере. Для представления данных необходима универсальная система кодирования, способная представить числовые (10 знаков), текстовые (33 знака) и другие типы данных в едином виде. В информатике двоичное кодирование признано универсальной формой представления данных. Представление чисел в памяти компьютера. Представление чисел в памяти компьютера имеет специфическую особенность, связанную с тем, что в памяти компьютера они должны располагаться в байтах – минимальных по размеру адресуемых ячейках памяти. 1 байт памяти компьютера занимает целые числа от 0 до 255. Целые числа в двоичном коде можно представить следующим образом: 0-0000 0000; 1- 0000 0001; 2-0000 0010; 3-0000 0011; 255-1111 1111 Для представления действительных чисел требуется более 1 байта, бесконечные числа усекаются до определенного знака (становятся приблизительными). Для этого используют форму записи числа в виде: X = m · q𝑝, где m — мантисса числа, q – основание системы счисления, p — целое число, называемое порядком. Такой способ записи чисел называется представлением числа с плавающей точкой. 4235,25=423,525*101=42,3525*102=4,23525*103=0,423525*104 Действительные числа в компьютерах различных типов записываются по-разному. Существует несколько международных стандартов различных по точности, но имеющих одинаковую структуру. Первый вид двоичного представления используется для кодирования знака мантиссы (0 – «+», 1 – «-»), следующая группа кодирует порядок числа, а оставшаяся – абсолютные величины мантиссы. Длина порядка и мантиссы фиксируется. Вещественные числа в памяти компьютера в зависимости от требуемой точности (количество рядов мантиссы) и диапазона значений (количество рядов порядка) занимают от 4 до 10 байтов. Если вещественное число занимает 10 байт, то мантиссе отводится 65 разрядов, а порядку 14 разрядов. Это обеспечивает точность 19-20 десятичных знаков мантиссы и диапазон значений 10±4931. Представление символьных и текстовых данных: Применяют специальный метод кодирования, разработанный в США в 1981 г., называемый ASCII (американский стандартный код обмена информации) – международный код. Эта таблица рассчитана на объем информации 1 байт, позволяет закодировать 256 символов, состоит из 2 частей: основная (первые 127 символов, управляющие символы (код 1 – 31), арабские цифры, буквы латинского алфавита, знаки препинания, специальные символы); расширенная (128-255, применяется для национальных алфавитов, может изменяться). В 1991 г. производители программных продуктов и организации, утверждающие стандарты, пришли к соглашению о выборе единого стандарта, который построен по 16-битной системе кодирования UNICODE. Он позволяет закодировать 216 символов, и этого достаточно для кодирования основных национальных алфавитов во всем мире. Кодирование графической информации. При рассмотрении черно-белого графического изображения с помощью увеличительного стекла заметно, что в его состав входит несколько мельчайших точек, образующих характерный узор (или растр). Линейные координаты и индивидуальные свойства каждой из точек изображения можно выразить с помощью целых чисел, поэтому способ растрового кодирования базируется на использовании двоичного кода представления графических данных. Общеизвестным стандартом считается приведение черно-белых иллюстраций в форме комбинации точек с 256 градациями серого цвета, т. е. для кодирования яркости любой точки необходимы 8-разрядные двоичные числа. В основу кодирования цветных графических изображений положен принцип разложения произвольного цвета на основные составляющие, в качестве которых применяются три основных цвета: красный (Red), зеленый (Green) и синий (Blue). На практике принимается, что любой цвет, который воспринимает человеческий глаз, можно получить с помощью механической комбинации этих трех цветов. Такая система кодирования называется RGB (по первым буквам основных цветов). При применении 24 двоичных разрядов для кодирования цветной графики такой режим носит название полноцветного (True Color). Каждый из основных цветов сопоставляется с цветом, дополняющим основной цвет до белого. Для любого из основных цветов дополнительным будет являться цвет, который образован суммой пары остальных основных цветов. Соответственно среди дополнительных цветов можно выделить голубой (Cyan), пурпурный (Magenta) и желтый (Yellow). Принцип разложения произвольного цвета на составляющие компоненты используется не только для основных цветов, но и для дополнительных, т. е. любой цвет можно представить в виде суммы голубой, пурпурной и желтой составляющей. Этот метод кодирования цвета применяется в полиграфии, но там используется еще и четвертая краска – черная (Black), поэтому эта система кодирования обозначается четырьмя буквами – CMYK. Для представления цветной графики в этой системе применяется 32 двоичных разряда. Данный режим также носит название полноцветного. При уменьшении количества двоичных разрядов, применяемых для кодирования цвета каждой точки, сокращается объем данных, но заметно уменьшается диапазон кодируемых цветов. Кодирование цветной графики 16-разрядными двоичными числами носит название режима High Color. При кодировании графической цветной информации с применением 8 бит данных можно передать только 256 оттенков. Данный метод кодирования цвета называется индексным. 4. Типы структур данных. Линейные структуры — это списки. Список — это простейшая структура данных, отличающаяся тем, что каждый элемент данных однозначно определяется своим номером в массиве. Обычный журнал посещаемости занятий, например, имеет структуру списка, поскольку все студенты группы зарегистрированы в нем под своими уникальными номерами. При создании любой структуры данных надо решить два вопроса: как разделять элементы данных между собой и как разыскивать нужные элементы. В журнале посещаемости, например, это решается так: каждый новый элемент списка заносится с новой строки, то есть разделителем является конец строки. Тогда нужный элемент можно разыскать по номеру строки. Разделителем может быть и какой-нибудь специальный символ. Например, разделители между словами — это пробелы, а между предложениями – точки. В качестве разделителя можно использовать любой символ, который не встречается в самих данных. В этом случае для розыска элемента с номером n надо просмотреть список с начала и пересчитать встретившиеся разделители. Когда будет отсчитано n-1 разделителей начнется нужный элемент. Он закончится, когда будет встречен следующий разделитель. Еще проще, когда все элементы списка имеют одинаковую длину, тогда разделители не нужны. Для розыска элемента с номером n надо просмотреть список с начала и отсчитать a(n-1) символ, где а – длина элемента. Со следующего символа начинается нужный элемент. Такие упрощенные списки называют векторами данных. Таким образом, линейные структуры данных (списки) — это упорядоченные структуры, в которых адрес элемента однозначно определяется его номером. Табличные структуры: Табличные структуры отличаются от списочных тем, что элементы данных определяются адресом ячейки, который состоит не из одного параметра, как в списках, а из нескольких. Для таблицы умножения, например, адрес ячейки определяется номерами строки и столбца. Нужная ячейка находится на их пересечении, а элемент выбирается из ячейки. При хранении табличных данных количество разделителей должно быть больше, чем для данных, имеющих структуру списка. Если нужно сохранить таблицу в виде символьной строки, используют один символ-разделитель между элементами, принадлежащими одной строке, и другой разделитель для отделения строк, Для розыска элемента, имеющего адрес ячейки (m, n), надо просмотреть набор данных с самого начала и пересчитать внешние разделители. Когда будет отсчитан m-1 разделитель, надо пересчитывать внутренние разделители. После того как будет найден n-1 разделитель, начнется нужный элемент. Он закончится, когда будет встречен очередной разделитель. Еще проще можно действовать, если все элементы таблицы имеют равную длину. Такие таблицы называют матрицами. В данном случае разделители не нужны, т.к все элементы имеют равную длину и количество их известно. Для розыска элемента с адресом (m, n) в матрице, имеющей М строк и N столбцов, надо просмотреть ее с начала и отсчитать а [N(m - 1)+(n-1)] символ, где а — длина элемента. Со следующего символа начнется нужный элемент. Таким образом, табличные структуры данных — это упорядоченные структуры, в которых адрес элемента определяется номером строки и номером столбца, на пересечении которых находится ячейка, содержащая искомый элемент. Многомерные таблицы – упорядоченные структуры данных, в которых адрес элемента определяется 3-мя и более измерениями, необходимо знать параметры всех измерений. Иерархические структуры: Нерегулярные данные, которые трудно представить в виде списка или таблицы, часто представляют в виде иерархических структур.(система почтовых адресов). В иерархической структуре адрес каждого элемента определяется путем доступа (маршрутом), ведущим от вершины структуры к данному элементу. Дихотомия данных. Основным недостатком иерархических структур данных является увеличенный размер пути доступа. Очень часто бывает так, что длина маршрута оказывается больше, чем длина самих данных, к которым он ведет. Поэтому в информатике применяют методы для регуляризации иерархических структур с тем, чтобы сделать путь доступа компактным. Один из методов получил название дихотомии. В иерархической структуре, построенной методом дихотомии, путь доступа к любому элементу можно представить как путь через рациональный лабиринт с поворотами налево (0) или направо (1) и, таким образом, выразить путь доступа в виде компактной двоичной. |