Базы данных, хранилища данных ответы на тест. Как характеризуются системы анализа с точки зрения качества данных
Скачать 32.19 Kb.
|
Как характеризуются системы анализа с точки зрения качества данных? - Не допускаются ошибки в данных Как характеризуются системы анализа с точки зрения избыточности данных? - Допускается контролируемая денормализация Что необходимо для принятия эффективного решения? - Набор целей, Система мер, Своевременное поступление информации Какой характер вычислительной загрузки имеет место в системах анализа? - Максимальная загрузка процессора при выполнении запроса На каком уровне руководства компанией используются максимально обобщенные KPI показатели? - Руководители верхнего звена Какие утверждения являются корректными для анализа, определяемого данными? - Известен вопрос, но неизвестно, где искать ответ; Полученная информация определяет дальнейшее направление поиска Для выявления в данных скрытых закономерностей используется интеллектуальный анализ данных. Как характеризуются системы анализа с точки зрения избыточности данных? - Допускается контролируемая денормализация Какие утверждения являются корректными для анализа, определяемого структурой? - Имеется набор конкретных вопросов, на которые надо найти ответы; Известно то, что надо искать и где искать Последовательность значений одного из анализируемых параметров образует измерение Какие достоинства есть у ROLAP? - Гибкость при добавлении новых измерений; Экономичное использование ресурсов Какие из перечисленных операций можно выполнять с гиперкубом? – Срез; Вращение (Консолидация;Детализация) Основное назначение технологии OLAP состоит в поддержке произвольных запросов Как связаны друг с другом факты и меры? - Одному факту может соответствовать много мер С помощью иерархии задается направление выполнения операций детализации и консолидации В каком году Эдгар Кодд сформулировал основные концепции OLAP? – 1993 Какие типы мер используются в OLAP? – Свычисляемые; СХранимые Некоторые измерения могут иметь несколько иерархий – Верно Последовательность значений одного из анализируемых параметров образует измерение Укажите предложение, которое корректно описывает категорию фактов в виде транзакционной таблицы фактов. - Факты, которые фиксируют определенные события Когда целесообразно применять архитектуру ХД с оперативным складом данных? - Когда надо обеспечить быстрый доступ к информации, которая еще не полностью проверена Какая идея лежит в основе концепции разделения данных? - разделение данных для анализа и оперативной разработки Какие недостатки у ХД на основе независимых витрин данных? - Сложно получить информацию из нескольких витрин одновременно; Информация в витринах не согласована Какими достоинствами обладает виртуальное ХД? - Сокращение расходов на внедрение и обслуживание; Работа с самыми свежими данными Какое количество информационных потоков разных видов может присутствовать в ХД? – шесть Какая основная проблема присутствует в ХД с накоплением данных в витринах? - Информация в разных витринах не согласована между собой В чем основное отличие централизованных ХД с ELT перед централизованными ХД с ETL? - В ELT сначала выполняется загрузка данных в ХД, затем выполняется их преобразование Укажите свойства, которыми должно обладать ХД. - Предметная ориентация; Интеграция данных;Неизменчивость данных; Поддержка хронологии Сколько уровней имеет рекомендованная архитектура корпоративного ХД? – 6 Назовите основное преимущество централизованных ХД с ETL перед виртуальными ХД и независимыми витринами - Наличие единого репозитория данных С какой целью выполняется агрегирование данных? - для более быстрого выполнения запросов на этапе анализа данных В какие таблицы данные загружаются первыми в процессе загрузки в ХД? - в таблицы измерений Назовите технологию, которую рекомендуется использовать для определения изменившихся данных, если источником данных является СУБД Oracle - Oracle Streams Процесс загрузки заключается в переносе данных из промежуточных таблиц в структуры ХД. Укажите причины, по которым приходится выполнять преобразование структуры данных в процессе ETL? - Структура извлеченных из источников данных отличается от структуры ХД; Данные из разных источников имеют разную структуру, их надо привести к единому формату После того, как выполнена загрузка в таблицы измерений можно выполнять загрузку в таблицы фактов. В какое место таблицы фактов загружается новая информация? - В конец таблицы Область временного хранения, в которую помещаются данные после извлечения из систем-источников, называется staging area (англ. термин) Какой вариант преобразования данных является наиболее предпочтительным? - преобразование в промежуточной области перед загрузкой в ХД Какой метод определения изменившихся данных можно использовать в случае отсутствия доступа к БД источника данных? - сравнение файлов При композитном секционировании должна использоваться комбинация двух разных методов распределения данных. – Неверно Что такое ключ секционирования? - Столбец таблицы, относительно значений которого выполняется разбиение таблицы на секции При использовании хеш-секционирования строки таблицы, имеющие разные значения, равномерно распределяются по секциям. – Верно Что есть у каждой секции таблицы - собственное имя; собственные характеристики хранения Как выполняется проектирование БД для OLAP-системы? - На основе денормализации На чем основана стратегия секционирования Range Partitioning? - На последовательном диапазоне значений С точки зрения администратора БД секционированный объект выглядит как единое целое. - Неверно С точки зрения пользователя БД секционированный объект выглядит как единое целое. - верно Структура BITMAP индекса содержит одну общую битовую карту для всех возможных значений столбца. – Неверно Для достижения оптимальной производительности OLTP и OLAP систем используются одинаковые приемы проектирования. – Неверно Для каких столбцов рекомендуется использовать индексы на основе битовых карт? - для столбцов с низкой кардинальностью Что есть у каждой секции таблицы? - собственное имя; собственные характеристики хранения Наличие нескольких операций группировки (ROLLUP, CUBE, GROUPING SETS) во фразе GROUP BY называется каскадной группировкой. Какие ранги присваивает функция DENSE_RANK для строк, имеющих одинаковые ранги? – одинаковые Предложение OVER используется в SQL-операторах для определения временного окна. Для каких групп будут подсчитаны подитоги при использовании оператора SELECT … GROUP BY ROLLUP(a,b,c)? - (a,b,c), (a,b), (a), () В каких SQL-операторах могут применяться аналитические функции? - SELECT В чем заключается отличие функций для создания отчетов от оконных функций SQL? - Функции для создания отчетов не могут указывать локальные окна Ранжирующие функции SQL позволяют определить эффективность некоторой бизнес-сущности по сравнению с такими же, как она объектами. - Верно Какой фразой в SQL-операторе задается неограниченное временное окно? - over(rows between unbounded preceding and unbounded following) Групповые операции CUBE(a,b) и CUBE(b,a) возвращают одинаковый результат. – Верно Групповые операции ROLLUP (a,b) и ROLLUP (b,a) возвращают одинаковый результат. – Неверно Какое утверждение корректно по отношению к групповой операции ROLLUP? - ROLLUP создает промежуточные подитоги, двигаясь по данным от низкого уровня к высокому Сколько уровней имеет репозиторий Oracle BI? – 3 В Oracle BI за представление данных конечному пользователю отвечает презентационный уровень. В качестве источника данных Tableau может использовать облачные сервисы. – Верно Tableau имеет собственный ETL-обработчик для очистки и загрузки данных. – Неверно Опция СУБД Oracle Partitioning предоставляет возможность секционирования таблиц и индексов. Oracle BI – это виртуальное хранилище данных. Опция Oracle Advanced Analytics позволяет выполнять скрипты на языке R и алгоритмы Data Mining непосредственно в БД Oracle. – Верно Какие режимы взаимодействия с данными может использовать Tableau? - Extract, Live Укажите программные продукты Oracle, которые можно использовать для реализации процесса ETL. - Golden Gate; Data Integrator;Warehouse Builder Какой программно-аппаратный комплекс компании Oracle предназначен для решения задач бизнес-аналитики? - Oracle Exalytics Укажите основные тенденции, которые наблюдаются на рынке BI в последние годы? - Self-service BI; Мобильный BI; Open Source BI; Облачный BI На какие вопросы позволяет ответить прогнозная аналитика? - Что произойдет? Укажите сильные стороны традиционных BI-систем. – Сложная метамодель ; Интеграция данных из разных источников Самообслуживание; Интуитивный интерфейс; Быстрая аналитика; Разработчики программного обеспечения могут использовать BI-системы с открытым кодом, добавляя их функционал в свои приложения. – Верно Self-Service BI – это системы, которые позволяют аналитику самостоятельно найти ответ на интересующий вопрос, без обращения в техническую поддержку. – Верно По каким причинам сдерживается внедрение систем бизнес-аналитики (BI)? - Слабое понимание преимуществ BI; Неуверенность в соответствии бизнес-задачам; Плохое качество данных В чем состоит основное преимущество облачных BI перед традиционными BIсистемами? - Возможность использования готовых интеллектуальных наработок; Более высокая скорость развертывания Какой программный продукт относится к категории Self-Service BI? - Oracle Data Visualization Рынок BI является одним из самых быстрорастущих сегментов IT-рынка в мире. - Верно Какие риски надо учитывать при внедрении Open Source BI? - Риск поддержки такой системы в дальнейшем со стороны ее производителя Для каких компаний использование облачного BI является предпочтительным вариантом? - Для компаний, у которых в облаке уже размещены другие приложения; Для средних компаний, которые ранее не инвестировали в аналитику Какой вариант подключения к данным является предпочтительным для Tableau при подключении к большим ХД? – Live Могут ли пользователи Tableau применять интеллектуальный анализ данных? - Могут, за счет интеграции Tableau с языком R Каждое измерение может быть представлено в виде иерархической структуры. С какой целью выполняется интеграция данных в ХД? - Чтобы привести данные из разных источников к единому формату ХД Укажите универсальные методы, которые можно использовать для выявления изменившихся данных в любой БД/ - сравнение файлов; установка временной отметки; триггеры Какую инструкцию во фразе OVER() должны содержать функции для создания отчетов, чтобы разбить результирующее множество на несколько частей? - partition by Некоторые измерения могут иметь несколько иерархий.- Верно В каком случае рекомендуется использовать ХД с интеграционной шиной? - Если компоненты ХД разнесены территориально и находятся за межсетевыми экранами Какие действия выполняются при загрузке данных в таблицы измерений ХД? - добавление новых записей, изменение существующих В Oracle BI за соединение с источниками данных отвечает физический уровень Для каких групп будут подсчитаны подитоги при использовании оператора SELECT … GROUP BY a ROLLUP((b,c), d)? - (a,b,c,d), (a,b,c), (a) Какие варианты программного обеспечения предоставляет компания Oracle для реализации MOLAP-серверов? - Oracle Essbase; СУБД Oracle Database с опцией OLAP В чем состоит основное преимущество облачных BI перед традиционными BIсистемами? - Более высокая скорость развертывания, Возможность использования готовых интеллектуальных наработок Для чего нужны иерархии? - Для определения уровней, на которых будет выполняться группировка данных, Для задания пути для операций консолидации и детализации Какие утверждения корректны для секционирования по диапазону? - Распределение непрерывно, без каких-либо промежутков, Значение границ секций всегда увеличивается, Для определения диапазона указывается верхняя граница секции Какие утверждения справедливы для BITMAP индексов? - Используется в основном в ХД и OLAP, Занимает мало места в БД, Трудно обновляется Какие из нижеперечисленных подсистем входят в СППР? - Подсистема хранения данных, Подсистема ввода данных, Подсистема анализа данных В процессе ETL выполняется очистка – процедура корректировки данных, которые в каком-либо смысле не удовлетворяют определенным критериям качества. Один запрос не может содержать несколько групповых операций ROLLUP, CUBE, GROUPPING SETS или их комбинацию. – Неверно Укажите сильные стороны Self-Service BI. - Интуитивный интерфейс, Возможность использования своих файлов Безопасность данных, Быстрая аналитика, Быстрая аналитика В качестве альтернативы правилам Кодда для определения соответствия требованиям OLAP на практике используют тест FASMI В какой момент выполнения SQL-оператора происходит вычисление аналитических функций? - После выполнении FROM, WHERE GROUP BY HAVING Какие операции выполняются в процессе преобразования данных в рамках ETL? - преобразование структуры данных, агрегирование данных, перевод значений, создание новых данных, очистка данных Какие компоненты включает в себя опция Oracle Advanced Analytics? - Oracle Data Mining и Oracle R Enterprise Укажите классы фактов, которые корректно описывают взаимосвязь измерений и фактов - Аддитивные, Полуаддитивные, Неаддитивные В каких системах рекомендуется применять BITMAP индексы? в OLAP системах Какую функцию выполняет в Oracle В! уровень бизнес-модели и отображения данных? - отображение физических источников на многомерный куб Укажите основные недостатки Tableau. - Сложно оптимизировать производительность, Требует предварительной обработки данных С какой целью выполняют разделение данных в ХД и в оперативных источниках данных? - Для оптимизации структур данных, используемых для анализа Какие имеются достоинства у ХД на основе независимых витрин данных? - Легкость и простота организации независимых ВД, Отсутствует потребность в сложных процедурах ETL Какими недостатками обладает виртуальное ХД? - Более низкая скорость выполнения запросов, Высокая нагрузка на оперативные источники данных, Зависимость от доступности оперативных источников данных Укажите проблемы, возникающие при использовании OLTP-систем для зада бизнес-аналитики - Сильная нормализация БД, Снижение производительности OLTP-системы, Недостаточное количество исторических данных, Хранение данных в разных информационных системах По каким критериям можно разбить рынок BI на разные сегменты? По решаемым задачам (отчеты, анализ, data mining);По квалификации пользователей;По уровню применения (аналитик, отдел, компания) Какие риски надо учитывать при внедрении Open Source Bl? Риск поддержки такой системы в дальнейшем со стороны ее производителя Какой тип СУБД используется для реализации ROLAP? - Реляционная В чем состоит основное преимущество облачных BI перед традиционными Bl-системами? - Возможность использования готовых интеллектуальных наработок ;Более высокая скорость развертывания Укажите способы вычисления агрегатов - среднее, количество, максимум, медиана Какую функцию выполняет в Oracle BI уровень бизнес-модели и отображения данных? - отображение физических источников на многомерный куб Какие из следующих предложений являются правилами Кодда для описания технологии OLAP? - Многомерность, Равноправие измерений. Интуитивная манипуляция данными На чем основана стратегия секционирования List Partitioning? - На неупорядоченных списках значений Какой фразой в SQL-операторе задается временное окно для нарастающего итога? - oversows between unbounded preceding and current row) Какие ранжирующие функции можно испопьзовать в Oracle SQL? - RANK, DENSE RANK, ROW NUMBER Какой инструмент ПО Oracle Bl позволяет выполнять произвольные запросы и создавать информационные панели? - Oracle Bl Answers Что обозначает аббревиатура ETL? - извлечение, преобразование, загрузка Для чего используется репозиторий Oracle BI? - Для отображения источников данных на многомерный куб Какие преимущества предоставляет секционирование? - можно выполнять операции на уровне отдельных секций, параллельная обработка данных Какие утверждения корректны для иерархии с пропуском уровней? - Допускается пропуск уровней в некоторых ветвях; Все конечные элементы расположены на одном уровне Что является ребрами многомерного гиперкуба? – Измерения Создание новых данных на основе существующих выполняется для вычисления показателей,вычисляемых по сложным формулам - Верно Какие проблемы возникают при использовании ХД с интеграционной шиной? : Сильно возрастает нагрузка на системы-источники данных, Регламент сбора информации рассеян по приложениям. Данные в ХД будут несогласованы между собой Укажите классы фактов, которые корректно описывают взаимосвязь измерений и фактов. - Аддитивные. Полуаддитивные, Неаддитивные Когда происходит добавление данных в систему анализа? – Периодически Какое количество полных просмотров таблицы будет сделано при использовании в SQL-запросегрупповой операции CUBE(a,b,c)? - один С какой цепью выполняется перевод значений в процессе ETL? - для декодирования данных Из-за каких причин Bl-системы отсутствуют на некоторых предприятиях? - Высокая цена Bl-систем, Плохая структурированность БД, Консервативность руководства В чем состоит основное преимущество облачных BI перед традиционными В1-системами? - Более высокая скорость развертывания, Возможность использования готовых интеллектуальных наработок Какие утверждения корректны по отношению к групповой операции GROUPING SETS? - Генерирует суммарную информацию только необходимого уровня. Порядок столбцов не важен Какой из программных продуктов компании Microsoft относится к категории облачных BI? - MS Power BI Sevice По каким причинам может произойти отклонение записей в процессе загрузки? - Некорректный порядок загрузки, Внутренние проблемы ХД. Прерывание процесса загрузки Какие варианты программного обеспечения предоставляет компания Oracle для реализации MOLAP-серверов? - СУБД Oracle Database с опцией OLAP. Oracle Essbase С какой целью выпопняют разделение данных в ХД и в оперативных источниках данных? - Для оптимизации структур данных, испопьзуемых для анализа |