| ГлавнаяИзбранныеСлучайная статьяПознавательныеНовые добавленияОбратная связьFAQ
к экзамену НИР
Понятие «научное исследование»
Научное исследование — процесс изучения, эксперимента, концептуализации и проверки теории, связанный с получением научных знаний.
Цель науки – установление истины, а способом ее постижения является научное исследование. Научное исследование в отличие от стихийных форм познания окружающего мира основано на методологии (или системе принципов), методе (способе организации) и методике (технике исследования). Его осуществление предполагает ряд обязательных этапов (постановку цели исследования, выбор средств исследования, фиксацию и представление результата и т. д.).
Различают эмпирические и теоретические исследования. В основе теоретического исследования лежат некоторые теоретические обобщения, на основе которых формулируются новые теоретические выводы. Эмпирические исследования не имеют теоретической базы, позволяют лишь накопить первоначальные научные факты. Как правило, большинство исследований носит теоретико-эмпирический характер. При этом на основе известных в науке подхода, теории, принципов ведется накопление нового знания.
Исследования по их характеру подразделяют на фундаментальные и прикладные, монодисциплинарные и междисциплинарные, аналитические и комплексные. (Фундаментальное исследование направлено на познание реальности без учета практического эффекта от применения знаний. Прикладное исследование проводится в целях получения знания, которое должно быть использовано для решения конкретной практической задачи. Монодисциплинарные исследования проводятся в рамках отдельной науки, в данном случае – психологии. Междисциплинарные исследования требуют участия специалистов различных областей и проводятся на стыке нескольких научных дисциплин. К этой группе можно отнести клинические генетические исследования, исследования в области психофизиологии, нейропсихологии и др.
Научное исследование как деятельность, направленная на всестороннее изучение объекта, процесса или явления.
Формой существования и развития науки является научное исследование. Научная (научно-исследовательская) деятельность – это деятельность, направленная на получение и применение новых знаний. Научное исследование – это деятельность, направленная на всестороннее изучение объекта, процесса или явления, их структуры и связей, а также получение и внедрение в практику полезных для человека результатов. Его объектом являются материальная или идеальная системы, а предметом – структура системы, взаимодействие ее элементов, различные свойства, закономерности развития и т.д.
Объект исследования — та область непосредственно наблюдаемой реальности, для которой выявлены устойчивые и необходимые связи между отдельными ее составляющими и закреплены в системе научных абстракций. Процесс построения объекта научного исследования невозможен без появления особой познавательной задачи, научной проблемы.
Средства исследования — фундаментальные понятия науки, с помощью которых расчленяется объект исследования и формулируется проблема, принципы и методы изучения объекта, средства получения эмпирических данных, включая технические средства.
Один и тот же объект может входить в предмет нескольких разных исследований и даже различных наук. Поэтому понятию предмета исследования противопоставляется не объект, а эмпирическая область — совокупность научных фактов и описаний, на которых развертывается предмет исследования.
Процесс научного исследования состоит из определенных фаз, в рамках которых предпринимаются действия, в известной мере гарантирующие истинность и объективность как в сборе фактов, так и в формулировании научных выводов. Единого мнения относительно количества таких фаз в социологической литературе нет. Тем не менее мы полагаем, что процесс научного исследования в рамках всякой науки, в том числе и социологии, включает пять основных фаз: определение предмета исследования и формулирование исходных гипотез; разработку плана исследования; сбор данных; упорядочение собранных данных; научное объяснение и проверку.
Эффективность научных исследований, оценивание результатов исследования. Если основной характеристикой фундаментальных исследований является их актуальность, теоретическая новизна, концептуальность, доказательность, перспективность и возможность внедрения результатов в практику, то при рассмотрении прикладных исследований следует оценивать в первую очередь их практическую актуальность и значимость, возможность внедрения в практику, эффективность результатов. Для научных разработок здесь ценной является новизна, актуальность и эффективность.
Объект и предмет научного исследования
Объект — это процесс или явление, порождающее проблемную ситуацию и взятое исследователем для изучения. Предмет — это то, что находится в рамках, в границах объекта. Объект — это та часть научного знания, с которой исследователь имеет дело. Предмет исследования — это тот аспект проблемы, исследуя который, мы познаем целостный объект, выделяя его главные, наиболее существенные признаки. Предмет диссертационного исследования чаще всего совпадает с определением его темы или очень близок к нему. Объект и предмет исследования как научные категории соотносятся как общее и частное.
Необходимо подчеркнуть, что объект и предмет исследования, так же как и его цели и задачи, зависят не только от выбранной темы, но и от замысла исследователя. По нашему мнению, первичным является объект исследования (более широкое понятие), вторичным — предмет исследования, в котором выделяется определенное свойство объекта исследования. Некоторые исследователи не видят разницы в этих понятиях и отождествляют предмет и объект исследования.
Порой объект и предмет исследования определяются практически одинаково. В автореферате диссертации по экономике «Пути повышения социально-экономической эффективности занятости молодежи» (2003) объектом исследования названы «социально-трудовые отношения, реализуемые в процессе обеспечения занятости молодежи»; а предметом исследования – «организационно-управленческие отношения, возникающие в процессе повышения социально-экономической эффективности занятости молодежи». Немало диссертаций, в которых объект и предмет исследования вообще не указываются. Определив предмет и объект исследования, автор диссертации должен дать им всестороннюю характеристику и в процессе научной работы постоянно иметь их в виду.
Формы и методы исследования
Получение и обоснование объективно-истинного знания в науке происходит при помощи научных методов.
Метод (от греч. metodos - путь исследования или познания) - совокупность правил, приемов и операций практического и теоретического освоения действительности. Основная функция метода в научном знании - внутренняя организация и регулирование процесса познания того или иного объекта.
Методология определяется как система методов и как учение об этой системе, общая теория метода.
Современная система методов науки столь же разнообразна, как и сама наука. Содержание изучаемых наукой объектов служит критерием для различия методов естествознания и методов социально-гуманитарных наук. В свою очередь методы естественных наук подразделяют на методы изучения неживой природы и методы изучения живой природы. Выделяют также качественные и количественные методы, однозначно детерминистские и вероятностные, методы непосредственного и опосредованного познания, оригинальные и производные и т.д.
Характер метода определяется многими факторами: предметом исследования, степенью общности поставленных задач, накопленным опытом, уровнем развития научного знания и т.д. Методы, подходящие для одной области научного знания, оказываются непригодными для достижения целей в других областях. Методы, использовавшиеся на этапе становления научной дисциплины, уступают место более сложным и совершенным методам на последующей ступени её развития. В то же время многие выдающиеся достижения явились следствием переноса методов, хорошо зарекомендовавших себя в одних науках, в другие отрасли научного знания. Например, в биологии успешно применяются методы физики, химии, общей теории систем. Обобщенные характеристики методов, выработанных в термодинамике, химии, биологии, дали толчок к возникновению синергетики. В самых разнообразных науках оправдали себя математические методы.
Таким образом, на основе применяемых методов происходят противоположные процессы дифференциации и интеграции наук.
В теории науки и методологии научного познания разработаны различные классификации методов. Так, в типологии научных методов, предложенной В.А. Канке, выделены:
· индуктивный метод, который регламентирует перенос знаний с известных объектов на неизвестные и тесно сопряжен с проблематикой научных открытий;
· гипотетико-дедуктивный метод, определяющий правила научного объяснения в естествознании и основанный на определении соответствия научных понятий реальной ситуации;
· аксиоматический и конструктивистский методы, определяющие правила логических и математических рассуждений;
· прагматический метод, применяемый преимущественно в социально-гуманитарном знании метод понимания (интерпретации) явлений, основанный на установлении ценностного отношения между исследователем и миром культуры.
Различают также методы:
· общие - методы, которые применяются в человеческом познании вообще,
o анализ,
o синтез,
o абстрагирование,
o сравнение,
o индукция,
o дедукция,
o аналогия
o и др.;
· специфические - те, которыми пользуется наука:
o научное наблюдение,
o эксперимент,
o идеализация,
o формализация,
o аксиоматизация,
o восхождение от абстрактного к конкретному
o и т.д.;
· практические - применяемые на предметно-чувственном уровне научного познания:
o наблюдение,
o измерение,
o практический эксперимент;
· логические, являющиеся результатом обобщения много раз повторяющихся действий:
o доказательство,
o опровержение,
o подтверждение,
o объяснение,
o выведение следствий,
o оправдание.
Одновременно наблюдение, измерение, практический эксперимент относятся к эмпирическим методам, как и сопровождающие их доказательство или выведение следствий. Такие методы, как идеализация, мысленный эксперимент, восхождение от абстрактного к конкретному, являются теоретическими. Существуют методы, приспособленные преимущественно для обоснования знаний (эксперимент, доказательство, объяснение, интерпретация), другие направлены на открытие (наблюдение, индуктивное обобщение, аналогия, мысленный эксперимент).
Индукция, Дедукция. Примеры применения
индукция – способ переход знаний от отдельных элементов процесса к знанию общего процесса
дедукция – стремление познания от абстрактного к конкретному, т.е. переход от общих закономерностей к фактическому их проявлению
Примеры дедукции
Если идет дождь, земля мокрая
Все люди смертны. Все греки – люди. Следовательно, все греки – смертны.
Примеры индукции
Аргентина является республикой; Бразилия – республика; Венесуэла – республика; Эквадор – республика. Аргентина, Бразилия, Венесуэла, Эквадор – латиноамериканские государства. Все латиноамериканские государства являются республиками.
Италия – республика; Португалия – республика; Финляндия – республика; Франция – республика. Италия, Португалия, Финляндия, Франция – западноевропейские страны. Все западноевропейские страны являются республиками.
Индукция не дает полной гарантии получения новой истины из уже имеющихся [истин]. Максимум, о котором можно говорить, – это определенная степень вероятности выводимого утверждения. Так, посылки и первого и второго индуктивного умозаключения истинны, но заключение первого из них истинно, а второго – ложно. Действительно, все латиноамериканские государства – республики; но среди западноевропейских стран имеются не только республики, но и монархии, например Англия, Бельгия и Испания.
Аксиоматический метод
АКСИОМАТИЧЕСКИЙ МЕТОД – метод построения теорий, в соответствии с которым разрешается пользоваться в доказательствах лишь аксиомами и ранее выведенными из них утверждениями. Основания для применения аксиоматического метода могут быть разными, что обычно приводит к различению аксиом не только по их формулировкам, но и по их методологическим (прагматическим) статусам. Например, аксиома может иметь статус утверждения, или статус предположения, или статус лингвистического соглашения о желаемом употреблении терминов. Иногда это различие в статусах отражается в названиях аксиом (в современных аксиоматиках для эмпирических теорий среди всех аксиом выделяют часто т.н. постулаты значения, выражающие лингвистические соглашения, а древние греки делили геометрические аксиомы на общие понятия и постулаты, полагая, что первые описывают, вторые строят). Вообще говоря, учет статусов аксиом обязателен, так как можно, например, изменить содержание аксиоматической теории, не изменив при этом ни формулировку, ни семантику аксиом, а поменяв лишь их статус, объявив, скажем, одну из них новым постулатом значения. Аксиоматический метод был впервые продемонстрирован Евклидом в его «Началах», хотя понятия аксиомы, постулата и определения рассматривались уже Аристотелем. В частности, к нему восходит толкование аксиом как необходимых общих начал доказательства. Понимание аксиом как истин самоочевидных сложилось позднее, став основным с появлением школьной логики Пор-Рояля, для авторов которой очевидность означает особую способность души осознавать некоторые истины непосредственно (в чистом созерцании, или интуиции). Между прочим, убеждение Канта в априорном синтетическом характере геометрии Евклида зависит от этой традиции не считать аксиомы лингвистическими соглашениями или предположениями. Открытие неевклидовой геометрии (Гаусс, Лобачевский, Бойяи); появление в абстрактной алгебре новых числовых систем, причем сразу целых их семейств (напр., р-адические числа); появление переменных структур вроде групп; наконец, обсуждение вопросов типа «какая геометрия истинна?» – все это способствовало осознанию двух новых, по сравнению с античным, статусов аксиом: аксиом как описаний (классов возможных универсумов рассуждений) и аксиом как предположений, а не самоочевидных утверждений. Так сформировались основы современного понимания аксиоматического метода. Это развитие аксиоматического метода становится особенно наглядным при сопоставлении «Начал» Евклида с «Основаниями геометрии» Д.Гильберта – новой аксиоматики геометрии, базирующейся на высших достижениях математики 19 в.
К концу того же века Дж.Пеано дал аксиоматику натуральных чисел. Далее аксиоматический метод был использован для спасения теории множеств после нахождения парадоксов. При этом аксиоматический метод был обобщен и на логику. Гильберт сформулировал аксиомы и правила вывода классической логики высказываний, а П. Бернайс – логики предикатов. Ныне аксиоматическое задание является стандартным способом определения новых логик и новых алгебраических понятий. В последние десятилетия по мере развития моделей теории аксиоматический метод стал в почти обязательном порядке дополняться теоретико-модельным.
Метод формализации
Метод формализации имеет ряд особенностей, позволяющих расширять пределы его возможностей. Метод формализации позволяет описывать изучаемый объект точными логическими средствами вывода всех положений из соответствующих исходных положений научной теории. Гильберта о формализации языка науки, суть которой заключается в том, что все суждения науки рассматриваются как последовательность определенных знаковых выражений ( формул), не имеющих сами по себе содержательного смысла, но приобретающих его после определенной трактовки или конкретной интерпретации.
Метод формализации - это метод изучения самых разнообразных объектов путем отображения их содержания и структуры в знаковой форме, при помощи самых разнообразных искусственных языков, к числу которых относится, например, язык математики, математической логики, химии, радиотехники и ряда других наук. Использование специальной символики в этих науках является одним из необходимых и все более прогрессирующих методов отражения действительности человеком.
Метод абстрагирования.
Абстрагирование (идеализация) - мысленное отвлечение от несущественных свойств, связей и отношений изучаемого явления, предмета с одновременным выделением интересующих исследователя свойств и отношений (идеальный газ, идеально упругое изотропное однородное тело).
Абстрагирование — это приём мышления, который заключается в отвлечении от ряда свойств и отношений изучаемого явления с одновременным выделением интересующих исследователя свойств и отношений (см.: Абстрагирование). Результатом абстрагирующей деятельности мышления является образование различного рода абстракций, которыми являются как отдельно взятые понятия и категории, так и их системы (см.: Абстракция). Процесс абстрагирования носит двухступенчатый характер, предполагая, с одной стороны, установление относительной самостоятельности отдельных свойств, а с другой — выделение интересующих исследователя свойств и отношений. Предметы объективной действительности обладают бесконечным множеством различных свойств, связей и отношений. Одни из этих свойств сходны между собой и обусловливают друг друга, другие же отличны и относительно самостоятельны. В процессе познания и практики устанавливают прежде всего эту относительную самостоятельность отдельных свойств, выделяют те из них, связь между которыми важна для понимания предмета и раскрытия его сущности. Процесс такого выделения предполагает, что эти свойства и отношения должны быть обозначены особыми замещающими знаками, благодаря которым они закрепляются в сознании в качестве абстракций. Абстрагирование — универсальный приём познания, без которого немыслимы как научное, так и обыденное познание, как эмпирический, так и теоретический уровни исследований.
Анализ, Синтез. Примеры применения
Анализ - логический прием, метод исследования, состоящий в том, что изучаемый объект мысленно (или практически ) расчленяется на составные элементы (признаки, свойства, отношения), каждый из которых исследуется в отдельности как часть расчлененного целого.
Синтез - логический прием, с помощью которого отдельные элементы соединяются в целое.
Очень часто умение мыслить связывают с умением анализировать. Это вполне правомерно, так как вывод следствий, выражающих новые свойства изучаемого объекта, очень часто требует анализа того, что уже известно о нем. В математике, чаще всего, под анализом понимают рассуждение в "обратном направлении", т. е. от неизвестного, от того, что необходимо найти, к известному, к тому, что уже найдено или дано, от того, что необходимо доказать, к тому, что уже доказано или принято за истинное. В таком понимании, наиболее важном для обучения, анализ является средством поиска решения, доказательства, хотя в большинстве случаев сам по себе решением, доказательством еще не является.
Синтез, опираясь на данные, полученные в ходе анализа, дает решение задачи или доказательство теоремы. Анализ лежит в основе весьма общего подхода к решению задач (имеется в виду нестандартных задач, для которых нет соответствующего алгоритма), известного под названием сведения (редукции) задачи к совокупности подзадач. Идея такого подхода состоит именно в свойственном для анализа "размышлении в обратном направлении" от задачи, которую предстоит решить, к подзадачам, затем от этих подзадач к подподзадачам и т. д., пока исходная задача не будет сведена к набору элементарных задач. Что же понимают под "элементарными задачами"? Это, во-первых, задачи, решаемые за один шаг поиска, во-вторых, более сложные задачи (т. е. не решаемые за один шаг поиска), решение которых уже известно из имеющегося опыта решения задач.
Эксперимент
от лат. проба, опыт) – метод эмпирического познания,характеризующийся вмешательством в течение изучаемых процессов, использование разнообразных приборов. В ходе эксперимента исследователь, воздействуя на предмет в специально разработанных условиях, целенаправленно акцентируя внимание на нужном состоянии, изучая его на качественном и количественном уровнях. Эксперимент позволяет изолировать познаваемый объект от влияния случайных или второстепенных факторов, многократно воспроизводить ход процесса в постоянных условиях. Особенности научного эксперимента: а) позволяет изучать объект в «очищенном» виде (без побочных факторов); б) при нем могут создаваться специальные условия, при которых удается обнаружить неожиданные свойства объектов и тем самым постигнуть их сущность; в) многократная воспроизводимость позволяет получать достоверные результаты; г) изучая процесс, экспериментатор может включать в него все, что считает нужным для получения истинного знания об объекте. Эксперимент всегда включает в себя: 1) определенные допущения о свойствах моделируемых материальных процессов; 2) допущения о характере интересующих исследователя объектов, их свойств и отношений, которые должны в ходе эксперимента или подтвердиться, или опровергнуться, или уничтожиться; 3) приборы, измерительную технику и знания, лежащие в основе принципов их действия. В зависимости от характера поставленных задач научные эксперименты бывают следующих видов: измерительные, поисковые, проверочные, контрольные, исследовательские и др. В зависимости от области проведения эксперименты подразделяются на: фундаментальные, прикладные, промышленные, социальные, в области гуманитарных наук. Любой научный эксперимент – это не чисто материальная деятельность, а материально-когнитивная, опирающаяся на определенную систему знания, удостоверенную в прошлом опыте.
Математическая гипотеза
Важнейшей разновидностью метода гипотезы является метод математической гипотезы, который характерен для наук с высокой степенью математизации. В методе математической гипотезы мышление идет другим путем. Сначала для объяснения количественных зависимостей подбирается из смежных областей науки подходящее уравнение, что часто предполагает и его видоизменение, а затем этому уравнению пытаются дать содержательное истолкование. Характеризуя метод математической гипотезы, С. И. Вавилов писал: Положим, что из опыта известно, что изученное явление зависит от ряда переменных и постоянных величин, связанных между собой приближенно некоторым уравнением. Довольно произвольно видоизменяя, обобщая это уравнение, можно получить другие соотношения между переменными. В этом и состоит математическая гипотеза или экстраполяция. Она приводит к выражениям, совпадающим или расходящимся с опытом, и соответственно этому применяется дальше или отбрасывается.
Специалист по методологии науки И. В. Кузнецов попытался выделить различные способы видоизменения исходных уравнений в процессе выдвижения математической гипотезы: 1) изменяется тип, общий вид уравнения; 2) в уравнение подставляются величины другой природы; 3) изменяется и тип уравнения, и вид величины; 4) изменяются предельные граничные условия. Все это дает основание и для типологии метода математической гипотезы.
Сфера применения метода математической гипотезы весьма ограничена. Он применим прежде всего в тех дисциплинах, где накоплен богатый арсенал математических средств в теоретическом исследовании. К таким дисциплинам прежде всего относится современная физика. Метод математической гипотезы был использован при открытии основных законов квантовой механики. Так, Э. Щредингер для описания движения элементарных частиц за основу взял волновое уравнение классической физики, но дал иную интерпретацию его членов. В итоге был создан волновой вариант квантовой механики. В. Гейзенберг и М.Борн пошли в решении этой задачи другим путем. Они взяли за исходный пункт в выдвижении математической гипотезы канонические уравнения Гамильтона из классической механики, сохранив их математическую форму или тип уравнения, но ввели в эти уравнения новый тип величин - матрицы. В результате возник матричный вариант квантово-механической теории.
Метод гипотезы демонстрирует творческий характер научного исследования в процессе открытия новых законов, принципов и создания теорий.
Правила метода гипотезы не предопределяют однозначно результатов исследования и не гарантируют истинности полученного знания. Именно творческая интуиция, творческий выбор из многообразия возможных путей решения проблемы приводит ученого к новой теории. Теория не вычисляется логически и не открывается, она создается творческим гением ученого и на ней всегда лежит печать личности ученого, как она лежит на любом продукте духовно-практической деятельности человека.
Дисперсионный анализ
Дисперсионный анализ, предложенный Р. Фишером, является статистическим методом, предназначенным для выявления влияния ряда отдельных факторов на результаты экспериментов.
В основе дисперсионного анализа лежит предположение о том, что одни переменные могут рассматриваться как причины (факторы, независимые переменные), а другие как следствия (зависимые переменные). Независимые переменные называют иногда регулируемыми факторами именно потому, что в эксперименте исследователь имеет возможность варьировать ими и анализировать получающийся результат.
Сущность дисперсионного анализа заключается в расчленении общей дисперсии изучаемого признака на отдельные компоненты, обусловленные влиянием конкретных факторов, и проверке гипотез о значимости влияния этих факторов на исследуемый признак. Сравнивая компоненты дисперсии друг с другом посредством F — критерия Фишера, можно определить, какая доля общей вариативности результативного признака обусловлена действием регулируемых факторов.
Исходным материалом для дисперсионного анализа служат данные исследования трех и более выборок, которые могут быть как равными, так и неравными по численности, как связными, так и несвязными. По количеству выявляемых регулируемых факторов дисперсионный анализ может быть однофакторным (при этом изучается влияние одного фактора на результаты эксперимента), двухфакторным (при изучении влияния двух факторов) и многофакторным(позволяет оценить не только влияние каждого из факторов в отдельности, но и их взаимодействие).
Дисперсионный анализ относится к группе параметрических методов и поэтому его следует применять только тогда, когда доказано, что распределение является нормальным.
Суть кластерного анализа
Суть факторного анализа
Хозяйственные процессы и конечные результаты складываются под влиянием объективных и субъективных, внешних и внутренних факторов. Факторы — это причины, воздействующие на изучаемый экономический показатель. Одни из них непосредственно связаны между собой, другие — косвенно. Под факторным анализом понимается методика комплексного и системного изучения и измерения воздействия факторов на величину результативного показателя. Факторы в результате анализа получают количественную и качественную оценку. Каждый показатель может в свою очередь выступать и в роли факторного, и результативногоРазличают следующие типы факторного анализа: o детерминированный и стохастический; o прямой и обратный; o одноступенчатый и многоступенчатый; o статический и динамический; o ретроспективный (исторический) и перспективный (прогнозный). Основные задачи факторного анализа. 1. Отбор факторов для анализа исследуемых показателей. 2. Классификация и систематизация их с целью обеспечения системного подхода. 3. Моделирование взаимосвязей между результативными и факторными показателями. 4. Расчет влияния факторов и оценка роли каждого из них в изменении величины результативного показателя. 5. Работа с факторной моделью (практическое ее использование для управления экономическими процессами).
Регрессионный анализ
Регрессионный анализ - метод моделирования измеряемых данных и исследования их свойств. Данные состоят из пар значений зависимой переменной (переменной отклика) и независимой переменной (объясняющей переменной). Регрессионная модель есть функция независимой переменной и параметров с добавленной случайной переменной. Корреляционный анализ и регрессионный анализ являются смежными разделами математической статистики, и предназначаются для изучения по выборочным данным статистической зависимости ряда величин; некоторые из которых являются случайными. При статистической зависимости величины не связаны функционально, но как случайные величины заданы совместным распределением вероятностей. Исследование зависимости случайных величин приводит к моделям регрессии и регрессионному анализу на базе выборочных данных. Теория вероятностей и математическая статистика представляют лишь инструмент для изучения статистической зависимости, но не ставят своей целью установление причинной связи. Представления и гипотезы о причинной связи должны быть привнесены из некоторой другой теории, которая позволяет содержательно объяснить изучаемое явление. Числовые данные обычно имеют между собой явные (известные) или неявные (скрытые) связи. Явно связаны показатели, которые получены методами прямого счета, т. е. вычислены по заранее известным формулам. Например, проценты выполнения плана, уровни, удельные веса, отклонения в сумме, отклонения в процентах, темпы роста, темпы прироста, индексы и т. д. Связи же второго типа (неявные) заранее неизвестны. Однако необходимо уметь объяснять и предсказывать (прогнозировать) сложные явления для того, чтобы управлять ими. Поэтому специалисты с помощью наблюдений стремятся выявить скрытые зависимости и выразить их в виде формул, т. е. математически смоделировать явления или процессы. Одну из таких возможностей предоставляет корреляционно-регрессионный анализ.
Методы снижения размерности
Процесс уменьшения анализируемого множества данных до размера, оптимального с точки зрения решаемой задачи и используемой аналитической модели.
Сокращение размерности может потребоваться когда данные избыточны в информационном плане, т.е. задачу можно решить с тем же уровнем эффективности и точности, но используя меньший объем данных. Это позволяет урезать время и вычислительные затраты на решение задачи. Другой случай связан со слишком большими вычислительными затратами, требуемыми для обработки множества данного размера. Эта ситуация типична для алгоритмов, вычислительная сложность которых экспоненциально растет с увеличением числа наблюдений (т.е. немасштабируемых). Если в первом случае достаточно просто отобрать из всего множества столько признаков(атрибутов) и записей, сколько надо, то во втором, нужно сократить исходное множество до такого объема, который обеспечил бы реализуемость его обработки невзирая на потерю полезной информации.
Поэтому во втором случае предъявляются очень жесткие требования по отбору данных: сокращение объема должно происходить за счет наименее ценных данных, например, сначала за счет наименее значимых признаков, затем - похожих записей и т.д., пока размерность не окажется приемлемой с точки зрения требуемого объема вычислений.
Существует несколько направлений сокращения размерности множеств данных: сокращение числа признаков (атрибутов), сокращение числа записей и сокращение числа разнообразных значений определенного признака. Наиболее эффективным является сокращение признаков, поскольку в этом случае уменьшается не только объем данных, но и размерность всей задачи. В большинстве случаев решающим фактором за или против исключения признака является его значимость. На практике, определяют значимость всех признаков, исключают все признаки, значимость которых ниже заданного порога. Также следует исключать коррелирующие признаки.
Подмножество данных, полученное в результате сокращения размерности, должно унаследовать от исходного множества столько информации, сколько необходимо для решения задачи с заданной точностью, а вычислительные и временные затраты на сокращение данных не должны обесценивать , полученные от него преимущества. Аналитическая модель, построенная на основе сокращенного множества данных, должна стать проще для обработки, реализации и понимания, чем модель, построенная на исходном множестве.
Решение о выборе метода сокращения размерности основывается на априорном знании об особенностях решаемой задачи и ожидаемых результатах, а также ограниченности временных и вычислительных ресурсов.
Дискриминантный анализ
Дискриминантный анализ необходим для:
· Поиска наиболее сильныхразличий между сегментами.
· Оценки устойчивости сегментации.
· Воспроизведения сегментации с помощью обучения новой выборки по данным прошлых волн.
· Восстановления пропущенных значений.
На входе анализа – категориальная переменная, содержащая принадлежность к классам (например, сегментация, или потребление продуктов или брендов), и набор независимых переменных, измеренных по интервальным или дихотомическим шкалам. При этом категориальная переменная может иметь пропуски, т.е. не для всех респондентов будет заполнена: алгоритм самостоятельно предскажет эти значения.
С помощью статистического критерия (чаще всего используют критерий Фишера) алгоритм ищет такую комбинацию линейных уравнений (дискриминантных функций), которая наилучшим образом опишет различия между группами.
Первая дискриминантная функция отделяет первую группу от групп 2, 3, … N, вторая – вторую группу от групп 3, 4, … N и т.д. В итоге все N групп получаются отделёнными друг от друга дискриминантными функциями. Это даёт возможность определить вероятность принадлежности респондента к тому или иному классу.
Дискриминантный анализ дает возможность понять, по каким именно переменным имеющиеся классы (сегменты, продукты, бренды, и т.д.) различаются сильнее всего.
Каждому респонденту приписывается вероятность попадания в тот или иной класс; таким образом, при сегментации можно определить основной (по наибольшей вероятности попадания) и дополнительный (второе по величине значение вероятности) сегмент респондента.
Метод позволяет воспроизвести уже имеющуюся сегментацию, распространив ее на новые волны исследования. Кроме того, с его помощью можно оценить устойчивость сегментов.
Наконец, с помощью дискриминантного анализа можно строить различные карты, существенно облегчающие интерпретацию результатов кластерного анализа.
Анализ временных рядов
| |