Для Герасимова 2. Разработка модели потребительских предпочтений на основе данных рекомендательной сети epinions com
Скачать 2.87 Mb.
|
ЗаключениеПовсеместное распространение доступа в Интернет расширило возможности людей по обмену мнениями, позволив одновременно компаниям, заинтересованным в продвижении своей продукции, получить доступ к этой информации. Это, наряду с возможностями новых технологий обработки данных, дает бизнесу большие возможности для выработки маркетинговых стратегий, подкрепленных полными, точными и актуальными данными. В процессе выполнения работы были применены современные технологии программирования: ORM, XML-парсер, сериализация объектов и др. С их помощью была разработана база данных для хранения информации о товарах и отзывах, процедуры извлечения данных с различных типов страниц сайта epinions.com, процедуры заполнения БД, способные работать длительное время. При выполнении работы были собрана информация с тысяч страниц сайта epinions.com и получена база данных, включающая: более 800 тыс. отзывов более 600 тыс. товаров более 30 тыс. пользователей Результаты сбора данных показывают, что современные технологии дают возможность быстро получить большой объем качественной и актуальной информации данных, пользуясь современными технологиями. Это означает, что затраты на маркетинговые исследования в ряде случаев могут быть сокращены за счет более активного использования средств автоматизированного сбора данных из глобальной сети. В результате проведенного исследования среди пользователей сайта epinions.com были выделены следующие группы: пользователи, которые пишут главным образом о книгах, фильмах или музыке пользователи с “мужскими” интересами, которые пишут об электронике и автомобилях любители компьютерных игр, которые пишут главным образом об электронных развлечениях женщины, которые ориентированы на семью и пишут в основном о хозяйстве и детских товарах женщины с обычными интересами, которые пишут о косметике, домашних животных и в меньшей степени о домашнем хозяйстве пользователи, не имеющие выраженных интересов Это разделение подтвердило изначальные предположения автора об аудитории сайта. В результате исследования модели пользовательских предпочтений было обнаружено, что наиболее важными потребительскими свойствами фотокамеры являются надежность и качество снимков. Наименее важными свойствами являются емкость аккумулятора и скорость срабатывания затвора. Наблюдение подтвердилось как для полной выборки, так и для большинства групп. Было выявлено, что мужская аудитория сайта имеет повышенные требования практически ко всем характеристикам фотокамер: надежности, качеству снимков и простоте использования. Эти наблюдения были неоднократно подтверждены при различных вариантах деления на группы. Судя по результатам исследования, женская аудитория сайта имеет повышенные требования к качеству снимков. Эти наблюдения были подтверждены при различных вариантах деления на группы. Для некоторых из обнаруженных групп точно оценить потребительские предпочтения не удалось из-за нехватки отзывов на фотокамеры среди пользователей этих групп. Выявленные закономерности, подкрепленные большим объемом выборки, позволяют сделать вывод, что для удержания своих позиций на рынке производители должны уделять особое внимание приоритетным потребительским свойствам и позиционированию своих товаров среди различных групп потребителей. В процессе выполнения работы разработана методология разделения пользователей на группы по интересам на основе их отзывов, которая дала предсказуемые результаты на реальных данных, что позволяет заявлять о возможности ее использования в аналогичных исследованиях. Полученная при выполнении работы база данных с помощью предлагаемых процедур может быть легко расширена для исследования любой другой товарной категории или проведения других видов статистического анализа. Библиографический списокКалинина В. Н., Соловьёв В. И. Введение в многомерный статистический анализ [Текст] / В. Н. Калинина, В. И. Соловьёв — М.: ГУУ, 2003. — 66 с. — ISBN 978-5-215-01514-7 Дейт К. Дж. Введение в системы баз данных [Текст] / К. Дж. Дейт — 8-е изд. — М.: Вильямс, 2006. — 1328 с. — ISBN 0-321-19784-4 Бьюли А. Изучаем SQL [Текст] / А. Бьюли — СПб.: Символ-Плюс, 2007. — 312 с. — ISBN 978-5-93286-051-9 Dubes R. C., Anil K. Jain (1988), Algorithms for Clustering Data, Prentice Hall Steinbach M., Karypis G., Kumar V., A comparison of document clustering techniques, In KDD Workshop on Text Mining, 2002 Agresti A. (2007). An Introduction to Categorical Data Analysis. Wiley-Interscience. ISBN 0471226181 Leisch F. A Toolbox for K-Centroids Cluster Analysis. Computational Statistics and Data Analysis, 51 (2), 526–544, 2006 Larsen B., Aone C., Fast and Effective Text Mining Using Linear-time Document Clustering, KDD-99, San Diego, California, 1999 Manning C. D.; Raghavan P.; Schutze, Hinrich (2008). Introduction to Information Retrieval. Cambridge University Press. ISBN 0521865719 An Introduction to R [Электронный ресурс]: документ. – Режим доступа: http://cran.r-project.org/doc/manuals/r-release/R-intro.pdf Coursera: Natural Language Processing [Электронный ресурс]: сайт. – Режим доступа: https://www.coursera.org/course/nlp Epinions [Электронный ресурс]: сайт. – Режим доступа: http://www.epinions.com/ lxml Documentation [Электронный ресурс]: сайт. – Режим доступа: http://lxml.de/index.html#documentation Package ‘flexclust’ [Электронный ресурс]: документ. – Режим доступа: http://cran.r-project.org/web/packages/flexclust/flexclust.pdf Python Documentation [Электронный ресурс]: сайт. – Режим доступа: http://python.org/doc/ SQLAlchemy 0.6 Documentation [Электронный ресурс]: сайт. – Режим доступа: http://docs.sqlalchemy.org/en/rel_0_6/ SQLite Documentation [Электронный ресурс]: сайт. – Режим доступа: http://sqlite.org/docs.html Quick-R [Электронный ресурс]: сайт. – Режим доступа: http://www.statmethods.net/ |