Главная страница

Для Герасимова 2. Разработка модели потребительских предпочтений на основе данных рекомендательной сети epinions com


Скачать 2.87 Mb.
НазваниеРазработка модели потребительских предпочтений на основе данных рекомендательной сети epinions com
Дата11.06.2022
Размер2.87 Mb.
Формат файлаdocx
Имя файлаДля Герасимова 2.docx
ТипДокументы
#584719
страница10 из 16
1   ...   6   7   8   9   10   11   12   13   ...   16

Заключение


Повсеместное распространение доступа в Интернет расширило возможности людей по обмену мнениями, позволив одновременно компаниям, заинтересованным в продвижении своей продукции, получить доступ к этой информации. Это, наряду с возможностями новых технологий обработки данных, дает бизнесу большие возможности для выработки маркетинговых стратегий, подкрепленных полными, точными и актуальными данными.

В процессе выполнения работы были применены современные технологии программирования: ORM, XML-парсер, сериализация объектов и др. С их помощью была разработана база данных для хранения информации о товарах и отзывах, процедуры извлечения данных с различных типов страниц сайта epinions.com, процедуры заполнения БД, способные работать длительное время.

При выполнении работы были собрана информация с тысяч страниц сайта epinions.com и получена база данных, включающая:

  • более 800 тыс. отзывов

  • более 600 тыс. товаров

  • более 30 тыс. пользователей

Результаты сбора данных показывают, что современные технологии дают возможность быстро получить большой объем качественной и актуальной информации данных, пользуясь современными технологиями. Это означает, что затраты на маркетинговые исследования в ряде случаев могут быть сокращены за счет более активного использования средств автоматизированного сбора данных из глобальной сети.

В результате проведенного исследования среди пользователей сайта epinions.com были выделены следующие группы:

  • пользователи, которые пишут главным образом о книгах, фильмах или музыке

  • пользователи с “мужскими” интересами, которые пишут об электронике и автомобилях

  • любители компьютерных игр, которые пишут главным образом об электронных развлечениях

  • женщины, которые ориентированы на семью и пишут в основном о хозяйстве и детских товарах

  • женщины с обычными интересами, которые пишут о косметике, домашних животных и в меньшей степени о домашнем хозяйстве

  • пользователи, не имеющие выраженных интересов

Это разделение подтвердило изначальные предположения автора об аудитории сайта.

В результате исследования модели пользовательских предпочтений было обнаружено, что наиболее важными потребительскими свойствами фотокамеры являются надежность и качество снимков. Наименее важными свойствами являются емкость аккумулятора и скорость срабатывания затвора. Наблюдение подтвердилось как для полной выборки, так и для большинства групп.

Было выявлено, что мужская аудитория сайта имеет повышенные требования практически ко всем характеристикам фотокамер: надежности, качеству снимков и простоте использования. Эти наблюдения были неоднократно подтверждены при различных вариантах деления на группы.

Судя по результатам исследования, женская аудитория сайта имеет повышенные требования к качеству снимков. Эти наблюдения были подтверждены при различных вариантах деления на группы.

Для некоторых из обнаруженных групп точно оценить потребительские предпочтения не удалось из-за нехватки отзывов на фотокамеры среди пользователей этих групп.

Выявленные закономерности, подкрепленные большим объемом выборки, позволяют сделать вывод, что для удержания своих позиций на рынке производители должны уделять особое внимание приоритетным потребительским свойствам и позиционированию своих товаров среди различных групп потребителей.

В процессе выполнения работы разработана методология разделения пользователей на группы по интересам на основе их отзывов, которая дала предсказуемые результаты на реальных данных, что позволяет заявлять о возможности ее использования в аналогичных исследованиях.

Полученная при выполнении работы база данных с помощью предлагаемых процедур может быть легко расширена для исследования любой другой товарной категории или проведения других видов статистического анализа.

Библиографический список




  1. Калинина В. Н., Соловьёв В. И. Введение в многомерный статистический анализ [Текст] / В. Н. Калинина, В. И. Соловьёв — М.: ГУУ, 2003. — 66 с. — ISBN 978-5-215-01514-7

  2. Дейт К. Дж. Введение в системы баз данных [Текст] / К. Дж. Дейт — 8-е изд. — М.: Вильямс, 2006. — 1328 с. — ISBN 0-321-19784-4

  3. Бьюли А. Изучаем SQL [Текст] / А. Бьюли — СПб.: Символ-Плюс, 2007. — 312 с. — ISBN 978-5-93286-051-9

  4. Dubes R. C., Anil K. Jain (1988), Algorithms for Clustering Data, Prentice Hall

  5. Steinbach M., Karypis G., Kumar V., A comparison of document clustering techniques, In KDD Workshop on Text Mining, 2002

  6. Agresti A. (2007). An Introduction to Categorical Data Analysis. Wiley-Interscience. ISBN 0471226181

  7. Leisch F. A Toolbox for K-Centroids Cluster Analysis. Computational Statistics and Data Analysis, 51 (2), 526–544, 2006

  8. Larsen B., Aone C., Fast and Effective Text Mining Using Linear-time Document Clustering, KDD-99, San Diego, California, 1999

  9. Manning C. D.; Raghavan P.; Schutze, Hinrich (2008). Introduction to Information Retrieval. Cambridge University Press. ISBN 0521865719

  10. An Introduction to R [Электронный ресурс]: документ. – Режим доступа: http://cran.r-project.org/doc/manuals/r-release/R-intro.pdf

  11. Coursera: Natural Language Processing [Электронный ресурс]: сайт. – Режим доступа: https://www.coursera.org/course/nlp

  12. Epinions [Электронный ресурс]: сайт. – Режим доступа: http://www.epinions.com/

  13. lxml Documentation [Электронный ресурс]: сайт. – Режим доступа: http://lxml.de/index.html#documentation

  14. Package ‘flexclust’ [Электронный ресурс]: документ. – Режим доступа: http://cran.r-project.org/web/packages/flexclust/flexclust.pdf

  15. Python Documentation [Электронный ресурс]: сайт. – Режим доступа: http://python.org/doc/

  16. SQLAlchemy 0.6 Documentation [Электронный ресурс]: сайт. – Режим доступа: http://docs.sqlalchemy.org/en/rel_0_6/

  17. SQLite Documentation [Электронный ресурс]: сайт. – Режим доступа: http://sqlite.org/docs.html

  18. Quick-R [Электронный ресурс]: сайт. – Режим доступа: http://www.statmethods.net/


1   ...   6   7   8   9   10   11   12   13   ...   16


написать администратору сайта