структурные части синтаксиса. Вопросы психолингвистики 2 (36) 2018 99
Скачать 1.43 Mb.
|
Вопросы психолингвистики 2 (36) 2018 99 Пильгун М.А.Психолингвистический анализ медиаконтента... УДК 81’22 DOI: 10.30982/2077-5911-2-99-117 ПСИХОЛИНГВИСТИЧЕСКИЙ АНАЛИЗ МЕДИАКОНТЕНТА В МУЛЬТИМОДАЛЬНОМ АСПЕКТЕ: ПРОТЕСТНЫЕ КОММУНИКАЦИИ & БОЛЬШИЕ ДАННЫЕ 1 Пильгун Мария Александровна профессор, Институт языкознания РАН, 125009 Москва, Б. Кисловский пер., д.1. стр.1, pilgunm@yandex.ru Статья посвящена исследованию медиаконтента протестных коммуника- ций в мультимодальном аспекте с применением психолингвистического анализа. Материалом для исследования послужила база данных социальной сети ВКонтакте (март 2017 года). Сбор данных осуществлялся по трем направлениям: лингвистиче- ский модус анализировался по вербальному контенту, визуальный модус – по ста- тичным визуальным материалам, сетевой модус – по коммуникативным сетевым действиям. Полученные данные были обработаны с помощью программного обеспечения Automap и Tableau. Для визуализации сетевых структур использовалось программ- ное обеспечение Gephi, алгоритм Force Atlas 2. В ходе исследования было выявлено, что лингвистический модус протестно- го сетевого медиаконтента характеризуется повышенным эмоциональным фоном, экспрессивностью, агрессивностью, конфликтогенностью, саркастической тональ- ностью. Лингвистические особенности формируются речевыми средствами разных языковых уровней. Анализ основных характеристик акторов позволил выделить три кластера участников по целевым установкам: «неофиты», «идейные борцы», «гедонисты». Результаты данного исследования подтвердили, что социальные сети – это ин- струмент, который позволяет влиять на коммуникативную природу взаимодействия между людьми, воздействовать на акторов и реализовывать манипуляционные тех- нологии на принципиально новом уровне. Ключевые слова:медиаконтент, психолингвистический анализ, мультимо- дальность, протестные движения Введение Психолингвистический анализ протестного медиаконтента в мультимодаль- ном аспекте позволяет открыть новые ресурсы для уточнения особенностей речево- го поведения современных пользователей, их языкового сознания и картины мира, а также специфики коммуникации в социальных сетях. Одна из важных тенденций развития научной парадигмы – распространение Больших данных. За последние десятилетия человечество генерировало данных 1 Публикация подготовлена при финансовой поддержке Российского фонда фундаментальных исследований по проекту № 17-26-01007 100 Вопросы психолингвистики 2 (36) 2018 Теоретические и экспериментальные исследования больше, чем за всю историю своего развития. По прогнозам, к 2020 году на одного человека в одну секунду будет генерироваться 1,7 гигабайта, а цифровая вселенная достигнет 44 зеттабайт (44 триллиона гигабайт). Распространение больших данных определяет развитие не только технологической и научной, но также культурной, социальной, политической сфер. Существующие технологии и алгоритмы анализа Больших данных позволяют обрабатывать структурированные, неструктурирован- ные, потоковые данные, выявлять имплицитные закономерности и пр. (см., напри- мер, Data Science Central, 2018). Появление и публикация больших объемов данных привела к росту научных исследований на их основе, однако очевиден дефицит исследований с исчерпыва- ющей и корректной интерпретацией данных. Подобная ситуация связана со слож- ностью подбора адекватной методологической базы, позволяющей объединять результаты количественных и качественных методов, анализ структурированных, неструктурированных, полуструктуированных, а также метаданных и др. данных. Адекватная интерпретация Больших данных может быть выполнена с привлечени- ем гуманитарных методов, которые имеют длительную традицию и успешно адап- тированы к новой эмпирической базе. В частности, синергия больших данных и традиций московской психолингвистической школы может принести интересные результаты и представляется перспективным направлением анализа медиаконтен- та, а также языкового сознания и языковой картины мира. Очевидно, что для междисциплинарных исследований наиболее значимыми источниками являются текстовые корпусы, которые можно рассматривать как часть открытой науки, открытые данные и сетевой медиаконтент. Корпусная лингвистика, позволившая применить IT-технологии для работы с большими массивами языковых данных, привела с появлению новых методов лингвистического анализа, значительно расширила рамки лингвистической науч- ной парадигмы. В современном медиапространстве уже представлено огромное количество открытых данных, основными принципами которых являются полнота представле- ния, первичность, своевременность, доступность, пригодность к машинной обра- ботке, отсутствие дискриминации к доступу, отсутствие проприетарных форматов и лицензионная чистота. 7 июня 2013 года в России был принят закон об откры- тых данных, который обязал органы государственной власти публиковать откры- тые данные (в машиночитаемых форматах) наряду с публикацией информации в немашиночитаемом виде. Публикации в открытом доступе материалов различных научных, государственных, негосударственных, коммерческих структур сформиро- вали обширный массив данных для исследований, несмотря на неоднозначность реализации закона и качество публикуемых материалов. Данные социальные сетей, блогов, форумов и пр. также предоставляют огром- ные возможности для анализа, в частности, особенностей развития современного русского языка, речевого поведения, специфики языкового сознания и языковой картины мира. Веб-контент стремительно увеличивается, например, пользователи Facebook отправляют 30 миллионов сообщений и просматривают 3 миллиона виде- озаписей (в среднем, за одну минуту). Google ежесекундно генерируется 40,000 по- исковых запросов, в год – 1.2 триллиона запросов. На YouTube загружаются более 300 часов видео-файлов (в среднем, за одну минуту). Вопросы психолингвистики 2 (36) 2018 101 Пильгун М.А.Психолингвистический анализ медиаконтента... Особая проблема при анализе сетевого контента связаны с использованием персональных данных. Скандал, вызванный деятельностью Cambridge Analytica на выборах в Америке 2017 года, привлек пристальное внимание общественных и государственных структур к алгоритмам Facebook и открыл новый этап в исследо- вании сетевого контента, связанный с этическими и правовыми аспектами. В дан- ном исследовании контент используется на основании правил ВКонтакте 2 n 7.1.3., а также ст. 1274 ГК. Исследования взаимовлияния онлайн и офлайн – общения, воздействия веб- коммуникаций на реальные события сформировали две противопоставленные тео- рии об использовании социальных сетей в политической сфере: 1) веб-технологии трансформируют все коммуникативные процессы, откры- вают широкие возможности для вовлечения граждан в политические процессы, приводят к активизации участия граждан в политической жизни общества [Vaccari 2008a, 2008b, 2008c; Pepe & Gennaro 2009 и др.]. 2) cетевые коммуникации не оказывают существенного влияния на политиче- скую реальность [Druckman 2007; Kalnes 2009; Zittel 2009; Larsson 2011 и др.]. В данном исследовании базовой посылкой служит тезис: социальные сети – это инструмент, который позволяет влиять на коммуникативную природу взаимо- действия между людьми, воздействовать на акторов и реализовывать манипуляци- онные технологии на принципиально новом уровне. Конвергентность и многоаспектность онлайн-коммуникаций требуют крос- сдисциплинарного подхода, который и применяется во многих исследованиях, представляющих различные аспекты взаимодействия в веб-среде [Sauter 2014; Lipschultz 2014; Fuchs 2014; Verboord 2014 и др.]. Широкое распространение в последние десятилетия приобретают исследо- вания в мультимодальной перспективе [Kress 2002, 2003, 2010; Gibbon et al. 2000; Granström et al. 2002; Scollon 2006; Muller et al. 2013; Murray 2013; Lutkewitte 2013; Литвиненко, Николаева, Кибрик 2017; Кибрик 2018]. Мультимодальный аспект отражает социальный семиотический подход к со- временной коммуникации, поскольку в медиапространстве преобладают смешан- ные и ремиксные изображения, вербальные, невербальные формы взаимодейству- ют с 3D-объектами и др. Мультимодальность позволяет выйти за пределы анализа языковых структур и рассмотреть новые разнообразные способы коммуникации и создания смыслов. [Kress 2010]. Именно мультимодальный подход представляется наиболее адекватным при анализе сетевого контента, поскольку позволяет конвер- тировать данные, информацию, поступающие по различным каналам. Анализ медиапространства как мультимодальной сферы получает все большее распространения в различных исследованиях [см., например, Velkova 2018]. 2 П. 7.1.3. Пользователь, размещая на Сайте принадлежащий ему на законных основаниях Контент, предоставляет другим пользователям неисключительное право на его использование исключительно в рамках предоставляемого Сайтом функционала, путем просмотра, воспроизведения (в том числе копирования) и иные права исключительно с целью личного некоммерческого использования, кроме случаев, когда такое использование причиняет или может причинить вред охраняемым законом интересам правообладателя. 102 Вопросы психолингвистики 2 (36) 2018 Теоретические и экспериментальные исследования Цель исследования: психолингвистический анализ протестного медиаконтен- та в мультимодальном аспекте. Психолингвистический анализ используется в рамках московской психо- лингвистической школы [Леонтьев 1965, 1975, 1997; Тарасов, 1996, 1998, 2004; Уфимцева 2000, 2009; 2011, 2017 и др.]; Исследовательские вопросы: 1. Каковы особенности лингвистического модуса протестного медиаконтента? 2. Какие специфические особенности языковой картины мира позволяет вы- явить психолингвистический анализ протестного медиаконтента в мультимодаль- ном аспекте? 3. Какие основные характеристики акторов протестного медиаконтента по- зволяет выявить данный тип анализа? 4. Какова мотивация акторов протестного медиаконтента? Метод Материалисследования Материалом для исследования послужила база данных социальной сети ВКонтакте (март 2017 года), семантическое поле – кейс «Он вам не Димон» (#ДимонОтветит). Релевантные данные после очистки: - контент активных акторов (n 15 021), - релевантные посты (n 23 602); Процедуры: Сбор данных осуществлялся по трем направлениям: I. Лингвистический модус анализировался по вербальному контенту, собран- ному по хештегам #димонответит, содержащему оригинальный авторский контент и контент пользователей об активных акторах в рамках указанного семантического поля. Алгоритм анализа вербального контента, который был использован в иссле- довании, а также метод зерновой кластеризации описаны в [Pilgun, Gradoselskaya 2016], [Pilgun 2018]. II. Визуальный модус исследовался по данным статичных визуальных мате- риалов с помощью алгоритма SocialDataHub, который позволяет достигать точно- сти до 85 %. С помощью анализа визуального контента были идентифицированы реальные участники протестного митинга. III. Сетевой модус анализировался с помощью коммуникативных сетевых действий, алгоритм анализа которого описан в [Pilgun, Gradoselskaya 2016], [Pilgun 2018]. Собранные и очищенные данные были проанализированы с использованием контент-анализа в интерпретации [White, Marsh 2006;Krippendorff 2012]. Полученные данные обрабатывались с применением программного обеспече- ния Automap и Tableau. В частности, AutoMap как инструмент для интеллектуального анализа текста позволяет извлекать информацию с использованием методов сетевого анализа, поддерживает извлечение нескольких типов данных из неструктурированных до- Вопросы психолингвистики 2 (36) 2018 103 Пильгун М.А.Психолингвистический анализ медиаконтента... кументов. Типы информации, которые может быть извлечены, включают в себя: аналитические данные контента (слова и частоты), семантические сетевые данные (сеть понятий), данные о мета-сети (перекрестная классификация понятий с онто- логией), а также эксплицитные данные (отношения, убеждения). Tableau – многофункциональный ресурс, размещенный в облаке, который по- зволяет, в частности, делать визуальную аналитику, интерактивную визуализацию данных. Визуализация сетевых структур проводилась с помощью программного обе- спечения Gephi (алгоритм Force Atlas 2) [Bastian, Heymann, Jacomy 2009; Jacomy, Venturini, Heymann, Bastian 2014]. Анализ социальных сетей – сложный и разноплановый процесс. В современ- ной научной парадигме существует несколько подходов к анализу социальных се- тей, существует большое количество специальной литературы. Количество эта- пов в данной комплексной задаче зависит от многих факторов, в частности, от ко- личественных характеристик сети. Как правило, выделяют три уровня социальных сетей: - микроуровень, характеризующий взаимодействие акторов, а также микрогрупп; - мезоуровень, определяется коммуникацией групп, формированием сообществ. - макроуровень, представляет собой конгломерат крупных сообществ. Выявление искусственных сущностей в рамках данного исследования прово- дилось по технологии SocialDataHub, которая позволяет автоматически анализиро- вать профиль в социальной сети. Наиболее яркими маркерами являются следующие характеристики профиля: отсутствие друзей, отсутствие или незначительное коли- чество визуальных данных (фото без лица конкретного пользователя), отсутствие постов других пользователей со ссылками на актора, активность только в опреде- ленные периоды, соответствующие знаковым временным периодам, связанными с политическими событиями, а также вхождение в уже известные бот-сети. Результаты Анализ данных позволил выявить особенности акторов протестный коммуни- каций, создаваемого ими контента, языковой картины мира и коммуникативного поведения (Приложение 1; Рис.1, 2, 3, 4, 5, 6). Можно выделить три кластера участников в соответствии с их целевыми уста- новками: (в примерах сохраняются авторская орфография и пунктуация): 1) «Неофиты» – новички, молодые люди, которые впервые вышли с проте- стами на улицу: Например: Сегодня в первый раз я была на митинге. Я не могла точно сказать что там может быть, когда шла туда. Я предполагала, что наши доблестные полицаи могут задерживать людей, но это абсурд- задерживать без оснований! Было неприятно, но люди не расходились, а приходило все больше на- роду и это хорошо. Я рада, что людям не все равно. Да, мы не сможем свергнуть всю гнусную систему властей, но пусть они видят, что мы не согласны с тем, что можно забивать огромный болт на простых людей. Люди, выходите на улицы так, как это было сегодня, не оставайтесь равнодушными! Пусть все было не так идеально как хотелось бы в организационном плане, но дальше, я надеюсь, будет лучше. Огромное спасибо организаторам! (ВКонтакте). 104 Вопросы психолингвистики 2 (36) 2018 Теоретические и экспериментальные исследования 2) «Идейные борцы» – люди с опытом протестных движений, которые со- знательно выходят на митинги, чтобы выразить свою гражданскую позицию: Например: Для любителей теорий заговора, дворцовых переворотов и прочих: в на- шей стране достаточно рычагов, для выжигания коррупции, как таковой. Никто не требовал жечь покрышки! Мы за запуск машины правосудия, а не сжигание резины (ВКонтакте). 3) «Гедонисты» – люди, для которых митинг – тип тусовки, светского меро- приятия. Например: Я посетил мероприятие в СПб, относясь к этому исключи- тельно как к массовому гулянию. Как и планировал, я не скандировал лозунги и не торчал в толпе… (ВКонтакте). Информационные каналы: Распространение информации происходило Вконтакте и в мессенджерах (Telegram, WhatsApp ). Лингвистический модус протестного сетевого медиаконтента. Протестный контент отличается повышенным эмоциональным фоном, агре- сивность, конфликтогенностью, саркастической тональностью: Лингвистические особенности протестного медиаконтента формируются ре- чевыми средствами разных языковых уровней (лексического деривационного, син- таксического), а также стилистическими, риторическими, коммуникативными, гра- фическими средствами и эффектами интегрированного медиатекста: Лексические средства: 1. Почему школьники, вместо того, чтобы готовиться к ЕГЭ, за обычную ПРОГУЛКУ с УТКАМИ и КРОССОВКАМИ должны сидеть в кутузке, а их роди- тели должны трястись в страхе за их судьбу? Ведь я знаю, что будет дальше! Дальше их великолепные учителя в школе начнут их гнобить и создавать им про- блемы, а потом они с некой вероятностью не смогут никуда поступить, из-за грёбаной бумажки о том, что они были частью НЕСАНКЦИОНИРОВАННОГО МИТИНГА (ВКонтакте). 2. Пока Мистеръ-Твиттеръ сажаетъ мимозы и Обустраиваетъ домикъ для уточки. Вы скажете, молъ: «пренебречь, вальсируемъ! Экая невидаль – казно- крадъ-вельможа!» Мы его вовсе не димонизируемъ, Но нѣчто димоническое есть въ немъ всё же: Всегда элегантенъ, подтянутъ, скроменъ: Этакій Мефистовель у главнаго бѣса. Днемъ онъ трудяга въ Бѣломъ Домѣ, Ночью онъ – куртуазный повѣса (ВКонтакте). 3. …Ну дебилы бл... Вещие слова товарища Лаврова…(ВКонтакте). Деривационные средства: 1. Не верьте кремлеботам, которые утверждают, что оппозиционерам зав- тра в школу. Это наглая ложь, с 25 марта начались каникулы (ВКонтакте). 2. Даже самые ярые кремлевские защитники должны признать, что вся бли- стательность Путина заканчивается, когда начинается разговор про внутреннюю политику, а она действительно никакая, даже наверно никакущая… (ВКонтакте). 3. В Питере с Марсова поля несколько тысяч пошли на Дворцовую. Стоявшую на площади полицию пришедшие забросали дымовухами… (ВКонтакте). Cинтаксические средства (средства экспрессивного синтаксиса). |