Анализ настроений в социальных сетях (social media sentiment analysis) становится одним из актуальнейших методов исследований, позволяющих понять отношение людей к теме, предмету, событию или процессу. В ближайшие месяцы Европейская обсерватория журналистики (EJO) опубликует ряд статей, посвященных этому методу.
В первой статье данного цикла рассмотрим основные риски и возможности, связанные с анализом содержания данных в социальных сетях. В основе статьи лежат идеи и выводы профессора маркетинга Энны Вееки (Ann Veeck).
По мнению профессора Вееки, практика анализа данных в социальных сетях во многих отношениях перекликается с методом традиционного качественного анализа: выявление ключевых тем, кодирование в соответствии с темами (либо вручную, либо посредством специальных программ), сравнение и интегрирование данных и т.д. Многие из основных этапов, используемых в контент-анализе текстов, полученных посредством интервью или опросов в фокус-группах, могут быть легко адаптированы для анализа информации, в том числе и для анализа настроений, в социальных сетях. С другой стороны, анализ данных в социальных сетях требует специализированного подхода.
Во-первых, социальные сети предлагают изобилие информации. Данные, полученные методом традиционных интервью или фокус-групп, напротив, в большой степени уже сфокусированы, сконцентрированы и контекстуализированы в соответствии с заданной темой. Анализ содержания социальных сетей, в свою очередь, требует четких ограничений согласно темам или периодам времени.
Во-вторых, содержание комментариев в социальных сетях ничем не ограничено. Участники фокус-групп или интервьюируемые отвечают или реагируют на конкретные, четко сформулированные вопросы исследователей. Пользователи же социальных сетей пишут все, что им приходит в голову. Это также означает, что проблемы и цели исследования могут потребовать радикального пересмотра в ходе анализа комментариев и других данных в социальных сетях.
В-третьих, в социальных сетях гораздо больше «шума», пустых комментариев, не говоря уже о неконтекстуализированных непристойностях, грубостях, личных нападках и т.д. Поскольку огромное количество данных в социальных сетях никак не управляется и не регулируется модератором дискуссии или исследователем, многие комментарии, если не большинство, будут бесполезны для анализа.
В-четвертых, данные в интернете представляют из себя многообразие форм и форматов. Помимо текста, они могут быть выражены в форме видео, аудио, фотографий, иллюстраций, слайд-шоу и т.д. К тому же комментарии могут быть написаны на разных языках, включая те, которыми исследователь не владеет, или используя сленг, непонятный для исследователя. Все это как усложняет, так и невероятно обогащает исследование.
И последнее. В социальных сетях присутствует недостаток контекста. Традиционные качественные методы исследования позволяют достаточно точно идентифицировать важные показатели, например, ключевые демографические и социальные данные об участниках опросов и интервью, такие как пол, возраст, место жительства, доход и т.д. Гораздо сложнее извлечь достоверную информацию из социальных сетей. Даже если соответствующие данные добывать путем просмотра профилей пользователей, нет никаких гарантий и уверенности в том, что все профили являются подлинными, а представленная на них информация – невыдуманной.
В основе данной статьи лежат материалы, опубликованные здесь
Фотография: luckey_sun / Flickr CC: big-data_conew1 (License terms: https://creativecommons.org/licenses/by-sa/2.0/)
Теги:анализ настроений в социальных сетях, интервью, исследования, комментарии, контент-анализ, новые медиа, профили пользователей, СМИ, фокус-группы