1 заметка с тегом

#radio #analytic #mediascope #google

Веселая аналитика. Радиостанции

В рамках практики анализа открытых данных и просто практики анализа

Введение

Не так давно столкнулся с сервисом Google Trends https://trends.google.ru/trends/, и мне показалось интересным сделать небольшую статистику, используя данный сервис. Сразу стоит сказать, что результаты, показываемые Google Trends, скорее в «попугаях», чем в осмысленных величинах. Официальное определение выглядит так:
Динамика популярности
Числа обозначают уровень интереса к теме по отношению к наиболее высокому показателю в таблице для определенного региона и периода времени. 100 баллов означают наивысший уровень популярности запроса, 50 — уровень популярности запроса, вдвое меньший по сравнению с первым случаем. 0 баллов означает местоположение, по которому недостаточно данных о рассматриваемом запросе.
То есть некоторый индекс популярности поисковых запросов, будем полагать, что чем он выше тем лучше, по крайней мере, для того же запроса, по которому получены данные.
На повестке дня анализ открытых данных по радиостанциям:

  • данные по популярности поисковых запросов
  • данные полученные с сайта компании Mediascope https://mediascope.net/data/

Инструменты

  • pytrends — https://pypi.org/project/pytrends/1.1.3/ — для использования Google Trends API
  • plotly — для построения интерактивных графиков
  • pandas — для удобного оперирования данными

Данные

Google Trends

Чтобы скачивать данные из Google Trends, воспользуемся библиотекой pytrends — https://pypi.org/project/pytrends/1.1.3/.
Импортируем библиотеку, задаем зону поиска — Россия, в запроса передаем предварительно созданный список станций, задаем временной промежуток — today 5-y — за прошедшие 5 лет, запускаем и ждем, когда все будет готово.

from pytrends.request import TrendReq
pytrends = TrendReq(hl='ru-RU', tz=360)
trends_data = []
for s in station_list:
    s = s.lower()
    kw_list = [s]
    pytrends.build_payload(kw_list, cat=0, timeframe='today 5-y', geo='', gprop='')
    interest_over_time_df = pytrends.interest_over_time()[[s]]
    trends_data.append(interest_over_time_df)
    
google_trends = trends_data[0]
for i in range(1, len(trends_data)):
    google_trends = google_trends.merge(trends_data[i], left_index=True, right_index=True)

Несколько секунд ожидания и на выходе, таблица с результатами:

Данные Mediascope

Открытые данные по слушанию радиостанций предоставляются по нажатию кнопки на сайте и в виду их небольшого объема, я решил записать их вручную. Список станций, выбранный параметр Reach Daily и информация, собранная на просторах интернета, о медиахолдингах, к которым относятся радиостанции, жанре радиостанции по личным ощущениям автора=).

Анализ

Базовый анализ

Сначала пройдемся по простому, посмотрим сколько станций какого жанра, кол-во станций в холдингах и прочее. В данных присутствуют только те радиостанции, которые есть в выдаче Mediascope.
Кол-во станций — 45
Кол-во холдингов — 13 холдингов и 2 радиостанции в частном владении

Тут стоит немного сказать о жанрах, Популярная музыка — на этих станциях крутится и русская и зарубежная музыка, а в жанре Русская популярная музыка — только русская популярная музыка. Делаем вывод — либо поговорить, либо попса. Что-то более менее уникальное, так и остается уникальным даже в количественном отношении!

В топе по количеству станций:

  • ГПМ — Газпром медиа — 8 станций
  • ЕМГ — Европейская медиагруппа — 6 станций
  • Krutoy медиа — 5 станций
  • РМГ — Русская медиагруппа — 5 станций

Оценим жанровое разнообразие медиахолдингов. Посчитаем кол-во уникальных жанров для каждого холдинга и разделим на общее кол-во уникальных жанров.

Krutoy медиа — станций много, но все однотипны!

РМГ — станций меньше чем в ЕМГ, но разнообразнее!

Переходим к рейтингам радиостанций

Топ-3 по дневному охвату:

  • Авторадио
  • Европа+
  • Эхо Москвы

По суммарному рейтингу медиахолдингов лидеры следующие:

  • Газпром медиа
  • Европейская медиагруппа
  • Русская медиагруппа

Так как в холдингах разное кол-во станций, рассчитаем относительный показатель охвата, на одну станцию в холдинге.

Газпром медиа уступает вершину пирамиды Европейской медиа группе, так как эффективнее использует имеющийся ресурс. А Krutoy медиа опускается на дно нашего рейтинга — малоэффективны все его станции.

На очереди данные популярности в вебпоиске. Данных от Google Trens достаточно много, не все из них интересны. Посмотрим на забавные инсайты.

Первая неделя года — все ностальгируют!

Пики на графике Ретро ФМ приходятся аккурат на первую неделю каждого года, всем хочется тепла и уюта от старых добрых песен или этому способствует фестиваль «Легенды Ретро ФМ». Самый крутой график имеет Новое радио — рекламы видимо много🧐.

На графиках популярности Авторадио есть аналогичные пики, только они приходятся на последнюю неделю перед Новым годом. Вероятно этому способствует фестиваль «Дискотека 80-х», но он проходит в конце ноября. Какой-то замедленный эффект на вебпоиск имеют оба события🧐.

Интересности у есть у графика популярности Детского радио — провалы приходятся на середину июля, увеличение интереса происходит в начале осени, видимо Детское радио сильно привязано к учебному году.
Самый веселый инсайт случился с радио Романтика. Видите пик популярности в январе 2018 года🤓, и нет это не эффективные действия руководства, а в конце января вышел южнокорейский телесериал «Радио Романтика» и последняя серия вышла 20 марта, в этот период пик спадает. Такая оказия!

У двух рок🤘 станций наблюдается совместный спад популярности, не до рока сейчас!

Посмотрим на графики популярности радиостанций в вебпоиске по данным Google Trends

Не совсем похоже на то, что видели выше. Да и сравниваем тут не абсолюты, сей рейтинг говорит о том, что популярность Радио Шансон сейчас по отношению к некоторому максимуму для Радио Шансон выше чем у других станций по отношению к их собственному некоторому максимуму.

По холдингам различий практически нет! Перестановки только внизу списка.

И под конец вам скаттерплот «Reach Daily vs Popularity»

Комментариев не будет, сами ищите здесь связь, если хотите её найти😉

Для корректности

Ссылка на источник данных: Mediascope
Название исследования: Radio Index
Период исследования «август-октябрь 2019»
Регион исследования: «Москва»
Reach Daily (’000) — накопленное суточное количество слушателей радиостанции в тысячах человек.

 114   6 мес   #radio #analytic #mediascope #google