Сервіси на основі відкритих даних

Публічна карта моніторингу змін мобільності в Запоріжжі в період пандемії від Habidatum


Про проєкт

З метою підвищення інформованості та громадської участі в питаннях міського розвитку, а також поширення інструментів просторової аналітики, Habidatum у співпраці з містом Запоріжжя та за підтримки Міжнародної фінансової корпорації (IFC), члена Групи Світового банку, у партнерстві з урядами Швейцарії та Австрії публікує інтерактивну публічну карту з даними зі зміни мобільності населення Запоріжжя в період COVID-19.


https://zaporizhzhia.mobilitymonitor.habidatum.com/
 

Подібний моніторинг корисний як міській владі та керівникам бізнесів для прийняття управлінських рішень на основі аналізу даних і налаштування операційної діяльності організацій, так і городянам для моніторингу ситуації на рівні свого району або всього міста і, в тому числі, планування повсякденної активності, знаючи патерни, що склалися за аналізований період.

У період пандемії COVID-19, коли кардинально змінялися відносини городян з простором, це має найбільший запит — інструмент дозволяє подивитися на історичні дані про зміну в структурі мобільності людей. Звіти, підготовлені на основі інтерактивної карти й аналізу даних, можуть використовуватися для підготовки аналітики при прийнятті рішень про розвиток інфраструктури, своєчасність яких закладає основу для стійкого розвитку міста.


Про дані

Для даного проєкту використовуються GPS дані мобільних додатків, користувачі яких погодилися передавати інформацію про свою геолокацію. Дані збираються дата-брокерами за допомогою програмного забезпечення, яке є комбінацією GPS сигналів, підключень до Wi-Fi й стільникових сигналів, а потім в агрегованому вигляді передаються Habidatum.

GPS дані мають унікальний рівень деталізації в просторі (з точністю до геолокації) і безперервні в часі. Головною їх перевагою є глобальний характер, що дозволяє порівнювати міста і країни між собою.

При обробці GPS даних для Mobility Monitor враховуються всі необхідні стандарти конфіденційності. Для інтерактивної карти використовуються тільки агреговані дані, що гарантує дотримання анонімності — дані не можуть бути ідентифіковані, навіть при зіставленні з іншими наборами даних. Сервіс надає доступ до агрегованих даних, що забезпечує дотримання безпеки.


Дата-фіди

На інтерактивній карті представлені два різновиди даних. Перший — дані про мобільність — знаходиться у вкладці меню «мобільність», з вибором в підменю за датами:

Дані про мобільність в меню сервісу

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Мобільність в осередку зі стороною 800 метрів розраховується на основі кількості користувачів мобільних додатків з GPS активністю. Чим більша кількість користувачів в осередку, тим вище значення (100 — максимальне). Мобільність розраховується щодня й усереднюється за тиждень. Даний показник дозволяє досліджувати, як перерозподіляються потоки людей з березня по серпень 2020 року, дивитися, якого тижня (наприклад, відповідно до карантину) в певних локаціях міста було більше людей, якого — менше.

Другий тип даних — рівень центральності — знаходиться на перших трьох вкладках меню:

Рівень центральності

Рівень центральності — це оригінальний показник, розроблений Habidatum. Створюється на основі поєднання GPS даних про активність користувачів, а також щільності комерційних і соціальних функцій (магазини, кафе, поліклініки, школи, тощо — дані про них взяті з відкритих картографічних сервісів) і їх різноманіття (кількості унікальних функцій, тобто якщо в осередку знаходиться 5 кафе і 3 продуктових, то унікальних функції всього дві — кафе і продуктовий).

Чим менше ранг центральності, тим вище центральність (1 — найбільш центральні кластери, 5 — найменш центральні). Тобто 1 ранг — це локації, де найбільша активність в поєднанні з найбільшою щільністю і різномаїттям комерційних і соціальних об'єктів (кафе, аптеки, ресторани, магазини, поліклініки, тощо), 5 ранг — локації, де найменша активність і щільність (різноманітність) об'єктів.

Для розуміння змін в структурі центральності міста створено три зрізи — за лютий (до карантину), за квітень (розпал обмежувальних заходів) і за червень (ослаблення обмежувальних заходів).

Набори даних, які представлені на карті, можна завантажити у вигляді zip архіву, всередині якого кожен шар можна знайти в форматах *.geojson або *.csv.

1. Дані про мобільність (кількість користувачів в комірці) знаходяться в файлі rank_layer.csv (табличний формат) і rank_layer.geojson (геопросторовий формат).

У цих файлах міститься інформація про ранг осередку від 0 до 100 за кожен тиждень. Колонка node_id — ідентифікаційний номер комірки. Також у файлі є колонки lat та lon з географічними координатами центру кожного осередку, далі 25 колонок з датами початку тижня, по якому надається інформація, у форматі 2020-03-02. У кожній з цих колонок буде число — ранг активності осередку від 0 до 100, де 100 — найактивніший осередок за цей тиждень, 0 — найбільш неактивний. Колонка geometry — географічний опис кожного осередку з даними.

2. Дані про центральність за різні місяці (лютий, квітень і червень) знаходяться в окремій папці «centralities» в трьох файлах відповідно: centralities_february.geojson, centralities_april.geojson, centralities_june.geojson.

У файлі міститься інформація про id кластера центральності (колонка geoid), сам рівень центральності від 1 до 5 (self_centrality_level), де 1 — найбільш центральний кластер, 5 — найменш центральний кластер. Колонка geometry — географічний опис кожного кластера.

Як користуватися картою

Крім перемикачів шарів даних, представлених вище, у кожного з шарів є легенда.

Для шару мобільності — це розподіл від світлого до темного і відповідно від 0 до 100.

Чим світліше відтінок легенди та менше значення, тим менше мобільність (менше користувачів) в конкретній ділянці міста, і навпаки, чим темніше легенда і більше значення, тим вище мобільність (більше користувачів).

Для шарів центральності представлена шкала, де темний колір — найвищий ранг центральності (1), а світлий — найнижчий (5).

Всі набори даних можна завантажити, натиснувши кнопку «Завантажити датасети» під описом шару.


Шар «Мобільність»

Нагадаємо, що мобільність в осередку зі стороною 800 метрів розраховується на основі кількості користувачів мобільних додатків, що використовують в роботі сигнали GPS. Чим більше кількість користувачів в осередку, тим вище значення (0 — мінімальне, 100 — максимальне). Мобільність розраховується за кожен день і усереднюється за тиждень. Даний показник дозволяє досліджувати, як змінювалася активність людей з березня по серпень 2020 року, дивитися, в який тиждень карантину в певних локаціях міста було більше людей, в яких — менше.

Значення показника — це не пряма кількість осіб, а відносний показник, що описує рівень активності в осередку за тиждень в порівнянні з рівнем активності в кожній іншій клітинці в місті в цей тиждень.

 

Як користуватися картою з практичною користю

Наведемо приклад використання інтерактивної карти для аналізу мобільності населення в період COVID-19 березня-травня 2020 в Запоріжжі.

За допомогою додаткового меню можна перемикатися між різними датами, кожна з яких позначає початок тижня, за який показуються дані:

 

Можна перемикати дати один за одним, але так досить складно помітити зміни. Значні зміни в рівні активності городян найбільш помітні, якщо порівняти різні місяці. Наприклад, можна порівняти три дати: 2 березня (2020-03-02), 27 квітня (2020-04-27) і 25 травня (2020-05-25). Перемикаючись між цими датами, можна побачити, що 27 квітня мобільність в середньому по місту впала, особливо за межами центру. Однак до 25 травня активність відновилася на рівні початку березня.
 

2020-03-02 2020-04-27 2020-05-25

 

Можна також наблизити карту і подивитися на зміни в конкретних локаціях в місті. Погляньмо на центр міста. 2 березня можна побачити темні комірки (максимальний рівень активності) по всьому центру — це означає високий рівень активності в багатьох локаціях:

27 квітня парк Трудової слави, залишається однією з найактивніших в місті, а навколишні локації втрачають в активності:

25 травня все повертається до показників березня:


 

Як користуватися даними з практичною користю

Всі дані з інтерактивної карти можна завантажити, натиснувши на кнопку «Завантажити датасети» під описом шару. У завантаженому архіві ви знайдете дані про мобільність (кількість користувачів в комірці) в файлі rank_layer.csv (табличний формат) і rank_layer.geojson (геопросторовий формат).

У кожному з цих файлів міститься інформація про ранг від 0 до 100 одиниць за кожний тиждень. Колонка node_id — ідентифікаційний номер комірки. Також у файлі є колонки lat та lon з географічними координатами центру кожного осередку, далі 25 колонок з датами початку тижня, за який надається інформація, у форматі 2020-03-02. У кожній з цих колонок буде число — ранг активності осередку від 0 до 100, де 100 — найактивніший осередок за цей тиждень, 0 — найнеактивний. Колонка geometry — географічний опис кожного осередку з даними.

Для прикладу візьмемо геоприв'язаний файл rank_layer.geojson і візуалізуємо його в https://kepler.gl/demo.

Для цього треба просто перетягнути на сторінку наш файл, або відкрити його через меню. Для початку потрібно буде видалити точковий шар (Point). Після цього можна обрати колір палітри в налаштуваннях шару (layer settings — стрілка вниз праворуч від шару). Вибираємо Fill color (натискаємо на три точки праворуч від цього напису) -> Color based on -> і беремо будь-яку колонку з датою, наприклад, 2020-03-02, тобто 2 березня. Також можна вибрати будь-яку іншу дату, як і на нашій інтерактивній карті.

Для зручності сприйняття налаштуємо фон так (карту місцевості на тлі), щоб він був світлим. Для цього в панелі інструментів зверху, під написом kepler.gl натиснемо найправіший значок із зображенням перемикачів і виберемо Light.

Після цих дій ми отримаємо ось таку карту (ви можете вибрати і інші кольори):

Щоб відразу подивитися, які значення в осередків були у різні періоди часу, нам необхідно налаштувати поля, які будуть виводитися при наведенні мишки на осередок. Для цього на панелі інструментів у верхній частині екрану потрібно вибрати значок мишки з кружечком:

І там додати всі поля (колонки) з датами. Тоді при наведенні на осередок, можна буде побачити, як змінювалося значення активності в осередку від тижня до тижня. Виглядає це ось так:

Таким чином можна дивитися, як поводилася та чи інша локація в місті протягом періоду з березня по червень.

Для більш просунутих користувачів — можна трохи видозмінити таблицю, наприклад, за допомогою Python, і тоді ви зможете закинувши в kepler.gl використовувати функцію фільтра за часом і зробити анімацію змін.

Також, датасети можна перетинати з іншими шарами в QGIS, Python, javascript і будь-якими іншими доступними способами, наприклад, вивчивши залежність характеру забудови й активності, щільності точок тяжіння і активності і будь-які інші види досліджень.


Шари «Кластери центральності»

Рівень центральності (за кластерами) — це оригінальний показник, розроблений компанією Habidatum https://habidatum.com/. Створюється на основі поєднання GPS даних про активність користувачів, а також щільність комерційних і соціальних функцій (магазини, кафе, поліклініки, школи, тощо — дані про них взяті з відкритих картографічних сервісів) і їх різноманіття (кількості унікальних функцій, тобто якщо в осередку знаходиться 5 кафе і 3 продуктових магазини, то унікальних функцій всього дві — кафе і продуктовий).

Чим менше ранг центральності, тим вище центральність (1 — найбільш центральні кластери, 5 — найменш центральні). Тобто 1 ранг — це локації, де найбільше активності в поєднанні з найбільшою щільністю і різноманітністю комерційних і соціальних об'єктів (кафе, аптеки, ресторани, магазини, поліклініки та інші), 5 ранг — локації, де найменше активності і щільності-різноманітності об'єктів.

Для розуміння змін в структурі центрального міста, створено три зрізи — за лютий (до карантину), за квітень (розпал обмежувальних заходів) і за червень (ослаблення обмежувальних заходів).

 

Як користуватися картою з практичною користю

Наведемо приклад використання шару «Кластерів центральності» інтерактивної карти для аналізу найбільш популярних локацій в Запоріжжі на основі поєднання активності людей, щільності та різноманітності точок товарів і послуг.

За допомогою головного меню можна перемикатися між різними періодами підрахованих центральностей, у кожної з трьох вкладок меню є закінчення з назвою місяця:

Подивимося на три доступних зрізи кластерів центральності — лютий, квітень, червень:

Кластери центральності у лютому

Кластери центральності у квітні

Кластери центральності у червні

Найтемніші кластери центральності на карті — кластери першого рангу — найбільш активні протягом місяця за всіма параметрами локації. Ми можемо побачити, що за всі три зрізи часу один із кластерів центральності 1-го рангу незмінно знаходиться в районі Верхньої вулиці — вулиці Лобановського.

Якщо порівняти три зрізи часу в різних частинах міста, можна бачити різні зміни. Для більш детального вивчення можна наблизити карту і подивитися на зміни в конкретних локаціях в місті.

Розглянемо 2 кластери центральності 1-го рангу в лютому в центрі міста з умовним центром в районі площі Маяковського. У квітні він стає кластером 2 рангу, а в червні знову стає кластером 1 рангу (повертається активність):

Район пл. Маяковського — лютий Район пл. Маяковського — квітень Район пл. Маяковського — червень

Другий приклад — кластер між парком Перемоги (р. Суха Московка) і Студентським парком. У лютому в цьому районі був кластер центральності 1-го рангу, у квітні на його місці з'явився кластер 2-го рангу, тобто ранг знизився, і в червні залишився кластер 2-го рангу. При цьому, ми бачимо, що форма кластерів завжди різна, що говорить про різну активності людей від місяця до місяця:

Район парку Студентський — лютий Район парку Студентський — квітень Район парку Студентський — червень


Ці зміни можуть бути пов'язані з різними параметрами середовища навколо, обмежувальними заходами в пандемію й іншими факторами, кореляції з якими ми пропонуємо вам пошукати.

 

Як користуватися даними з практичною користю

Всі дані з інтерактивної карти можна завантажити, натиснувши на кнопку «Завантажити датасети» під описом шару. У завантаженому архіві ви знайдете дані про кластери центральності за різні місяці (лютий, квітень і червень) в окремій папці «centralities» в трьох файлах відповідно: centralities_february.geojson, centralities_april.geojson, centralities_june.geojson.

В кожному файлі міститься інформація про id кластера центральності (колонка geoid), сам рівень центральності від 1 до 5 (self_centrality_level), де 1 — найбільш центральний кластер, 5 — найменш центральний кластер. Колонка geometry — географічний опис кожного кластера.

Для прикладу візьмемо геопросторовий файл centralities_february.geojson та візуалізуємо його в https://kepler.gl/demo.

Для цього треба просто перетягнути на сторінку https://kepler.gl/demo наш файл, або відкрити його через меню. Для початку можна обрати колір палітри в налаштуваннях шару (layer settings — стрілка вниз праворуч від шару). Вибираємо Fill color -> Color based on -> і беремо будь-яку колонку self_centrality_level, яка позначає ранг центральності кластера.

Для зручності сприйняття налаштуємо підкладку (карту місцевості на тлі), щоб вона була світлою. Для цього в панелі інструментів зверху, під написом kepler.gl натиснемо найправіший значок із зображенням перемикачів і виберемо Light.

Після цих дій ми отримаємо, ось таку карту (ви можете вибрати й інші кольори):

Перевагою kepler.gl конкретно для цих шарів даних є можливість завантажувати додаткові шари даних і дивитися, в яких кластерах виявляються ті чи інші об'єкти.

Для більш просунутих користувачів — датасети можна перетинати з іншими верствами даних в QGIS, Python, javascript і будь-якими іншими доступними способами, наприклад, вивчивши залежність характеру забудови і кластерів різного рангу, щільності точок тяжіння, і будь-які інші види досліджень.