Оценка бедности, богатства по метаданным сотового телефона

Но вышки сотовой связи легче установить, чем наземные телефонные линии, даже в таких неблагополучных районах, а мобильные или сотовые телефоны широко используются как бедными, так и богатыми.Теперь исследователи из Информационной школы Вашингтонского университета и Департамента компьютерных наук и инженерии разработали способ оценки распределения богатства и бедности в районе, изучая метаданные из звонков и текстов, сделанных на сотовых телефонах.

Такие метаданные содержат информацию о времени, месте и характере «событий мобильного телефона», но не их содержание. Их статья была опубликована 27 ноября в журнале Science.«Количественные и точные измерения являются ключом к принятию важных решений о распределении социальных пособий и гуманитарной помощи», — сказал ведущий автор Джошуа Блуменсток, доцент Информационной школы Университета штата Вашингтон, который также является адъюнкт-профессором в области компьютерных наук и инженерии. "Но во многих развивающихся странах нет высококачественных данных.

«В этой статье мы показываем, и я думаю, довольно ясно, что телефонные данные можно использовать для оценки благосостояния и бедности».Исследование проводилось в Руанде, стране с населением 11 миллионов человек в Восточной Африке. Там в 2009 году, еще работая над своей диссертацией, Блюменсток руководил студентами Кигалийского института науки и технологий, когда они проводили телефонные интервью с 1000 владельцев мобильных телефонов, выбранных наугад.

Вопросы были разработаны, чтобы узнать, на каком этапе социально-экономической лестницы находятся эти люди и какова «подпись» богатства в метаданных, то есть какие привычки к сотовому телефону характерны для тех, кто относительно богат.«Для этой тысячи людей мы приблизительно знаем, богатые они или бедные. Это основная истина, которая привязывает данные к реальности», — сказал Блюменсток.Затем исследователи связали эту информацию с метаданными об использовании мобильных телефонов, предоставленными руандийской телефонной компанией, чтобы определить признаки социально-экономического статуса в данных.

Возникли простые закономерности — например, более богатые люди, как правило, звонят чаще, чем более бедные. Но это лишь одна из тысяч бит информации, которая помогает этому процессу.

Другие намеки на богатство или бедность в метаданных:Способ предоплаты телефонного времени; Те, кто покупает время на 10 долларов, как правило, богаче, чем те, кто покупает время на 50 центов.Ежедневный ритм звонков — те, кто звонит в дневное рабочее время, систематически отличается от тех, кто звонит нерегулярно, возможно, потому, что они с большей вероятностью будут «белыми воротничками».

Степень вероятности того, что человек будет звонить по телефону, а не принимать его. Поскольку в Руанде звонящий платит за звонок, более бедные люди, как правило, получают больше звонков, чем делают. Это также отражает явление, называемое «миганием», когда более бедный человек звонит более богатому другу и быстро кладет трубку, тем самым посылая сигнал, что ему следует перезвонить.

«На практике это непросто», — сказал Блюменсток. «Мы используем алгоритмы контролируемого машинного обучения, чтобы отсортировать тысячи шаблонов, чтобы выяснить, что больше всего коррелирует с богатством и бедностью. Но как только мы узнаем, какие модели мобильных телефонов указывают на богатство, мы можем экстраполировать на полторы миллиона ячеек страны. телефонных пользователей.

После этого мы просто видим для каждого человека, какому образцу они следуют — богатому или плохому ».Соавтор Blumenstock UW, Габриэль Кадамуро, аспирант в области компьютерных наук и инженерии, сказал, что команда пыталась не оправдать ожиданий относительно того, какие аспекты метаданных могут оказаться полезными для прогнозирования благосостояния.«Использование соответствующей техники машинного обучения позволило нам определить, какие из этих значений были наиболее полезными, — сказал Кадамуро, — и мы заметили, что, делая это таким образом, мы многое упустили, если бы попытались пойти чисто через нашу интуицию ".Затем эта информация накладывается на карты местности, чтобы создать визуальное представление о географическом распределении благосостояния от уровня района до уровня домохозяйств или микропоселений.

Блюменсток подчеркнул, что исследование проводится с учетом этических стандартов и конфиденциальности звонящих, а также конкурентных интересов телефонной компании, предоставляющей данные.Не все правительства могут проводить переписи населения и обследования домашних хозяйств, а у некоторых между ними идут десятилетия. В Руанде обследования домашних хозяйств проводятся каждые три-пять лет.

Блюменсток сказал, что, основываясь на правительственном опросе 2010 года, метаданные мобильных телефонов 2009 года оказались более эффективными для определения богатства и бедности, чем предыдущий опрос правительства Руанды в 2007 году.Блюменсток и его коллеги предполагают, что правительства могут использовать такого рода процесс обследования, который стоит около 10 000 долларов, вместо того, чтобы тратить миллионы на официальную общенациональную перепись.«Мы говорим, что если у вас нет ничего другого и вы не можете обследовать отдаленные регионы страны, это дает возможность потратить 10 000 долларов и получить промежуточные оценки того, как все выглядит, и построить оценку географического положения с более высоким разрешением. распределение богатства ", — сказал он.

По словам Блюменстока, эта ранняя работа в основном является «доказательством концепции» на данном этапе, но исследователи могут предвидеть множество практических применений в будущем.Кадамуро сказал: «Мы надеемся, что этот широкий подход к обнаружению сигналов означает, что методология будет работать даже в разных сетях вызова из разных стран»."Что еще вы могли бы измерить, что было бы полезно?" — спросил Блюменшток. «Вы можете представить себе использование данных Twitter, использования Интернета, спутниковых и метеостанций — всех этих данных — для измерения уязвимости населения или разработки более эффективной политики», — сказал он.

«Возможно, вы даже сможете определить с помощью телефонных данных, пропускают ли люди приемы пищи — мне это не кажется таким уж надуманным».