June 11, 2017

Data Dive - 3

Продолжение истории про Дата Дайв, начало здесь и здесь.

Наша следующая задача была уменьшить количество имеющихся у нас задач до обозримого объема. Количество задач нужно уменьшать, потому что, если задач будет слишком много, может так случиться, что волонтеры распределятся на слишком маленькие группы, и в результате ничего не удастся закончить. Дата Кайнд хотел, чтобы у нас было три задачи. Наш следующий звонок с представителями Хабитата состоял из разговора: «Представьте, что вам нужно упорядочить имеющиеся задачи по важности: какие три попадут в верх этого списка?» В результате, наши две самые главные задачи определились довольно быстро: это была карта, демонстрирующая в каких регионах жертвуют деньги на благотворительность и в каких работает Хабитат, и кластеры регионов, которые помогли бы обнаружить в каких регионах необходима помощь филиала Хабитата. Две задачи сразу были отсеяны как менее интересные – это были модель предсказывающая, вероятность того, что будет выплачена ипотека, и опросник для будущих владельцев домов. Когда же мы предложили представителям Хабитата выбрать из оставшихся двух задач, они сказали: «А обязательно нужно выбирать?», мы посоветовались с Дата Каинд и решили, что мы можем оставить в списке все четыре задачи. Таким образом, в наш список попало исследование социальных сетей и того, насколько успешно филиалы Хабитата их используют, и исследование параметров отдельных филиалов, чтобы выделить характеристики, говорящие о том, что филиал ведет успешную работу.

Сам Дата Дайв длился три дня – пятницу, субботу и воскресенье. В пятницу мы должны были сделать презентацию нашего проекта для всех пришедших волонтеров. Всего вместе с Хабитатом участвовали четыре организации. Остальные три организации были такие. Одна организация была местная – она помогала найти работу тем, у кого не получалось ее просто так найти. У них был очень интересный параметр, который они оценивали про участников своей программы, они его называли «готовность к работе» (job readiness). Готовность к работе оценивалась по тому, смог ли человек посетить все занятия бесплатного недельного семинара о том, как нужно искать работу. Как выяснили волонтеры в течение Дата Дайва этот параметр действительно очень хорошо предсказывал, сможет ли участник впоследствии найти работу.

Другая организация была расположена в Сан-Франциско и изучала, как рекламируются сигареты, и боролась с магазинами, которые рекламировали сигареты способами, запрещенными законодательно. Они использовали тоже очень необычные данные – эти данные собирают волонтеры, называемые community scientist. Чтобы стать таким волонтером, нужно скачать специальную программу на телефон, отправиться с ней в магазин, и пока ты там, заполнить опросник о том, что ты видишь – где находятся стенды с сигаретами, где и на каком уровне расположена реклама, есть ли реклама сигарет со вкусовыми добавками, на которой сигареты похожи на конфеты, и т.п.

Последняя организация называлась Anti-Defamation League. Эта организация анализирует общедоступные материалы, такие как публикации в газетах и отчеты о судебных процессах, чтобы находить случаи преступлений, совершенных на почве ненависти к той или иной социальной группе (hate crime) и специализируется на борьбе с такими случаями и в первую очередь с проявлениями антисемитизма. Волонтеры, работавшие с этой организацией, планировали создать программу, которая будет собирать статьи, опубликованные в разных печатных изданиях, и анализировать вероятность того, что в конкретной статье речь идет об преступлениях на почве ненависти, и неожиданно в середине своей работы обнаружили, что такая программа уже существует. Некоторые из них были таким результатом разочарованы.

Продолжение следует.