IT
April 5, 2022

Частная инвестиционная фирма покупает компании, которые собирают данные об американских детях

Vista Equity Partners скупает программное обеспечение, используемое в школах. Родители хотят знать, что компании делают с данными детей.

Disclaimer: этот пост – перевод статьи Todd Feathers с сайта The Markup.

За последние шесть лет малоизвестная частная инвестиционная фирма Vista Equity Partners создала империю образовательного программного обеспечения, которая оказывает невидимое влияние на образовательный процесс десятков миллионов детей. Попутно, как выяснил The Markup, компании, контролируемые фирмой, собрали огромное количество очень личных данных о детях, используемых для создания набора продуктов для прогнозной аналитики, которые расширяют границы роли технологий в образовании и, в некоторых случаях, вызывают проблемы дискриминации.

В одном округе, который мы исследовали, используются алгоритмы оценки рисков от входящей в группу компании PowerSchool, которые включают показатели семейного благосостояния для прогнозирования будущего успеха учащегося – спорная практика, о которой родители не знают, что вызывает тревожные вопросы.

“Я даже не подозревал, что в этом пространстве есть кто-то, кто все еще делает это [использует бесплатный и льготный статус школьного обеда] в модели, используемой для реальных детей”, – сказал Райан Бейкер, директор Центра аналитики обучения Пенсильванского университета. “Я удивлен и действительно потрясен”.

Vista Equity Partners, которая отказалась комментировать эту историю, приобрела контрольные пакеты акций некоторых ведущих компаний в области образовательных технологий, включая EAB, которая продает набор продуктов для консультирования и подбора персонала в колледжах, и PowerSchool, которая доминирует на рынке хранилищ данных и аналитики K-12. Только PowerSchool утверждает, что хранит данные о более чем 45 миллионах детей, из которых 75 процентов – это североамериканские учащиеся K-12. Ellucian, недавнее приобретение Vista, говорит, что они обслуживают 26 миллионов студентов. А продукты EAB используются тысячами колледжей и университетов. Но родители этих студентов говорят, что они в значительной степени остались в неведении относительно того, какие данные собирают компании и как они их используют.

“Мы платим этим поставщикам, и они зарабатывают деньги на данных наших детей”, – сказала Эллен Завиан, чей сын должен был использовать Naviance, программное обеспечение для подготовки к колледжу, недавно приобретенное PowerSchool, в средней школе Монтгомери Блэр в Сильвер-Спринг, штат Мэриленд.

После того, как ее сына стали беспокоить вопросы, на которые его просили ответить в ходе опросов, проводимых Naviance, Завиан и другие члены местной группы по защите конфиденциальности студентов запросили доступ в 2019 году к данным, которые компания хранит об их детях из округа в соответствии с Федеральным законом об образовательных правах и конфиденциальности (FERPA). Но на сегодняшний день она получила только имена пользователей и пароли.

“Родители очень мало знают об этом процессе”, – сказала она.

Образовательно-технологические компании в портфолио Vista, по-видимому, работают в основном независимо, но они заключили ряд партнерских отношений, которые углубляют связи совместного владения. Например, PowerSchool и EAB заключили партнерство по интеграции данных, направленное на “предоставление решений для перемещения данных, которые повышают ценность и экономят время для округов”. В прошлом году две компании также заключили ещё одну сделку, которая сделала EAB эксклюзивным реселлером некоторых продуктов PowerSchool.

EAB не ответила на запросы о комментариях.

Чтобы собрать воедино объем сбора данных компаниями, The Markup проанализировали тысячи страниц контрактов, руководств пользователей, соглашений об обмене данными и вопросов опроса, полученных с помощью запросов на публичные записи.

Мы обнаружили, что компании в совокупности собирают все: от базовой демографической информации, вводимой автоматически при поступлении учащегося в школу, до данных о гражданском статусе учащихся, религиозной принадлежности, школьных дисциплинарных протоколах, медицинских диагнозах, скорости чтения и набора текста, полного текста ответов, которые они дают на тестах, рисунках, которые они рисуют для заданий, живут ли они в семье с двумя родителями, употребляли ли они наркотики, были ли они жертвами преступления или проявляли интерес к группам ЛГБТК+, среди сотен других данных. Каждая компания, принадлежащая Vista, не обязательно имеет все перечисленные здесь данные.

Некоторые из этих данных были замечены в трафике между компьютерами учащихся и серверами PowerSchool, когда учащиеся использовали свои учетные записи. The Markup проверили учетные записи с разрешения студентов. Другие поля данных были перечислены в соглашениях о конфиденциальности данных округов с PowerSchool и библиотекой данных — списком всех доступных полей данных — для базы данных PowerSchool одного округа. Наш обзор дает более подробную картину операций с данными компании, чем публично раскрывает PowerSchool, но, скорее всего, даже это неполная информация.

Согласно своим контрактам со школьными округами, PowerSchool имеет право деидентифицировать данные, которые она хранит от их имени, путем удаления таких полей, как имена и номера социального страхования, и использовать их любым способом, который она считает нужным, для улучшения и создания своих собственных продуктов.

В некоторых округах, таких как государственные школы округа Майами-Дейд, недавние контракты с PowerSchool превысили 2,5 миллиона долларов за один год, согласно копиям сделок, полученных с помощью запросов на публичные записи.

“Мне трудно понять, как PowerSchool не будет платить за привилегию получения такого большого количества данных о учащихся”, – сказал Алекс Бауэрс, профессор педагогического лидерства в Педагогическом колледже Колумбийского университета – “Вы же не платите нефтяной компании за то, чтобы она откачивала нефть с вашей земли, все наоборот”.

PowerSchool отказалась отвечать на конкретные вопросы о данных, которые она собирает, и о том, как она использует эту информацию.

“В PowerSchool обеспечение равенства учащихся, конфиденциальности и доступа к качественному образованию является нашим главным приоритетом и лежит в основе всего, что мы делаем”, – написал Даррон Флэгг, главный специалист по соблюдению требований и конфиденциальности компании, в кратком заявлении для The Markup. “PowerSchool строго и активно следует правовым, нормативным и добровольным требованиям по защите частной жизни учащихся, включая Закон о правах семьи на образование и неприкосновенность частной жизни (FERPA), государственные нормативные акты и Обязательство о конфиденциальности учащихся. Клиенты PowerSchool владеют данными своих учеников и школ. Мы не продаем данные учащихся или школ; мы не собираем, не храним, не используем и не передаем личную информацию учащихся сверх того, что разрешено округом, родителями или учащимися.”

Поучительная история: Элгин, Иллинойс

Многие из новых продуктовых линеек PowerSchool, включая инструменты прогностической аналитики и платформу персонализированного обучения, требуют большого количества данных о студентах для обучения базовым алгоритмам. Но эксперты, изучившие результаты исследования, заявили, что некоторые данные, используемые для этих целей, неизбежно приведут к дискриминационным результатам.

Рассмотрим школьный округ U-46 в Элгине, штат Иллинойс, который был единственным округом — из 27, в которые мы отправили запросы на публичные записи, — предоставившим полный список хранилищ данных PowerSchool от своего имени. Округ также предоставил документы, в которых подробно описывается, как алгоритмы прогностической аналитики PowerSchool используют некоторые из этих данных, чтобы повлиять на образовательные поездки учащихся.

База данных PowerSchool U-46 содержит почти 7000 полей данных об учениках, родителях и сотрудниках, согласно копии базы данных, полученной The Markup.

Уже в первом классе алгоритмы из линейки продуктов Unified Insights компании начинают генерировать прогнозы о том, подвержены ли учащиеся низкому, умеренному или высокому риску не закончить среднюю школу вовремя, не соответствовать определенным стандартам в SATS или не закончить два года обучения в колледже, среди прочих результатов. Документы округа описывают десятки различных моделей прогнозирования, доступных через PowerSchool, хотя U-46 говорит, что не использует большинство из них.

По словам Мэтта Раймонди, координатора Элгина по оценке и подотчетности, округ начинает показывать учителям и администраторам оценки риска своевременного окончания учебы, начиная с седьмого класса.

Согласно документам, статус бесплатного и льготного обеда — показатель семейного благосостояния — и пол студента являются одними из наиболее важных факторов, определяющих этот показатель риска. В какой-то момент модели для Элгина, разработанные компанией Hoonuit, которая была приобретена PowerSchool в 2020 году и переименована в Unified Insights, также включали расу студентов в качестве переменной, имеющей большое значение.

Флэгг из PowerSchool сказал, что раса была удалена из моделей в 2017 году, ещё до того, как компания приобрела Hoonuit.

Прогнозные модели также опираются на такие данные, как посещаемость, дисциплинарная история и результаты тестов.

Эксперты по аналитике обучения сообщили The Markup, что использование демографических данных, таких как пол, статус бесплатного и льготного обеда — атрибутов, которые учащиеся и школьные чиновники не могут изменить, — для прогнозирования результатов учащихся неизбежно приведет к кодированию дискриминации в прогнозных моделях.

“Я думаю, что наличие [статуса бесплатного и льготного обеда] в качестве фактора предсказания в модели неоправданно в 2021 году”, – сказал Бейкер из Центра аналитики обучения Пенсильванского университета. Бейкер проконсультировался с BrightBytes, конкурентом PowerSchool в области прогнозной аналитики K-12.

“Unified Insights предоставляет школьным округам возможность включать статус бесплатного и льготного обеда, чтобы округи могли снизить риск отсева, связанный с экономическими трудностями, и определить дополнительные социальные услуги, которые могут быть доступны пострадавшим учащимся”, – написал Флэгг из PowerSchool в электронном письме.

“Включение этих вещей, которые не находятся под контролем семьи или школы, крайне проблематично”, – сказал Бауэрс из Педагогического колледжа Колумбийского университета, потому что даже школа с наилучшими намерениями не может изменить все системные гендерные и имущественные различия, которые влияют на конкретного ученика. Таким образом, основывая оценки риска в значительной степени на этих факторах, он скрывает влияние других факторов, на которые может повлиять школа, сказал он.

Раймонди сказал, что U-46 решил не использовать многие прогностические модели, которые предоставляет PowerSchool, из-за их зависимости от неизменных характеристик учащихся.

“Особенно в начальных классах, мы даже не делаем это видимым для пользователей, кроме меня и программиста”, – сказал он. “Модели на более низких уровнях не настолько точны и в гораздо большей степени опираются на данные демографического типа”.

Каждый год модель риска отсева в Элгине пропускает около 90 учащихся на каждом уровне из 3000 учащихся в каждом классе, которые не заканчивают школу вовремя, согласно презентации, подготовленной специалистом по данным PowerSchool и полученной The Markup.

“У нас нет комментариев по поводу чувствительности/специфичности моделей”, – написала представитель U-46 Карла Хименес по электронной почте.

The Markup ранее сообщали об аналогичном инструменте прогнозирования отсева, который EAB продает колледжам и университетам. Некоторые из этих школ включали расу в качестве “предсказателя успеха с высокой отдачей”, и их алгоритмы помечали чернокожих учащихся как “подверженных высокому риску” в четыре раза чаще, чем их белых сверстников, эффективно отводя цветных учащихся от определенных специальностей. После нашего отчета Техасский университет A&M отказался от использования расы в качестве прогнозной переменной.

Империя данных растет

Vista Equity Partners уже много лет расширяет свое присутствие в индустрии образовательного программного обеспечения. В ходе этого расширения была создана группа компаний, которые собирают данные и эффективно отслеживают детей на протяжении их образовательного процесса.

С 2015 года, когда Vista впервые приобрела PowerSchool у Pearson за 350 миллионов долларов, Vista активно тратит деньги, приобретая другие образовательно-технологические компании, которые собирают различные виды данных о студентах.

В 2017 году PowerSchool купила SunGard K-12, которая предоставляла программное обеспечение для управления персоналом и расчета заработной платы для школ. В 2019 году компания приобрела Schoology, широко используемую систему управления обучением, которая служила цифровой основой для учебных программ и планов уроков многих школ. В 2020 году компания приобрела компанию Hoonuit, которая обеспечивает прогнозную оценку рисков, используемую такими районами, как Элгин.

В марте прошлого года компания завершила покупку программного обеспечения Naviance для подготовки к колледжу, а в ноябре приобрела Kickboard, компанию, которая собирает данные о поведении студентов и социально-эмоциональных навыках. В презентациях для инвесторов представители PowerSchool заявили, что дополнительные приобретения являются ключевой частью плана роста компании.

EAB занимается аналогичными закупками, приобретая такие компании, как Wisr, YouVisit, Cappex и Starfish, которые используются для набора в колледж, рекламы и отслеживания студентов в кампусе. Компания также объявила о создании Edify, “хранилища данных и аналитического центра следующего поколения”, предназначенного для “разрушения хранилищ данных”.

В июне прошлого года Vista также приобрела долю в совместном владении компанией Ellucian, которая продает различные образовательные технологические продукты. Компания утверждает, что обслуживает более 26 миллионов студентов в 2700 учебных заведениях.

Эта консолидация данных и полномочий вызвала негативную реакцию родителей, заботящихся о конфиденциальности, некоторые из которых безуспешно пытались выяснить, что означают эти сделки для конфиденциальных данных их детей.

Проникнуть за завесу тайны может быть непросто, даже когда родители обращаются к законам о конфиденциальности, призванным повысить прозрачность.

Например, в Иллинойсе действует закон штата, который требует, чтобы школьные округа публиковали конкретную информацию о поставщиках электронных технологий, которые они используют, включая все письменные соглашения с поставщиками и списки элементов данных, которыми они делятся с этими поставщиками.

Несмотря на это, государственные школы Чикаго еще не опубликовали какие-либо необходимые материалы, касающиеся PowerSchool и Naviance. CPS, однако, опубликовала информацию об использовании данных для других поставщиков. По данным компании, по всему Иллинойсу 5800 школ используют программное обеспечение PowerSchool.

FERPA также оказалась малопригодной для некоторых родителей.

Чери Кизекер, родитель двоих детей из Колорадо, сказала, что она запросила записи своих детей в соответствии с законом у PowerSchool в начале этого года после того, как была завершена сделка с Naviance.

“Каждый школьный округ владеет и контролирует доступ к данным своих учащихся”, – написал Флэгг из PowerSchool в электронном письме для The Markup. – “Любые запросы родителей на доступ к данным своих детей должны обрабатываться через соответствующие школьные округа.”

PowerSchool проинструктировала Кизекер запросить записи через школу, что она и сделала. Когда PowerSchool не выполнила последующий запрос школы в установленный законом 45-дневный срок, адвокаты ее школы направили в компанию юридическое требование. На сегодняшний день, по словам Кизекер, она все еще не получила полные записи о своих детях, хотя PowerSchool и предоставила часть.

Дебора Симмонс, родитель из Техаса, сказала, что начала изучать компании, принадлежащие Vista, после того, как обнаружила, что ее школа автоматически загрузила данные своего ребенка в Naviance. Она подала запросы на публичные записи и жалобы в свою школу, но до сих пор не знает всего объема данных, которыми владеют компании, или с кем еще они были переданы.

“Эти технологические компании хотят избавиться от хранилищ данных, объединить и упорядочить все это, но нет, наши дети – это не продукты”, – сказала Симмонс. – “Вот что они делают, они обращаются с нашими детьми, как с продуктами. Они люди и заслуживают уединения и свободы”.