"Дай под зад диплому" #7: Этика сбора данных о людях / пользователях. Плюсов больше, чем минусов?
Дисклеймер
Сначала необходимо сделать важный дисклеймер с пояснением заголовка и предмета данной статьи. Контент на эту тему слишком политизирован, я столкнулся с этим при поиске информации о персональных данных, а теперь и при поиске литературы о сборе данных.
Начнём с самой фразы "этика сбора данных", ибо звучит она тупо. Этика — это нормативная наука и философская дисциплина, которая исследует нравственность и моральные принципы, лежащие в основе поведения людей. Так что не может быть "этики сбора данных", скорее речь про этику тех, кто проводит этот сбор.
Я сразу оговариваю данный момент, потому что здесь мы разберём именно этику сбора данных, как бы криво это не звучало. Кто именно ей занимается здесь вопроса не стоит! И о большом брате с "ой как плохо, что следят за моим списком покупок в интернете" тоже речи нет.
Здесь не будет рассуждений о государственном информационном колпаке и свободе слова, мне это не интересно, и данная статья посвящена исключительно айтишной стороне данного вопроса и информационной безопасности!
Тогда что именно представляет собой этика сбора данных пользователя?
Это довольно широкий вопрос, будем разбираться последовательно. Удобнее всего взять за базовую платформу для обсуждения социальную сеть, так как именно в ней вертится больше всех данных о человеке. Там есть как публичная информация, так и скрытая, но это всё ещё сбор данных, и социальная сеть оперирует ими всеми.
Есть очевидные моменты по типу репутации, когда верующие работодатели решают проверить ваши социальные сети перед наймом на работу, а у вас там репосты сатанизма. Такие моменты скорее должны рассматриваться в руководстве по адекватному и ответственному использованию социальных сетей.
Но есть и более интересные вещи. Например "не позитивное" высказывание о ком-либо. Казалось бы, какая тут связь с предметом нашего исследования? Самая прямая, ведь всеми нами любимая рекомендательная система с удовольствием подкинет вам для чтения любое высказывание о вас. И если мы говорим о людях, чувствительных к критике, то подобные алгоритмы рекомендаций могут нанести вред человеку, или подвергнуть "кибербуллингу", т.е. психологическому насилию в цифровом пространстве.
На данный момент многие социальные платформы борются с подобным, создают систему автомодерации, где автоматически скрывают негативный контент. Но попал бы человеку этот контент вообще, если бы изначально не было никаких рекомендаций? Скорее всего нет. Вот вам и первая касательная между сбором данных и этикой — подходящая рекомендация не всегда может быль полезной.
Продолжая тему "полезных" рекомендаций — как человек расширяет свой кругозор? Обычно с помощью усвоения новой информации. А теперь то получать новую информацию очень легко, пару кнопок нажал и можешь получать любую нужную информацию. Правда же? Сейчас пойду про котиков посмотрю на ютубе, а потом про идеи коммунизма. На следующий день захочу улучшить своё понимание государственного строя и посмотрю про... Коммунизм! Ведь у меня столько роликов о нём в ленте! А как ещё можно улучшить мой кругозор? Наверно почитать книги о... Коммунизме! Вон сколько книг мне выпало в предложениях, когда я открыл сайт книжного магазина!
Реомендательный алгоритмы способны запросто загнать человека в вакуум его убеждений, и они не стремятся вас переубедить, ведь главная задача — дать вам то, чем вы итак интересуетесь, исходя из истории просмотра. Я специально взял для примера государственный строй — дебаты с их сравнениями потрясают любое инфополе из покон веков, но разве сейчас последователи определённого режима могут часто увидеть противоположную точку зрения? Может быть, но с куда меньшей вероятностью, чем на условной встрече двух групп на кружке политики.
А видео с правильной консервацией томатов они могут увидеть и открыть в себе таланты повара? И подавно нет, если они никогда не интересовались готовкой прежде. Это даже большая проблема, чем отсутствие противоположного мнения — как можно расширять кругозор, когда вам сузили его до границ уже изведанного? Для расширения кругозора куда лучше подойдёт просмотр телевизора с дедушкой на диване, чем просмотр продвинутого и умного ютуба, для большинства людей это абсолютно верное утверждение.
Рекомендательные алгоритмы должны давать куда больше свободы в "появлении" новой информации, которая еле-еле или никак не связана с интересами человека. Например добавлять раздел "Интересное", но не просто кнопку, а видимое окно с результатами выдачи, прямо в окне с рекомендациями. К сожалению, я практически ниразу не видел подобной реализации в современных социальных сетях, и наречие "почти" я использую исключительно из соблюдения научного принципа о вероятности ошибки — мало ли я видел такую сеть, но забыл.
Также нельзя забывать о балансе между интересами пользователей и бизнесом. Если человек хочет обезопасить себя от рекламных рассылок и нескончаемого спама, ему как минимум нужно иметь две почты и два номера телефона — одно для регистрации, второе для личного использования. Почему "минимум"? Потому что текущие технологии носят глобальный и перекрёстный характеры: нет смысла прятать свой телефон от интернет-гигантов, если вы даёте его вашему другу с установленным определителем номеров с Play Market, который благополучно отдаёт на растерзание интернету всю телефонную книгу друга.
Такой проблемы не было бы в принципе, если б не заманчивая прибыль, которую можно обеспечить из ваших персональных данных. Мы должны следить за использованием собираемой информации на благо пользователям и нашей системы, а не во вред.
Момент с глобальными и перекрёстными технологиями можно раскрыть отдельно. Если вы часто открываете ленту в социальных сетях, то наверняка хотя бы пару раз встречали окно, предлагающее подтвердить, вы ли находитесь на фотографии. Вот насколько развита связующая система — вы сами того ещё не поняли, а система уже знает о ваших друзьях и знакомых, друзьях друзей и так далее. Такое глубокое сканирование, которое показывает ваш круг общения лучше, чем вы сами способны, пугает, не правда ли?
"Скажи мне, что ты ешь, и я скажу, кто ты" — можно куда лучше составить ваш цифровой отпечаток, если основываться не только на ваши данные, но и на данные вашего окружения, а потом сложить 2+2. И использование данного комплексного подхода начинается с нахождения вероятных знакомых и заканчивается вашей некрасивой фоткой под алкоголем в ленте ваших родителей и начальства. Некоторые вещи не хочется показывать всем подряд, но если это захотелось вашему другу, который есть среди ваших контактов неподалёку от родителей, почему бы не показать его пост с фотоотчётом о пьяной вечеринке вашим родителям и не попросить уточнить, есть ли вы на тех фотографиях?
Конфиденциальность и понимание рамок, среди которых можно заниматься подобными "перекрёстными рекомендациями", является очень важной и при этом очень тонкой темой. Не всё, что можно делать благодаря сбору данных, нужно делать. Да и в целом люди боятся использования их фото и видео, особенно в те моменты, когда они не фотографируются целенаправленно, им неприятен сам факт подобного слежения. 23% россиян заклеивают web-камеры на ноутбуках, это сказано в исследовании Касперского в 2016 году. Разработчики должны с уважением относится к собираемой информации и не позволять ей попадать не в те руки, обеспечивать достойную защиту информации.
Так в итоге то, чего больше? Плюсов или минусов?
Сложный вопрос, я скорее дал общее рассуждение и выявил торчащие нитки в клубке ниток. Мы рассмотрели сами этические стороны сбора данных, а этика имеет свойство играть разными красками при любом малейшем отличии точки зрения. Красота в глазах смотрящего. Нужно искать баланс.
Чем больше информации можно получить, тем больше способов её использовать, в том числе больше и корыстных способов. Содержание этой информации разнится от типа информации, и чем сложнее тип информации, тем больше оттуда можно извлечь информации. Текст, фото, аудио, а затем и видео.
Последнее — самый большой источник информации, но и самый опасный в плане безопасности, самый остроугольный в плане этики и самый сложный в плане технической обработки. Для рынка он нерентабелен с текущими технологиями... Но что если разработать технологию, которая сглаживает все эти нюансы и даёт доступ к такому богатому источнику информации?
Чтобы ответить на этот вопрос, надо рассмотреть сами технологии компьютерного зрения, этому и посвящена следующая часть исследования.
Если есть, чем дополнить, то можете написать в комментариях телеграм. Что это за рубрика и для чего она, я рассказываю здесь. Подписывайтесь на телеграм с постами и статьями, ютуб канал с обычными крупными и новостными видео, ютуб шортс с вертикальными видео и ютуб канал для стримов. Всем пока, до следующий статей.