горизонт. Сканирование горизонтов роль информационных технологий в будущем
Скачать 3.29 Mb.
|
124 Ст анислав Ронжин Данные как социальный барьер. Науки о данных к на- стоящему моменту поменяли многие аспекты нашей жиз- ни, но практически не коснулись здравоохранения. Это ситуация меняется крайне быстро, с тех пор, как искус- ственный интеллект достаточно развился для успешного применения в медицинской практике. В скором време- ни качество данных, доступных на момент постановки диагноза, будет напрямую влиять на здоровье человека. В наше время деньги могут предоставить доступ к наилуч- шим услугам здравоохранения. В будущем кроме денег, также будут нужны и данные. «К сожалению, я полагаю, что классовый раздел в будущем будет связан с данными. И при неосторож- ном подходе, может случиться так, что люди с наличием доступа к данным будут более здоровы, чем люди без доступа к данным» — сказал 133 Навин Рао, вице-прези- дент и главный управляющий подразделением искус- ственного интеллекта компании Intel. Невероятно, но эти слова произносит представитель гигантской част- ной компании, ключевой бизнес которой лежит в обла- сти продажи технологических решений. Это означает, что компания уже понимает, как использовать социаль- ный барьер в свою пользу, и очевидно, что это не под- разумевает работу над всеобщей доступностью дан- ных. Поэтому, цитату следовало бы перефразировать: «К счастью, я знаю, что классовое разделение будущего будет лежать в области данных. И если вы будете до- статочно аккуратны, то сможете получать прибыль из данных по меньшей мере 15 лет, примерно столько по- надобиться законодателям, чтобы осознать проблему и начать реагировать». Данные как экономический актив. Сеть стала пар- тиципаторной в середине 2000-х. С этого момента юзе- 133 Time (2019) «Unfortunately I believe the class divide in the future will be data,» says Dr. Naveen Rao at the #TIME100Health Summit. «And if you’re not careful, those who have access to data will have better health than those who don’t have access to data» [Twitter]. 17 октября. [Электронный ресурс]. URL: https://twitter.com/TIME/status/1184908321666547712? s=17 (дата обращения 22.08.2020) 125 Граж данск ое общ ество и бу дущ ее персональных данных ры стали продюзерами (и пользователями, и производи- телями), что означает, что они сами стали производить контент онлайн. Это было вдохновляющим моментом, так как возможность публиковать, комментировать, де- литься и ставить лайки сделала пользователей гражда- нами первого класса в Сети. Логика была проста — если раздел комментариев является главной причиной, по ко- торой люди посещают веб-сайт, то комментаторы заслу- живают свою долю прибыли от показа рекламы на этом сайте. В реальности же этого не произошло, отчасти, по- тому что онлайн-платформы были объективно в этом не заинтересованы, но также и потому что средний доход на одного пользователя был слишком маленьким, чтобы рассматривать его всерьез. К примеру, Facebook зарабатывал 10 $ на каждом пользователе в 2011 134 . Эта цифра выросла в 10 раз с тех пор, и нет причин думать, что Facebook не сможет удво- ить её в ближайшие несколько лет. Рекламные бюджеты будут расти пока Facebook будет улучшать алгоритмы контекстной рекламы. Вполне возможно, что в ближай- шем будущем среднестатистический пользователь смо- жет создавать доход, схожий по объему с его собствен- ным ежегодным личным доходом. Если так и случится, станет ли это аргументом для переосмысления условий пользовательского соглашения с платформой? Вопрос о том, почему у нас до сих пор нет инфра- структуры для монетизации наших цифровых следов связан с двусмысленностью подходов к обращению с нашими данными. С одной стороны, люди должны быть хозяевами информации о самих себе, и, как и хозяева собственности, должны полностью её контролировать. Более того, отношение к данным как к собственности, будет стимулировать развитие рынка данных. С другой стороны, ясно, что данные — это интимная часть чело- 134 Facebook.com (2018) Reports Fourth Quarter and Full Year 2018 Results [Электронный ресурс]. URL: https://s21.q4cdn.com/399680738/files/doc_ financials/2018/Q4/Q4-2018-Earnings-Release.pdf (дата обращения 22.08. 2020). 126 Ст анислав Ронжин веческой личности или существа и соответственно они требуют бережного отношения. Чтобы действовать наверняка, законодатели пред- почли сначала сфокусироваться на создании закона, направленного на предоставление средств правовой защиты для случаев нарушения тайны данных. Иронич- но, но подход, который считался самым верным привел к ситуации, в которой настоящие собственники данных не имеют средств к их монетизации, в то время как все остальные стороны, вовлеченные в цепочку создания ценности (см. рис. 7) зарабатывают на пользовательских данных деньги. Данные как политический актив. С технической точ- ки зрения, для платформы-рекламодателя нет разницы в том, что именно продвигать пользователю. С помощью социальных сетей, политическая реклама подается поль- зователям наравне со всеми остальными объявлениями, а пользовательское поведение отслеживается вместе с показателями конверсии и вовлечения. В этом смысле, политики не сильно отличаются от любых других про- давцов. Для эффективного управления политическими рекламными кампаниями, они точно также опираются на данные о своих сторонниках 135 . Политические пар- тии активно выстраивают внутреннюю инфраструкту- ру и процессы вокруг пользовательских данных, чтобы продвигаться выше по пирамиде из рис. 7. Данные стали активом, дающим политическим кандидатам серьезное преимущество. Несмотря на все спекуляции, связанные с Cam- bridge Analytica, всё ещё нет четких свидетельств того, что большие данные могут быть использованы для пред- сказания или манипуляций с будущим исходом выборов. Несмотря на это, большие данные точно помогают лучше понимать текущую ситуацию. Политики будут стремиться 135 Bashyakarla V., Hankey S., Macintyre A., Rennó R., Wright G. (2019) Personal Data: Political Persuasion. Inside the Influence Industry. How it works. // Tac- tical Tech’s Data and Politics team [Электронный ресурс]. URL: https://cdn. ttc.io/s/tacticaltech.org/Personal-Data-Political-Persuasion-How-it-works. pdf (дата обращения 22.08.2020). 127 Граж данск ое общ ество и бу дущ ее персональных данных к получению большего количества данных о жизни изби- рателей, например, данных об их местоположении 136 , т. к. политические кампании всегда имеют очевидную гео- графическую привязку. Если централизация данных дает власть лицам, принимающим решения, маловероятно, что они с легкостью эту власть отдадут. Ситуация, при которой все личные данные сосредоточены в руках еди- ниц, называется дата-олигархией, правлением малень- кого привилегированного круга, занимающего вершину пирамиды на Рисунке 7. Не стоит ожидать, что пользователям просто так вер- нут права на владение данными и их честный кусок пи- рога, испеченного в новой дата-центричной экономике. Этих прав следует добиваться, даже несмотря на значи- тельную разницу в ресурсах и возможностях между поль- зователями, желающими защитить свои данные и теми, кто хочет эти данные использовать. Чтобы это удалось, необходимо сделать так чтобы централизация данных стала очень очень сложным делом. Слабые сигналы Неспособность пользователей осознать ценность своих собственных данных относится к классу нехороших (англ. wicked — злой, нехороший) проблем, т. е. таких проблем, у которых не существует единого верного или ложно- го решения. У такого рода проблем существует беско- нечное количество решений, и они могут быть оценены только в сравнении. Следующая секция рассматривает недавние многообещающие разработки, нацеленные на решение этой проблемы. В контексте данного сборника, их можно рассматривать как слабые сигналы, которые могу помочь представить траекторию развития ситуации в будущем. 136 Tactical Technology Collective (2018) Geotargeting: The Political Value of Your Location. [Электронный ресурс]. URL: https://ourdataourselves.tac- ticaltech.org/posts/geotargeting/ (дата обращения 22.08.2020). 128 Ст анислав Ронжин The Social Linked Data (Solid) — проект, возглавляе- мый Тимом Бернерсом-Ли (2018), изобретателем Всемир- ной Сети и Семантической Сети. Проект предлагает набор принципов и технических инструментов для построения децентрализованных социальных приложений, основан- ных на принципах т. н. «связанных данных» (Linked Data). Solid подразумевает, что люди хранят свои данные в личных базах данных, называемых «капсулами» (pod — ед.ч.). На рис. 8 эти дата-капсулы обозначены кругами. Приложения (темно синие прямоугольники) вместо того, чтобы работать с одной базой данных, запрашивают до- ступ к необходимому количеству дата-капсул. Пользова- тели управляют тем, какие приложения могут читать или записывать данные из/в их капсул. За счет создания такой технологической инфра- структуры, в которой приложения были бы отделены от данных, Solid стремится нарушить механизмы работы бизнес-моделей, основанных на извлечении пользова- тельских данных и использовании их в коммерческих целях. Данные всегда остаются в дата-капсуле, и могут быть использованы любым другим приложением. Такая архитектура будет способствовать созданию рынка данных и демократизации разработки приложе- ний. Пользователи смогут монетизировать собственные данные и свободно перемещаться между приложениями в зависимости от их функционала. Для разработчиков это откроет возможность внедрять инновации на уров- не приложений, т. к. пользовательские данные больше не будут закрыты одним лишь приложением. Более того, децентрализация хранения данных вер- нет контроль над приватностью обратно в руки пользова- телей. Перепродажа пользовательских данных третьими сторонами станет невозможна, так как данные будут су- ществовать в единственном месте, в дата-капсуле поль- зователя и никогда не будут копироваться. Этот принцип известен как «данные в источнике» (data-at-the-source). Принятие таких правовых режимов, как GDPR в ЕС, создает проблемы не только для подозрительных или вре- 129 Граж данск ое общ ество и бу дущ ее персональных данных доносных организаций, но и вообще для всех, кто имеет дело с персональными данными. Часто это затрагивает и неправительственные организации. Например, группа опытных волонтеров хочет помочь некоммерческой орга- низации с проектом, работающим с данными третьих лиц. Эта задача подразумевает копирование данных, что неле- гально без дополнительного согласия со стороны пользо- вателя. Решением этой проблемы станет предоставление доступа гражданам персональных дата-капсул — таким образом, все их публичные и личные данные будут оста- ваться в одном месте. Вместо того, чтобы передавать дан- ные между организациями, каждая из них будет запраши- вать разрешение на просмотр только релевантных частей данных пользователей. Таким образом, данные не будут передаваться из одних рук в другие, и соответствие пра- вилам GDPR будет обеспечено автоматически для каждо- го конкретного запроса на просмотр данных. 137 Solid не является единственной разработкой, кото- рая пытается задействовать социальные сети в масштабе всей Всемирной Сети. К примеру, Diaspora и Indie Web уже работают на подобных принципах. Разница только 137 Verborgh R. (2018) Decentralizing the Semantic Web through incentivized collaboration // Ruben Verborgh blog [Электронный ресурс]. URL: https:// ruben.verborgh.org/articles/incentivized-collaboration/ (дата обращения 22.08.2020). Рисунок 7. Модель децентрализованных персональных хранилищ данных и распределенных приложений 137 Alice’s storage Carol’s storage Ben’s storage applications Персональное хранилище данных фотографии agenda contacts photo editor photo gallery meeting scheduler document editor social feed 130 Ст анислав Ронжин в том, что Solid поддерживается компанией Inrupt, кото- рая активно занимается разработкой приложений и со- обществ вокруг Solid. Распределенное машинное обучение (federated learn- ing) — развивающийся тренд в машинном обучении, не требующий централизации данных для обучения. В отли- чие от традиционного централизованного подхода, рас- пределенное машинное обучение происходит на личном устройстве, используя локальные данные устройства. Ис- ходные данные никогда не отправляются на центральный сервер. Вместо самих данных, передаются параметры модели, полученной на основе данных. Это позволяет разрабатывать алгоритмы машинного обучения, не тре- бующие обмена персональными данными. Как будет выглядеть будущее? Эта секция посвящена возможным траекториям развития проблемы персональных данных в следующие 20 лет. Будущее, в которым я хотел бы жить В 2040-м, веб-приложения не будут иметь возможности копировать и хранить пользовательскую информацию. Вместо этого, каждый раз, когда пользователь будет по- лучать доступ к веб-сайту, поставщик рекламы должен будет запросить данные, необходимые для персонализа- ции контента из хранилища пользователя. Однако, поль- зователь уже успел назначить цену (скажем, 10 центов) за каждый запрос на данные, чтобы выяснить предпочтения пользователя. Если поставщик рекламы согласен с такой ценой, то пользователь получает 10 центов на свой счет, а страница показывает персонализированный контент. В противном случае, пользователю показывают стан- дартные рекламные блоки. Схожим образом, пользова- тели могут монетизировать любое отслеживание своей гео-позиции. Более того, даже после того, как произо- 131 Граж данск ое общ ество и бу дущ ее персональных данных шла персонализация, поставщик рекламы никогда не по- лучает доступ к самим данным, использовавшимся для расчета предпочтений. Пользователь уже, при помощи другого стороннего приложения, сделал свои данные скрытыми, отобразив только финальные результаты за- проса для нужд сервиса персонализации. Высока веро- ятность, что современные социальные медиа, такие как Facebook, станут такими сервисами, не выдержав конку- ренции с лавиной новых социальных сетей, использую- щих преимущества децентрализованных персональных хранилищ данных. Facebook будет служить рекламным брокером и посредником между компаниями и пользо- вателями. Более того, эти новые социальные сети будут свободны от рекламы, так как существование рынка дан- ных станет провоцировать конкуренцию среди разра- ботчиков приложений, и, как результат, они будут выну- ждены искать другие формы монетизации. Потенциал для гражданского общества: Независи- мый поставщик идентичности. Наличие государства в жизни человека снизится. Правительства всё ещё бу- дут отвечать за обслуживание национальных реестров, но данные будут храниться и контролироваться самими пользователями. Правительственные органы будут запра- шивать доступ к персональным данным на индивидуаль- ной основе. В этом контексте правительственные органы будут просто ещё одним сервисом для поддержания ва- ших драгоценных данных в актуальном состоянии. Лич- ное хранилище данных, приложения поверх него, а также управление доступом, будут поставляться различными провайдерами подобных услуг. Пользователи будут свободны выбирать независи- мого поставщика услуг на любом из этих уровней. Это именно то место, где могут вступиться негосударствен- ные и некоммерческие организации. Установка и обслу- живание независимых низовых инфраструктур данных может стать важной ролью НКО и возможностью для укрепления гражданского общества. Особенно в случае независимых поставщиков идентификации пользовате- 132 Ст анислав Ронжин лей. Подобно тому, как пользователи используют учетную запись Facebook для идентификации на других сервисах (логин с помощью Facebook), люди будут использовать сервисы идентификации пользователя, управляемые местными сообществами. Потенциал для гражданского общества: профсоюзы данных. Люди будут использовать свои данные как сред- ство демократии. Если пользователь не разделяет поли- тической повестки определенной политической партии или кандидата, тогда он может отказать в доступе к сво- им данными, либо назначить цену за этот доступ. В таком контексте поддержка кандидату может быть выражена в предоставлении доступа к определенным собствен- ным данным. Схожим образом, возможность жертвовать свои цифровые отпечатки поспособствует гражданским научным проектам. Оптимизация дорожного движения на уровне района придет вместе с укреплением местно- го сообщества. Масштабируя эту идею в пространстве, и концептуально, можно создать катализатор для разра- ботки глобальной координации. Технические, так же, как и юридические аспекты управления персональными данными, часто оказыва- ются слишком сложными, чтобы управляться людьми. Рассмотрим, например, следующий сценарий. Алиса хранит свои личные данные о посещениях страниц в да- та-капсуле. Боб — академический исследователь, и он хотел бы использовать данные Алисы. Алиса — участни- ца профсоюза данных, некоммерческой общественной организации, помогающей свои участникам управлять разрешениями на доступ к данным. Профсоюз соглаша- ется, что Бобу можно доверить данные Алисы для его исследования. Профсоюзы данных могут быть разного географического охвата (локальные-глобальные) и обла- стей применения. Упомянутое выше будущее стало возможно благо- даря двум причинам. 1) Первая причина — к 2020 году технические гиганты западного мира стали проигрывать конкуренцию азиатским медиа платформам, особенно 133 Граж данск ое общ ество и бу дущ ее персональных данных китайским. С одной стороны, благодаря GDPR было по- дано несколько сокрушительных исков против Facebook и Google. С другой стороны, растущий средний класс в Африке и Азии выбрал платформы, говорившие на их родных языках. Вместе, два этих явления привели к осо- знанию угрозы безопасности западного мира. В резуль- тате, для подрыва успеха новых платформ, технические гиганты решили инициировать внедрение децентрализо- ванных хранилищ данных, чтобы создать конкурентное преимущество в виде защиты персональных данных сво- их пользователей. 2) Вторая причина — такие шаги были поддержаны социальной мобилизацией, давшей начало новому поколению некоммерческих организаций, таких как профсоюзы данных и независимые поставщики иден- тификации пользователя. Нежелательное будущее Правительства будут использовать проблему защиты персональных данных как повод увеличить государ- ственный контроль за персональными данными. Самый эффективный способ сделать это — прочно связать ап- паратную, программную и дата часть наших устройств. В 2020-м смартфоны получили отдельные чипы машин- ного обучения. К 2040-му устройства получат отдельный чип и предустановленное программное обеспечение, как часть обязательной национальной сертификации. Этот чип будет постоянно занят поддержанием официального «цифрового близнеца» вашего устройства на государ- ственных серверах. Цифровой близнец будет включать полное цифровое представление всего того, что проис- ходит с устройством, включая обнаруженное окружение и информацию о нём. Данные — это актив, управление которым слишком сложно для граждан. Правительства централизуют все персональные данные под эгидой единого националь- ного сервиса данных, который оперирует цифровыми двойниками и защищает всех людей и их сети от крими- |