IT как оружие. Копирование, воспроизведение и иное использование электронной книги, ее частей
Скачать 2.83 Mb.
|
на колесах Будут ли это традиционные автопроизводители или технологические компании? Ответ на этот вопрос имеет глубокие последствия. То, что часть экономической стоимости будет доставаться автопроизводителям, дает основание для более оптимистичного взгляда на долгосрочное будущее автомобильных компаний вроде Motors, BMW и Toyota. И, конечно, это создает более светлые перспективы для зарплат и рабочих мест в этих компаниях, а также для тех, кто на них работает. В таком контексте очевидно, что данный вопрос очень важен для акционеров компаний, а также для регионов и даже стран, где находятся эти компании. Без преувеличения можно сказать, что экономическое благополучие таких мест, как штат Мичиган, Германия и Япония, зависит от ответа на него. Если сказанное кажется притянутым за уши, вспомните о влиянии Amazon на книгоиздание — а теперь и на многие розничные секторы — или о том, что Google и Facebook сделали с рекламой. ИИ может точно также повлиять на все, от авиаперевозок до фармацевтики и транспортировки грузов. Именно такое будущее рисует Ли Кайфу. Именно поэтому вполне правдоподобен вывод о том, что будущее может принести все более возрастающую концентрацию богатства у небольшого числа компаний, которые владеют данными, ив регионах, где они расположены. Впрочем, как нередко случается, в будущее ведет не единственный и не жестко предопределенный путь. Хотя и существует риск того, что будущее окажется похожим на нарисованную Кайфу картину, у насесть альтернативный курс. Нам нужно предоставить людям более широкий доступ ко всем инструментам, необходимым для использования данных. Нам также нужно выработать подходы к совместному использованию данных, которое открывает компаниям, местным сообществами странам, как большим, таки маленьким, возможности для получения выгод. Короче говоря, мы должны демократизировать ИИ и данные, на которые он опирается. Так что же нужно делать для создания более широких возможностей для небольших игроков в мире, где все зависит от количества данных? Одним из тех, кто может ответить на этот вопрос, является Мэттью Траннелл. Траннелл — директор по вопросам управления данными в Онкологическом научном центре Фреда Хатчинсона, ведущем центре по исследованию онкологических заболеваний в Сиэтле, который носит имя местной знаменитости, игравшей 10 сезонов за команду Детройт Тайгерс» и возглавлявшей три команды из Главной лиги бейсбола. К сожалению, успешная карьера Фреда оборвалась в 1964 г., когда он в свои 45 лет ушел из жизни в результате онкологического заболевания. Лечением Фреда занимался его брат Билл Хатчинсон, который работал хирургом. После кончины своего младшего брата Билл основал Фред Хатч» исследовательский центр, занимавшийся лечением онкологических заболеваний. Траннелл приехал в Сиэтл в 2016 г. В центре тогда работали человек, которые занимали 13 зданий на южном берегу озера Юнион, откуда была видна самая узнаваемая достопримечательность Сиэтла — смотровая башня Space Миссия центра Хатч амбициозна — победить раки избавить людей от связанных с ним страданий. Разработкой новейших методов борьбы с этим заболеванием в нем занимаются ученые, среди которых три Нобелевских лауреата, врачи и исследователи. Центр тесно сотрудничает со своим соседом, Вашингтонским университетом, который известен в мире своими исследованиями в сфере медицины и компьютерных наук. Да и сам центр Хатч имеет внушительный список достижений, включая инновационные методы лечения лейкемии и других злокачественных заболеваний крови, пересадки костного мозга и иммунотерапии. Будущее центра Хатча, как и будущее практически всех институтов и компаний на земле, зависит теперь отданных. По словам президента Хатча, Гари Гиллиланда, данные изменят подходы к борьбе с онкологическими заболеваниями, диагностике и лечению. Он говорит, что исследователи превращают данные в фантастический микроскоп, который позволяет видеть, как наша иммунная система реагирует на заболевания вроде рака. В результате будущее биомедицины связано не только с биологией, но и с компьютерными науками и анализом данных. Хотя Траннелл никогда не встречался с Ли Кайфу, признание этого факта заставило его встать на путь, который фактически оспаривает тезис автора, те. предположение о том, что будущее принадлежит только тем, кто контролирует крупнейший источник данных в мире. Ведь в таком случае даже первоклассной команде ученых из не самого большого города в далеком уголке Северной Америки было бы крайне проблематично оказаться в числе первых в поиске средства от одного из самых опасных заболеваний. Причина понятна. Несмотря на то, что центр Хатч имеет доступ к важным наборам данных в сфере здравоохранения, помогающие проводить исследования рака с использованием ИИ, их никак нельзя назвать крупнейшим массивом данных в мире. Как и большинство других организаций и компаний, Хатч для сохранения лидерства в будущем должен конкурировать, не имея полного набора необходимых данных. К счастью, путь к успеху довольно очевиден. Он вытекает из двух особенностей данных, которые отличают их от большинства прочих ключевых ресурсов. Прежде всего, в отличие от традиционных полезных ископаемых вроде нефти или газа данные создаются самими людьми. Как заметил Сатья на одном из наших пятничных совещаний в Microsoft, данные — это, пожалуй, самый возобновляемый ресурс в мире. Есть ли еще какие-нибудь ресурсы, которые мы можем вот так непроизвольно создавать? Люди создают данные все быстрее и быстрее. Если мир чем-то и переполнен, тоне конечными и дефицитными ресурсами, а вечно увеличивающимися в объеме данными. Это не означает, что масштаб не имеет значения или что крупные игроки не получают преимущества. Преимущества у них, несомненно, есть. У Китая, где живет больше людей, чем в любом другом месте, больше возможностей генерировать данные, чему любой другой страны. Однако в отличие, скажем, от Ближнего Востока, где сосредоточено более половины разведанных мировых запасов нефти, он не может монополизировать рынок данных. Люди везде создают данные, и есть все основания ожидать, что в этом столетии все страны будут генерировать данные, грубо говоря, пропорционально их населению и размеру экономики. Китай и Соединенные Штаты могут стать первыми лидерами в сфере ИИ. Однако на Китай, несмотря на его размеры, приходится всего 18% мирового населения. А Соединенные Штаты представляют всего 4,3% мирового населения. Что касается размеров экономики, то здесь Соединенные Штаты и Китай имеют больше преимущества. На США приходятся мирового ВВП, а на Китай — 16% 12 . Однако, поскольку эти две страны, скорее всего, будут конкурировать, а не объединять силы, реальный вопрос заключается в том, сможет ли одна из них занять доминирующее положение в мире данных, если ее доля в глобальных данных составляет менее Хотя единственного гарантированного варианта не существует, более широкие возможности для небольших игроков связаны со второй особенностью данных, которая в действительности оказывается еще важнее. Данные, как говорят экономисты, являются «неконкурирующими». Когда завод потребляет баррель нефти, этот баррель становится недоступным для всех остальных. А вот данные можно использовать вновь и вновь, и десятки организаций могут делать выводы и обучаться на одних и тех же данных без уменьшения их полезности. Ключевой момент таким образом заключается в распространении данных и их коллективном использовании. Неудивительно, что лидером в подобном использовании данных является научное сообщество. Учитывая характер и роль научных исследований, университеты начали создавать депозитарии данных, которые можно использовать в различных целях. Microsoft Research тоже идет таким путем, предоставляя доступ к бесплатным массивам данных в таких областях, как обработка естественных языков и машинное зрение, а также естественные и общественные науки. Именно такая возможность делиться данными и вдохновила Мэттью Траннелла. Он считает, что если мы хотим ускорить победу над раком, то лучше всего позволить исследовательским организациям свободно обмениваться данными. Хотя это выглядит просто в теории, на практике все намного сложнее. Начать с того, что даже в пределах одной организации данные нередко попадают в изолированные хранилища, которые нужно как-то связать, а это сделать не так легко, особенно когда такие хранилища находятся в разных институтах. Данные могут храниться в нечитаемой для машин форме. Даже машиночитаемые данные чаще всего форматируются, маркируются и структурируются по-разному, что затрудняет их распространение и совместное использование. Если данные поступают от частных лиц, то возникают юридические проблемы, связанные с защитой неприкосновенности частной жизни. Даже когда данные не содержат персональной информации, приходится решать другие серьезные вопросы, связанные с процессом управления ими и правом собственности. Характер этих проблем не только технический. Они имеют также организационный, юридический, социальный и даже культурный аспект. Как отмечает Траннелл, они обусловлены в определенной мере тем, что большинство исследовательских организаций выполняют значительную часть технической работы с помощью инструментов собственной разработки. По его словам, «помимо изоляции данных в пределах отдельно взятой организации такой подход нередко приводит к повторному сбору данных, потере историй болезни пациентов и результатов лечения, а также к отсутствию сведений о том, где еще можно найти потенциально полезную информацию. Вместе взятые эти проблемы мешают поиску нового, замедляют темпы исследования данных о здоровье населения и повышают затраты» 13 Все это, как считает Траннелл, затрудняет сотрудничество исследовательских организаций и технологических компаний. В результате замедляется создание достаточно больших массивов данных, необходимых для машинного обучения. Фактически неспособность преодолеть такие барьеры и создает условия для реализации того сценария доминирования ИИ, что нарисовал Ли Кайфу. Траннелл и его коллеги в Хатче ясно осознали проблему, которую необходимо решить, и твердо нацелились на ее устранение. В августе 2018 г. Сатья, который сам является членом совета директоров Хатча, пригласил группу ведущих работников на обед, чтобы заслушать доклад о работе центра. Траннелл рассказало своем видении публичного ресурса, который должен позволить исследовательским институтам обмениваться данными по-новому. По его представлениям, несколько организаций должны были объединить свои данные в единый массив в партнерстве с технологической компанией. Я воспринял презентацию Траннелла с большим энтузиазмом. Во многих отношениях эта проблема была похожа на то, с чем мысами неоднократно сталкивались. План Траннелла напомнил мне эволюцию процесса разработки программного обеспечения. Назаре истории Microsoft разработчики защищали свой исходный код как производственный секрет, и большинство технологических компаний и других организаций создавали свои собственные коды. Однако открытое программное обеспечение революционизировало создание и использование программ. Разработчики все чаще публикуют свои коды, что позволяет другим включать, использовать и улучшать их. Это открывает простор для сотрудничества разработчиков и помогает быстрее обновлять программные средства. Когда началось такое движение, Microsoft непросто медлила с принятием изменения, а активно сопротивлялась ему вплоть до предъявления претензий в связи с нарушениями наших патентов компаниями, поставляющими продукты с открытым исходным кодом. Я был одним из главных участников этих акций. Однако со временем, особенно после того, как Сатья стал генеральным директором в 2014 г, мы признали такой подход ошибкой. В г. мы приобрели Xamarin, стартап, который поддерживает сообщество разработчиков открытого программного обеспечения. Его генеральный директор Нат Фридман перешел на работу в Microsoft и привнес в ряды нашего руководства взгляд со стороны. К началу 2018 г. Microsoft использовала в своих продуктах более 1,4 млн компонентов с открытым исходным кодом, занималась их совершенствованием и даже открыла многие из своих собственных фундаментальных технологий. Показателем того, как далеко мы ушли, служит то, что Microsoft стала самым активным участником веб-сервиса GitHub 14 , который служит платформой для разработчиков со всего мира и особенно для тех, кто занимается разработкой открытого программного обеспечения. В мае мы решили вложить $7,5 млрд в приобретение GitHub. Возглавить этот бизнес предложили Нату, ив процессе работы над сделкой мы поняли, что нам нужно объединить силы с ключевыми группами разработчиков открытого программного обеспечения, те. сделать прямо противоположное тому, чем мы занимались десятилетие назад. Мы должны предоставить наши патенты для защиты разработчиков открытых программ, которые создали Linux и другие компоненты с открытым исходным кодом. В разговорах с Сатьей, Биллом Гейтсом и другими членами совета директоров я подчеркивал, что пришло время перейти Рубикон». Мы былине на той стороне, а теперь, по общему мнению, настала пора изменить курс. Я вспоминал это, когда Траннелл описывал свою открытую базу данных. Проблемы, несмотря на их сложность, во многом походили нате, что уже были решены сообществом разработчиков открытого программного обеспечения. В Microsoft все более широкое использование открытых программных средств заставило нас переосмыслить связанные сними технические, организационные и юридические проблемы. Ане так давно мы развернули одну из самых масштабных в технологическом секторе инициатив по защите персональной информации и решению юридических проблем, возникающих при совместном использовании данных. Больше, однако, впечатляли не проблемы, а перспективы, нарисованные Траннеллом. Что, если нам удастся осуществить в сфере данных революцию, подобную той, которую совершил открытый исходный код в сфере программного обеспечения А что, если этот подход позволит работать более эффективно, чем организации, ориентированные на внутренние ресурсы и собственные массивы данных? Обсуждение этой темы напомнило мне встречу двухлетней давности, где мы в конечном итоге стали рассуждать о том, какое влияние совместное использование данных окажет на реальный мир. В начале декабря 2016 г, через месяц после президентских выборов, в вашингтонском офисе Microsoft состоялась встреча, посвященная анализу влияния технологии на президентскую гонку. Две политические партии и различные предвыборные штабы использовали наши продукты, а также технологии других компаний. Группы демократов и республиканцев согласились встретиться снами по отдельности для разговора о том, как они использовали технологию и чему научились. Сначала мы встретились с консультантами команды из штаба Хиллари Клинтон. На протяжении всей кампании 2016 гони считались генератором политических данных в стране. Они располагали крупным аналитическим департаментом, в активе которого был успех Национального комитета Демократической партии и успешная кампания по переизбранию Барака Обамы в г. Ведущие эксперты избирательного штаба Клинтон создали то, что считалось самым передовым технологическим решением в сфере предвыборных кампаний — самую лучшую в стране базу политических данных. По словам консультантов в сфере технических решений и политических технологий, Робби Мук, блестящий руководитель штаба Клинтон, принимал большинство решений на основе выводов, генерируемых аналитическим департаментом. По имеющимся сведениям, в конце дня голосования на Восточном побережье ни у кого в штабе не было сомнений в том, что они выиграли гонку благодаря, не в последнюю очередь, возможностям по аналитической обработке данных. Примерно в обед аналитическая команда оторвалась от своих компьютеров, чтобы принять поздравления от сотрудников аппарата избирательного штаба. Месяц спустя поздравления сменились гробовым молчанием относительно роли аналитики в поражении Клинтон. Команду штаба публично обвиняли в том, что она заметила важный для победы республиканцев сдвиг в Мичигане всего лишь за неделю довыборов, а в Висконсине — вообще только вовремя подсчета голосов. Так или иначе, все были по-прежнему уверены в полезности данных о кампании. Когда наша встреча подошла к концу, я задал присутствовавшей команде демократов простой вопрос На ваш взгляд, вы проиграли из-за результатов своего анализа данных или несмотря на них?» Реакция была мгновенной и совершенно однозначной Без сомнения, мы сработали отлично. Поражение произошло несмотря на это». После ухода команды демократов мы сделали перерыва потом встретились сведущими республиканцами. Их рассказ о ходе кампании был повествованием о неожиданных поворотах, которые привели к выдвижению кандидатуры Дональда Трампа и оказали сильное влияние на информационную стратегию его кампании. Вскоре после переизбрания Барака Обамы в 2012 г. Райнс Прибус стал во второй раз главой Национального комитета Республиканской партии. Он вместе с новым руководителем аппарата Майком Шилдсом пересмотрел сверху донизу работу комитета последам поражения 2012 г, в том числе и технологическую стратегию. Как это нередко случается в быстро меняющемся мире технологий, там нашлась возможность обойти конкурента. Прибус и Шилдс использовали информационные модели трех технологических фирм, консультировавших республиканцев, и встроили их во внутренние процессы Национального комитета. У них не было свободного доступа к пулу талантов из Кремниевой долины, которые симпатизировали демократам, поэтому они пригласили нового директора по технологиям из Мичиганского университета и молодого технолога из департамента транспорта Вирджинии для разработки новых алгоритмов для мира политики. Два руководителя Национального комитета Республиканской парии верили — и доказали на практике, — что таланты в сфере обработки и анализа данных есть везде. Но самым главным для республиканской технологической стратегии было то, что Прибус и его команда сделали после. Они создали такую модель совместного использования данных, которая убедила не только кандидатов от республиканцев по всей стране, но и комитеты в поддержку кандидатов партии, а также другие консервативные организации в необходимости передавать свою информацию в объединенную базу. Шилдс считал, что очень важно собрать как можно больший объем данных из всех доступных источников. В определенной мере это объяснялось тем, что Национальный комитет Республиканской партии понятия не имел, кто именно должен быть кандидатом в президенты. На тот момент там не знали, какие вопросы или избиратели будут наиболее важными для потенциального кандидата. Именно поэтому команда комитета стала заниматься вопросами установления связи с максимально большим количеством организаций и накопления максимально возможного объема разнообразных данных. Это позволило создать значительно более богатую, чему Национального комитета демократов или штаба Клинтон, базу данных. |