Люди

Человек, который встряхнул Dark Web

admin
Всего просмотров: 2658

Среднее время на прочтение: 21 минута, 25 секунд

Прежде чем помочь разрушить джихадистские финансовые сети, уничтожить рынки оружия и пресечь сексуальное рабство с помощью инструментов поиска, извлекающих информацию из Dark Web, Крису Уайту надо было умудриться не вылететь в открытую для стрельбы дверь накренившегося вертолета «Блэк Хок».

«На войне как на войне», — подумал он.

Шел сентябрь 2010 года. Уайт в составе секретной разведывательной группы направлялся на передовую оперативную базу недалеко от главного штаба в Кабуле, чтобы помочь в борьбе с Талибаном и Аль-Каидой, остановить зашифрованный поток их онлайн-платежей и покорить умы и сердца афганцев.

Худощавому и долговязому двадцативосьмилетнему Уайту казалось, что в тяжелом бронежилете и шлеме, похожем на луковицу, с надписью «доктор Уайт», нацарапанной на куске скотча, он напоминал Майкла Дукакиса (кандидат в президенты США от демократов, чья предвыборная кампания запомнилась карикатурно-«воинственной» фотографией Дукакиса в танке — прим. Newoчём). Кроме того, пыль от взлета затрудняла дыхание. Крис все еще мучился с непривычными ремнями безопасности, когда вертолёт резко дернулся в сторону, и Уайт чуть не соскользнул к открытой двери, в 60 метрах под которой простиралась пустыня.

Там, внизу, лежал Афганистан — территория хаоса, опасного практически для всех. Спустя почти десять лет войны, когда число погибших американцев достигло тысячи, а жертв среди мирного населения было не сосчитать, решение президента Обамы увеличить контингент на 30 тысяч человек лишь усилило конфронтацию. Многие опасались, что ситуация всё ещё может ухудшиться. США наращивали количество беспилотных ударов на стороне Пакистана, а армейское командование переживало сложные времена после того, как генерал Стэнли Маккристал, инициатор увеличения численности войск, был уволен из-за пренебрежительных высказываний в адрес главнокомандующего, опубликованных в каком-то музыкальном журнале.

Сложно представить, что всего несколько недель назад Уайт был лишь очередным моложавым постдоком (постдокторант, ученый, недавно получивший PhD — прим. Newочём) в Гарварде, предвкушающим лето в Кембридже. Вместо бронежилета он носил шлепанцы, а на его радаре мигали не боевые вертолеты и военные базы, а латте в парке и скалолазание, а еще престижная программа в Школе инженерных и прикладных наук на другой стороне кампуса, где он работал на пересечении анализа big data, статистики и машинного обучения. Его академические успехи не вызывали сомнений, и он ожидал, что так будет продолжаться и дальше – станет преподавателем, создаст лабораторию и будет выпускать белые книги (правительственный информационный документ по какому-либо вопросу — прим. Newoчём), катаясь как сыр в масле.

Но как-то раз научный руководитель Уайта попросил его посетить конференцию в DARPA. Уайт знал, что этот набор букв расшифровывается как Управление перспективных исследовательских проектов Министерства обороны США (Defense Advanced Research Projects Agency — прим. Newочём), научно-инновационный отдел Пентагона, создавший бионические экзоскелеты, ночное видение, винтовку M16, агент «оранж» (смесь для уничтожения растительности, которой США пользовались во время войны во Вьетнаме — прим. Newочём), GPS, стелс-технологии, метеорологические спутники и Интернет. Проекты DARPA соединяли умных людей, большие идеи и крупные правительственные суммы. Их целью было помочь стране не допустить внезапного применения противником новых технологий, каждые 5–10 лет выпуская изменяющие мир технологии, дающие США стратегическое преимущество.

Уайт пошел нехотя, ожидая презентацию в PowerPoint, приглашение на работу «и, может быть, какой-нибудь ожидаемый от DARPA теоретический вопрос, например, как построить какой-нибудь огромный лазер». Вместо этого он попал на брифинг на высшем уровне о воюющем мире. Он узнал, что в мире есть темные силы. Их поступки были жестокими, а тактика и бюрократия — изощренной. Они убивали и терроризировали, росли и побеждали. Также он узнал, что в противостоянии с этими силами можно было использовать большие данные, и его страна хотела ухватиться за это преимущество как можно скорее.

К концу дня вундеркинд-постдок Уайт чувствовал себя пристыженно-наивным.

Я ничего не знаю о войне, думал он. До этого момента Уайт не был знаком с ее деталями с практической, оперативной стороны. И все чаще появлялась необходимость разбираться в гигантских массивах необработанных и, казалось бы, несвязанных между собой данных, вытаскивать планы и методы из гор разведданных.

Оказалось, в зоне военных действий Америке пригодился бы такой парень, как Уайт.

Но сначала ему надо было не вылететь через ту вертолетную дверь. Уайт вскарабкался на свое место, схватился за ремни и держался, пока стрелки, свесившись из открытой двери, наблюдали за обстановкой. Эти бывалые солдаты похожи на героев фильма «Миссия невыполнима», подумал Уайт.

Уайт был в их команде, но играл другую роль, являясь частью ведущей команды умников в засекреченной программе DARPA под названием «Nexus 7». На протяжении почти десятилетия американские военные собирали разведданные в Афганистане: по сообщениям, с помощью ЦРУ, Агентства национальной безопасности, через GPS-спутники, записи с мобильных телефонов, военные отчеты, цифровые финансовые потоки, камеры наблюдения, иностранные перехваты и огромные потоки информации из всех существующих социальных сетей. Хотя эта развединформация были полезны — например, для целенаправленных ударов дронов — в основном она просто накапливалась в большом хранилище данных. И это США использовали еще не все возможности, для понимания желаний и нужд афганцев. Эти упущенные подсказки представляли собой, по словам генерал-лейтенанта Майкла Флинна, занимавшего тогда пост главы разведки в Афганистане, «обширный и недооцененный объем информации».

Чтобы исправить это упущение, DARPA внедрила Уайта и еще десяток гиков в боевые подразделения, чтобы собранные данные начали использоваться эффективнее. Некоторые из этих ребят соединяли спутниковые данные и системы наземного наблюдения, чтобы визуализировать движение машин на дорогах (или его отсутствие, что говорило о находящемся рядом укреплении талибов или самодельном взрывном устройстве на обочине дороги). Целью команды Уайта был цифровой след финансирования Талибана и Аль-Каиды.

Инструменты анализа данных, разработанные специально для военных нужд, оказались настолько успешными, что принесли ему повышения, медали и почетные грамоты. В дальнейшем Уайт будет использовать эти инструменты и полученные навыки дома, где с их помощью поможет журналистам изучить такой огромный массив данных, как «Панамский архив», произведет революцию в расследовании уголовных дел и прольет свет на область Dark Web’а, где наркотики, оружие и люди покупаются и продаются, где свободно текут миллиарды незаконных биткоинов. В один прекрасный день эти инструменты могут даже помочь проложить путь к более информированной демократии.

Соскальзывая к открытой двери вертолета, Уайт думал, что это конец. Но это было только началом.

Крис Уайт в Афганистане, 2010 год, в составе дата-майнинговой команды.
Фотография предоставлена Крисом Уайтом

Уайт не похож на заикающегося гения из «Игр разума». Он скорее скрытый ботаник. Впервые мы с ним встретились в прошлом ноябре, в холле отеля в центре Сиэтла. Грациозный и мрачно-красивый парень из Оклахомы в ярко-синей ветровке Patagonia, стоящий у стойки регистрации, походил на маленькую, тихую, хипстерскую версию Карла Сагана. Я хочу сказать, что он не только умен и увлечен своим делом, но также приятен и до странности нормален — черты, которые могут показаться несовместимыми с его ролью провозглашенного вундеркинда-визионера. Но кажущееся противоречие — «фишка» Уайта: он — опытный практик аштанга-йоги, побывавший на войне, бывший государственный служащий, лично знакомый со знаменитыми буддистами и легендарными хакерами и практикующий мастер боевых искусств, преданный отшельнической сидячей науке смотрения в экраны компьютеров.

Эти кажущиеся противоречия позволили 34-летнему Уайту наладить мосты между экспертами. Он не гений, пишущий код, не аналитик в поисках очередного крупного IPO (первичная эмиссия акций предприятия — прим. Newочём), не пожимающий руки деловым партнерам генеральный директор какой-нибудь компании и не генерал, превращающий кучу разведданных в план. Он тот, кто может поговорить с каждым из этих людей, понять их и объединить их сильные стороны в матрицу, которую сам по себе ни один из них не мог бы представить.

На данный момент эта матрица помогает превратить Интернет в более интересный, полезный и доступный инструмент для исследования нашей Вселенной данных. Как оказалось, это не та карьера, которую можно спланировать. Уайт удивил одноклассников по старшей школе, выбрав естественные науки. Затем он удивил семью и себя самого, бросив подготовительные курсы для поступления в медицинский университет ради электротехники. Крис продолжил удивлять всех своими способностями к статистике и компьютерной науке, что постепенно привело его к редкой научной области — той, где машинное обучение и большие данные пересекаются с естественным человеческим языком.

Некоторые из лучших умов нашего поколения используют Интернет, чтобы обогатить рекламодателей. Но объединенность Интернета также представляет собой беспрецедентный механизм для сопереживания, понимания друг друга, самих себя и всего нашего мира. Что может быть интересней?

Пройдя путь от постдока в Гарварде до брифинга в DARPA, Уайт успел использовать свою степень в электротехнике для того, чтобы стать научным сотрудником Министерства национальной безопасности и получить докторскую степень в Центре изучения языка и речи в Университете им. Джона Хопкинса. Кроме того, он работал с Microsoft, MIT, IBM, и Google. Но, по его словам, ничего из этого по серьезности даже близко не стояло с тем, что он делал в Афганистане.

«Я был потрясен. Это было страшно и тяжело, и я был по-настоящему сосредоточен на работе. Я знал, что я вношу вклад в важное дело. Но я не имел ни малейшего понятия о том, что это привело бы к разительным переменам в жизни».


Источник: The Voorhes

В то время DARPA тоже менялось. Новый директор, Регина Дуган, провела Nexus 7 через бюрократию Пентагона. Она верила в возможность краудсорсинга сложных проблем, и хотела, чтобы DARPA играло более активную роль в военное время, вместо того, чтобы выдумывать технологии, которые могут изменить военные силы спустя десятилетия. В своем выступлении перед комиссией Конгресса она сказала, что хочет, чтобы военные чины знали, что DARPА тоже рвется в бой.

Nexus 7 должен был стать острием копья. Операция была разработана менеджером DARPA по проектам Рэнди Гарреттом под надзором Дуган. Добро на проведение операции дал генерал Дэвид Петреус. Команды были разделены на две группы, общим числом около 100 программистов, социологов и экспертов в области разведки. Более многочисленная группа оставалась в Штатах для написания кода и составления массивов информации. Уайт же оказался в малочисленной группе, которая отправлялась в Афганистан.

Талибан и Аль-Каида — это военизированные организации, совершающие жестокие преступления во имя Аллаха, но они все в большей и большей степени действовали как преступные организации, основанные на деньгах, а не на религии. Деньгами платили за пули и бомбы, поддерживали настрой войск и дружелюбное отношение деревень, покупали информацию и защиту, транспорт и горючее, сердца и, иногда, умы.

Большая часть денег добывалась преступной деятельностью: воровством, наркоторговлей, торговлей оружием и людьми.

Эти транзакции и доходы от них скрывались с помощью законного бизнеса и фиктивных компаний. Что-то из этого происходило в физическом мире, но все чаще преступная деятельность переносилась в сеть, где покупка и продажа товаров в Dark Web или фильтрация доходов при помощи биткоинов и зашифрованных аккаунтов происходили куда проще, в том самом цифровом мире, изучением которого Уайт занимался всю жизнь.

Генералы коалиции в Афганистане знали это уже давно, но детали им были неизвестны. Роль Nexus 7 заключалась в том, чтобы найти в стоге сена разведданных весьма полезные иголки. Все, что могло помочь начальству лучше понять нужды народа Афганистана. Команда Уайта фокусировалась на источниках денег, оружия, наркотиков, и торговли людьми, чтобы понять, где и почему происходили транзакции, и кто в них участвовал. Сам Уайт играл роль посредника между командами DARPA, оставшимися в Штатах, и военными командирами в Афганистане.

К сожалению, это значило, что мне нужно было часто разговаривать с незнакомыми людьми или просить о встрече с командованием. Это было довольно тяжело. Я не общительный человек, но я знал, что мне нужно этим заниматься, потому что такова была моя работа

Разговаривать с людьми в зоне боевых действий, которые не знали и не хотели знать, почему Уайт отрывает их от работы, было сущим кошмаром. Уайт не особо любил людей, и, что хуже всего, он был гражданским. У него не было ни военной формы, ни военной подготовки, ни звания — удобной подсказки на погоне или плече, чтобы все понимали, кто и перед кем должен отчитываться.

«На войне у людей всегда полно забот», — объясняет Уайт

У него не было и особой военной выправки. Пока другие тягали железо, гибкий невысокий парень, которого они прозвали Доктор Спагетти, занимался йогой на спортивных матах. Постепенно, когда его 9 дней пребывания там переросли в 90, а затем и в еще больший срок, он возглавил местное отделение Nexus 7 и стал гражданином этого военного мира. Он научился многим важным мелочам, в том числе тому, что если победить здоровяков в спарринге, используя знания боевых искусств, то потом они будут куда дружелюбнее. В конечном счете это помогло Уайту и команде лучше делать свою работу. Точные данные засекречены, но отчетность ясно показывает, что Nexus 7 внесли значимый вклад в бой за сердца, умы, и жизни.

К концу своего пребывания в Афганистане команда Nexus 7 успела заслужить уважение командования, а Доктор Спагетти имел ранг в DARPA, который был эквивалентен бригадному генералу. Тяжкий трудом они заслужили множество наград от Министерства обороны и Министерства финансов США. Команду Уайта, в частности, наградили за создание обширной аналитической сети данных, которая принесла ценную информацию по ключевым стратегическим и операционным вопросам. Сам Уайт был отмечен как важный актив агентства.

Но все эти наградные ленты имели свою цену. Крис Уайт уже не был тем наивным выпускником, который прилетел на самолете в Кабул. Он бросил учебу в Гарварде и расстался с девушкой, с которой встречался долгое время. Сильнее всего, однако, изменился его взгляд на мир.

Его не контузило, он не выбивал дверей, и не наступал на вражеские мины, но впервые в жизни он видел на что были способны враги — такие же люди, как и он.

Работа была закончена, и нужно было двигаться дальше. Но Уайт всё же не был готов оставить битвы позади. Вскоре, у него появился шанс вынести одну из них за пределы войны.

Данные, которые Уайт помогал отследить, приводили людей, готовых рисковать своей жизнью, в места, где женщины и дети держались как товар. И Уайт видел своими глазами, насколько эти люди были уязвимы. Он также узнал, что такое происходит не только в Афганистане. И чтобы найти этих людей, не нужен был никакой самолет. Нужен был лишь модем.

Интернет, который вы знаете, это не Интернет. Или по крайней мере не весь. Для начала, есть Интернет Bing, Google, Firefox и Siri — те места, где находятся ваша почта и закладки, где вы можете найти наполнитель для кошачьего туалета или счет матча. Эти вещи представляют свыше двухсот терабайт данных, и это больше по объему, чем цифровой эквивалент содержимого Библиотеки Конгресса. Это огромный пласт информации, но он лишь лежит на поверхности.

Оценки могут различаться, но поверхностный, или открытый Web содержит от 5 до 20 процентов общей информации. Остальное содержиться в местах, которые большинство пользователей не могут достичь. Некоторая информация содержится в разных защищенных паролями местах, другая на все более популярных динамических сайтах вроде Kayak. Они представляют собой скорее приложения, чем страницы, и меняются, когда с ними взаимодействуют. Остальной Web — темный, Dark Web.

Но Dark Web — не кривая дорожка, на которую можно случайно свернуть на пути к amazon.com. Основным инструментом для входа в даркнет является Tor (акроним для The Onion Router). Так называемая луковичная маршрутизация впервые была разработана исследовательской лабораторией ВМФ США для безопасной и секретной передачи информации. Она проводит зашифрованную информацию через серию анонимных узлов, делая ее практически не отслеживаемой, и создавая рай для тех, кто хочет избежать наблюдения и контроля.

В Dark Web можно встретить государственных работников, кибер-библиотекарей, руководителей ИГИЛ, изобличителей-хактивистов или людей, планирующих акции для Арабской весны. Свободные рынки Dark Web не регулируются и специализируется на всем, что можно и нужно продавать анонимно. В Dark Web вы всегда в паре кликов от чего-то нелегального, омерзительно, жестокого, или даже от того, чтобы разделить тюремную камеру с Джаредом из Subway. Тут можно найти китайский героин, поддельные паспорта и деньги, перуанский кокаин, Диметилтриптамин (ДМТ), или порно-сайты, позволяющие искать знакомых людей по имени, местности, возрасту или даже тату, такие, как Pink Meth.

Если вы причисляете себя к одному из около 2,5 миллионов пользователей, ежедневно посещающих этот темный мир, прямо сейчас вы наверняка недобро смеетесь (или строчите злобный комментарий к этому тексту). Ни один каталог даркнета никогда не сможет претендовать на звание окончательного или точного. Эта многоголовая гидра кому-то дает чувство свободы, а в ком-то создает ощущение фрустрации. Даркнет также являет собой идеальную площадку, где криминальные организации и террористические группировки могут общаться, предлагать свои услуги или покупать и продавать любые товары, включая торговлю людьми.

Пока вы читаете эту статью, в мире происходит незаконное перемещение примерно 21 миллиона людей или торговля ими. Больше половины из них — женщины и девочки. Более миллиона — дети. Около четверти из них продают в сексуальное рабство. Согласно статистике, спасти удается лишь одну жертву торговли людьми из тысячи. Этот бизнес процветает. Высокая прибыль и низкая степень риска сделали торговлю людьми одним из наиболее динамично развивающихся и доходный видов преступлений: по последним оценкам ООН, торговля людьми приносит около 150 миллиардов долларов прибыли в год.

Как разновидность бизнеса она практически ничем не отличается от продажи наполнителей для кошачьего туалета или свитеров; чтобы потребители покупали твой продукт, им нужно суметь найти его. Производители Tidy Cats могут разместить свою рекламу на билборде; торговцы людьми же должны быть достаточно на виду для того, чтобы их нашли покупатели, но, в то же время оставаться в тени, чтобы их не могли выследить власти.

Неудивительно, что большинство информации о секс-трафике оказывается в глубоком Web или же прячется на самом видном месте — в терабайтах «видимого интернета», где она, впрочем, размещена не так, как данные производителей легальных услуг, желающих, чтобы их товар можно было найти при помощи поисковых запросов.

Точная формула того, каким образом поисковики типа Bing или Google сортируют результаты выдачи поисковых запросов, разрабатывается секретными алгоритмами, недоступными для простых смертных. Однако в этой системе доминируют два фактора: страницы, содержащие ссылки на другие страницы, оказываются выше в результатах выдачи поисковиков, как и страницы с ключевыми словами, совпадающими с запросом. Именно поэтому Википедия оказывается на первых строчках выдачи большинства поисковых запросов, сформулированных через Google — на эти страницы часто ссылаются другие пользователи, они и сами содержат немало цитат из других, менее значимых ресурсов (например, блогов).

Но торговцы людьми не хотят, чтобы на них было можно войти, просто задав соответствующий поисковый запрос. Чтобы уменьшить шанс на попадание в первые страницы выдачи, они рекламируют свои услуги через одноразовые объявления, не содержащие ссылок на другие страницы. Они прячутся в дебри тематических чатов или не поддающихся отслеживанию постов в социальных сетях. Они избегают поисковой оптимизации. Вместо ключевых слов они используют фотографии и кодовые слова. Вполне вероятно, что на сегодняшний день в интернете размещены сотни тысяч действующих предложений купить секс-раба. Детективам, использующие обычные поисковые системы, становится необычайно сложно обнаружить рекламу или предъявить обвинение преступникам, не желающим играть по правилам Google.

У Криса Уайта появился шанс изменить правила.

Когда-то Уайт отказался от мирной академической карьеры ради высокоинтеллектуальной военной авантюры. Спустя два года, когда и то, и другое уже подошло к концу, а самому Уайту исполнилось 30 лет, ему снова пришлось выбирать жизненный путь. Со стороны его жизнь могла бы показаться чередой логически связанных решений. Однако самому Уайту казалось, что он провалился в кроличью нору и вылетел из противоположной ее стороны. А затем DARPA предложили ему должность руководителя группы проектов. Он нашел свою Страну чудес.

«Когда-то я думал, что хочу стать „кем-то“», — говорит Уайт. — Кем-то достойным уважения — доктором или главным исследователем. «Но теперь я понял, что хочу „делать что-то“».

Как программный менеджер DARPA, Уайт имел право предложить собственный проект. И «что-то», чем он хотел заниматься, оказалось идеей создания новой разновидности поисковика, способного мониторить весь интернет.

В Афганистане в их распоряжении были готовые инструменты для отслеживания и сбора больших массивов данных; в основном, они создавались для экспертов и особых проектов. Но что, если бы они смогли создать готовые к употреблению схемы, доступные для всех? Что-то вроде установочного комплекта супер-поисковиков, которые можно было бы собрать в абсолютно любых комбинациях.

Первоначальная идея привела к созданию рассчитанного на три года (и на 50 миллионов долларов финансирования) проекта по созданию поискового «установочного комплекта» из 20 новых поисковых движков. Код для них писало 17 разных групп из частного сектора и университетов, а целью было объявлено создание более эффективных инструментов работы с массивами информации, доступных во всем интернете и позволяющих добиться большей степени охвата и большей прозрачности, чем в Firefox, Safari, Google или Bing

Они назвали его Memex, поскольку это слово сочетает в себе «память» и «индекс» — термин, позаимствованный из опубликованной в 1945 году статьи В. Буша, визионера и бывшего директора Департамента науки и технологий в Vannevar Bush. Предполагалось, что Memex должен стать средством визуализации связей между идеями и фактами. Если бы прототип продемонстрировал эффективные результаты, исследователи оказались бы наделены практически безграничными возможностями.

Как объясняет Уайт, данные в интернете в основном представляют собой описания событий, произошедших в реальном мире — письма, электронные письма, блоги, телефонные звонки, GPS и посты в социальных сетях. «Цель исследователя — продраться сквозь описания и вернуться в самое начало, чтобы понять, что случилось», — объясняет Уайт.

С традиционным веб-браузером сделать это непросто.

Вбейте обычный поисковый запрос — к примеру, номера телефона — в Google, и, вполне вероятно, вы получите тысяч 20 результатов: ссылки на страницы из «видимого» интернета, расположенные в зависимости от соответствия ключевым словам и от числа ссылок, содержащихся на каждой веб-странице.

Единственный выход — кликать по каждой из ссылок, проверяя каждую страницу в поисках нужного вам единственного ответа. Эта схема работает для поиска ответов на вопросы вроде «Какой город — столица Монтаны?». Однако в случае сложных исследований Уайт сравнивает этот способ получения информации с использованием ручной газонокосилки для стрижки поля для гольфа. «Он слишком линейный и подвержен ошибкам, — поясняет Уайт. — Существуют способы получше».

Memex Уайта основывается на структурно-комплексном подходе. Определенные инструменты можно будет запустить в Dark Web, обнаружить все спрятанные сайты и составить целый индекс, что ранее считалось практически невозможным. Другие могли бы индексировать и сортировать невероятно внушительный поток онлайн-форумов глубокого интернета, которые в обычной жизни найти невозможно.

Третьи стали бы мониторить новые тенденции в социальных сетях и медиа, устанавливать связь между фотографиями, разбирать написанную от руки информацию или добывать ее с веб-страниц, а затем создавать информационные карты на основе полученных данных, Теоретически, поисковик Уайта мог бы помочь в разработке ряда приложений; как проекту DARPA им необходимо показать свою эффективность на примере по меньшей мере одного случая.

В идеале тестовая версия приложения должна быть способна справляться с реальной проблемой массивов данных, что смогло бы помочь следователям сделать наш мир лучше, а страну — безопаснее.

Уайт решил использовать тестовую версию Memex, чтобы помочь американским органам правопорядка с преступлениями, которые увидел в Афганистане и тут же счел «невыносимо ужасными»: торговлей людьми.

Уэйд Шен, программный менеджер Memex, демонстрирует на экране компьютера в расположенной в Арлингтоне, Вирджиния, лаборатории проекта Memex, как потенциал Memex был использован для расследования случаев продажи людей в секс-рабство.

Первый носил название Datawake. При обычных обстоятельствах детектив, отрабатывающий зацепку (например, электронное письмо, где упоминается проститутка) загружает эту информацию в Google, не получает никаких определенных результатов, но поисковик выдает ему, допустим, 25300 страниц; скорее всего, детектив успеет открыть только несколько из них до того, как обнаружит новые улики, которые он загрузит в поисковик и пойдет дальше.

Анализ и обработка информации, содержащейся на всех 25 300 страницах, заняла бы 14 полноценных двенадцатичасовых рабочих дней.

Datawake обрабатывает те же результаты из поисковой выдачи Google, собирает со страниц всю значимую информацию и организует ее удобным для визуализации способом. Результаты появляются на экране в виде множества окружностей. Линии между ними обозначают связь между данными: имена, номера телефонов и фотографии, которые неоднократно повторялись в сообщении. Для детектива особенно важно, что так удается проанализировать все 25 300 результатов — тогда он сможет заняться наиболее перспективными теориями, не отвлекаясь на прочие результаты.

Подобные инструменты позволили прокуратуре заново обратиться к материалам по успешно завершенным делам сексуального характера и снова использовать уже доказанные улики в виде телефонных номеров, имен, электронных и физических адресов. Инструменты Memex позволяют находить в этих старых делах поисковые термины для развития новых дел и доказательства преступного сговора, связывая таким образом уже сидящих преступников с поныне действующими сексуальными бандами.

Один из самых полезных инструментов — TellFinder, собирающий и систематизирующий информацию из рекламы сексуальных услуг. Найдя нечто общее в разных рекламах — собственный стиль их автора — он может сгруппировать рекламы по автору или организации и дать следователям точнее оценить масштаб преступных операций. В одной из демонстраций Шен выводит на экран карту США с кругами вроде тех, что рисуют на карте плотности населения, символизирующими 869 000 активных рекламных объявлений. Он увеличивает масштаб до отдельных городов и юрисдикций и прокручивает назад даты, чтобы увидеть, где публиковались и постепенно исчезали эти объявления. На карте также показаны телефонные номера, имена, электронные и физические адреса, совпадающие в объявлениях, и даже фотографии с одинаковым фоном (одинаковые занавески и обои в мотелях на фоне могут вывести детективов на сайт сексуальных услуг). За несколько щелчков Шен показывает, как реклама одной женщины двигалась через страну, демонстрируя вероятный маршрут секс-трафика.

Другой инструмент, Dig, берет эту информацию и сортирует ее в список, чем-то похожий на результаты поиска в Amazon. Ключевые категории и термины сбоку списка позволяют следователям фильтровать результаты и оставлять только нужную информацию. Dig также обладает усиленными по сравнению с TellFinder возможностями поиска изображений. «Это еще один способ взглянуть на ту же проблему, — поясняет Шен. — Но это лишь примеры — нет какого-то единственного способа использовать эти инструменты».

Некоторые инструменты Memex были адаптированы для выполнения схожих задач в Dark Web, сканируя недоступные иначе сайты на предмет конкретной информации.

В Сиэтле Уайт показал мне еще один инструмент: Aperture Tiles. Он делает ранее неуправляемые массивы данных — то есть миллиарды подвижных точек на карте — управляемыми. Чтобы продемонстрировать его работу, Уайт совместил адреса мотелей, замешанных в сексуальной торговле, и информацию о местоположении, прикрепленную к онлайн-публикациям, сделанным рядом с этими адресами. Он отмечает:

«Большинство людей не подозревают, что когда они дают приложениям в телефоне требуемые разрешения, они заключают сделку, товар в которой — они и их информация»

Зачастую появлялись видимые связи. Люди, размещающие объявления, ездили из города в город по всем США, каждые несколько дней выходя из Dodge, скорее всего, чтобы не попадать в поле зрения правоохранительных органов. Некоторые люди, часто размещавшие объявления в США, так же часто размещали их в Юго-Восточной Азии. По словам Уайта, только полноценное расследование может сказать, что это значит, однако разумно будет предположить, что эти люди связаны с международной сексуальной торговлей.

19 декабря 2014 года Фройлан Росадо сидел в фургоне, припаркованном у секс-отеля на Манхэттэне, с 16-летней беременной девушкой на пассажирском сидении. Росадо было почти сорок лет, и он любил постить в Facebook фото, где он и его семья наряжались заключенными на Хэллоуин, или селфи в темных очках, с косичками, козлиной бородкой и ухмылкой. Росадо был сутенером. В отеле была его 18-летняя проститутка, «Флора». Полицейские под прикрытием взяли ее в ходе обычной операции против проституции.

Но на самом деле она была потерпевшей.

Флора рассказала следователям, что опекуны выгнали ее из дома, и ей некуда было пойти. Росадо взял ее к себе и потом заставил заниматься проституцией. Следователи вскоре узнали, что Росадо стал экспертом в заманивании девушек и женщин в проституцию посредством соцсетей: с помощью молодой женщины уже в его подчинении он выходил на связь с девушками, которым могло быть всего 15 лет. Заманив их, он их удерживал насилием, наркотиками и обещаниями денег. Однажды он принялся душить девушку, которая отказалась подчиняться ему. В одном сообщении он назвал одну из подопечных «свежим мясом». Он выкладывал их фото в объявлениях на Backpage с контактным телефоном, принимал звонки, назначал свидания и ждал снаружи, чтобы получить свою долю.

Чтобы получить больше улик против Росадо, манхэттенская прокуратура под руководством Сайруса Р. Вэнса хотела найти больше девушек. Флора не знала их полных имен, телефонных номеров или местонахождения. И она не знала, как именно Росадо заметал свои цифровые следы. Например, она понятия не имела, что он регулярно удалял или изменял рекламу своих девушек, или менял их имена, или приобретал новые дешевые мобильники. И из-за этого следователи не могли связать Росадо с более крупной преступной организацией, даже когда он руководил своим бизнесом по телефону из нью-йоркской тюрьмы Райкерс-Айленд.

Они обратились за помощью к Memex, которая начала сотрудничать с ними в 2014 году. Аналитики использовали ранние версии Dig и TellFinder, чтобы обнаружить невидимые следы Росадо в удаленных и действующих объявлениях, и тут же вышли на фото, имена, адреса, номера и еще большее количество девушек. Пока Росадо вел свои дела из тюрьмы, следователи слушали его и записали несколько новых упомянутых им номеров, которые они вбивали в Memex и связывали с остальными данными. Вскоре они опознали и нашли еще больше жертв Росадо, собрав улики, доказывающие его связь с сетью проституток, в числе которых были 10 девочек от 15 до 18 лет, и укрепив дело. 15 сентября 2015 года, почти через год после ареста Росадо, его приговорили к тюремному заключению сроком от 7 до 14 лет по делу о торговле людьми и организации проституции. Теперь прокуратура Манхэттэна использует Memex во всех делах по сексуальной торговле. Лишь за первые 6 месяцев 2016 года она просканировала 4752 потенциальных дела.

Источник: The Voorhes

Одним дождливым вторником в этом ноябре я встретился с Крисом Уайтом в его новом офисе в кампусе Microsoft в Редмонде, штат Вашингтон, где-то в двадцати километрах к северо-востоку от Сиэтла. По указаниям Уайта я приехал по шоссе 520 к гаражу и современному зданию со стеклянным фасадом, отмеченному номером 99 и населенному почти исключительно кандидатами наук.

Уже по окончании рабочего дня Уайт провел меня мимо охраны в лабиринт офисов, наполненных прототипами и экспериментами, и стеклянных стен, покрытых уравнениями. Уайт ушел из DARPA в мае 2015-го, как раз перед истечением срока своего назначения (организация нанимает исследователей только на ограниченный период времени, чтобы поток идей был постоянным, а набор талантов — всегда свежим). Но Уайт снова чувствовал, будто выскочил из кроличьей норы и оказался на перекрестке.

Поначалу он хотел основать компанию, которая позволила бы компаниям проводить собственный анализ данных и работу по сетевой безопасности с помощью автоматизации и искусственного интеллекта. Идея была достаточно хороша, чтобы ей заинтересовались венчурные капиталисты. Но потом Уайт подумал о жизни в роли директора стартапа, о том, как тяжело это скажется на его отношениях с невестой (в этом марте Уайт женился), и о том, каким ограниченным будет влияние этого стартапа на мир.

Поэтому вместо того, чтобы десять лет потратить на работу директором, Уайт выбрал существование, которое он считал более простым, но и более значимым.

На посту главного исследователя в отделении особых проектов Microsoft он имеет возможность развивать свой труд над Memex и создавать доступные и удобные инструменты изучения и визуализации данных для предприятий (и журналистов, и всех остальных).

«Планка стала еще выше. Вопрос уже не в том, можем ли мы сделать что-то, что будет работать, а в том, сможем ли мы сделать что-то, что будет работать для миллиарда людей», — говорит Уайт

Он надеется, что этот новый проект, в числе прочего, изменит отношения людей с большими данными и друг с другом. Он также может повлиять на нашу демократию самыми невообразимыми способами.

Перед моим уходом Уайт раскрыл свой Lenovo ThinkPad X1 и открыл инструмент под названием Newman — программу визуализации данных, отображающую структуры в истории электронной переписки. В данном случае это была переписка Джеба Буша за восемь лет на посту губернатора Флориды. За несколько секунд Ньюман рассортировал 250 тысяч писем в узловую структуру, показывающую, кому и как часто писал Буш, какие письма копировал, кому их отправлял и насколько быстро на эти письма отвечали. По сути, это была интерактивная карта влияния и принятия решений, внутренности нашей демократии, вывернутые наружу. Уайт легко мог заставить программу показать развитие отношений с лоббистами и донорами, вертя данные кандидата под разными углами, будто яблоко в руке.

«В экономике знаний это огромная власть, — говорит Уайт. — На данный момент существует лишь несколько браузеров, и они являются нашей единственной связью с мировым информационным полем. С Memex мы могли бы как-то это изменить».

Инструменты Memex могут показать передвижения рекрутов или пропаганды ИГИЛ; связи между подставными компаниями и отмыванием денег; незаконные потоки оружия или рабочей силы и частоту упоминаний в соцсетях слов и идей, как и их контекст, в режиме онлайн на карте. Их использовали для отслеживания вспышки Эболы в Западной Африке, чтобы понять, как люди попадали в опасную зону и уезжали из нее, и помочь Белому дому определиться с тем, как реагировать на вспышку. Они также могут отслеживать и отобразить общественные настроения и их изменения по всей планете.

Нетрудно представить, как такая прозрачность повлияет на наше понимание общественного мнения за пределами нашего ограниченного Twitter и Facebook кругозора. Еще проще представить угрозу, которую такая прозрачность представляет для современной интернет-модели власти и выгоды — рекламщиков, зависящих от оплачиваемых экспертов, оценивающих или рецензирующих их продукт, либо использующих SEO-трюки или деньги для искажения интернет-поиска в свою пользу, и поисковых компаний, зарабатывающих на продаже доступа к этому влиянию. Или для диктатур, пользующихся теми же технологиями для влияния и контроля над своими гражданами. Или даже для демократии, где горстка технологических компаний контролирует потоки информации, из-за чего даже самые добропорядочные корпорации не могут избежать незримых искажений в том, что видят пользователи, и в информации, на которой они основывают свой выбор и свое мнение.

Если Уайт прав, Memex — это только начало поколения инструментов, которые помогут Интернету не превратиться в один огромный торговый центр. Это хорошо. Это намного лучше, чем то, что у нас есть сейчас. Но будет ли оно чем-то значительным? Сделает ли оно нас лучшими гражданами или более полноценными людьми?

Какое-то мгновение Уайт просто смотрит на меня, а потом почти улыбается.

«Это очень интересные и очень важные вопросы», — говорит он.

На эти вопросы он только начинает проливать свет.

Автор: Чарльз Граебер.
Оригинал: Popular Science.

Перевели: Оля Кузнецова, Сергей Пахомов, Влада Ольшанская и Кирилл Козловский.
Редактировали: Артём Слободчиков, Роман Вшивцев, Кирилл Казаков и Сергей Разумов.