FindFace — приложение, которое может положить конец анонимности

Технологии

Представьте, что вы сидите в кофейне. Краем глаза вы замечаете, как незнакомец наводит на вас телефон. На следующий день вы получаете письмо от человека, который утверждает, что видел вас в кофейне. Он приглашает на свидание. Вы понятия не имеете, как он с вами связался и как вообще узнал ваше имя.

Возможность опознавать совершенно незнакомых прохожих — гвоздь рекламной кампании новой волны стартапов, которые надеются извлечь выгоду из стремительно развивающейся технологии распознавания лиц. Но в России это уже реальность.

FindFace, приложение, запущенное российским стартапом два месяца назад, дает пользователям возможность опознавать незнакомцев по фотографиям их лиц. Она строится на сопоставлении фото с аватарками из VK (также известного как «ВКонтакте»), российской социальной сети, схожей с Facebook. Авторы приложения продвигают его как отличный инструмент для того, чтобы завязать отношения или познакомиться. Но это колоссальная угроза для приватности.

После запуска многие новостные издания задавались вопросом, появятся ли схожие продукты в США. Но настоящая угроза не в том, что приложение вроде FindFace придет к такой социальной сети как Facebook. А в том, что в скором времени оно может быть подключено к бесчисленному количеству баз данных с фото, например, к каталогам университетов или спискам работников — или даже ко всему интернету.


Вот как работает FindFace. Сначала вы делаете фото того, кого хотите опознать. Затем загружаете фото в приложение, которое ищет картинки из «ВКонтакте» и возвращает вам те, которые считает похожими. Алгоритм распознавания лиц FindFace ультрасовременный — создан компанией под названием NTech Lab (она недавно шла нога-в-ногу с алгоритмом распознавания лиц от Google на международном соревновании Вашингтонсокго университета — но ничего нового в этом нет). Facebook производит такие поиски каждый день, хотя и по другим базам данных. Настоящая инновация, сделавшая FindFace такой угрозой конфиденциальности — это база данных.

Когда вы загружаете фото на Facebook, он сравнивает лица на этой фотографии только с лицами ваших друзей. FindFace, с другой стороны, ищет по всем аватарам из «ВКонтакте». Это означает, что каждый раз, когда кто-то загружает фото в FindFace, оно подбирает похожие из базы данных, содержащей каждого участника самой популярной социальной сети в русскоязычном мире — сотни миллионов аккаунтов. И когда находится совпадение, приложение связывает этого человека с профилем «ВКонтакте», раскрывая его имя и контактную информацию.

Все аватары «ВКонтакте» находятся в публичном доступе, поэтому единственный способ скрыться из этой базы данных — удалить свою страницу. Это оставляет россиянам два нежелательных варианта: они могут либо уйти из «ВКонтакте» на менее популярную платформу, теряя новости, фото и сообщения, или смириться с тем, что их лица занесены в базу и доступны для поиска всему миру.


Мог ли кто-то сделать такое для Facebook? Наверное, нет.

Скорее всего, FindFace заполучил свою базу данных, выкачав её из VK — загрузив аватарки по одной либо через API «ВКонтакте», либо через посещения ботом каждого профиля VK. Это является привычной проблемой для крупных сайтов вроде Facebook, Twitter и Google, и поэтому они заблокировали «автоматизированный сбор данных» в своих Пользовательских соглашениях, усилили настройки конфиденциальности и внедрили сильные меры защиты от выкачки в форме «ограничения скорости». Если вы попытаетесь слишком быстро загрузить слишком много страниц, — напоминая скачивальщика или бота — эти сайты автоматически ограничат или обрежут вам доступ.

Это не значит, что Facebook в безопасности. Сайт не предоставляет возможности скрыть профиль от широкой публики, что является базовой мерой защиты от клона FindFace. По крайней мере, Facebook должен позволять вам показывать другую аватарку людям вне вашего круга друзей. При желании он также должен помогать вам, отображая эту аватарку в достаточно низком разрешении, чтобы алгоритмы распознавания лиц, подобные FindFace, не сработали. Facebook мог бы даже делать фото полутоновым или немного его размывать, ещё сильнее шифруя информацию, которая нужна технологии распознавания лиц для работы. Все эти возможности — всего лишь адаптации той же технологии, которая позволила людям наложить флаг Франции поверх своих аватарок из солидарности с Парижем после терактов в прошлом году.

Facebook обладает уникальной возможностью для того, чтобы предоставить ещё одну меру обеспечения секретности. Он может использовать собственные ресурсы для распознавания лиц, чтобы выяснять, совпадают ли ваши аватарки с чьими-либо ещё — иными словами, есть ли у вас двойники на Facebook. Если есть, тогда алгоритму вроде FindFace будет нелегко вычислить именно вас в сравнении с двойниками. А если вы уникальны, Facebook может предложить размыть ваше фото и снизить разрешение, пока вы не сольетесь с толпой.


Facebook может предложить столько мер по защите приватности потому, что он устроен как огороженный сад. Он контролирует контент вроде аватарок, и единственный способ его получить — использовать сам Facebook с ограничением скорости и прочими мерами. К сожалению, бескрайнее море изображений в Интернете — возможно, даже большинство изображений в Интернете — никем не контролируется.

Вбейте свое имя в Google. Взгляните на ряд знакомых лиц, и они взглянут на вас. Google не выкачал их тихой сапой из Facebook. Его армия ботов собрала их с миллионов публичных страниц и связала их с ключевыми словами на странице, включая ваше имя. Так как эти боты берут по чуть-чуть информации из самых различных мест, ни один сайт не обязан ограничивать эти посещения столь же сурово, как это делает Facebook. Собственно, большинство сайтов ждут этих посещений, чтобы их можно было найти в Google.

Сейчас основным способом поиска изображения является использование ключевых слов, которые его описывают. Google позволяет искать изображения с помощью других изображений, но он не использует для этого распознавание лиц — в нем нельзя искать известные лица, как в FindFace. Напротив, председатель совета директоров Google Эрик Шмидт назвал распознавание лиц «единственной технологией, которую Google, после раздумий, решил не создавать».

Но способность ползать по сети и собирать массивы фотографий — удел не только больших поисковых движков вроде Google. Хотя повтор FindFace в масштабе всего интернета, вероятно, на настоящий момент, находится вне сферы технологической осуществимости, это может недолго оставаться невозможным. По мнению экспертов из Национального института стандартов и технологий США (NIST), технология распознавания лиц экспоненциально улучшается, а стоимость хранения данных и вычислительных мощностей постоянно снижается. Стартап с малым числом этических запретов в скором времени сможет написать поискового робота, собрать базу данных и выпустить программу распознавания лиц с поиском по всему интернету, чего до этого воздерживался Google. А после того, как эта опция станет следующей неотъемлемой частью социальных сетей, продолжат ли такие компании,как Google, воротить нос?

Даже если завтра интернет не превратится в огромную базу данных распознавания лиц, эту технологию в меньшем масштабе можно применять уже сегодня — собственно, ею уже пользуются. В 2011 году Алессандро Аквисти, профессор в Университете Карнеги — Меллон, скачал аватары всех участников группы школы с Facebook и сравнил их с фотографиями с веб-камер добровольцев. Он обнаружил, что почти треть участников можно было опознать таким образом, выявляя их страницы на Facebook. С сегодняшними технологиями доля успешных исходов, скорее всего, будет намного выше. (За время, прошедшее после эксперимента Аквисти, Facebook усилил защиту после нескольких случаев массовой выкачки.)

В масштабе работы, университета или города приложения, похожие на FindFace, могут лишить нас практичной анонимности, которая, как нам кажется, есть у нас в сообществах, которые мы ежедневно посещаем. Размер этих онлайн-каталогов и других баз данных измеряется тысячами, а не миллиардами — масштаб, который может не привести в действие противошпионские средства, и который доступен существующим программам распознавания лиц. И многие из этих баз данных находятся в открытом доступе. Просто вспомните первый «facebook» (фотоальбом — прим. Newочём) — каталог имен и фотографий студентов университета.

Это может показаться крайностью, но жесткий выбор, перед которым стоят российские пользователи «ВКонтакте», может распространиться на всех пользователей интернета. Вы не можете просто удалить свой аккаунт из интернета, многие фотографии добавлены другими людьми без нашего ведома или согласия, вплоть до фотографий со школьной научной ярмарки или соседского соревнования в бассейне, которые были выложены в сеть, когда мы были слишком юны, чтобы вмешаться. В то числе это и фотографии с сайтов, на которых даже наше имя не указано.

В мире, который представляют создатели FindFace, вы можете попытаться скрыть свое лицо от интернета, прячась ото всех баз данных, которые соберут преемники FindFace. Или вам, возможно, придется признать, что вы больше не анонимны в общественных местах. Возможно, вы никогда больше не будете просто человеком в толпе.

Автор: Джонатан Франкл.
Оригинал: The Atlantic.

Перевели: Оля Кузнецова и Георгий Лешкашели.
Редактировали: Анна Небольсина и Артём Слободчиков.

Оцените статью
Добавить комментарий
  1. Игорь Кириллов
    Игорь Кириллов

    Вроде 1 хотели переводить.

    1. Георгий Лешкашели
      Георгий Лешкашели

      Иносми опередили.

  2. Дмитрий Няннянкин
    Дмитрий Няннянкин

    тру чики и пацанчики не пользуются вконтакте и факебуками, ващет.
    да и идентификация вряд ли будет работать адекватно. одно дело поиск фотографии, другое дело искать рожу, которая почти у каждого второго такая же.

    1. Валентин Тарасов
      Валентин Тарасов

      Дмитрий, вы, видимо, не пользовались файндфейсом.

      1. Дмитрий Няннянкин
        Дмитрий Няннянкин

        Valentin, им обязательно пользоваться? офк он будет работать, у него ведь предназначение такое. найти по фотографии более 1000 людей много ума не требуется.

        1. Валентин Тарасов
          Валентин Тарасов

          Дмитрий, он находит профиль человека по только что сделанной фотографии, которой до этого не было нигде.

          1. Дмитрий Няннянкин
            Дмитрий Няннянкин

            Valentin, я это понял, и что с того?

          2. Артём Арутюнов
            Артём Арутюнов

            > да и идентификация вряд ли будет работать адекватно. одно дело поиск фотографии, другое дело искать рожу, которая почти у каждого второго такая же.

            > он находит профиль человека по только что сделанной фотографии, которой до этого не было нигде.

            > я это понял, и что с того?

            орнул.

          3. Дмитрий Няннянкин
            Дмитрий Няннянкин

            Artyom, одно дело – речь про гугл-имагес и их подобие, другое дело – речь про только что сфотканные рожи. в чем ор-то, гений?

          4. Артём Арутюнов
            Артём Арутюнов

            Дмитрий, в том, что никто тебе про Google Images не говорил, а говорится о том, что уже есть приложения, способные прогоняя фото по алгоритму находить именно этого пользователя.
            См. пример – FindFace.
            О чем ты споришь то?

          5. Дмитрий Няннянкин
            Дмитрий Няннянкин

            Artyom, предположим, что есть 1000 человек, у которых внешность абсолютно одинакова, и все внезапно в вконтакте. каким образом он найдёт именно “ту бабу с той деревни слева”? инновационности тут вообще нет в принципе. также можно запилить определенный алгоритм, который находит папоротники по только что сделанной фотографии папоротника.
            и, вообще-то, в статье про гугл-имагес говорилось. я ведь читал.

          6. Николай Абрамов
            Николай Абрамов

            Dmitry, все люди разные по внешности, кроме близнецов.

          7. Валентин Тарасов
            Валентин Тарасов

            Дмитрий, установите файндфейс и проестируйте. Когда вы увидите, что среди первых совпадений именно тот человек, которого вы только что сфоткали, поймёте, что все мы разные.

          8. Юрий Молодцов
            Юрий Молодцов

            Дмитрий, а не бывает 1000 одинаковых людей. Бывают похожие. Бывают и близнецы — и FindFace, по-моему опыту, по фото одного находит и второго.

    2. Глеб Парфенов
      Глеб Парфенов

      Dmitri, тащемто таким способом нашли тьму порноактрис в ВКашечке, ну да ладно

    3. Артём Арутюнов
      Артём Арутюнов

      “тру чики и пацанчики” интернетом не пользуются и сидят исключительно на пейджерах, ага.

  3. Денис Пиявкин
    Денис Пиявкин

    а что если в вк нет фоток

  4. Ivan Ivanov
    Ivan Ivanov

    Мою реальную страницу ff не находит. У них, видимо, какая-то своя бд.

  5. Евгений Кедышко
    Евгений Кедышко

    В какомто кино было(коломбо вроде) водитель маску-фотографию надевал и его фоткала камера контроля скорости

  6. Андрей Макаев
    Андрей Макаев

    Комменты под этой статьей на атлантике)

  7. admin
    admin автор

    ИноСМИ перевели первый материал семь часов назад.

  8. Диана Костина
    Диана Костина

    Атлантик нормальное же издание вроде, но после их статей о диком русском интернете начинаю сомневаться.

    Буквально 4 дня назад они нашли вк группу американских нео-наци (состоящую из эмм… 19 человек? — ссылка есть в комментариях к статье) и написали о массовой миграции пользователей из стоящего на страже интерересов гуманности воина добра Фейсбука Цензуровича во Вконтакт Путинович, где обитают сплошь отбросы общества.
    В комментариях вообще все пишут что мол Трамп и Путин дружат, поэтому у нас есть такое вот контакте и вообще скоро Америка будет как Россия сплошь из неонаци.
    Вот такой вывод делает средний читатель этого материала:

    Ссылка: http://www.theatlantic.com/technology/archive/2016/05/extremist-groups-vkontakte/483426/

    1. Дмитрий Грушин
      Дмитрий Грушин

      Диана, а вам не кажется, что вы малость искаженное воспринимаете статью? Мне вот ничего такого между строк не видится.

      1. Диана Костина
        Диана Костина

        Вы про ту, под которой пишу комментарий? Перечитала, признаю, возможно, эмоционально выразилась. Полагаю, что и аудитория Антлантик подумала бы про “кишащий угрозами” русский интернет, прочитав обе недавние статьи в совокупности. Технически, статья про FindFace конечно сделана лучше. Отредактирую коммент на менее эмоциональный, чтобы уточнить свою позицию

        1. Дмитрий Грушин
          Дмитрий Грушин

          Диана, да я, собственно, про обе. Это в первую очередь субъективная разница в восприятии, но в статье о нео-нацистах по вашей ссылке я не вижу ни заявлений о массовой миграции пользователей, ни об отбросах общества в ВК.
          Я вижу в статье информацию, что забаненные в фб околофашисты нашли (временное?) пристанище в ВК. Вижу информацию, что это возможно благодаря менее жесткой модерации, но при этом отдельно указано, что и ФБ в этом плане далек от идеала. А насчет того, что пишут в комментариях — посмотрите хотя бы на соседние комментарии к этой статье. Комментируют далеко не исключительно самые умные или зрелые.
          В сущности, тут все сводится именно к восприятию материала конкретным человеком: вы видите одно, я другой, кто-то еще — третье. В этом и прелесть журналистики — она способна дать пищу для ума на любой вкус.

  9. Виктор Ковалев
    Виктор Ковалев

    Welcome to open data.

    По поводу анализа соц сетей. Есть скрипт, который находит все открытые фото в соц сетях в указанном месте в указанное время (photobygeo) . Теперь еще добавили сервис этот (раньше похожее было в виде приватных самописов у избранных).

    Ходишь в метро/общественном месте, знай, на рынке уже давно выпускаются системы распознавания лиц со скоростью свыше 10млн в сек, а у клевых контор свыше 30млн (привет NEC) причем в реальном времени. И если учесть тягу офф. правительств по сбору данных, соответствующие базы есть.

    Имеешь активную сим карту, знай, её появление в сети регестрируется на ближайшей станции. По идее для триангуляции достаточно на 3ех станциях провернуть махинацию, чтобы тебя вычислили (хотябы район/двор, а там можно и вручную).

    Есть всякие Shodan’ы, через которые, возможно нашли твою IP камеру, которую ты мог без особой настройки прокинуть в сеть, и с которой за тобой смогут понаблюдать.

    И т.д.

    Но к чему это все: нет пределу совершенства паранойи. Благо я этим страдаю в меру.

    Надеюсь социальная инженерия не доберется до тебя {UserName} ?

  10. Антон Воболок
    Антон Воболок

    Все собрались прогонять фотографии через сервис, хотя достаточно было узнать у гугла о других упоминаниях сервиса, чтобы понять, что это очередная нативная реклама.
    И спрашивается зачем переводить рекламу, которой и на русском предостаточно, когда есть множество интересных статей, что аж выбрать сложно.

    1. Эмиль Закиров
      Эмиль Закиров

      Антон, им есть что рекламировать – сервис реально хорош. попробуй сам, удивишься

      1. Антон Воболок
        Антон Воболок

        Эмиль, Вы наверное не прочитали. Я повторю.
        Зачем переводить рекламу, которой уже на русском хватает?

        1. Эмиль Закиров
          Эмиль Закиров

          Антон, это не реклама, это обзор сервиса, который может кому-то быть интересен. Реклама это “Мы лучшие – покупайте у нас”. По вашей логики презентация любой новой технологии – реклама.

          1. Антон Воболок
            Антон Воболок

            Эмиль, А вы отличаете, традиционную, диджитал, медийную и нативную?
            Можете погрузиться в маркетинг и узнать много интересного, особенно про то как сейчас выглядит реклама.

    2. Юрий Молодцов
      Юрий Молодцов

      Вы думаете, что все публикации про них это реклама?)

      1. Антон Воболок
        Антон Воболок

        Юрий, Я думаю, что переводить рекламу, это абсурд.

        1. Юрий Молодцов
          Юрий Молодцов

          Антон, почему это реклама то?

          1. Антон Воболок
            Антон Воболок

            Юрий, Потому что 17 упоминаний FindFace в Тексте, где всего 18 абзацев, это многовато. Потому что у её автора всего 1 самостоятельная статья – эта.
            Потому что это не первая подобная статья про сервис.
            А теперь докажите, что не реклама.

          2. Юрий Молодцов
            Юрий Молодцов

            Антон, какая разница самостоятельная или нет?
            Это contributor, а не редактор в штате. У большинства из них все несколькими статьями и ограничивается.
            Достаточно открыть его LinkedIn, чтобы понять, что человек на другом зарабатывает: https://www.linkedin.com/in/jfrankle

            И ни одно серьезное медиа в США не будет оформлять нативную рекламу как чью-то обычную статью, они всегда идут от редакции с пометками.
            А еще достаточно непросто написать статью про FindFace не упоминая FindFace.

            В общем, некоторые люди везде рекламу увидят. Особенно если особо часто читают американские издания.

          3. Антон Воболок
            Антон Воболок

            Юрий, Поздравляю вы нашли ещё 1 канал его заработков.
            Вы наверное не знаете, но в The New York Times (совсем несерьезное медиа) есть отдельное подразделение которое этим занимается, под названием – T Brand Studio. Есть отделы по меньше и в других изданиях.
            Ибо статья о FindFace, это реклама сервиса и его услуг. Ничто так хорошо не описывает сервис и его услуги, как реклама, не находите.
            В общем, некоторые люди до сих пор живут в прошлом веке традиционной рекламы. Особенно когда не читаю/слушают лекций специалистов СМИ. Как-то так это звучало бы с вашей стороны.

          4. Юрий Молодцов
            Юрий Молодцов

            Антон, я работаю в маркетинге и PR, поэтому вашу снисходительность можете оставить себе на ужин.
            Я отлично представляю, что такое нативная реклама, и одно безусловное правило для любого top-Tier медиа (включая NYT и The Atlantic) — эта реклама делается специальным отделом редакции и всегда соответствующе помечена.

            И если вдруг contributor зачем-то решил продать свои услуги, то над ним будет сидеть его editor, который будет бить за каждую лишнюю ссылку, и откровенную рекламу точно не пропустит.

            Пока что все ваши вопли “это рекламная статья, зачем переводили” строятся исключительно на вашем же не подтвержденном фактами мнении.

          5. Антон Воболок
            Антон Воболок

            Юрий, Рад за вас.
            Как назвать статью, в издании, где может публиковаться сторонний автор. Который пишет о сервисе из другой страны. При этом постоянно повторяет название сервиса и его услуги.
            Хотя в грамотных статьях предмет разбора и его функционал обозначаются лишь в начале, как тезис.
            Ответ в студию.

          6. Юрий Молодцов
            Юрий Молодцов

            Антон, наверное потому что статья о сервисе. А сторонние авторы публикуются под строгим надзором редактора. У того же англоязычного Forbes им вообще запрещено уходить с одной заданной темы.

          7. Антон Воболок
            Антон Воболок

            Юрий, Хорошо. Как какую цель преследуют статьи описывающие в большей степени сервис и его услуги? Сравни её с целями рекламы.

          8. Юрий Молодцов
            Юрий Молодцов

            Антон, это аргументация на уровне “мухам выгодны выброшенные котлеты, у кого еще может быть такая цель?”.

          9. Антон Воболок
            Антон Воболок

            Юрий, То есть вы не нашли никаких целей кроме рекламных?
            Что и требовалось доказать.

          10. Юрий Молодцов
            Юрий Молодцов

            Антон, да ничего вы не доказали, успокойтесь. Цель очень простая, журналист написал про интересную (и даже опасную) с его точки зрения технологию. Без каких-либо явных доказательств все эти утверждения про рекламу бред.

          11. Антон Воболок
            Антон Воболок

            Юрий, Повторите это для себя)
            Журналист написал про сервис и его услуги, которые основаны на технологии. А не о технологии которая применяется или не применяется в сервисах. И не нужно надумывать.
            Стоит понимать разницу между объектом и предметом статьи.

          12. Виктор Ковалев
            Виктор Ковалев

            Юрий, я тоже не вижу ничего интересного в конкретно данной статье. Толком ничего не сказано о выбранной технологии распознавания/хранения изображений (слепков). Много рассуждений о возможных применениях данного сервиса с примесью поверхностных опасаний за будущее анонимности людей (одна вода). Статья больше похожа на обзорную => больше рекламная (да, может они и не получат денег).

  11. Максим Малахов
    Максим Малахов

    Находил в файндфейсе своих двойников, довольно весело