Спецпроекты

ИТ-гиганты патентуют шпионаж

Мобильность

Конец 2018 г. выдался богатым на патенты, описывающие разнообразные технологии слежки за пользователями. Крупнейшие ИТ-компании не скрывают своего стремления любым способом собрать как можно больше информации о передвижениях и личной жизни своих клиентов. Так Facebook получила три патента на методы прогнозирования будущего местоположения пользователей, Google патентует технологии, позволяющие следить за людьми в их собственном жилище, а Amazon готова нацелить на распознавание личности даже дверные звонки.

Куда идет король, большой-большой секрет?

Facebook располагает сразу несколькими алгоритмами, позволяющими предсказать, куда направится человек. В конце этого года патентное ведомство США удовлетворило три заявки компании и зарегистрировало на ее имя технологии по прогнозированию передвижений людей.

Так 4 декабря Facebook получила патент под названием Offline Trajectories («Траектория движения в автономном режиме»). В нем описывается метод вычисления возможного местоположения пользователя в будущем. Для этого используется два основных информационных блока. Первый состоит из метаданных, полученных с клиентского устройства, в том числе и координаты его текущего местоположения. Второй блок включает в себя метаданные, связанные с друзьями и незнакомыми людьми, которые ранее уже находились в этой же локации, а также шаблоны их передвижений.

Далее на основе этой информации и методов машинного обучения строится компьютерная модель, которая и определяет возможные направления движения пользователя. Кроме того, также вычисляется вероятность отсутствия связи в каждой из предсказанных географических локаций.

13 ноября на имя Facebook был зарегистрирован патент под названием Location prediction using wireless signals on online social networks («Прогнозирование местоположения с помощью беспроводных сигналов в социальных сетях»). В нем представлен алгоритм, позволяющий «предсказать следующее место, куда прибудет пользователь, учитывая информацию о предыдущем месте, которое пользователь посетил или посетит».

Технология основывается на определении силы сигнала Wi-Fi, Bluetooth, сотовой связи или NFC. Эта информация о «фоновом излучении» может быть использована в качестве альтернативы или в сочетании с GPS, поскольку, как описывается в патенте, она может обеспечить преимущество более точного и четкого определения географического местоположения клиентского устройства. Кроме того, с помощью этих данных технология также позволяет определять категорию текущего места (например, бар, супермаркет или тренажерный зал), часы его работы, количество пользователей, находящихся там, а также «любые другие подходящие признаки». Этот алгоритм позволит компании не только отслеживать локации, где бывает пользователь, и время, когда он там бывает, но также оценить пользовательские привычки и предсказать его поведение.

depositphotos197222378m2015-crop_600-400.jpg
Фото: depositphotos
Facebook располагает сразу несколькими технологическими решениями, позволяющими предсказать передвижение пользователей

18 сентября Facebook получила патент под названием Predicting locations and movements of users based on historical locations for users of an online system («Прогнозирование местонахождения и передвижения пользователей на основе истории местоположений для пользователей онлайн-системы»). В нем описана технология построения поведенческой модели, основанной на отслеживании данных о перемещениях пользователей, и объединения в группы тех из них, кому интересны одни и те же места.

Согласно патенту, онлайн-система получает информацию о местоположении от множества клиентских устройств. На основе этих данных строятся цепочки мест, посещаемых каждым из пользователей. Далее сопоставляя эти цепочки, система генерирует одну или несколько пар локаций, где каждая из них включает в себя первое – начальное – местоположение и второе местоположение, в которое с высокой вероятностью отправится человек. Такие пары могут применяться с различными целями, например, для таргетированной рекламы или для предоставления сведений о перемещениях пользователей. Кроме того, технология может различать тенденции передвижения среди постоянных жителей населенного пункта, и тех, кто находится там с визитом.

После появления информации об этих патентах, пресса и эксперты незамедлительно обрушились с критикой в адрес Facebook. В ответ компания поспешила успокоить общественность, заявив, что регистрация технологических решений вовсе не означает их обязательную реализацию.

«Мы часто получаем патенты на технологии, которые мы никогда не внедряем, и патентные заявки, такие как эта, не должны рассматриваться как указание на будущие планы», – рассказал Buzzfeed News пресс-секретарь Facebook Энтони Харрисон (Anthony Harrison).

Но, как отмечают эксперты издания, даже если Facebook и не планирует внедрение этих технологий, получение патентов демонстрирует интерес компании к отслеживанию и прогнозированию действий пользователей. Кроме того, уже сейчас мобильное приложение Facebook собирает данные о местоположении клиентов, чтобы «предоставить более персонифицированные впечатления».

При этом Facebook – не единственный технологический гигант, замеченный в подобных устремлениях. Apple и Google также попадались на своей неуемной любви к сбору геолокационных сведений. Хотя, как показало исследование Дугласа Шмидта из университета Вандербильта, аппетиты «яблочной компании» несколько скромнее: устройства под управлением ОС Android отправляют в Google почти в десять раз больше геоданных, чем iPhone и iPad – в Apple. Чуть позже Associated Press опубликовала расследование, в котором указывается, что многие службы Google, работающие на устройствах Android и iPhone, хранят информацию о местоположении, даже если пользователь явно запретил это делать.

А в конце ноября были опубликованы результаты еще одного расследования, согласно которым устройства под управлением Android собирают данные о местоположении пользователя и отправляют их в Google, даже если на них отключены геолокационные сервисы, не запущено ни одно приложение или отсутствует SIM-карта. Практически одновременно с этим несколько групп защиты потребителей из Нидерландов, Норвегии, Швеции и Словении подали жалобы национальным властям на то, что Google нарушает Общий регламент по защите данных (GDPR). В заявлениях указывается, что компания собирает сведения о местоположении пользователей своих приложений, но не предоставляет им «ясной информации о том, что это влечет за собой».

Не просто геолокация

И как установили ученые, сбор и хранение информации о местоположении может иметь серьезные последствия. В начале декабря ученые из Массачусетского технологического института (MIT) опубликовали результаты исследования, которые указывают: объединение геолокационных сведений с различными типами данных может упростить распознавание пользователей. Даже если они анонимны.

В своей работе исследователи составили два анонимизированных набора данных «низкой плотности» – несколько записей в день – об использовании сотовых телефонов и личного транспорта в Сингапуре, записанных в 2011 г. Мобильные данные поступили от крупного оператора связи. 485 млн записей о более чем 2 млн пользователей содержали информацию с временными метками и географическими координатами. Данные о передвижениях были предоставлены местной транспортной сетью и содержали более 70 миллионов записей с временными метками для лиц, перемещающихся по городу.

Модель исследователей была построена на выборе пользователя из одного набора данных и поиске соответствующего пользователя в другом наборе данных с большим количеством совпадающих меток местоположения. Ученые указывают, что в рамках этой модели по мере увеличения количества совпадающих точек вероятность ложноположительного совпадения уменьшается.

«Я был на острове Сентоза в Сингапуре два дня назад, вчера приехал в аэропорт Дубая и сегодня нахожусь на пляже Джумейра в Дубае. Маловероятно, что траектория другого человека выглядит точно так же. Короче говоря, если у кого-то есть моя анонимная информация о кредитной карте и, возможно, мои открытые данные о местоположении из Twitter, они могут деанонимизировать данные моей кредитной карты», – объясняет Кало Ратти (Carlo Ratti), соавтор исследования, профессор кафедры градостроительства и урбанистики MIT, руководитель исследовательской лаборатории в Senseable City Lab MIT.

Сосредоточившись на типичных пользователях, авторы работы выяснили: успех сопоставления записей составляет 17% на основе анализа данных, собранных в течение недели, около 55% – в течение четырех недель и 95% – с данными, накопленными за 11 недель. Кроме того обнаружилось, что в случае объединения двух наборов данных с данными мониторинга GPS, которые регулярно активно и пассивно собирают приложения для мобильных устройств, успех сопоставления возрастает до 95% на основе анализа информации, собранной менее чем за одну неделю.

Ученые предупреждают, этот метод демонстрирует эффективный масштабируемый способ сопоставления траекторий мобильности в наборах данных. Его использование может стать не только мощным инструментом для исследователей, но и повысить вероятность деанонимизации пользовательских сведений в реальных условиях.

«Мир сегодня наводнен большими данными. В 2015 г. человечество произвело столько информации, сколько было создано за все предыдущие годы развития цивилизации, – рассказал Даниэль Кондор (Daniel Kondor), постдок Группы по городской мобильности Альянса Сингапура и MIT в области исследований и технологий. – Хотя данные означают лучшее понимание городской среды, в настоящее время большая часть этого информационного богатства хранится всего в нескольких компаниях и государственных учреждениях, которые знают о нас много, в то время как мы знаем о них крайне мало. Мы должны позаботиться о том, чтобы избежать монополий на данные и злоупотребления ими».

Дом, милый дом

Но интересы Google в области пользовательских данных не ограничиваются лишь отслеживанием местоположения. Компания стремится собрать как можно больше информации из разных источников. Оценивается все: поисковые запросы, электронные письма, данные мобильных приложений... И как показывает блок из двух патентных заявок, Google готова следить за своими клиентами даже в их собственных домах.

В марте 2015 г. с разницей в один день компания подала в американское Ведомство по патентам и товарным знакам заявления на регистрацию двух схожих технологий по управлению умным домом. Первая патентная заявка под названием Privacy-aware personalized content for the smart home («Персонализированный контент для умного дома с учетом конфиденциальности») описывает систему устройств, которые сканируют и анализируют внутреннее пространство дома и его внешнее окружение, а затем предлагают различный контент на основе того, что они обнаружили.

depositphotos210512408m2015-crop_600-400.jpg
Фото: depositphotos
Система поможет управлять домашним хозяйством, а также контролировать поведение членов семьи и посторонних, находящихся в доме

Согласно тексту заявки, «ежедневно люди взаимодействуют с различными электронными устройствами. В домашних условиях это могут быть компьютеры, интеллектуальные телевизоры, планшеты, умные термостаты, системы освещения, сигнализации, развлекательные системы и т.д. Интеллектуальные электронные устройства могут представлять рекламу и/или другой контент».

«Чувствительное устройство (умная камера) может, например, распознать лицо Уилла Смита на футболке, лежащей на полу в шкафу. После сопоставления этой информации с историей веб-браузера, система может определить, что пользователь недавно искал Уилла Смита в интернет. Соответственно, клиентское устройство может использовать сочетание данных объекта и историю поиска, чтобы предоставить пользователю рекомендацию фильма: “Вам, кажется, нравится Уилл Смит. Новый фильм с его участием можно посмотреть в кинотеатре недалеко от вас”».

И это не предел. В заявке предполагается, что устройства умного дома будут делать все типы выводов о пользователях, сортируя их по категориям на основе того, что «видят» и «слышат» датчики в личном пространстве.

Так в качестве еще одного примера приводится ситуация, когда система с помощью интеллектуальных видеокамер обнаруживает, что пятнадцатилетний подросток (средний сын в семье) с баскетбольным мячом в руках входит в комнату и включает смарт-ТВ. «В ответ видеокамера может отправить на клиентское устройство идентификатор среднего сына, его пол (мужчина), возраст (пятнадцать лет) и данные, связанные с баскетболом. В свою очередь клиентское устройство на основе полученных данных о людях/объектах может выбрать контент для демонстрации во время рекламной паузы. Этот контент может включать рекламу баскетбольного лагеря в местной средней школе, новой баскетбольной видеоигры, анонс телевизионного расписания местной команды, выступающей в Национальной баскетбольной лиге (НБА), и т.д».

Используя распознавание объектов, система может не только оценивать «модные предпочтения», но и благосостояние клиентов на основе любых «дорогих механических и/или электронных устройств», которые она обнаружит. Умный дом порекомендует, что смотреть, где покупать, какой выбор сделать, и все это исходя из того, к какой категории вкусов, доходов и интересов был «отнесен» пользователь.

Эта патентная заявка все еще находится на рассмотрении регистрационного ведомства США. Вторая заявка Google уже удовлетворена: 30 октября 2018 г. компания получила патент под названием Smart-home automation system that suggests or autmatically implements selected household policies based on sensed observations («Система автоматизации умного дома, которая предлагает или автоматически реализует выбранные политики домохозяйства на основе сенсорных наблюдений»). В этом случае описывается система, которая поможет управлять домашним хозяйством, используя датчики и камеры. В том числе и для контроля поведения членов семьи и посторонних, находящихся в доме.

Так, в тексте патента говорится, что для оценки эмоционального состояния система с помощью оптических датчиков может регистрировать мимику, движения головы или другую активность людей. Дополнительно для этого может быть использован анализ информации, поступающей с аудиорегистраторов (для сопоставления со звуковыми шаблонами плача, смеха, повышенных голосов и т. д.) и с инфракрасных сенсоров (для оценки температура тела). Кроме того, «после определения эмоционального состояния жильца, система может сообщать и/или записывать результаты для последующего использования. Например, полученные данные могут применяться в отчетах о домашних хозяйствах, уведомлениях в режиме реального времени или для управления интеллектуальными устройствами в доме».

Причем, в патенте отдельно описывается, как умный дом может создавать поведенческие шаблоны для разных членов семьи. В частности, родители могут запрограммировать систему на отслеживание и ограничение действий детей: прослушивать используют ли они в своей речи нецензурную лексику; сканировать использование интернета на предмета обращения к сайтам с нежелательным или «зрелым» контентом; использовать датчики присутствия, чтобы определить, направляются ли они в потенциально опасные участки дома (в тексте документа приводятся такие примеры, как родительская спальня, винный шкаф или кухонный стеллаж, содержащий ядовитые чистящие средства). В качестве предупреждения детей о том, что их действия недопустимы, система может быть настроена на «изменение цвета умных осветительных устройств на красный и перевод их в режим мигания» или даже на полное отключение освещения и других электроприборов.

Помимо определения внутренних правил поведения для отдельных членов семьи, эта технология также предусматривает возможность установки политик для целого домохозяйства. К примеру, семья может поставить цель: «тратить меньше времени на гаджеты» или «использовать на 5% меньше энергии в течение следующих трех месяцев». В некоторых вариантах успешность достижения цели «может быть определена путем опроса одного или нескольких членов домашнего хозяйства (например, через графический интерфейс пользователя)». В других – может оцениваться компьютером «на основе наблюдаемого поведения членов домашнего хозяйства; на основе определенных входных данных, полученных от интеллектуальных устройств в доме; на основе определенных входных данных от удаленных поставщиков/посредников/регуляторов и т. д.; или на основе любой их комбинации».

Это может предоставить компаниям возможность вознаграждать семьи или отдельных пользователей за «правильное» поведение либо лояльность бренду. К примеру, медицинские организации могут получить доступ к умным кухонным устройствам для выяснения и контроля пищевых привычек и на основе этого устанавливать расценки на медобслуживание. Компании по страхованию жизни могут контролировать датчики дыма или камеры наблюдения для того, чтобы отслеживать курильщиков… В обмен на глубоко конфиденциальную информацию пользователи смогут получать скидки или изменение тарифных планов. Как отмечают эксперты, уже сейчас все чаще в реальной жизни и в режиме онлайн потребители сталкиваются с выбором: персональные данные или удобство. И если появится необходимость решать, что важнее: доступ в личное пространство или повышение коммунальных либо страховых платежей, выбор пользователей может оказаться на пользу Google.

Сколько данных нужно, чтобы позвонить в дверь?

Еще один «шпионский» скандал разгорелся в начале декабря после того, как пресса обратила внимание на опубликованную 29 ноября патентную заявку Amazon под названием Generating Composite Facial Images Using Audio/Video Recording and Communication Devices («Создание композитных изображений лица с помощью аудио/видеозаписи и коммуникационных устройств»). В ней описывается технология наблюдения за окрестностями жилища с помощью системы, состоящей из дверного звонка и сети датчиков (видеокамер, аудиозаписывающих устройств и даже сенсоров ДНК). Она может работать вместе с технологией распознавания лиц, использующей разнообразные алгоритмы, такие как захват трехмерного изображения с нескольких камер, анализ текстуры кожи, анализ тепловизионных изображений головы и т.д.

В заявке указываются и дополнительные варианты автоматической идентификации и сбора сведений, которые могут использоваться для проверки личности и/или авторизации человека, включая, без ограничений, биометрические данные. «Примеры содержат, но не ограничиваются ими, отпечатки пальцев, вены ладони, распознавание лица, трехмерное распознавание лица, анализ текстуры кожи, ДНК, отпечатки ладоней, геометрию руки, распознавание радужной оболочки глаз, распознавание сетчатки и распознавание запаха/аромата». А также поведенческие характеристики, включая, помимо прочего, походку и распознавание голоса.

Кроме того, в заявке подробно описано взаимодействие системы с базой данных, содержащей максимум возможной информации «о каждом известном подозрительном человеке». Тем не менее, допускается и наличие минимума сведений: достаточно изображения лица подозреваемого, даже если оно не идентифицировано по имени или иным удостоверяющим признакам.

Эта база данных может представлять собой БД «осужденных преступников и/или зарегистрированных лиц, совершивших сексуальные преступления». Одновременно с этим указывается, что в некоторых реализациях технологии база данных известных подозрительных лиц может быть изменена пользователем, например, через клиентское устройство. В частности, «пользователь после просмотра сохраненных составных изображений лица посетителей может идентифицировать человека как подозрительного. Это составное изображение лица затем может быть загружено в базу данных». Также предусмотрена возможность информирования соседей о подозрительных людях, находящихся поблизости.

Сразу после появления в СМИ публикаций, посвященных этой патентной заявке, представители Ring, дочерней компании Amazon, выступили с заявлением для прессы: «Мы всегда внедряем инновации в интересах соседей, чтобы сделать наши районы лучшими местами для жизни, и этот патент является одной из многих идей для улучшения услуг, которые мы предлагаем. Тем не менее, патенты не обязательно отражают текущие изменения в продуктах и услугах, и эта патентная заявка, безусловно, не подразумевает реализацию. Конфиденциальность имеет первостепенное значение для нас, и мы всегда разрабатываем наши услуги, включая надежную защиту персональной информации».

depositphotos222279918m2015-crop_600-450.jpg
Фото: depositphotos
Система может применять не только технологию распознавания лиц, но другие варианты автоматической идентификации, включая использование биометрические данных

Как и в случае с Facebook, представители Amazon озвучили отговорку, уже ставшую классикой: «патентование – не значит внедрение». Но в данном случае Amazon уже продемонстрировала готовность к использованию технологии распознавания лиц. Так в 2018 г. компания совместно с департаментами полиции Вашингтона и Орландо проводила испытание технологии Rekognition, которую, по словам Amazon, можно применять для идентификации «всех лиц на групповых фотографиях, многолюдных мероприятиях и в общественных местах». Эти испытания незамедлительно привлекли пристальное внимание защитников конфиденциальности, которые опасаются, что технологию можно использовать для отслеживания людей без их ведома или согласия. А в мае 2018 г. Ring анонсировала социальную сеть Neighbours, которая была создана для обмена фотографиями и видео о грабителях, подозрительной активности и воровстве. Технология, описанная в патентной заявке, может сделать эту платформу более мощной.

«Редко бывает, чтобы в патентных заявках излагались такие кошмарные детали, жуткий мир, который хочет создать компания, – отметил Джейкоб Сноу (Jacob Snow), адвокат по технологиям и гражданским свободам Фонда ACLU (Американского союза гражданских свобод) в Северной Калифорнии, в прошлом патентный специалист. – Amazon мечтает об опасном будущем, с ее технологией в сосредоточии массивной децентрализованной сети наблюдения, работающей в режиме реального времени».

Критики системы ссылаются на несколько важных аспектов. Прежде всего – это несовершенство технологии. Так летом был проведен эксперимент, в рамках которого Американский союз гражданских свобод протестировал эффективность системы распознавания лиц Rekognition от Amazon, используя 25 тыс. фотографий людей, сделанных после их ареста, и официальные фотографии 535 членов Конгресса США. В итоге программное обеспечение ошибочно определило 28 конгрессменов как лиц, которые подвергались аресту. Но такое несовершенство может оказаться лишь временной проблемой.

«Алгоритмы Amazon выиграют от массового внедрения этой технологии. Камеры компании будут регулярно фиксировать людей, входящих в дома, и это позволит тестировать и улучшать то, насколько хорошо алгоритм идентифицирует людей», – отметил в интервью CNN Мэтт Пруитт (Matt Pruitt), главный архитектор решений NEC.

Кроме того эксперты указывают, что если система, описанная в патентной заявке, будет реализована, то многие люди, осужденные или подозреваемые в совершении даже незначительных правонарушений, автоматически станут изгоями.

«Просто представьте, что человек, который имеет судимость, доставляет пакет или почту. Но система была настроена на автоматическое распознавание любого, у кого есть предыдущая криминальная история, как “подозрительное лицо”. А затем полицейские появляются в этом месте, когда этот человек просто делает свою работу, – пояснил Сноу. – Тогда у вас начинается взаимодействие между полицией и этим человеком. А мы видели, как взаимодействие между темнокожими людьми и полицией может стать смертельным по любой причине или без причины вообще».

Но, самое главное, эта технология подразумевает, что уже только для того, чтобы позвонить в дверь, люди должны будут подтверждать, пусть и косвенно, свою невиновность. Но даже в суде необходимо доказывать обратное.


Взгляд месяца

Почему идея внутренней разработки себя не оправдала

Александр Глазков

председатель совета директоров, «Диасофт»

Профиль месяца

Искусственный интеллект стал полумифическим понятием

Сергей Поляков

ИТ-директор Альфа-Банка