Что такое «дифференциальная конфиденциальность» и как она сохраняет мои данные анонимными?
Apple делает ставку на свою репутацию, обеспечивая конфиденциальность данных, которые она собирает у вас. Как? Используя то, что называется «Дифференциальная конфиденциальность».
Что такое дифференциальная конфиденциальность?
Apple объясняет это так:
Apple использует технологию дифференциальной конфиденциальности, чтобы помочь обнаружить шаблоны использования большого количества пользователей без ущерба для личной конфиденциальности. Чтобы скрыть личность человека, дифференциальная конфиденциальность добавляет математический шум к небольшому образцу модели использования человека. По мере того, как все больше людей используют один и тот же шаблон, начинают появляться общие шаблоны, которые могут информировать и улучшать пользовательский опыт..
Философия Дифференциальной Конфиденциальности заключается в следующем: любой пользователь, чье устройство, будь то iPhone, iPad или Mac, добавляет вычисление к большему пулу совокупных данных (большая картинка, образованная из разных меньших картинок), не должен показываться как источник, не говоря уже о том, какие данные они предоставили.
Apple не единственная компания, которая делает это, и Google, и Microsoft использовали ее еще раньше. Но Apple популяризировала его, подробно рассказав об этом в своем выступлении на WWDC в 2016 году..
Вы спросите, как это отличается от других анонимных данных? Ну, анонимные данные все еще могут быть использованы для вывода личной информации, если вы знаете достаточно о человеке.
Допустим, хакер может получить доступ к анонимной базе данных, которая показывает платежную ведомость компании. Допустим, они также знают, что Сотрудник X переезжает в другой район. Затем хакер может просто запросить базу данных до и после перемещения сотрудника X и легко определить его доход.
Чтобы защитить конфиденциальную информацию Сотрудника X, Дифференциальная конфиденциальность изменяет данные с помощью математического «шума» и других методов, так что если вы запрашиваете базу данных, вы получите только приближение о том, сколько (или кто-либо еще) сотрудник X был заплачен.
Следовательно, его конфиденциальность сохраняется благодаря «разнице» между предоставленными данными и добавленным к ним шумом, поэтому в таком случае достаточно расплывчато, так что практически невозможно узнать, являются ли эти данные, которые вы просматриваете, на самом деле конкретными людьми..
Как работает дифференцированная конфиденциальность Apple??
Дифференциальная конфиденциальность является относительно новой концепцией, но идея заключается в том, что она может дать компании острое понимание, основанное на данных от ее пользователей, не зная, что именно так эти данные говорят или от кого они происходят.
Например, Apple полагается на три компонента, позволяющих использовать дифференциальную конфиденциальность на вашем компьютере Mac или iOS: хеширование, субсэмплинг и внедрение шума.
Хеширование берет строку текста и превращает ее в более короткое значение с фиксированной длиной и смешивает эти ключи в необратимо случайные строки уникальных символов или «хэш». Это скрывает ваши данные, поэтому устройство не сохраняет их в первоначальном виде..
Подвыборка означает, что вместо того, чтобы собирать каждое слово, которое вводит человек, Apple будет использовать только меньшую их выборку. Например, скажем, у вас есть длинный текстовый разговор с другом, свободно использующим эмодзи. Вместо того, чтобы собирать весь этот разговор, субсэмплинг может использовать только те части, которые интересуют Apple, такие как эмодзи.
Наконец, ваше устройство вводит шум, добавляя случайные данные в исходный набор данных, чтобы сделать его более расплывчатым. Это означает, что Apple получает результат, который был слегка замаскирован и поэтому не совсем точен.
Все это происходит на вашем устройстве, поэтому оно уже было сокращено, перепутано, отобранно и размыто до того, как оно было отправлено в облако для Apple для анализа.
Где используется дифференцированная конфиденциальность Apple??
Есть множество случаев, когда Apple может быть хочу собирать данные для улучшения своих приложений и сервисов. Хотя сейчас Apple использует дифференциальную конфиденциальность только в четырех конкретных областях..
- Когда достаточное количество людей заменяет слово определенным эмодзи, оно станет предложением для всех.
- Когда новые слова добавляются в достаточное количество локальных словарей, чтобы считаться обычным явлением, Apple также добавит их в словарь всех остальных.
- Вы можете использовать поисковый термин в Spotlight, и он затем предоставит предложения приложений и откроет эту ссылку в указанном приложении или позволит установить ее из App Store. Например, скажем, вы ищете «Звездный путь», который предлагает приложение IMDB. Чем больше людей откроют или установят приложение IMDB, тем больше оно появится в результатах поиска всех пользователей..
- Это обеспечит более точные результаты для подсказок поиска в примечаниях. Например, скажем, у вас есть заметка со словом «яблоко». Вы выполняете поиск по поиску, и он дает вам результаты не только для определения словаря, но также для веб-сайта Apple, мест расположения магазинов Apple Store и т. Д. Предположительно, чем больше людей нажимают на определенные результаты, тем выше и чаще они будут появляться в поиске для всех остальных.
Давайте использовать смайлики в качестве примера. В iOS 10 Apple представила новую функцию замены эмодзи в iMessage. Введите слово «любовь», и вы можете заменить его смайликом сердца. введите слово «собака», и - как вы уже догадались - вы можете заменить его на смайлик собаки.
Точно так же ваш iPhone может предсказать, какой смайлик вы хотите, так что, если вы наберете сообщение «Я собираюсь выгулять собаку», ваш iPhone услужливо предложит вам смайлик для собаки..
Таким образом, Apple берет все эти небольшие кусочки данных iMessage, которые она собирает, анализирует их в целом и может вывести шаблоны из того, что люди печатают и в каком контексте. Это означает, что ваш iPhone может дать вам более разумный выбор, потому что он извлекает выгоду из всех тех текстовых разговоров, которые другие создают и думают: «Это, вероятно, тот смайлик, который вам нужен».
Требуется Деревня (Emoji)
Недостатком дифференциальной конфиденциальности является то, что она не дает точных результатов в небольших выборках. Его сила заключается в том, чтобы сделать конкретные данные неопределенными, чтобы их нельзя было приписать какому-либо одному пользователю. Для того, чтобы он работал и работал хорошо, многие пользователи должны участвовать.
Это как смотреть на растровое фото очень близко. Вы не сможете увидеть, что это такое, если вы посмотрите только на несколько бит, но когда вы отступите назад и посмотрите на все это, картина станет более четкой и более четкой, даже если она не очень высокая. разрешающая способность.
Таким образом, чтобы улучшить замену и прогнозирование смайликов (среди прочего), Apple необходимо собирать данные iPhone и Mac со всего мира, чтобы дать ей все более четкое представление о том, что люди делают, и, таким образом, улучшить свои приложения и услуги. Он обращается ко всем этим рандомизированным, шумным, краудсорсинговым данным и копирует их для шаблонов, таких как, например, сколько пользователей используют персиковые смайлики вместо «задницы».
Таким образом, способность дифференциальной конфиденциальности полагается на то, что Apple может проверять большие объемы совокупных данных, и в то же время гарантирует, что никто не знает, кто отправляет им эти данные..
Как отказаться от дифференциальной конфиденциальности в iOS и macOS
Если вы все еще не уверены, что дифференциальная конфиденциальность вам подходит, то вам повезло. Вы можете отказаться прямо из настроек вашего устройства.
На вашем устройстве iOS нажмите «Настройки», а затем «Конфиденциальность»..
На экране конфиденциальности нажмите «Диагностика и использование»..
Наконец, на экране «Диагностика и использование» нажмите «Не отправлять».
В macOS откройте Системные настройки и нажмите «Безопасность и конфиденциальность».
В настройках «Безопасность и конфиденциальность» перейдите на вкладку «Конфиденциальность» и убедитесь, что флажок «Отправить диагностические данные и данные об использовании в Apple» не установлен. Обратите внимание, что вам нужно будет щелкнуть значок замка в левом нижнем углу и ввести системный пароль, прежде чем вы сможете сделать это изменение.
Очевидно, что в дифференциальной конфиденциальности гораздо больше, как в теории, так и в применении, чем это упрощенное объяснение. Мясо и картофель в нем сильно зависят от серьезной математики и, как таковые, могут стать довольно весомыми и сложными..
Надеемся, однако, что это дает вам представление о том, как это работает, и что вы чувствуете себя более уверенно в компаниях, собирающих определенные данные, не опасаясь быть идентифицированными.