Google відкриває інструмент “диференціальна конфіденційність” для розробників і вчених, що працюють з даними. Продукт буде цікавий всім, хто хоче мати безпеку інформації, що збирається.
Диференційно-приватний аналіз даних – метод, який дає можливість отримувати користь з оброблюваних відомостей, одночасно гарантуючи, що ці результати не дозволять виділити дані будь-якого окремого користувача.
Цей тип аналізу може бути реалізований різними способами і для різних цілей. Наприклад, дослідники в галузі охорони здоров’я можуть порівнювати середню кількість часу перебування пацієнтів в різних лікарнях, щоб визначити, чи є відмінності в одержуваному ними сервісі. Це досягається шляхом змішування нових призначених для користувача даних з штучним “білим шумом”. У підсумку результати будь-якого аналізу не можуть бути використані для ідентифікації людей і не дозволяють третій стороні відстежити будь-яку точку даних до її джерела.
У Google вирішили відкрити на GitHub доступ до версії диференціальної конфіденційності з відкритим вихідним кодом, яка вже використовується в деяких основних продуктах компанії.
Деякі з ключових особливостей бібліотеки:
- Статистичнi функції: у відкритій версії підтримуються найбільш поширені операції з даними. Розробники можуть обчислювати суми, середні значення, медіани, процентилi і лічильники;
- Ретельнi тестування. Щоб запобігти виникненню помилок при аналізі даних, в ПО включені набори тестів і “бібліотека стохастичних перевірок диференціальної моделі конфіденційності”;
- Готовнiсть до використання. До ПО додається технічний документ з описом особливостей ПО, щоб користувач зміг відразу почати роботу з продуктом;
- Модульна: бібліотеку можна розширити, включивши інші функції.
Аналогічну технологію використовує Apple при організації машинного навчання, орієнтованого на конфіденційність. Це дозволяє компанії отримувати дані з iPhone, статистично анонімізувати їх і ефективно отримувати корисну інформацію, наприклад, для поліпшення алгоритмів Siri. Google використовує той же підхід в Chrome, запобігаючи відстеження історії перегляду та інших конфіденційних відомостей.
Сервіс може бути корисний розробникам в сфері охорони здоров’я, соціології, бізнесі, державному секторі та ін.
“Ми використовували диференційно-приватні методи для створення корисних функцій в наших продуктах, наприклад, для визначення, наскільки завантажений бізнес протягом дня або наскільки популярна страва конкретного ресторану в Google Maps, і покращуємо [з їх допомогою] Google Fi”.
Джерело: internetua.com