Google допоможе розробникам і вченим зберегти конфіденційність даних

Google відкриває інструмент “диференціальна конфіденційність” для розробників і вчених, що працюють з даними. Продукт буде цікавий всім, хто хоче мати безпеку інформації, що збирається.

Диференційно-приватний аналіз даних – метод, який дає можливість отримувати користь з оброблюваних відомостей, одночасно гарантуючи, що ці результати не дозволять виділити дані будь-якого окремого користувача.

Цей тип аналізу може бути реалізований різними способами і для різних цілей. Наприклад, дослідники в галузі охорони здоров’я можуть порівнювати середню кількість часу перебування пацієнтів в різних лікарнях, щоб визначити, чи є відмінності в одержуваному ними сервісі. Це досягається шляхом змішування нових призначених для користувача даних з штучним “білим шумом”. У підсумку результати будь-якого аналізу не можуть бути використані для ідентифікації людей і не дозволяють третій стороні відстежити будь-яку точку даних до її джерела.

У Google вирішили відкрити на GitHub доступ до версії диференціальної конфіденційності з відкритим вихідним кодом, яка вже використовується в деяких основних продуктах компанії.

Деякі з ключових особливостей бібліотеки:

  • Статистичнi функції: у відкритій версії підтримуються найбільш поширені операції з даними. Розробники можуть обчислювати суми, середні значення, медіани, процентилi і лічильники;
  • Ретельнi тестування. Щоб запобігти виникненню помилок при аналізі даних, в ПО включені набори тестів і “бібліотека стохастичних перевірок диференціальної моделі конфіденційності”;
  • Готовнiсть до використання. До ПО додається технічний документ з описом особливостей ПО, щоб користувач зміг відразу почати роботу з продуктом;
  • Модульна: бібліотеку можна розширити, включивши інші функції.

Аналогічну технологію використовує Apple при організації машинного навчання, орієнтованого на конфіденційність. Це дозволяє компанії отримувати дані з iPhone, статистично анонімізувати їх і ефективно отримувати корисну інформацію, наприклад, для поліпшення алгоритмів Siri. Google використовує той же підхід в Chrome, запобігаючи відстеження історії перегляду та інших конфіденційних відомостей.

Сервіс може бути корисний розробникам в сфері охорони здоров’я, соціології, бізнесі, державному секторі та ін.

“Ми використовували диференційно-приватні методи для створення корисних функцій в наших продуктах, наприклад, для визначення, наскільки завантажений бізнес протягом дня або наскільки популярна страва конкретного ресторану в Google Maps, і покращуємо [з їх допомогою] Google Fi”.

Джерело: internetua.com

Оставить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

*