Проект Collage: як боротися з інтернет-цензурою за допомогою користувацького контенту

Група вчених з технологічного університету штату Джорджія опублікувала концепцію нового інструменту обходу блокувань. Проект отримав назву Collage, і його концепція передбачає використання так званого user-generated content. У даній статті представлені основні тези цієї роботи.

Вступ

У сучасному світі блокування в інтернеті вже давно стали чимось буденним. Цензуру вводять не тільки авторитарні режими, в тому чи іншому вигляді обмеження свободи слова існують навіть в таких демократичних країнах, як Великобританія, Австралія або Південна Корея.

Паралельно з поширенням цензури розвиваються і системи обходу блокувань. Більшість існуючих сьогодні інструментів боротьби з цензурою припускають використання проксі, але найчастіше для цензора не складає труднощів виявити і заблокувати їх. Для просунутих цензорів це неважко – наприклад, в Китаї ефективно блокують Tor.

У цьому дослідженні вчені університету Джорджії спробували описати метод обходу блокування, який не покладається на один або кілька проксі, а передбачає масовий запуск сайтів, на яких розташовується створений користувачами контент.

Концепція: проект Collage

Суть ідеї в тому, щоб використовувати user-generated content в якості маскування для інтернет-трафіку. Collage використовує існуючі сайти для розміщення створеного користувачами контенту (блог-платформи, соцмережі і т.п.), який приховує зашифровані повідомлення.

Для цензора знайти і заблокувати контент, який прихований в фото, тексті і відео по всьому інтернету – це складніше завдання, ніж знайти і заблокувати конкретний проксі.

Міркування про діяльність цензора

Передбачається, что цензор НЕ планує повністю блокувати інтернет, якісь з’єднання вважаються дозволеними. Однак для нього важлива можливість моніторити, аналізувати, блокувати або змінювати якісь частини трафіку.

Також розробники системи вважали, что цензор має достатньо ресурсів, для того, щоб розташувати залізо для моніторингу трафіку на великій кількості дільниць мережі.

При цьому, цілі цензора можуть змінюватися. Одна з них – переслідування конкретних користувачів, для чого використовується виявлення патернів поведінки на основі трафіку. Інше завдання – блокування конкретного контенту, для вирішення її цензор может піти навіть на внесення спотворень в трафік, щоб заборонений зміст просто не відкривався браузером.

Як це працює

Система Collage складається з трьох рівнів: векторного, рівня повідомлень та рівня додатків.

Трирівнева модель Collage. Операції зображені овалами, проміжні дані – в прямокутниках

На векторному рівні створюється «маскуючий контент», в який записується повідомлення. Наприклад, це може бути відео з зашифрованим посланням, і в такому випадку вектором буде YouTube-відео. Другий рівень відповідає за опис протоколу відправки та отримання повідомлень. Над усім цим можна надбудувати будь-яку кількість додатків.

Для успішного обміну даними відправник і одержувач інформації повинні провести процедуру rendezvous. Для цього кожен з них виконує певну послідовність дій. Наприклад, відправник може генерувати послідовність HTTP-запитів, які розшифровуються як «завантажити фото з тегом «flowers» на хостинг Flickr», а одержувач повинен відправити запит «знайти на Flickr фото з тегом «flowers» і завантажити перші 50 з них».

Підсумкова реалізація Collage – це Python-бібліотека на 650 рядків коду. Вона описує логіку рівня повідомлень, включаючи базу даних завдань, кодування і декодування векторів. Для виконання завдань використовується популярний інструмент браузерної автоматизації Selenium. Додаток відвідує веб-сайти, виконує потрібні завдання і завантажує вектори.

Джерело: habr.com