Publication:
Hierarchical spatial decompositions under local differential privacy

Thumbnail Image

Departments

School / College / Institute

Organizational Unit

Program

Computer Sciences and Engineering

KU Authors

Co-Authors

Authors

YƖK Thesis ID

905039

Approval Date

Publication Date

Language

Type

Embargo Status

No

Journal Title

Journal ISSN

Volume Title

Alternative Title

Lokal diferansiyel mahremiyet korumalı hiyerarşik konumsal ayrışımlar

Abstract

The popularity of smartphones, GPS-equipped devices, social networks, and connected vehicles continues to increase the volume of spatial data available for collection and analysis. Spatial decompositions assist in handling big spatial data, and they have been commonly used in the centralized differential privacy (DP) literature for range query answering, spatial indexing, count-of-counts histograms, data summarization, and visualization. However, their applications under the emerging local differential privacy (LDP) notion are relatively scarce. In this thesis, we study the problem of building hierarchical spatial decompositions under LDP, focusing on two methods: quadtrees and kd-trees. We develop two solutions for quadtrees: a baseline solution that is inspired by the centralized DP literature, and a proposed solution that utilizes a single data collection step from users, propagates density estimates to remaining nodes, and performs structural corrections to the quadtree. Since kd-trees rely on node medians which are data-dependent, we observe that it is not feasible to build kd-trees using a single data collection step. We therefore propose an iterative solution that constructs kd-trees in top-down fashion by utilizing a novel algorithm for estimating node medians at each tree depth. We experimentally evaluate our quadtree and kd-tree algorithms using four real-world spatial datasets, multiple utility metrics, varying privacy budgets, and tree parameters. Results demonstrate that our algorithms enable the building of accurate spatial decompositions that provide high utility in practice. Notably, our quadtrees and kd-trees achieve substantially lower errors in answering spatial density queries (up to 10-fold improvement) when compared with a state-of-the-art method.
Akıllı telefonlar, GPS donanımlı cihazlar, sosyal ağlar ve bağlantılı araƧların popülerliği, toplanması ve analiz edilmesi mümkün olan konumsal verinin hacmini arttırmaya devam etmektedir. Konumsal ayrışımlar, büyük konumsal verilerin işlenmesine yardımcı olur ve merkezi diferansiyel mahremiyet (DP) literatüründe aralık sorgusu yanıtlama, konumsal dizinleme, sayım-histogramlar, veri ƶzetleme ve gƶrselleştirme iƧin sıklıkla kullanılmıştır. Ancak, yeni gelişen lokal diferansiyel mahremiyet (LDP) kavramı altındaki uygulamaları nispeten azdır. Bu tezde, hiyerarşik konumsal ayrışımların LDP altında oluşturulması problemini inceleyerek, ƶzellikle iki yƶnteme odaklanıyoruz: dƶrdüzağaƧlar ve kd-ağaƧları. DƶrdüzağaƧlar iƧin iki Ƨƶzüm geliştiriyoruz: merkezi DP literatüründen esinlenen bir temel Ƨƶzüm ve kullanıcılardan tek bir veri toplama adımı kullanan, yoğunluk tahminlerini diğer düğümlere ileten ve dƶrdüzağaƧ üzerinde yapısal düzeltmeler gerƧekleştiren bir ƶnerilen Ƨƶzüm. Kd-ağaƧları, veriye bağımlı olan düğüm medyanlarına dayandığı iƧin, tek bir veri toplama adımını kullanarak kd-ağaƧları oluşturmanın mümkün olmadığını gƶzlemliyoruz. Bu nedenle, her ağaƧ derinliğinde düğüm medyanlarını kestirmek iƧin yeni bir algoritma kullanan, üstten aşağıya doğru kd-ağaƧları oluşturan iteratif bir Ƨƶzüm ƶneriyoruz. Dƶrt gerƧek konumsal veri kümesi, Ƨeşitli fayda ƶlçütleri, değişen mahremiyet bütƧeleri ve ağaƧ parametreleri kullanarak dƶrdüzağaƧ ve kd-ağacı algoritmalarımızı deneysel olarak değerlendiriyoruz. SonuƧlar, algoritmalarımızın pratikte yüksek fayda sağlayan doğru konumsal ayrışımların oluşturulmasını mümkün kıldığını gƶstermektedir. Ɩzellikle, dƶrdüzağaƧlarımız ve kd-ağaƧlarımız mevcut bir yƶntemle karşılaştırıldığında, konumsal yoğunluk sorgularını yanıtlarken ƶnemli ƶlçüde daha düşük hata oranlarına ulaşmaktadır (10 kata kadar iyileşme).

Source

Publisher

KoƧ University

Subject

Computer networks, Security measures, Computer communication systems, Computer security, Computational intelligence, Artificial intelligence, Information visualization, Computer vision, Mathematical models, Geospatial data, Geographic information systems

Citation

Has Part

Source

Book Series Title

Edition

DOI

item.page.datauri

Link

Rights

restrictedAccess

Copyrights Note

© All Rights Reserved. Accessible to Koç University Affiliated Users Only!

Endorsement

Review

Supplemented By

Referenced By

0

Views

0

Downloads