Anonimleştirme nedir
Anonimleştirme, veri madenciliğinde şifrelenmiş veya genelleştirilmiş bilgileri yeniden tanımlayan bir tekniktir. Veri yeniden tanımlama olarak da adlandırılan anonimleştirme, bir kişiyi, grubu veya işlemi tanımlamak için anonimleştirilmiş bilgileri mevcut diğer verilerle çapraz referanslar.
KESİCİ KESME Anonimleştirme
Teknoloji meraklısı dönem, ekonominin çeşitli sektörlerinde geleneksel iş yapma şeklini hızla bozuyor. Son yıllarda, finans endüstrisi fintech şirketleri tarafından kendi sektörüne tanıtılan birçok dijital ürün gördü. Bu yenilikçi ürünler, daha fazla tüketicinin geleneksel finansal kurumların izin verdiğinden daha düşük maliyetle finansal ürünlere ve hizmetlere erişebildiği finansal içermeyi desteklemiştir. Teknolojinin uygulanmasındaki artış, verilerin toplanması, depolanması ve kullanımında bir artışa neden olmuştur. Sosyal medya platformları, dijital ödeme platformları ve akıllı telefon teknolojisi gibi teknoloji araçları, çeşitli şirketler tarafından tüketicilerle etkileşimlerini artırmak için kullanılan bir ton veri ortaya koydu. Bu ton verilere büyük veri denir ve kullanıcıların kimliklerini ve gizliliğini koruyan daha fazla yasa isteyen bireyler ve düzenleyici otoriteler arasında endişe kaynağıdır.
Anonimleştirme Nasıl Çalışır?
Bir kullanıcının çevrimiçi etkinlikleri hakkındaki hassas bilgilerin bulut bilişim yoluyla anında paylaşıldığı büyük veri çağında, kullanıcıların kimliklerini korumak için veri anonimleştirme araçları kullanılmıştır. Anonimleştirme, sağlık hizmetleri, sosyal medya platformları, e-ticaret işlemleri vb. Gibi çeşitli alanlarda işlem yapan kullanıcıların kişisel olarak tanımlanabilir bilgilerini (PII) maskeler. PII, doğum tarihi, Sosyal Güvenlik Numarası (SSN), posta kodu ve IP gibi bilgileri içerir adres. Çevrimiçi etkinliklerle geride bırakılan dijital izleri maskeleme ihtiyacı, şifreleme, silme, genelleme ve bozulma gibi anonimleştirme stratejilerinin uygulanmasına yol açmıştır. Her ne kadar veri bilimcileri bu bilgileri paylaşılan verilerden hassas bilgileri ayırmak için kullanıyor olsalar da, orijinal bilgileri hala koruyorlar, böylece yeniden tanımlama imkanı için kapılar açılıyorlar.
Anonimleştirme, paylaşılan ancak sınırlı veri kümelerini çevrimiçi olarak kolayca erişilebilen veri kümeleriyle eşleştirerek anonimleştirme sürecini tersine çevirir. Veri madencileri daha sonra bir kişinin kimliğini veya işlemini bir araya getirmek için mevcut her veri kümesinden bazı bilgileri alabilir. Örneğin, bir veri madencisi, bir kullanıcının adını ve sık aktivitelerini belirlemek için bir telekomünikasyon şirketi, bir sosyal medya sitesi, bir e-ticaret platformu ve halka açık bir nüfus sayımı sonucu paylaşılan bir veri setini alabilir.
Anonimleştirme Nasıl Kullanılır
Yeni bilgiler yayınlandığında veya uygulanan anonimleştirme stratejisi doğru şekilde yapılmadığında yeniden tanımlama başarılı olabilir. Geniş veri kaynağı ve günlük sınırlı bir süre ile veri analistleri ve madencileri karar verirken sezgisel tarama olarak bilinen kısayolları uyguluyorlar. Sezgisel tarama, bir veri kümesiyle taramada değerli zaman ve kaynak tasarrufu sağlarken, yanlış sezgisel tarama aracı uygulanıp uygulanmadığından da yararlanılabilecek boşluklar oluşturabilir. Bu boşluklar, bir veri setini yasal veya yasa dışı amaçlarla anonim hale getirmeye çalışan veri madencileri tarafından tanımlanabilir.
Anonimleştirme tekniklerinden yasadışı yollarla elde edilen kişisel olarak tanımlanabilir bilgiler, aynı zamanda bir tür anonimleştirme platformları olan yeraltı pazarlarında satılabilir. Yanlış ellere geçen bilgiler zorlama, gasp ve gözdağı vermek için kullanılabilir, bu da mağdurlara düşen işletmeler için gizlilik kaygılarına ve muazzam maliyetlere yol açar.
Anonimleştirme yasal olarak da kullanılabilir. Örneğin, yasadışı uyuşturucular için bir yeraltı pazarı olan İpek Yolu web sitesi, kullanıcılarının IP adreslerini gizlemek için bir soğan stratejisi kullanan Tor adlı anonim bir ağ tarafından barındırıldı. Tor ağı ayrıca silah ticareti, çalıntı kredi kartları ve hassas kurumsal bilgiler gibi birkaç yasadışı piyasaya ev sahipliği yapıyor. Karmaşık anonimleştirme araçlarının kullanılmasıyla FBI, İpek Yolu'nu ve çocuk pornografisi yapan siteleri başarıyla kırdı ve kapattı.
Yeniden tanımlama süreçlerindeki başarı, anonimliğin garanti edilmediğini kanıtlamıştır. Günümüzde verileri maskelemek için çığır açan anonimleştirme araçları uygulansa bile, yeni teknoloji ve yeni veri setleri kullanıma sunuldukça veriler birkaç yıl içinde yeniden tanımlanabilir.