Apa Teknologi lan Solusi Masking Data ing Broker Paket Jaringan?

1. Konsep Data Masking

Data masking uga dikenal minangka data masking. Iki minangka cara teknis kanggo ngowahi, ngowahi utawa nutupi data sensitif kayata nomer ponsel, nomer kertu bank lan informasi liyane nalika kita menehi aturan lan kabijakan masking. Teknik iki utamane digunakake kanggo nyegah data sensitif digunakake langsung ing lingkungan sing ora bisa dipercaya.

Prinsip Data Masking: Data masking kudu njaga karakteristik data asli, aturan bisnis, lan relevansi data kanggo mesthekake yen pangembangan, testing, lan analisis data sabanjure ora kena pengaruh masking. Priksa konsistensi lan validitas data sadurunge lan sawise masking.

2. Klasifikasi Data Masking

Data masking bisa dipérang dadi static data masking (SDM) lan dynamic data masking (DDM).

Static data masking (SDM): Masking data statis mbutuhake panyiapan database lingkungan non-produksi anyar kanggo isolasi saka lingkungan produksi. Data sensitif diekstrak saka basis data produksi banjur disimpen ing basis data non-produksi. Kanthi cara iki, data desensitized diisolasi saka lingkungan produksi, sing nyukupi kabutuhan bisnis lan njamin keamanan data produksi.

SDM

Dynamic Data masking (DDM): Biasane digunakake ing lingkungan produksi kanggo desensitize data sensitif ing wektu nyata. Kadhangkala, tingkat masking sing beda dibutuhake kanggo maca data sensitif sing padha ing kahanan sing beda. Contone, peran lan ijin sing beda bisa ngetrapake skema masking sing beda.

DDM

Pelaporan data lan aplikasi masking produk data

Skenario kasebut utamane kalebu produk pemantauan data internal utawa papan reklame, produk data layanan eksternal, lan laporan adhedhasar analisis data, kayata laporan bisnis lan review proyek.

nglaporake data masking produk

3. Solusi Masking Data

Skema masking data umum kalebu: invalidation, nilai acak, panggantos data, enkripsi simetris, nilai rata-rata, offset lan rounding, etc.

Invalidation: Invalidation nuduhake enkripsi, truncation, utawa ndhelikake data sensitif. Skema iki biasane ngganti data nyata nganggo simbol khusus (kayata *). Operasi kasebut prasaja, nanging pangguna ora bisa ngerti format data asli, sing bisa mengaruhi aplikasi data sabanjure.

Nilai Random: Nilai acak nuduhake panggantos acak data sensitif (nomer ngganti digit, huruf ngganti huruf, lan karakter ngganti karakter). Cara masking iki bakal njamin format data sensitif kanggo ombone tartamtu lan nggampangake aplikasi data sakteruse. Kamus masking bisa uga dibutuhake kanggo sawetara tembung sing migunani, kayata jeneng wong lan panggonan.

Panggantos Data: Panggantos data padha masking saka nilai null lan acak, kajaba sing nggunakake karakter khusus utawa nilai acak, data masking diganti karo nilai tartamtu.

Enkripsi simetris: Enkripsi simetris minangka cara masking khusus sing bisa dibalèkaké. Iku encrypts data sensitif liwat tombol enkripsi lan algoritma. Format ciphertext konsisten karo data asli ing aturan logis.

Rata-rata: Skema rata-rata asring digunakake ing skenario statistik. Kanggo data numerik, pisanan kita ngetung rata-rata, lan banjur kanthi acak mbagekke nilai desensitized watara rata-rata, saéngga tetep jumlah data konstan.

Offset lan Rounding: Cara iki ngganti data digital kanthi shift acak. Pembulatan offset njamin keasliane kira-kira nalika njaga keamanan data, sing luwih cedhak karo data nyata tinimbang skema sadurunge, lan nduweni makna gedhe ing skenario analisis data gedhe.

ML-NPB-5660-数据脱敏

Model sing disaranake"ML-NPB-5660"kanggo data masking

4. Teknik Masking Data sing umum digunakake

(1). Teknik Statistika

Sampling data lan agregasi data

- Sampling data: Analisis lan evaluasi set data asli kanthi milih subset perwakilan saka kumpulan data minangka cara penting kanggo ningkatake efektifitas teknik de-identifikasi.

- Panggabungan data: Minangka kumpulan teknik statistik (kayata penjumlahan, pancacahan, rata-rata, maksimum lan minimal) sing ditrapake kanggo atribut ing microdata, asil kasebut minangka wakil saka kabeh cathetan ing kumpulan data asli.

(2). Kriptografi

Kriptografi minangka cara umum kanggo desensitize utawa nambah efektifitas desensitisasi. Jinis algoritma enkripsi sing beda bisa entuk efek desensitisasi sing beda.

- Enkripsi deterministik: Enkripsi simetris non-acak. Biasane ngolah data ID lan bisa dekripsi lan mulihake ciphertext menyang ID asli yen perlu, nanging kunci kasebut kudu direksa kanthi bener.

- Enkripsi sing ora bisa dibatalake: Fungsi hash digunakake kanggo ngolah data, sing biasane digunakake kanggo data ID. Ora bisa langsung dekripsi lan hubungan pemetaan kudu disimpen. Kajaba iku, amarga fitur fungsi hash, tabrakan data bisa kedadeyan.

- Enkripsi Homomorphic: Algoritma homomorphic ciphertext digunakake. Ciri khas yaiku asil operasi ciphertext padha karo operasi plaintext sawise dekripsi. Mulane, umume digunakake kanggo ngolah lapangan numerik, nanging ora akeh digunakake kanggo alasan kinerja.

(3). Teknologi Sistem

Teknologi penindasan mbusak utawa nglindhungi item data sing ora nduweni proteksi privasi, nanging ora nerbitake.

- Masking: nuduhake cara desensitisasi sing paling umum kanggo nutupi nilai atribut, kayata nomer lawan, kertu ID ditandhani karo tanda bintang, utawa alamat dipotong.

- Penindasan lokal: nuduhake proses mbusak nilai atribut tartamtu (kolom), mbusak kolom data sing ora penting;

- Penindasan rekaman: nuduhake proses mbusak cathetan tartamtu (baris), mbusak cathetan data sing ora penting.

(4). Pseudonym Teknologi

Pseudomanning minangka teknik de-identifikasi sing nggunakake jeneng samaran kanggo ngganti pengenal langsung (utawa pengenal sensitif liyane). Teknik pseudonym nggawe pengenal unik kanggo saben subyek informasi individu, tinimbang pengenal langsung utawa sensitif.

- Bisa ngasilake nilai acak kanthi mandiri kanggo cocog karo ID asli, nyimpen tabel pemetaan, lan ngontrol akses menyang tabel pemetaan kanthi ketat.

- Sampeyan uga bisa nggunakake enkripsi kanggo ngasilake jeneng samaran, nanging kudu njaga kunci dekripsi kanthi bener;

Teknologi iki akeh digunakake ing kasus akeh pangguna data independen, kayata OpenID ing skenario platform mbukak, ing ngendi pangembang beda entuk Openid sing beda kanggo pangguna sing padha.

(5). Teknik Generalisasi

Teknik generalisasi nuduhake teknik de-identifikasi sing nyuda granularitas atribut sing dipilih ing sakumpulan data lan menehi gambaran sing luwih umum lan abstrak babagan data kasebut. Teknologi generalisasi gampang dileksanakake lan bisa nglindhungi keaslian data tingkat rekaman. Biasane digunakake ing produk data utawa laporan data.

- Rounding: kalebu milih basis pembulatan kanggo atribut sing dipilih, kayata forensik munggah utawa mudhun, ngasilake asil 100, 500, 1K, lan 10K

- Teknik pengkodean ndhuwur lan ngisor: Ganti nilai ing ndhuwur (utawa ing ngisor) ambang karo ambang sing nuduhake tingkat ndhuwur (utawa ngisor), ngasilake asil "ing ndhuwur X" utawa "ing ngisor X"

(6). Teknik Randomization

Minangka jinis teknik de-identifikasi, teknologi randomization nuduhake modifikasi nilai atribut liwat randomization, supaya nilai sawise randomization beda saka nilai nyata asli. Proses iki nyuda kemampuan panyerang kanggo nurunake nilai atribut saka nilai atribut liyane ing rekaman data sing padha, nanging mengaruhi keaslian data sing diasilake, sing umum karo data uji produksi.


Wektu kirim: Sep-27-2022