Διατήρηση της εμπιστευτικότητας κατά την ενοποίηση των δεδομένων σε κατανεμημένες βάσεις δεδομένων
View/ Open
Author
Μητρογιάννης, ΒασίλειοςSupervisor name
Βερύκιος, Βασίλειος Σ.
Μουστακίδης, Γεώργιος Β.
Date
2005Language
el
Keyword
Access
free
Abstract
Στη σύγχρονη εποχή οι διάφοροι οργανισμοί, που είτε απασχολούνται στον
επιχειρηματικό τομέα, είτε δραστηριοποιούνται σε διάφορα επιστημονικά πεδία,
διαχειρίζονται έναν μεγάλο όγκο πληροφοριών. Στην κατεύθυνση αυτή έχει συμβάλλει
σημαντικά η ανάπτυξη της τεχνολογίας η οποία επιτρέπει την διακίνηση και ανταλλαγή
των πληροφοριών μεταξύ των οργανισμών με ευκολία, ταχύτητα και ασφάλεια.
Σε αυτήν την εργασία θα γίνει μια προσπάθεια διερεύνησης των τρόπων με τους
οποίους είναι δυνατόν να επιτευχθεί η ενοποίηση των πληροφοριών μεταξύ των
Βάσεων Δεδομένων, διατηρώντας παράλληλα την εμπιστευτικότητα των δεδομένων. Η
συγκεκριμένη διαδικασία είναι ιδιαίτερα σημαντική για την περαιτέρω ανάπτυξη του
τομέα των Βάσεων Δεδομένων, αφού οι έρευνες έχουν αποδείξει ότι οι οργανισμοί θα
προβούν στην ενοποίηση των δεδομένων τους μόνο αν προφυλάσσεται η
εμπιστευτικότητα τους.
Μέχρι σήμερα η κοινότητα των Βάσεων Δεδομένων έχει αναπτύξει διάφορες
μεθόδους που επιτυγχάνουν την ενοποίηση των πληροφοριών. Μια από τις μεθόδους
αυτές η οποία εξετάζεται διεξοδικά στην εργασία είναι η διασύνδεση των εγγραφών,
δηλαδή το record linkage Γ3, 5, 10, 131. Η διαδικασία της διασύνδεσης των εγγραφών
ουσιαστικά συγκρίνει τις εγγραφές που υπάρχουν σε δυο ή περισσότερες Βάσεις
Δεδομένων και εξετάζει κατά πόσο κάποιες εγγραφές αντιστοιχούν στην ίδια οντότητα.
Οι περισσότεροι τρόποι που έχουν αναπτυχθεί μέχρι στιγμής για την διασύνδεση των
εγγραφών δυστυχώς δεν ασχολούνται με το ζήτημα της διατήρησης της
εμπιστευτικότητας.
Προς αυτήν την κατεύθυνση οδηγείται η εργασία. Αρχικά εξετάζεται το λογισμικό
Febrl Γ4, 331 το οποίο μπορεί να επιτύχει την διασύνδεση των εγγραφών δυο συνόλων
δεδομένων. Προτού όμως ξεκινήσει η διασύνδεση των εγγραφών, οι εφαρμογές του
λογισμικού που περιγράφονται στην ενότητα 32 «καθαρίζουν» τα δεδομένα [4], ώστε
να τα φέρουν όλα στην τυποποιημένη μορφή. Παράλληλα το λογισμικό παρέχει την δυνατότητα παραγωγής νέων τεχνητών συνόλων δεδομένων για την εξέταση και τον
έλεγχο της απόδοσης διαφόρων αλγορίθμων.
Κατόπιν παρουσιάζεται η τεχνική των Ν-γραμμάτων Γ5, 13, 151 που επιτυγχάνει
την διασύνδεση των εγγραφών, συγκρίνοντας την ομοιότητα των αλφαριθμητικών.
Μάλιστα περιγράφεται ένα πρωτόκολλο [5] σύγκρισης της ομοιότητας εμπιστευτικών
δεδομένων που συνδυάζει αυτήν την τεχνική με μεθόδους συμμετρικής
κρυπτογράφησης Γ5, 191 και συναρτήσεις κατακερματισμού Γ5, 191 προκειμένου να
επιτύχει την ασφαλή ενοποίηση των δεδομένων. Με βάση αυτό το πρωτόκολλο
υλοποιήθηκαν ορισμένα προγράμματα που επιτυγχάνουν τον στόχο της ασφαλούς
ενοποίησης των δεδομένων.
Τέλος εξετάζοντας την αποδοτικότητα των προγραμμάτων, όσον αφορά την
πρακτικότητα τους και την ποιότητα των αποτελεσμάτων τους, παράγονται ορισμένα
χρήσιμα συμπεράσματα για την διαδικασία της ασφαλούς διασύνδεσης των εγγραφών,
και ειδικότερα της εφαρμογής της τεχνικής των Ν-γραμμάτων σε συνδυασμό με
κρυπτογραφικές τεχνικές.
Academic publisher
Πανεπιστήμιο Θεσσαλίας. Πολυτεχνική Σχολή. Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών.