Incomplete information in RDF databases with an emphasis on the geospatial domain

Η διαχείριση μη πλήρους πληροφορίας έχει μελετηθεί σε βάθος στις σχεσιακές βάσεις δεδομένων και στην αναπαράσταση γνώσης, αλλά στην περιοχή του σημασιολογικού ιστού και στα σχετικά με αυτή μοντέλα αναπαράστασης γνώσης, όπως το RDF, δεν έχει μελετηθεί αρκετά. Σε αυτή τη διατριβή προτείνουμε μία επέκταση του μοντέλου RDF που λέγεται RDFi για την αναπαράσταση μη πλήρους πληροφορίας για τιμές ιδιοτήτων και την αποτίμηση ερωτημάτων εκφρασμένων στη γλώσσα SPARQL. Το πλαίσιο RDFi παραμετροποιείται με μία γλώσσα περιορισμών που εξυπηρετεί την έκφραση μερικής γνώσης για τιμές ιδιοτήτων μέσω του σχηματισμού κατάλληλων περιορισμών. Δίνουμε το συντακτικό, ορίζουμε τη σημασιολογία του RDFi με τυπικό τρόπο βασιζόμενοι στην σημασιολογία πιθανών κόσμων, και επεκτείνουμε τους τελεστές της SPARQL έτσι ώστε να συλλάβουμε τα νέα στοιχεία που έχουν εισαχθεί στο RDFi για την αναπαράσταση μη πλήρους πληροφορίας. Μελετάμε την ορθότητα της επέκτασης αυτής και αποδεικνύουμε ότι υπάρχουν δύο υποκλάσεις της SPARQL που θα μπορούσαν να οδηγήσουν στην ορθή αποτίμηση ερωτημάτων πάνω από το RDFi βάσει της ορισθείσας σημασιολογίας, αλλά μόνο αν οι απαντήσεις περιοριστούν στις επονομαζόμενες βέβαιες απαντήσεις. Η εργασία μας γύρω από το πλαίσιο RDFi ολοκληρώνεται παρουσιάζοντας έναν αλγόριθμο για τον υπολογισμό των βέβαιων απαντήσεων ενός ερωτήματος SPARQL και τη μελέτη της πολυπλοκότητας δεδομένων του σχετικού με αυτό προβλήματος απόφασης και έναν αριθμό από γλώσσες περιορισμών που μπορούν να χρησιμοποιηθούν για να εκφράσουν μη πλήρη πληροφορία για χρονικά, χωρικά, γεωχωρικά, και άλλα δεδομένα. Το υπόλοιπο της εργασίας μας είναι πιο πρακτικό. Παρακινούμενοι από την ραγδαία αύξηση του μεγέθους των διασυνδεδεμένων γεωχωρικών δεδομένων που έχουν δημοσιευθεί τελευταία στον ιστό, δίνουμε βαρύτητα στο γεωχωρικό πεδίο. Επισημαίνουμε ότι το πρόσφατο πρότυπο GeoSPARQL που προτάθηκε από την κοινοπραξία για τα γεωχωρικά δεδομένα OGC για την αποτίμηση ερωτημάτων πάνω από γεωχωρικά δεδομένα εκφρασμένα στο RDF ενώ παρέχει μία πλούσια γλώσσα, την ίδια στιγμή φέρει έναν αριθμό αδυναμιών όσον αφορά στη διαχείριση μη πλήρους πληροφορίας, οι οποίες οδηγούν σε ημιτελές απαντήσεις. Υπό αυτό το πρίσμα, επιδεικνύουμε την εκφραστικότητα του πλαισίου RDFi δείχνοντας ότι θα μπορούσε να χρησιμοποιηθεί ώστε να ορίσει τη σημασιολογία της GeoSPARQL με τυπικό τρόπο καθώς επίσης και να επιλύσει ορισμένες από τις αδυναμίες της. Συνεχίζουμε με τη συζήτηση διάφορων τρόπων μέσω των οποίων τα προβλήματα που προκύπτουν από αυτές τις αδυναμίες θα μπορούσαν να διορθωθούν και προτείνουμε ως καταλληλότερη λύση τη χρήση τεχνικών από την ερευνητική περιοχή του ποιοτικού χωρικού συμπερασμού που βασίζονται σε αλγορίθμους διάδοσης περιορισμών. Παρουσιάζουμε την υλοποίηση μίας τέτοιας επέκτασης στη γεωχωρική RDF βάση δεδομένων Strabon καθώς επίσης και την αξιολόγησή της χρησιμοποιώντας διασυνδεδεμένα χωρικά σύνολα δεδομένων. Παρακινούμενοι από τα αρνητικά αποτελέσματα της αξιολόγησης μελετάμε και υλοποιούμε αλγορίθμους για τον έλεγχο συνέπειας και τη διάδοση περιορισμών σε πολύ μεγάλα και πραγματικά δίκτυα περιορισμών, όπως τα διασυνδεδεμένα γεωχωρικά σύνολα δεδομένων, και δείχνουμε ότι μπορούν να οδηγήσουν σε αποδοτικές υλοποιήσεις.

περισσότερα

Περίληψη σε άλλη γλώσσα

Incomplete information has been studied in-depth in relational databases and knowledge representation, but not much has been done in semantic web frameworks such as RDF. In this Thesis we propose an extension of RDF, called RDFi, for the representation and querying of incomplete information for property values. The RDFi framework is parameterized with a constraint language and serves for expressing partial knowledge about property values through the formulation of constraints. We give the syntax and formal semantics of RDFi and extend the compositional semantics of SPARQL to capture the new elements introduced in RDFi for the capturing of incomplete information. We show two fragments of SPARQL that can be used to evaluate queries over RDFi in a semantically correct way and only with respect to a subset of their answers corresponding to the so-called certain answers. Our work around RDFi completes by giving an algorithm for the computation of certain answers and studying the data complexity of the associated decision problem named certainty. The rest of our work is more practical. Motivated by the rapid increase in the size of linked geospatial data published on the web, we give a strong emphasis on the geospatial domain. We point out that the recent OGC standard GeoSPARQL for the querying of geospatial information provides a rich language, but at the same time it covers a number of weaknesses pertaining to the handling of incomplete information that leading to incomplete answers. In this context, we demonstrate the expressivity of the RDFi framework showing that it can be employed to give semantics to GeoSPARQL. We continue by discussing possible ways through which these problems can be amended using constraint propagation techniques developed in the area of qualitative spatial reasoning and then presenting an implementation as an extension to the system Strabon as well as a corresponding evaluation using linked geospatial datasets. Prompted by the negative results of this evaluation we then study how consistency checking of very large real-world networks, such as the linked geospatial datasets, can be done efficiently.

περισσότερα

Διαβάστε τη διατριβή (Online)

Κατεβάστε τη διατριβή σε μορφή PDF (3.85 MB) (Η υπηρεσία είναι διαθέσιμη μετά από δωρεάν εγγραφή)

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI	10.12681/eadd/38588
Διεύθυνση Handle	http://hdl.handle.net/10442/hedi/38588
ND	38588
Εναλλακτικός τίτλος	Incomplete information in RDF databases with an emphasis on the geospatial domain
Συγγραφέας	Νικολάου, Χαράλαμπος (Πατρώνυμο: Στυλιανός)
Ημερομηνία	2015
Ίδρυμα	Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών (ΕΚΠΑ). Σχολή Θετικών Επιστημών. Τμήμα Πληροφορικής και Τηλεπικοινωνιών. Τομέας Υπολογιστικών Συστημάτων και Εφαρμογών
Εξεταστική επιτροπή	Κουμπαράκης Εμμανουήλ Ιωαννίδης Ιωάννης Χριστοφίδης Βασίλης Γουνόπουλος Δημήτριος Σκιαδόπουλος Σπυρίδων Στάμου Γεώργιος Στεργίου Κωνσταντίνος
Επιστημονικό πεδίο	Φυσικές Επιστήμες ➨ Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Λέξεις-κλειδιά	Μη πλήρης πληροφορία; RDF; SPARQL; GeoSPARQL; Γεωχωρική πληροφορία; Χωρικός συμπερασμός; Περιορισμοί
Χώρα	Ελλάδα
Γλώσσα	Αγγλικά
Άλλα στοιχεία	206σ., εικ., πιν., σχημ., γραφ.

Στατιστικά χρήσης

ΠΡΟΒΟΛΕΣ

Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.

ΞΕΦΥΛΛΙΣΜΑΤΑ

Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.

ΜΕΤΑΦΟΡΤΩΣΕΙΣ

Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.

ΧΡΗΣΤΕΣ

Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.

Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)

Κλιμακώσιμοι και βασισμένοι στο φόρτο εργασίας αλγόριθμοι διαχείρισης μη δομημένων δεδομένων

Managing, querying and analyzing big data on the web

Γενικευμένα αντικειμενοστρεφή μοντέλα για την δυναμική αναδιαμόρφωση στοιβών τηλεπικοινωνιακών πρωτοκόλλων σε ασύρματα δίκτυα 3ης και 4ης γενιάς

Μελέτη της συνδυασμένης πυρόλυσης και καύσης ανθράκων, βιομάζας και αποβλήτων

Δυναμική μοντελοποίηση δεδομένων επιβίωσης και συγκριτική ανάλυση μεταξύ προκυπτόντων και σχετικών αιτιοκρατικών μοντέλων

Κατανεμημένη αποτίμηση επερωτήσεων και συλλογιστική για το μοντέλο RDF σε δίκτυα ομότιμων κόμβων

ΕΠΕΚΤΑΣΗ ΤΗΣ ΠΡΟΤΥΠΗΣ ΓΛΩΣΣΑΣ SQL2 ΓΙΑ ΤΗ ΔΙΑΧΕΙΡΙΣΗ ΔΕΔΟΜΕΝΩΝ ΤΥΠΟΥ ΔΙΑΣΤΗΜΑΤΟΣ

A SEMANTIC NETWORK MODEL OF DATA BASES

Formulation and efficient execution of frequent queries in RDF databases

Μοντελοποίηση συμπεριφοράς βιοϊατρικών δεδομένων

"Μη πλήρης πληροφορία σε βάσεις δεδομένων RDF με έμφαση στο γεωχωρικό πεδίο"
	Πληκτρολογήστε το κείμενο της εικόνας!
Δηλώνω ότι έλαβα γνώση και ανεπιφύλακτα συμφωνώ και αποδέχομαι τους Όρους Χρήσης του Εθνικού Αρχείου Διδακτορικών Διατριβών, καθώς και της .