Περίληψη
Εισαγωγή: Η υπολογιστική τομογραφία (ΥΤ) είναι μια από τις πιο σημαντικές μεθόδους ιατρικής απεικόνισης. Οι υψηλές δόσεις ακτινοβολίας ασθενών και η συχνότητα των εξετάσεων που συναντώνται στην ΥΤ, έχουν πυροδοτήσει αυξημένο επιστημονικό και κλινικό ενδιαφέρον για την εκτίμηση της εξατομικευμένης δόσης ασθενών. Το 2014, το Συμβούλιο της Ευρωπαϊκής Ένωσης εξέδωσε την Οδηγία 2013/59/ΕΥΡΑΤΟΜ, ζητώντας από τα κράτη μέλη να ενισχύσουν τις απαιτήσεις τους σχετικά με την ενημέρωση των ασθενών, συμπεριλαμβανομένης της καταγραφής και αναφοράς δόσεων ακτινοβολίας από διαγνωστικές πράξεις. Οι σύγχρονες μέθοδοι υπολογιστικής δοσιμετρίας μπορούν να παρέχουν ακριβείς εκτιμήσεις δόσης ασθενών με μη επεμβατικό τρόπο, χρησιμοποιώντας τη δύναμη των σύγχρονων υπολογιστών. Επίσης, λόγω του γεγονότος ότι δεν χρειάζεται να χρησιμοποιούν εξειδικευμένα υλικά ή αναλώσιμα, οι υπολογιστικές μέθοδοι έχουν τη δυνατότητα να μειώσουν το κόστος της εξατομικευμένης δοσιμετρίας ασθενών, σε λογικά οικονομικά επίπεδα. Ωσ ...
Εισαγωγή: Η υπολογιστική τομογραφία (ΥΤ) είναι μια από τις πιο σημαντικές μεθόδους ιατρικής απεικόνισης. Οι υψηλές δόσεις ακτινοβολίας ασθενών και η συχνότητα των εξετάσεων που συναντώνται στην ΥΤ, έχουν πυροδοτήσει αυξημένο επιστημονικό και κλινικό ενδιαφέρον για την εκτίμηση της εξατομικευμένης δόσης ασθενών. Το 2014, το Συμβούλιο της Ευρωπαϊκής Ένωσης εξέδωσε την Οδηγία 2013/59/ΕΥΡΑΤΟΜ, ζητώντας από τα κράτη μέλη να ενισχύσουν τις απαιτήσεις τους σχετικά με την ενημέρωση των ασθενών, συμπεριλαμβανομένης της καταγραφής και αναφοράς δόσεων ακτινοβολίας από διαγνωστικές πράξεις. Οι σύγχρονες μέθοδοι υπολογιστικής δοσιμετρίας μπορούν να παρέχουν ακριβείς εκτιμήσεις δόσης ασθενών με μη επεμβατικό τρόπο, χρησιμοποιώντας τη δύναμη των σύγχρονων υπολογιστών. Επίσης, λόγω του γεγονότος ότι δεν χρειάζεται να χρησιμοποιούν εξειδικευμένα υλικά ή αναλώσιμα, οι υπολογιστικές μέθοδοι έχουν τη δυνατότητα να μειώσουν το κόστος της εξατομικευμένης δοσιμετρίας ασθενών, σε λογικά οικονομικά επίπεδα. Ωστόσο, μέχρι σήμερα, η απαιτούμενη τεχνογνωσία και ο υπολογιστικός χρόνος που απαιτείται για τον προσδιορισμό της δόσης του ασθενούς από τις εξετάσεις ΥΤ, αποθάρρυνε τους ερευνητές από την επιδίωξη αυτού του στόχου. Η μέθοδος αναφοράς για την εξατομικευμένη δοσιμετρία ασθενών που έχουν κάνει εξετάσεις ΥΤ είναι η εφαρμογή των μεθόδων Monte Carlo (MC) σε τρισδιάστατα (3D) ειδικά ομοιώματα ασθενών που δημιουργούνται από τις εικόνες των ίδιων των ασθενών. Η εφαρμογή του MC σε τέτοια ομοιώματα επιτρέπει τη δημιουργία τρισδιάστατων κατανομών δόσης ακτινοβολίας. Με τη σειρά τους, αυτές οι κατανομές μπορούν να χρησιμοποιηθούν για τον υπολογισμό των δόσεων οργάνων μέσω της εφαρμογής κάποιας μορφής τμηματοποίησης οργάνων. Ωστόσο, όπως προαναφέρθηκε τα εργαλεία και η τεχνογνωσία που απαιτούνται καθιστούν δύσκολη την ευρεία εφαρμογή τέτοιων εργαλείων στην κλινική πράξη. Σκοπός αυτής της εργασίας ήταν η ανάπτυξη υπολογιστικής μεθόδου υποβοηθούμενης από τεχνητή νοημοσύνη (ΤΝ), η οποία θα συμβάλλει σημαντικά στο να γίνει πρακτικά εφικτή στην κλινική πράξη, η εκτίμηση της εξατομικευμένης δόσης ασθενών στην ΥΤ. Πιο συγκεκριμένα, η εργασία αυτή είχε ως στόχο να υποκαταστήσει τις προσομοιώσεις MC που απαιτούνται για τη δημιουργία των τρισδιάστατων κατανομών δόσης. Μέθοδοι: Συνολικά επελέγησαν τυχαία 95 ανώνυμες εξετάσεις ΥΤ από το αποθετήριο του Πανεπιστημιακού Νοσοκομείου Ηρακλείου Κρήτης. Η ανωνυμοποίηση πραγματοποιήθηκε χρησιμοποιώντας εξειδικευμένο λογισμικό και στη συνέχεια ελέγχθηκε και χειροκίνητα για να διασφαλιστεί ότι ήταν επιτυχής, εξετάζοντας τα μεταδεδομένα των εικόνων με ένα πρόγραμμα προβολής εικόνων DICOM (Digital Imaging and Communications in Medicine). Ελήφθη έγκριση από την Επιτροπή Ηθικής του ιδρύματος, διασφαλίζοντας τη σωστή και εγκεκριμένη χρήση των δεδομένων των ασθενών. Όλες οι εξετάσεις ΥΤ πραγματοποιήθηκαν στον ίδιο τομογράφο με 64 σειρές ανιχνευτών (Revolution GSI; GE Medical Systems, Waukesha, Wisconsin, ΗΠΑ), εφαρμόζοντας το τυπικό πρωτόκολλο απεικόνισης θώρακα ενηλίκων που χρησιμοποιείται στο νοσοκομείο. Οι εικόνες δόσης για κάθε σειρά εικόνων ΥΤ δημιουργήθηκαν χρησιμοποιώντας το λογισμικό ImpactMC. Το λογισμικό εκτελεί προσομοιώσεις MC στο σύνολο των εικόνων ΥΤ των ασθενών και υπολογίζει τις αντίστοιχες εικόνες δόσης. Οι εικόνες δόσης που προκύπτουν αντιστοιχούν 1 προς 1 στις εικόνες ΥΤ από τις οποίες δημιουργήθηκαν, χωρίς να απαιτείται ευθυγράμμιση ή άλλου είδους παρόμοια επεξεργασία. Αυτές οι εικόνες MC χρησιμοποιούνται ως εικόνες «αληθούς δόσης» (ground truth) σε αυτή τη μελέτη. Το ImpactMC απαιτεί δεδομένα εισόδου που περιγράφουν τα γεωμετρικά και δοσιμετρικά χαρακτηριστικά του συγκεκριμένου τομογράφου, όπως το εύρος, η γωνία πρόσπτωσης και το φάσμα της δέσμης καθώς επίσης και ο χρόνος περιστροφής της λυχνίας ακτινών Χ, μεταξύ άλλων. Η προεπεξεργασία δεδομένων πραγματοποιήθηκε χρησιμοποιώντας «τετράδια» (notebooks) Python και διαθέσιμες βιβλιοθήκες Python ανοιχτού κώδικα. Συνολικά 11424 εικόνες ΥΤ σε μορφή DICOM και ίσος αριθμός εικόνων «αληθούς δόσης» που παρήχθησαν μέσω MC (επίσης σε μορφή DICOM) μελετήθηκαν και αναλύθηκαν. Για να αποφευχθεί η απώλεια πιστότητας, όλες οι εικόνες χρησιμοποιήθηκαν στο αρχικό τους μέγεθος και δεν χρησιμοποιήθηκαν βελτιώσεις αντίθεσης/contrast (που συνήθως είναι μη αναστρέψιμες). Τα δεδομένα απεικόνισης ΥΤ και οι σχετικές πληροφορίες των ασθενών εξήχθησαν μαζικά από τα αρχεία DICOM χρησιμοποιώντας τη βιβλιοθήκη Pydicom και αποθηκεύτηκαν σε υπολογιστικά φύλλα για περαιτέρω επεξεργασία. Το σύνολο των δεδομένων διαχωρίστηκε σε ένα υποσύνολο δεδομένων εκπαίδευσης (77 ασθενείς, 9231 εικόνες ΥΤ και 9231 αντίστοιχες εικόνες «αληθούς δόσης» που δημιουργήθηκαν με μεθόδους MC) και σε ένα υποσύνολο δεδομένων αξιολόγησης της μεθόδου (18 ασθενείς, 2193 εικόνες ΥΤ και 2193 αντίστοιχες εικόνες «αληθούς δόσης» που δημιουργήθηκαν με μεθόδους MC). Ο αλγόριθμος μετάφρασης εικόνας σε εικόνα (pix2pix) εκπαιδεύτηκε ώστε να μπορεί να δημιουργεί εικόνες δόσεων απευθείας από τις εικόνες ΥΤ ασθενών. Ο αλγόριθμος ανήκει στην κατηγορία των υπό όρους αναγεννητικών ανταγωνιστικών δικτύων (Conditional Generative Adversarial Networks – cGANs). Αυτή η αρχιτεκτονική περιλαμβάνει δύο ανταγωνιστικά νευρωνικά δίκτυα, τη γεννήτρια (generator) και τον κριτή (discriminator), που λειτουργούν σε συνεργασία προκειμένου να παράξουν έναν επιθυμητό τύπο εικόνων χρησιμοποιώντας σαν πρότυπο έναν διαφορετικό τύπο σχετικών εικόνων. Στην πράξη, το δίκτυο που χρησιμοποιήθηκε σε αυτή τη μελέτη, στόχευε στη δημιουργία συνθετικών εικόνων δόσης, εξετάζοντας πώς μοιάζει ένα πραγματικό ζεύγος μιας εικόνας ΥΤ και της αντίστοιχης εικόνας «αληθούς δόσης» (που δημιουργήθηκε με μεθόδους MC). Το pix2pix εκπαιδεύτηκε σε ζεύγη εικόνων ΥΤ και των αντίστοιχων εικόνων «αληθούς δόσης» 77 τυχαία επιλεγμένων ασθενών (47 Άνδρες, 30 Γυναίκες). Ο συνολικός αριθμός εικόνων που χρησιμοποιήθηκαν για την εκπαίδευση του pix2pix ήταν ένα υποσύνολο 847 από τις αρχικές 9231 εικόνες των 77 ασθενών που συμπεριελήφθησαν στο υποσύνολο δεδομένων εκπαίδευσης. Μέσα από πολλές «εποχές» (epochs) επιτυχούς εκπαίδευσης, το μοντέλο pix2pix μπόρεσε να δημιουργήσει ρεαλιστικές εικόνες δόσης εξετάζοντας απλώς τις εικόνες ΥΤ των ασθενών. Ωστόσο, για να λειτουργήσει σωστά το pix2pix cGAN, οι τιμές pixel/voxel της εικόνας έπρεπε να επανακλιμακωθούν μεταξύ -1 και 1 (0 και 1 για τις εικόνες δόσης) κατά τη φάση της προεπεξεργασίας δεδομένων, διαιρώντας κάθε τιμή pixel σε κάθε εικόνα, με την υψηλότερη τιμή pixel στην εικόνα. Αυτή η επανακλιμάκωση είχε ως αποτέλεσμα τη διατήρηση των μαθηματικών αναλογιών των εικόνων, αλλά ταυτοχρόνως και την αποσύνδεση της τιμής των pixel από την απόλυτη τιμή δόσης στους ιστούς που απεικονίζονται στις εικόνες δόσης. Ως αποτέλεσμα, οι συνθετικές εικόνες δόσης που δημιουργήθηκαν από το pix2pix, χρειάστηκε να επανακλιμακωθούν για άλλη μια φορά, ώστε να αντιστοιχούν στα πραγματικά επίπεδα δόσης. Αυτό επετεύχθη με τη δημιουργία και τη χρήση ενός μοντέλου παλινδρόμησης ΤΝ που μπορούσε να προβλέψει τη μέση τιμή δόσης των συνθετικών εικόνων δόσης που δημιουργήθηκαν. Αυτές οι προβλεπόμενες τιμές στη συνέχεια χρησιμοποιήθηκαν για την επανακλιμάκωση των συνθετικών εικόνων δόσης σε ρεαλιστικά επίπεδα δόσης. Το μοντέλο παλινδρόμησης εκπαιδεύτηκε σε δεδομένα εικόνων που εξήχθησαν από τις κεφαλίδες DICOM των εικόνων, μαζί με άλλες υπολογισμένες τιμές από τις ίδιες τις εικόνες CT. Τα δεδομένα κεφαλίδας DICOM που χρησιμοποιήθηκαν ήταν η διάμετρος ανακατασκευής εικόνας, το ύψος του τραπεζιού, το ρεύμα της λυχνίας ακτίνων Χ και η θέση της τομής, ενώ οι υπολογισμένες ποσότητες περιελάμβαναν το πλάτος του ασθενούς στη διάσταση x του αξονικού επιπέδου, το πλάτος του ασθενούς στη διάσταση y του αξονικού επιπέδου και την ισοδύναμη διάμετρο νερού (Water Equivalent Diameter – WED). Οι υπολογισμένες μεταβλητές υπολογίστηκαν τμηματοποιώντας τις εικόνες ΥΤ χρησιμοποιώντας μεθόδους υπολογιστικής όρασης (computer vision – CV) και αποθηκεύοντας τα υπολογισμένα μεγέθη μαζί με τα δεδομένα της κεφαλίδας DICOM για κάθε εικόνα. Η αξιολόγηση της μεθόδου πραγματοποιήθηκε σε δύο επίπεδα. Η αξιολόγηση της δοσιμετρικής ακρίβειας πραγματοποιήθηκε με την εφαρμογή των εκπαιδευμένων μοντέλων σε εικόνες που δεν εξετέθησαν ποτέ σε κανένα από τα μοντέλα ΤΝ κατά την εκπαίδευσή τους και συγκρίνοντας τις δόσεις οργάνων που υπολογίστηκαν στις συνθετικές εικόνες δόσης έναντι των αντίστοιχων δόσεων που υπολογίστηκαν στις εικόνες «αληθούς δόσης» που παρήχθησαν με μεθόδους MC . Περιγράμματα τμηματοποίησης οργάνων εφαρμόστηκαν σε όλες τις εικόνες των 18 ασθενών του υποσυνόλου αξιολόγησης της μεθόδου. Η μέση δόση στους πνεύμονες, το δέρμα, το γυναικείο στήθος, τα οστά και την καρδιά υπολογίστηκε τόσο στις συνθετικές όσο και στις εικόνες «αληθούς δόσης», προκειμένου να συγκριθούν. Οι συνθετικές εικόνες αξιολογήθηκαν επίσης ως προς την ποιότητα τους χρησιμοποιώντας τυπικές μεθόδους σύγκρισης εικόνων όπως ο δείκτης δομικής ομοιότητας (Structural Similarity Index – SSIM), η ρίζα του μέσου τετραγωνικού σφάλματος (Root Mean Squared Error – RMSE), η αναλογία κορυφής σήματος προς θόρυβο (Peak Signal-To-Noise Ratio – PSNR) και η χαρτογράφηση φασματικής γωνίας (Spectral Angle Mapper – SAM). Επιπλέον, ο δείκτης γάμμα (Gamma Index Pass Rate – GIPR) χρησιμοποιήθηκε για την αξιολόγηση των συνθετικών εικόνων ως προς τη μορφολογική και δοσιμετρική τους ακρίβεια. Αποτελέσματα: Η εκπαίδευση του pix2pix cGAN για το υποσύνολο των 847 εικόνων που επελέγησαν από το αρχικό υποσύνολο εκπαίδευσης ΤΝ, πραγματοποιήθηκε σε μια πλατφόρμα υπολογιστικού νέφους χρησιμοποιώντας έναν υπολογιστή με επιτάχυνση μέσω μονάδων επεξεργασίας γραφικών P4000 (GPU – Graphics processing unit). Η εκπαίδευση για 900 εποχές χρειάστηκε 52 ώρες για να ολοκληρωθεί, ενώ η εκπαίδευση μικρότερου συνόλου δεδομένων για τον ίδιο αριθμό εποχών χρειάστηκε λιγότερο χρόνο, ευθέως ανάλογο με τον αριθμό των εικόνων που συμπεριελήφθησαν στην εκπαίδευση. Η ισορροπία Nash επιτεύχθηκε μέσα σε περίπου 200-400 εποχές. Η εκπαίδευση του μοντέλου παλινδρόμησης (regression) πραγματοποιήθηκε χρησιμοποιώντας τη βιβλιοθήκη PyCaret στο σύνολο των δεδομένων εκπαίδευσης. Πίνακες συσχέτισης (correlation heatmaps) χρησιμοποιήθηκαν για την επιλογή των μεταβλητών που θα ήταν μέρος της εκπαίδευσης του μοντέλου. Το 10-fold cross validated μοντέλο τύπου “extra trees” που επελέγη, πέτυχε μέσο σφάλμα 2.2% και δεν υπέφερε από υπερβολική προσαρμογή (over-fitting). Η τιμή του συντελεστή R2 ήταν 0.989. Χρησιμοποιώντας και τα δύο μοντέλα ΤΝ, η δημιουργία συνθετικών εικόνων δόσης από εικόνες ΥΤ διαρκεί δευτερόλεπτα ανά εικόνα. Μια ολόκληρη εξέταση ασθενούς μπορεί να υποβληθεί σε πλήρη επεξεργασία μέσα σε λίγα λεπτά και οι εικόνες να αποθηκευτούν για περαιτέρω επεξεργασία και ανάλυση. Η δοσιμετρική επικύρωση της μεθόδου απέδωσε μια μέση απόλυτη διαφορά της τάξης του 8.3% μεταξύ των δόσεων που υπολογίστηκαν στις συνθετικές εικόνες έναντι των δόσεων που υπολογίστηκαν στις εικόνες «αληθούς δόσης». Οι διαφορές δεν ξεπέρασαν το 20% σε κανένα από τα όργανα και για κανέναν από τους ασθενείς. Οι συνθετικές εικόνες δόσης που παρήχθησαν από το εκπαιδευμένο μοντέλο pix2pix έμοιαζαν πολύ με τις εικόνες «αληθούς δόσης», ωστόσο οι μέθοδοι που εφαρμόστηκαν για τον ποσοτικό προσδιορισμό της ομοιότητάς τους, απέδωσαν θετικά αποτελέσματα, υποδεικνύοντας καλή ομοιότητα. Η μέση τιμή του συντελεστή γάμμα, της πιο δοσιμετρικά σχετικής ποσότητας, βρέθηκε να είναι 77.7% ± 10.8%. Συζήτηση και συμπεράσματα: Αυτή η εργασία εισάγει μια νέα προσέγγιση στην εξατομικευμένη δοσιμετρία ασθενών στην ΥΤ. Η προτεινόμενη μέθοδος είναι ικανή να υπολογίζει γρήγορα τις δόσεις οργάνων του ασθενούς χρησιμοποιώντας μόνο τις εικόνες ΥΤ του ίδιου του ασθενούς και παρακάμπτοντας τη χρονοβόρα δημιουργία εικόνων δόσης μέσω μεθόδων MC. Το μέσο απόλυτο σφάλμα του 8.3% που πέτυχε η μέθοδος είναι αποδεκτό για τους σκοπούς της ακτινοπροστασίας στην ΥΤ. Επίσης, η μέθοδος που προτείνεται εδώ δημιουργεί συνθετικές εικόνες δόσης αποδεκτής ποιότητας, σε ένα μικρό κλάσμα του χρόνου που απαιτείται για τη δημιουργία εικόνων δόσης μέσω MC. Η επιτευχθείσα μέση τιμή GIPR για το υποσύνολο των δεδομένων αξιολόγησης της μεθόδου (77.7% ± 10.8%), ορίζει μια τιμή αναφοράς για την ποιότητα συνθετικής εικόνας στη δοσιμετρία ΥΤ. Από μόνη της, η διαθεσιμότητα εικόνων δόσης καλής ποιότητας επιτρέπει περαιτέρω ανάλυση με σκοπό τη δοσιμετρία των ασθενών, τους ποιοτικούς και ρυθμιστικούς ελέγχους ή άλλες εφαρμογές, όπως επιδημιολογικές μελέτες, στις οποίες οι υπολογισμοί της δόσης οργάνων είναι απαραίτητοι. Το σύνολο δεδομένων εκπαίδευσης που χρησιμοποιήθηκε σε αυτή τη μελέτη ήταν αρκετά μεγάλο ώστε τα μοντέλα AI να εκπαιδευτούν επαρκώς. Ένα ενδιαφέρον σημείο είναι ότι οι ανομοιομορφίες και οι διαφορές μεταξύ των τυχαία επιλεγμένων υποσυνόλων δεδομένων εκπαίδευσης και αξιολόγησης δεν αποτέλεσαν πρόβλημα για την απόδοση των μοντέλων. Πιθανώς, μεγαλύτερα σύνολα δεδομένων θα αυξήσουν την προγνωστική ισχύ των μοντέλων και θα αποδώσουν ακόμα καλύτερα δοσιμετρικά αποτελέσματα, καλύπτοντας ενδεχομένως περισσότερα πρωτόκολλα απεικόνισης ΥΤ και ενέργειες δέσμης ακτίνων Χ. Ο χρόνος που απαιτήθηκε για την εκπαίδευση των μοντέλων ΤΝ ήταν σχετικά μεγάλος αλλά σε ρεαλιστικά επίπεδα, καθιστώντας τη μέθοδο άξια ανάπτυξης για μεμονωμένα κέντρα, τομογράφους και πρωτόκολλα απεικόνισης. Η χρήση του pix2pix cGAN ήταν ένα καλό παράδειγμα αρχιτεκτονικής βαθέων νευρωνικών δικτύων που είναι σε θέση να προσδιορίζουν μόνα τους μια κατάλληλη συνάρτηση απώλειας (loss function) χωρίς να την ορίζει ρητά ο χρήστης. Παρότι το pix2pix εμπίπτει στην κατηγορία των GANs και οι διαδικασίες βαθιάς εκμάθησής του δεν είναι εξηγήσιμες, το γεγονός ότι είναι ένας τύπος εποπτευόμενης μάθησης το κάνει λίγο πιο εύκολο στην κατανόηση και την εκπαίδευση χρησιμοποιώντας τη μέθοδο ισορροπίας Nash. Η προσθήκη του μοντέλου παλινδρόμησης για την επανακλιμάκωση των συνθετικών εικόνων χρησιμοποιώντας τη μέση τιμή εικόνας δόσης αποτέλεσε ένα απαραίτητο βήμα που συνδέει τα αποτελέσματα των μοντέλων ΤΝ με τη φυσική πραγματικότητα της δοσιμετρίας. Άλλοι συγγραφείς που χρησιμοποίησαν μεθόδους πρόβλεψης δόσης με βάση την ΤΝ εφάρμοσαν επίσης παρόμοιες μεθόδους για να ομαλοποιήσουν τα αποτελέσματά τους. Η προτεινόμενη μέθοδος αποδίδει δοσιμετρικά αποτελέσματα που είναι συγκρίσιμα με εναλλακτικές προσεγγίσεις, ενώ είναι απλή, κατανοητή και κομψή. Λόγω της χρήσης του προγραμματισμού με Python, εξειδικευμένοι αγωγοί επεξεργασίας δεδομένων (pipelines) ανοιχτού κώδικα μπορούν να χρησιμοποιηθούν για την αυτοματοποίηση και τον εξορθολογισμό των βημάτων της διαδικασίας προς εξοικονόμηση χρόνου, κόστους και προσπάθειας στο κλινικό περιβάλλον. Επιπλέον, η απόδοση των μοντέλων και η συνολική μέθοδος δεν επηρεάστηκε από την παρουσία διαφορετικών τύπων παθολογίας στις εικόνες. Ωστόσο, η περαιτέρω διερεύνηση των πιθανών επιπτώσεων της υπάρχουσας παθολογίας στη δοσιμετρική ακρίβεια αξίζει να διερευνηθεί περαιτέρω. Ένα άλλο πιθανό μελλοντικό πεδίο μελέτης θα ήταν η αξιολόγηση της επίδρασης των σκιαγραφικών μέσων που χρησιμοποιούνται στις εξετάσεις ΥΤ. Ωστόσο, ούτε οι μέθοδοι MC ούτε η ΤΝ έχουν ακόμη παράγει κατάλληλες λύσεις για την αντιμετώπιση της επίδρασης των σκιαγραφικών μέσων στη δόση του ασθενούς στην ΥΤ.
περισσότερα
Περίληψη σε άλλη γλώσσα
Introduction: Computed tomography (CT) is one of the most important medical imaging modalities. The high patient radiation doses and frequency of examinations encountered in CT, have sparked an increased scientific and clinical interest in individual patient dose estimation. In 2014, the Council of the European Union issued Directive 2013/59/EURATOM, asking Member States to strengthen their requirements concerning patient information, including the recording and reporting of radiation doses from medical procedures. Modern computational dosimetry methods can provide accurate patient dose estimations in a non-invasive manner, using the power of modern computer systems. Also, due to the fact that they do not need to use specialized materials or consumables, computational methods have the potential to reduce the cost of individual patient dosimetry, at reasonably affordable levels. However, to date, the required know-how and computational time needed for the determination of patient dose ...
Introduction: Computed tomography (CT) is one of the most important medical imaging modalities. The high patient radiation doses and frequency of examinations encountered in CT, have sparked an increased scientific and clinical interest in individual patient dose estimation. In 2014, the Council of the European Union issued Directive 2013/59/EURATOM, asking Member States to strengthen their requirements concerning patient information, including the recording and reporting of radiation doses from medical procedures. Modern computational dosimetry methods can provide accurate patient dose estimations in a non-invasive manner, using the power of modern computer systems. Also, due to the fact that they do not need to use specialized materials or consumables, computational methods have the potential to reduce the cost of individual patient dosimetry, at reasonably affordable levels. However, to date, the required know-how and computational time needed for the determination of patient dose from CT examinations, have been discouraging researchers from pursuing this goal. Till now, the gold-standard method for individual patient CT dosimetry has been the application of Monte Carlo (MC) radiation transport methods on 3-dimensional (3D) patient specific phantoms that are created through the CT datasets of the patients themselves. The application of MC on such phantoms allows the creation of 3D dose maps. In turn, those maps can be used to calculate individual organ doses through some form of segmentation. However, as mentioned above the tools and know-how required make the wide application of such tools in clinical practice difficult. The purpose of this work was the development of an artificial intelligence (AI) assisted computational method, which will significantly contribute to making the estimation of individual patient dose in CT practically feasible at the clinic. More specifically, this work aimed to substitute the MC simulations needed in order to create the 3D dose distribution maps. Methods: A total of 95 randomly selected, anonymized CT examinations were selected from the institutional repository of the University Hospital of Heraklion. Anonymization was performed using specialized software and also manually checked to ensure it was successful, by looking into the image metadata, using a Digital Imaging and Communications in Medicine (DICOM) image viewer. Appropriate approval was obtained from the institutional review board, ensuring proper use of patient data. All CT examinations were performed on the same 64-detector row CT scanner (Revolution GSI; GE Medical Systems, Waukesha, Wisconsin, USA), using the typical adult thorax imaging protocol used in the hospital. Dose images for each CT dataset were created by using the MC-based software ImpactMC. The software runs MC simulations of radiation transport on the CT imaging datasets of individual patients and calculates the dose images. Resulting dose images correspond 1-to-1 to the CT images they were produced from, not requiring any registration. These MC-calculated dose images are used as the ground truth dose images in this study. ImpactMC requires input describing the geometric and dosimetric characteristics of the CT scanner, such as beam collimation, fan angle, spectrum of the beam and rotation time, among others. Data preprocessing was performed using Python notebooks and available, open-source, Python libraries. A total of 11424 DICOM CT images and an equal number of ground truth dose images (also in DICOM format) were perused and analyzed. To avoid fidelity loss, all images were used in their original size and no contrast enhancements (which are usually irreversible) were used. Imaging data and relevant patient information was extracted in bulk from DICOM using the Pydicom Python library and put in spreadsheets for further processing. The dataset was separated into a training dataset (77 patients, 9231 CT images and their 9231 respective ground truth dose images, created with MC methods) and a method evaluation dataset (18 patients, 2193 CT images and their 2193 respective ground truth dose images, created with MC methods). Conditional generative adversarial networks (cGANs) and more specifically image-to-image translation (pix2pix) were trained to be able to create the dose maps directly from the CT images of patients. This architecture involves two competing neural networks, namely the generator and the discriminator, working iteratively in order to learn how to create a desired type of images through looking at a different type of related images. In practice the network used in this study aimed at creating synthetic dose images by looking at how an actual pair of a CT image and its corresponding ground truth dose image (created with MC methods) looks like. The pix2pix was trained on pairs of CT and their respective, ground truth, MC-generated images of 77 randomly selected patients (47 Male, 30 Female). The total number of images used for the training was a subset of 847 from the initial 9231 images of the 77 patients that were included in the test set. Through many epochs of converging/successful training, the pix2pix model was able to learn how to create realistic dose images by just looking at CT images of patients. However, for the pix2pix cGAN to work properly, image pixel/voxel values needed to be rescaled between -1 and 1 (0 and 1 for dose images) during the data preprocessing phase, by dividing every pixel value in each image, with the highest pixel value in the image. This rescaling resulted in keeping the mathematical proportions of the images, but also to the disconnection of pixel value and the absolute dose to the tissues represented in the dose images. As a result, the synthetic dose images created by pix2pix, needed to be rescaled once more to correspond to actual dose levels. This was achieved by creating and employing a regression model that was capable of predicting the average dose value of the generated dose images. These predicted values were then used to rescale the synthetic dose images up to realistic dose levels. The regression model was trained on image data that were extracted from the DICOM headers of images, along with calculated values from the CT images themselves. DICOM header data used were reconstruction diameter, table height, X-ray tube current and slice location, while calculated quantities included patient width in the x dimension of the axial plane, patient width in the y dimension of the axial plane and water equivalent diameter (WED). The calculated variables were calculated by segmenting the CT images using computer vision (CV) methods and saving the data along with DICOM header data for every image. The evaluation of the method was two tiered. Evaluation of the dosimetric accuracy was performed by applying the trained models on images that were never seen by any of the AI models and comparing organ doses calculated on the synthetic dose images versus the corresponding doses calculated on the ground truth dose images produced with MC methods. Organ segmentation contours were applied on all slices of all 18 patients of the method evaluation dataset, and average dose to the lungs, skin, female breast, bone and heart was calculated on both the synthetic and the ground truth images, in order to be compared. The synthetic images were also evaluated for quality by using typical image comparison methods such as the structural similarity Index (SSIM), root mean squared error (RMSE), peak signal-to-noise ratio (PSNR) and spectral angle mapper (SAM). Furthermore, the gamma index pass rate (GIPR) was also used to evaluate the images in respect to their morphological and dosimetric accuracy. Results: The cGAN training for the subset of 847 images selected from the original training dataset was performed on a cloud computing platform using an instance with Graphics processing unit (GPU) acceleration (P4000 GPU). Training for 900 epochs took 52 hours to complete, while training a smaller dataset for the same number of epochs took proportionally less time, according to the smaller number of images included in the training. Nash equilibrium was achieved within about 200-400 epochs. The regression model training was performed using the PyCaret library on the dataset. Correlation heatmaps were used for the selection of the variables that would be part of the model training. The 10-fold cross-validated extra trees type model that was selected achieved a mean average error of 2.2% and did not suffer from over-fitting. The R2 value was 0.989. Using both models the creation of synthetic dose images from CT images takes seconds per image. A whole study can be processed in a few minutes and images can be saved for further processing and analysis. The dosimetric validation of the method yielded a mean absolute difference of 8.3% between doses calculated on the synthetic versus the ground truth dose images. Differences did not exceed 20% across all organs and patients. The synthetic dose images that were produced by the trained pix2pix model looked very similar to the ground truth images, however the methods applied for the quantification of their similarity yielded positive results, indicating good similarity. The average value of the more dosimetrically relevant metric of GIPR was found to be 77.7% ± 10.8%. Discussion and conclusions: This work represents a novel approach in personalized patient dosimetry in CT. The proposed method is capable of quickly calculating individual patient organ doses by using only the patient CT datasets as input and skipping the time-consuming MC dose image generation. The average absolute error of 8.3% that the method achieved is acceptable for the purposes of radiation protection in CT. Also, the method proposed herein creates synthetic dose images of acceptable quality at a fraction of the time needed for MC dose image generation. The achieved average GIPR value for the method evaluation dataset of 77.7% ± 10.8%, sets a benchmark value for synthetic image quality in CT dosimetry. By itself, the availability of good quality dose images enables further analysis for the purpose of patient dosimetry, quality and regulatory audits, or other applications such as epidemiological studies, in which organ dose calculations are pertinent. The training dataset used in this study was large enough for the AI models to be trained properly. An interesting point is that the non-uniformities and differences between the randomly selected training and evaluation datasets were not an issue for the models’ performance. Presumably, larger datasets will increase the predictive power of the models and yield even better dosimetric results, potentially covering other CT imaging protocols and X-ray energies. The time required to train the AI models was relatively long but within realistically achievable levels, making the method worth developing for individual centers, scanners and imaging protocols. The use of the pix2pix cGAN has been a good example of deep neural network architecture that is capable of figuring out an appropriate loss function without the user expressly defining it. Even if the pix2pix falls under the category of GANs and its deep learning (DL) processes are not explainable, the fact that it is a type of supervised learning makes it a little easier to understand and train using the Nash equilibrium method. The addition of the regression model for the scaling of the synthetic images using the average dose image value comprised a necessary step that connects the AI outputs to the physical reality of dosimetry. Other authors who used AI based dose prediction methods also applied similar methods to normalize their results. The proposed method yields dosimetric results that are comparable to alternative state of the art approaches, while being simple, easy to understand and elegant. Due to the use of Python programming, open-source data processing pipelines can be employed to automate and streamline steps of the process to save time, cost and effort in the clinical environment. Furthermore, the performance of the models and the overall method was not affected by the presence of different types of pathology in the images. However, further investigation of possible effects of existing pathology on the dosimetric performance would be worth exploring. Another possible future field of study would be assessing the effect of contrast agents used in the CT examinations. However, neither MC nor AI have yet produced appropriate solutions to tackle the effect of contrast agents on patient dose in CT.
περισσότερα