Επισκόπηση αλγορίθμων βελτιστοποίησης για καθαρά ολογράμματα φάσης
1. Ιστορικό
Τα τελευταία χρόνια, η υπολογιστική ολογραφία αναπτύσσεται ραγδαία χάρη στις εξελίξεις σε διάφορες τεχνολογίες όπως η οπτική, η ηλεκτρονική και οι υπολογιστές, καθώς και σε νέους αλγόριθμους. Δεδομένου ότι οι υπάρχοντες διαμορφωτές χωρικού φωτός υγρών κρυστάλλων έχουν υψηλότερη ικανότητα διαμόρφωσης και απόδοση περίθλασης για ολογράμματα καθαρής φάσης, οι αλγόριθμοι βελτιστοποίησης για ολογράμματα καθαρής φάσης αποτελούσαν πάντα ένα ερευνητικό hotspot. Προς το παρόν, διάφορες παραδοσιακές μέθοδοι μπορούν να ικανοποιήσουν διαφορετικές απαιτήσεις υπολογιστικού χρόνου και ποιότητας ανακατασκευής, ενώ νέες μέθοδοι όπως η βαθιά μάθηση και η ροή Verdinger φέρνουν νέες ιδέες για βελτιστοποίηση ολογραμμάτων καθαρής φάσης, και αυτές οι εργασίες ευνοούν την έγκαιρη υλοποίηση ολογραφικών τρισδιάστατων οθονών σε πραγματικό χρόνο, ευρέος οπτικού πεδίου και υψηλής ποιότητας. Σε αντίθεση με την παραδοσιακή τεχνολογία ολογραφικής απεικόνισης, στον τομέα των ολογραμμάτων που δημιουργούνται από υπολογιστή, οι διαμορφωτές χωρικού φωτός υγρών κρυστάλλων προσφέρουν μια άνευ προηγουμένου ευέλικτη ικανότητα ελέγχου των πληροφοριών κύματος, η οποία παρέχει μεγάλο χώρο ανάπτυξης και ισχύ για την ανάπτυξη της υπολογιστικής ολογραφίας.
Τις τελευταίες δεκαετίες, έχει παρατηρηθεί πολλαπλασιασμός αλγορίθμων ολογραμμάτων μόνο φάσης που δημιουργούνται από υπολογιστή, ο πυρήνας των οποίων είναι το πρόβλημα βελτιστοποίησης ολογραμμάτων μόνο φάσης: δεδομένου ενός ολόγραμμα σύνθετου πλάτους (Ολόγραμμα σύνθετου πλάτους), κωδικοποιήστε το ως ολόγραμμα μόνο φάσης (Ολόγραμμα μόνο φάσης), έτσι ώστε η οπτική ανακατασκευή της εικόνας που λαμβάνεται από αυτό το καθαρό ολόγραμμα φάσης να αναπαράγει την αρχική εικόνα όσο το δυνατόν περισσότερο. Η εικόνα που λαμβάνεται με οπτική ανακατασκευή με το ολόγραμμα μόνο φάσης θα πρέπει να αποκατασταθεί στην αρχική εικόνα όσο το δυνατόν περισσότερο. Αυτές οι μέθοδοι χωρίζονται κυρίως σε τρεις κατηγορίες: επαναληπτικές μέθοδοι, μη επαναληπτικές μέθοδοι και άλλες μέθοδοι. Οι επαναληπτικοί αλγόριθμοι συνήθως ξεκινούν από μια προσέγγιση του ολογράμματος-στόχου και μετά από μια σειρά επαναλαμβανόμενων λειτουργιών συνεχίζουν να βελτιστοποιούν την προσέγγιση του ολογράμματος μέχρι η ανακατασκευασμένη εικόνα που λαμβάνεται με αυτήν την προσέγγιση να πληροί ορισμένες απαιτήσεις σφάλματος. Οι μη επαναληπτικοί αλγόριθμοι δεν χρειάζεται να επαναλαμβάνουν μεγάλο αριθμό υπολογισμών βελτιστοποίησης και θα δίνονται ταυτόχρονα σύμφωνα με τα καθορισμένα βήματα στην κατά προσέγγιση λύση. Λόγω του χαμηλότερου υπολογιστικού φορτίου, οι μη επαναληπτικοί αλγόριθμοι είναι περισσότερο συμβατοί με τις απαιτήσεις της ολογραφικής απεικόνισης σε πραγματικό χρόνο, αλλά με το κόστος της ανακατασκευής, η ποιότητα τέτοιων μεθόδων δεν είναι τόσο καλή όσο των επαναληπτικών αλγορίθμων. Άλλες μέθοδοι είναι πολύ διαφορετικές και έχουν τα δικά τους χαρακτηριστικά.
2.Εισαγωγή σε αλγόριθμους για τη δημιουργία καθαρών ολογραμμάτων φάσης
Επαναληπτικός Αλγόριθμος: Αλγόριθμος Gerchberg-Saxton
Μεταξύ των επαναληπτικών αλγορίθμων που μπορούν να δημιουργήσουν καθαρά ολογράμματα φάσης, ο Αλγόριθμος Επαναληπτικού Μετασχηματισμού Fourier (IterativeFourier Transform Algorithm) είναι ένας πιο αντιπροσωπευτικός αλγόριθμος, ο οποίος χαρακτηρίζεται από την επαναληπτική διέλευση του Μετασχηματισμού Fourier σε δύο επίπεδα.
Σχήμα 1 Διάγραμμα ροής ολογραφίας που δημιουργείται από υπολογιστή
Ο επαναληπτικός αλγόριθμος μετασχηματισμού Fourier, ή Αλγόριθμος Μείωσης Σφαλμάτων (Error Reduction Algorithm) προτάθηκε ως αλγόριθμος για την ψηφιακή ολογραφία στις αρχές της δεκαετίας του 1970 και αργότερα τροποποιήθηκε από τους Gerchberg και Saxton και εφαρμόστηκε στον τομέα της εξαγωγής φάσεων, ο οποίος έχει γίνει η πιο διάσημη και πιθανώς η πιο χρησιμοποιούμενη μέθοδος στον επαναληπτικό αλγόριθμο. -Ο αλγόριθμος Gerchberg-Saxton (GS), του οποίου το διάγραμμα ροής φαίνεται στο Σχήμα 2.
Σχήμα 2 Διάγραμμα ροής του αλγορίθμου Gerchberg-Saxton.
Σε αυτόν τον αλγόριθμο, σύμφωνα με την κατανομή πλάτους του επιπέδου ολογράμματος και του ανακατασκευασμένου επιπέδου εικόνας, οι πληροφορίες φάσης του φωτεινού πεδίου στο επίπεδο ολογράμματος λαμβάνονται με επαναληπτική εκτέλεση της διάδοσης του φωτεινού κύματος προς τα εμπρός και προς τα πίσω, καθώς και με τους περιορισμούς που επιβάλλονται στα δύο επίπεδα. Αυτή η μέθοδος είναι πολύ κατάλληλη για τον υπολογισμό καθαρών ολογραμμάτων φάσης, και οι μετασχηματισμοί Fresnel ή Fourier μπορούν να χρησιμοποιηθούν για τον υπολογισμό της διάδοσης του φωτεινού πεδίου.
Επαναληπτικός Αλγόριθμος: Αλγόριθμος Διάχυσης Σφάλματος
Η Μέθοδος Διάχυσης Σφάλματος είναι ένας άλλος τύπος επαναληπτικού αλγορίθμου που επαναλαμβάνεται μεταξύ pixel στο επίπεδο του ολογράμματος. Όταν οι πληροφορίες πλάτους ενός ολογράμματος σύνθετου πλάτους αφαιρούνται απευθείας, κάθε σημείο pixel δημιουργεί ένα σφάλμα και ο αλγόριθμος διάχυσης σφαλμάτων θα σαρώσει τα σημεία pixel ένα προς ένα και θα διαχύσει το σφάλμα κάθε σημείου pixel στα τέσσερα γειτονικά σημεία pixel που δεν έχουν ακόμη σαρωθεί σύμφωνα με ένα συγκεκριμένο βάρος.
Σχήμα 3 Σχηματικό διάγραμμα του αλγορίθμου διάχυσης σφαλμάτων.
(α) Διάχυση σφάλματος από σάρωση από αριστερά προς τα δεξιά· (β) διάχυση σφάλματος με σάρωση από δεξιά προς τα αριστερά.
3. Μη επαναληπτικοί αλγόριθμοι
Η μέθοδος τυχαίας φάσης είναι μια συνήθως χρησιμοποιούμενη μη επαναληπτική μέθοδος στη διαδικασία της καθαρής φάσης ολογράμματος. Δεδομένου ότι η ολογραφική κωδικοποίηση καθαρής φάσης είναι ισοδύναμη με μια διαδικασία φιλτραρίσματος υψηλής συχνότητας, η ανακατασκευασμένη εικόνα περιλαμβάνει μόνο τα οριακά και γραμμικά τμήματα της αρχικής εικόνας, επομένως είναι απαραίτητο να εισαχθεί μια Μάσκα Τυχαίας Φάσης για να γίνει το μέτωπο κύματος της αρχικής εικόνας διασκορπισμένο σε ολόκληρο το ολόγραμμα, προκειμένου να βελτιωθεί η ποιότητα της ανακατασκευής. Ωστόσο, ο επακόλουθος θόρυβος κηλίδων είναι επίσης πιο εμφανής. Προκειμένου να μειωθεί αυτός ο θόρυβος κηλίδων, πρόσφατα υπάρχει μια βελτιωμένη μέθοδος τυχαίας φάσης, η οποία εισάγει τυχαίες μάσκες φάσης με διαφορετικές συχνότητες για διαφορετικές εικόνες για να μειώσει περαιτέρω την απώλεια πληροφοριών και να βελτιώσει την ποιότητα της ανακατασκευής. Επιπλέον, υπάρχουν πολλές μη επαναληπτικές μέθοδοι για τη μείωση του θορύβου κηλίδων, όπως η μέθοδος Ολογράμματος μόνο δειγματοληψίας φάσης με μάσκα υποδειγματοληψίας, η μέθοδος Ολογράμματος μόνο φάσης με μοτίβο, η μέθοδος διπλής φάσης και η μέθοδος τυχαίας φάσης που χρησιμοποιεί μη τυχαιοποιημένες μάσκες φάσης. Η μέθοδος φάσης και η μέθοδος τυχαίας χωρίς φάση που χρησιμοποιεί μια μη τυχαία μάσκα φάσης.
Σχήμα 4 Παράδειγμα του ρόλου της τυχαίας φάσης στα αποτελέσματα ανακατασκευής ολογραμμάτων καθαρής φάσης
(α) Αρχική εικόνα· (β) χωρίς προσθήκη τυχαίας μάσκας φάσης· (γ) με προσθήκη τυχαίας μάσκας φάσης.
4. Άλλες μέθοδοι
Εκτός από τους επαναληπτικούς και μη επαναληπτικούς αλγόριθμους, υπάρχει ένας άμεσος αλγόριθμος που μπορεί να χρησιμοποιηθεί για τον υπολογισμό ενός καθαρού ολογράμματος φάσης. Υποθέτοντας ότι ένα καθαρού ολογράμματος φάσης έχει M×N pixel και κάθε pixel έχει Q πιθανές τιμές για την τιμή φάσης, ο χώρος αναζήτησης του προβλήματος δημιουργίας καθαρού ολογράμματος φάσης είναι M×N×Q και ο στόχος είναι να βρεθούν όλες οι τιμές pixel του ολογράμματος που ελαχιστοποιούν το σφάλμα μεταξύ της ανακατασκευασμένης εικόνας και της αρχικής εικόνας. Υπάρχουν τρεις κύριες κατηγορίες άμεσων αλγορίθμων: αλγόριθμος άμεσης αναζήτησης (Αλγόριθμος Άμεσης Αναζήτησης), αλγόριθμος προσομοίωσης ανόπτησης (Αλγόριθμος Προσομοίωσης Ανόπτησης) και γενετικός αλγόριθμος (Γενετικός Αλγόριθμος).
Σχήμα 5 Σύγκριση τριών άμεσων αλγορίθμων
Εκτός από τους αλγόριθμους που παρουσιάστηκαν παραπάνω, στην εργασία παρουσιάζεται επίσης μια σειρά από αλγόριθμους που έχουν προταθεί τα τελευταία χρόνια, όπως: ένας αλγόριθμος δημιουργίας καθαρού ολογράμματος φάσης μεταξύ των δύο κατηγοριοποιήσεων, επαναληπτικών και μη επαναληπτικών αλγορίθμων, ο οποίος μπορεί να εξοικονομήσει πολύ χρόνο υπολογισμού διατηρώντας παράλληλα υψηλή ακρίβεια ανακατασκευής και είναι κατάλληλος για εφαρμογές όπως η απεικόνιση ολογραφικής δυναμικής σε πραγματικό χρόνο, καθώς και μια μέθοδος βαθιάς μάθησης, η οποία αναπτύσσεται ραγδαία τα τελευταία χρόνια και έχει χρησιμοποιηθεί στη συμπίεση ολογραμμάτων. Στον βρόχο, η τεχνική CITL καταγράφει απευθείας το αποτέλεσμα οπτικής ανακατασκευής του ολογράμματος και χρησιμοποιεί το αποτέλεσμα για περαιτέρω βελτιστοποίηση του ολογράμματος, επιτυγχάνοντας υψηλή ποιότητα ανακατασκευής. Και η μέθοδος εξαγωγής φάσης που βασίζεται στη ροή Wirtinger και προτείνεται από τους Chakravarthy et al. μπορεί να μετατρέψει το πρόβλημα εξαγωγής φάσης σε έναν αλγόριθμο βελτιστοποίησης πρώτης τάξης (First-Order-Optimization), ο οποίος μπορεί να χρησιμοποιηθεί για τη βελτιστοποίηση του ολογράμματος. Η μέθοδος εξαγωγής φάσης που βασίζεται στη ροή Wirtinger και προτείνεται από τους Chakravarthy et al. μπορεί να μετατρέψει το πρόβλημα εξαγωγής φάσεων σε ένα τετραγωνικό πρόβλημα που μπορεί να βελτιστοποιηθεί με τη Μέθοδο Βελτιστοποίησης Πρώτης Τάξης. Η χρήση αυτής της μεθόδου εξαγωγής φάσεων για βελτιστοποίηση ολογραμμάτων μπορεί να επιτύχει πολύ υψηλή ακρίβεια στην ποιότητα ανακατασκευής με υπολογιστικό κόστος συγκρίσιμο με αυτό του αλγορίθμου GS.
Προς το παρόν, τόσο οι παραδοσιακοί επαναληπτικοί όσο και οι μη επαναληπτικοί αλγόριθμοι βελτιστοποίησης ολογραμμάτων καθαρής φάσης έχουν επιτύχει καλά αποτελέσματα, αλλά είναι απαραίτητο να γίνει μια αντιστάθμιση μεταξύ του υπολογιστικού χρόνου που απαιτεί και της ποιότητας ανακατασκευής, και η συνεχής εμφάνιση νέων μεθόδων όπως η βαθιά μάθηση και η ροή Verdinger έχει φέρει νέες ιδέες για την επίλυση αυτού του προβλήματος, και όλα αυτά τα έργα ευνοούν την έγκαιρη υλοποίηση ολογραφικών τρισδιάστατων οθονών σε πραγματικό χρόνο, με ευρύ οπτικό πεδίο και υψηλή ποιότητα.
Αναφορές:
Bu Haozhen, Jiao Shuming. Αλγόριθμος βελτιστοποίησης για ολόγραμμα καθαρής φάσης [J]. Υγροί κρύσταλλοι και οθόνες, 2021,36(06):810-826.
DOI: 10.37188/CJLCD.2021-0035