Η Μόνα Λίζα μπορεί πλέον να κάνει κάτι περισσότερο από το να χαμογελάει, χάρη στη νέα τεχνολογία τεχνητής νοημοσύνης της Microsoft.
Την περασμένη εβδομάδα, οι ερευνητές της Microsoft παρουσίασαν λεπτομερώς ένα νέο μοντέλο τεχνητής νοημοσύνης που ανέπτυξαν, το οποίο μπορεί να λάβει μια ακίνητη εικόνα ενός προσώπου και ένα ηχητικό απόσπασμα από την ομιλία κάποιου και να δημιουργήσει αυτόματα ένα ρεαλιστικό βίντεο. Τα βίντεο – τα οποία μπορούν να δημιουργηθούν από πραγματικά πρόσωπα σε φωτογραφίες, καθώς και από κινούμενα σχέδια ή έργα τέχνης – είναι πλήρη με συναρπαστικό συγχρονισμό χειλιών και φυσικές κινήσεις προσώπου.
Σε ένα βίντεο επίδειξης, οι ερευνητές έδειξαν πώς έδωσαν φωνή και κίνηση στη Μόνα Λίζα για να απαγγείλει ένα κωμικό ραπ τραγούδι που στην πραγματικότητα είχε τραγουδήσει σε μια εκπομπή προ δεκαετίας η διάσημη ηθοποιός, Anne Hathaway.
Η Μόνα Λίζα «τραγουδάει» ραπ
Τα αποτελέσματα του μοντέλου τεχνητής νοημοσύνης, που ονομάζεται VASA-1, είναι πραγματικά εντυπωσιακά.
Η Microsoft δήλωσε ότι η τεχνολογία θα μπορούσε να χρησιμοποιηθεί για την εκπαίδευση ή τη «βελτίωση της προσβασιμότητας για άτομα με επικοινωνιακές προκλήσεις», ή ενδεχομένως για τη δημιουργία εικονικών συντρόφων για τους ανθρώπους. Αλλά είναι επίσης εύκολο να καταλάβει κανείς πώς το εργαλείο θα μπορούσε να γίνει αντικείμενο κατάχρησης και να χρησιμοποιηθεί για να υποδυθεί πραγματικούς ανθρώπους, σε ένα όργιο παραπληροφόρησης και deepfake.
Πρόκειται για μια ανησυχία που ξεπερνά τη Microsoft. Καθώς εμφανίζονται περισσότερα εργαλεία για τη δημιουργία πειστικών εικόνων, βίντεο και ήχου που δημιουργούνται με τεχνητή νοημοσύνη, οι ειδικοί ανησυχούν ότι η κατάχρησή τους θα μπορούσε να οδηγήσει σε νέες μορφές παραπληροφόρησης. Ορισμένοι ανησυχούν επίσης ότι η τεχνολογία θα μπορούσε να διαταράξει περαιτέρω βιομηχανίες, από τον κινηματογράφο μέχρι τη διαφήμιση.
Προς το παρόν, η Microsoft δήλωσε ότι δεν σκοπεύει να διαθέσει άμεσα το μοντέλο VASA-1 στο κοινό. Η κίνηση αυτή είναι παρόμοια με τον τρόπο με τον οποίο ο συνεργάτης της Microsoft, η OpenAI, χειρίζεται τις ανησυχίες γύρω από το εργαλείο βίντεο που παράγει η τεχνητή νοημοσύνη, το Sora: Η OpenAI παρουσίασε το Sora τον Φεβρουάριο, αλλά μέχρι στιγμής το έχει διαθέσει μόνο σε ορισμένους επαγγελματίες χρήστες και καθηγητές κυβερνοασφάλειας για δοκιμαστικούς σκοπούς.
«Είμαστε αντίθετοι σε οποιαδήποτε συμπεριφορά για τη δημιουργία παραπλανητικού ή επιβλαβούς περιεχομένου πραγματικών προσώπων”, ανέφεραν οι ερευνητές της Microsoft σε ανάρτηση στο blog. Αλλά, πρόσθεσαν, η εταιρεία «δεν έχει σχέδια να κυκλοφορήσει» το προϊόν δημόσια «μέχρι να είμαστε σίγουροι ότι η τεχνολογία θα χρησιμοποιηθεί υπεύθυνα και σύμφωνα με τους κατάλληλους κανονισμούς».