Η Google λανσάρει την τεχνολογία αναγνώρισης περιεχομένου που παράχθηκε από AI

0


Η Google ανακοίνωσε επίσημα ότι το SynthID είναι πλέον διαθέσιμο για όποιον θέλει να το δοκιμάσει. Το σύστημα ελέγχου ταυτότητας για περιεχόμενο που παράγεται από Τεχνητή Νοημοσύνη ενσωματώνει ανεπαίσθητα υδατογραφήματα σε παραγόμενες εικόνες, video και κείμενα, επιτρέποντας στους χρήστες να επαληθεύουν αν ένα κομμάτι περιεχομένου δημιουργήθηκε από ανθρώπους ή μηχανές.

Το εργαλείο μας SynthID Text watermarking είναι διαθέσιμο ως open-source σε προγραμματιστές και επιχειρήσεις, για να τους βοηθήσει να ταυτοποιήσουν το περιεχόμενο που παράγεται με τεχνητή νοημοσύνη.

Το SynthID έκανε το ντεμπούτο του το 2023 ως μέσο για την υδατογράφηση εικόνων, ήχου και video που δημιουργούνται από AI. Αρχικά ενσωματώθηκε στο Imagen και στη συνέχεια η εταιρεία ανακοίνωσε την ενσωμάτωση του στο chatbot Gemini τον περασμένο Μάιο στο I/O 2024.

Το σύστημα λειτουργεί με την κωδικοποίηση των tokens, τα θεμελιώδη κομμάτια δεδομένων (είτε πρόκειται για έναν μεμονωμένο χαρακτήρα, μια λέξη ή μέρος μιας φράσης) που χρησιμοποιεί μια παραγωγική AI για να κατανοήσει την προτροπή και να προβλέψει την επόμενη λέξη στην απάντησή της, με ανεπαίσθητα υδατογραφήματα κατά τη διαδικασία παραγωγής κειμένου. Αυτό το κάνει εισάγοντας πρόσθετες πληροφορίες στην κατανομή των token στο σημείο της παραγωγής, διαμορφώνοντας την πιθανότητα να δημιουργηθούν token.

Συγκρίνοντας τις επιλογές λέξεων του μοντέλου μαζί με τις «προσαρμοσμένες βαθμολογίες πιθανότητας» με το αναμενόμενο μοτίβο των βαθμολογιών για κείμενα με και χωρίς υδατογράφημα, το SynthID μπορεί να ανιχνεύσει αν μια Τεχνητή Νοημοσύνη έγραψε αυτή την πρόταση.

Αυτή η διαδικασία δεν επηρεάζει την ακρίβεια, την ποιότητα ή την ταχύτητα της απάντησης, σύμφωνα με μελέτη που δημοσιεύθηκε στο Nature, ούτε μπορεί εύκολα να παρακαμφθεί. Σε αντίθεση με τα τυπικά μεταδεδομένα, τα οποία μπορούν εύκολα να αφαιρεθούν και να διαγραφούν, το υδατογράφημα του SynthID φέρεται να παραμένει ακόμη και αν το περιεχόμενο έχει περικοπεί, υποστεί επεξεργασία ή τροποποιηθεί με άλλο τρόπο.

Ωστόσο, το σύστημα δεν είναι αλάνθαστο. Αν και είναι ανθεκτικό στην παραποίηση, τα υδατογραφήματα του SynthID μπορούν να αφαιρεθούν εάν το κείμενο περάσει από μια εφαρμογή γλωσσικής μετάφρασης ή εάν έχει ξαναγραφτεί σε μεγάλο βαθμό. Είναι επίσης λιγότερο αποτελεσματικό με σύντομα αποσπάσματα κειμένου και στον προσδιορισμό του κατά πόσον μια απάντηση που βασίζεται σε μια πραγματική δήλωση δημιουργήθηκε από AI.

[via]



Πηγή