Η Google DeepMind, οι άνθρωποι πίσω από το AlphaFold, ανακοίνωσαν το Genie 2, ένα πρωτοποριακό εργαλείο που μπορεί να δημιουργήσει διαδραστικούς τρισδιάστατους κόσμους με βάση μια απλή προτροπή εικόνας. Αυτό το νέο μοντέλο έχει σχεδιαστεί για να βοηθήσει στην εκπαίδευση και τη δοκιμή των AI agents, επιτρέποντάς τους να αλληλεπιδρούν με αυτά τα δυναμικά περιβάλλοντα χρησιμοποιώντας καταχωρήσεις από το πληκτρολόγιο και το ποντίκι. Επιτρέπει την εκπαίδευση και τη δοκιμή των AI agents σε μια ευρεία ποικιλία διαδραστικών περιβαλλόντων, και εδώ είναι μια ανάλυση των βασικών δυνατοτήτων του, σύμφωνα με την DeepMind:
- Action-Controlable: Το Genie 2 ανταποκρίνεται σε ενέργειες, όπως είσοδοι από το πληκτρολόγιο και το ποντίκι, επιτρέποντας σε έναν άνθρωπο ή μια AI να αλληλεπιδράσει με το περιβάλλον. Για παράδειγμα, όταν πατάτε τα πλήκτρα με τα βέλη, καταλαβαίνει ότι πρέπει να μετακινήσει τον χαρακτήρα και έτσι δεν μετακινεί κατά λάθος αντικείμενα όπως δέντρα ή σύννεφα.
- Long Horizon Memory: Το Genie 2 μπορεί να θυμάται τμήματα του κόσμου που δεν είναι πλέον ορατά και να τα απεικονίζει όταν επανέρχονται στη σκηνή, κάνοντας την προσομοίωση να φαίνεται πιο συνεχής και ρεαλιστική.
- New Content On-the-Fly: Μπορεί να δημιουργήσει νέο, συνεπές περιεχόμενο, διατηρώντας παράλληλα την ακεραιότητα του κόσμου με την πάροδο του χρόνου, διασφαλίζοντας ότι τα περιβάλλοντα εξελίσσονται πάντα με αληθοφανή τρόπο.
- Emergent Capabilities: Το Genie 2 μπορεί να μοντελοποιήσει πολύπλοκες αλληλεπιδράσεις, όπως η Φυσική, η βαρύτητα και ο φωτισμός, ακόμη και να εμψυχώσει χαρακτήρες και να προσομοιώσει συμπεριφορές των μη playable χαρακτήρων (NPCs). Μπορεί να χειριστεί τα πάντα, από εφέ νερού μέχρι την κίνηση των χαρακτήρων και τον καπνό.
- Counterfactual Simulation: Το σύστημα μπορεί να δημιουργήσει διαφορετικές διαδρομές από το ίδιο σημείο εκκίνησης. Αυτό το χαρακτηριστικό επιτρέπει στους ερευνητές να δοκιμάζουν διαφορετικά αποτελέσματα, παρέχοντας έναν τρόπο προσομοίωσης ποικίλων εμπειριών για εκπαιδευτικούς σκοπούς.
- Real-World Image Prompting: Το Genie 2 μπορεί επίσης να χρησιμοποιήσει φωτογραφίες από τον πραγματικό κόσμο ως προτροπές, προσομοιώνοντας φυσικά στοιχεία, όπως γρασίδι που φυσάει στον άνεμο ή νερό που ρέει.
- Rapid Prototyping: Οι ερευνητές μπορούν να δημιουργήσουν γρήγορα διαδραστικές εμπειρίες με το Genie 2, επιτρέποντας γρήγορες δοκιμές και εκπαίδευση σε διαφορετικά περιβάλλοντα. Μπορεί να μετατρέψει το concept art ή τα σχέδια σε πλήρεις, διαδραστικούς κόσμους.
Η παραγωγική Τεχνητή Νοημοσύνη όπως το Genie 2 δεν είναι άμοιρη αντιπαραθέσεων. Τα θέματα πνευματικών δικαιωμάτων και πνευματικής ιδιοκτησίας αποτελούν σημαντικά σημεία εμπλοκής σε αυτόν τον χώρο. Μοντέλα όπως αυτά εκπαιδεύονται συχνά σε σύνολα δεδομένων που αντλούνται από το Διαδίκτυο, και αυτό μερικές φορές περιλαμβάνει υλικό που προστατεύεται από πνευματικά δικαιώματα.
Καλλιτέχνες, προγραμματιστές παιχνιδιών, ακόμη και εταιρείες τεχνολογίας έχουν εκφράσει ανησυχίες σχετικά με τη μη εξουσιοδοτημένη χρήση του περιεχομένου τους για την εκπαίδευση αυτών των μοντέλων. Αγωγές έχουν ήδη εμφανιστεί σε άλλους τομείς της δημιουργικής τεχνητής νοημοσύνης, με στόχο εταιρείες όπως η OpenAI και η Stability AI, με τους ενάγοντες να υποστηρίζουν ότι τα έργα τους χρησιμοποιήθηκαν χωρίς άδεια. Δεν είναι δύσκολο να φανταστούμε παρόμοιες υποθέσεις να προκύπτουν εδώ, ειδικά καθώς αυτοί οι κόσμοι που δημιουργούνται από την AI γίνονται όλο και πιο δυσδιάκριτοι από τα σχέδια που δημιουργούνται από τον άνθρωπο.
Προσθέτοντας ένα άλλο επίπεδο πολυπλοκότητας είναι η ευρύτερη κριτική των πρακτικών απόξεσης δεδομένων. Πολλοί είναι απογοητευμένοι με εταιρείες όπως η Meta και η X, οι οποίες χρησιμοποιούν δεδομένα χρηστών από τις πλατφόρμες τους για την εκπαίδευση μοντέλων, συχνά χωρίς ρητή συγκατάθεση.
[via]