Η Google DeepMind σημειώνει σταθερή πρόοδο στον τομέα της Τεχνητής Νοημοσύνης με τακτικές ενημερώσεις των Gemini, Imagen, Veo, Gemma και AlphaFold. Τώρα, η ομάδα εισέρχεται στον κλάδο της Ρομποτικής με δύο νέα μοντέλα που βασίζονται στο Gemini 2.0: τα Gemini Robotics και Gemini Robotics-ER.
Το Gemini Robotics είναι ένα προηγμένο μοντέλο όρασης-γλώσσας-δράσης (VLA) το οποίο βασίζεται στο Gemini 2.0, με την προσθήκη φυσικών ενεργειών ως νέου τρόπου εξόδου για τον έλεγχο των ρομπότ. Η Google ισχυρίζεται ότι αυτό το νέο μοντέλο μπορεί να κατανοήσει καταστάσεις που δεν έχει δει ποτέ πριν κατά την εκπαίδευση.
Σε σύγκριση με άλλα σύγχρονα μοντέλα όρασης-γλώσσας-δράσης, το Gemini Robotics έχει διπλάσιες επιδόσεις σε ένα ολοκληρωμένο μέτρο σύγκρισης γενίκευσης. Δεδομένου ότι το Gemini Robotics βασίζεται στο μοντέλο Gemini 2.0, διαθέτει δυνατότητες κατανόησης φυσικής γλώσσας σε διάφορες γλώσσες. Έτσι, μπορεί να κατανοήσει τις εντολές των ανθρώπων με πολύ καλύτερο τρόπο.
Όσον αφορά την επιδεξιότητα, η Google ισχυρίζεται ότι το Gemini Robotics μπορεί να χειριστεί εξαιρετικά σύνθετες εργασίες πολλών βημάτων που απαιτούν ακριβή χειρισμό. Για παράδειγμα, αυτό το μοντέλο μπορεί να εκτελέσει αναδίπλωση origami ή να βάλει ένα σνακ σε μια σακούλα Ziploc.
Το Gemini Robotics-ER είναι ένα προηγμένο μοντέλο γλώσσας όρασης που εστιάζει στη χωρική συλλογιστική και επιτρέπει στους ειδικούς της Ρομποτικής να το συνδέσουν με τους υπάρχοντες low-level ελεγκτές τους. Χρησιμοποιώντας αυτό το μοντέλο, οι ειδικοί της Ρομποτικής θα έχουν όλα τα απαραίτητα εφόδια για τον έλεγχο ενός ρομπότ, τα οποία περιλαμβάνουν την αντίληψη, την εκτίμηση της κατάστασης, τη χωρική κατανόηση, τον προγραμματισμό και τη δημιουργία κώδικα.
Η Google συνεργάζεται με την Apptronik για την κατασκευή ανθρωποειδών ρομπότ με βάση τα μοντέλα Gemini 2.0. Η Google συνεργάζεται επίσης με επιλεγμένους αξιόπιστους δοκιμαστές, συμπεριλαμβανομένων των Agile Robots, Agility Robotics, Boston Dynamics και Enchanted Tools, για το μέλλον των Gemini Robotics-ER.
Δίνοντας τη δυνατότητα στα ρομπότ να κατανοούν και να εκτελούν σύνθετες εργασίες με μεγαλύτερη ακρίβεια και προσαρμοστικότητα, η Google DeepMind ανοίγει το δρόμο για ένα μέλλον όπου τα ρομπότ θα μπορούν να ενσωματώνονται απρόσκοπτα σε διάφορες πτυχές της ζωής μας.
[via]
Ο αμερικανικός στρατός υπέγραψε συμφωνία με την Scale AI για να δώσει στην τεχνητή νοημοσύνη,…
Μια νέα σελίδα στην ιστορία της εξερεύνησης του Διαστήματος γράφτηκε στις 12 Μαρτίου όταν ένας…
Η Kaspersky ανακοίνωσε μια σημαντική αναβάθμιση του Kaspersky Anti Targeted Attack (KATA). Με την κυκλοφορία…
Στις αρχές Φεβρουαρίου, ένας Αυστραλός άνδρας γύρω στα 40 έγινε ο πρώτος άνθρωπος στον κόσμο…
Οι ερευνητές της Quantum Internet Alliance (QIA) του TU Delft, του QuTech, του Πανεπιστημίου του…
Το X-37B είναι ένα επαναχρησιμοποιήσιμο ρομποτικό διαστημικό αεροπλάνο που χρησιμοποιείται από τη Space Force των…
Αυτό το site χρησιμοποιεί cookies, για την παροχή των υπηρεσιών της, να προσαρμόσετε τις διαφημίσεις και να αναλύσει την επισκεψιμότητα. Με τη χρήση αυτής της ιστοσελίδας, συμφωνείτε με τη πολιτική χρήση των cookies.
Leave a Comment