Categories: Facebook

Η Google φέρνει την AI στα ανθρωποειδή ρομπότ! [Videos]


Η Google DeepMind σημειώνει σταθερή πρόοδο στον τομέα της Τεχνητής Νοημοσύνης με τακτικές ενημερώσεις των Gemini, Imagen, Veo, Gemma και AlphaFold. Τώρα, η ομάδα εισέρχεται στον κλάδο της Ρομποτικής με δύο νέα μοντέλα που βασίζονται στο Gemini 2.0: τα Gemini Robotics και Gemini Robotics-ER.

Το Gemini Robotics είναι ένα προηγμένο μοντέλο όρασης-γλώσσας-δράσης (VLA) το οποίο βασίζεται στο Gemini 2.0, με την προσθήκη φυσικών ενεργειών ως νέου τρόπου εξόδου για τον έλεγχο των ρομπότ. Η Google ισχυρίζεται ότι αυτό το νέο μοντέλο μπορεί να κατανοήσει καταστάσεις που δεν έχει δει ποτέ πριν κατά την εκπαίδευση.

Σε σύγκριση με άλλα σύγχρονα μοντέλα όρασης-γλώσσας-δράσης, το Gemini Robotics έχει διπλάσιες επιδόσεις σε ένα ολοκληρωμένο μέτρο σύγκρισης γενίκευσης. Δεδομένου ότι το Gemini Robotics βασίζεται στο μοντέλο Gemini 2.0, διαθέτει δυνατότητες κατανόησης φυσικής γλώσσας σε διάφορες γλώσσες. Έτσι, μπορεί να κατανοήσει τις εντολές των ανθρώπων με πολύ καλύτερο τρόπο.

Όσον αφορά την επιδεξιότητα, η Google ισχυρίζεται ότι το Gemini Robotics μπορεί να χειριστεί εξαιρετικά σύνθετες εργασίες πολλών βημάτων που απαιτούν ακριβή χειρισμό. Για παράδειγμα, αυτό το μοντέλο μπορεί να εκτελέσει αναδίπλωση origami ή να βάλει ένα σνακ σε μια σακούλα Ziploc.

Το Gemini Robotics-ER είναι ένα προηγμένο μοντέλο γλώσσας όρασης που εστιάζει στη χωρική συλλογιστική και επιτρέπει στους ειδικούς της Ρομποτικής να το συνδέσουν με τους υπάρχοντες low-level ελεγκτές τους. Χρησιμοποιώντας αυτό το μοντέλο, οι ειδικοί της Ρομποτικής θα έχουν όλα τα απαραίτητα εφόδια για τον έλεγχο ενός ρομπότ, τα οποία περιλαμβάνουν την αντίληψη, την εκτίμηση της κατάστασης, τη χωρική κατανόηση, τον προγραμματισμό και τη δημιουργία κώδικα.

Η Google συνεργάζεται με την Apptronik για την κατασκευή ανθρωποειδών ρομπότ με βάση τα μοντέλα Gemini 2.0. Η Google συνεργάζεται επίσης με επιλεγμένους αξιόπιστους δοκιμαστές, συμπεριλαμβανομένων των Agile Robots, Agility Robotics, Boston Dynamics και Enchanted Tools, για το μέλλον των Gemini Robotics-ER.

Δίνοντας τη δυνατότητα στα ρομπότ να κατανοούν και να εκτελούν σύνθετες εργασίες με μεγαλύτερη ακρίβεια και προσαρμοστικότητα, η Google DeepMind ανοίγει το δρόμο για ένα μέλλον όπου τα ρομπότ θα μπορούν να ενσωματώνονται απρόσκοπτα σε διάφορες πτυχές της ζωής μας.

[via]



Πηγή

iTech News

Leave a Comment
Share
Published by
iTech News

Recent Posts

Ο αμερικανικός στρατός θα χρησιμοποιεί AI στον σχεδιασμό και τις πολεμικές επιχειρήσεις!

Ο αμερικανικός στρατός υπέγραψε συμφωνία με την Scale AI για να δώσει στην τεχνητή νοημοσύνη,…

4 ώρες ago

Εκτοξεύθηκαν τα SPHEREx και PUNCH εγκαινιάζοντας μια νέα εποχή για τη μελέτη του Σύμπαντος

Μια νέα σελίδα στην ιστορία της εξερεύνησης του Διαστήματος γράφτηκε στις 12 Μαρτίου όταν ένας…

5 ώρες ago

Το επόμενο επίπεδο προστασίας από τις στοχευμένες επιθέσεις

Η Kaspersky ανακοίνωσε μια σημαντική αναβάθμιση του Kaspersky Anti Targeted Attack (KATA). Με την κυκλοφορία…

5 ώρες ago

40χρονος άνδρας επέζησε για 105 ημέρες με καρδιά από τιτάνιο!

Στις αρχές Φεβρουαρίου, ένας Αυστραλός άνδρας γύρω στα 40 έγινε ο πρώτος άνθρωπος στον κόσμο…

5 ώρες ago

Αυτό είναι το πρώτο λειτουργικό σύστημα για κβαντικά δίκτυα

Οι ερευνητές της Quantum Internet Alliance (QIA) του TU Delft, του QuTech, του Πανεπιστημίου του…

5 ώρες ago

Το «μυστικό» διαστημικό αεροσκάφος X-37B της Space Force των ΗΠΑ επέστρεψε μετά από 14 μήνες

Το X-37B είναι ένα επαναχρησιμοποιήσιμο ρομποτικό διαστημικό αεροπλάνο που χρησιμοποιείται από τη Space Force των…

5 ώρες ago