Categories: Facebook

Το AI μοντέλο που εντοπίζει τα λάθη στις απαντήσεις του…ChatGPT!


Το ChatGPT κατέκτησε τον κόσμο της τεχνολογίας όταν εμφανίστηκε κατά τους τελευταίους μήνες του 2022. Το λανσάρισμα ήταν αρκετά σημαντικό ώστε να ταρακουνήσει τα πράγματα στη Google, με αποτέλεσμα η εταιρεία να τρέξει για να προλάβει τις εξελίξεις προκειμένου να ενσωματώσει την δική της παραγωγική AI στη μηχανή αναζήτησης, με ορισμένα τραγελαφικά να συμβαίνουν στην πορεία. Αν και το ChatGPT δεν προτείνει να βάλετε κόλλα στην πίτσα σας, το chatbot που κάνει τα πάντα δεν είναι τέλειο και κατά περίπτωση μπορεί να κάνει λάθη.

Μία από τις εργασίες που μπορεί να αναλάβει το ChatGPT είναι να γράφει αποσπάσματα κώδικα αφού λάβει προτροπές από τον χρήστη. Ο OpenAI έχει εκπαιδεύσει ένα μοντέλο Τεχνητής Νοημοσύνης με βάση το GPT-4 που ονομάζεται CriticGPT για να βρίσκει λάθη στην έξοδο κώδικα που παρέχει το chatbot. Μπορεί να γράψει κριτικές που επισημαίνουν τις ανακρίβειες στις απαντήσεις του ChatGPT. Το μοντέλο χρησιμοποιείται εσωτερικά και ο OpenAI έχει δημοσιεύσει μια ερευνητική εργασία για να το περιγράψει λεπτομερώς.

Το CriticGPT προορίζεται να βοηθήσει τους ανθρώπους-εκπαιδευτές Τεχνητής Νοημοσύνης, των οποίων η δουλειά είναι να εκπαιδεύουν και να βελτιώνουν τις απαντήσεις του GPT-4 χρησιμοποιώντας μια τεχνική που ονομάζεται Ενισχυτική Μάθηση από Ανθρώπινη Ανατροφοδότηση (Reinforcement Learning from Human Feedback – RLHF). Περιλαμβάνει εκπαιδευτές AI που βαθμολογούν διαφορετικές απαντήσεις του ChatGPT μεταξύ τους.

Ωστόσο, τα πράγματα γίνονται όλο και πιο δύσκολα για τους εκπαιδευτές Τεχνητής Νοημοσύνης, καθώς το ChatGPT γίνεται όλο και πιο ακριβές και τα λάθη του όλο και πιο διακριτικά. “Αυτός είναι ένας θεμελιώδης περιορισμός του RLHF και μπορεί να καταστήσει ολοένα και πιο δύσκολη την ευθυγράμμιση των μοντέλων, καθώς αυτά γίνονται σταδιακά πιο ενημερωμένα από οποιοδήποτε άτομο που θα μπορούσε να παρέχει ανατροφοδότηση“, δήλωσε ο OpenAI.

Το CriticGPT μπαίνει στο παιχνίδι για να σώσει την κατάσταση, αλλά εξακολουθεί να είναι ένα μοντέλο τεχνητής νοημοσύνης και οι απαντήσεις του μπορεί να μην είναι πάντα σωστές. Είναι επίσης επιρρεπές σε προβλήματα της AI, ωστόσο, το μοντέλο μπορεί να βοηθήσει τους ανθρώπους να γίνουν καλύτεροι στην επισήμανση των λαθών από ό,τι όταν κάνουν τη δουλειά μόνοι τους.

Ο OpenAI δήλωσε ότι “ένας δεύτερος τυχαίος εκπαιδευτής προτίμησε τις κριτικές από την ομάδα Human+CriticGPT σε σχέση με εκείνες από ένα άτομο χωρίς βοήθεια σε ποσοστό άνω του 60% των περιπτώσεων“. Το CriticGPT εκπαιδεύτηκε επίσης χρησιμοποιώντας το RLHF και του ανατέθηκε να αναλύσει και να σχολιάσει έναν μεγάλο αριθμό εισροών που περιείχαν λάθη. Το μοντέλο έπρεπε να βρει λάθη που είχαν εισαχθεί σκόπιμα από ανθρώπους και “φυσικά” σφάλματα του ChatGPT που είχαν προηγουμένως εντοπιστεί από έναν εκπαιδευτή. Υπάρχουν μερικοί περιορισμοί που προσπαθεί προς το παρόν να εξαλείψει ο OpenAI.

Το CriticGPT εκπαιδεύτηκε χρησιμοποιώντας σύντομες απαντήσεις του ChatGPT και πρέπει να αναπτυχθούν νέες μέθοδοι που θα μπορούν να βοηθήσουν τους εκπαιδευτές να κατανοήσουν τις μεγάλες και πολύπλοκες εργασίες.

[via]



Πηγή

iTech News

Leave a Comment
Share
Published by
iTech News

Recent Posts

Η DJI μπαίνει και επίσημα στον χώρο των ηλεκτρικών ποδηλάτων!

Η DJI αποκάλυψε ότι μπαίνει επίσημα στα ηλεκτρονικά ποδήλατα, προσφέροντας αυτό που αποκαλεί "πρωτοποριακό σύστημα…

21 ώρες ago

Ο θρυλικός Ναρκαλιευτής (Minesweeper) σε μια νέα έκδοση από το Netflix!

Ο τελευταίος τίτλος που προστέθηκε στη λίστα των Netflix Games είναι μια πολύ μοντέρνα εκδοχή…

21 ώρες ago

Σε κίνδυνο οι πολύ προσιτές αγορές από τα Temu, Shein και AliExpress

Η Ευρωπαϊκή Ένωση επεξεργάζεται σχέδια για την επιβολή τελωνειακών δασμών σε φθηνά προϊόντα που αγοράζονται…

22 ώρες ago

Έξυπνα ρούχα καταγράφουν τις κινήσεις του σώματος

Έξυπνα ρούχα καταγράφουν τις κινήσεις του σώματος - Newsbeast play Έρευνα ανοίγει νέες δυνατότητες για…

23 ώρες ago

Η Ελλάδα αποκτά 7 Μικροδορυφόρους Παρατήρησης Γης εντός του 2026

Στο πλαίσιο του «Εθνικού Προγράμματος Μικροδορυφόρων» η Ελλάδα αποκτά εντός του 2026 επτά δορυφόρους για…

1 ημέρα ago

Νέες λειτουργίες για τους συνδρομητές Premium

Το YouTube φέρνει τις λειτουργίες Jump Ahead και picture-in-picture για τα Shorts videos στους συνδρομητές…

1 ημέρα ago

Αυτό το site χρησιμοποιεί cookies, για την παροχή των υπηρεσιών της, να προσαρμόσετε τις διαφημίσεις και να αναλύσει την επισκεψιμότητα. Με τη χρήση αυτής της ιστοσελίδας, συμφωνείτε με τη πολιτική χρήση των cookies.