Η Anthropic ανακοίνωσε μια νέα έκδοση του μοντέλου Claude 3.5 Sonnet και το νέο μοντέλο Claude 3.5 Haiku. Το ενημερωμένο μοντέλο Claude 3.5 Sonnet προσφέρει βελτιώσεις σε όλους τους τομείς, με σημαντικά κέρδη στην κωδικοποίηση. Το μοντέλο Claude 3.5 Haiku είναι η απάντηση της Anthropic στο GPT-4o Mini του OpenAI και στο Gemini 1.5 Flash της Google. Θα είναι διαθέσιμο στην ίδια τιμή με τον προκάτοχο του, αλλά με σημαντικές βελτιώσεις στις επιδόσεις.
Βελτιώσεις του νέου Claude 3.5 Sonnet:
- Η βαθμολογία SWE-bench Verified αυξήθηκε από 33,4% σε 49,0%, η καλύτερη βαθμολογία που έχει επιτευχθεί ποτέ από οποιοδήποτε AI μοντέλο του κλάδου.
- Η βαθμολογία TAU-bench αυξήθηκε από 62,6% σε 69,2% στον τομέα της λιανικής πώλησης και από 36,0% σε 46,0% στον τομέα των αεροπορικών εταιρειών.
- Οι βαθμολογίες GPQA και MMLU Pro αυξήθηκαν σε 65% και 78%, αντίστοιχα, οι οποίες είναι καλύτερες από το Gemini 1.5 Pro.
Το νέο μοντέλο Claude 3.5 Haiku ξεπερνά το Claude 3 Opus, το μεγαλύτερο μοντέλο της προηγούμενης γενιάς της Anthropic, σε πολλά σημεία αναφοράς Τεχνητής Νοημοσύνης. Το Claude 3.5 Haiku σημειώνει βαθμολογία 40,6% στο SWE-bench Verified, ξεπερνώντας το αρχικό Claude 3.5 Sonnet και το OpenAI GPT-4 Turbo. Το Claude 3.5 Haiku θα είναι αρχικά διαθέσιμο μόνο ως μοντέλο μόνο για κείμενο, ενώ η υποστήριξη εικόνων θα έρθει αργότερα.
Η Anthropic υπογράμμισε επίσης ότι οι κοινές δοκιμές πριν από την ανάπτυξη του νέου μοντέλου Claude 3.5 Sonnet διεξήχθησαν από το Ινστιτούτο Ασφάλειας Τεχνητής Νοημοσύνης των ΗΠΑ (US AISI) και το Ινστιτούτο Ασφάλειας του Ηνωμένου Βασιλείου (UK AISI) στο πλαίσιο της συμφωνίας που υπέγραψαν στις αρχές του τρέχοντος έτους. Σύμφωνα με την πολιτική τους για την υπεύθυνη κλιμάκωση, το επικαιροποιημένο μοντέλο Claude 3.5 Sonnet εμπίπτει στο πρότυπο ASL-2.
Το ενημερωμένο μοντέλο Claude 3.5 Sonnet είναι πλέον διαθέσιμο στην ίδια τιμή για όλους τους developers μέσω του Anthropic API, του Amazon Bedrock και του Vertex AI του Google Cloud. Το νέο μοντέλο Claude 3.5 Haiku θα είναι διαθέσιμο αργότερα αυτό το μήνα.
Οι βελτιωμένες επιδόσεις και η προσιτή τιμή αυτών των νέων μοντέλων Claude 3.5 τα καθιστούν ελκυστικές επιλογές για developers και επιχειρήσεις που αναζητούν προηγμένα γλωσσικά μοντέλα για τις AI εφαρμογές τους.
[via]