Categories: Mobile

Η ByteDance (TikTok) συγκεντρώνει δεδομένα από το Διαδίκτυο 25 φορές πιο γρήγορα από τον OpenAI


Η μητρική εταιρεία του TikTok, η ByteDance, συγκεντρώνει τεράστιους όγκους διαδικτυακών δεδομένων πολύ πιο γρήγορα από τους άλλους μεγάλους web crawlers. Η ByteDance ενδέχεται να σχεδιάζει να κυκλοφορήσει το δικό της LLM (μεγάλο γλωσσικό μοντέλο) και χρησιμοποιεί επιθετικά το web crawler της, το «Bytespider», για να μαζέψει δεδομένα για να εκπαιδεύσει τα μοντέλα της, όπως αναφέρει το Fortune.

Το Bytespider εμφανίστηκε στο προσκήνιο τον περασμένο Απρίλιο και από τότε, ο ρυθμός κατανάλωσής του βάζει σε δύσκολη θέση τους web scrapers από το OpenAI, τη Google, τη Meta και την Anthropic.

Ο Sam Crowther, CEO της Kasada, μιας εταιρείας που ειδικεύεται στη διαχείριση bot, δήλωσε στο πρακτορείο ότι ο ρυθμός απόξεσης του Bytespider είναι 25 φορές μεγαλύτερος από τον GPTbot του OpenAI και 3.000 φορές μεγαλύτερος από τον ρυθμό του ClaudeBot, ο οποίος είναι ο web crawler της Anthropic για το Claude LLM. Ο Crowther δήλωσε επίσης ότι τα δεδομένα της Kasada έχουν δει «τεράστιες αιχμές στη δραστηριότητα απόξεσης» από το Bytespider τις τελευταίες έξι εβδομάδες.

Καθώς το Bytespider καταναλώνει αχόρταγα τον ιστό, η κυβέρνηση των ΗΠΑ προσπαθεί να εμποδίσει την πιθανή πρόσβαση στα δεδομένα των αμερικανών χρηστών στην κινεζική κυβέρνηση. Τον Απρίλιο, ο πρόεδρος Biden υπέγραψε ένα νομοσχέδιο που επιβάλλει την απαγόρευση του TikTok, εκτός εάν πωληθεί από την ByteDance εντός του έτους. Δεδομένου ότι το χρονικό περιθώριο της ByteDance για την πώληση του TikTok είναι μικρό, η αίσθηση του επείγοντος ταιριάζει με τον τεράστιο ρυθμό της δραστηριότητας crawling στον ιστό, είτε για ένα LLM, είτε για έναν καλύτερο αλγόριθμο, είτε για κάτι άλλο που δεν γνωρίζουμε.

Το τι σκοπεύει να κάνει η ByteDance με όλα τα πρόσφατα εξορυγμένα δεδομένα της μένει να φανεί. Ωστόσο, το TikTok έχει δρομολογήσει αρκετές λειτουργίες με τεχνολογία Τεχνητής Νοημοσύνης για την πλατφόρμα. Τον Μάιο, ανακοίνωσε μια σουίτα εργαλείων για τους διαφημιστές για τη δημιουργία διαφημίσεων που παράγονται από AI, καθώς και avatars που παράγονται από AI για brands και δημιουργούς. Το TikTok φημολογείται επίσης ότι εργάζεται πάνω σε μια εσωτερική μηχανή αναζήτησης, με αποτελέσματα που θα τροφοδοτούνται από AI – πιθανώς χρησιμοποιώντας το ChatGPT.

[via]



Πηγή

iTech News

Leave a Comment
Share
Published by
iTech News

Recent Posts

Η μεγαλύτερη διαρροή μέχρι σήμερα! [CES 2025]

Η Genki δημοσίευσε την πιο αληθοφανή και εκτενή διαρροή για το πολυαναμενόμενο Nintendo Switch 2.…

2 ώρες ago

Το γαλλικό υπουργείο Εξωτερικών εκφράζει «ανησυχία» για την απόφαση της Meta να σταματήσει το fact-checking

Το γαλλικό υπουργείο Εξωτερικών εκφράζει «ανησυχία» για την απόφαση της Meta να σταματήσει το fact-checking…

10 ώρες ago

To Bερολίνο πετάει το «μπαλάκι» στην Ευρωπαϊκή Επιτροπή για τη λειτουργία των πλατφορμών κοινωνικής δικτύωσης

To Bερολίνο πετάει το «μπαλάκι» στην Ευρωπαϊκή Επιτροπή για τη λειτουργία των πλατφορμών κοινωνικής δικτύωσης…

16 ώρες ago

Αλέξανδρος Πέππας: Από τον Κάλαμο στην Ιρλανδία και στην Microsoft για να δουλέψει πάνω στην τεχνητή νοημοσύνη

Αλέξανδρος Πέππας: Από τον Κάλαμο στην Ιρλανδία και στην Microsoft για να δουλέψει πάνω στην…

18 ώρες ago

Η Microsoft περιμένει να αναβαθμίσουμε σε Windows 11 PCs φέτος

Το CES 2025 μας έφερε ένα κύμα ανακοινώσεων για laptops και desktops, καθώς πολλοί κατασκευαστές…

19 ώρες ago

Θα είναι το επόμενο Xbox έτοιμο το 2026;

Η Microsoft έχει παραμείνει σχετικά ήσυχη, ενώ η Sony έχει πάρει το στέμμα της πιο…

19 ώρες ago

Αυτό το site χρησιμοποιεί cookies, για την παροχή των υπηρεσιών της, να προσαρμόσετε τις διαφημίσεις και να αναλύσει την επισκεψιμότητα. Με τη χρήση αυτής της ιστοσελίδας, συμφωνείτε με τη πολιτική χρήση των cookies.