Categories: Technology

Η νέα τεχνολογική ανακάλυψη που δίνει ελπίδα στους ανθρώπους που δεν μπορούν να μιλήσουν


Ερευνητές στις ΗΠΑ δημιούργησαν μια συσκευή που εμφυτεύεται στον εγκέφαλο και αποκωδικοποιεί την εγκεφαλική δραστηριότητα, μετατρέποντας την αυτομάτως σε συνθετική ομιλία. Η νέα καινοτόμος συσκευή, που χρησιμοποιεί μεθόδους τεχνητής νοημοσύνης, υπόσχεται να επιταχύνει και να κάνει πιο φυσική την επικοινωνία μέσω συνθετικής ομιλίας, σε σχέση με ό,τι ήταν εφικτό έως τώρα, δίνοντας έτσι τη δυνατότητα να ακουστεί η (έστω τεχνητή) φωνή ανθρώπων που δεν μπορούν να μιλήσουν, όπως οι παράλυτοι και οι άνθρωποι με νευρολογικές βλάβες.

Η ομιλία φαίνεται απλή, αλλά στην πραγματικότητα είναι ένα από τα πιο πολύπλοκα πράγματα που κάνει ένας άνθρωπος, καθώς απαιτεί τον ακριβή και δυναμικό συντονισμό πολλών μυών της φωνητικής οδού. Πολλοί ασθενείς με νευρολογικές κυρίως παθήσεις (εγκεφαλικό τραύμα, εγκεφαλικό επεισόδιο, Πάρκινσον, πλάγια αμυοτροφική σκλήρυνση κ.α.) χάνουν τη δυνατότητα ομιλίας, όπως ήταν η διάσημη περίπτωση του Βρετανού επιστήμονα Στίβεν Χόκινγκ.

Για να επικοινωνήσουν, αναγκάζονται να εξαρτώνται από συσκευές που χρησιμοποιούν διεπαφές εγκεφάλου-υπολογιστή ή κινήσεις του κεφαλιού και των ματιών, προκειμένου να ελέγχουν έναν κέρσορα και να επιλέγουν γράμματα σε μια οθόνη, με ρυθμό -στην καλύτερη περίπτωση- έως δέκα λέξεις το λεπτό. Όμως η διαδικασία της επικοινωνίας είναι δύσκολη, επιρρεπής σε λάθη και πολύ πιο αργή από τον φυσιολογικό ρυθμό της ανθρώπινης ομιλίας (κατά μέσο όρο 100 ως 150 λέξεις το λεπτό).

Οι ερευνητές, με επικεφαλής τον καθηγητή νευροχειρουργικής Έντουαρντ Τσανγκ του Πανεπιστημίου της Καλιφόρνια στο Σαν Φρανσίσκο, οι οποίοι έκαναν τη σχετική δημοσίευση στο περιοδικό “Nature”, ανέπτυξαν μια νέα μέθοδο που -με τη βοήθεια της τεχνικής της βαθιάς μηχανικής μάθησης και των τεχνητών νευρωνικών δικτύων- συνθέτει την ομιλία χρησιμοποιώντας εγκεφαλικά σήματα, τα οποία σχετίζονται με τις κινήσεις των σιαγόνων, του λάρυγγα, των χειλιών και της γλώσσας.

Αρχικά οι επιστήμονες κατέγραψαν με τη βοήθεια ηλεκτροδίων -στο πλαίσιο θεραπείας για επιληψία- τη δραστηριότητα του φλοιού του εγκεφάλου πέντε εθελοντών, καθώς αυτοί μιλούσαν. Με βάση αυτήν την καταγραφή, σχεδίασαν ένα σύστημα, το οποίο σε πρώτη φάση είναι σε θέση να αποκωδικοποιεί μόνο του τα νευρωνικά σήματα που ευθύνονται για τις επιμέρους κινήσεις της φωνητικής οδού. Σε δεύτερο στάδιο, ένας άλλος αλγόριθμος αναλαμβάνει να συνθέσει την ομιλία από αυτές τις αποκωδικοποιημένες κινήσεις.

Οι δοκιμές του αποκωδικοποιητή έδειξαν ότι οι ακροατές μπορούσαν εύκολα να καταλάβουν τη συνθετική ομιλία, παρόλο που αυτή είναι κατώτερη από τη φυσική ομιλία. Αρκετές έρευνες μέχρι σήμερα είχαν χρησιμοποιήσει μεθόδους τεχνητής νοημοσύνης για να «μεταφράσουν» τα εγκεφαλικά σήματα σε ακουστικά, ώστε να συνθέσουν ομιλία. Η νέα έρευνα, που δεν βασίζεται στα «μεταφρασμένα» ακουστικά σήματα, αλλά στη νευρωνική αποκωδικοποίηση των κινήσεων της φωνητικής οδού, φαίνεται να είναι πιο αποτελεσματική.

«Για πρώτη φορά δείξαμε ότι μπορούμε να αναδημιουργήσουμε ολόκληρες προτάσεις ομιλίας με βάση την εγκεφαλική δραστηριότητα ενός ατόμου. Έχουμε πια την τεχνολογία για να φτιάξουμε μια συσκευή που θα αξιοποιηθεί κλινικά για ασθενείς με απώλεια της ομιλίας τους», δήλωσε ο Τσανγκ.

Πάντως η συσκευή χρειάζεται ακόμη βελτίωση, προτού καταστεί δυνατό να αξιοποιηθεί κλινικά. Το μέλλον θα δείξει κατά πόσο είναι εφικτή αυτή η βελτίωση, ώστε η συνθετική ομιλία να πλησιάσει σε απόδοση τη φυσική. Επίσης μια μελλοντική πρόκληση αφορά εκείνους τους ανθρώπους που δεν έχουν χάσει μόνο τη φωνή τους, αλλά και την ικανότητα να παράγουν στη φωνητική οδό τους τις κινήσεις που σχετίζονται με την ομιλία τους.

fbq('init', '1706173679639449'); fbq('track', "PageView");

var options = { type: "scroll", scripts: [ "//connect.facebook.net/en_US/sdk.js#xfbml=1&appId=219378041527087" ], success: function () {

FB.init({ appId: '219378041527087', cookie: true, xfbml: true, version: 'v3.0' }); } }; if ($(window).scrollTop() > 0) { window.fbAsyncInit = function () { FB.init({ appId: '219378041527087', cookie: true, xfbml: true, version: 'v3.0' }); //jQuery('#fb-root').trigger('facebook:init'); document.body.className += " fbinit"; };

(function (d, s, id) { var js, fjs = d.getElementsByTagName(s)[0]; if (d.getElementById(id)) { return; } js = d.createElement(s); js.id = id; js.src = "http://connect.facebook.net/en_US/sdk.js"; fjs.parentNode.insertBefore(js, fjs); }(document, 'script', 'facebook-jssdk')); } else { $.lazyscript(options); } });

$.getScript("http://connect.facebook.net/en_US/sdk.js", function(){ FB.init({ appId: '219378041527087', cookie: true, xfbml: true, version: 'v3.0' }); facebookAPILoaded = true; }); }



Πηγή

iTech News

Leave a Comment

Recent Posts

Η Google παρουσιάζει την επόμενη γενιά τεχνητής νοημοσύνης με το Gemini 2.0

Η Google παρουσιάζει την επόμενη γενιά τεχνητής νοημοσύνης με το Gemini 2.0 - Newsbeast play…

10 ώρες ago

Way of the Sword, το sequel του horror samurai game έρχεται το 2026 [Video]

Το Onimusha: Way of the Sword, η πρώτη νέα προσθήκη στο franchise σαμουράι τρόμου της…

12 ώρες ago

Elton John: Never too Late, διαθέσιμο το πρωτότυπο ντοκιμαντέρ στο Disney+

Το πρωτότυπο ντοκιμαντέρ Elton John: Never too Late, σε σκηνοθεσία των R.J. Cutler και David Furnish, είναι τώρα διαθέσιμο, αποκλειστικά…

12 ώρες ago

Το θρυλικό game επιστρέφει με νέο sequel

Το αγαπημένο και πολυδιαφημισμένο Okami θα αποκτήσει sequel, αν και οι λεπτομέρειες είναι, μέχρι στιγμής,…

12 ώρες ago

Xiaomi Smart Band 9 Pro και το Xiaomi Smart Band 9 Active, επίσημα τα νέα fitness bands

Η Xiaomi παρουσιάζει το Xiaomi Smart Band 9 Pro και το Χiaomi Smart Band 9…

12 ώρες ago

Πρώτο gameplay trailer για το νέο co-op shooter

Η σουηδική 10 Chambers ανακοίνωσε το Den of Wolves στα περσινά Game Awards, οπότε είναι…

12 ώρες ago

Αυτό το site χρησιμοποιεί cookies, για την παροχή των υπηρεσιών της, να προσαρμόσετε τις διαφημίσεις και να αναλύσει την επισκεψιμότητα. Με τη χρήση αυτής της ιστοσελίδας, συμφωνείτε με τη πολιτική χρήση των cookies.