Τεχνολογία της Μicrosoft προσφέρει διερμηνεία σε πραγματικό χρόνο
Ένα πειραματικό σύστημα που μεταφράζει τα λόγια ενός αγγλόφωνου ομιλητή στα κινέζικα, σχεδόν σε πραγματικό χρόνο, χρησιμοποιήθηκε πρακτικά σε παρουσίαση που έδωσε στέλεχος της Microsoft στo Τιανζίν της Κίνας. Το λογισμικό, μάλιστα, μπορεί ακόμα και να μιμείται τη χροιά της φωνής του ομιλητή.
Ένα πειραματικό σύστημα που μεταφράζει τα λόγια ενός αγγλόφωνου ομιλητή στα κινέζικα, σχεδόν σε πραγματικό χρόνο, χρησιμοποιήθηκε πρακτικά σε παρουσίαση που έδωσε στέλεχος της Microsoft στo Τιανζίν της Κίνας. Το λογισμικό, μάλιστα, μπορεί ακόμα και να μιμείται τη χροιά της φωνής του ομιλητή.
«Καθώς μιλούσα στα αγγλικά, το σύστημα συνδύαζε αυτόματα μια σειρά τεχνολογιών για να δώσει μια ικανοποιητική εμπειρία στους ακροατές -με τη δική μου φωνή να ακούγεται στα κινέζικα» γράφει σε εταιρικό ιστολόγιο ο Ρικ Ρασίντ, επικεφαλής Έρευνας στη Μicrosoft.
Τα πρώτα συστήματα αυτόματης μετάφρασης ομιλίας εμφανίστηκαν τη δεκαετία του 1970 και προσπαθούσαν να αντιστοιχίσουν την κυματομορφή της φωνής του χρήστη με γνωστές κυματομορφές σε μια άλλη γλώσσα.
Το σύστημα της Μicrosoft ακουλουθεί εντελώς διαφορετική προσέγγιση: στο πρώτο στάδιο, μετατρέπει την ομιλία σε γραπτό κείμενο, το οποίο μεταφράζεται στη συνέχεια στα κινέζικα λέξη προς λέξη. Στο επόμενο στάδιο, το λογισμικό αναδιατάσσει τις λέξεις στη σωστή σειρά ώστε να βγάζουν νόημα, και τις εκφέρει μιμούμενο τη χροιά της φωνής του ομιλητή.
Το σύστημα, επισήμανε ο Ρασίντ, συνδυάζει διάφορες προσεγγίσεις μετάφρασης, όπως τη «μοντελοποίηση Μάρκοφ» που επιτρέπει επιτρέπει στο σύστημα να μαθαίνει ακούγοντας πολλούς διαφορετικούς ομιλητές, καθώς και την τεχνική Deep Neural Networks, η οποία αναπτύχθηκε από τη Microsoft σε συνεργασία με το Πανεπιστήμιο του Τορόντο και βασίζεται στα λεγόμενα νευρωνικά δίκτυα, τα οποία μιμούνται την οργάνωση των νευρώνων του εγκεφάλου.
Ο Ρασίντ τόνισε πάντως ότι στη σημερινή του μορφή το σύστημα μεταφράζει λανθασμένα περίπου λέξη ανά επτά ή οκτώ. Τα λάθη είναι επομένως αρκετά, ωστόσο η ακρίβεια έχει αυξηθεί κατά 30% σε σχέση με προηγούμενες απόπειρες.
Η Microsoft, πάντως, δεν είναι η μόνη εταιρεία που ερευνά τις τεχνολογίες μηχανικής διερμηνείας. Ανάλογες τεχνολογίες αναπτύσσονται μεταξύ άλλων από τη Google και την AT&T, ενώ η ιαπωνική εταιρεία κινητής τηλεφωνίας NTT Docomo έχει παρουσιάσει ένα κινητό που επιτρέπει στους Ιάπωνες να μιλούν αγγλικά. Η διαφορά όμως είναι ότι στα συστήματα αυτά η φωνή του συστήματος έχει μηχανική χροιά.
Newsroom ΑΛΤΕΡ ΕΓΚΟ
- Κωνσταντίνος Αργυρός: Τι λέει για τη γνωρίμια του με την Κίμπερλι Γκίλφοϊλ
- Χίος: Διάσωση μητέρας και γιου από το φλεγόμενο σπίτι τους
- Νέλσον Μαντέλα: Ο ισόβιος αγώνας κατά του ρατσισμού
- Η δεύτερη… νιότη του Νάντο Ντε Κολό στη Βιλερμπάν (vids)
- Θεσσαλονίκη: Φωτιά σε εργοστάσιο ανακύκλωσης στα Διαβατά
- Ελβετικό φράγκο: Έφτασε η κρίσιμη δίκη στον Άρειο Πάγο – Προσφυγή 200.000 πολιτών
- Η La Liga πάει τους παίκτες στα δικαστήρια
- «Καραγκιόζη… Χάσαμε τον Αϊ Βασίλη!»: Με τη Ματίνα Νικολάου στο θέατρο Σκιών του Π. Χατζηαναγνώστου
Ακολουθήστε το in.gr στο Google News και μάθετε πρώτοι όλες τις ειδήσεις






![Άκρως Ζωδιακό: Τα Do’s και Don’ts στα ζώδια σήμερα [Παρασκευή 05.12.2025]](https://www.in.gr/wp-content/uploads/2025/12/pexels-kammeran-gonzalez-keola-3137381-9559884-315x220.jpg)





























































Αριθμός Πιστοποίησης Μ.Η.Τ.232442