Η Microsoft πέρασε τα τελευταία δύο χρόνια προσθέτοντας εντυπωσιακές νέες δυνατότητες παραγωγικότητας στο Teams και τώρα η εταιρεία αναθεωρεί τον τρόπο με τον οποίο λειτουργούν τα βασικά στοιχεία χάρη στην τεχνητή νοημοσύνη. Όλοι έχουμε πάει σε μια κλήση όπου κάποιος έχει κακή ακουστική δωματίου που δυσκολεύει να τον ακούσει, ή έχουμε δει δύο άτομα να προσπαθούν να μιλήσουν ταυτόχρονα δημιουργώντας μια άβολη στιγμή «όχι, προχώρα». Οι νέες βελτιώσεις ποιότητας φωνής της Microsoft με τεχνητή νοημοσύνη θα πρέπει να βελτιώσουν ή ακόμα και να εξαλείψουν αυτές τις καθημερινές ενοχλήσεις.

Η Microsoft χρησιμοποιεί τώρα μοντέλα μηχανικής εκμάθησης για να βελτιώσει την ακουστική του δωματίου, ώστε να μην ακούγεστε πλέον σαν να κρύβεστε σε μια σπηλιά. «Ενώ προσπαθούσαμε με την επεξεργασία ψηφιακού σήματος να κάνουμε πολύ καλή δουλειά στο Teams, τώρα αρχίσαμε να χρησιμοποιούμε για πρώτη φορά μηχανική εκμάθηση για να δημιουργήσουμε ακύρωση ηχούς όπου μπορείτε πραγματικά να μειώσετε την ηχώ από όλες τις διαφορετικές συσκευές», εξηγεί. Ο Robert Aichner, κύριος διευθυντής προγράμματος για έξυπνο cloud συνομιλιών και επικοινωνιών στη Microsoft, σε μια συνέντευξη με Το χείλος.

Η Microsoft το δοκιμάζει εδώ και μήνες, μετρώντας τα μοντέλα της στον πραγματικό κόσμο για να διασφαλίσει ότι οι χρήστες του Teams παρατηρούν τη μείωση της ηχούς και τις βελτιώσεις στην ποιότητα των κλήσεων. Ο κατασκευαστής λογισμικού χρησιμοποίησε 30.000 ώρες ομιλίας για να βοηθήσει στην εκπαίδευση των μοντέλων του και απαθανάτισε χιλιάδες συσκευές μέσω crowd sourcing όπου οι χρήστες του Teams πληρώνονται για την εγγραφή της φωνής τους και την αναπαραγωγή ήχου από τη συσκευή τους.

«Επίσης, προσομοιώνουμε περίπου 100.000 διαφορετικά δωμάτια… η ακουστική του δωματίου παίζει μεγάλο ρόλο στην ακύρωση της ηχούς», λέει ο Aichner. Το αποτέλεσμα είναι μεγάλες βελτιώσεις στην ποιότητα ήχου κλήσης και η εξάλειψη της ηχούς που επιτρέπει επίσης σε πολλά άτομα να μιλούν ταυτόχρονα. Μπορείτε να δείτε όλες τις βελτιώσεις σε δράση στο παραπάνω βίντεο.

Εάν το Teams εντοπίσει ότι ο ήχος αναπηδά ή αντηχεί σε ένα δωμάτιο με αποτέλεσμα ρηχό ήχο, το μοντέλο θα μετατρέψει επίσης τον καταγεγραμμένο ήχο και θα τον επεξεργαστεί ώστε να ακούγεται σαν να μιλούν οι συμμετέχοντες στο Teams σε ένα μικρόφωνο κοντινής εμβέλειας αντί για ένα χάος ηχούς.

Το πιο εντυπωσιακό κομμάτι είναι η δυνατότητα των ατόμων να διακόπτουν ο ένας τον άλλον στις κλήσεις Teams τώρα, χωρίς την αμήχανη επικάλυψη όπου δεν μπορείτε να ακούσετε το άλλο άτομο λόγω της ηχούς. Η Microsoft αποστέλλει τώρα όλη αυτή την εργασία στο Teams, παράλληλα με τις βελτιώσεις που έχει κάνει με την καταστολή θορύβου που βασίζεται σε AI. Όλη η επεξεργασία γίνεται τοπικά σε συσκευές-πελάτες, αντί στο cloud.

“Είπαμε ότι θέλουμε να το κάνουμε στον πελάτη, επειδή το cloud είναι ακόμα ακριβό αν θέλετε να κάνετε κάθε κλήση που υποβάλλεται σε επεξεργασία στο cloud… και προφανώς θα έπρεπε να περάσουμε αυτό το κόστος στον πελάτη”, εξηγεί ο Aichner. Αυτό θα σήμαινε δυνητικά περιορισμό αυτών των σημαντικών βελτιώσεων του Teams στους πελάτες που πληρώνουν και η διαδρομή στη συσκευή σημαίνει ότι λειτουργίες όπως η καταστολή θορύβου είναι διαθέσιμες στο 90 τοις εκατό των συσκευών που χρησιμοποιούν το Teams.

Όλες αυτές οι νέες βελτιώσεις του Microsoft Teams είναι πλέον ζωντανές, παράλληλα με ορισμένες βελτιστοποιήσεις οθόνης σε πραγματικό χρόνο για κείμενο σε βίντεο και βελτιώσεις που βασίζονται σε AI στους περιορισμούς εύρους ζώνης κατά τη διάρκεια κλήσεων βίντεο ή κοινής χρήσης οθόνης.