Τα ερευνητικά εργαστήρια τεχνητής νοημοσύνης της Meta δημιούργησαν ένα νέο υπερσύγχρονο chatbot και επιτρέπουν στα μέλη του κοινού να μιλήσουν στο σύστημα προκειμένου να συλλέξουν σχόλια για τις δυνατότητές του.

Το bot ονομάζεται BlenderBot 3 και είναι προσβάσιμο στο διαδίκτυο. (Αν και, αυτή τη στιγμή, φαίνεται ότι μόνο οι κάτοικοι στις ΗΠΑ μπορούν να το κάνουν.) Το BlenderBot 3 μπορεί να συμμετάσχει σε γενικές συζητήσεις, λέει ο Meta, αλλά και να απαντήσει στα ερωτήματα που μπορεί να ζητήσετε από έναν ψηφιακό βοηθό, «από το να μιλάμε για υγιή συνταγές φαγητού για να βρείτε ανέσεις φιλικές προς τα παιδιά στην πόλη.»

Το bot είναι ένα πρωτότυπο και βασίζεται στην προηγούμενη δουλειά του Meta με τα γνωστά μοντέλα μεγάλων γλωσσών ή LLMS — ισχυρό αλλά ελαττωματικό λογισμικό δημιουργίας κειμένου του οποίου το GPT-3 του OpenAI είναι το πιο ευρέως γνωστό παράδειγμα. Όπως όλα τα LLM, το BlenderBot εκπαιδεύεται αρχικά σε τεράστια σύνολα δεδομένων κειμένου, τα οποία εξορύσσει για στατιστικά μοτίβα προκειμένου να δημιουργήσει γλώσσα. Τέτοια συστήματα έχουν αποδειχθεί εξαιρετικά ευέλικτα και έχουν χρησιμοποιηθεί σε μια σειρά χρήσεων, από τη δημιουργία κώδικα για προγραμματιστές μέχρι να βοηθήσουν τους συγγραφείς να γράψουν το επόμενο μπεστ σέλερ τους. Ωστόσο, αυτά τα μοντέλα έχουν επίσης σοβαρά ελαττώματα: επαναφέρουν προκαταλήψεις στα δεδομένα εκπαίδευσης και συχνά εφευρίσκουν απαντήσεις στις ερωτήσεις των χρηστών (μεγάλο πρόβλημα αν πρόκειται να είναι χρήσιμοι ως ψηφιακοί βοηθοί).

Αυτό το τελευταίο ζήτημα είναι κάτι που η Meta θέλει συγκεκριμένα να δοκιμάσει με το BlenderBot. Ένα μεγάλο χαρακτηριστικό του chatbot είναι ότι μπορεί να κάνει αναζήτηση στο διαδίκτυο για να μιλήσει για συγκεκριμένα θέματα. Ακόμη πιο σημαντικό, οι χρήστες μπορούν στη συνέχεια να κάνουν κλικ στις απαντήσεις του για να δουν από πού πήρε τις πληροφορίες του. Το BlenderBot 3, με άλλα λόγια, μπορεί να αναφέρει τις πηγές του.

Κυκλοφορώντας το chatbot στο ευρύ κοινό, η Meta θέλει να συλλέξει σχόλια σχετικά με τα διάφορα προβλήματα που αντιμετωπίζουν τα μεγάλα γλωσσικά μοντέλα. Οι χρήστες που συνομιλούν με το BlenderBot θα μπορούν να επισημάνουν τυχόν ύποπτες απαντήσεις από το σύστημα και η Meta λέει ότι έχει εργαστεί σκληρά για να «ελαχιστοποιήσει τη χρήση χυδαίων γλωσσών, προσβολών και πολιτιστικά ανόητων σχολίων από τα bots». Οι χρήστες θα πρέπει να επιλέξουν τη συλλογή των δεδομένων τους και, αν ναι, οι συνομιλίες και τα σχόλιά τους θα αποθηκευτούν και αργότερα θα δημοσιευθούν από τη Meta για να χρησιμοποιηθούν από τη γενική ερευνητική κοινότητα AI.

«Δεσμευόμαστε να δημοσιεύσουμε δημόσια όλα τα δεδομένα που συλλέγουμε στο demo με την ελπίδα ότι μπορούμε να βελτιώσουμε την τεχνητή νοημοσύνη συνομιλίας», είπε ο Kurt Shuster, ερευνητής μηχανικός στη Meta που βοήθησε στη δημιουργία του BlenderBot 3. Το χείλος.

Η Meta τοποθετεί το τελευταίο της chatbot AI στον Ιστό για να μιλήσει το κοινό

Ένα παράδειγμα συνομιλίας με το BlenderBot 3 στον Ιστό. Οι χρήστες μπορούν να δώσουν σχόλια και αντιδράσεις σε συγκεκριμένες απαντήσεις.
Εικόνα: Meta

Η κυκλοφορία πρωτότυπων chatbots AI στο κοινό ήταν, ιστορικά, μια επικίνδυνη κίνηση για τις εταιρείες τεχνολογίας. Το 2016, η Microsoft κυκλοφόρησε ένα chatbot με το όνομα Tay στο Twitter που μάθαινε από τις αλληλεπιδράσεις του με το κοινό. Κάπως προβλέψιμα, οι χρήστες του Twitter σύντομα καθοδήγησαν τον Tay να επαναφέρει μια σειρά από ρατσιστικές, αντισημιτικές και μισογυνιστικές δηλώσεις. Σε απάντηση, η Microsoft απέσυρε το bot εκτός σύνδεσης λιγότερο από 24 ώρες αργότερα.

Η Meta λέει ότι ο κόσμος της τεχνητής νοημοσύνης έχει αλλάξει πολύ μετά τη δυσλειτουργία του Tay και ότι το BlenderBot διαθέτει κάθε είδους ράγες ασφαλείας που θα πρέπει να εμποδίσουν τη Meta να επαναλάβει τα λάθη της Microsoft.

Είναι πολύ σημαντικό, λέει η Mary Williamson, υπεύθυνη μηχανικής έρευνας στο Facebook AI Research (FAIR), ενώ ο Tay σχεδιάστηκε για να μαθαίνει σε πραγματικό χρόνο από τις αλληλεπιδράσεις των χρηστών, το BlenderBot είναι ένα στατικό μοντέλο. Αυτό σημαίνει ότι μπορεί να θυμάται τι λένε οι χρήστες σε μια συνομιλία (και θα διατηρήσει αυτές τις πληροφορίες ακόμη και μέσω cookie του προγράμματος περιήγησης εάν ένας χρήστης βγει από το πρόγραμμα και επιστρέψει αργότερα), αλλά αυτά τα δεδομένα θα χρησιμοποιηθούν μόνο για τη βελτίωση του συστήματος περαιτέρω.

«Είναι απλώς προσωπική μου άποψη, αλλά αυτό [Tay] Το επεισόδιο είναι σχετικά ατυχές, επειδή δημιούργησε αυτόν τον χειμώνα chatbot όπου κάθε ίδρυμα φοβόταν να βγάλει δημόσια chatbot για έρευνα», λέει ο Williamson Το χείλος.

Ο Williamson λέει ότι τα περισσότερα chatbots που χρησιμοποιούνται σήμερα είναι στενά και προσανατολισμένα στην εργασία. Σκεφτείτε τα ρομπότ εξυπηρέτησης πελατών, για παράδειγμα, τα οποία συχνά παρουσιάζουν στους χρήστες ένα προ-προγραμματισμένο δέντρο διαλόγου, περιορίζοντας το ερώτημά τους πριν τα παραδώσουν σε έναν ανθρώπινο πράκτορα που μπορεί πραγματικά να ολοκληρώσει τη δουλειά. Το πραγματικό έπαθλο είναι η οικοδόμηση ενός συστήματος που μπορεί να διεξάγει μια συνομιλία τόσο ελεύθερης και φυσικής όσο αυτή του ανθρώπου, και ο Meta λέει ότι ο μόνος τρόπος για να επιτευχθεί αυτό είναι να αφήσουμε τα bots να έχουν ελεύθερες και φυσικές συνομιλίες.

«Αυτή η έλλειψη ανοχής για τα ρομπότ που λένε μη χρήσιμα πράγματα, με την ευρεία έννοια, είναι ατυχής», λέει ο Williamson. «Και αυτό που προσπαθούμε να κάνουμε είναι να το απελευθερώσουμε πολύ υπεύθυνα και να προωθήσουμε την έρευνα».

Εκτός από την τοποθέτηση του BlenderBot 3 στον Ιστό, η Meta δημοσιεύει επίσης τον υποκείμενο κώδικα, το σύνολο δεδομένων εκπαίδευσης και μικρότερες παραλλαγές μοντέλων. Οι ερευνητές μπορούν να ζητήσουν πρόσβαση στο μεγαλύτερο μοντέλο, το οποίο έχει 175 δισεκατομμύρια παραμέτρους, μέσω μιας φόρμας εδώ.