Η Yahoo έχει αναπτύξει έναν αλγόριθμο τεχνητής νοημοσύνης που λέει ότι μπορεί να ανιχνεύσει σωστά μέχρι και το 90 τοις εκατό των καταχρηστικών σχολίων online, ξεπερνώντας όλους τους άλλους “state-of-the-art” αλγόριθμους, σύμφωνα με μια έκθεση από τους προγραμματιστές του αλγορίθμου.
“Ενώ η αυτόματη ανίχνευση καταχρηστικής γλώσσας online είναι ένα σημαντικό θέμα, η προηγούμενη [ανίχνευσης κατάχρησης] δεν ήταν πολύ ολοκληρωμένη, επιβραδύνοντας έτσι την πρόοδο… [η κατάχρηση] μπορεί να έχει βαθιά επίδραση στην ευγένεια μιας κοινότητας ή στην εμπειρία του χρήστη“, έγραψαν οι προγραμματιστές.
Ο αλγόριθμος χρησιμοποιεί ένα μείγμα μηχανικής μάθησης και crowdsourced ανίχνευσης κατάχρησης για να σαρώνει τα σχόλια του Yahoo News and Finance.
Υπήρχαν Κάποια Στιγμή Δακτύλιοι γύρω από τη Γη;
AI κάμερες θα χρησιμοποιηθούν για περιορισμό των ατυχημάτων
Europol: Εξάρθρωσε την πλατφόρμα Ghost - Σύλληψη εγκληματιών
Επί του παρόντος, οι περισσότεροι ανιχνευτές καταχρηστικής γλώσσας είναι συστήματα που βασίζονται σε λέξεις κλειδιά. Το πρόβλημα είναι ότι οι “δράστες” μπορεί να αποφεύγουν ορισμένες λέξεις για να αποφύγουν τα φίλτρα ή να χρησιμοποιούν κάποια νέα λέξη αργκό. Επιπλέον, τα συστήματα δεν δουλεύουν σωστά με το να βγάζουν συμπέρασμα από τα συμφραζόμενα ή με τον σαρκασμό.
Η Yahoo, από την άλλη πλευρά, προχώρησε το θέμα λίγο πιο βαθιά και ήταν σε θέση να παρακολουθεί τις απαντήσεις μέσα από ένα σύνολο σχολίων και λέξεων, μέσα από τον αριθμό των σημείων στίξης, των URL και των κεφαλαίων γραμμάτων. Παρακολουθούσε, επίσης, και τη χρήση “λέξεων ευγενείας”. Συνολικά, ο αλγόριθμος ξεπέρασε τους παλιούς ανιχνευτές της Yahoo κατά περίπου 10 τοις εκατό.
Επιπλέον, ειδικά εκπαιδευμένοι εργαζόμενοι της Yahοo εξέτασαν τα ίδια σχόλια και τα κατέταξαν ως καταχρηστικά ή όχι, γεγονός που βοήθησε στην εκπαίδευση του αλγορίθμου ώστε να ψάχνει για σιωπηρή κατάχρηση. (Η βάση δεδομένων με αυτά που θεωρούνται καταχρηστικά, θα είναι σύντομα διαθέσιμη στο διαδίκτυο στο Yahoo Webscope.)