Η ομάδα ηθικής τεχνητής νοημοσύνης λέει ότι τα Bias Bounties μπορούν να αποκαλύψουν πιο γρήγορα αλγοριθμικά ελαττώματα

Κόμβος πηγής: 1732021

Η μεροληψία στα συστήματα τεχνητής νοημοσύνης αποδεικνύεται ότι αποτελεί σημαντικό εμπόδιο στις προσπάθειες για ευρύτερη ενσωμάτωση της τεχνολογίας στην κοινωνία μας. Μια νέα πρωτοβουλία που θα ανταμείψει τους ερευνητές για την εύρεση τυχόν προκαταλήψεων Συστήματα AI θα μπορούσε να βοηθήσει στην επίλυση του προβλήματος.

Η προσπάθεια βασίζεται στο πρότυπο σφαλμάτων που πληρώνουν οι εταιρείες λογισμικού σε ειδικούς στον τομέα της κυβερνοασφάλειας που τους ειδοποιούν γιαστ τυχόν πιθανά ελαττώματα ασφαλείας στα προϊόντα τους. Η ιδέα δεν είναι καινούργια. «προκαταλήψεις» ήταν πρώτη πρόταση από τον ΑΕίμαι ερευνητής και επιχειρηματίας JB Rubinovitz το 2018, και διάφοροι οργανισμοί έχουν ήδη αντιμετωπίσει τέτοιες προκλήσεις.

Ωστόσο, η νέα προσπάθεια επιδιώκει να δημιουργήσει ένα συνεχές φόρουμ για διαγωνισμούς μεροληψίας που να είναι ανεξάρτητο από οποιονδήποτε συγκεκριμένο οργανισμό. Αποτελούμενη από εθελοντές από μια σειρά εταιρειών, συμπεριλαμβανομένου του Twitter, οι λεγόμενοι «Bias Buccaneers» σχεδιάζουν να διοργανώνουν τακτικούς διαγωνισμούς ή «ανταρτήσεις» και νωρίτερα αυτόν τον μήνα ξεκίνησε την πρώτη τέτοια πρόκληση.

"Τα bug bounties είναι μια τυπική πρακτική στον τομέα της κυβερνοασφάλειας που δεν έχει ακόμη βρει βάση στην κοινότητα αλγοριθμικής προκατάληψης», η οργάνωσηνίζερ λένε στην ιστοσελίδα τους. «Ενώ οι αρχικές έκτακτες εκδηλώσεις έδειξαν ενθουσιασμό για τα bounties, η Bias Buccaneers είναι η πρώτη μη κερδοσκοπική εταιρεία που προορίζεται να δημιουργήσει συνεχείς ανταρσίες, να συνεργαστεί με εταιρείες τεχνολογίας και να ανοίξει το δρόμο για διαφανείς και αναπαραγώγιμες αξιολογήσεις συστημάτων AI».

Αυτός ο πρώτος διαγωνισμός στοχεύει στην αντιμετώπιση της μεροληψίας στους αλγόριθμους ανίχνευσης εικόνων, αλλά αντί να κάνει τους ανθρώπους να στοχεύουν συγκεκριμένα συστήματα AI, ο διαγωνισμός θα κεφζητήστε από τους ερευνητές να δημιουργήσουν εργαλεία που μπορούν να ανιχνεύσουν μεροληπτικά σύνολα δεδομένων. Η ιδέα είναι να δημιουργηθεί ένα μοντέλο μηχανικής μάθησης που θα μπορεί να επισημάνει με ακρίβεια κάθε εικόνα σε ένα σύνολο δεδομένων με τον τόνο δέρματος, το αντιληπτό φύλο και την ηλικιακή ομάδα. Ο διαγωνισμός λήγει στις 30 Νοεμβρίου και έχει πρώτο βραβείο $6,000, δεύτερο βραβείο $4,000 και τρίτο βραβείο $2,000.

Η πρόκληση βασίζεται στο γεγονός ότι συχνά η πηγή της αλγοριθμικής μεροληψίας δεν είναι τόσο ο ίδιος ο αλγόριθμος, αλλά η φύση των δεδομένων στα οποία εκπαιδεύεται. Αυτοματοποιημένα εργαλεία που μπορούν να αξιολογήσουν γρήγορα πόσο ισορροπημένη είναι μια συλλογή of Οι εικόνες είναι σε σχέση με χαρακτηριστικά που συχνά αποτελούν πηγές διάκρισης θα μπορούσαν να βοηθήσουν τους ερευνητές της τεχνητής νοημοσύνης να αποφύγουν σαφώς μεροληπτικές πηγές δεδομένων.

Ωστόσο, οι διοργανωτές λένε ότι αυτό είναι μόνο το πρώτο βήμα σε μια προσπάθεια δημιουργίας μιας εργαλειοθήκης για την αξιολόγηση της μεροληψίας σε σύνολα δεδομένων, αλγόριθμους και εφαρμογές και, τελικά, τη δημιουργία προτύπων για τον τρόπο καταστροφήςl με αλγοριθμική προκατάληψη, δικαιοσύνη και επεξήγηση.

Είναι δεν είναι η μόνη τέτοια προσπάθεια. Ένας από τους ηγέτες του νέου πρωτοβουλία είναι ο Rumman Chowdhury του Twitter, ο οποίος βοήθησε στη διοργάνωση του πρώτου διαγωνισμού τεχνητής νοημοσύνης πέρυσι, στοχεύοντας έναν αλγόριθμο που χρησιμοποιούσε η πλατφόρμα για την περικοπή εικόνων που οι χρήστες παραπονέθηκαν ευνοούσε τα λευκόδερμα και τα αρσενικά πρόσωπα έναντι των μαύρων και γυναικείων.

Ο ανταγωνισμός έδωσε στους χάκερ πρόσβαση στο μοντέλο της εταιρείας και τους προκάλεσε να βρουν ελαττώματα σε αυτό. Εισερχόμενοι βρήκε ένα ευρύ φάσμα προβλημάτων, συμπεριλαμβανομένουπροτιμώντας τα στερεότυπα όμορφα πρόσωπα, μια αποστροφή προς άτομα με λευκά μαλλιά (δείκτης ηλικίας) και μια προτίμηση στα μιμίδια με αγγλική και όχι αραβική γραφή.

Το Πανεπιστήμιο του Στάνφορντ ολοκλήρωσε επίσης πρόσφατα έναν διαγωνισμό που προκάλεσε τις ομάδες να βρουν εργαλεία σχεδιασμένα να βοηθούν τους ανθρώπους να ελέγχουν εμπορικά ανεπτυγμένα ή ανοιχτού κώδικα συστήματα τεχνητής νοημοσύνης για διακρίσεις. Και οι ισχύοντες και επερχόμενοι νόμοι της ΕΕ θα μπορούσαν να καταστήσουν υποχρεωτικό για τις εταιρείες τον τακτικό έλεγχο των δεδομένων και των αλγορίθμων τους.

Παίρνοντας όμως Επιβραβεύσεις σφαλμάτων AI και αλγοριθμικός έλεγχος Το mainstream και η αποτελεσματικότητά τους θα είναι ευκολότερο να ειπωθούν παρά να γίνουν. Αναπόφευκτα, οι εταιρείες που χτίζουν τις επιχειρήσεις τους με βάση τους αλγόριθμούς τους θα αντισταθούν σε κάθε προσπάθεια δυσφήμησής τους.

Αξιοποιώντας τα διδάγματα από τα συστήματα ελέγχου σε άλλους τομείς, όπως τα οικονομικά και οι περιβαλλοντικοί και υγειονομικοί κανονισμοί, ερευνητές πρόσφατα μερικά από τα κρίσιμα συστατικά για την αποτελεσματική λογοδοσία. Ενα από τα πιο σημαντικά κριτήρια εντόπισαν ότι ήταν η ουσιαστική εμπλοκή ανεξάρτητων τρίτων.

Οι ερευνητές επεσήμαναν ότι οι τρέχοντες εθελοντικοί έλεγχοι τεχνητής νοημοσύνης συχνά περιλαμβάνουν σύγκρουση συμφερόντων, όπως ο οργανισμός-στόχος που πληρώνει για τον έλεγχο, βοηθά να πλαισιώσει το εύρος του ελέγχου ή έχει την ευκαιρία να επανεξετάσει τα ευρήματα πριν δημοσιοποιηθούν. Αυτή η ανησυχία αντικατοπτρίζεται σε μια πρόσφατη έκθεση από το Αλγοριθμική ένωση δικαιοσύνης, πουch σημείωσε το υπερμεγέθηd ρόλος των οργανισμών-στόχων στα τρέχοντα προγράμματα επιβράβευσης σφαλμάτων στον κυβερνοχώρο.

Η εύρεση ενός τρόπου χρηματοδότησης και υποστήριξης αληθινά ανεξάρτητων ελεγκτών τεχνητής νοημοσύνης και κυνηγών σφαλμάτων θα είναι μια σημαντική πρόκληση, ιδιαίτερα καθώς θα έρθουν αντιμέτωποι με μερικές από τις εταιρείες με τους περισσότερους πόρους στον κόσμο. Ευτυχώς όμως, φαίνεται να υπάρχει μια αυξανόμενη αίσθηση στον κλάδο ότι η αντιμετώπιση αυτού του προβλήματος θα είναι κρίσιμη για τη διατήρηση της εμπιστοσύνης των χρηστών στις υπηρεσίες τους.

Image Credit: Τζάκομπ Ρόζεν / Unsplash

Σφραγίδα ώρας:

Περισσότερα από Κέντρο μοναδικότητας