Μελέτη του MIT βρίσκει λάθη και ανακρίβειες στις βάσεις δεδομένων

29 Μαρτίου, 2021

Δευτέρα, 29/03/2021 · Νίκος Καϊμακάμης

Ένα ποσοστό 3% των δεδομένων σε βάσεις δεδομένων παρουσιάζονται ως ανακριβή και λανθασμένα, σύμφωνα με μελέτη του MIT. Το ζήτημα αυτό μπορεί να έχει συνέπειες σε συστήματα machine learning που βασίζονται στις βάσεις δεδομένων.

Οι ερευνητές του MIT εξέτασαν πακέτα δεδομένων που περιλαμβάνονται σε βάσεις δεδομένων που χρησιμοποιούν γνωστές διαδικτυακές υπηρεσίες, όπως το IMDB, το Amazon και άλλες, προκειμένου να ανακαλύψουν πιθανά λάθη και σφάλματα.

Σε πολλές περιπτώσεις εμφανίστηκαν λάθη στις εγγραφές και τα αποτελέσματα αναζήτησης, με χαρακτηριστικές περιπτώσεις λανθασμένης χρήσης ετικέτας σε YouTube videos και άλλες περιπτώσεις. Για την αναζήτηση λαθών, οι ερευνητές του MIT χρησιμοποίησαν την τεχνική του confident learning, όπως ονομάζεται, μαζί με το εργαλείο Mechanical Turk.

Σε ένα πολύ μεγάλο ποσοστό οι ερευνητές εντόπισαν λάθη στις ετικέτες που χρησιμοποιούνται, κάτι που μπορεί να οδηγήσει αντιστοίχως και σε λανθασμένα αποτελέσματα αναζήτησης. Αυτό δεν μπορεί παρά να σημαίνει ότι απέχουμε ακόμα αρκετά από το να θεωρήσουμε ότι η Τεχνητή Νοημοσύνη μπορεί να λειτουργεί αυτόνομα. Υπάρχει μεγάλο περιθώριο βελτιώσεων, αφού η μηχανική μάθηση είναι η βάση της ανάπτυξης της Τεχνητής Νοημοσύνης.

Ακολουθήστε το Techblog.gr στο Google News για να μάθετε πρώτοι όλες τις ειδήσεις τεχνολογίας. Αν χρησιμοποιείτε RSS προσθέστε το Techblog στη λίστα σας https://techblog.gr/feed.

Πηγή

Μελέτη του MIT βρίσκει λάθη και ανακρίβειες στις βάσεις δεδομένων

Μου αρέσει αυτό:

Σχετικά

Επιλογές συντάκτη

Η κυβέρνηση των ΗΠΑ πιέζει τη Google να πουλήσει τον Chrome

Redmi K80 Pro: Μάθαμε το chipset και άλλες βασικές προδιαγραφές

Η Apple ετοιμάζει έναν ‘LLM Siri’ βοηθό για να ανταγωνιστεί το ChatGPT

Πρέπει να διαβάσετε

Η Apple ετοιμάζει έναν ‘LLM Siri’ βοηθό για να ανταγωνιστεί το ChatGPT

Δημοφιλείς Κατηγορίες

Μοιραστείτε το:

Μου αρέσει αυτό:

Σχετικά

Επιλογές συντάκτη

Η κυβέρνηση των ΗΠΑ πιέζει τη Google να πουλήσει τον Chrome

Redmi K80 Pro: Μάθαμε το chipset και άλλες βασικές προδιαγραφές

Η Apple ετοιμάζει έναν ‘LLM Siri’ βοηθό για να ανταγωνιστεί το ChatGPT

Πρέπει να διαβάσετε

Η Apple ετοιμάζει έναν ‘LLM Siri’ βοηθό για να ανταγωνιστεί το ChatGPT

Δημοφιλείς Κατηγορίες