H κινεζική DeepSeek απειλεί να φέρει μεγάλη αναταραχή στον κόσμο της τεχνολογίας, αμφισβητώντας την αμερικανική υπεροχή στην τεχνητή νοημοσύνη με ένα χαμηλού κόστους, δωρεάν διαθέσιμου μοντέλου τεχνητής νοημοσύνης, με τον βοηθό ΑΙ να εκτινάσσεται στην κορυφή της κατηγορίας “Δωρεάν εφαρμογές” του iPhone App Store το Σαββατοκύριακο, ξεπερνώντας το ChatGPT.
Τη Δευτέρα, η μετοχή της Nvidia υποχώρησε 17% εν μέσω ανησυχιών για την άνοδο της κινεζικής εταιρείας AI DeepSeek, της οποίας το μοντέλο συλλογισμού R1 κατέπληξε τους παρατηρητές του κλάδου την περασμένη εβδομάδα .
Η υπόθεση ξεκίνησε γύρω στις 20 Ιανουαρίου όταν η κινεζική startup τεχνητής νοημοσύνης DeepSeek ανακοίνωσε το R1, ένα νέο μοντέλο προσομοίωσης συλλογισμού (SR) που υποστηρίζει ότι θα μπορούσε να ταιριάζει με το o1 της OpenAI στα κριτήρια συλλογιστικής. Όπως το o1, το R1 εκπαιδεύεται να εργάζεται μέσω μιας προσομοιωμένης αλυσίδας διαδικασίας σκέψης πριν δώσει μια απάντηση, η οποία μπορεί ενδεχομένως να βελτιώσει την ακρίβεια ή τη χρησιμότητα των εξόδων των μοντέλων AI για ορισμένους τύπους ερωτήσεων που θέτει ο χρήστης.
Αυτό δεν είναι τόσο εντυπωσιακό, καθώς άλλες εταιρείες τεχνητής νοημοσύνης, όπως η Google,έχουν τα δικά τους μοντέλα προσομοίωσης συλλογισμού. Επιπλέον, η ίδια η OpenAI ανακοίνωσε ένα επερχόμενο μοντέλο SR (με το όνομα “o3″) που μπορεί να ξεπεράσει το o1 σε απόδοση.
Ωστόσο, υπάρχουν τρία στοιχεία του DeepSeek R1 που πραγματικά συγκλόνισαν τους ειδικούς. Πρώτον, η κινεζική startup φαίνεται να έχει εκπαιδεύσει το μοντέλο για μόνο 6 εκατομμύρια δολάρια (σύμφωνα με πληροφορίες περίπου το 3% του κόστους εκπαίδευσης o1) ως ένα λεγόμενο ” side project ” ενώ χρησιμοποιεί λιγότερο ισχυρά τσιπ επιτάχυνσης AI Nvidia H800 λόγω των περιορισμών από τις ΗΠΑ σε πρόσβαση σε GPU αιχμής. Δεύτερον, εμφανίστηκε μόλις τέσσερις μήνες αφότου η OpenAI ανακοίνωσε το o1 τον Σεπτέμβριο του 2024. Τέλος, και ίσως το πιο σημαντικό, το DeepSeek κυκλοφόρησε δωρεάν τα μοντέλα με ανοιχτή άδεια MIT, που σημαίνει ότι ο καθένας μπορεί να το κατεβάσει, να το τρέξει και να το τροποποιήσει.
Ξαφνικά φάνηκε σε πολλούς παρατηρητές στα μέσα κοινωνικής δικτύωσης ότι οι αμερικανικές εταιρείες τεχνολογίας όπως η OpenAI και η Google δεν έχουν τεχνολογικό προβάδισμα. Η πρόσβαση σε hardware αιχμής ή τα εντυπωσιακά bankrolls δεν τους προστατεύουν απαραίτητα από τους νέους ανταγωνιστές της αγοράς.
Την Παρασκευή, ο επιχειρηματίας Marc Andreessen έγραψε στο X ότι το DeepSeek R1 είναι «μία από τις πιο εκπληκτικές και εντυπωσιακές ανακαλύψεις που έχω δει ποτέ» και ένα «βαθύ δώρο στον κόσμο». Η υποστήριξη από τον συνιδρυτή του Andreessen Horowitz ανέβασε κι άλλο το hype γύρω από το DeepSeek.
Επιπλέον, το Σαββατοκύριακο, η εφαρμογή του DeepSeek, η οποία επιτρέπει στους χρήστες να πειραματίζονται δωρεάν τόσο με το μοντέλο R1 όσο και με το μοντέλο V3 συμβατικής μεγάλης γλώσσας (LLM) της εταιρείας, έφτασε στην κορυφή του καταστήματος εφαρμογών iPhone των ΗΠΑ. Πολλαπλά threads του Reddit που σχετίζονται με την τεχνητή νοημοσύνη ξαφνικά γέμισαν με αναρτήσεις που σχετίζονται με τη DeepSeek, με πολλές θεωρίες (συνομωσίας).
Αυτό το μπαμ που έγινε με την εφαρμογή προκάλεσε κάποιο βαθμό πανικού σε μεγάλους επενδυτές τεχνολογίας και οδήγησε στο ξεπούλημα της μετοχής της Nvidia, παρά το γεγονός ότι η DeepSeek χρησιμοποίησε τσιπ Nvidia για εκπαίδευση.
Στο LinkedIn, ο επικεφαλής επιστήμονας τεχνητής νοημοσύνης της Meta, Yann LeCun, ο οποίος συχνά υπερασπίζεται μοντέλα τεχνητής νοημοσύνης ανοιχτού βάρους και έρευνα τεχνητής νοημοσύνης ανοιχτού κώδικα, έγραψε : «Στους ανθρώπους που βλέπουν την απόδοση η DeepSeek και σκέφτονται: «Η Κίνα ξεπερνά τις ΗΠΑ σε τεχνητή νοημοσύνη». Το διαβάζετε λάθος Η σωστή ανάγνωση είναι: «Τα μοντέλα ανοιχτού κώδικα ξεπερνούν τα ιδιόκτητα».
Τελικά, ένα φθηνά εκπαιδευμένο μοντέλο τεχνητής νοημοσύνης που μπορεί να ταιριάζει με τα καλύτερα εμπορικά μοντέλα της Αμερικής είναι πραγματικά μια απειλή για τις εταιρείες τεχνητής νοημοσύνης κλειστού κώδικα, αλλά δεν πρέπει να αποτελεί έκπληξη για όποιον παρακολουθεί τον γρήγορο ρυθμό προόδου στην τεχνητή νοημοσύνη. Η ιστορία των υπολογιστών είναι γεμάτη με παραδείγματα τεχνολογίας πληροφοριών που γίνονται όλο και πιο φθηνές, γίνονται εμπόρευμα και τελικά απορροφώνται ως συστατικό σε μεγαλύτερα προϊόντα.