
η εταιρεία Η Nvidia παίζει δυνατά στον κόσμο της AI με το υλικό τελευταίας γενιάς, αλλά τώρα προσθέτει και λογισμικό με το NVLM. θα ανταγωνιστεί με GPT-4o και Καλεί μέσω ενός LLM ανοιχτού κώδικα για ένταξη σε πολυτροπικά μοντέλα (εικόνα, κείμενο).
Η Nvidia κυριαρχεί στο υλικό για AI με τις GPU του για τη συγκέντρωση δεδομένων, με τα μοντέλα H100 και B200 ως τα πιο αντιπροσωπευτικά. Αλλά με το NVLM έρχεται ένα νέο στοίχημα για τον τομέα των μεγάλων γλωσσικών μοντέλων (LLM). Η πρόταση της Nvidia έρχεται να αγωνιστεί σε έναν τομέα που κυριαρχείται από το OpenAI και το GPT-4º του. Ωστόσο, υπάρχουν και άλλοι ανταγωνιστές, όπως το Gemini της Google, το Llama της Meta και το Claude 3.5 της Anhtropic.
Τι προτείνει το NVLM της Nvidia για να φέρει επανάσταση στον κόσμο της τεχνητής νοημοσύνης;
NVLM 1.0 από την Nvidia είναι ο νέος ανταγωνιστής στον κόσμο των μεγάλων γλωσσικών μοντέλων για AI. Οι προγραμματιστές δημοσίευσαν μια μελέτη που περιγράφει λεπτομερώς πώς λειτουργεί και τι θα επιτρέψει αυτή η νέα πρόταση που στοχεύει να ανταγωνιστεί στον τομέα του λογισμικού με AI.
Εν ολίγοις, το NVLM είναι μια ολόκληρη οικογένεια πολυτροπικών LLM που, σύμφωνα με τη Nvidia, προσφέρουν αξιοσημείωτα αποτελέσματα στην όραση και τη γλώσσα. Η μελέτη δείχνει μια ικανότητα ανάλυσης και ανάπτυξης πολύ παρόμοια με αυτή άλλων ήδη δημοφιλών μοντέλων, όπως το GPT-4o.
Στο NVLM βρίσκουμε α μοντέλο με 72.000 δισεκατομμύρια παραμέτρους, ο πιο φιλόδοξος και ικανός αριθμός μέχρι σήμερα. Σύμφωνα με τη Nvidia, η συμπεριφορά και ο τύπος των αποκρίσεών της είναι καλύτερες από αυτές του Llama 3 405B, ενός πολύ μεγαλύτερου μοντέλου σύμφωνα με δοκιμές απόδοσης.
Ένα άλλο πλεονέκτημα της πρότασης της Nvidia είναι ότι το NVLM προσφέρει ένα μοντέλο ανοιχτού κώδικα AI ανοιχτών βαρών. Οι υπεύθυνοι υπόσχονται να δημοσιεύσουν τον κώδικα που χρησιμοποιήθηκε για την εκπαίδευση του μοντέλου, κάτι εξαιρετικά χρήσιμο. Οι προγραμματιστές θα μπορούν να το χρησιμοποιούν στα δικά τους έργα και πιρούνια.
Τι θα προσφέρει το NVLM στον κόσμο της AI;
Με το NVLM μπορείτε να αναλύσετε εισαγωγές οπτικών και κειμένου. Αυτό μεταφράζεται στην ικανότητα του AI να ερμηνεύει μιμίδια και να αναλύει φωτογραφίες. Επιπλέον, μπορείτε επίσης να χρησιμοποιήσετε αυτό το μοντέλο γλώσσας που δημιουργήθηκε από την Nvidia για να λύσετε μαθηματικά προβλήματα βήμα προς βήμα.
Η λειτουργία αυτού του συστήματος συνδυάζει OCR, εντοπισμό, κοινή λογική, παγκόσμια γνώση και δεξιότητες προγραμματισμού. Όλα αυτά μαζί επιτρέπουν στο NVLM να ανταποκρίνεται σε διαφορετικά αιτήματα και καταστάσεις με μεγάλη ευελιξία. Η διερεύνηση του πεδίου εφαρμογής αυτού του νέου μοντέλου γλώσσας τεχνητής νοημοσύνης και η σύγκρισή του ως προς την απόδοσή του με άλλους παίκτες στον κλάδο μας επιτρέπει να κατανοήσουμε πού προχωρά η τεχνολογία.
Σχετικά με την προπόνηση
Οι υπεύθυνοι για την εκπαίδευση του NVLM έχουν χρησιμοποιήσει μια βελτιωμένη αρχιτεκτονική για την εκπαίδευση και τη λογική του μοντέλου τους. Οι δυνατότητές του είναι πολύ ευέλικτες και μπορεί να επεξεργαστεί 72.000 εκατομμύρια παραμέτρους και άμεσα ανταγωνιστές GPT-4o, Llama 3-V-70B και Gemini 1.5 Pro. Η μεγαλύτερη απόδοσή του είναι αυτή τη στιγμή αποδεδειγμένη στην επίλυση μαθηματικών προβλημάτων, στην επεξεργασία εικόνας και κειμένου.
Οι πληροφορίες που χρησιμοποιήθηκαν για την προ-προπόνηση και την προπόνηση επιλέχθηκαν προσεκτικά με λεπτές προσαρμογές και ανθρώπινη επίβλεψη. Η εργασία χρησίμευσε για την επαλήθευση της ποιότητας των συνόλων δεδομένων καθώς και της ποικιλομορφίας συμβατών και κλιμακωμένων εργασιών, συμπεριλαμβανομένου του προεκπαιδευτικού σταδίου.
El ισχυρός αλγόριθμος που δημιουργήθηκε από την Nvidia Κυκλοφόρησε ως ανοιχτού κώδικα, μαζί με το μοντέλο με οδηγίες και παραμέτρους εκπαίδευσης. Μπορούν να χρησιμοποιηθούν και να τροποποιηθούν χωρίς κόστος, διανέμονται μέσω της Megatron-Core, της βιβλιοθήκης ανάπτυξης της εταιρείας.
Αυτό είναι ένα πραγματικό ορόσημο στον κλάδο, επειδή η Nvidia διευκολύνει άλλους μικρούς οργανισμούς ή ανεξάρτητους ερευνητές να συμβάλλουν επίσης στην πρόοδο της τεχνητής νοημοσύνης. Αυτός δωρεάν πρόσβαση στο εργαλείο και τα χαρακτηριστικά του παρόμοια με εκείνα άλλων μεγάλων τεχνολογικών προϊόντων θα σηματοδοτήσουν ένα πριν και το μετά στον αγώνα για τον έλεγχο του κλάδου.
Με αυτό το νέο LLM, στόχος είναι να επεκταθεί η βάση των χρηστών και των πελατών, ευνοώντας μια επιχείρηση που είναι ήδη προσοδοφόρα. Τώρα όμως θα προσθέσει ακόμη περισσότερους ενθουσιώδεις και πιθανούς χρήστες σε όλο τον κόσμο. Ένα εξαιρετικό βήμα για τη Nvidia, η οποία εκτός από την κυριαρχία στον τομέα της τεχνητής νοημοσύνης μέσω υλικού, στοχεύει πλέον άμεσα στον τομέα του λογισμικού.
Υβριδική επιχειρηματική στρατηγική
Η ηγετική θέση που έχει πάρει η Nvidia στο τομέα της τεχνολογίας και στην ανάπτυξη της Τεχνητής Νοημοσύνης ανταποκρίνεται σε μια υβριδική επιχειρηματική στρατηγική. Από τη μία πλευρά, εξετάζει την ανάπτυξη και παραγωγή τσιπ και την πώληση προηγμένων συστημάτων για την προώθηση της λειτουργίας πολύ διαφορετικών αλγορίθμων. Αυτό επιτάχυνε τη δημιουργία εισοδήματος και έλαβε την έγκριση των επενδυτών. Από την άλλη, γίνεται δουλειά στους αλγόριθμους AI, ώστε η Nvidia να τοποθετείται σε ένα τμήμα όπου βρίσκεται σε μειονεκτική θέση σε σύγκριση με το OpenAI, το Google και το Meta. Αλλά χάρη σε αυτή τη στρατηγική, το NVLM αποδεικνύεται ένα εξαιρετικό εργαλείο, ικανό να πολεμήσει σώμα με σώμα με γίγαντες τεχνητής νοημοσύνης που είναι ήδη τοποθετημένοι.
Με τους νέους επεξεργαστές Nvidia, η ταχύτητα και η ικανότητα ανάλυσης και επίλυσης μαθηματικών προβλημάτων που επιτυγχάνουν οι χρήστες είναι αξιοσημείωτη. Η άφιξη του NVLM 1.0 θα σηματοδοτήσει ένα πριν και το μετά για τον κλάδο, δημιουργώντας τη δυνατότητα ενός νέου παράγοντα με προτάσεις ανοιχτού κώδικα να προσεγγίσει μεγαλύτερο αριθμό χρηστών και μικρομεσαίων επιχειρήσεων.
Πώς θα είναι η κατάσταση της αγοράς AI τώρα που η Nvidia μπήκε με το NVLM;
Μέχρι τώρα, η Nvidia πρόσφερε το οι πιο σημαντικοί επεξεργαστές και GPU για όλους τους τύπους κέντρων δεδομένων και διακομιστών όπου εκτελούνται μοντέλα τεχνητής νοημοσύνης. Αλλά το NVLM συνεπάγεται την άμεση προσγείωση της Nvidia στον τομέα και αυτό μπορεί να δημιουργήσει κάποια τριβή με τον υπόλοιπο ανταγωνισμό. Η πρωτοβουλία ανοιχτού κώδικα και η φιλόδοξη επεξεργαστική ισχύς καθιστούν το NVLM ένα πολύ ελκυστικό μοντέλο γλώσσας. Μένει να δούμε πώς προσαρμόζεται και τις χρήσεις που αρχίζει να του δίνει η κοινότητα χρηστών για να κατανοήσουμε πλήρως το εύρος του. Μάλλον θα αρχίσουμε να ακούμε σημαντικά νέα από τον τομέα της AI τώρα που η Nvidia μπήκε στο παιχνίδι.
