ΑρχικήUpdatesGoogle Gemini 1.5 Pro: Διαθέσιμο για δημόσιο preview στο Vertex AI

Google Gemini 1.5 Pro: Διαθέσιμο για δημόσιο preview στο Vertex AI

Το Google Gemini 1.5 Pro, είναι πλέον διαθέσιμο για δημόσιο preview μέσω του Vertex AI, της πλατφόρμας της Google για την ανάπτυξη επιχειρηματικών εφαρμογών τεχνητής νοημοσύνης.

gemini 1.5 pro

Αυτή η ανακοίνωση έγινε κατά τη διάρκεια του ετήσιου συνεδρίου Cloud Next, το οποίο πραγματοποιείται στο Λας Βέγκας αυτή την εβδομάδα.

Τον Φεβρουάριο, η Google παρουσίασε το Gemini 1.5 Pro, μια εντυπωσιακή προσθήκη στην σειρά των μοντέλων τεχνητής νοημοσύνης Gemini. Το πιο σημαντικό χαρακτηριστικό του είναι η ικανότητά του να επεξεργάζεται εκπληκτικά μεγάλα σύνολα δεδομένων: από 128.000 μέχρι και 1 εκατομμύριο tokens, όπου τα “tokens” αντιστοιχούν σε επιμέρους bits ακατέργαστων δεδομένων, όπως τα τμήματα “fan”, “tas” και “tic” στη λέξη «φανταστικό».

Διαβάστε περισσότερα: Google Gemini: Περιορισμοί στα ερωτήματα που σχετίζονται με τις εκλογές

Αυτό το εκπληκτικό όριο του ενός εκατομμυρίου tokens είναι ισοδύναμο με περίπου 700.000 λέξεις ή περίπου 30.000 γραμμές κώδικα, προσφέροντας τετραπλάσια την χωρητικότητα δεδομένων σε σχέση με το δημοφιλές μοντέλο της Anthropic, το Claude 3, και οκταπλάσια σε σχέση με το μέγιστο όριο του GPT-4 Turbo του OpenAI.

Το πλαίσιο ενός μοντέλου, ή αλλιώς το περιβάλλον δεδομένων, αναφέρεται στην αρχική συλλογή δεδομένων (όπως κείμενο) που αναλύει το μοντέλο προτού παράγει το αποτέλεσμα (π.χ. επιπρόσθετο κείμενο). Για παράδειγμα, μια απλή ερώτηση – “Ποιος κέρδισε τις προεδρικές εκλογές των ΗΠΑ το 2020;” – μπορεί να λειτουργήσει ως πλαίσιο, όπως επίσης και ένα σενάριο ταινίας, ένα email, ένα δοκίμιο ή ένα ηλεκτρονικό βιβλίο.

Μοντέλα που διαθέτουν περιορισμένο πεδίο παρατήρησης, τείνουν να αγνοούν το περιεχόμενο ακόμα και πρόσφατων συζητήσεων, παρεκκλίνοντας από το αρχικό θέμα. Αντιθέτως, μοντέλα με εκτεταμένο πεδίο λειτουργούν καλύτερα, καθώς μπορούν να παρακολουθούν τη ροή των δεδομένων πιο εύκολα, να συνθέτουν πιο πλούσιες απαντήσεις αξιοποιώντας τα συμφραζόμενα και να μειώνουν την ανάγκη για εκτενή ρύθμιση και προσαρμογή.

Τι είναι δυνατόν να πετύχει κανείς όταν έχει στη διάθεσή του ένα περιβάλλον με 1 εκατομμύριο διακριτικά; Η Google υπόσχεται πολλά, από την ανάλυση εκτενών βιβλιοθηκών κώδικα, την εμβάθυνση σε μακροσκελή έγγραφα με συλλογιστική ικανότητα, μέχρι τη διεξαγωγή εκτεταμένων συνομιλιών μέσω ενός chatbot.

Διότι το Gemini 1.5 Pro είναι πολυγλωσσικό και πολυτροπικό — καθώς αντιλαμβάνεται εικόνες, βίντεο και από την Τρίτη και έπειτα, ακόμα και ηχητικές ροές πέρα από το κείμενο — το σύστημα είναι ικανό να αναλύσει και να παρουσιάσει συγκρίσεις μεταξύ περιεχομένου από διάφορα μέσα, όπως τηλεοπτικές εκπομπές, ταινίες, ραδιοφωνικά προγράμματα, ηχογραφήσεις τηλεδιασκέψεων και άλλα, σε πολλαπλές γλώσσες. Ένα εκατομμύριο λέξεις μεταφράζονται περίπου σε μία ώρα βίντεο ή περίπου 11 ώρες ήχου.

Χάρη στις δυνατότητες επεξεργασίας ήχου, το Gemini 1.5 Pro μπορεί να δημιουργήσει μεταγραφές και για βίντεο κλιπ, αν και η κριτική επιτροπή δεν γνωρίζει την ποιότητα αυτών των μεταγραφών.

Σε μία προηχογραφημένη φετινή παρουσίαση, η Google παρουσίασε τον Gemini 1.5 Pro αναλύοντας τη μεταγραφή της ιστορικής τηλεοπτικής εκπομπής για την προσεδάφιση του Apollo 11, η οποία εκτείνεται σε περίπου 400 σελίδες.

Η Google αναφέρει ότι οι πρωτοπόροι χρήστες της πλατφόρμας Gemini 1.5 Pro, στους οποίους συγκαταλέγονται η United Wholesale Mortgage, η TBS και η Replit, εκμεταλλεύονται τις εκτεταμένες δυνατότητες του συστήματος για μια πληθώρα εργασιών. Αυτές περιλαμβάνουν τη διαχείριση στεγαστικών δανείων, την αυτοματοποιημένη προσθήκη ετικετών metadata σε αρχεία πολυμέσων καθώς και τη δημιουργία, την επεξήγηση, και τη μετατροπή κώδικα.

Το Gemini 1.5 Pro δεν μπορεί να επεξεργαστεί ένα εκατομμύριο στοιχεία με την απλή πίεση ενός κουμπιού. Στις παρουσιάσεις που αναφέρθηκαν προηγουμένως, οι αναζητήσεις απαιτούσαν από 20 δευτερόλεπτα έως ένα ολόκληρο λεπτό για να ολοκληρωθούν, διάρκεια πολύ μεγαλύτερη σε σύγκριση με τον μέσο χρόνο ενός ερωτήματος στο ChatGPT.

gemini 1.5 pro vertex ai

Δείτε ακόμη: Το Gemini στο Google App: Νέες Εξελίξεις στο Android

Η Google έχει δηλώσει παλαιότερα ότι δίνει ιδιαίτερη σημασία στον λανθάνοντα χρόνο, και γι’ αυτό εργάζεται ενεργά για την “βελτίωση” της απόδοσης του Gemini 1.5 Pro καθώς προχωρά ο χρόνος.

Είναι σημαντικό να επισημανθεί ότι το Gemini 1.5 Pro σταδιακά καθιερώνεται σε διάφορα στοιχεία του εταιρικού προϊοντικού οικοσυστήματος της Google. Η εταιρεία ανακοίνωσε την Τρίτη ότι η έκδοση αυτή (σε ιδιωτική προεπισκόπηση) θα ενισχύσει τις νέες δυνατότητες του Code Assist, του εργαλείου υποστήριξης κωδικοποίησης με τεχνολογία AI της Google. Πλέον, οι προγραμματιστές θα έχουν τη δυνατότητα να εφαρμόζουν αλλαγές “μεγάλης κλίμακας” στις βάσεις κώδικα, όπως επισημαίνει η Google, όπως για παράδειγμα, μπορούν να ανανεώσουν τις εξαρτήσεις μεταξύ αρχείων και να αναλύσουν μεγάλα τμήματα κώδικα.

Πηγή: techcrunch

SecNews
SecNewshttps://secnews.gr
In a world without fences and walls, who need Gates and Windows
spot_img

Εγγραφή στο Newsletter

* indicates required

FOLLOW US

LIVE NEWS