ΑρχικήinetΤο Imagine with Meta AI εκπαιδεύτηκε σε 1,1 δις φωτογραφίες από Instagram...

Το Imagine with Meta AI εκπαιδεύτηκε σε 1,1 δις φωτογραφίες από Instagram και Facebook

Το νέο εργαλείο δημιουργίας εικόνων AI της Meta εκπαιδεύτηκε χρησιμοποιώντας 1,1 δισεκατομμύριο δημοσίως ορατές φωτογραφίες από τα Instagram και Facebook.

Το “Imagine with Meta AI” μετατρέπει προτροπές σε εικόνες, εκπαιδευμένο με τη χρήση δημόσιων δεδομένων του Facebook.

Δείτε επίσης: Meta: Ενσωματώνει το AI chatbot της στο WhatsApp

Την Τετάρτη, η Meta κυκλοφόρησε ένα δωρεάν αυτόνομο εργαλείο δημιουργίας εικόνων AI, το “Imagine with Meta AI”, βασισμένο στο μοντέλο σύνθεσης εικόνων Emu της. Προηγουμένως, η έκδοση της Meta αυτής της τεχνολογίας – χρησιμοποιώντας τα ίδια δεδομένα – ήταν διαθέσιμη μόνο σε εφαρμογές μηνυμάτων και κοινωνικών δικτύων, όπως το Instagram.

Εάν χρησιμοποιείτε το Facebook ή το Instagram, είναι πολύ πιθανό να μια φωτογραφία σας (ή που τραβήξατε) βοήθησε στην εκπαίδευση του Emu. Κατά κάποιον τρόπο, η παλιά φράση “Αν δεν πληρώνεις γι’ αυτό, εσύ είσαι το προϊόν” έχει λάβει μια εντελώς νέα έννοια. Παρόλα αυτά, το 2016, οι χρήστες του Instagram ανέβαζαν πάνω από 95 εκατομμύρια φωτογραφίες την ημέρα, οπότε το σύνολο δεδομένων που χρησιμοποίησε η Meta για την εκπαίδευση του μοντέλου AI ήταν ένα μικρό υποσύνολο της συνολικής της φωτογραφικής βιβλιοθήκης.

Καθώς η Meta δηλώνει ότι χρησιμοποιεί μόνο δημόσιες διαθέσιμες φωτογραφίες για την εκπαίδευση, το να ρυθμίσετε τις φωτογραφίες σας σε ιδιωτικές στο Instagram ή το Facebook θα πρέπει να αποτρέψει τη συμπερίληψή τους στη μελλοντική εκπαίδευση του AI μοντέλου της εταιρείας (εκτός αν αλλάξει αυτή την πολιτική, φυσικά).

Δείτε ακόμα: Windows 11 KB5032288: Βελτιώνει το Copilot AI και διορθώνει σφάλματα

Παρόμοια με το Stable Diffusion, το DALL-E 3 και το Midjourney, το Imagine with Meta AI δημιουργεί νέες εικόνες βασιζόμενο σε αυτό που το AI μοντέλο “γνωρίζει” για οπτικές έννοιες που έχει μάθει από τα δεδομένα εκπαίδευσης. Η δημιουργία εικόνων χρησιμοποιώντας το νέο ιστότοπο απαιτεί έναν λογαριασμό Meta, ο οποίος μπορεί να εισαχθεί από έναν υπάρχοντα λογαριασμό στο Facebook ή το Instagram. Κάθε δημιουργία παράγει τέσσερις εικόνες 1280×1280 pixel που μπορούν να αποθηκευτούν σε μορφή JPEG. Οι εικόνες περιλαμβάνουν ένα μικρό λογότυπο “Imagined with AI” στην κάτω αριστερή γωνία.

“Έχουμε απολαύσει να ακούμε από ανθρώπους πώς χρησιμοποιούν το imagine, το χαρακτηριστικό παραγωγής κειμένου σε εικόνα της Meta AI, για να δημιουργήσουν διασκεδαστικό και δημιουργικό περιεχόμενο σε συνομιλίες”, αναφέρει η Meta στη δελτίο τύπου της. “Σήμερα, διευρύνουμε την πρόσβαση στο imagine έξω από τις συνομιλίες, καθιστώντας το διαθέσιμο στις Ηνωμένες Πολιτείες για αρχή στο imagine.meta.com. Αυτή η αυτόνομη εμπειρία για δημιουργικούς ερασιτέχνες σας επιτρέπει να δημιουργήσετε εικόνες με την τεχνολογία από το Emu, το μοντέλο εικόνας του οργανισμού μας.”

Κάναμε δοκιμές της νέας γεννήτριας εικόνων AI της Meta μέσω μιας σειράς χαμηλού ρίσκου ανεπίσημων δοκιμών χρησιμοποιώντας το πρωτόκολλο σύνθεσης εικόνων και ανακαλύψαμε αισθητικά καινοτόμα αποτελέσματα, όπως μπορείτε να δείτε παραπάνω. (Ως παρατήρηση, κατά τη δημιουργία εικόνων ανθρώπων με το Emu, παρατηρήσαμε ότι πολλές από αυτές μοιάζουν με τυπικές αναρτήσεις μόδας στο Instagram.)

Δοκιμάσαμε επίσης την τύχη μας σε επιθετικές δοκιμές. Η γεννήτρια φαίνεται να φιλτράρει τις περισσότερες σκηνές βίας, κακόβουλες λέξεις, σεξουαλικό περιεχόμενο και θέματα και τα ονόματα διασημοτήτων και ιστορικών προσωπικοτήτων, αλλά επιτρέπει εμπορικούς χαρακτήρες όπως ο Elmo και ο Mickey Mouse.

Το μοντέλο της Meta δημιουργεί γενικά φωτορεαλιστικές εικόνες καλά, αλλά όχι τόσο καλά όσο το Midjourney. Μπορεί να αντιμετωπίσει πιο πολύπλοκες υποδείξεις καλύτερα από το Stable Diffusion XL, αλλά ίσως όχι τόσο καλά όσο το DALL-E 3. Δεν φαίνεται να αντιμετωπίζει καλά την απεικόνιση κειμένου γενικά, και διαχειρίζεται διάφορες μορφές μέσων όπως τα χρώματα του νερού, η κέντηση και το μελάνι με ανάμεικτα αποτελέσματα. Οι εικόνες των ανθρώπων φαίνεται να περιλαμβάνουν ποικιλία στην εθνική τους καταγωγή. Συνολικά, φαίνεται περίπου μέτριο σήμερα όσον αφορά τη σύνθεση εικόνων με τη χρήση της τεχνητής νοημοσύνης.

Δείτε επίσης: Η Google αναβάλλει το λανσάρισμα του Gemini AI για το 2024!

Όσον αφορά τον Emu, το AI μοντέλο πίσω από τα νέα χαρακτηριστικά δημιουργίας εικόνων της Meta, βασίζεται σε ένα ερευνητικό έγγραφο που κυκλοφόρησε η Meta τον Σεπτέμβριο. Ο Emu αποκτά τη δυνατότητά του να δημιουργεί υψηλής ποιότητας εικόνες μέσω ενός διαδικαστικού που ονομάζεται “ρύθμιση ποιότητας”. Αντίθετα με τα παραδοσιακά μοντέλα κειμένου προς εικόνα εκπαιδευμένα με μεγάλο αριθμό ζευγαριών κειμένου-εικόνας, ο Emu επικεντρώνεται στην “αισθητική ευθυγράμμιση” μετά την προεκπαίδευση, χρησιμοποιώντας ένα σύνολο σχετικά μικρών, αλλά οπτικά ελκυστικών εικόνων.

Στην καρδιά του Emu, ωστόσο, βρίσκεται το προαναφερθέν μαζικό σύνολο δεδομένων προεκπαίδευσης από 1.1 δισεκατομμύρια ζευγάρια κειμένου-εικόνας που προέρχονται από το Facebook και το Instagram. Στο ερευνητικό έγγραφο του Emu, η Meta δεν καθορίζει ακριβώς από πού προήλθαν τα δεδομένα εκπαίδευσης, αλλά αναφορές από το Συνέδριο Meta Connect 2023 αναφέρουν ότι ο πρόεδρος παγκόσμιων υποθέσεων της Meta, Nick Clegg, επιβεβαίωσε πως χρησιμοποιούσαν δημοσιεύσεις από κοινωνικά μέσα ως δεδομένα εκπαίδευσης για τα μοντέλα τεχνητής νοημοσύνης, συμπεριλαμβανομένων των εικόνων που τροφοδοτούν τον Emu.

Αυτή είναι μια αλλαγή στην προσέγγιση σε σύγκριση με άλλες εταιρείες τεχνητής νοημοσύνης, καθώς η Meta έχει πρόσβαση σε τόσα πολλά δεδομένα εικόνων και λεζάντων από τις υπηρεσίες της. Άλλα μοντέλα σύνθεσης εικόνων χρησιμοποιούν εικόνες που έχουν αποκτηθεί παράνομα από το Διαδίκτυο, έχουν αδειοδοτηθεί από εμπορικές βιβλιοθήκες εικόνων, ή μια συνδυασμένη προσέγγιση.

Αξίζει το ενδιαφέρον ότι επίσης το γεγονός ότι το ερευνητικό έγγραφο της Meta για τον Emu είναι το πρώτο που δεν εκφράζει αμφιβολία για το ενδεχόμενο του μοντέλου να δημιουργήσει παραπλανητική αποκαλυπτική πληροφόρηση ή πιθανώς επιβλαβές περιεχόμενο. Αυτό φαίνεται να αντικατοπτρίζει τη γενική αποδοχή (ή παραίτηση) για την πραγματικότητα των μοντέλων σύνθεσης εικόνων τεχνητής νοημοσύνης, τα οποία τώρα γίνονται πολύ πιο κοινά. Εάν αυτό είναι καλό ή όχι, αποτελεί ανοικτό ερώτημα.

Παρόλα αυτά, η Meta φαίνεται ότι αντιμετωπίζει τα ζητήματα πιθανών επιβλαβών αποτελεσμάτων με φίλτρα, ένα προτεινόμενο σύστημα υδατογραφίας που δεν είναι ακόμη λειτουργικό (“Στις επόμενες εβδομάδες, θα προσθέσουμε αόρατη υδατογράφηση στην εμπειρία Imagine with Meta AI για αυξημένη διαφάνεια και ιχνηλασιμότητα”, λέει η εταιρεία), και ένα μικρό αποποιητικό σημείωμα στο κάτω μέρος του ιστοτόπου: “Οι εικόνες είναι και ενδέχεται να είναι ανακριβείς ή ακατάλληλες.”

Οι εικόνες ενδέχεται να μην είναι ακριβείς και ενδέχεται ακόμη και να μην είναι ηθικές στα μάτια των ανώνυμων συντακτών των 1.1 δισεκατομμυρίων εικόνων που χρησιμοποιήθηκαν για την εκπαίδευση του μοντέλου. Αλλά τολμούμε να το πούμε: Η δημιουργία τους μπορεί να είναι διασκεδαστική. Φυσικά, ανάλογα με τη διάθεσή σας και τον τρόπο που βλέπετε το ρυθμό της σύνθεσης εικόνων από την τεχνητή νοημοσύνη, αυτή η διασκέδαση μπορεί να ισορροπηθεί από ένα ίσο επίπεδο ανησυχίας.

Πηγή: arstechnica.com

spot_img

Εγγραφή στο Newsletter

* indicates required

FOLLOW US

LIVE NEWS