Midjourney: Νέο Χαρακτηριστικό για δημιουργία συνεπών εικονών

Η δημοφιλής υπηρεσία δημιουργίας εικόνων AI, Midjourney, έχει αναπτύξει ένα από τα πιο συχνά ζητούμενα χαρακτηριστικά της. Κάνει ντεμπούτο με τη δυνατότητα αναπαραγωγής χαρακτήρων με συνέπεια σε πολλές νέες gen AI εικόνες.

Αυτό ήταν ένα μεγάλο εμπόδιο για τα AI μοντέλα εικόνας μέχρι σήμερα, από τη φύση τους.

Αυτό οφείλεται στο γεγονός ότι οι περισσότεροι AI generators δημιουργοί εικόνων βασίζονται σε “μοντέλα διάχυσης“, εργαλεία παρόμοια ή βασισμένα στο αλγόριθμο δημιουργίας εικόνων ανοιχτού πηγαίου της Stability AI, το Stable Diffusion, το οποίο λειτουργεί περίπου λαμβάνοντας κείμενο που εισάγει ένας χρήστης και προσπαθεί να συναρμολογήσει μια εικόνα pixel-προς-pixel που ταιριάζει με την περιγραφή αυτή, όπως έχει μάθει από παρόμοιες εικόνες και ετικέτες κειμένου στο μαζικό (και αμφιλεγόμενο) σύνολο δεδομένων εκπαίδευσής των εκατομμυρίων εικόνων που δημιουργήθηκαν από ανθρώπους.

Δείτε επίσης: Η Salesforce ανακοινώνει νέα εργαλεία AI για γιατρούς

Γιατί οι συνεπείς χαρακτήρες είναι τόσο ισχυροί – και δυσκολεύουν το generative AI imagery

Ωστόσο, όπως συμβαίνει με τα μοντέλα μεγάλου μεγέθους γλώσσας (LLMs) βασισμένα σε κείμενο, όπως το ChatGPT της OpenAI ή το νέο Command-R της Cohere, το πρόβλημα με όλες τις εφαρμογές generative AI είναι η ανεπάρκεια των απαντήσεών τους: η AI δημιουργεί κάτι νέο για κάθε μοναδική προτροπή που εισάγετε σε αυτή, ακόμη κι αν η προτροπή επαναλαμβάνεται ή χρησιμοποιούνται κάποιες από τις ίδιες βασικές λέξεις-κλειδιά.

Αυτό είναι εξαιρετικό για τη δημιουργία ολοκαίνουργιου περιεχομένου – στην περίπτωση της Midjourney, νέες εικόνες. Αλλά τι γίνεται αν σχεδιάζετε ένα φιλμ, ένα μυθιστόρημα, ένα γραφικό μυθιστόρημα ή κόμικς, ή κάποιο άλλο οπτικό μέσο όπου θέλετε ο ίδιος χαρακτήρας ή χαρακτήρες να κινηθούν μέσα από αυτό και να εμφανίζονται σε διαφορετικές σκηνές, περιβάλλοντα, με διαφορετικές εκφράσεις προσώπου και αξεσουάρ;

Αυτή η συγκεκριμένη σκηνή, η οποία είναι συνήθως απαραίτητη για την αφηγηματική συνέχεια, ήταν πολύ δύσκολο να επιτευχθεί με τη generative AI – μέχρι τώρα. Αλλά η Midjourney δοκιμάζει τώρα την προσπάθεια, εισάγοντας ένα νέο tag (ετικέτα), το “–cref” (σύντομο για “αναφορά χαρακτήρα”) που οι χρήστες μπορούν να προσθέσουν στο τέλος των κειμένων των προτροπών τους στο Midjourney Discord και θα προσπαθήσει να αντιστοιχίσει τα χαρακτηριστικά του χαρακτήρα, τον τύπο του σώματος και ακόμη και τα ρούχα από ένα URL που ο χρήστης επικολλά μετά την εν λόγω ετικέτα.

Καθώς το χαρακτηριστικό προχωρά και βελτιώνεται, θα μπορούσε να οδηγήσει τη Midjourney περαιτέρω από ένα ενδιαφέρον «παιχνίδι» ή πηγή ιδεών σε ένα πιο επαγγελματικό εργαλείο.

Δείτε ακόμα: Adobe Express: Νέα mobile εφαρμογή με Firefly generative AI features

Πώς να χρησιμοποιήσετε το νέο χαρακτηριστικό συνεπών χαρακτήρων της Midjourney

Η ετικέτα λειτουργεί καλύτερα με εικόνες που έχουν δημιουργηθεί προηγουμένως από τη Midjourney. Έτσι, για παράδειγμα, η ροή εργασίας για έναν χρήστη θα ήταν να δημιουργήσει ή να ανακτήσει το URL ενός προηγουμένως δημιουργημένου χαρακτήρα.

Ας ξεκινήσουμε από την αρχή και να πούμε ότι δημιουργούμε ένα νέο χαρακτήρα με αυτήν την προτροπή: “ένας μυϊκός φαλακρός άνδρας με ένα σκουλαρίκι και κάλυμμα στο μάτι.”

Θα αυξήσουμε την εικόνα που μας αρέσει περισσότερο, στη συνέχεια θα κάνουμε κλικ με το πλήκτρο ελέγχου σε αυτήν στον διακομιστή Discord της Midjourney για να βρούμε την επιλογή “copy link” (“αντιγραφή συνδέσμου”).

Στη συνέχεια, μπορούμε να πληκτρολογήσουμε μια νέα προτροπή “φορώντας ένα λευκό σμόκιν στέκεται σε μια έπαυλη–cref [URL]” και να επικολλήσουμε το URL της εικόνας που μόλις δημιουργήσαμε, και η Midjourney θα προσπαθήσει να δημιουργήσει αυτόν τον ίδιο χαρακτήρα από πριν στο νέο μας περιβάλλον που πληκτρολογήσαμε.

Όπως θα δείτε, τα αποτελέσματα είναι μακριά από το ακριβές του αρχικού χαρακτήρα (ή ακόμη και την αρχική μας προτροπή), αλλά σίγουρα ενθαρρυντικά.

Δείτε επίσης: ChatGPT Read Aloud: Η OpenAI Προσφέρει Φωνητική Ανάγνωση

Επιπλέον, ο χρήστης μπορεί να ελέγξει κατά κάποιο τρόπο το “βάρος” του πόσο στενά η νέα εικόνα αναπαράγει τον αρχικό χαρακτήρα εφαρμόζοντας την ετικέτα “–cw” ακολουθούμενη από έναν αριθμό 1 έως 100 στο τέλος της νέας τους προτροπής (μετά τη συμβολοσειρά “–cref [URL]”, έτσι: “–cref [URL] –cw 100.” Όσο χαμηλότερος είναι ο αριθμός του “cw”, τόσο περισσότερη απόκλιση θα έχει η νέα εικόνα. Όσο υψηλότερος είναι ο αριθμός του “cw”, τόσο πιο στενά θα ακολουθεί η νέα εικόνα την αρχική αναφορά.

Όπως μπορείτε να δείτε στο παράδειγμά μας, η εισαγωγή ενός πολύ χαμηλού “cw 8” επιστρέφει πράγματι αυτό που θέλαμε: το λευκό σμόκιν. Παρόλα αυτά, τώρα αφαίρεσε το χαρακτηριστικό παράδειγμά μας.

Τι να κάνουμε όμως, τίποτα δεν μπορεί να διορθώσει μια μικρή “περιοχή ποικιλίας” – σωστά;

Εντάξει, έτσι το κάλυμμα είναι στο λάθος μάτι… αλλά πλησιάζουμε!

Μπορείτε επίσης να συνδυάσετε πολλούς χαρακτήρες σε ένα χρησιμοποιώντας δύο ετικέτες “–cref” δίπλα-δίπλα με τα αντίστοιχα URL τους.

Δείτε ακόμα: Apple: Το νέο MacBook Air είναι το καλύτερο laptop για AI

Το χαρακτηριστικό μόλις κυκλοφόρησε νωρίτερα απόψε, αλλά ήδη καλλιτέχνες και δημιουργοί το δοκιμάζουν τώρα. Δοκιμάστε το μόνοι σας αν έχετε το Midjourney. Και διαβάστε την πλήρη σημείωση του ιδρυτή David Holz παρακάτω:

Γεια σε όλους δοκιμάζουμε ένα νέο χαρακτηριστικό “Αναφορά Χαρακτήρα” σήμερα. Αυτό είναι παρόμοιο με το χαρακτηριστικό “Αναφορά Στυλ”, εκτός από το ότι αντιστοιχίζει μια εικόνα χαρακτήρα.

Πώς λειτουργεί

Πληκτρολογήστε –cref URL μετά την προτροπή σας με ένα URL για μια εικόνα ενός χαρακτήρα.
Μπορείτε να χρησιμοποιήσετε –cw για να τροποποιήσετε την “δύναμη” της αναφοράς από 100 έως 0.
Η δύναμη 100 (–cw 100) είναι προεπιλογή και χρησιμοποιεί το πρόσωπο, τα μαλλιά και τα ρούχα.
Στη δύναμη 0 (–cw 0) θα επικεντρωθεί μόνο στο πρόσωπο (καλό για αλλαγή ρούχων / μαλλιών κλπ.).

Για τι προορίζεται

Αυτό το χαρακτηριστικό λειτουργεί καλύτερα όταν χρησιμοποιούνται χαρακτήρες που δημιουργήθηκαν από εικόνες της Midjourney. Δεν είναι σχεδιασμένο για πραγματικά άτομα / φωτογραφίες (και πιθανότατα θα τις παραμορφώσει όπως κάνουν οι κανονικές εικονικές προτροπές).

Το Cref λειτουργεί με παρόμοιο τρόπο με τις κανονικές εικονικές προτροπές, εκτός από το ότι “επικεντρώνεται” στα χαρακτηριστικά του χαρακτήρα.

Η ακρίβεια αυτής της τεχνικής είναι περιορισμένη, δεν θα αντιγράψει ακριβείς λεπτομέρειες όπως ρυτίδες / σπυράκια / ή λογότυπα μπλουζών.

Το Cref λειτουργεί τόσο για τα μοντέλα Niji όσο και για τα κανονικά MJ και μπορεί επίσης να συνδυαστεί με –sref.

Προχωρημένες λειτουργίες

Μπορείτε να χρησιμοποιήσετε περισσότερα από ένα URL για να αναμείξετε τις πληροφορίες / χαρακτήρες από πολλές εικόνες όπως αυτό cref URL1 URL2 (αυτό είναι παρόμοιο με πολλαπλές εικονικές ή στυλ προτροπές).

Πώς λειτουργεί στον ιστό alpha;

Σύρετε ή επικολλήστε μια εικόνα στη νοητή γραμμή έτσι ώστε να έχει τρία εικονίδια. Επιλέγοντας αυτά ορίζει εάν είναι μια εικονική προτροπή, μια αναφορά στυλ ή μια αναφορά χαρακτήρα. Πατήστε Shift+ επιλέξτε μια επιλογή για να χρησιμοποιήσετε μια εικόνα για πολλαπλές κατηγορίες.

Να θυμάστε, ενώ η MJ V6 είναι σε φάση alpha αυτό και άλλα χαρακτηριστικά ενδέχεται να αλλάξουν ξαφνικά, αλλά η επίσημη beta της V6 έρχεται σύντομα. Θα θέλαμε τις σκέψεις όλων στην ⁠ideas-and-features. Ελπίζουμε να απολαύσετε αυτήν την πρώιμη έκδοση και ελπίζουμε ότι θα σας βοηθήσει να παίξετε με τη δημιουργία ιστοριών και κόσμων.

Πηγή: venturebeat

Ακολουθήστε μας στο Google News και ενημερωθείτε πρώτοι για όλες τις ειδήσεις.

Midjourney: Νέο Χαρακτηριστικό για δημιουργία συνεπών εικονών

RELATED ARTICLES

Εγγραφή στο Newsletter

FOLLOW US

LIVE NEWS