Τρομακτικό και εντυπωσιακό ταυτόχρονα: το μοντέλο AI OpenAI δημιουργεί τώρα εικόνες από τα λόγια σας

Τρομακτικό και εντυπωσιακό ταυτόχρονα: το μοντέλο AI OpenAI δημιουργεί τώρα εικόνες από τα λόγια σας

“Σχεδιάστε με έναν καναπέ σε σχήμα αβοκάντο”, “Κύβος με κόκκους καφέ” Ανοίξτε το νέο μοντέλο OpenAI μετατρέπει τις λέξεις σε εικόνες. Το αποτέλεσμα κυμαίνεται από εντυπωσιακό έως τρομακτικό

Εκτύπωση οθόνης

Το OpenAI, η εταιρεία AI που κέρδισε την υποστήριξη (και την επαλήθευση) του Elon Musk, έχει αναπτύξει μερικά από τα πιο ενδιαφέροντα και αγχωτικά μοντέλα στον κόσμο τα τελευταία χρόνια. Μετά το μοντέλο GPT-2, το οποίο θεωρείται “πολύ επικίνδυνο” για χρήση, καιΤο μοντέλο GPT-3 κυκλοφόρησε το περασμένο καλοκαίριΚαι με βάση δισεκατομμύρια παραμέτρους, η εταιρεία παρουσιάζει τώρα μια ενδιαφέρουσα ανάπτυξη βασισμένη στο νέο μοντέλο, το οποίο είναι τόσο εντυπωσιακό όσο και τρομακτικό.

Όταν το WALL-E γνώρισε το Σαλβαδόρ Νταλί

ξέρω ΠΑΡΟΣ-Ι, Ένα νέο μοντέλο από το OpenAPI βασισμένο στο GPT-3. Από το DALL-E – ένας συνδυασμός του Dali και του χαριτωμένου ρομπότ από την ταινία Pixar – WALL-E – μπορείτε να ζητήσετε να δημιουργήσετε οποιαδήποτε εικόνα θέλετε. Είτε πρόκειται για έναν κύβο από ηλεκτρικά κυκλώματα, έναν κύλινδρο πυρκαγιάς και ακόμη και ένα σχέδιο ενός daikon (κινέζικο ραπανάκι) που φοράει φούστα tutu και πηγαίνει για μια βόλτα με ένα σκύλο (ναι, αυτό είναι ένα πραγματικό αίτημα).

Όπως και με το μοντέλο κειμένου GPT3, μερικά από τα αποτελέσματα εδώ είναι πιο επιτυχημένα και μερικά είναι λιγότερο επιτυχημένα, όπως το αίτημα του μοντέλου για παραγωγή εικόνων γυαλιών – μια λέξη που αντιπροσωπεύει τόσο τα “γυαλιά” όσο και τα “γυαλιά”. στα Αγγλικά – σε ένα τραπέζι οδήγησε το μοντέλο να παράγει περίπου τις μισές εικόνες με δύο ποτήρια και οι μισές με γυαλιά.

Το μοντέλο μπορεί να παράγει, ανάλογα με το σχολαστικό αίτημά σας στο κείμενο, εικόνες που μοιάζουν με φωτογραφίες πραγματικών αντικειμένων, σχέδια των αντικειμένων που ζητάτε, emoji και ακόμη και βιτρό (αντικείμενα) – για όσους από εσάς θέλετε πραγματικά να δείτε πώς θα είναι μια εκκλησία με παράθυρο με φρούτα και λαχανικά σε διαφορετικά χρώματα.

Αποτυχία: αυτό είναι το ισραηλινό φαγητό σύμφωνα με το DALL-E | Εκτύπωση οθόνης

Μια μελιτζάνα και μια γάτα θα λάβουν μια μελιτζάνα

Οι ερευνητές πίσω από το DALL-E παρουσιάζουν έναν τεράστιο αριθμό επιλογών για να παίξουν με το μοντέλο, όπως η δυνατότητα παρουσίασης μιας φωτογραφίας και της ζητούν να τη μετατρέψει σε εικόνα, να δημιουργήσουν έπιπλα σε διαφορετικές διαμορφώσεις και ακόμη και να συνδεθούν δύο άσχετα στοιχεία, όπως η δημιουργία μιας μελιτζάνας (έτσι “μελιτζάνα”). ») Και μια ποικιλία από περίεργες και ενδιαφέρουσες επιλογές.

a

Το OpenAI λέει για τη νέα τους δημιουργία ότι «το GPT-3 έχει δείξει ότι η γλώσσα μπορεί να χρησιμοποιηθεί για να καθοδηγήσει ένα μεγάλο νευρωνικό δίκτυο για να εκτελέσει μια ποικιλία λειτουργιών δημιουργίας κειμένου. Η εικόνα GPT (ή DALL-E) δείχνει ότι το ίδιο νευρωνικό δίκτυο μπορεί επίσης να παράγει εικόνες υψηλής ποιότητας. Παρουσιάσαμε αυτά τα ευρήματα για να δείξουμε ότι η αλλαγή οπτικών ιδεών μέσω της γλώσσας είναι πρακτική. “

Με λίγα λόγια, στο OpenAI μας λένε ότι δεν χρειάζεται πλέον να σκάψουμε μέσα σε ένα μοντέλο, να πάρουμε την παράμετρο χρώματος και να την αλλάξουμε χειροκίνητα, ώστε να δημιουργήσουμε το ίδιο αντικείμενο σε διαφορετικά χρώματα ή το σχήμα του αντικειμένου στο ίδιο χρώμα – μπορείτε μόνο γράψτε το ό, τι θέλουμε και δεν παράγει κακή ποιότητα που πιθανότατα θα βελτιωθεί μόνο όταν μαθαίνετε περισσότερα.

Ορισμένες από τις εικόνες και τις εικόνες που παράγονται από το νέο μοντέλο OpenAI φαίνονται εντελώς παραληρητικές και δεν μπορούν πραγματικά να χρησιμοποιηθούν, αλλά ταυτόχρονα υπάρχουν αρκετές επιτυχίες που θα σας κάνουν να αναρωτιέστε αν είναι μια τεχνητή φωτογραφία ή εικόνα και όχι κάτι που παράγεται από ένα μοντέλο.

Το OpenAI μίλησε επίσης για το μέλλον του DALL-E σε μια ανάρτηση ιστολογίου στην οποία αποκάλυψαν το μοντέλο με μια ενδιαφέρουσα δήλωση. Οι ερευνητές έγραψαν ότι “στο μέλλον σκοπεύουμε να αναλύσουμε πώς μοντέλα όπως το DALL-E σχετίζονται με κοινωνικά ζητήματα, όπως ο οικονομικός αντίκτυπος στις εργασιακές διαδικασίες και τα διαφορετικά επαγγέλματα, η πιθανή μεροληψία του μοντέλου και οι ηθικές προκλήσεις που προκύπτουν από τη χρήση αυτού τεχνολογίες “.




Θέλετε να λαμβάνετε όλες τις τεχνολογικές ενημερώσεις μόλις συμβούν;


Θέλετε να λαμβάνετε όλες τις τεχνολογικές ενημερώσεις μόλις συμβούν;
Εγγραφείτε τώρα στο κανάλι τηλεγράφων μας


Oshri Alexelsi

Ο φίλος της γειτονιάς σας. Έχετε μια τεχνολογική ιστορία; Μίλα μου: [email protected]

READ  Ένας κρυμμένος πόλεμος μεταξύ του Elon Musk και του Mark Zuckerberg - Erm News

We will be happy to hear your thoughts

Leave a reply

Vidcase