კატეგორიები

CardanoNFTავტოარქიტექტურაახალი ამბებიახალიამბებიბიზნესიგანათლებაგარემოგარემო და ბუნებაგარემოს დაცვაგართობაეკონომიკაეკონომიკა/ბიზნესიზოგადითავგადასავალითამაშებიიარაღიისტორიაკოსმოსიკრიმინალიკრიპტოკრიპტოვალუტაკრიპტოსამყაროკულინარიაკულინარია რეცეპტებიკულტურაკულტურა/მედიამედიამეცნიერებამოგზაურობამოდამომხმარებელიმსოფლიომსოფლიო ამბებიმსოფლიო პოლიტიკანადირობაპოლიტიკაპროდუქტის მიმოხილვარობოტექნიკასაბრძოლო მასალასაზოგადოებასამართალისამხედროსილამაზესპორტისტარტაპებისტილისხვადასხვატექნიკატექნოლოგიატექნოლოგიებიტექნოლოგიები/ონლაინ კომერციატრანსპორტიტურიზმიუსაფრთხოებაფინანსებიფიტნესიშოუბიზნესიცხოვრებაწიგნებიხელოვნებახელოვნური ინტელექტიჯანდაცვაჯანმრთელობა

ChatGPT-მ მნიშვნელოვნად გააუმჯობესა გამოსახულების გენერირების ფუნქცია

ტექნოლოგია ხელოვნური ინტელექტი
ChatGPT-მ მნიშვნელოვნად გააუმჯობესა გამოსახულების გენერირების ფუნქცია

OpenAI-მ განაგრძო ChatGPT-ის შესაძლებლობების გაფართოება, დაამატა ხმოვანი ასისტენტი, ფაილებისა და გამოსახულებების გაგების ფუნქცია, კვლევის გაუმჯობესებული ინსტრუმენტები და სხვა. თუმცა, აქამდე აშკარად აკლდა ერთი რამ - მართლაც ეფექტური გამოსახულების გენერატორი.

სულ ახლახან, OpenAI-მ წარმოადგინა 4o გამოსახულების გენერაციის მოდელი. ეს მოდელი მნიშვნელოვნად აღემატება DALL-E-ს, რომელსაც კომპანია აქამდე იყენებდა, თუმცა მუშაობის სისწრაფით ჩამოუვარდება. ის წარმატებით უმკლავდება რთულ მოთხოვნებს, როგორიცაა რეალისტური გამოსახულებების შექმნა და, რაც ყველაზე შთამბეჭდავია, ტექსტის ზუსტად გენერირება.

მაგალითად, პრეზენტაციის დროს, OpenAI-ს აღმასრულებელმა დირექტორმა, სემ ალტმანმა, მკვლევარებთან ერთად, 4o-ს დაავალა შეექმნა ფოტო კონკრეტული ხედვის კუთხიდან, ფლაერით, რომელზეც ბევრი ტექსტი იყო განთავსებული. რამდენიმე წამის შემდეგ, მოდელმა სწორად განსაზღვრა კინემატოგრაფიული მიმართულება და ზუსტად დაბეჭდა მთელი ტექსტი.

ამ მოდელს ასევე აქვს მრავალი სხვა შესაძლებლობა, რაც OpenAI-ს წინა გამოსახულების გენერატორს არ გააჩნდა, როგორიცაა გამოსახულების მითითება, რომლის გამოყენებაც შესაძლებელია სურათის ახალი ვერსიის შესაქმნელად (მაგალითად, ანიმეს სტილში ან სელფის სახით), ან როგორც შთაგონება სრულიად ახალი ნამუშევრისთვის.

ეს ინსტრუმენტი შექმნილია იმისთვის, რომ ინტეგრირდეს კრეატიულ პროცესებში, ამიტომ მას შეუძლია შექმნას გამოსახულებები გამჭვირვალე ფონზე, გამოიყენოს კონკრეტული ფერები HEX კოდებიდან ან გამოიყენოს ჩეთბოტის მოწინავე საკომუნიკაციო შესაძლებლობები გენერირების პროცესში. მაგალითად, როდესაც დემონსტრაციის დროს სთხოვეს ფოტოში "იუმორი" დაემატებინა, მან ტექსტი შეიტანა, რომელიც ამ კრიტერიუმს აკმაყოფილებდა.

ვინაიდან გამოსახულების გენერატორი ხელმისაწვდომია ChatGPT-ში, მომხმარებლებს ასევე შეუძლიათ სურათების დახვეწა მრავალჯერადი საუბრის საშუალებით. ეს აადვილებს სურათების კორექტირებას და საშუალებას აძლევს მოდელს გამოიყენოს წინა თაობების კონტექსტი ახალი სურათების შესაქმნელად. ვინაიდან GPT-4o-ს აქვს წვდომა ინტერნეტზე, ეს კონტექსტი ასევე ემატება სურათების შექმნას.

კომპანიის განცხადებით, GPT-4o-ს გამოსახულების გენერაციას ასევე აქვს ძლიერი ინსტრუქციის დაცვა. მას შეუძლია 10-20-მდე სხვადასხვა ობიექტის დამუშავება, რაც იმას ნიშნავს, რომ შეგიძლიათ მოითხოვოთ ერთდროულად დიდი რაოდენობის ობიექტების გენერირება.

გამოსახულების გენერატორის კიდევ ერთი ახალი ასპექტი არის ის, რომ მას ახლა შეუძლია უფრო სარისკო კონტენტის შექმნა, რაც ელონ მასკის Grok მოდელისთვის არის დამახასიათებელი. პრეზენტაციის დროს ალტმანმა განაცხადა, რომ თქვენ შეძლებთ GPT-4o-ს გამოსახულების გენერირების გამოყენებას შეურაცხმყოფელი კონტენტის შესაქმნელად "გონივრულ ფარგლებში".

მოდელის შესახებ ბლოგპოსტში აღნიშნულია, რომ ის დაბლოკავს მოთხოვნებს, რომლებიც არღვევს კონტენტის პოლიტიკას, მათ შორის ბავშვთა სექსუალური ძალადობის მასალებსა და სექსუალურ დიფფეიკებს. კიდევ ერთი დამცავი მექანიზმი არის შეზღუდვა იმისა, თუ რა შეიძლება შეიქმნას, როდესაც კონტექსტში რეალური ადამიანები არიან, მათ შორის "განსაკუთრებით მკაცრი დაცვა სიშიშვლისა და გრაფიკული ძალადობისგან".

განახლებული გამოსახულების გენერირების ფუნქციები უკვე ხელმისაწვდომია ChatGPT-სა და Sora-ში. ყველა მომხმარებელს, მათ შორის უფასო მომხმარებლებსაც, ექნებათ წვდომა GPT-4o-ზე.

კომენტარები