Gemini 2.0-ის გამოშვებიდან და DeepSeek-ის აღზევებიდან სულ რამდენიმე თვის შემდეგ, Google-მა გამოაცხადა თავისი „ყველაზე ინტელექტუალური მოდელი დღემდე“, Gemini 2.5, რომელსაც შეუძლია მსჯელობა და გამოირჩევა გაუმჯობესებული წარმადობითა და სიზუსტით.
Gemini 2.5 გამოდის Google-ის მიერ მისი წინა ყველაზე ინტელექტუალური მოდელის ოჯახის, Gemini 2.0-ის გამოშვებიდან სამი თვის შემდეგ, რომელმაც მსჯელობა და აგენტური გამოყენების შემთხვევები შემოიტანა. ეს ახალი მოდელი ხელმისაწვდომია როგორც Gemini 2.5 Pro (ექსპერიმენტული) Google-ის AI Studio-ში და Gemini Advanced-ის მომხმარებლებისთვის Gemini-ის ჩატის ინტერფეისზე. ის მალე ხელმისაწვდომი იქნება Vertex AI-ზეც.
კორაი კავუკჩუოღლუმ, Google DeepMind-ის CTO-მ, ბლოგპოსტში განაცხადა, რომ Gemini 2.5 წარმოადგენს შემდეგ ნაბიჯს Google-ის მიზნისკენ, რომ „ხელოვნური ინტელექტი უფრო ჭკვიანი და მსჯელობის უფრო მეტად უნარიანი გახადოს“.
„ახლა, Gemini 2.5-ით, ჩვენ მივაღწიეთ შესრულების ახალ დონეს მნიშვნელოვნად გაუმჯობესებული საბაზისო მოდელის გაუმჯობესებულ პოსტ-ტრენინგთან კომბინაციით“, - წერს კავუკჩუოღლუ. „მომავალში, ჩვენ ამ აზროვნების შესაძლებლობებს პირდაპირ ჩვენს ყველა მოდელში ვაშენებთ, რათა მათ უფრო რთული პრობლემების გადაჭრა და კიდევ უფრო ქმედუნარიანი, კონტექსტზე მცოდნე აგენტების მხარდაჭერა შეძლონ“.
მეტი კონტექსტი და გაგება
Gemini 2.0-ისა და Gemini 2.0 Flash Thinking-ის მსგავსად, Gemini 2.5 Pro „ფიქრობს“ სანამ პასუხობს. ახალ მოდელს შეუძლია მულტიმოდალური შეყვანის დამუშავება ტექსტიდან, აუდიოდან, სურათებიდან, ვიდეოებიდან და დიდი მონაცემთა ნაკრებებიდან. Gemini 2.5 Pro-ს ასევე შეუძლია გაიგოს მთელი კოდის რეპოზიტორიები კოდირების პროექტებისთვის.
Gemini 2.5 Pro გთავაზობთ კონტექსტის ყველაზე დიდ ფანჯრებს, რაც ხელმისაწვდომია ექსპერიმენტული მოდელებისთვის Gemini-ზე. მას მოყვება 1 მილიონი ტოკენის კონტექსტის ფანჯარა, მაგრამ მალე 2 მილიონ ტოკენამდე გაფართოვდება. Google AI Studio-ს პროდუქტის მენეჯერმა, ლოგან კილპატრიკმა X-ზე გამოაქვეყნა, რომ Gemini 2.5 Pro არის „პირველი ექსპერიმენტული მოდელი უფრო მაღალი სიჩქარის ლიმიტებით + ბილინგით“.
Google გეგმავს მალე გამოაქვეყნოს ფასები Gemini 2.5 მოდელებისთვის.
გაუმჯობესებული კოდირებისა და მსჯელობის შესრულება
Google-ის განცხადებით, მოდელი ლიდერობს მოწინავე მსჯელობის ბენჩმარკ ტესტებში. კომპანიამ განაცხადა, რომ Gemini 2.5 Pro „ლიდერობს მათემატიკისა და მეცნიერების ბენჩმარკებში, როგორიცაა GPQA და AIME 2025“. კავუკჩუოღლუმ თქვა, რომ მოდელმა ასევე დააგროვა „უახლესი 18.8% მოდელებს შორის ხელსაწყოების გამოყენების გარეშე Humanity’s Last Exam-ზე“, მონაცემთა ნაკრები, რომელიც მიზნად ისახავს ადამიანის ცოდნისა და მსჯელობის აღებას.
Gemini 2.5 Pro ასევე ძლიერად ასრულებს კოდირების ამოცანებს და კონკრეტულ ბენჩმარკებში Gemini 2.0-ზე უკეთესი შედეგი აჩვენა. Google-მა აღნიშნა, რომ ახალი მოდელი „გამოირჩევა ვიზუალურად მიმზიდველი ვებ აპლიკაციებისა და აგენტური კოდის აპლიკაციების შექმნით, კოდის ტრანსფორმაციასთან და რედაქტირებასთან ერთად“.
უფრო კონკურენტული ბაზარი
Gemini 2.5 Pro მსჯელობის მოდელების ბრძოლაში მნიშვნელოვნად შეცვლილ გარემოში შედის, ვიდრე Gemini 2.0 დეკემბერში შევიდა. DeepSeek-ის მსჯელობის დიდი ენობრივი მოდელის (LLM) DeepSeek-R1-ის გამოშვებამ აჩვენა, რომ ძლიერ მოდელებს შეუძლიათ წარმატებით იმუშაონ წვრთნისა და გამოთვლითი ღირებულების ფრაქციაში. გარდა ამისა, DeepSeek-მა აჩვენა, რომ ღია კოდის მოდელებს შეუძლიათ კონკურენცია გაუწიონ უფრო დახურული კოდის LLM-ებს, როგორიცაა OpenAI-ის o1 და o3 მოდელები.
DeepSeek-ის მუდმივად გაფართოებული მოდელის შეთავაზებების გარდა, Google-ს კონკურენცია OpenAI-ის მსჯელობის მოდელებთანაც უწევს. მიუხედავად იმისა, რომ OpenAI-ის უახლესი მოდელი იყო GPT-4.5 —არა მსჯელობის მოდელი—კომპანია მაინც მოსალოდნელია, რომ მალე შეიმუშავებს მეტ მსჯელობის მოდელს.
Gemini 2.5 არის Google-ის მეორე ახალი მოდელი ამ თვეში. მარტში კომპანიამ გამოუშვა თავისი მცირე ენობრივი მოდელის, Gemma 3-ის უახლესი ვერსია, რომელსაც ჰქონდა 128,000 ტოკენის კონტექსტის მოდელი და საუკეთესოდ გამოიყენებოდა მოძრავ მოწყობილობებში.
ასინეთა AI მიერ არის დამუსავებული.
გსურთ კომენტარის დატოვება?
კომენტარის დასატოვებლად საჭიროა ავტორიზაცია
შესვლა რეგისტრაციაკომენტარები არ არის
იყავით პირველი, ვინც დატოვებს კომენტარს