LG-ის EXAONE Deep: ხელოვნური ინტელექტი მათემატიკის, მეცნიერებისა და კოდირების ოსტატი

LG AI Research-მა წარმოადგინა EXAONE Deep, მსჯელობის მოდელი, რომელიც განსაკუთრებულ წარმატებას აღწევს კომპლექსური პრობლემების გადაჭრაში ისეთ სფეროებში, როგორიცაა მათემატიკა, მეცნიერება და კოდირება. კომპანიამ ყურადღება გაამახვილა მოწინავე მსჯელობის მოდელების შექმნის გლობალურ გამოწვევაზე და აღნიშნა, რომ ამჟამად, მხოლოდ რამდენიმე ორგანიზაციაა ჩართული ამ რთულ სფეროში ფუნდამენტური მოდელების შექმნით. EXAONE Deep მიზნად ისახავს კონკურენცია გაუწიოს ამ ლიდერ მოდელებს და წარმოაჩინოს მსჯელობის უნარის კონკურენტული დონე.

LG AI Research-მა ძალისხმევა მიმართა EXAONE Deep-ის მსჯელობის შესაძლებლობების მნიშვნელოვნად გაუმჯობესებაზე ძირითად სფეროებში. მოდელი ასევე გამოირჩევა ცოდნის გაგებისა და გამოყენების ძლიერი უნარით საგნების ფართო სპექტრში. LG AI Research-ის მიერ გამოქვეყნებული მონაცემები შთამბეჭდავია:

მათემატიკა: EXAONE Deep 32B მოდელმა კონკურენტ მოდელს აჯობა, მიუხედავად იმისა, რომ მისი ზომის მხოლოდ 5%-ს შეადგენდა, მომთხოვნი მათემატიკის ეტალონში. გარდა ამისა, 7.8B და 2.4B ვერსიებმა პირველი ადგილები დაიკავეს ყველა ძირითად მათემატიკურ ეტალონში მათი შესაბამისი მოდელის ზომებისთვის.

მეცნიერება და კოდირება: ამ სფეროებში EXAONE Deep-ის მოდელებმა (7.8B და 2.4B) ასევე მოიპოვეს პირველი ადგილები ყველა ძირითად ეტალონში.

MMLU (Massive Multitask Language Understanding): 32B მოდელმა მიაღწია 83.0 ქულას MMLU-ს ეტალონში, რაც, LG AI Research-ის მტკიცებით, საუკეთესო მაჩვენებელია ადგილობრივ კორეულ მოდელებს შორის.

EXAONE Deep 32B მოდელის შესაძლებლობებმა უკვე მოიპოვა საერთაშორისო აღიარება. მისი გამოშვებიდან მალევე, ის შევიდა აშშ-ში დაფუძნებული არაკომერციული კვლევითი ორგანიზაციის Epoch AI-ს “მნიშვნელოვანი AI მოდელების” სიაში. ეს ნუსხა EXAONE Deep-ს მის წინამორბედთან, EXAONE 3.5-თან ერთად აყენებს, რითაც LG არის ერთადერთი კორეული კომპანია, რომლის მოდელებიც ბოლო ორი წლის განმავლობაში ამ პრესტიჟულ სიაშია წარმოდგენილი.

მათემატიკური ოსტატობა EXAONE Deep-მა აჩვენა განსაკუთრებული მათემატიკური მსჯელობის უნარები მისი სხვადასხვა მოდელის ზომებში (32B, 7.8B და 2.4B). 2025 წლის სასწავლო წლის მათემატიკის სასწავლო გეგმაზე დაფუძნებულ შეფასებებში, სამივე მოდელმა აჯობა მსგავსი ზომის გლობალურ მსჯელობის მოდელებს. 32B მოდელმა მიაღწია 94.5 ქულას ზოგადი მათემატიკის კომპეტენციის ტესტში და 90.0 ქულას ამერიკის საინვენტარო მათემატიკის გამოცდაში (AIME) 2024, რომელიც არის საკვალიფიკაციო გამოცდა აშშ-ს მათემატიკურ ოლიმპიადაზე. AIME 2025-ში, 32B მოდელმა DeepSeek-R1-ის (მნიშვნელოვნად დიდი 671B მოდელი) შესრულებას მიაღწია. ეს შედეგი ასახავს EXAONE Deep-ის ეფექტურ სწავლას და ძლიერ ლოგიკურ მსჯელობის შესაძლებლობებს, განსაკუთრებით რთული მათემატიკური ამოცანების გადაჭრისას. უფრო მცირე 7.8B და 2.4B მოდელებმა ასევე მიაღწიეს საუკეთესო რეიტინგებს მსუბუქი და მოწყობილობაზე დამონტაჟებული მოდელების ძირითად ეტალონებში, შესაბამისად. 7.8B მოდელმა დააგროვა 94.8 ქულა MATH-500-ის ეტალონში და 59.6 AIME 2025-ში, ხოლო 2.4B მოდელმა მიაღწია 92.3 და 47.9 ქულას იმავე შეფასებებში.

მეცნიერებისა და კოდირების სრულყოფილება EXAONE Deep-მა ასევე გამოავლინა შესანიშნავი შესაძლებლობები პროფესიული მეცნიერული მსჯელობისა და პროგრამული კოდირების კუთხით. 32B მოდელმა დააგროვა 66.1 ქულა GPQA Diamond ტესტში, რომელიც აფასებს პრობლემების გადაჭრის უნარებს დოქტორანტურის დონის ფიზიკაში, ქიმიასა და ბიოლოგიაში. LiveCodeBench შეფასებაში, რომელიც ზომავს კოდირების ცოდნას, მოდელმა მიაღწია 59.5 ქულას, რაც მიუთითებს მის პოტენციალზე ამ დარგის მაღალი დონის გამოყენებისთვის. 7.8B და 2.4B მოდელებმა განაგრძეს ძლიერი შესრულების ტენდენცია და ორივემ დაიკავა პირველი ადგილი GPQA Diamond-ისა და LiveCodeBench-ის ეტალონებში მათი შესაბამისი ზომის კატეგორიებში. ეს მიღწევა ეფუძნება EXAONE 3.5 2.4B მოდელის წარმატებას, რომელიც ადრე ლიდერობდა Hugging Face-ის LLM Readerboard-ში ზღვრული გამოთვლების განყოფილებაში.

ზოგადი ცოდნის გაუმჯობესება სპეციალიზებული მსჯელობის შესაძლებლობების გარდა, EXAONE Deep-მა ასევე აჩვენა გაუმჯობესებული შესრულება ზოგადი ცოდნის გაგებაში. 32B მოდელმა მიაღწია შთამბეჭდავ 83.0 ქულას MMLU ეტალონში, რაც მას აქცევს საუკეთესო ადგილობრივ მოდელად ამ ყოვლისმომცველ შეფასებაში. ეს მიუთითებს, რომ EXAONE Deep-ის მსჯელობის გაუმჯობესება სცილდება კონკრეტულ სფეროებს და ხელს უწყობს სხვადასხვა საგნების უფრო ფართო გაგებას.

LG AI Research-ს მიაჩნია, რომ EXAONE Deep-ის მსჯელობის წინსვლა წარმოადგენს ნახტომს მომავლისკენ, სადაც AI-ს შეუძლია გადაჭრას უფრო და უფრო რთული პრობლემები და ხელი შეუწყოს ადამიანის ცხოვრების გამდიდრებასა და გამარტივებას უწყვეტი კვლევისა და ინოვაციების გზით.

აგრეთვე იხილეთ: Baidu კონკურენტ AI მოდელებს ERNIE 4.5-ითა და ERNIE X1-ით ანაცვლებს

გსურთ მეტი გაიგოთ AI-სა და ინდუსტრიის ლიდერებისგან დიდი მონაცემების შესახებ? იხილეთ AI & Big Data Expo, რომელიც ტარდება ამსტერდამში, კალიფორნიასა და ლონდონში. ყოვლისმომცველი ღონისძიება განთავსებულია სხვა წამყვან ღონისძიებებთან ერთად, მათ შორის, Intelligent Automation Conference, BlockX, Digital Transformation Week და Cyber Security & Cloud Expo. გაეცანით TechForge-ის მიერ მხარდაჭერილ სხვა მომავალ საწარმოთა ტექნოლოგიების ღონისძიებებსა და ვებინარებს აქ.

კატეგორიები

LG-ის EXAONE Deep: ხელოვნური ინტელექტი მათემატიკის, მეცნიერებისა და კოდირების ოსტატი

კომენტარები

მსგავსი სიახლეები

Genesis X Gran Equator SUV-ის კონცეფცია: დაფაზე განლაგებული წრიული მაჩვენებლები,...

ხელოვნური ინტელექტის ხმოვანი აგენტი მილანის დიზაინის კვირეულზე ხავსით დაფარულ სა...

Smashing - Goodreads-ის დამფუძნებლის აპლიკაცია - დაიხურა

Rippling-ი Revolut-ს Deel-ის სავარაუდო ჯაშუშისთვის თანხის გადამხდელის დასახელება...

აი, როგორ დაწერენ ტოპ 5 AI აპლიკაცია “თეთრი ლოტოსის” მე-4 სეზონს

სამეფოს ციფრული ტრანსფორმაცია Smart Data & AI Summit-ზე

კატეგორიები

LG-ის EXAONE Deep: ხელოვნური ინტელექტი მათემატიკის, მეცნიერებისა და კოდირების ოსტატი

კომენტარები

გსურთ კომენტარის დატოვება?

მსგავსი სიახლეები

Genesis X Gran Equator SUV-ის კონცეფცია: დაფაზე განლაგებული წრიული მაჩვენებლები,...

ხელოვნური ინტელექტის ხმოვანი აგენტი მილანის დიზაინის კვირეულზე ხავსით დაფარულ სა...

Smashing - Goodreads-ის დამფუძნებლის აპლიკაცია - დაიხურა

Rippling-ი Revolut-ს Deel-ის სავარაუდო ჯაშუშისთვის თანხის გადამხდელის დასახელება...

აი, როგორ დაწერენ ტოპ 5 AI აპლიკაცია “თეთრი ლოტოსის” მე-4 სეზონს

სამეფოს ციფრული ტრანსფორმაცია Smart Data & AI Summit-ზე