ხელოვნური ინტელექტის პროგრამა DeepSeek R1-ის გამოჩენამ იანვარში საფონდო ბირჟაზე აქციების გაყიდვა გამოიწვია. ახლა კი, ჩიპების გიგანტი Nvidia, რომელიც ხელოვნური ინტელექტის დამუშავების სფეროში დომინანტი ძალაა, ცდილობს, DeepSeek-ის მიერ წარმოდგენილი იაფი ხელოვნური ინტელექტის ეკონომიკის ცენტრში მოექცეს.
კომპანია Nvidia-ს თანადამფუძნებელმა და აღმასრულებელმა დირექტორმა, ჯენსენ ჰუანგმა, სან ხოსეში გამართულ კონფერენციაზე განაცხადა, რომ კომპანიის Blackwell-ის ჩიპებს შეუძლიათ DeepSeek R1-ის მნიშვნელოვნად დაჩქარება.
Nvidia აცხადებს, რომ მის GPU ჩიპებს შეუძლიათ DeepSeek R1-ის გამტარუნარიანობის 30-ჯერ გაზრდა მონაცემთა ცენტრში, რაც იზომება წამში დამუშავებული ტოკენების რაოდენობით. ამის მიღწევა შესაძლებელია ახალი ღია კოდის პროგრამული უზრუნველყოფის, Nvidia Dynamo-ს გამოყენებით.
Nvidia-ს წარმომადგენლის თქმით, Dynamo-ს შეუძლია ამ უპირატესობის გამოყენება და DeepSeek-ის მსგავსი მოდელებისთვის იმავე არქიტექტურაში, GPU-ების იგივე რაოდენობით 30-ჯერ მეტი წარმადობის უზრუნველყოფა.
Dynamo პროგრამული უზრუნველყოფა, რომელიც უკვე ხელმისაწვდომია, დასკვნის სამუშაოებს ანაწილებს 1000-მდე Nvidia GPU ჩიპზე. სამუშაოს პარალელურად შესრულებით, მანქანური დროის ერთ წამში მეტი სამუშაოს შესრულებაა შესაძლებელი.
შედეგად, დასკვნის ამოცანისთვის, რომლის ფასიც მილიონ ტოკენზე 1 დოლარია, ყოველ წამში მეტი ტოკენის დამუშავებაა შესაძლებელი, რაც GPU-ების მომწოდებელი სერვისების შემოსავალს ზრდის.
სერვისის პროვაიდერებს შეუძლიათ DeepSeek-ზე მეტი მომხმარებლის მოთხოვნის დამუშავება, ან ერთი მომხმარებლისთვის მეტი დამუშავების დათმობა და "პრემიუმ" სერვისში მეტი თანხის გადახდა.
Nvidia-ს ტერმინი "ხელოვნური ინტელექტის ფაბრიკა" აღნიშნავს მსხვილ სერვისებს, რომლებიც კომპანიის ჩიპების, პროგრამული უზრუნველყოფისა და თაროებზე დაფუძნებული აღჭურვილობის გამოყენებით ხელოვნური ინტელექტის მძიმე სამუშაოებს ასრულებენ.
ხელოვნური ინტელექტის დასკვნისთვის მეტი ჩიპის გამოყენების პერსპექტივა (და შესაბამისად, ბიზნესის ზრდა) არის Nvidia-ს პასუხი ინვესტორების შეშფოთებაზე, რომ DeepSeek-ს შეუძლია შეამციროს თითოეული მოთხოვნისთვის საჭირო დამუშავების რაოდენობა, რაც საერთო ჯამში ნაკლები გამოთვლითი სიმძლავრის გამოყენებას გამოიწვევს.
Dynamo-ს Blackwell-თან გამოყენებით, Nvidia-ს ფლაგმანი AI GPU-ს ამჟამინდელი მოდელით, Dynamo პროგრამულ უზრუნველყოფას შეუძლია AI მონაცემთა ცენტრების მიერ 50-ჯერ მეტი შემოსავლის გამომუშავება, ვიდრე ძველი Hopper მოდელით.
Nvidia-მ HuggingFace-ზე DeepSeek R1-ის საკუთარი ვერსიაც გამოაქვეყნა. Nvidia-ს ვერსია ამცირებს R1-ის მიერ ცვლადების მანიპულირებისთვის გამოყენებული ბიტების რაოდენობას "FP4"-მდე, ანუ მცურავი მძიმით ოთხ ბიტამდე, რაც სტანდარტული მცურავი მძიმით 32 ან B-float 16-ისთვის საჭირო გამოთვლების ნაწილია.
Blackwell-ის უახლესი ვერსია, "Ultra", რომელიც შოუზე წარადგინეს, აუმჯობესებს არსებული Blackwell 200-ის სხვადასხვა ასპექტს, როგორიცაა DRAM მეხსიერების გაზრდა 192 გბ HBM3e მაღალი გამტარუნარიანობის მეხსიერებიდან 288 გბ-მდე.
Nvidia-ს Grace CPU ჩიპთან ერთად, კომპანიის NVL72 თაროზე დაფუძნებულ კომპიუტერში შესაძლებელია 72 Blackwell Ultra-ს აწყობა. სისტემა გაზრდის დასკვნის წარმადობას FP4-ზე 50%-ით Grace-Blackwell 200 ჩიპებზე დაფუძნებულ არსებულ NVL72-თან შედარებით.
გსურთ კომენტარის დატოვება?
კომენტარის დასატოვებლად საჭიროა ავტორიზაცია
შესვლა რეგისტრაციაკომენტარები არ არის
იყავით პირველი, ვინც დატოვებს კომენტარს