კატეგორიები

CardanoNFTავტოარქიტექტურაახალი ამბებიახალიამბებიბიზნესიგანათლებაგარემოგარემო და ბუნებაგარემოს დაცვაგართობაეკონომიკაეკონომიკა/ბიზნესიზოგადითავგადასავალითამაშებიიარაღიისტორიაკოსმოსიკრიმინალიკრიპტოკრიპტოვალუტაკრიპტოსამყაროკულინარიაკულინარია რეცეპტებიკულტურაკულტურა/მედიამედიამეცნიერებამოგზაურობამოდამომხმარებელიმსოფლიომსოფლიო ამბებიმსოფლიო პოლიტიკანადირობაპოლიტიკაპროდუქტის მიმოხილვარობოტექნიკასაბრძოლო მასალასაზოგადოებასამართალისამხედროსილამაზესპორტისტარტაპებისტილისხვადასხვატექნიკატექნოლოგიატექნოლოგიებიტექნოლოგიები/ონლაინ კომერციატრანსპორტიტურიზმიუსაფრთხოებაფინანსებიფიტნესიშოუბიზნესიცხოვრებაწიგნებიხელოვნებახელოვნური ინტელექტიჯანდაცვაჯანმრთელობა

DeepSeek V3-0324 ლიდერობს ღია კოდის ხელოვნური ინტელექტის მოდელებს შორის

ტექნოლოგია ხელოვნური
DeepSeek V3-0324 ლიდერობს ღია კოდის ხელოვნური ინტელექტის მოდელებს შორის

DeepSeek V3-0324 ხელოვნური ინტელექტის ანალიზის ინდექსში არარეზონირებად მოდელებს შორის უმაღლესი მაჩვენებლის მქონე მოდელი გახდა, რაც მნიშვნელოვანი წინსვლაა ღია კოდის ხელოვნური ინტელექტის სფეროში. ახალმა მოდელმა საორიენტაციო ნიშნულში შვიდი ქულით გაუსწრო ისეთ საკუთრების მოდელებს, როგორებიცაა Google-ის Gemini 2.0 Pro, Anthropic-ის Claude 3 Sonnet და Meta-ს Llama 3 70B. მართალია, V3-0324 ჩამორჩება რეზონირების მოდელებს, მათ შორის DeepSeek-ის საკუთარ R1-სა და OpenAI-სა და Alibaba-ს შეთავაზებებს, ეს მიღწევა ხაზს უსვამს ღია კოდის გადაწყვეტილებების მზარდ სიცოცხლისუნარიანობას ლატენტურობისადმი მგრძნობიარე აპლიკაციებში, სადაც მყისიერი რეაგირება კრიტიკულად მნიშვნელოვანია.

DeepSeek V3-0324 წარმოადგენს ღია კოდის ხელოვნური ინტელექტის ახალ ერას. არარეზონირებადი მოდელები – რომლებიც პასუხებს მყისიერად, „აზროვნების“ ფაზების განხილვის გარეშე გასცემენ – აუცილებელია რეალურ დროში გამოყენების შემთხვევებისთვის, როგორიცაა ჩეთბოტები, მომხმარებელთა მომსახურების ავტომატიზაცია და უშუალო თარგმანი. DeepSeek-ის უახლესი ვერსია ამჟამად ამ აპლიკაციებისთვის სტანდარტს ადგენს და წამყვან საკუთრების ინსტრუმენტებსაც კი აღემატება. „ეს არის პირველი შემთხვევა, როდესაც ღია წონის მოდელი არარეზონირებად მოდელებს შორის ლიდერია, რაც მნიშვნელოვანი ეტაპია ღია კოდისთვის“, – აცხადებენ ხელოვნური ანალიზიდან.

მოდელის მუშაობა მას საკუთრების რეზონირების მოდელებთან აახლოებს, თუმცა ეს უკანასკნელი კვლავ აღემატება რთული პრობლემების გადაჭრაში. DeepSeek V3-0324 ინარჩუნებს 2024 წლის დეკემბრის წინამორბედის სპეციფიკაციების უმეტესობას, მათ შორის: 128k კონტექსტის ფანჯარა (შეზღუდულია 64k-მდე DeepSeek-ის API-ის საშუალებით); 671 მილიარდი ჯამური პარამეტრი, რაც FP8 სიზუსტისთვის 700 გბ-ზე მეტ GPU მეხსიერებას მოითხოვს; 37 მილიარდი აქტიური პარამეტრი; მხოლოდ ტექსტური ფუნქციონალობა (მულტიმოდალური მხარდაჭერა არ არის); MIT ლიცენზია. „ეს ჯერ კიდევ არ არის ის, რისი გაშვებაც სახლის პირობებში შეგიძლიათ!“ – ხუმრობენ ხელოვნური ანალიზიდან და ხაზს უსვამენ მის საწარმოო დონის ინფრასტრუქტურის მოთხოვნებს.

ღია კოდის ხელოვნური ინტელექტი იმპულსს იძენს. მიუხედავად იმისა, რომ საკუთრების რეზონირების მოდელები, როგორიცაა DeepSeek R1, ინტელექტის უფრო ფართო ინდექსში დომინირებას ინარჩუნებენ, მათ შორის სხვაობა მცირდება. სამი თვის წინ DeepSeek V3 თითქმის შეესაბამებოდა Anthropic-ისა და Google-ის საკუთრების მოდელებს, მაგრამ ვერ აჯობა მათ. დღეს განახლებული V3-0324 არა მხოლოდ ღია კოდის ალტერნატივებს ლიდერობს, არამედ ყველა საკუთრების არარეზონირებად კონკურენტსაც აღემატება. „ეს გამოშვება, შეიძლება ითქვას, R1-ზე უფრო შთამბეჭდავია“, – აცხადებენ ხელოვნური ანალიზიდან.

DeepSeek-ის პროგრესი ხელოვნური ინტელექტის სექტორში ცვლილებაზე მიანიშნებს, სადაც ღია კოდის ფრეიმვორკები სულ უფრო ხშირად ეჯიბრებიან დახურულ სისტემებს. დეველოპერებისა და საწარმოებისთვის, MIT-ლიცენზირებული V3-0324 მძლავრ, ადაპტირებად ინსტრუმენტს გვთავაზობს – თუმცა, მისმა გამოთვლითმა ხარჯებმა შესაძლოა ხელმისაწვდომობა შეზღუდოს. „DeepSeek ახლა არარეზონირებადი ღია წონის მოდელების საზღვარს წარმართავს“, – აცხადებენ ხელოვნური ანალიზიდან. R2-ის მოლოდინში, საზოგადოება ხელოვნური ინტელექტის მუშაობაში კიდევ ერთ პოტენციურ ნახტომს ელის. (ფოტო: Paul Hanaoka)

იხილეთ ასევე: Hugging Face ღია კოდზე ფოკუსირებისკენ მოუწოდებს ხელოვნური ინტელექტის სამოქმედო გეგმაში. გსურთ გაიგოთ მეტი ხელოვნური ინტელექტისა და დიდი მონაცემების შესახებ ინდუსტრიის ლიდერებისგან? იხილეთ AI & Big Data Expo, რომელიც ტარდება ამსტერდამში, კალიფორნიასა და ლონდონში. ყოვლისმომცველი ღონისძიება სხვა წამყვან ღონისძიებებთან ერთად იმართება, მათ შორის Intelligent Automation Conference, BlockX, Digital Transformation Week და Cyber Security & Cloud Expo. გამოიკვლიეთ TechForge-ის მიერ მხარდაჭერილი სხვა მომავალი საწარმოო ტექნოლოგიების ღონისძიებები და ვებინარები აქ.

კომენტარები