როგორც ჩანს, ჩინური ხელოვნური ინტელექტის სტარტაპი DeepSeek კვლავ ყურადღების ცენტრშია. ამჯერად, კომპანიამ განაახლა თავისი V3 მოდელი, რომელიც დეკემბერში გამოვიდა. ახალი ვერსია, სახელწოდებით V3-0324, ოფიციალურად გამოცხადდა სამშაბათს, თუმცა მომხმარებლებმა მოდელი HuggingFace-ზე ერთი დღით ადრე შეამჩნიეს.
იანვარში გამოშვებული DeepSeek-ის საუკეთესო მოდელის, R1-ის მსგავსად, განახლებული ვერსიაც ღია კოდის პრინციპით ვრცელდება (მისი წონები საჯაროა, თუმცა არა მისი რეალური კოდი) MIT ლიცენზიით.
DeepSeek-ის განცხადებით, განახლება აუმჯობესებს ვებ-დეველოპმენტის კოდირების უნარებს და მნიშვნელოვნად ზრდის ლოგიკური მსჯელობის შესაძლებლობებს. თუმცა, კომპანია კვლავ გვირჩევს მის გამოყენებას ნაკლებად კომპლექსური ამოცანებისთვის. R1 რჩება კომპანიის საუკეთესო მოდელად ლოგიკური მსჯელობის კუთხით.
DeepSeek-ის განცხადებით, V3-ის განახლება აუმჯობესებს მუშაობას ინდუსტრიის სტანდარტულ საზომებში, განსაკუთრებით AIME (American Invitational Mathematics Examination) მათემატიკის ტესტში, სადაც თითქმის 20 ქულით უკეთესი შედეგი აჩვენა.
მიუხედავად იმისა, რომ საზომები მოდელების უმეტესობისთვის ძალიან მარტივი გახდა, AIME კვლავ უფრო რთულად ითვლება.
DeepSeek-ის ინფორმაციით, სხვა გაუმჯობესებებს შორისაა „გაუმჯობესებული“ წერის სტილი და ხარისხი, განსაკუთრებით გრძელი ტექსტებისთვის. ზოგიერთი Reddit-ის მომხმარებელი ვარაუდობს, რომ განახლების გამოშვება შეიძლება R2-ის მოახლოებას წინასწარმეტყველებდეს, რომელიც R1-ის მსგავსად, მნიშვნელოვან ცვლილებებს მოიტანს.
V3-0324-ზე წვდომა შესაძლებელია HuggingFace-ის ან DeepSeek-ის ვებსაიტისა და აპლიკაციის საშუალებით. თუმცა, მნიშვნელოვანია უსაფრთხოების საკითხებისა და მომხმარებლის კონფიდენციალურობის გათვალისწინება. ჯერჯერობით უცნობია, დაამატა თუ არა DeepSeek-მა რაიმე უსაფრთხოების ფენა V3-0324-ში, რადგან V3 და R1 ძალიან ადვილად გატეხვადი აღმოჩნდა.
გსურთ კომენტარის დატოვება?
კომენტარის დასატოვებლად საჭიროა ავტორიზაცია
შესვლა რეგისტრაციაკომენტარები არ არის
იყავით პირველი, ვინც დატოვებს კომენტარს