კატეგორიები

CardanoNFTავტოარქიტექტურაახალი ამბებიახალიამბებიბიზნესიგანათლებაგარემოგარემო და ბუნებაგარემოს დაცვაგართობაეკონომიკაეკონომიკა/ბიზნესიზოგადითავგადასავალითამაშებიიარაღიისტორიაკოსმოსიკრიმინალიკრიპტოკრიპტოვალუტაკრიპტოსამყაროკულინარიაკულინარია რეცეპტებიკულტურაკულტურა/მედიამედიამეცნიერებამოგზაურობამოდამომხმარებელიმსოფლიომსოფლიო ამბებიმსოფლიო პოლიტიკანადირობაპოლიტიკაპროდუქტის მიმოხილვარობოტექნიკასაბრძოლო მასალასაზოგადოებასამართალისამხედროსილამაზესპორტისტარტაპებისტილისხვადასხვატექნიკატექნოლოგიატექნოლოგიებიტექნოლოგიები/ონლაინ კომერციატრანსპორტიტურიზმიუსაფრთხოებაფინანსებიფიტნესიშოუბიზნესიცხოვრებაწიგნებიხელოვნებახელოვნური ინტელექტიჯანდაცვაჯანმრთელობა

ახალი, საწარმოს სპეციფიკური AI მეტყველების მოდელი: aiOla-ს Jargonic კონკურენტებზე უკეთესი ბიზნეს ლექსიკაში

ტექნოლოგია ხელოვნურიინტელექტი
ახალი, საწარმოს სპეციფიკური AI მეტყველების მოდელი: aiOla-ს Jargonic კონკურენტებზე უკეთესი ბიზნეს ლექსიკაში

მეტყველების ამოცნობის მოდელები ბოლო წლებში სულ უფრო ზუსტი გახდა. თუმცა, ისინი შესაძლოა იდეალურ პირობებში იყოს აგებული და შეფასებული - მშვიდი ოთახები, სუფთა აუდიო და ზოგადი დანიშნულების ლექსიკა. საწარმოებისთვის კი რეალურ სამყაროში აუდიო გაცილებით უფრო არეულია.

სწორედ ამ გამოწვევის მოგვარებას ისახავს მიზნად aiOla Jargonic-ის გამოშვებით, მისი ახალი ავტომატური მეტყველების ამოცნობის (ASR) სისტემით, რომელიც სპეციალურად საწარმოებისთვის არის შექმნილი. ისრაელის სტარტაპი Jargonic-ს დღეს წარადგენს.

Jargonic არის ახალი მეტყველებიდან ტექსტში გადამყვანი მოდელი, რომელიც შექმნილია სპეციალიზებული ჟარგონის, ფონური ხმაურისა და მრავალფეროვანი აქცენტების დასამუშავებლად, ვრცელი გადამზადებისა და დახვეწის გარეშე.

„ჩვენი მოდელი ფოკუსირებულია მეტყველების ამოცნობის სამ ძირითად გამოწვევაზე: ჟარგონი, ფონური ხმაური და აქცენტები“, - განაცხადა გილ ჰეცმა, aiOla-ს ხელოვნური ინტელექტის ვიცე-პრეზიდენტმა. „ჩვენ შევქმენით მოდელი, რომელიც ნულოვანი სწავლების მეთოდით გაიგებს კონკრეტული ინდუსტრიის ჟარგონს, გაუმკლავდება ხმაურიან გარემოს და მხარს უჭერს აქცენტების ფართო სპექტრს.“

Jargonic, რომელიც ახლა უკვე ხელმისაწვდომია API-ის საშუალებით aiOla-ს საწარმოთა პლატფორმაზე, პოზიციონირებულია, როგორც წარმოებისთვის მზა ASR გადაწყვეტა ისეთი ინდუსტრიების ბიზნესებისთვის, როგორიცაა წარმოება, ლოგისტიკა, ფინანსური მომსახურება და ჯანდაცვა.

aiOla-ს გუნდი. Credit: aiOla

პროდუქტიდან პირველადიდან AI-ზე პირველადზე გადასვლა

Jargonic-ის გამოშვება aiOla-ს ფოკუსირების ცვლილებას წარმოადგენს. კომპანიის ხელმძღვანელობის თქმით, გუნდმა გადააფასა მიდგომა, რათა პრიორიტეტი მიენიჭებინა AI კვლევასა და განვითარებას.

„როდესაც აქ მოვედი, დავინახე საოცარი პროდუქტის მქონე კომპანია, რომელსაც დიდი ინვესტიცია ჰქონდა ჩადებული მოწინავე AI შესაძლებლობებში, მაგრამ ძირითადად ცნობილი იყო იმით, რომ ეხმარებოდა ხალხს ფორმების შევსებაში“, - თქვა ასაფ ასბაგმა, aiOla-ს ტექნოლოგიებისა და პროდუქტების მთავარმა ოფიცერმა. „ჩვენ შევცვალეთ პერსპექტივა და გავხდით AI კომპანია შესანიშნავი პროდუქტით, ნაცვლად პროდუქტის კომპანიისა AI შესაძლებლობებით.“

„ჩვენ გადავწყვიტეთ, ჩვენი შესაძლებლობები სამყაროსთვის გაგვეხსნა“, - დასძინა ასბაგმა. „იმის ნაცვლად, რომ ჩვენი მოდელი მხოლოდ ჩვენი პროდუქტის ფარგლებში მომსახურებოდა საწარმოებს, ჩვენ შევიმუშავეთ API და ახლა ვუშვებთ მას, რათა ჩვენი საწარმოს დონის, ტყვიაგაუმტარი მოდელი ყველასთვის ხელმისაწვდომი გავხადოთ.“

ჟარგონის ამოცნობა, ნულოვანი ადაპტაცია

Jargonic-ის ერთ-ერთი გამორჩეული მახასიათებელია სპეციალიზებული ლექსიკისადმი მიდგომა. მეტყველების ამოცნობის სისტემები, როგორც წესი, სირთულეებს აწყდებიან დომენის სპეციფიკური ჟარგონის წინაშე, რომელიც არ ჩანს სტანდარტულ სასწავლო მონაცემებში. Jargonic ამ გამოწვევას უმკლავდება საკუთრების საკვანძო სიტყვების აღმოჩენის სისტემით, რომელიც იძლევა ნულოვანი ადაპტაციის საშუალებას - საწარმოებს უბრალოდ შეუძლიათ ტერმინების სიის მიწოდება დამატებითი გადამზადების გარეშე.

სატესტო შეფასებებში, Jargonic-მა აჩვენა საშუალო სიტყვის შეცდომის მაჩვენებელი (WER) 5.91% ოთხ წამყვან ინგლისურ აკადემიურ მონაცემთა ბაზაში, რაც აღემატება კონკურენტებს, როგორიცაა Eleven Labs, Assembly AI, OpenAI-ს Whisper და Deepgram Nova-3.

თუმცა, კომპანიას ჯერ არ გაუმჟღავნებია შესრულების შედარება კონკრეტულად ახალ მულტიმოდალურ ტრანსკრიფციის მოდელებთან, როგორიცაა OpenAI-ს GPT-4o-transcribe, რომელიც ცხრა დღის წინ გამოვიდა და WER-ის მსგავს შეფასებებში საუკეთესო შედეგებს აჩვენებს, ინგლისურ ენაში მხოლოდ 2.46%-ით. aiOla აცხადებს, რომ მისი მოდელი მაინც უკეთესია კონკრეტული ბიზნეს ჟარგონის ამოცნობაში.

Jargonic-მა ასევე მიაღწია 89.3%-იან აღდგენის მაჩვენებელს სპეციალიზებულ ფინანსურ ტერმინებზე და მუდმივად აჯობა სხვებს მრავალენოვან ჟარგონის ამოცნობაში, მიაღწია 95%-ზე მეტ სიზუსტეს ხუთ ენაზე.

„როდესაც საქმე მძიმე ჟარგონს ეხება, ამოცნობის სიზუსტე, როგორც წესი, 20%-ით ეცემა“, - განმარტა ასბაგმა. „მაგრამ ჩვენი ნულოვანი სწავლების მიდგომით, სადაც თქვენ უბრალოდ ჩამოთვლით მნიშვნელოვან საკვანძო სიტყვებს, სიზუსტე კვლავ 95%-მდე იზრდება. ეს მხოლოდ ჩვენთვის არის დამახასიათებელი.“

ეს შესაძლებლობა შექმნილია იმისთვის, რომ აღმოფხვრას დროში ხანგრძლივი, რესურსზე ინტენსიური გადამზადების პროცესი, რომელიც, როგორც წესი, საჭიროა ASR სისტემების კონკრეტულ ინდუსტრიებზე ადაპტირებისთვის.

ოპტიმიზირებულია საწარმოთა გარემოსთვის

Jargonic-ის განვითარებაზე გავლენა მოახდინა საწარმოთა კლიენტებისთვის გადაწყვეტილებების შექმნის მრავალწლიანმა გამოცდილებამ. მოდელი გაწვრთნილია ტრანსკრიბირებული მეტყველების მილიონ საათზე მეტ მონაცემზე, მათ შორის ინდუსტრიული და ბიზნეს გარემოდან მნიშვნელოვან მონაცემებზე, რაც უზრუნველყოფს საიმედოობას ხმაურიან, რეალურ გარემოში.

„ის, რაც გვაგანსხვავებს, არის ის, რომ ჩვენ წლები გავატარეთ რეალურ სამყაროში არსებული საწარმოთა პრობლემების გადაჭრაში“, - თქვა ჰეცმა. „ჩვენ გავაუმჯობესეთ სიჩქარე, სიზუსტე და რთული გარემოს დამუშავების შესაძლებლობა - არა მხოლოდ პოდკასტები ან ვიდეოები, არამედ ხმაურიანი, არეული, რეალური სამუშაო ადგილები.“

მოდელის არქიტექტურა აერთიანებს საკვანძო სიტყვების აღმოჩენას პირდაპირ ტრანსკრიფციის პროცესში, რაც Jargonic-ს საშუალებას აძლევს შეინარჩუნოს სიზუსტე არაპროგნოზირებად აუდიო პირობებშიც კი.

ხმოვანი მომავალი

aiOla-ს ხელმძღვანელობისთვის Jargonic არის ნაბიჯი უფრო ფართო ცვლილებისკენ, თუ როგორ ურთიერთობენ ადამიანები ტექნოლოგიებთან. კომპანია მეტყველების ამოცნობას განიხილავს არა მხოლოდ როგორც ბიზნეს ინსტრუმენტს, არამედ როგორც ადამიანისა და კომპიუტერის ურთიერთქმედების მომავლისთვის აუცილებელ ინტერფეისს.

„ჩვენი ხედვაა, რომ ყველა მანქანური ინტერფეისი მალე ხმოვანი გახდება“, - თქვა ჰეცმა. „თქვენ შეძლებთ ელაპარაკოთ თქვენს მაცივარს, თქვენს მტვერსასრუტს, ნებისმიერ მანქანას - და ის იმოქმედებს და გააკეთებს ყველაფერს, რაც გსურთ. ეს არის მომავალი, რომლისკენაც მივისწრაფვით.“

ასბაგმა ამ განწყობას მხარი დაუჭირა და დასძინა: „კომუნიკაციური AI ახალი ვებ ბრაუზერი გახდება. მანქანებმა დაიწყეს ჩვენი გაგება და ახლა გვაქვს მიზეზი, რომ მათთან ბუნებრივად ვიურთიერთობოთ.“

ჯერჯერობით, aiOla-ს ყურადღება საწარმოებზე რჩება. Jargonic დაუყოვნებლივ ხელმისაწვდომია საწარმოთა მომხმარებლებისთვის API-ის საშუალებით, რაც მათ საშუალებას აძლევს, მოდელის მეტყველების ამოცნობის შესაძლებლობები საკუთარ სამუშაო პროცესებში, აპლიკაციებში ან მომხმარებელზე ორიენტირებულ სერვისებში დანერგონ.

კომენტარები