კატეგორიები

CardanoNFTავტოარქიტექტურაახალი ამბებიახალიამბებიბიზნესიგანათლებაგარემოგარემო და ბუნებაგარემოს დაცვაგართობაეკონომიკაეკონომიკა/ბიზნესიზოგადითავგადასავალითამაშებიიარაღიისტორიაკოსმოსიკრიმინალიკრიპტოკრიპტოვალუტაკრიპტოსამყაროკულინარიაკულინარია რეცეპტებიკულტურაკულტურა/მედიამედიამეცნიერებამოგზაურობამოდამომხმარებელიმსოფლიომსოფლიო ამბებიმსოფლიო პოლიტიკანადირობაპოლიტიკაპროდუქტის მიმოხილვარობოტექნიკასაბრძოლო მასალასაზოგადოებასამართალისამხედროსილამაზესპორტისტარტაპებისტილისხვადასხვატექნიკატექნოლოგიატექნოლოგიებიტექნოლოგიები/ონლაინ კომერციატრანსპორტიტურიზმიუსაფრთხოებაფინანსებიფიტნესიშოუბიზნესიცხოვრებაწიგნებიხელოვნებახელოვნური ინტელექტიჯანდაცვაჯანმრთელობა

Genspark-ის Super Agent ზრდის ფსონებს გენერალური AI აგენტების რბოლაში

ტექნოლოგია ავტომატიზაცია
Genspark-ის Super Agent ზრდის ფსონებს გენერალური AI აგენტების რბოლაში

ზოგადი დანიშნულების AI აგენტების სფერო მოულოდნელად გაცილებით ხალხმრავალი და ამბიციური ხდება.

ამ კვირაში, პალო-ალტოში დაფუძნებულმა სტარტაპმა Genspark გამოუშვა ის, რასაც ის Super Agent-ს უწოდებს, სწრაფად მოქმედი ავტონომიური სისტემა, რომელიც შექმნილია რეალურ სამყაროში ამოცანების შესასრულებლად სხვადასხვა სფეროში - მათ შორის ისეთებშიც, რომლებიც წარბებს აწევს, როგორიცაა რესტორნებში სატელეფონო ზარების განხორციელება რეალისტური სინთეზური ხმის გამოყენებით.

ეს გაშვება საწვავს მატებს იმას, რაც AI კონკურენციაში მნიშვნელოვან ახალ ფრონტად ყალიბდება: ვინ ააშენებს პირველ საიმედო, მოქნილ და ჭეშმარიტად სასარგებლო ზოგადი დანიშნულების აგენტს? შესაძლოა, უფრო გადაუდებლად, რას ნიშნავს ეს საწარმოებისთვის?

">

Genspark-ის Super Agent-ის გაშვება მოხდა სულ რაღაც სამი კვირის შემდეგ, რაც სხვა ჩინეთში დაფუძნებულმა სტარტაპმა, Manus-მა, ყურადღება მიიპყრო თავისი უნარით მოახდინოს ინსტრუმენტებისა და მონაცემთა წყაროების კოორდინაცია ასინქრონული ღრუბლოვანი ამოცანების შესასრულებლად, როგორიცაა მოგზაურობის დაჯავშნა, რეზიუმეების სკრინინგი და საფონდო ბირჟის ანალიზი - ეს ყველაფერი ამჟამინდელი აგენტების უმეტესობისთვის დამახასიათებელი ხელის შეწყობის გარეშე.

Genspark ახლა აცხადებს, რომ კიდევ უფრო შორს მიდის. თანადამფუძნებლის, ერიკ ჯინგის თქმით, Super Agent აგებულია სამ ბურჯზე: ცხრა სხვადასხვა LLM-ის კონცერტი, 80-ზე მეტი ინსტრუმენტი და 10-ზე მეტი საკუთრების მონაცემთა ნაკრები - ეს ყველაფერი კოორდინირებულ ნაკადში მუშაობს. ის სცილდება ტრადიციულ ჩეთბოტებს, ამუშავებს რთულ სამუშაო პროცესებს და აბრუნებს სრულად შესრულებულ შედეგებს.

დემოში, Genspark-ის აგენტმა დაგეგმა ხუთდღიანი მოგზაურობა სან-დიეგოში, გამოთვალა მანძილი ატრაქციონებს შორის ფეხით, დააფიქსირა საზოგადოებრივი ტრანსპორტის ვარიანტები და შემდეგ გამოიყენა ხმოვანი ზარის აგენტი რესტორნების დასაჯავშნად, მათ შორის საკვების ალერგიისა და ადგილების პრეფერენციების დამუშავება. სხვა დემოში აგენტმა შექმნა კულინარიული ვიდეო რგოლი რეცეპტის ნაბიჯების, ვიდეო სცენებისა და აუდიო გადაფარვების გენერირებით. მესამეში მან დაწერა და გადაიღო South Park-ის სტილის ანიმაციური ეპიზოდი, რომელიც დაფუძნებულია სიგნალგეითის ბოლოდროინდელ პოლიტიკურ სკანდალზე, რომელიც მოიცავს ომის გეგმების გაზიარებას პოლიტიკურ რეპორტიორთან.

ეს შეიძლება მომხმარებელზე იყოს ორიენტირებული, მაგრამ ისინი აჩვენებენ, თუ სად მიდის ტექნოლოგია - მრავალმოდალური, მრავალსაფეხურიანი ამოცანების ავტომატიზაციისკენ, რომელიც ბუნდოვანს ხდის ზღვარს შემოქმედებით გენერაციასა და შესრულებას შორის.

ამ რეალური სამყაროს პრობლემების გადაჭრა გაცილებით რთულია, ვიდრე გვეგონა", - ამბობს ჯინგი ვიდეოში, "მაგრამ ჩვენ აღფრთოვანებული ვართ იმ პროგრესით, რომელიც მივაღწიეთ.

ერთი დამაჯერებელი მახასიათებელი: Super Agent ნათლად ვიზუალიზაციას უკეთებს თავის აზროვნების პროცესს, აკვირდება, თუ როგორ მსჯელობს თითოეულ ნაბიჯზე, რომელ ინსტრუმენტებს იყენებს და რატომ. ამ ლოგიკის რეალურ დროში თვალყურის დევნება სისტემას შავი ყუთის ნაცვლად უფრო ჰგავს თანამშრომლობით პარტნიორს. მას ასევე შეუძლია შთააგონოს საწარმოების დეველოპერები ააშენონ მსგავსი კვალის მიმყოლი მსჯელობის გზები საკუთარ AI სისტემებში, რაც აპლიკაციებს უფრო გამჭვირვალესა და სანდოს გახდის.

Super Agent ასევე შთამბეჭდავად მარტივი გამოსაცდელი იყო. ინტერფეისი შეუფერხებლად გაეშვა ბრაუზერში ტექნიკური დაყენების გარეშე. Genspark მომხმარებლებს საშუალებას აძლევს დაიწყონ ტესტირება პერსონალური მონაცემების მოთხოვნის გარეშე. განსხვავებით, Manus ჯერ კიდევ მოითხოვს განმცხადებლებს შეუერთდნენ მოლოდინის სიას და გაამჟღავნონ სოციალური ანგარიშები და სხვა პირადი ინფორმაცია, რაც ექსპერიმენტებს ხახუნს მატებს.

ჩვენ პირველად Genspark-ზე ნოემბერში დავწერეთ, როდესაც მან გამოუშვა Claude-ზე მომუშავე ფინანსური ანგარიშები. მას მინიმუმ 160 მილიონი დოლარი აქვს მოზიდული ორ რაუნდში და მას მხარს უჭერენ აშშ-სა და სინგაპურში დაფუძნებული ინვესტორები.

უყურეთ უახლეს ვიდეო დისკუსიას AI აგენტის დეველოპერს სემ ვიტევინსა და ჩემს შორის აქ, რათა უფრო ღრმად ჩაიხედოთ, თუ როგორ ადარებს Genspark-ის მიდგომა სხვა აგენტის ჩარჩოებს და რატომ აქვს ამას მნიშვნელობა საწარმო AI გუნდებისთვის.

როგორ ახერხებს Genspark ამას?

Genspark-ის მიდგომა გამოირჩევა, რადგან ის ნავიგაციას უწევს AI ინჟინერიის ძველ გამოწვევას: ინსტრუმენტების ორკესტრირება მასშტაბით.

ამჟამინდელი აგენტების უმეტესობა იშლება, როდესაც ჟონგლიორობენ რამდენიმე გარე API-ზე ან ინსტრუმენტზე მეტით. Genspark-ის Super Agent, როგორც ჩანს, ამას უკეთ უმკლავდება, სავარაუდოდ, მოდელის მარშრუტიზაციისა და მოძიებაზე დაფუძნებული შერჩევის გამოყენებით, რათა დინამიურად შეარჩიოს ინსტრუმენტები და ქვემოდელები ამოცანის საფუძველზე.

ეს სტრატეგია ეხმიანება განვითარებად კვლევას CoTools-ის გარშემო, ახალი ჩარჩო ჩინეთის Soochow University-დან, რომელიც აუმჯობესებს იმას, თუ როგორ იყენებენ LLM-ები ვრცელ და განვითარებად ინსტრუმენტების კომპლექტებს. ძველი მიდგომებისგან განსხვავებით, რომლებიც დიდწილად ეყრდნობიან სწრაფი ინჟინერიას ან ხისტ დახვეწას, CoTools ინახავს ძირითად მოდელს "გაყინულს", ხოლო წვრილი კომპონენტების მომზადებას ინსტრუმენტების ეფექტურად განსასჯელად, მოსაძიებლად და გამოსაძახებლად.

კიდევ ერთი ხელშემწყობი არის მოდელის კონტექსტის პროტოკოლი (MCP), ნაკლებად ცნობილი, მაგრამ სულ უფრო მეტად მიღებული სტანდარტი, რომელიც აგენტებს საშუალებას აძლევს განახორციელონ უფრო მდიდარი ინსტრუმენტები და მეხსიერების კონტექსტები ნაბიჯებზე. Genspark-ის საკუთრების მონაცემთა ნაკრებებთან ერთად, MCP შეიძლება იყოს ერთ-ერთი მიზეზი, რის გამოც მათი აგენტი უფრო "მართვადია" ალტერნატივებთან შედარებით.

როგორ შეედრება ეს Manus-ს?

Genspark არ არის პირველი სტარტაპი, რომელიც ზოგად აგენტებს უწევს პოპულარიზაციას. Manus, რომელიც გასულ თვეში ჩინეთში დაფუძნებულმა კომპანია Monica-მ გამოუშვა, ტალღები ააგორა თავისი მრავალაგენტიანი სისტემით, რომელიც ავტონომიურად მართავს ისეთ ინსტრუმენტებს, როგორიცაა ვებ ბრაუზერი, კოდის რედაქტორი ან ცხრილების ძრავა მრავალსაფეხურიანი ამოცანების შესასრულებლად.

Manus-ის ღია კოდის ნაწილების, მათ შორის ვებ ინსტრუმენტებისა და LLM-ების, როგორიცაა Claude Anthropic-დან, ეფექტური ინტეგრაცია გასაკვირი იყო. მიუხედავად იმისა, რომ მას არ აუშენებია საკუთრების მოდელის სტეკი, მან მაინც აჯობა OpenAI-ს GAIA-ს ბენჩმარკში — სინთეზური ტესტი, რომელიც შექმნილია აგენტების მიერ რეალურ სამყაროში ამოცანების ავტომატიზაციის შესაფასებლად.

Genspark, თუმცა, აცხადებს, რომ Manus-ს გადაასწრო, GAIA-ზე 87.8%-იანი მაჩვენებელი დააგროვა — Manus-ის 86%-იან მაჩვენებელს გადაუსწრო — და ეს გააკეთა არქიტექტურით, რომელიც მოიცავს საკუთრების კომპონენტებს და უფრო ვრცელ ინსტრუმენტების დაფარვას.

დიდი ტექნოლოგიური მოთამაშეები: ჯერ კიდევ უსაფრთხოდ თამაშობენ?

იმავდროულად, აშშ-ში დაფუძნებული უმსხვილესი AI კომპანიები ფრთხილობენ.

Super Agent1-ის AI აგენტის მთავარი შეთავაზება, Copilot Studio, Super Agent2. Super Agent3-ის Super Agent4 Super Agent5. Super Agent6-ის ახლახან გამოცხადებული Nova Act დეველოპერზე პირველადი მიდგომაა, რომელიც სთავაზობს ატომურ ბრაუზერზე დაფუძნებულ მოქმედებებს SDK-ის საშუალებით, მაგრამ მჭიდროდ არის მიბმული მის Nova LLM-სა და ღრუბლოვან ინფრასტრუქტურაზე.

ეს მიდგომები უფრო მოდულურია, უფრო უსაფრთხო და აშკარად მიმართულია საწარმოთა გამოყენებისკენ. მაგრამ მათ აკლიათ ამბიცია - ან ავტონომია - რომელიც Genspark-ის დემოშია ნაჩვენები.

ერთი მიზეზი შეიძლება იყოს რისკის თავიდან აცილება. რეპუტაციული დანახარჯი შეიძლება მაღალი იყოს, თუ Google-ის ან Microsoft-ის ზოგადი აგენტი არასწორ ფრენას დაჯავშნის ან რაიმე უცნაურს იტყვის ხმოვან ზარზე. ეს კომპანიები ასევე ჩაკეტილნი არიან საკუთარ მოდელის ეკოსისტემებში, რაც ზღუდავს მათ მოქნილობას მრავალმოდელიანი ორკესტრირების ექსპერიმენტებისთვის.

სტარტაპებს, როგორიცაა Genspark, პირიქით, აქვთ თავისუფლება აურიონ და შეუთავსონ LLM-ები - და სწრაფად იმოძრაონ.

უნდა აინტერესებდეთ საწარმოებს?

ეს არის სტრატეგიული კითხვა. საწარმოების უმეტესობას არ სჭირდება ზოგადი დანიშნულების აგენტი სადილის დასაჯავშნად ან სატირული მულტფილმების შესაქმნელად. მაგრამ მათ შეიძლება მალე დასჭირდეთ აგენტები, რომლებსაც შეუძლიათ გაუმკლავდნენ დომენზე სპეციფიკურ, მრავალსაფეხურიან ამოცანებს, როგორიცაა შესაბამისობის მონაცემების ზედაპირზე გამოტანა და ფორმატირება, მომხმარებელთა ბორტზე აყვანის ორკესტრირება ან კონტენტის წარმოება მრავალ ფორმატში.

ამ კონტექსტში, Genspark-ის მუშაობა უფრო აქტუალური ხდება. რაც უფრო გამართული და ავტონომიური ხდება ზოგადი აგენტები - და რაც უფრო მეტად აერთიანებენ ისინი ხმას, მეხსიერებას და გარე ინსტრუმენტებს - მით უფრო მეტად შეუძლიათ მათ დაიწყონ კონკურენცია გაუწიონ ძველ SaaS აპლიკაციებსა და RPA პლატფორმებს.

და ისინი ამას აკეთებენ მსუბუქი ინფრასტრუქტურით. Genspark, მაგალითად, აცხადებს, რომ მისი აგენტი არის "სუპერ მართვადი" და გამოსაყენებელი მარკეტოლოგების, მასწავლებლების, რეკრუტერების, დიზაინერებისა და ანალიტიკოსების მიერ - ეს ყველაფერი მინიმალური დაყენებით.

ზოგადი აგენტის ერა აღარ არის ჰიპოთეტური. ის აქ არის - და სწრაფად მოძრაობს.

უყურეთ ვიდეო გადაცემას აქ:

">

დამუშავებულია ასინეთა AI-ის მიერ.

კომენტარები