BMS, BUS, արդյունաբերական, գործիքային մալուխի համար։

Էլոն Մասկը և xAI թիմը պաշտոնապես ուղիղ հեռարձակման ժամանակ թողարկեցին Grok-ի վերջին տարբերակը՝ Grok3-ը: Այս միջոցառումից առաջ Մասկի 24/7 գովազդային աղմուկի հետ մեկտեղ, Grok3-ի նկատմամբ համաշխարհային սպասումները բարձրացրին աննախադեպ մակարդակի: Ընդամենը մեկ շաբաթ առաջ Մասկը DeepSeek R1-ի վերաբերյալ մեկնաբանություն անելիս ուղիղ հեռարձակման ժամանակ վստահորեն հայտարարեց. «xAI-ն պատրաստվում է թողարկել ավելի լավ AI մոդել»: Ուղիղ հեռարձակմամբ ներկայացված տվյալներից պարզվում է, որ Grok3-ը գերազանցել է բոլոր ներկայիս հիմնական մոդելները մաթեմատիկայի, գիտության և ծրագրավորման չափանիշներով, Մասկը նույնիսկ պնդում է, որ Grok3-ը կօգտագործվի SpaceX-ի Մարսի առաքելությունների հետ կապված հաշվողական առաջադրանքների համար՝ կանխատեսելով «Նոբելյան մրցանակի մակարդակի առաջընթացներ երեք տարվա ընթացքում»: Այնուամենայնիվ, սրանք առայժմ միայն Մասկի պնդումներն են: Թողարկումից հետո ես փորձարկեցի Grok3-ի վերջին բետա տարբերակը և տվեցի մեծ մոդելների համար դասական հնարքային հարցը. «Ո՞րն է ավելի մեծ՝ 9.11-ը, թե՞ 9.9-ը»: Ցավոք, առանց որևէ որակավորման կամ գնահատականի, այսպես կոչված ամենախելացի Grok3-ը դեռևս չկարողացավ ճիշտ պատասխանել այս հարցին: Grok3-ը չկարողացավ ճշգրիտ որոշել հարցի իմաստը։
Այս թեստը արագորեն գրավեց բազմաթիվ ընկերների ուշադրությունը, և պատահականորեն, արտասահմանում նմանատիպ տարբեր թեստեր ցույց տվեցին, որ Grok3-ը դժվարանում է լուծել ֆիզիկայի/մաթեմատիկայի հիմնական հարցեր, ինչպիսիք են՝ «Ո՞ր գնդակն է առաջինը ընկնում Պիզայի թեք աշտարակից»։ Այսպիսով, նրան հումորով անվանել են «հանճար, որը չի ցանկանում պատասխանել պարզ հարցերին»։

Grok3-ը լավն է, բայց R1-ից կամ o1-Pro-ից լավը չէ։
Grok3-ը գործնականում «ձախողումներ» ունեցավ բազմաթիվ ընդհանուր գիտելիքների թեստերում: xAI-ի մեկնարկի միջոցառման ժամանակ Մասկը ցուցադրեց, թե ինչպես է օգտագործում Grok3-ը՝ վերլուծելու Path of Exile 2 խաղի կերպարների դասերն ու էֆեկտները, որը, ինչպես նա պնդում էր, հաճախ է խաղում, սակայն Grok3-ի կողմից տրված պատասխանների մեծ մասը սխալ էր: Ուղիղ հեռարձակման ժամանակ Մասկը չնկատեց այս ակնհայտ խնդիրը:
Այս սխալը ոչ միայն լրացուցիչ ապացույցներ ստեղծեց արտասահմանյան ինտերնետ օգտատերերի համար՝ ծաղրելու Մասկին խաղերում «փոխարինող գտնելու» համար, այլև լուրջ մտահոգություններ առաջացրեց Grok3-ի հուսալիության վերաբերյալ գործնական կիրառություններում: Նման «հանճարի» համար, անկախ իր իրական հնարավորություններից, դրա հուսալիությունը չափազանց բարդ կիրառական սցենարներում, ինչպիսիք են Մարսի հետազոտական առաջադրանքները, մնում է կասկածի տակ:
Ներկայումս, շատ փորձարկողներ, ովքեր շաբաթներ առաջ ստացել են Grok3-ին մուտք գործելու հնարավորություն, և նրանք, ովքեր երեկ մի քանի ժամ փորձարկել են մոդելի հնարավորությունները, բոլորը գալիս են մեկ ընդհանուր եզրակացության. «Grok3-ը լավն է, բայց այն R1-ից կամ o1-Pro-ից լավը չէ»։

Քննադատական հայացք «Nvidia-ի խաթարման» վերաբերյալ
Թողարկման ժամանակ պաշտոնապես ներկայացված PPT-ում Grok3-ը ցույց էր տրվել «շատ առաջ» Chatbot Arena-ում, սակայն այն խելացիորեն օգտագործել է գրաֆիկական տեխնիկա. առաջատարների աղյուսակի ուղղահայաց առանցքը թվարկում էր միայն 1400-1300 միավորների միջակայքում գտնվող արդյունքները, ինչի շնորհիվ թեստի արդյունքների սկզբնական 1% տարբերությունը այս ներկայացման մեջ թվում էր բացառիկ նշանակալի։

Իրական մոդելի գնահատման արդյունքներում Grok3-ը DeepSeek R1-ից և GPT-4.0-ից ընդամենը 1-2%-ով առաջ է, ինչը համապատասխանում է շատ օգտատերերի գործնական փորձարկումների փորձին, որոնք «նկատելի տարբերություն չեն հայտնաբերել»: Grok3-ը իր հաջորդներին գերազանցում է միայն 1%-2%-ով:

Չնայած Grok3-ը ավելի բարձր միավորներ է հավաքել, քան բոլոր ներկայումս հրապարակայնորեն փորձարկված մոդելները, շատերը դա լուրջ չեն ընդունում. չէ՞ որ xAI-ը նախկինում քննադատվել է Grok2 դարաշրջանում «միավորների մանիպուլյացիայի» համար: Քանի որ առաջատարների ցուցակը պատժեց պատասխանի երկարության ոճը, միավորները զգալիորեն նվազեցին, ինչը ոլորտի ներկայացուցիչներին ստիպեց հաճախ քննադատել «բարձր միավորներ, բայց ցածր կարողություններ» երևույթը:
Անկախ նրանից՝ առաջատարների աղյուսակի «մանիպուլյացիաների», թե նկարազարդումներում դիզայնի հնարքների միջոցով, դրանք բացահայտում են xAI-ը և Մասկի մոլուցքը մոդելների հնարավորությունների «առաջատարը» լինելու գաղափարի հանդեպ։ Մասկը բարձր գին վճարեց այս շահույթի համար. թողարկման ժամանակ նա պարծենում էր 200,000 H100 GPU-ների օգտագործմամբ (ուղիղ հեռարձակման ժամանակ՝ «ավելի քան 100,000») և ընդհանուր 200 միլիոն ժամ մարզման ժամանակի ապահովմամբ։ Սա ոմանց ստիպեց հավատալ, որ սա GPU արդյունաբերության համար ևս մեկ նշանակալի առավելություն է, և DeepSeek-ի ազդեցությունը ոլորտի վրա համարել «հիմարություն»։ Հատկանշական է, որ ոմանք կարծում են, որ մոդելների մարզման ապագան միայն հաշվողական հզորությունն է։
Այնուամենայնիվ, որոշ ինտերնետ օգտատերեր համեմատել են 2000 H800 գրաֆիկական պրոցեսորների սպառումը երկու ամսվա ընթացքում՝ DeepSeek V3-ը ստանալու համար, հաշվարկելով, որ Grok3-ի մարզումների իրական էներգիայի սպառումը 263 անգամ ավելի է, քան V3-ինը: 1402 միավոր հավաքած DeepSeek V3-ի և Grok3-ի միջև տարբերությունը մի փոքր պակաս է 100 միավորից: Այս տվյալների հրապարակումից հետո շատերը արագ հասկացան, որ Grok3-ի՝ որպես «աշխարհի ամենաուժեղ» տիտղոսի հետևում թաքնված է հստակ սահմանային օգտակարության էֆեկտ. ավելի մեծ մոդելների՝ ավելի ուժեղ կատարողականություն ապահովող տրամաբանությունը սկսել է ցույց տալ նվազող արդյունքներ:

Նույնիսկ «բարձր միավորներ, բայց ցածր կարողություններ» ունենալու դեպքում, Grok2-ը ուներ X (Twitter) հարթակից ստացված հսկայական քանակությամբ բարձրորակ առաջին կողմի տվյալներ՝ օգտագործումը ապահովելու համար: Այնուամենայնիվ, Grok3-ի մարզման ընթացքում xAI-ը բնականաբար բախվեց այն «առաստաղին», որին ներկայումս բախվում է OpenAI-ը. պրեմիում մարզման տվյալների բացակայությունը արագորեն բացահայտում է մոդելի հնարավորությունների սահմանային օգտակարությունը:
Grok3-ի մշակողները և Մասկը, հավանաբար, առաջինն են, ովքեր խորությամբ հասկանում և բացահայտում են այս փաստերը, այդ իսկ պատճառով Մասկը սոցիալական ցանցերում անընդհատ նշում է, որ օգտատերերի կողմից այժմ օգտագործվող տարբերակը «դեռևս միայն բետա տարբերակն է» և որ «ամբողջական տարբերակը կթողարկվի առաջիկա ամիսներին»։ Մասկը ստանձնել է Grok3-ի արտադրանքի մենեջերի դերը՝ առաջարկելով օգտատերերին մեկնաբանությունների բաժնում արձագանքել տարբեր խնդիրների վերաբերյալ։ Նա, հնարավոր է, Երկրի վրա ամենաշատ հետևորդներ ունեցող արտադրանքի մենեջերն է։
Այնուամենայնիվ, մեկ օրվա ընթացքում Grok3-ի արդյունավետությունը, անկասկած, տագնապ առաջացրեց նրանց մոտ, ովքեր հույս ունեին ապավինել «հսկայական հաշվողական մկաններին»՝ ավելի ուժեղ մեծ մոդելներ պատրաստելու համար. հրապարակայնորեն մատչելի Microsoft-ի տեղեկատվության հիման վրա, OpenAI-ի GPT-4-ի պարամետրերի չափը կազմում է 1.8 տրիլիոն պարամետր, ինչը GPT-3-ի չափից ավելի քան տասը անգամ մեծ է: Լուրերը ենթադրում են, որ GPT-4.5-ի պարամետրերի չափը կարող է նույնիսկ ավելի մեծ լինել:
Քանի որ մոդելի պարամետրերի չափերը կտրուկ աճում են, վերապատրաստման ծախսերը նույնպես կտրուկ աճում են: Grok3-ի ներկայությամբ, այնպիսի մրցակիցներ, ինչպիսիք են GPT-4.5-ը և այլք, որոնք ցանկանում են շարունակել «փող ծախսել» պարամետրերի չափի միջոցով մոդելի ավելի լավ աշխատանքի հասնելու համար, պետք է հաշվի առնեն այն առաստաղը, որն այժմ հստակ տեսանելի է և մտածեն, թե ինչպես հաղթահարել այն: Այս պահին OpenAI-ի նախկին գլխավոր գիտնական Իլյա Սուցկևերը նախկինում անցյալ տարվա դեկտեմբերին հայտարարել էր. «Մեզ ծանոթ նախնական վերապատրաստումը կավարտվի», ինչը կրկին ի հայտ է եկել քննարկումներում՝ խթանելով մեծ մոդելների վերապատրաստման իրական ուղին գտնելու ջանքերը:

Իլյայի տեսակետը տագնապ է հնչեցրել ոլորտում։ Նա ճշգրտորեն կանխատեսել է հասանելի նոր տվյալների անխուսափելի սպառումը, ինչը հանգեցրել է այնպիսի իրավիճակի, երբ տվյալների ձեռքբերման միջոցով արդյունավետության բարձրացումը չի կարող շարունակվել՝ համեմատելով այն բրածո վառելիքի սպառման հետ։ Նա նշել է, որ «ինչպես նավթը, այնպես էլ ինտերնետում մարդու կողմից ստեղծված բովանդակությունը սահմանափակ ռեսուրս է»։ Սուցկևերի կանխատեսումներով, մոդելների հաջորդ սերունդը, նախնական վերապատրաստումից հետո, կունենա «իրական ինքնավարություն» և «մարդկային ուղեղի նման» դատողության կարողություններ։
Ի տարբերություն այսօրվա նախապես պատրաստված մոդելների, որոնք հիմնականում հիմնված են բովանդակության համապատասխանեցման վրա (հիմնված նախկինում սովորած մոդելի բովանդակության վրա), ապագայի արհեստական բանականության համակարգերը կկարողանան սովորել և մշակել մեթոդաբանություններ՝ խնդիրները լուծելու համար՝ մարդու ուղեղի «մտածողության» նման ձևով: Մարդը կարող է հասնել հիմնարար հմտությունների որևէ առարկայի մեջ՝ օգտագործելով միայն հիմնական մասնագիտական գրականություն, մինչդեռ արհեստական բանականության մեծ մոդելը պահանջում է միլիոնավոր տվյալներ՝ հասնելու համար միայն ամենահիմնական մուտքի մակարդակի արդյունավետությանը: Նույնիսկ երբ ձևակերպումը փոքր-ինչ փոխվում է, այս հիմնարար հարցերը կարող են ճիշտ չհասկացվել, ինչը ցույց է տալիս, որ մոդելն իրականում չի բարելավվել ինտելեկտի առումով. հոդվածի սկզբում նշված հիմնական, բայց անլուծելի հարցերը ներկայացնում են այս երևույթի հստակ օրինակ:

Եզրակացություն
Այնուամենայնիվ, կոպիտ ուժի կիրառումից այն կողմ, եթե Grok3-ը իսկապես հաջողության հասնի ոլորտին բացահայտել, որ «նախապես պատրաստված մոդելները մոտենում են իրենց ավարտին», դա էական հետևանքներ կունենա ոլորտի համար։
Հնարավոր է՝ Grok3-ի շուրջ տիրող իրարանցումից հետո մենք ականատես կլինենք ավելի շատ դեպքերի, ինչպիսին է Ֆեյ-Ֆեյ Լիի «բարձր արդյունավետությամբ մոդելների կարգավորումը որոշակի տվյալների բազմության վրա ընդամենը 50 դոլարով» օրինակը, որը, ի վերջո, կբացահայտի արհեստական ինտելեկտի ստեղծման իրական ուղին։
Կառավարման մալուխներ
Կառուցվածքային մալուխային համակարգ
Ցանց և տվյալներ, օպտիկամանրաթելային մալուխ, միացման լար, մոդուլներ, դիմային վահանակ
2024թ. ապրիլի 16-18-ը Մերձավոր Արևելքի էներգետիկայի թեմայով Դուբայում
2024թ. ապրիլի 16-18-ը Securika-ն Մոսկվայում
2024 թվականի մայիսի 9-ին Շանհայում տեղի կունենա նոր արտադրանքի և տեխնոլոգիաների մեկնարկի միջոցառում
2024 թվականի հոկտեմբերի 22-25-ը SECURITY CHINA-ում, Պեկին
2024թ. նոյեմբերի 19-20, CONNECTED WORLD, Սաուդյան Արաբիա
Հրապարակման ժամանակը. Փետրվարի 19-2025