Deepseek-R1- ը համատեղելով AI եւ EDGE հաշվարկը արդյունաբերական iot- ի համար

Ներածություն

Deepseek-R1- ի փոքր չափի թորած մոդելները լավ կարգավորված են `օգտագործելով Deepseek-R1- ի կողմից առաջացած շղթայական տվյալներ, որոնք նշված են...Պիտակներ, ժառանգելով R1- ի պատճառաբանության հնարավորությունները: Այս նուրբ տվյալների շտեմարանները հստակ ներառում են բանական գործընթացներ, ինչպիսիք են խնդրի տարրալուծումը եւ միջանկյալ նվազեցումները: Ամրապնդման ուսումը հավասարեցրել է թորած մոդելի վարքի ձեւերը R1- ի կողմից առաջացած պատճառաբանությամբ քայլերով: Այս թորման մեխանիզմը թույլ է տալիս փոքր մոդելներ պահպանել հաշվարկային արդյունավետությունը `միաժամանակ ավելի մեծ մոդելների հարեւանությամբ հիմնավոր պատճառաբանական կարողություններ ձեռք բերել, ինչը նշանակալի կիրառական արժեք ունի ռեսուրսների սահմանափակ սցենարներում: Օրինակ, 14b վարկածը հասնում է սկզբնական Deepseek-R1 մոդելի կոդերի 92% -ի: Այս հոդվածը ներկայացնում է Deepseek-R1 թորած մոդելը եւ դրա հիմնական դիմումները արդյունաբերական Edge Computing- ում, որն ամփոփված է հետեւյալ չորս ուղղություններով, իրականացման հատուկ դեպքերի հետ միասին.

DC3C637C5BEAD8B62ED51B6D83AC0B4

Սարքավորումների կանխատեսելի պահպանում

Տեխնիկական իրականացում

Sensor Fusion:

Ինտեգրվել թրթռում, ջերմաստիճան եւ ընթացիկ տվյալներ PLCS- ի միջոցով Modbus Protocol- ի միջոցով (նմուշառման մակարդակ 1 կՀց):

Խաղարկային արդյունահանում.

Run Edge Impules jetson orin NX- ի վրա `128 ծավալային ժամանակի շարքի առանձնահատկությունները քաղելու համար:

Մոդելի եզրակացություն.

Տեղադրեք Deepseek-R1-Drotil-14B մոդելը, մուտքագրելով առանձնահատկությունների վեկտորներ, մեղքի հավանականության արժեքներ ստեղծելու համար:

Դինամիկ ճշգրտում.

Trigger Maintenance Works պատվերներ, երբ վստահություն> 85% եւ նախաձեռնում է երկրորդական հաստատման գործընթաց, երբ <60%:

Համապատասխան դեպք

Schneider Electric- ը տեղակայեց այս լուծումը հանքարդյունաբերական մեքենաների վրա, նվազեցրեք կեղծ դրական դրույքաչափերը 63% -ով եւ պահպանեք ծախսերը `41% -ով:

1

R1 Deepseek R1 թորած մոդելը չի ​​կարողանում ներթափանցել AI EDGE համակարգիչներում

Ընդլայնված տեսողական ստուգում

Արդյունքների ճարտարապետություն

Բնորոշ տեղակայման խողովակաշար.

Camera = gige_vision_camera (500fps) # Gigabit Արդյունաբերական տեսախցիկ
Շրջանակ = Camera.Capture () # Capture Image
Նախապես հատուցված = opencv.denoise (շրջանակ) # denoising preprocessing
Defect_Type = Deepseek_R1_7B.Infer (Preprocless) # թերության դասակարգում
Եթե ​​Defect_Type! = 'Նորմալ':
Plc.trigger_reject () # ձգանման տեսակավորման մեխանիզմ

Կատարման չափումներ

Վերամշակման ձգձգում.

82 MS (Jetson Agx Orin)

Acc շգրտություն.

Ներարկման ձուլված արատների հայտնաբերումը հասնում է 98,7% -ի:

2

Deepseek R1- ի հետեւանքները. Հաղթողներ եւ պարտվողներ Generive AI արժեքային ցանցում

Գործընթացների հոսքի օպտիմիզացում

Հիմնական տեխնոլոգիաներ

Բնական լեզու փոխազդեցություն.

Օպերատորները նկարագրում են սարքավորումների անոմալիաները ձայնի միջոցով (օրինակ, «Extruder ճնշման տատանում ± 0.3 MPA»):

Մուլտիմոդալ պատճառաբանություն.

Մոդելը ստեղծում է օպտիմիզացման առաջարկներ, որոնք հիմնված են սարքավորումների պատմական տվյալների վրա (օրինակ, պտուտակային արագությունը 2,5% -ով կարգավորելը):

Թվային երկվորյակների ստուգում.

Պարամետրերի սիմուլյացիայի վավերացում EdgeX- ի ձուլման հարթակում:

Իրականացում ազդեցություն

BASF- ի քիմիական գործարանը ընդունեց այս սխեման, հասնելով էներգիայի սպառման 17% իջեցմանը եւ արտադրանքի որակի մակարդակի 9% աճ:

Գրքույկ

Edge AI եւ բիզնեսի ապագա. Openai o1 ընդդեմ Deepseek R1 առողջապահության, ավտոմեքենաների եւ iiot- ի համար

Գիտելիքների բազայի ակնթարթային որոնում

Archit արտարապետության ձեւավորում

Տեղական վեկտորի տվյալների շտեմարան.

Օգտագործեք Chromadb- ը `սարքավորումների ձեռնարկները պահելու եւ գործընթացների բնութագրերը պահելու համար (Տեղադրման չափը 768):

Հիբրիդային որոնում.

Միավորել BM25 ալգորիթմը + կոսինի նմանությունը հարցման համար:

Արդյունքների ստեղծում.

R1-7B մոդելը ամփոփում եւ թարմացնում է որոնման արդյունքները:

Բնորոշ դեպք

Siemens ինժեներները լուծեցին ինվերտորի ձախողումները բնական լեզվի հարցումների միջոցով, նվազեցնելով վերամշակման միջին ժամանակը 58% -ով:

Տեղակայման մարտահրավերներ եւ լուծումներ

Հիշողության սահմանափակումներ.

Օգտագործված KV քեշի քանակականացման տեխնոլոգիան, նվազեցնելով 14b մոդելի հիշողության օգտագործումը 32 ԳԲ-ից մինչեւ 9 ԳԲ:

Իրական ժամանակի կատարման ապահովում.

Կայունացված եզրակացության լատենտություն ± 15 MS- ին Cuda Graph օպտիմիզացման միջոցով:

Մոդելի ամպեր.

Շաբաթվա հավելյալ թարմացումներ (պարամետրերի միայն 2% փոխանցում):

Ծայրահեղ միջավայրեր.

Նախատեսված է -40 ° C- ից 85 ° C լայն ջերմաստիճանի տողերի համար IP67 պաշտպանության մակարդակով:

5
微信图片 _20240614024031.jpg1

Եզրափակում

Տեղակայման ընթացիկ ծախսերը այժմ նվազել են մինչեւ 599 դոլար / հանգույց (Jetson Orin NX), իսկ մասշտաբային ծրագրեր, որոնք ձեւավորվում են այնպիսի ոլորտներում, ինչպիսիք են 3C Արտադրությունը, ավտոմոբիլային ժողովը եւ էներգետիկ քիմիան: Նախատեսվում է, որ MoE ճարտարապետության եւ քանակական տեխնոլոգիաների շարունակական օպտիմիզացումը հնարավորություն կտա 70b մոդելը գործարկել եզրային սարքերում մինչեւ 2025 թվականը:

Գտեք ELV մալուխի լուծում

Կառավարման մալուխներ

BMS- ի, ավտոբուսի, արդյունաբերական, գործիքավորման մալուխի համար:

Կառուցվածքային կաբելային համակարգ

Network անց եւ տվյալներ, օպտիկամանրաթելային մալուխ, կարկատակի լար, մոդուլներ, FacePlate

2024 ցուցահանդեսներ եւ իրադարձությունների ակնարկ

APR.16-րդ 18, 2024 Միջին Արեւելք-էներգիա Դուբայում

Ապրիլ .6-րդ 18, 2024 թ. Մոսկվայում

Մայիսի 9-ին, 2024 նոր ապրանքներ եւ տեխնոլոգիաների մեկնարկի միջոցառում Շանհայում

Հոկտեմբեր 25-ին, 2024 թ. Անվտանգություն Չինաստան Պեկինում

Նոյեմբեր .19-20, 2024 Կապակցված Համաշխարհային KSA


Փոստի ժամանակ, FEB-07-2025