„Deepseek-R1“ sujungia AI ir kraštų skaičiavimą pramoniniam IoT

Įvadas

Mažo dydžio distiliuoti „Deepseek-R1“ modeliai yra tiksliai suderinti naudojant „DeepSeeek-R1“ sugeneruotus duomenis apie mąstytus duomenis, pažymėtus su...Žymos, paveldi R1 samprotavimo galimybes. Šie tiksliai suderinti duomenų rinkiniai aiškiai apima samprotavimo procesus, tokius kaip problemos skilimas ir tarpiniai dedukcijos. Stiprinimo mokymasis suderino distiliuoto modelio elgesio modelius su R1 pagrindimo veiksmais. Šis distiliavimo mechanizmas leidžia mažiems modeliams palaikyti skaičiavimo efektyvumą, tuo pačiu gaunant sudėtingus samprotavimo gebėjimus šalia didesnių modelių, o tai yra reikšminga taikymo vertė, naudojant išteklius suvaržytus scenarijus. Pavyzdžiui, 14B versija pasiekia 92% originalaus „Deepseek-R1“ modelio kodo. Šiame straipsnyje pristatomas distiliuotas „Deepseek-R1“ modelis ir jo pagrindinės programos pramoninių kraštų skaičiavimo srityje, apibendrintas šiomis keturiomis kryptimis kartu su konkrečiais įgyvendinimo atvejais:

dc3c637c5bead8b62ed51b6d83ac0b4

Prognozuojama įrangos priežiūra

Techninis įgyvendinimas

Jutiklio suliejimas:

Integruokite vibraciją, temperatūrą ir dabartinius PLC duomenis naudodami „Modbus“ protokolą (1 kHz mėginių ėmimo greitis).

Funkcijos ištraukimas:

„Jetson Orin NX“ paleiskite „Edge Impulse“, kad ištrauktų 128 matmenų laiko eilučių funkcijas.

Modelio išvados:

Diegkite „Deepseeek-R1-Distill-14B“ modelį, įvesdami funkcijų vektorius, kad sugeneruotumėte gedimo tikimybės vertes.

Dinaminis koregavimas:

Sukelia techninės priežiūros darbo užsakymus, kai pasitikėjimas yra 85%, ir inicijuokite antrinį patikrinimo procesą, kai <60%.

Atitinkamas atvejis

„Schneider Electric“ dislokavo šį sprendimą kasybos mašinose, sumažindamas klaidingą teigiamą normą 63%, o priežiūros išlaidos - 41%.

1

Vykdyti „Deepseeek R1“ distiliuotą modelį ant instrukcijų AI krašto kompiuteriuose

Patobulintas vaizdinis patikrinimas

Išvesties architektūra

Tipiškas diegimo vamzdynas:

fotoaparatas = gige_vision_camera (500Fps) # gigabit pramoninė kamera
Frame = camera.capture () # fiksuoti vaizdą
Iš anksto apdorotas = opencv.denoise (rėmelis) # denoising išankstinis apdorojimas
defektas_type = deepseeek_r1_7b.infer (iš anksto apdorotas) # defekto klasifikacija
Jei defektas_Type! = 'normalus':
Plc.Trigger_reject () # Trigger rūšiavimo mechanizmas

Našumo metrika

Apdorojimo vėlavimas:

82 ms (Jetson Agx Orin)

Tikslumas:

Įpurškimo defektų aptikimas siekia 98,7%.

2

„Deepseek R1“ pasekmės: nugalėtojai ir pralaimėtojai generacinėje AI vertės grandinėje

Proceso srauto optimizavimas

Pagrindinės technologijos

Natūralios kalbos sąveika:

Operatoriai apibūdina įrangos anomalijas balsu (pvz., „Estruuderio slėgio svyravimas ± 0,3 MPa“).

Multimodaliniai samprotavimai:

Modelis sukuria optimizavimo pasiūlymus, pagrįstus įrangos istoriniais duomenimis (pvz., Sraigtinio greičio reguliavimo greitis 2,5%).

Skaitmeninis dvynių patikrinimas:

Parametrų modeliavimo patvirtinimas „Edgex Foundry“ platformoje.

Įgyvendinimo efektas

BASF chemijos gamykla priėmė šią schemą, padidindama 17% energijos suvartojimo sumažėjimą ir 9% padidėjusį produkto kokybės greitį.

3

„Edge AI“ ir verslo ateitis: „Openai O1“ prieš „Deepseek R1“, skirta sveikatos priežiūros, automobilių ir IIOT

Momentinis žinių bazės gavimas

Architektūros dizainas

Vietinė vektoriaus duomenų bazė:

Naudokite „Chromadb“ įrangos vadovams ir proceso specifikacijoms laikyti (įterpimo matmenys 768).

Hibridinis gavimas:

Sujunkite BM25 algoritmą + užklausos kosinuso panašumą.

Rezultatų karta:

R1-7B modelis apibendrina ir patobulina gavimo rezultatus.

Tipiškas atvejis

„Siemens“ inžinieriai išsprendė keitiklio gedimus dėl natūralių kalbos užklausų, sumažindami vidutinį apdorojimo laiką 58%.

Diegimo iššūkiai ir sprendimai

Atminties apribojimai:

Naudojama „KV Cache Quantalization“ technologija, sumažindama 14B modelio atminties naudojimą nuo 32 GB iki 9 GB.

Užtikrinant realaus laiko našumą:

Stabilizuotas vieno išvados latentinis latentinis latentinis latentinis ± 15 ms per CUDA grafiko optimizavimą.

Modelio dreifas:

Savaitės papildomi atnaujinimai (perduodantys tik 2% parametrų).

Ekstremalia aplinka:

Skirta plataus temperatūros diapazonui nuo -40 ° C iki 85 ° C su IP67 apsaugos lygiu.

5
微信图片 _20240614024031.jpg1

Išvada

Dabartinės dislokavimo išlaidos dabar sumažėjo iki 599 USD/mazgo („Jetson Orin NX“), o keičiamos programos formuojamos tokiuose sektoriuose kaip 3C gamyba, automobilių surinkimas ir energetikos chemija. Tikimasi, kad nuolatinis MOE architektūros ir kvantizavimo technologijos optimizavimas leis 70B modeliui veikti ant kraštų įrenginių iki 2025 m. Pabaigos.

Raskite ELV kabelio sprendimą

Valdymo kabeliai

BMS, autobusų, pramoniniam, prietaisų kabeliui.

Struktūrizuota kabelių sistema

Tinklas ir duomenys, pluošto optinis kabelis, pleistro laidas, moduliai, priekinė plokštė

2024 parodų ir renginių apžvalga

2024 m. Balandžio 16 d., 2024 m.

2024 m. Balandžio 16 d., 2024 m. Securika Maskvoje

2024 m. Gegužės 9 d. Naujų produktų ir technologijų renginys Šanchajuje

2024 m. Spalio 22 d., Saugumas Kinija Pekine

2024 m. Lapkričio 19 d., „Connected World KSA“


Pašto laikas: 2012-07-07