„DeepSeek-R1“ – dirbtinio intelekto ir kraštinių skaičiavimų derinys pramoniniam daiktų daiktų tinklui

Įvadas

Maži „DeepSeek-R1“ distiliuoti modeliai yra tiksliai suderinti naudojant „DeepSeek-R1“ sugeneruotus minties grandinės duomenis, pažymėtus...žymes, paveldinčias R1 samprotavimo galimybes. Šie tiksliai suderinti duomenų rinkiniai aiškiai apima samprotavimo procesus, tokius kaip problemų skaidymas ir tarpinės dedukcijos. Sustiprinimo mokymasis suderino distiliuoto modelio elgesio modelius su R1 sugeneruotais samprotavimo žingsniais. Šis distiliavimo mechanizmas leidžia mažiems modeliams išlaikyti skaičiavimo efektyvumą, tuo pačiu metu įgyjant sudėtingus samprotavimo gebėjimus, artimus didesnių modelių gebėjimams, o tai yra labai naudinga taikant ribotų išteklių scenarijuose. Pavyzdžiui, 14B versija pasiekia 92 % originalaus „DeepSeek-R1“ modelio kodo užbaigtumo. Šiame straipsnyje pristatomas „DeepSeek-R1“ distiliuotas modelis ir jo pagrindinės taikymo sritys pramoniniuose periferiniuose skaičiavimuose, apibendrintos šiomis keturiomis kryptimis kartu su konkrečiais įgyvendinimo atvejais:

dc3c637c5 karoliukas8b62ed51b6d83ac0b4

Numatomoji įrangos priežiūra

Techninis įgyvendinimas

Jutiklių suliejimas:

Integruokite vibracijos, temperatūros ir srovės duomenis iš PLC per Modbus protokolą (diskretizavimo dažnis 1 kHz).

Funkcijų išskyrimas:

Paleiskite „Edge Impulse“ programą „Jetson Orin NX“ sistemoje, kad išgautumėte 128 dimensijų laiko eilučių ypatybes.

Modelio išvada:

Įdiegti „DeepSeek-R1-Distill-14B“ modelį, įvedant požymių vektorius gedimų tikimybės reikšmėms generuoti.

Dinaminis reguliavimas:

Suaktyvinti priežiūros darbų užsakymus, kai patikimumas > 85 %, ir inicijuoti antrinį patvirtinimo procesą, kai < 60 %.

Susijęs atvejis

„Schneider Electric“ įdiegė šį sprendimą kasybos mašinoms, sumažindama klaidingai teigiamų rezultatų skaičių 63 %, o priežiūros išlaidas – 41 %.

1

„DeepSeek R1“ distiliuoto modelio paleidimas „InHand“ dirbtinio intelekto „Edge“ kompiuteriuose

Patobulinta vizualinė apžiūra

Išvesties architektūra

Tipinis diegimo srautas:

camera = GigE_Vision_Camera(500fps) # Gigabito pramoninė kamera
frame = camera.capture() # Užfiksuoti vaizdą
preprocessed = OpenCV.denoise(frame) # Triukšmo šalinimo išankstinis apdorojimas
defect_type = DeepSeek_R1_7B.infer(preprocessed) # Defektų klasifikacija
jei defekto_tipas != 'normalus':
PLC.trigger_reject() # Trigerio rūšiavimo mechanizmas

Našumo metrika

Apdorojimo vėlavimas:

82 ms (Jetson AGX Orin)

Tikslumas:

Įpurškimo būdu pagamintų gaminių defektų aptikimas siekia 98,7 %.

2

„DeepSeek R1“ pasekmės: generatyvinės dirbtinio intelekto vertės grandinės nugalėtojai ir pralaimėtojai

Proceso srauto optimizavimas

Pagrindinės technologijos

Natūralios kalbos sąveika:

Operatoriai įrangos anomalijas apibūdina balsu (pvz., „Ekstruderio slėgio svyravimas ±0,3 MPa“).

Multimodalinis samprotavimas:

Modelis generuoja optimizavimo pasiūlymus, pagrįstus įrangos istoriniais duomenimis (pvz., sraigto greičio reguliavimas 2,5 %).

Skaitmeninio dvynio patvirtinimas:

Parametrų modeliavimo patvirtinimas „EdgeX Foundry“ platformoje.

Įgyvendinimo poveikis

BASF chemijos gamykla pritaikė šią schemą, sumažindama energijos suvartojimą 17 % ir pagerindama produkto kokybę 9 %.

3

Dirbtinis intelektas krašte ir verslo ateitis: „OpenAI o1“ ir „DeepSeek R1“ sveikatos priežiūros, automobilių ir daiktų interneto srityse.

Momentinis žinių bazės gavimas

Architektūros dizainas

Vietinė vektorių duomenų bazė:

Naudokite „ChromaDB“ įrangos vadovams ir procesų specifikacijoms saugoti (įterpti 768 dimensiją).

Hibridinis išgavimas:

Užklausai sujungti BM25 algoritmą ir kosinuso panašumą.

Rezultatų generavimas:

R1-7B modelis apibendrina ir patikslina paieškos rezultatus.

Tipinis atvejis

„Siemens“ inžinieriai inverterių gedimus sprendė naudodami natūralios kalbos užklausas, taip 58 % sutrumpindami vidutinį apdorojimo laiką.

Diegimo iššūkiai ir sprendimai

Atminties apribojimai:

Panaudota KV talpyklos kvantavimo technologija, sumažinusi 14B modelio atminties naudojimą nuo 32 GB iki 9 GB.

Realaus laiko veikimo užtikrinimas:

Stabilizuotas vienos išvados delsos laikas iki ±15 ms naudojant CUDA grafiko optimizavimą.

Modelio dreifas:

Savaitiniai papildomi atnaujinimai (perduodama tik 2 % parametrų).

Ekstremalios aplinkos:

Sukurtas plačiam temperatūrų diapazonui nuo -40 °C iki 85 °C, o apsaugos lygis – IP67.

5
微信图片_20240614024031.jpg1

Išvada

Dabartinės diegimo išlaidos sumažėjo iki 599 USD už mazgą („Jetson Orin NX“), o tokiuose sektoriuose kaip 3C gamyba, automobilių surinkimas ir energetikos chemija formuojasi keičiamo mastelio taikymo sritys. Tikimasi, kad nuolatinis MoE architektūros ir kvantavimo technologijos optimizavimas leis 70B modeliui veikti periferiniuose įrenginiuose iki 2025 m. pabaigos.

Raskite ELV kabelių sprendimą

Valdymo kabeliai

BMS, magistralinių, pramoninių, prietaisų kabeliams.

Struktūrizuota kabelių sistema

Tinklas ir duomenys, šviesolaidinis kabelis, jungiamasis laidas, moduliai, priekinė plokštė

2024 m. parodų ir renginių apžvalga

2024 m. balandžio 16–18 d., Artimųjų Rytų energetikos paroda Dubajuje

2024 m. balandžio 16–18 d. „Securika“ Maskvoje

2024 m. gegužės 9 d. NAUJŲ PRODUKTŲ IR TECHNOLOGIJŲ PRISTATYMO RENGINYS Šanchajuje

2024 m. spalio 22–25 d. Pekine vyks „SAUGUMO KINIJA“ konferencija

2024 m. lapkričio 19–20 d. „Connected World“ Saudo Arabijoje


Įrašo laikas: 2025 m. vasario 7 d.