DeepSeek-R1 Спалучэнне штучнага інтэлекту і перыферыйных вылічэнняў для прамысловага Інтэрнэту рэчаў

Уводзіны

Невялікія дыстыляваныя мадэлі DeepSeek-R1 дапрацаваны з выкарыстаннем дадзеных ланцужка думак, згенераваных DeepSeek-R1, пазначаных...тэгі, якія наследуюць магчымасці разважання R1. Гэтыя дасканалыя наборы дадзеных відавочна ўключаюць працэсы разважання, такія як раскладанне праблемы і прамежкавыя высновы. Навучанне з падмацаваннем супаставіла мадэлі паводзін дыстыляванай мадэлі з этапамі разважання, згенераванымі R1. Гэты механізм дыстыляцыі дазваляе малым мадэлям падтрымліваць вылічальную эфектыўнасць, атрымліваючы пры гэтым складаныя здольнасці разважання, блізкія да магчымасцей больш буйных мадэляў, што мае значную каштоўнасць прымянення ў сцэнарах з абмежаванымі рэсурсамі. Напрыклад, версія 14B дасягае 92% завяршэння кода арыгінальнай мадэлі DeepSeek-R1. У гэтым артыкуле прадстаўлена дыстыляваная мадэль DeepSeek-R1 і яе асноўныя прымяненні ў прамысловых перыферыйных вылічэннях, коратка апісаныя ў наступных чатырох напрамках, а таксама канкрэтныя выпадкі рэалізацыі:

dc3c637c5bead8b62ed51b6d83ac0b4

Прагнастычнае абслугоўванне абсталявання

Тэхнічная рэалізацыя

Зліццё датчыкаў:

Інтэграцыя дадзеных аб вібрацыі, тэмпературы і току з ПЛК праз пратакол Modbus (частата дыскрэтызацыі 1 кГц).

Вылучэнне прыкмет:

Запусціце Edge Impulse на Jetson Orin NX, каб атрымаць 128-мерныя прыкметы часовых шэрагаў.

Выснова мадэлі:

Разгарніце мадэль DeepSeek-R1-Distill-14B, уводзячы вектары прыкмет для генерацыі значэнняў верагоднасці няспраўнасці.

Дынамічная рэгуляванне:

Запускаць заказы на тэхнічнае абслугоўванне, калі ўпэўненасць > 85%, і запускаць працэс другаснай праверкі, калі < 60%.

Адпаведная справа

Schneider Electric укараніла гэтае рашэнне на горназдабыўной тэхніцы, знізіўшы ўзровень ілжывых спрацоўванняў на 63% і выдаткі на тэхнічнае абслугоўванне на 41%.

1

Запуск дыстыляванай мадэлі DeepSeek R1 на перыферыйных камп'ютарах InHand з штучным інтэлектам

Палепшаны візуальны агляд

Выхадная архітэктура

Тыповы канвеер разгортвання:

camera = GigE_Vision_Camera(500fps) # Гігабітная прамысловая камера
frame = camera.capture() # Захоп выявы
preprocessed = OpenCV.denoise(frame) # Папярэдняя апрацоўка шуму
defect_type = DeepSeek_R1_7B.infer(preprocessed) # Класіфікацыя дэфектаў
калі тып_дэфекту != 'нармальны':
PLC.trigger_reject() # Механізм сартавання трыгераў

Паказчыкі прадукцыйнасці

Затрымка апрацоўкі:

82 мс (Jetson AGX Orin)

Дакладнасць:

Выяўленне дэфектаў ліцця пад ціскам дасягае 98,7%.

2

Вынікі DeepSeek R1: пераможцы і няўдачнікі ў ланцужку стварэння каштоўнасці генератыўнага штучнага інтэлекту

Аптымізацыя працэснага працэсу

Ключавыя тэхналогіі

Узаемадзеянне з натуральнай мовай:

Аператары апісваюць анамаліі абсталявання голасам (напрыклад, «Ваганні ціску экструдара ±0,3 МПа»).

Мультымадальнае разважанне:

Мадэль генеруе прапановы па аптымізацыі на аснове гістарычных дадзеных абсталявання (напрыклад, карэкціроўка хуткасці шрубы на 2,5%).

Праверка лічбавага двайніка:

Праверка параметраў мадэлявання на платформе EdgeX Foundry.

Эфект рэалізацыі

Хімічны завод BASF укараніў гэтую схему, дасягнуўшы зніжэння спажывання энергіі на 17% і павышэння якасці прадукцыі на 9%.

3

Перыферыйны штучны інтэлект і будучыня бізнесу: OpenAI o1 супраць DeepSeek R1 для аховы здароўя, аўтамабілебудавання і IIoT

Імгненнае атрыманне базы ведаў

Архітэктурны дызайн

Лакальная вектарная база дадзеных:

Выкарыстоўвайце ChromaDB для захоўвання інструкцый па эксплуатацыі абсталявання і спецыфікацый працэсаў (вымярэнне ўбудавання 768).

Гібрыдны пошук:

Аб'яднайце алгарытм BM25 і косінусную падабеннасць для запыту.

Генерацыя вынікаў:

Мадэль R1-7B абагульняе і ўдакладняе вынікі пошуку.

Тыповы выпадак

Інжынеры Siemens вырашалі праблемы з інвертарам з дапамогай запытаў на натуральнай мове, скараціўшы сярэдні час апрацоўкі на 58%.

Праблемы разгортвання і рашэнні

Абмежаванні памяці:

Выкарыстана тэхналогія квантавання кэша KV, што дазволіла знізіць выкарыстанне памяці мадэллю 14B з 32 ГБ да 9 ГБ.

Забеспячэнне прадукцыйнасці ў рэжыме рэальнага часу:

Стабілізаваная затрымка адзіночнага вываду да ±15 мс дзякуючы аптымізацыі CUDA Graph.

Дрэйф мадэлі:

Штотыднёвыя паступовыя абнаўленні (перадача толькі 2% параметраў).

Экстрэмальныя ўмовы:

Распрацаваны для шырокага дыяпазону тэмператур ад -40°C да 85°C са ступенню абароны IP67.

5
微信图片_20240614024031.jpg1

Выснова

Бягучыя выдаткі на разгортванне цяпер знізіліся да 599 долараў ЗША за вузел (Jetson Orin NX), прычым маштабуемыя прыкладанні фарміруюцца ў такіх сектарах, як вытворчасць 3C, зборка аўтамабіляў і энергетычная хімія. Чакаецца, што пастаянная аптымізацыя архітэктуры MoE і тэхналогіі квантавання дазволіць мадэлі 70B працаваць на перыферыйных прыладах да канца 2025 года.

Знайсці рашэнне для кабеляў ELV

Кантрольныя кабелі

Для кабеляў BMS, BUS, прамысловых, прыборных.

Структураваная кабельная сістэма

Сетка і перадача дадзеных, валаконна-аптычны кабель, патч-корд, модулі, пярэдняя панэль

Агляд выстаў і мерапрыемстваў 2024 года

16-18 красавіка 2024 г. Блізкаўсходняя энергетыка ў Дубаі

16-18 красавіка 2024 г., Securika ў Маскве

9 мая 2024 г. ПРЭЗЕНТАЦЫЯ НОВЫХ ПРАДУКТАЎ І ТЭХНАЛОГІЙ у Шанхаі

22–25 кастрычніка 2024 г. SECURITY CHINA ў Пекіне

19-20 лістапада 2024 г. CONNECTED WORLD KSA


Час публікацыі: 7 лютага 2025 г.