Нейронные блоки в процессорах: зачем они нужны и как работают

В 2024 и 2025 годах индустрия железа переживает настоящий бум искусственного интеллекта. Если раньше нам продавали гигагерцы и количество ядер, то теперь маркетологи Intel, AMD и Qualcomm меряются TOPS (триллионами операций в секунду). Нам обещают эру «AI PC», встраивают нейронные блоки (NPU) даже в бюджетные «камни» и лепят отдельные кнопки для вызова ассистентов на клавиатуры.

Архитектурный ликбез: Скаляр, Вектор и Матрица

Чтобы понять, зачем нужен NPU (Neural Processing Unit), нужно вспомнить, как мыслят разные компоненты вашего ПК.

CPU (Central Processing Unit): Это универсальный солдат. Он великолепен в последовательных задачах, ветвлениях и управлении логикой. Но когда нужно перемножить две огромные матрицы (основа работы нейросетей), CPU захлебывается. Для него это миллионы тактов.
GPU (Graphics Processing Unit): Король параллелизма. Тысячи ядер могут одновременно обрабатывать пиксели или вершины. Тензорные ядра в современных картах NVIDIA специально созданы для матричных вычислений (здравствуй, DLSS).
NPU (Neural Processing Unit): Это ASIC (специализированная интегральная схема). Он не умеет запускать Windows и плох в рендеринге. Но он дьявольски эффективен в одной задаче: Multiply-Accumulate (MAC) — операции умножения с накоплением, выполняемые над тензорами данных.

Битва Ватт: Ferrari против Электросамоката

В десктопе, где у вас блок питания на 1200 Вт, экономия 20 Вт кажется смешной. Но здесь вступает в силу фактор шума и ресурса. Вы действительно хотите, чтобы вентиляторы вашей видеокарты раскручивались (Stop Fan отключался) каждый раз, когда голосовой ассистент слушает вашу команду? NPU позволяет системе оставаться бесшумной.

Магия (и обман) TOPS: Почему 40 > 1300?

Microsoft установила стандарт для AI PC следующего поколения: NPU должен выдавать не менее 40 TOPS (триллионов операций в секунду), чтобы локально крутить Copilot.

NPU в Intel Core Ultra 200V (Lunar Lake): ~48 TOPS.
NPU в AMD Ryzen AI 300: ~50 TOPS.
NVIDIA GeForce RTX 4090: ~1300+ AI TOPS.

Гейминг + Стриминг

Представьте, что вы играете в тяжелую игру с Path Tracing, загружая GPU на 99%. Если вы параллельно запустите AI-шумодав для микрофона или AI-аватар на GPU, вы отнимете ресурсы у игры. FPS просядет, появятся статтеры.

NPU же работает параллельно, не трогая видеокарту.

Always-on Assistants

Вы хотите спросить у локального ассистента: «Найди в моих документах договор от марта». Заводить ради этого 450-ваттную видеокарту — это как ездить на карьерном самосвале за хлебом. NPU ответит быстрее, потому что он всегда активен и не требует переключения контекста VRAM.

Будущее: NPU станет новым QuickSync

В ближайшие 2-3 года мы увидим переход к гетерогенному AI:

Микро-задачи (NPU): шумоподавление, транскрибация голоса, умный фокус камеры, анализ почты.
Тяжелые задачи (GPU): DLSS/FSR, генерация изображений, обучение моделей.
Супер-тяжелые (Cloud): ChatGPT-5/6 и т.п.

Резюме: Эра AI PC наступила, но софт опоздал на вечеринку. Железо готово, осталось дождаться, когда разработчики научатся им пользоваться.