Нейронные блоки в процессорах: зачем они нужны и как работают

Нейронные блоки в процессорах: зачем они нужны и как работают
Нейронные блоки в процессорах: зачем они нужны и как работают (источник изображения)

В 2024 и 2025 годах индустрия железа переживает настоящий бум искусственного интеллекта. Если раньше нам продавали гигагерцы и количество ядер, то теперь маркетологи Intel, AMD и Qualcomm меряются TOPS (триллионами операций в секунду). Нам обещают эру «AI PC», встраивают нейронные блоки (NPU) даже в бюджетные «камни» и лепят отдельные кнопки для вызова ассистентов на клавиатуры.

Архитектурный ликбез: Скаляр, Вектор и Матрица

Чтобы понять, зачем нужен NPU (Neural Processing Unit), нужно вспомнить, как мыслят разные компоненты вашего ПК.

  • CPU (Central Processing Unit): Это универсальный солдат. Он великолепен в последовательных задачах, ветвлениях и управлении логикой. Но когда нужно перемножить две огромные матрицы (основа работы нейросетей), CPU захлебывается. Для него это миллионы тактов.
  • GPU (Graphics Processing Unit): Король параллелизма. Тысячи ядер могут одновременно обрабатывать пиксели или вершины. Тензорные ядра в современных картах NVIDIA специально созданы для матричных вычислений (здравствуй, DLSS).
  • NPU (Neural Processing Unit): Это ASIC (специализированная интегральная схема). Он не умеет запускать Windows и плох в рендеринге. Но он дьявольски эффективен в одной задаче: Multiply-Accumulate (MAC) — операции умножения с накоплением, выполняемые над тензорами данных.

Битва Ватт: Ferrari против Электросамоката

В десктопе, где у вас блок питания на 1200 Вт, экономия 20 Вт кажется смешной. Но здесь вступает в силу фактор шума и ресурса. Вы действительно хотите, чтобы вентиляторы вашей видеокарты раскручивались (Stop Fan отключался) каждый раз, когда голосовой ассистент слушает вашу команду? NPU позволяет системе оставаться бесшумной.

Магия (и обман) TOPS: Почему 40 > 1300?

Microsoft установила стандарт для AI PC следующего поколения: NPU должен выдавать не менее 40 TOPS (триллионов операций в секунду), чтобы локально крутить Copilot.

  • NPU в Intel Core Ultra 200V (Lunar Lake): ~48 TOPS.
  • NPU в AMD Ryzen AI 300: ~50 TOPS.
  • NVIDIA GeForce RTX 4090: ~1300+ AI TOPS.

Гейминг + Стриминг

Представьте, что вы играете в тяжелую игру с Path Tracing, загружая GPU на 99%. Если вы параллельно запустите AI-шумодав для микрофона или AI-аватар на GPU, вы отнимете ресурсы у игры. FPS просядет, появятся статтеры.

NPU же работает параллельно, не трогая видеокарту.

Always-on Assistants

Вы хотите спросить у локального ассистента: «Найди в моих документах договор от марта». Заводить ради этого 450-ваттную видеокарту — это как ездить на карьерном самосвале за хлебом. NPU ответит быстрее, потому что он всегда активен и не требует переключения контекста VRAM.

Будущее: NPU станет новым QuickSync

В ближайшие 2-3 года мы увидим переход к гетерогенному AI:

  • Микро-задачи (NPU): шумоподавление, транскрибация голоса, умный фокус камеры, анализ почты.
  • Тяжелые задачи (GPU): DLSS/FSR, генерация изображений, обучение моделей.
  • Супер-тяжелые (Cloud): ChatGPT-5/6 и т.п.

Резюме: Эра AI PC наступила, но софт опоздал на вечеринку. Железо готово, осталось дождаться, когда разработчики научатся им пользоваться.

News Express Team
News Express Team

Команда News Express, состоящая из опытных редакторов и журналистов, предоставляет своевременные и надежные репортажи о российской политике, экономике, технологиях и мировых событиях с уникальной региональной точки зрения. Будьте в курсе событий с нашими преданными журналистами.

ru_RURU