Китай превращает современные видеокарты GeForce RTX 4090 в ИИ-ускорители. Что происходит?

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

В конце лета 2023 года мы писали о том, что Китай пользуется лазейкой с урезанными версиями ИИ-ускорителей. Дело в том, что Китай не имел возможности покупать (во всяком случае, официально) ускорители А100 и Н100. Но Nvidia ранее выпустила искусственно урезанные версии этих систем, А800 и Н800. Сделано это для обхода экспортных ограничений.

Но чуть позже США запретили ввоз в страну любых ИИ-чипов производства Nvidia, AMD и Intel. Китаю пришлось искать новые способы заполучить производительные графические чипы. Насколько можно понять, Поднебесная нашла и пока что активно пользуется таким способом. Подробности — под катом.

Санкции? Какие санкции?


Компании, указанные выше, не могут ввозить в Китай графические чипы, предназначенные для ИИ-отрасли. Дело в том, что они используют американские технологии. Соответственно, обязаны соблюдать правила экспорта, установленные регуляторами США. В целом, компании так и делают, но есть и небольшие хитрости, позволяющие продолжать поставки современного оборудования покупателям из Китая.

Например, Nvidia создала урезанную версию ускорителя А100 под названием А800. Его отличием от оригинала стала пониженная примерно на треть скорость двунаправленной передачи данных (bidirectional transfer rate; BTR), что и позволило обойти новые ограничения.

Ну а чуть позже появилась и урезанная версия Н100, которую Nvidia модифицирует для китайских потребителей. Кастомизированная версия системы продается под другим названием — не H100, а Н800.

Насколько известно, вариант системы, которая поставляется в Китай, искусственно «замедлен». Т.е. у ускорителя сниженные характеристики пропускной способности. Так, если у H100 это 300 Гбит/с, то у китайской версии — всего 150 Гбит/с.

Не только Nvidia, но и Intel тоже не желает терять покупателей из Поднебесной. Ранее стало известно о том, что корпорация Intel начала продажу Китаю ускорителей Habana Gaudi 2. Как и в случае систем от Nvidia, они предназначены для работы с задачами глубинного обучения и инференса (обеспечение работы предварительно обученной нейросети на конечном устройстве). При этом сам по себе ускоритель — система, которую нельзя в текущем виде поставлять в Китай, в силу ограничений, наложенных США на эту страну.

Но теперь все эти возможности канули в Лету, поскольку США ужесточило санкции, в результате чего ни полноценные, ни урезанные ИИ-чипы не могут поставляться в КНР.

А что предприняли китайцы?


Они стали закупать огромное количество современных игровых видеокарт Nvidia GeForce RTX 4090 производства различных компаний. Но не для создания игровых ПК, а для того, чтобы превратить графические адаптеры в ускорители для искусственного интеллекта.



Карта 4090 была выбрана потому, что это наиболее продвинутый графический адаптер в мире. Вскоре после выхода она стала дефицитом, и не только потому, что ее стали разбирать геймеры. Скорее, потому, что Китай стал закупать эти адаптеры едва ли не тоннами, несмотря на то, что стоимость одного устройства составляет примерно $2000.

К слову, сейчас и 4090 попали под запрет в плане поставок в Китай. Но еще до введения этого запрета компании КНР успели закупить огромное количество видеокарт. Предварительно была разработана схема кастомизации таких модулей, с тем, чтобы можно было превратить их в ИИ-ускорители. Китайцы разработали для них новую схему, так что после доработки 4090 карты занимают уже не 3-4 слота в блоке, а всего 2. А значит, их можно устанавливать в сервера.


Работа при этом достаточно кропотливая, поскольку приходится выполнять большинство операций вручную. Китайцы разбирают карты, ликвидируя систему охлаждения, а затем основные компоненты. Для создания ИИ-ускорителя разработана специальная плата, на которую эти компоненты и переносятся. Итоговый продукт отлично работает в серверах, выполняя нужную КНР работу.

Весь процесс достаточно сложный, почти все этапы реализуются людьми, так что приходится тщательно проверять работоспособность адаптеров. Это китайцы делают весьма тщательно. Кроме специализированного софта, вроде Furmark, карты тестируют и в приложениях искусственного интеллекта. Если с картами все хорошо, их отправляют китайским же компаниям, которые разрабатывают ИИ-продукты.

Гибридный графический адаптер закупаются операторами дата-центров Китая, компаниями, которые производят решения для ИИ-отрасли. Внутренний рынок страны действительно очень большой, так что для компаний, которые перерабатывают новые графические адаптеры, действительно есть смысл выполнять такую работу.


Ну а основу, плату без чипа 4090 и пары других компонентов, китайцы тоже продают, только уже на запчасти. Сервисные центры подобное охотно закупают, поскольку если плата видеокарты выходит из строя (физическое воздействие, серьезное выгорание разъемов питания и т.п.), что ее можно восстановить, используя донора — ту самую «голую» плату от 4090.


Ну хорошо, а что с самими картами?


Как и говорилось выше, они быстро стали дефицитом. Но сейчас США запретили компаниям поставлять в Китай и их, так что игроки рынка надеются на скорое восстановление баланса спрос/предложение. В течение относительно которого времени Китайцы создали настолько ажиотажный спрос, что и так вовсе не низкая цена на 4090-карты поднялись очень высоко. Ну а сами карты стали дефицитом.

Специалисты надеются, что после вступления запрета на поставку адаптеров китайцев спрос быстро придет в норму, а цены попадают.

Другие интересные материалы


  • Рутина продакта: путешествие из ХЗ в ТЗ
  • Что такое микросервисная архитектура
  • Полезные функции DevTools для тестировщиков
Источник: https://habr.com/ru/companies/selectel/articles/776412/


Интересные статьи

Интересные статьи

Стоя в обычной пробке в час пик, что только не придёт в скучающую голову. В один прекрасный вечер, наблюдая за пешеходами, с гордостью превышающими скорость авт...
Ввиду того, что мы не можем раскрывать данные клиентов, мы удалили с изображений ниже часть данных, но поверьте, что для понимания масштаба кликфрода, это будет не критично. В данном кейсе люди теряли...
Микроэлектромеханические системы (МЭМС) — устройства, объединяющие в себе микроэлектронные и микромеханические компоненты. Сейчас довольно трудно встретить системы в которых не используют...
В статье "Contemporary Front-end Architectures" рассмотрены архитектуры фронт-энда с точки зрения потоков данных в исторической ретроспективе. Материал состоит из трех частей Тео...
— Слушайте, а какой пульс должен быть во время пробежки? — Ну не знаю – ударов 150. — Да? А чего у меня 840? — 840 в минуту?! — А что, надо было в минуту считать что ли? — А ты как считал? ...