Механизмы рендеринга на базе видеокарт (GPU), такие как Redshift, Octane или VRAY, значительно усовершенствовались и обгоняют движки рендеринга на базе CPU – как по популярности, так и по скорости.
Но, какое оборудование даёт наибольшую отдачу от вложенных средств, и что вы должны иметь в виду при создании рабочей станции на GPU по сравнению с рабочей станцией для рендеринга на ЦП?
Создание универсальной рабочей станции для 3D-моделирования и рендеринга на ЦП может быть довольно простым делом, но оптимизация производительности рендеринга на ЦП – это совсем другая история.
Итак, какие самые доступные и лучшие части ПК для рендеринга с помощью Octane, Redshift, VRAY или других движков рендеринга на GPU?
Давайте взглянем:
Лучшее оборудование для рендеринга на GPU
-
Процессор для рендеринга на GPU
Поскольку движки рендеринга на GPU используют видеокарту для рендеринга, технически вам следует выбрать процессор с максимальной тактовой частотой, такой как Intel i9 12900K или AMD Ryzen 9 5950X с тактовой частотой 3,4 ГГц (4,9 ГГц Turbo).
Это имеет смысл, потому что ЦП помогает ускорить некоторые части процесса рендеринга, такие как подготовка сцены.
Тем не менее, есть еще один фактор, который следует учитывать при выборе процессора: PCIe.
Графические процессоры подключаются к ЦП через линии PCIe на материнской плате. Разные процессоры поддерживают разное количество линий PCIe.
Графическим процессорам высшего уровня обычно требуется 16 линий PCIe 3.0 для работы с полной производительностью без ограничения полосы пропускания.
Основные процессоры, такие как i9 12900K/5950X, имеют 16 линий PCIe GPU-CPU, это означает, что вы можете использовать только один GPU на полной скорости с такими типами процессоров.
Если вы хотите использовать более одного графического процессора на полной скорости, вам понадобится другой процессор, поддерживающий больше линий PCIe.
Например, процессоры AMD Threadripper отлично подходят для работы с большим количеством графических процессоров. Они имеют 64 линии PCIe (например, Threadripper 3960X).
Однако, графические процессоры также могут работать в режимах с более низкой пропускной способностью, таких как 8-кратная скорость PCIe 3.0 (или 4.0).
Это также означает, что они используют меньше линий PCIe (а именно 8x). Обычно существует незначительная разница в скорости рендеринга, когда графические процессоры текущего поколения работают в режиме 8x вместо 16x.
При пропускной способности x8 PCIe вы можете запустить два графических процессора на i9 12900K или Ryzen 9 5950X. (Всего 16 линий PCIe, если материнская плата и набор микросхем поддерживают двойные графические процессоры и имеют достаточное количество слотов PCIe).
Теоретически вы можете запустить 4 графических процессора в режиме x16 на процессоре Threadripper (64 канала PCIe). К сожалению, это не поддерживается, и лучшее, чего вы можете достичь с процессорами Threadripper, – это конфигурация x16, x8, x16, x8.
ЦП с большим количеством линий PCIe обычно попадают в диапазон платформ HEDT (High-End-Desk-Top) и часто отлично подходят для рендеринга на ЦП, поскольку они имеют больше ядер и, следовательно, более высокую мультипроцессорность.
Вот быстрое сравнение пропускной способности между двумя графическими процессорами Titan X, работающими в режиме x8/x8, x16/x8 и x16/x16. Различия находятся в пределах погрешности.
Однако имейте в виду, что Titan X в этом бенчмарке определенно не перегружает шину x8 PCIe 3.0, а сцена бенчмарка легко вписывается в видеопамять графического процессора, а это означает, что по линиям PCIe не проходит много данных.
При активном рендеринге ваша сцена прекрасно помещается в видеопамять графического процессора, скорость механизмов рендеринга на GPU зависит от производительности графического процессора.
Однако некоторые процессы, которые происходят до и во время рендеринга, в значительной степени зависят от производительности ЦП, хранилища и (возможно) вашей сети.
Например, извлечение и подготовка данных сетки для использования графическим процессором, загрузка высококачественных текстур из хранилища и подготовка данных сцены.
Эти этапы обработки могут занимать значительное время в очень сложных сценах и снижать общую производительность рендеринга, если используются слабый ЦП, диск или ОЗУ.
Если ваша сцена слишком велика, чтобы поместиться в память видеокарты, механизму рендеринга потребуется получить доступ к оперативной памяти системы или даже переключиться на диск, что значительно замедлит рендеринг.
-
Лучшая память (ОЗУ) для рендеринга на GPU
Различные виды ОЗУ не сильно ускорят рендеринг на GPU. Однако, вы должны убедиться, что у вас достаточно оперативной памяти, иначе ваша система будет «зависать».
Помните о следующих правилах, чтобы максимально оптимизировать производительность:
- В целях безопасности размер оперативной памяти должен быть, как минимум, в 1,5-2 раза больше общего размера видеопамяти.
- ЦП может выиграть от более высоких тактовых частот памяти, что, в свою очередь, может немного ускорить рендеринг GPU.
- ЦП может выиграть от большего количества каналов памяти в определенных системах, что может немного ускорить рендеринг.
- Ищите оперативную память с меньшей задержкой (например, CL14 лучше, чем CL16), которая может повысить производительность процессора и, следовательно, также может немного ускорить рендеринг на GPU.
Если вам просто нужна быстрая рекомендация, загляните в Corsair Vengeance Memory, так как мы протестировали эти модули во многих системах рендеринга на GPU и можем рекомендовать без колебаний.
-
Лучшая видеокарта для рендеринга на GPU
Чтобы использовать Octane и Redshift, вам понадобится графический процессор с ядрами CUDA, то есть вам понадобится видеокарта NVIDIA.
Раньше некоторые версии VRAY дополнительно поддерживали OpenCL, то есть вы могли использовать графический процессор AMD, но это уже не так.
Лучшие графические процессоры NVIDIA для рендеринга:
- RTX 3060 Ti (4864 ядра CUDA, 8 ГБ видеопамяти)
- RTX 3070 (5888 ядер CUDA, 8 ГБ видеопамяти)
- RTX 3070 Ti (6144 ядра CUDA, 8 ГБ видеопамяти)
- RTX 3080 (8704 ядра CUDA, 10 ГБ видеопамяти)
- RTX 3080 Ti (10240 ядер CUDA, 12 ГБ видеопамяти)
- RTX 3090 (10496 ядер CUDA, 24 ГБ видеопамяти)
Хотя некоторые графические процессоры Quadro предлагают ещё больше видеопамяти, ценность этих графических процессоров уровня «Pro» хуже для рендеринга GPU по сравнению с обычными или «игровыми» видеокартами.
Есть некоторые функции, такие как ECC VRAM, более высокая точность с плавающей запятой или официальная поддержка и драйверы, которые делают их ценными в глазах промышленных пользователей, для машинного обучения или САПР, и это лишь некоторые из вариантов.
Для ваших потребностей в рендеринге с помощью графического процессора придерживайтесь основных видеокарт RTX, чтобы получить наилучшее соотношение цены и качества.
Охлаждение графического процессора
Кулер воздуходув (рекомендуется для установок с несколькими графическими процессорами):
- Преимущества: лучшее охлаждение при тесной установке более одной видеокарты (тепло выдувается из корпуса)
- Недостатки: громче, чем при открытом охлаждении
Отрытое охлаждение (рекомендуется для установок с одним графическим процессором):
- Преимущества: тише, дешевле, доступно больше моделей
- Недостатки: плохое охлаждение при установке нескольких видеокарт (тепло остаётся в корпусе)
Гибридное охлаждение AiO (контур водяного охлаждения «всё в одном» с вентиляторами):
- Преимущества: лучшее универсальное охлаждение для стекирования карт
- Недостатки: дороже, нужно место для радиаторов в корпусе
Полное пользовательское водяное охлаждение:
- Преимущества: лучшая эффективность, тихая работа
- Недостатки: требует много дополнительного места в корпусе для бака и радиаторов, намного дороже
Видеокарты NVIDIA используют технологию Boosting, которая автоматически разгоняет графический процессор до определенной степени, пока он остаётся в заданном пределе температуры и мощности.
Убедитесь, что ваш графический процессор остаётся максимально холодным, что позволит ему работать дольше на максимальных оборотах и, следовательно, повысить производительность.
Вы можете наблюдать этот эффект, особенно в ноутбуках, где мало места для охлаждения, а графические процессоры очень сильно нагреваются, шумят и очень рано тормозят. Так что если вы думаете о рендеринге на ноутбуке, имейте это в виду.
-
Блок питания для рендеринга GPU
Обязательно приобретите достаточно мощный блок питания для вашей системы. Большинство видеокарт имеют типичную потребляемую мощность около 180-250 Вт, хотя видеокарты Nvidia RTX 3080 и 3090 могут потреблять ещё больше.
Я рекомендую не менее 650 Вт для сборки с одним GPU. Добавьте 250 Вт для каждого дополнительного графического процессора, установленного в вашей системе.
Хорошими производителями блоков питания, на которых стоит обратить внимание, являются Corsair, beQuiet, Seasonic и CoolerMaster, но вы можете предпочесть других.
-
Материнская плата и линии PCIe
Убедитесь, что материнская плата имеет необходимое количество линий PCIe и не использует общие линии со слотами SATA или M.2.
Учитывайте, какие конфигурации PCIe поддерживает материнская плата. Некоторые из них имеют 3 или 4 физических слота PCIe, но поддерживают только одну карту PCIe x16.
Это может быть довольно запутанным.
Посетите веб-сайт производителя материнской платы, чтобы убедиться, что конфигурация с несколькими графическими процессорами, к которой вы стремитесь, поддерживается.
Вот пример того, что вам следует искать в спецификациях материнской платы:
В приведенном выше примере вы сможете использовать (с ЦП на 40 линий PCIe) 1 графический процессор в режиме x16. Или 2 графических процессора в режимах x16, или 3 графических процессора, один в режиме x16 и два из них в режиме x8 и так далее. Имейте в виду, что ЦП с 28 линиями PCIe в этом примере будут поддерживать другие конфигурации графических процессоров, чем ЦП с 40 линиями.
В настоящее время процессоры AMD Threadripper дадут вам 64 линии PCIe для подключения ваших графических процессоров, если вы хотите больше, вам придётся пойти по пути Epyc или Xeon.
Чтобы ещё больше запутать ситуацию, некоторые материнские платы предлагают возможность подключения четырёх графических процессоров x16 (требуется 64 линии PCIe) на процессорах только с 44 линиями PCIe. Как это вообще возможно?
Дело в чипах PLX.
На некоторых материнских платах эти чипы служат «переключателем», управляя линиями PCIe и заставляя ЦП полагать, что используется меньше линий.
Таким образом, вы можете использовать, например, 32 линии PCIe с ЦП с 16 линиями PCIe или 64 линии PCIe с ЦП с 44 линиями.
Однако будьте осторожны, только несколько материнских плат имеют эти чипы PLX. Asus WS X299 Sage является одной из них, позволяющей использовать до 7 видеокарт x8 с 44-канальным ЦП или даже 4 видеокарты x16 на 44-канальном ЦП.
Ускорьте время рендеринга с мульти-GPU
Примечание. Этот раздел немного продвинутый. Не стесняйтесь пропускать это.
Видеокарты, к сожалению, не всегда идеально масштабируются. 2 графических процессора отображают изображение примерно в 1,9 раза быстрее. Наличие 4 графических процессоров приводит к ускорению рендеринга, примерно, в 3,6 раза.
Наличие нескольких графических процессоров, взаимодействующих друг с другом для рендеринга одной и той же задачи, снижает производительность настолько, что большая часть одного графического процессора в установке с 4 видеокартами используется только для управления.
Одним из решений может быть следующее: при окончательном рендеринге последовательностей изображений используйте как можно меньше графических процессоров для каждой задачи.
Сделаем пример:
Что мы обычно делаем в установке с несколькими видеокартами, так это заставляем все графические процессоры работать над одной и той же задачей. В этом случае единственной задачей будет изображение в нашей последовательности изображений.
. графических процессора вместе отображают одно изображение, а затем переходят к следующему изображению в последовательности изображений, пока вся последовательность не будет визуализирована.
Мы можем ускорить время подготовки для каждого графического процессора (когда они бездействуют, ожидая, пока процессор завершит подготовку сцены) и обойти некоторые замедления работы нескольких видеокарт, когда каждый графический процессор обрабатывает свою собственную задачу. Мы можем сделать это, отрендерив одну задачу на каждый GPU.
Таким образом, машина с 4 видеокартами будет отображать 4 задачи (4 изображения) одновременно, каждое на одном графическом процессоре, вместо 4 графических процессоров, работающих над одним и тем же изображением, как раньше.
Некоторое 3D-программное обеспечение может иметь эту встроенную функцию, если нет, лучше использовать какой-либо менеджер рендеринга, такой как Thinkbox Deadline (бесплатно для 2 узлов/компьютеров).
Помните, однако, что вам, возможно, придётся немного увеличить системную оперативную память и иметь мощный процессор, поскольку для каждой задачи с графическим процессором требуется свой объём оперативной памяти и производительность процессора.
Redshift или Octane – что выбрать
Меня часто спрашивают, стоит ли использовать Redshift или Octane.
Поскольку я сам широко использовал оба, по моему опыту, благодаря Shader Graph Editor и обширному Multi-Pass Manager Redshift, мне больше нравится использовать Redshift для выполнения работы, которая требует сложных настроек материалов и тяжелой композиции.
Octane отлично подходит, если вы хотите получить быстрые результаты, так как его кривая обучения более пологая. Но это, конечно, личное мнение и хотелось бы услышать ваше!
Ответы на часто задаваемые вопросы о рендере на GPU
GPU или CPU – что важнее для рендеринга?
Это зависит от движка рендеринга, который вы используете. Если вы используете движок рендеринга на графическом процессоре, такой как Redshift, Octane или Cycles GPU, то видеокарта будет значительно важнее для рендеринга, чем центральный процессор.
Для движков рендеринга на ЦП, таких как Cycles CPU, V-Ray CPU, Arnold CPU, более важным будет центральный процессор.
Интересно, что центральный процессор также играет незначительную роль в максимизации производительности рендеринга с помощью графического процессора. Процессоры с высокой одноядерной производительностью не создают узких мест для видеокарты.
Лучше ли RTX, чем GTX для рендеринга?
Да, видеокарты RTX от Nvidia работают лучше в графическом рендеринге, чем GTX. Причина проста: RTX обозначает более высокоуровневые и более дорогие графические процессоры, которые работают лучше по сравнению с линейкой GTX от Nvidia, а также имеют ядра с трассировкой лучей, что может дополнительно повысить производительность рендеринга в поддерживаемых движках.
Помогает ли увеличение оперативной памяти рендерингу?
Больше оперативной памяти ускорит ваш рендеринг только в том случае, если у вас её слишком мало. Видите ли, оперативная память действительно ограничивает производительность только в том случае, если она заполнена и данные приходится выгружать на диск.
Если у вас простая 3D-сцена, которой для рендеринга требуется всего 16 ГБ ОЗУ, то 32, 64 или 128 ГБ ОЗУ ничего не сделают для этой конкретной задачи. Если до этого у вас было всего 8 ГБ ОЗУ, то установка большего объема ОЗУ значительно повысит производительность рендеринга.
Помогает ли больше VRAM для рендеринга?
Как и в случае с оперативной памятью, увеличение объёма видеопамяти помогает повысить производительность только в тех сценариях, где изначально её было слишком мало.
Если ваша 3D-сцена полностью помещается в видеопамять вашей видеокарты, то наличие графического процессора с большим объёмом видеопамяти вообще не повлияет на производительность (учитывая, что все остальные характеристики равнозначны).
Конечно, многие механизмы рендеринга на GPU могут использовать большие деревья лучей или другие оптимизации, если имеется больше свободной видеопамяти, поэтому в зависимости от механизма рендеринга вы можете увидеть небольшое ускорение с большим объёмом видеопамяти, даже если ваша сцена проста и легко помещается в VRAM.