» » Список графических процессоров Nvidia

Список графических процессоров Nvidia

19.12.2020


Эта таблица содержит основную информацию о графических процессорах NVIDIA серии GeForce и видеокартах, построенных на официальных спецификациях NVIDIA.

Замечания о версиях DirectX

Версия DirectX обозначает ключевую доступную особенность.

  • DirectX 6.0 — мультитекстурирование
  • DirectX 7.0 — аппаратная поддержка преобразований, обрезания и освещения
  • DirectX 8.0 — шейдерная модель 1.1
  • DirectX 8.1 — пиксельные шейдеры 1.4 и вершинные шейдеры 1.1
  • DirectX 9.0 — шейдерная модель 2.0
  • DirectX 9.0b — пиксельные шейдеры 2.0b и вершинные шейдеры 2.0
  • DirectX 9.0c — шейдерная модель 3.0
  • DirectX 9.0L — версия DirectX 9.0 для Windows Vista
  • DirectX 10 — шейдерная модель 4.0 (только Windows Vista, Windows 7)
  • DirectX 10.1 — шейдерная модель 4.1 (только Windows Vista, Windows 7)
  • DirectX 11 — шейдерная модель 5.0 (только Windows Vista, Windows 7)
  • DirectX 11.1 — шейдерная модель 5.1 (только Windows Vista, Windows 7)
  • DirectX 11.3/DirectX 12 — шейдерная модель 5.1 (только Windows 10).

Замечания о версиях OpenGL

Версия OpenGL обозначает то, какие операции графического ускорения поддерживает данная графическая карта.

  • OpenGL 1.1 — объекты текстур
  • OpenGL 1.2 — 3D-текстуры, форматы BGRA и упакованных пикселей
  • OpenGL 1.3 — мультитекстурирование, multisampling, сжатие текстур
  • OpenGL 1.4 — текстуры глубины
  • OpenGL 1.5 — VBO, Occlusion Querys
  • OpenGL 2.0 — GLSL 1.1, MRT, текстуры с размерами, не являющимися степенью двойки, Point Sprites, Two-sided stencil
  • OpenGL 2.1 — GLSL 1.2, Pixel Buffer Object (PBO), текстуры sRGB
  • OpenGL 3.0 — GLSL 1.3, Массивы текстур, условный рендеринг , FBO
  • OpenGL 3.1 — GLSL 1.4, Instancing, Texture Buffer Object, Uniform Buffer Object, Primitive restart
  • OpenGL 3.2 — GLSL 1.5, Geometry Shader, Multi-sampled textures
Buffer Object: FBO (Frame), VBO (Vertex), PBO (Pixel), Texture, Uniform
  • OpenGL 4.0 — GLSL 4.00, Тесселяция на GPU, шейдеры с 64-битной точностью.

Расшифровка обозначений в полях таблицы

Поля таблицы, перечисленные ниже, обозначают следующее:

  • Модель — рыночное название для графического процессора (ГП), присвоенное nVidia.
  • Год(дата) — год (дата) выпуска процессора.
  • Кодовое имя — внутреннее имя процессора в процессе разработки (обычно обозначается именем вида NVXY и позже GXY, где X обозначает серийный номер поколения, а Y — этап проекта для этого поколения.
  • Техпроцесс — средний размер элементарных компонентов процессора.
  • Шина — шина, по которой графический процессор подключен к системе (обычно слот расширения, такой как PCI, AGP или PCI-Express).
  • Макс. объём памяти — максимальное количество памяти, которое может использоваться процессором.
  • Частота ядра — максимальная фабричная частота ядра (так как некоторые производители графических карт могут её увеличивать или уменьшать, эта частота всегда является официально специфицированной nVidia).
  • Частота памяти — максимальная фабричная частота работы с памятью (так как некоторые производители графических карт могут её увеличивать или уменьшать, эта частота всегда является официально специфицированной nVidia).
  • Конвейеры x TMU x VPU — список, состоящий из количества пиксельных конвейеров, текстурных обработчиков (на каждый конвейер) и вершинных обработчиков в процессоре. В поздних моделях шейдеры интегрированы в унифицированную шейдерную архитектуру, в результате любой шейдер может выполнять любую из трёх перечисленных функций. Графические процессоры с ограниченным функционированием обработчика T&L обозначаются, как имеющие 0.5 VPU.
  • SPU x TAU x ROP — список, состоящий из количества шейдерных процессоров, обработчиков текстурных адресов (общее количество) и операторов растеризации (общее количество) в процессоре.
  • Скорость заполнения — максимальная теоретически доступная скорость заполнения (филрейт) в текстурированных пикселях в секунду. Это количество в основном используется как «максимальная пропускная способность» для графического процессора и в основном более высокая скорость заполнения характеризует более мощные (и быстрые) ГП.
  • Пропускная способность памяти — максимальная теоретическая пропускная способность процессора, работающего на фабричной частоте с фабричной разрядностью шины (здесь ГБ=109 байт).
  • Тип шины памяти — тип используемой шины памяти.
  • Ширина шины памяти — максимальная используемая ширина шины памяти в битах. Это всегда фабричная ширина шины.
  • Direct X — максимальная полностью поддерживаемая версия Direct3D.
  • Open GL — максимальная полностью поддерживаемая версия OpenGL.
  • Особенности — дополнительные особенности.

Сравнительная таблица: десктопные графические процессоры

До GeForce

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации

GeForce series

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации

GeForce 2 Series

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
  • 2 GeForce2 Ti VX никогда не представлялся официально, хотя это — не что иное, как GeForce2 Ti со сниженной частотой.

GeForce 3 Series

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации

GeForce 4 Series

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации

AGP 3.0 обозначает понижение напряжения и увеличение максимальной теоретической полосы пропускания (доступные скорости 4X и 8X, вместо 2X и 4X); сами ядра не имели никаких изменений (от NV17 до NV18 или NV25 к NV28). Кроме увеличенной тактовой частоты и уменьшенного напряжения колебания сигнала (от 1.5 V к 0.8 V), AGP 3.0 все еще поддерживает sideband адресацию (позднее добавлена к спецификациям AGP 1.0, увеличила практическую пропускную способность), и быструю запись (в спецификациях AGP 2.0, данные прямо записываются в памяти видеокарты).

GeForce 5 Series

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
  • * NV31, NV34 и NV36 используют 2x2 конвейерный дизайн, выполняя вертексный шейдер, в остальных случаях используют 4x1 конвейерный дизайн.
  • ** GeForce FX series имеют ограниченную поддержку OpenGL 2.1 (с последним драйвером Windows XP, выпущенным для этого, 175.19).

GeForce 6 Series

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
  • 2 Графическая карта, поддерживающая TurboCache в размер памяти входит полная память (VRAM + System RAM), иначе входит только VRAM

GeForce 7 Series

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
  • 2 Для графической карты, поддерживающей TurboCache в размер памяти входит полная память (VRAM + System RAM), иначе входит только VRAM

GeForce 8 Series

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Полный G80 содержит 32 блока адресации текстур и 64 блока фильтрации текстур, в отличие от G92, который содержит 64 блока адресации текстур и 64 блока фильтрации текстур
  • 3 С этих видеокарт начинается поддержка OpenGL 3.3.

GeForce 9 Series

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации

GeForce 100 Series

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации

GeForce 200 Series

  • 1 Потоковый процессор : Текстурный блок : Блок растеризации

GeForce 300 Series

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Каждый потоковый мультипроцессор(SM) в GPU архитектуры G80/GT200 содержит 8 шейдерных процессоров(SP) и 2 блока специализированных функций(SFU). Каждый SP может выполнять до двух операций MAD(ADD+MUL) одинарной точности за такт, а каждый SFU до четырех операций за такт (эти блоки также могут обрабатывать одно умножение одинарной точности с плавающей запятой за такт). Пиковое соотношение операций выполняемыми SP к операциям выполняемыми SFU 2:1. Теоретическая суммарная производительность [FLOPSsp+sfu, GFLOPS] блоков SP и SFU рассчитывается по формуле:FLOPSsp+sfu ≈ f × n × 3 , где [n] — количество SP, [f, GHz] — их частота. Аналогичная формула: FLOPSsp+sfu ≈ f × m × (8 SPs × 2 (MAD) + 4 × 2 SFUs), где [m] — количество SM.

GeForce 400 Series

  • Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • Каждый потоковый мультипроцессор (SM) в GPU архитектуры GF100 содержит 32 шейдерных процессора (SP) и 4 блока специализированных функций(SFU).
  • Каждый потоковый мультипроцессор (SM) в GPU архитектуры GF104/GF106/GF108 содержит 48 шейдерных процессоров (SP) и 8 блоков специализированных функций(SFU). Каждый SP может выполнять до двух операций FMA (Fused ADD+MUL) одинарной точности за такт, а каждый SFU до четырех операций за такт. Пиковое соотношение операций выполняемыми SP к операциям выполняемыми SFU: для GF100 SFU 4:1, для GF104/106/108 3:1.
  • Теоретическая производительность [FLOPSsp+sfu, GFLOPS] блоков SP рассчитывается по формуле:FLOPSsp ≈ f × n × 2 , где [n] — количество SP [f, GHz] — их частота. Аналогичная формула: для GF100 FLOPSsp ≈ f × m × (32 SPs × 2 (FMA), для GF104/106/108 FLOPSsp ≈ f × m × (48 SPs × 2(FMA)), где [m] — количество SM. Полную производительность GPU можно рассчитать по формуле: для GF100 FLOPSsp ≈ f × m ×(32 SPs × 2(FMA)+ 4 × 4 SFUs), для GF104/106/108 FLOPSsp ≈ f × m × (48 SPs × 2(FMA) + 4 × 8 SFUs) или для GF100 FLOPSsp ≈ f × n × 2.5, для GF104/106/108 FLOPSsp ≈ f × n × 8 / 3.

GeForce 500 Series

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Каждый потоковый мультипроцессор(SM) в GPU архитектуры GF110 содержит 32 шейдерных процессора(SP) и 4 блока специализированных функций(SFU). Каждый SP может выполнять до двух операций FMA(Fused ADD+MUL) одинарной точности за такт, а каждый SFU — до четырех операций за такт. Пиковое соотношение операций выполняемыми SP к операциям выполняемыми SFU: для GF100 SFU 4:1. Теоретическая производительность [FLOPSsp+sfu, GFLOPS] блоков SP рассчитывается по формуле:FLOPSsp ≈ f × n × 2 , где [n] — количество SP [f, GHz] — их частота. Аналогичная формула: для GF110 FLOPSsp ≈ f × m × (32 SPs × 2 (FMA), где [m] — количество SM. Полную производительность GPU можно рассчитать по формуле: для GF110 FLOPSsp ≈ f × m × (32 SPs × 2(FMA) + 4 × 4 SFUs) или для GF110 FLOPSsp ≈ f × n × 2.5.

GeForce 600 Series

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 GeForce 605 (OEM) — переименованная GeForce 510.
  • 3 GeForce GT 610 — переименованная GeForce GT 520.
  • 4 GeForce GT 620 (OEM) — переименованная GeForce GT 520.
  • 5 GeForce GT 620 — переименованная GeForce GT 530.
  • 6 GeForce GT 630 (DDR3) — переименованная GeForce GT 440 (DDR3).
  • 7 GeForce GT 630 (GDDR5) — переименованная GeForce GT 440 (GDDR5).
  • 8 GeForce GT 640 (OEM) — переименованная GeForce GT 545 (DDR3).
  • 9 GeForce GT 645 (OEM) — переименованная GeForce GTX 560 SE.

GeForce 700 Series

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на базовую тактовую частоту ядра.
  • 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на базовую тактовую частоту ядра.
  • 4 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на базовую частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
  • 5 Производительность GTX Titan в операциях над 64-битными числами составляет 1/3 от его производительности при работе над 32-битными, тогда как для прочих чипов на базе Kepler это соотношение равно 1/24.

GeForce 900 Series

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на максимальную тактовую частоту ядра.
  • 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на максимальную тактовую частоту ядра.
  • 4 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
  • 5 Производительность в операциях над 64-битными числами для чипов на базе «Maxwell» составляет 1/32 от его производительности при работе над 32-битными.
  • 6 SLI поддерживает подключение до 4 графических процессоров одинаковых карт для конфигурации 4-Way SLI. То есть, 4-way SLI включает поддержку 3-way SLI и 2-way SLI, однако двухчиповые карты уже сконфигурированы в 2-way SLI, поэтому они поддерживают 4-way SLI с одинаковыми двухчиповыми картами, но не поддерживает 3 -way SLI.
  • 7 В связи с отключением одного или более блока кэша L2/ROP блоков без отключения контроллеров памяти, изначально подключенных к отключенным блокам, память была сегментирована. Для достижения пиковой скорости из одного блока должно производиться чтение, в другой — запись.
  • 8 Видеокарты серии GTX 950—980 TI. Titan X. всех дочерних производителей (Asus, Gigabyte, Zotac, KFA, Palit.) не являются средством шифрования и криптографии. Не могут участвовать в построении станций шифрования.
  • 9 Является инновационной функцией масштабирования — общая графика в компьютере, более мощные технологии, то NVIDIA ® SLI ™ получит выгоду от увеличения пропускной способности шины архитектуры PCI экспресс ™решения, оборудование и программное обеспечение. Интеллектуальное программное обеспечение, которое позволяет множественные графические процессоры NVIDIA

GeForce 10 Series

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальной частоте, но у 1000 Series видеокарт NVIDIA частота ядра без разгона может превышать даже паспортную максимальную частоту.(максимальная тактовая частота * кол-во блоков растеризации)
  • 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальной частоте. (максимальная тактовая частота * кол-во блоков текстурных блоков)
  • 4 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
  • 5 Производительность в FLOPS двойной точности (64-бит) равна 1/XXFP32 У «xxxx». В других видеокартах на этой архитектуре производительность FP64 может быть другой.

GeForce 16 Series

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во блоков растеризации).
  • 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во текстурных блоков)
  • 4 Пропускная способность памяти (псп) рассчитывается по формуле: Частота памяти * разрядность шины / 8. (8 — переводной коэффициент из бит в Байты)
  • 5 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту шейдера. Если не указана максимальная частота шейдера, умножайте на максимальную частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
  • 6 Производительность в FLOPS двойной точности (64-бит) равна 1/XXFP32 У «xxxx». В других видеокартах на этой архитектуре производительность FP64 может быть другой.

GeForce 20 Series

}
  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во блоков растеризации).
  • 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во текстурных блоков)
  • 4 Пропускная способность памяти (псп) рассчитывается по формуле: Частота памяти * разрядность шины / 8. (8 — переводной коэффициент из бит в Байты)
  • 5 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту шейдера. Если не указана максимальная частота шейдера, умножайте на максимальную частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
  • 6 Производительность в FLOPS двойной точности (64-бит) равна 1/XXFP32 У «xxxx». В других видеокартах на этой архитектуре производительность FP64 может быть другой.

Таблица вычислительных возможностей (compute capability)

Подробнее на странице CUDA.

Сравнительная таблица: мобильные графические процессоры

GeForce 2 Go series

GeForce 2 Go series для ноутбуков.

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации

GeForce 4 Go series

GeForce 4 Go series для ноутбуков.

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации

GeForce FX Go 5 (Go 5xxx) series

GeForce FX Go 5 series для ноутбуков.

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
  • * NV31, NV34 и NV36 используют 2x2 конвейерный дизайн, выполняя вертексный шейдер, в остальных случаях используют 4x1 конвейерный дизайн.
  • ** GeForce FX series имеют ограниченную поддержку OpenGL 2.1 (с последним драйвером Windows XP, выпущенным для этого, 175.19).

GeForce Go 6 (Go 6xxx) series

GeForce Go 6 series для ноутбуков.

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
  • 2 Для графической карты, поддерживающей TurboCache в размер памяти входит полная память (VRAM + System RAM), иначе входит только VRAM

GeForce Go 7 (Go 7xxx) series

GeForce Go 7 series для ноутбуков.

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
  • 2 Для графической карты, поддерживающей TurboCache, в размер памяти входит полная память (VRAM + System RAM), иначе входит только VRAM

GeForce 8M (8xxxM) series

GeForce 8M series для ноутбуков.

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации

GeForce 9M (9xxxM) series

GeForce 9M series для ноутбуков.

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации

GeForce 100M (1xxM) series

GeForce 100M series для ноутбуков.

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 103M, 105M, 110M, 130M переименованные GPU, то есть используются те же самые ядра GPU предыдущего поколения, 9M, с обещанной оптимизацией на других особенностях

GeForce 200M (2xxM) series

GeForce 200M series для ноутбуков.

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации

GeForce 300M (3xxM) series

GeForce 300M series для ноутбуков.

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Каждый потоковый мультипроцессор(SM) в GPU архитектуры G80/GT200 содержит 8 шейдерных процессоров(SP) и 2 блока специализированных функций(SFU). Каждый SP может выполнять до двух операций MAD(ADD+MUL) одинарной точности за такт, а каждый SFU — до четырех операций за такт (эти блоки также могут обрабатывать одно умножение одинарной точности с плавающей запятой за такт). Пиковое соотношение операций выполняемыми SP к операциям выполняемыми SFU 2:1. Теоретическая суммарная производительность [FLOPSsp+sfu, GFLOPS] блоков SP и SFU рассчитывается по формуле:FLOPSsp+sfu ≈ f × n × 3 , где [n] — количество SP, [f, GHz] — их частота. Аналогичная формула: FLOPSsp+sfu ≈ f × m × (8 SPs × 2 (MAD) + 4 × 2 SFUs), где [m] — количество SM.

GeForce 400M (4xxM) series

GeForce 400M series для ноутбуков.

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Каждый потоковый мультипроцессор(SM) в GPU архитектуры GF100 содержит 32 шейдерных процессора(SP) и 4 блока специализированных функций(SFU). Каждый потоковый мультипроцессор(SM) в GPU архитектуры GF104/GF106/GF108 содержит 48 шейдерных процессоров(SP) и 8 блоков специализированных функций(SFU). Каждый SP может выполнять до двух операций FMA(Fused ADD+MUL) одинарной точности за такт, а каждый SFU — до четырех операций за такт. Пиковое соотношение операций выполняемыми SP к операциям выполняемыми SFU: для GF100 SFU 4:1, для GF104/106/108 3:1. Теоретическая производительность [FLOPSsp+sfu, GFLOPS] блоков SP рассчитывается по формуле:FLOPSsp ≈ f × n × 2 , где [n] — количество SP [f, GHz] — их частота. Аналогичная формула: для GF100 FLOPSsp ≈ f × m × (32 SPs × 2 (FMA), для GF104/106/108 FLOPSsp ≈ f × m × (48 SPs × 2(FMA)), где [m] — количество SM. Полную производительность GPU можно рассчитать по формуле: для GF100 FLOPSsp ≈ f × m ×(32 SPs × 2(FMA)+ 4 × 4 SFUs), для GF104/106/108 FLOPSsp ≈ f × m × (48 SPs × 2(FMA) + 4 × 8 SFUs) или для GF100 FLOPSsp ≈ f × n × 2.5, для GF104/106/108 FLOPSsp ≈ f × n × 8 / 3.
  • 3 Каждый SM в GF100 также содержит 4 блока адресации текстур и 16 блоков фильтрации текстур. Всего для GF100 c 16 SM получаем 64 блока адресации текстур и 256 блоков фильтрации текстур. Каждый SM в GF104/GF106/108 также содержит 8 блоков адресации текстур и 32 блока фильтрации текстур. Каждый SM в GF104/GF106/108 также содержит на один блок адресации текстур и 8 блоков фильтрации текстур. Всего для GF104 c 8 SM получаем 64 блока адресации текстур и 512 блоков фильтрации текстур. Всего для GF106 c 4 SM получаем 32 блока адресации текстур и 256 блоков фильтрации текстур. Всего для GF108 c 2 SM получаем 16 блоков адресации текстур и 128 блоков фильтрации текстур.

GeForce 500M (5xxM) series

GeForce 500M series для ноутбуков.

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации

GeForce 600M (6xxM) series

GeForce 600M series для ноутбуков.

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 1 Unified Shaders : Texture mapping units : Render output units

GeForce 700M (7xxM) series

GeForce 700M series для ноутбуков.

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Показатель вычислительной мощности получается путём умножения тактовой частоты шейдеров на количество ядер и количество инструкций, которое ядро способно выполнять за один цикл.

GeForce 800M (8xxM) series

GeForce 800M series для ноутбуков

GeForce 900M (9xxM) series

GeForce 900M series для ноутбуков

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во блоков растеризации). В это правило не входят GeForce GT 920M(Fermi 2.0) и GeForce GT 920M (Kepler 2.0). Почему???
  • 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во текстурных блоков)
  • 4 Пропускная способность памяти (псп) находится по формуле: частота памяти * битность шины / 8. (8-переводной коэффициент из бит в Байты)
  • 5 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту шейдера. Если не указана максимальная частота шейдера, умножайте на максимальную частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
  • 6 Производительность в FLOPS двойной точности (64-бит) равна 1/32FP32 У Maxwell,Maxwell2.0. 1/12FP у Fermi2.0. 1/3 у Kepler2.0.В других видеокартах на этих архитектурах производительность FP64 может быть другой. Например, gtx 590(Fermi2.0) FP64=1/8FP32

GeForce 10 Series (Notebooks)

GeForce 10 Series для ноутбуков

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во блоков растеризации).
  • 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во текстурных блоков)
  • 4 Пропускная способность памяти (псп) рассчитывается по формуле: Частота памяти * разрядность шины / 8. (8 — переводной коэффициент из бит в Байты)
  • 5 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту шейдера. Если не указана максимальная частота шейдера, умножайте на максимальную частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
  • 6 Производительность в FLOPS двойной точности (64-бит) равна 1/32FP32 У Pascal. В других видеокартах на этой архитектуре производительность FP64 может быть другой.

GeForce MX100 (MX1xx) series

GeForce MX100(MX1xx) series для ноутбуков

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во блоков растеризации).
  • 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во текстурных блоков)
  • 4 Пропускная способность памяти (псп) рассчитывается по формуле: Частота памяти * разрядность шины / 8. (8 — переводной коэффициент из бит в Байты)
  • 5 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту шейдера. Если не указана максимальная частота шейдера, умножайте на максимальную частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
  • 6 Производительность в FLOPS двойной точности (64-бит) равна 1/32FP32 У Maxwell и Pascal. В других видеокартах на этих архитектурах производительность FP64 может быть другой.

Quadro

  • 1 Вертексный шейдер : Пиксельный шейдер : Текстурный блок : Блок растеризации
  • 2 Унифицированный шейдер (Вертексный шейдер/Геометрический шейдер/Пиксельный шейдер) : Текстурный блок : Блок растеризации

Quadro NVS

  • 1 Вертексный шейдер : Пиксельный шейдер : Текстурный блок : Блок растеризации
  • 2 Унифицированный шейдер (Вертексный шейдер/Геометрический шейдер/Пиксельный шейдер) : Текстурный блок : Блок растеризации

Сравнительная таблица: графические процессоры для рабочих станций

Quadro

  • 1 Вертексный шейдер : Пиксельный шейдер : Текстурный блок : Блок растеризации
  • 2 Унифицированный шейдер (Вертексный шейдер/Геометрический шейдер/Пиксельный шейдер) : Текстурный блок : Блок растеризации
  • * NV31, NV34 и NV36 используют 2x2 конвейерный дизайн, выполняя вертексный шейдер, в остальных случаях используют 4x1 конвейерный дизайн.

Tesla

  • 1Спецификации, не определенные NVIDIA, как предполагается, основаны на GeForce 8800GTX.
  • 2Спецификации, не определенные NVIDIA, как предполагается, основаны на GeForce GTX280
  • 3Спецификации, не определенные NVIDIA, как предполагается, основаны на GeForce 400 Series
  • 4С активированным ECC, доступная для пользователя память, составит 2.625 Гбайта на GPU для C2050, S2050 и 5.25 Гбайт на GPU для C2070, S2070.
  • 5 GF100 выполняет новую соединенную инструкцию умножения-сложения (FMA) для обоих 32-битных чисел одинарной точности с плавающей запятой и 64-битных чисел двойной точности с плавающей запятой (GT200 поддерживает инструкцию FMA только для чисел двойной точности). Разница мужду инструкциями FMA и MAD при выполнении операции вида A*B+C заключается в том, что FMA не округляет результат произведения перед суммированием, что даёт более точный результат.

FMA — Fused Multiply-Add
MAD — Multiply-Add