Эта таблица содержит основную информацию о графических процессорах NVIDIA серии GeForce и видеокартах, построенных на официальных спецификациях NVIDIA.
Замечания о версиях DirectX
Версия DirectX обозначает ключевую доступную особенность.
- DirectX 6.0 — мультитекстурирование
- DirectX 7.0 — аппаратная поддержка преобразований, обрезания и освещения
- DirectX 8.0 — шейдерная модель 1.1
- DirectX 8.1 — пиксельные шейдеры 1.4 и вершинные шейдеры 1.1
- DirectX 9.0 — шейдерная модель 2.0
- DirectX 9.0b — пиксельные шейдеры 2.0b и вершинные шейдеры 2.0
- DirectX 9.0c — шейдерная модель 3.0
- DirectX 9.0L — версия DirectX 9.0 для Windows Vista
- DirectX 10 — шейдерная модель 4.0 (только Windows Vista, Windows 7)
- DirectX 10.1 — шейдерная модель 4.1 (только Windows Vista, Windows 7)
- DirectX 11 — шейдерная модель 5.0 (только Windows Vista, Windows 7)
- DirectX 11.1 — шейдерная модель 5.1 (только Windows Vista, Windows 7)
- DirectX 11.3/DirectX 12 — шейдерная модель 5.1 (только Windows 10).
Замечания о версиях OpenGL
Версия OpenGL обозначает то, какие операции графического ускорения поддерживает данная графическая карта.
- OpenGL 1.1 — объекты текстур
- OpenGL 1.2 — 3D-текстуры, форматы BGRA и упакованных пикселей
- OpenGL 1.3 — мультитекстурирование, multisampling, сжатие текстур
- OpenGL 1.4 — текстуры глубины
- OpenGL 1.5 — VBO, Occlusion Querys
- OpenGL 2.0 — GLSL 1.1, MRT, текстуры с размерами, не являющимися степенью двойки, Point Sprites, Two-sided stencil
- OpenGL 2.1 — GLSL 1.2, Pixel Buffer Object (PBO), текстуры sRGB
- OpenGL 3.0 — GLSL 1.3, Массивы текстур, условный рендеринг , FBO
- OpenGL 3.1 — GLSL 1.4, Instancing, Texture Buffer Object, Uniform Buffer Object, Primitive restart
- OpenGL 3.2 — GLSL 1.5, Geometry Shader, Multi-sampled textures
- OpenGL 4.0 — GLSL 4.00, Тесселяция на GPU, шейдеры с 64-битной точностью.
Расшифровка обозначений в полях таблицы
Поля таблицы, перечисленные ниже, обозначают следующее:
- Модель — рыночное название для графического процессора (ГП), присвоенное nVidia.
- Год(дата) — год (дата) выпуска процессора.
- Кодовое имя — внутреннее имя процессора в процессе разработки (обычно обозначается именем вида NVXY и позже GXY, где X обозначает серийный номер поколения, а Y — этап проекта для этого поколения.
- Техпроцесс — средний размер элементарных компонентов процессора.
- Шина — шина, по которой графический процессор подключен к системе (обычно слот расширения, такой как PCI, AGP или PCI-Express).
- Макс. объём памяти — максимальное количество памяти, которое может использоваться процессором.
- Частота ядра — максимальная фабричная частота ядра (так как некоторые производители графических карт могут её увеличивать или уменьшать, эта частота всегда является официально специфицированной nVidia).
- Частота памяти — максимальная фабричная частота работы с памятью (так как некоторые производители графических карт могут её увеличивать или уменьшать, эта частота всегда является официально специфицированной nVidia).
- Конвейеры x TMU x VPU — список, состоящий из количества пиксельных конвейеров, текстурных обработчиков (на каждый конвейер) и вершинных обработчиков в процессоре. В поздних моделях шейдеры интегрированы в унифицированную шейдерную архитектуру, в результате любой шейдер может выполнять любую из трёх перечисленных функций. Графические процессоры с ограниченным функционированием обработчика T&L обозначаются, как имеющие 0.5 VPU.
- SPU x TAU x ROP — список, состоящий из количества шейдерных процессоров, обработчиков текстурных адресов (общее количество) и операторов растеризации (общее количество) в процессоре.
- Скорость заполнения — максимальная теоретически доступная скорость заполнения (филрейт) в текстурированных пикселях в секунду. Это количество в основном используется как «максимальная пропускная способность» для графического процессора и в основном более высокая скорость заполнения характеризует более мощные (и быстрые) ГП.
- Пропускная способность памяти — максимальная теоретическая пропускная способность процессора, работающего на фабричной частоте с фабричной разрядностью шины (здесь ГБ=109 байт).
- Тип шины памяти — тип используемой шины памяти.
- Ширина шины памяти — максимальная используемая ширина шины памяти в битах. Это всегда фабричная ширина шины.
- Direct X — максимальная полностью поддерживаемая версия Direct3D.
- Open GL — максимальная полностью поддерживаемая версия OpenGL.
- Особенности — дополнительные особенности.
Сравнительная таблица: десктопные графические процессоры
До GeForce
- 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
GeForce series
- 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
GeForce 2 Series
- 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
- 2 GeForce2 Ti VX никогда не представлялся официально, хотя это — не что иное, как GeForce2 Ti со сниженной частотой.
GeForce 3 Series
- 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
GeForce 4 Series
- 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
AGP 3.0 обозначает понижение напряжения и увеличение максимальной теоретической полосы пропускания (доступные скорости 4X и 8X, вместо 2X и 4X); сами ядра не имели никаких изменений (от NV17 до NV18 или NV25 к NV28). Кроме увеличенной тактовой частоты и уменьшенного напряжения колебания сигнала (от 1.5 V к 0.8 V), AGP 3.0 все еще поддерживает sideband адресацию (позднее добавлена к спецификациям AGP 1.0, увеличила практическую пропускную способность), и быструю запись (в спецификациях AGP 2.0, данные прямо записываются в памяти видеокарты).
GeForce 5 Series
- 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
- * NV31, NV34 и NV36 используют 2x2 конвейерный дизайн, выполняя вертексный шейдер, в остальных случаях используют 4x1 конвейерный дизайн.
- ** GeForce FX series имеют ограниченную поддержку OpenGL 2.1 (с последним драйвером Windows XP, выпущенным для этого, 175.19).
GeForce 6 Series
- 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
- 2 Графическая карта, поддерживающая TurboCache в размер памяти входит полная память (VRAM + System RAM), иначе входит только VRAM
GeForce 7 Series
- 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
- 2 Для графической карты, поддерживающей TurboCache в размер памяти входит полная память (VRAM + System RAM), иначе входит только VRAM
GeForce 8 Series
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
- 2 Полный G80 содержит 32 блока адресации текстур и 64 блока фильтрации текстур, в отличие от G92, который содержит 64 блока адресации текстур и 64 блока фильтрации текстур
- 3 С этих видеокарт начинается поддержка OpenGL 3.3.
GeForce 9 Series
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
GeForce 100 Series
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
GeForce 200 Series
- 1 Потоковый процессор : Текстурный блок : Блок растеризации
GeForce 300 Series
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
- 2 Каждый потоковый мультипроцессор(SM) в GPU архитектуры G80/GT200 содержит 8 шейдерных процессоров(SP) и 2 блока специализированных функций(SFU). Каждый SP может выполнять до двух операций MAD(ADD+MUL) одинарной точности за такт, а каждый SFU до четырех операций за такт (эти блоки также могут обрабатывать одно умножение одинарной точности с плавающей запятой за такт). Пиковое соотношение операций выполняемыми SP к операциям выполняемыми SFU 2:1. Теоретическая суммарная производительность [FLOPSsp+sfu, GFLOPS] блоков SP и SFU рассчитывается по формуле:FLOPSsp+sfu ≈ f × n × 3 , где [n] — количество SP, [f, GHz] — их частота. Аналогичная формула: FLOPSsp+sfu ≈ f × m × (8 SPs × 2 (MAD) + 4 × 2 SFUs), где [m] — количество SM.
GeForce 400 Series
- Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
- Каждый потоковый мультипроцессор (SM) в GPU архитектуры GF100 содержит 32 шейдерных процессора (SP) и 4 блока специализированных функций(SFU).
- Каждый потоковый мультипроцессор (SM) в GPU архитектуры GF104/GF106/GF108 содержит 48 шейдерных процессоров (SP) и 8 блоков специализированных функций(SFU). Каждый SP может выполнять до двух операций FMA (Fused ADD+MUL) одинарной точности за такт, а каждый SFU до четырех операций за такт. Пиковое соотношение операций выполняемыми SP к операциям выполняемыми SFU: для GF100 SFU 4:1, для GF104/106/108 3:1.
- Теоретическая производительность [FLOPSsp+sfu, GFLOPS] блоков SP рассчитывается по формуле:FLOPSsp ≈ f × n × 2 , где [n] — количество SP [f, GHz] — их частота. Аналогичная формула: для GF100 FLOPSsp ≈ f × m × (32 SPs × 2 (FMA), для GF104/106/108 FLOPSsp ≈ f × m × (48 SPs × 2(FMA)), где [m] — количество SM. Полную производительность GPU можно рассчитать по формуле: для GF100 FLOPSsp ≈ f × m ×(32 SPs × 2(FMA)+ 4 × 4 SFUs), для GF104/106/108 FLOPSsp ≈ f × m × (48 SPs × 2(FMA) + 4 × 8 SFUs) или для GF100 FLOPSsp ≈ f × n × 2.5, для GF104/106/108 FLOPSsp ≈ f × n × 8 / 3.
GeForce 500 Series
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
- 2 Каждый потоковый мультипроцессор(SM) в GPU архитектуры GF110 содержит 32 шейдерных процессора(SP) и 4 блока специализированных функций(SFU). Каждый SP может выполнять до двух операций FMA(Fused ADD+MUL) одинарной точности за такт, а каждый SFU — до четырех операций за такт. Пиковое соотношение операций выполняемыми SP к операциям выполняемыми SFU: для GF100 SFU 4:1. Теоретическая производительность [FLOPSsp+sfu, GFLOPS] блоков SP рассчитывается по формуле:FLOPSsp ≈ f × n × 2 , где [n] — количество SP [f, GHz] — их частота. Аналогичная формула: для GF110 FLOPSsp ≈ f × m × (32 SPs × 2 (FMA), где [m] — количество SM. Полную производительность GPU можно рассчитать по формуле: для GF110 FLOPSsp ≈ f × m × (32 SPs × 2(FMA) + 4 × 4 SFUs) или для GF110 FLOPSsp ≈ f × n × 2.5.
GeForce 600 Series
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
- 2 GeForce 605 (OEM) — переименованная GeForce 510.
- 3 GeForce GT 610 — переименованная GeForce GT 520.
- 4 GeForce GT 620 (OEM) — переименованная GeForce GT 520.
- 5 GeForce GT 620 — переименованная GeForce GT 530.
- 6 GeForce GT 630 (DDR3) — переименованная GeForce GT 440 (DDR3).
- 7 GeForce GT 630 (GDDR5) — переименованная GeForce GT 440 (GDDR5).
- 8 GeForce GT 640 (OEM) — переименованная GeForce GT 545 (DDR3).
- 9 GeForce GT 645 (OEM) — переименованная GeForce GTX 560 SE.
GeForce 700 Series
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
- 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на базовую тактовую частоту ядра.
- 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на базовую тактовую частоту ядра.
- 4 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на базовую частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
- 5 Производительность GTX Titan в операциях над 64-битными числами составляет 1/3 от его производительности при работе над 32-битными, тогда как для прочих чипов на базе Kepler это соотношение равно 1/24.
GeForce 900 Series
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
- 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на максимальную тактовую частоту ядра.
- 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на максимальную тактовую частоту ядра.
- 4 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
- 5 Производительность в операциях над 64-битными числами для чипов на базе «Maxwell» составляет 1/32 от его производительности при работе над 32-битными.
- 6 SLI поддерживает подключение до 4 графических процессоров одинаковых карт для конфигурации 4-Way SLI. То есть, 4-way SLI включает поддержку 3-way SLI и 2-way SLI, однако двухчиповые карты уже сконфигурированы в 2-way SLI, поэтому они поддерживают 4-way SLI с одинаковыми двухчиповыми картами, но не поддерживает 3 -way SLI.
- 7 В связи с отключением одного или более блока кэша L2/ROP блоков без отключения контроллеров памяти, изначально подключенных к отключенным блокам, память была сегментирована. Для достижения пиковой скорости из одного блока должно производиться чтение, в другой — запись.
- 8 Видеокарты серии GTX 950—980 TI. Titan X. всех дочерних производителей (Asus, Gigabyte, Zotac, KFA, Palit.) не являются средством шифрования и криптографии. Не могут участвовать в построении станций шифрования.
- 9 Является инновационной функцией масштабирования — общая графика в компьютере, более мощные технологии, то NVIDIA ® SLI ™ получит выгоду от увеличения пропускной способности шины архитектуры PCI экспресс ™решения, оборудование и программное обеспечение. Интеллектуальное программное обеспечение, которое позволяет множественные графические процессоры NVIDIA
GeForce 10 Series
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
- 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальной частоте, но у 1000 Series видеокарт NVIDIA частота ядра без разгона может превышать даже паспортную максимальную частоту.(максимальная тактовая частота * кол-во блоков растеризации)
- 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальной частоте. (максимальная тактовая частота * кол-во блоков текстурных блоков)
- 4 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
- 5 Производительность в FLOPS двойной точности (64-бит) равна 1/XXFP32 У «xxxx». В других видеокартах на этой архитектуре производительность FP64 может быть другой.
GeForce 16 Series
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
- 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во блоков растеризации).
- 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во текстурных блоков)
- 4 Пропускная способность памяти (псп) рассчитывается по формуле: Частота памяти * разрядность шины / 8. (8 — переводной коэффициент из бит в Байты)
- 5 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту шейдера. Если не указана максимальная частота шейдера, умножайте на максимальную частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
- 6 Производительность в FLOPS двойной точности (64-бит) равна 1/XXFP32 У «xxxx». В других видеокартах на этой архитектуре производительность FP64 может быть другой.
GeForce 20 Series
}- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
- 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во блоков растеризации).
- 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во текстурных блоков)
- 4 Пропускная способность памяти (псп) рассчитывается по формуле: Частота памяти * разрядность шины / 8. (8 — переводной коэффициент из бит в Байты)
- 5 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту шейдера. Если не указана максимальная частота шейдера, умножайте на максимальную частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
- 6 Производительность в FLOPS двойной точности (64-бит) равна 1/XXFP32 У «xxxx». В других видеокартах на этой архитектуре производительность FP64 может быть другой.
Таблица вычислительных возможностей (compute capability)
Подробнее на странице CUDA.
Сравнительная таблица: мобильные графические процессоры
GeForce 2 Go series
GeForce 2 Go series для ноутбуков.
- 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
GeForce 4 Go series
GeForce 4 Go series для ноутбуков.
- 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
GeForce FX Go 5 (Go 5xxx) series
GeForce FX Go 5 series для ноутбуков.
- 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
- * NV31, NV34 и NV36 используют 2x2 конвейерный дизайн, выполняя вертексный шейдер, в остальных случаях используют 4x1 конвейерный дизайн.
- ** GeForce FX series имеют ограниченную поддержку OpenGL 2.1 (с последним драйвером Windows XP, выпущенным для этого, 175.19).
GeForce Go 6 (Go 6xxx) series
GeForce Go 6 series для ноутбуков.
- 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
- 2 Для графической карты, поддерживающей TurboCache в размер памяти входит полная память (VRAM + System RAM), иначе входит только VRAM
GeForce Go 7 (Go 7xxx) series
GeForce Go 7 series для ноутбуков.
- 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
- 2 Для графической карты, поддерживающей TurboCache, в размер памяти входит полная память (VRAM + System RAM), иначе входит только VRAM
GeForce 8M (8xxxM) series
GeForce 8M series для ноутбуков.
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
GeForce 9M (9xxxM) series
GeForce 9M series для ноутбуков.
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
GeForce 100M (1xxM) series
GeForce 100M series для ноутбуков.
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
- 2 103M, 105M, 110M, 130M переименованные GPU, то есть используются те же самые ядра GPU предыдущего поколения, 9M, с обещанной оптимизацией на других особенностях
GeForce 200M (2xxM) series
GeForce 200M series для ноутбуков.
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
GeForce 300M (3xxM) series
GeForce 300M series для ноутбуков.
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
- 2 Каждый потоковый мультипроцессор(SM) в GPU архитектуры G80/GT200 содержит 8 шейдерных процессоров(SP) и 2 блока специализированных функций(SFU). Каждый SP может выполнять до двух операций MAD(ADD+MUL) одинарной точности за такт, а каждый SFU — до четырех операций за такт (эти блоки также могут обрабатывать одно умножение одинарной точности с плавающей запятой за такт). Пиковое соотношение операций выполняемыми SP к операциям выполняемыми SFU 2:1. Теоретическая суммарная производительность [FLOPSsp+sfu, GFLOPS] блоков SP и SFU рассчитывается по формуле:FLOPSsp+sfu ≈ f × n × 3 , где [n] — количество SP, [f, GHz] — их частота. Аналогичная формула: FLOPSsp+sfu ≈ f × m × (8 SPs × 2 (MAD) + 4 × 2 SFUs), где [m] — количество SM.
GeForce 400M (4xxM) series
GeForce 400M series для ноутбуков.
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
- 2 Каждый потоковый мультипроцессор(SM) в GPU архитектуры GF100 содержит 32 шейдерных процессора(SP) и 4 блока специализированных функций(SFU). Каждый потоковый мультипроцессор(SM) в GPU архитектуры GF104/GF106/GF108 содержит 48 шейдерных процессоров(SP) и 8 блоков специализированных функций(SFU). Каждый SP может выполнять до двух операций FMA(Fused ADD+MUL) одинарной точности за такт, а каждый SFU — до четырех операций за такт. Пиковое соотношение операций выполняемыми SP к операциям выполняемыми SFU: для GF100 SFU 4:1, для GF104/106/108 3:1. Теоретическая производительность [FLOPSsp+sfu, GFLOPS] блоков SP рассчитывается по формуле:FLOPSsp ≈ f × n × 2 , где [n] — количество SP [f, GHz] — их частота. Аналогичная формула: для GF100 FLOPSsp ≈ f × m × (32 SPs × 2 (FMA), для GF104/106/108 FLOPSsp ≈ f × m × (48 SPs × 2(FMA)), где [m] — количество SM. Полную производительность GPU можно рассчитать по формуле: для GF100 FLOPSsp ≈ f × m ×(32 SPs × 2(FMA)+ 4 × 4 SFUs), для GF104/106/108 FLOPSsp ≈ f × m × (48 SPs × 2(FMA) + 4 × 8 SFUs) или для GF100 FLOPSsp ≈ f × n × 2.5, для GF104/106/108 FLOPSsp ≈ f × n × 8 / 3.
- 3 Каждый SM в GF100 также содержит 4 блока адресации текстур и 16 блоков фильтрации текстур. Всего для GF100 c 16 SM получаем 64 блока адресации текстур и 256 блоков фильтрации текстур. Каждый SM в GF104/GF106/108 также содержит 8 блоков адресации текстур и 32 блока фильтрации текстур. Каждый SM в GF104/GF106/108 также содержит на один блок адресации текстур и 8 блоков фильтрации текстур. Всего для GF104 c 8 SM получаем 64 блока адресации текстур и 512 блоков фильтрации текстур. Всего для GF106 c 4 SM получаем 32 блока адресации текстур и 256 блоков фильтрации текстур. Всего для GF108 c 2 SM получаем 16 блоков адресации текстур и 128 блоков фильтрации текстур.
GeForce 500M (5xxM) series
GeForce 500M series для ноутбуков.
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
GeForce 600M (6xxM) series
GeForce 600M series для ноутбуков.
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
- 1 Unified Shaders : Texture mapping units : Render output units
GeForce 700M (7xxM) series
GeForce 700M series для ноутбуков.
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
- 2 Показатель вычислительной мощности получается путём умножения тактовой частоты шейдеров на количество ядер и количество инструкций, которое ядро способно выполнять за один цикл.
GeForce 800M (8xxM) series
GeForce 800M series для ноутбуков
GeForce 900M (9xxM) series
GeForce 900M series для ноутбуков
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
- 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во блоков растеризации). В это правило не входят GeForce GT 920M(Fermi 2.0) и GeForce GT 920M (Kepler 2.0). Почему???
- 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во текстурных блоков)
- 4 Пропускная способность памяти (псп) находится по формуле: частота памяти * битность шины / 8. (8-переводной коэффициент из бит в Байты)
- 5 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту шейдера. Если не указана максимальная частота шейдера, умножайте на максимальную частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
- 6 Производительность в FLOPS двойной точности (64-бит) равна 1/32FP32 У Maxwell,Maxwell2.0. 1/12FP у Fermi2.0. 1/3 у Kepler2.0.В других видеокартах на этих архитектурах производительность FP64 может быть другой. Например, gtx 590(Fermi2.0) FP64=1/8FP32
GeForce 10 Series (Notebooks)
GeForce 10 Series для ноутбуков
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
- 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во блоков растеризации).
- 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во текстурных блоков)
- 4 Пропускная способность памяти (псп) рассчитывается по формуле: Частота памяти * разрядность шины / 8. (8 — переводной коэффициент из бит в Байты)
- 5 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту шейдера. Если не указана максимальная частота шейдера, умножайте на максимальную частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
- 6 Производительность в FLOPS двойной точности (64-бит) равна 1/32FP32 У Pascal. В других видеокартах на этой архитектуре производительность FP64 может быть другой.
GeForce MX100 (MX1xx) series
GeForce MX100(MX1xx) series для ноутбуков
- 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
- 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во блоков растеризации).
- 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во текстурных блоков)
- 4 Пропускная способность памяти (псп) рассчитывается по формуле: Частота памяти * разрядность шины / 8. (8 — переводной коэффициент из бит в Байты)
- 5 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту шейдера. Если не указана максимальная частота шейдера, умножайте на максимальную частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
- 6 Производительность в FLOPS двойной точности (64-бит) равна 1/32FP32 У Maxwell и Pascal. В других видеокартах на этих архитектурах производительность FP64 может быть другой.
Quadro
- 1 Вертексный шейдер : Пиксельный шейдер : Текстурный блок : Блок растеризации
- 2 Унифицированный шейдер (Вертексный шейдер/Геометрический шейдер/Пиксельный шейдер) : Текстурный блок : Блок растеризации
Quadro NVS
- 1 Вертексный шейдер : Пиксельный шейдер : Текстурный блок : Блок растеризации
- 2 Унифицированный шейдер (Вертексный шейдер/Геометрический шейдер/Пиксельный шейдер) : Текстурный блок : Блок растеризации
Сравнительная таблица: графические процессоры для рабочих станций
Quadro
- 1 Вертексный шейдер : Пиксельный шейдер : Текстурный блок : Блок растеризации
- 2 Унифицированный шейдер (Вертексный шейдер/Геометрический шейдер/Пиксельный шейдер) : Текстурный блок : Блок растеризации
- * NV31, NV34 и NV36 используют 2x2 конвейерный дизайн, выполняя вертексный шейдер, в остальных случаях используют 4x1 конвейерный дизайн.
Tesla
- 1Спецификации, не определенные NVIDIA, как предполагается, основаны на GeForce 8800GTX.
- 2Спецификации, не определенные NVIDIA, как предполагается, основаны на GeForce GTX280
- 3Спецификации, не определенные NVIDIA, как предполагается, основаны на GeForce 400 Series
- 4С активированным ECC, доступная для пользователя память, составит 2.625 Гбайта на GPU для C2050, S2050 и 5.25 Гбайт на GPU для C2070, S2070.
- 5 GF100 выполняет новую соединенную инструкцию умножения-сложения (FMA) для обоих 32-битных чисел одинарной точности с плавающей запятой и 64-битных чисел двойной точности с плавающей запятой (GT200 поддерживает инструкцию FMA только для чисел двойной точности). Разница мужду инструкциями FMA и MAD при выполнении операции вида A*B+C заключается в том, что FMA не округляет результат произведения перед суммированием, что даёт более точный результат.
FMA — Fused Multiply-Add
MAD — Multiply-Add