Универсальных шейдерных блоков что это

Унифицированная шейдерная модель (англ. Unified shader model ) — термин, который используется для описания двух подобных, но вместе с тем и отдельных понятий: унифицированная шейдерная архитектура (англ. Unified Shading Architecture ), которая описывает аппаратный уровень, и унифицированная шейдерная модель, которая описывает программный уровень.

Содержание

Унифицированная шейдерная модель [ править | править код ]

Унифицированная шейдерная модель, известная в Direct3D 10 как Shader Model 4.0, использует согласованный (схожий) набор команд для всех типов шейдеров. [1] Шейдеры всех типов имеют очень похожие возможности — они могут «читать» текстуры, буферы данных и выполнять тот же самый набор арифметических инструкций.

Однако, набор команд не полностью одинаковый во всех типах шейдеров; например, только пиксельный шейдер может читать текстуры с неявными координатными градиентами; и только геометрический шейдер может производить рендеринг дополнительных примитивов, и т.д. [1]

Ранние шейдерные модели (Shader Model 1.x) использовали очень разные наборы команд для вершинных и пиксельных шейдеров, где вершинные шейдеры имели намного более гибкий набор команд. Более поздние шейдерные модели (2.x и 3.0) всё более сокращали различия, что и привело к унифицированной шейдерной модели.

Унифицированная шейдерная архитектура [ править | править код ]

Когда графический процессор поддерживает унифицированную шейдерную модель, то имеет смысл проектировать его вычислительные блоки так, чтобы любой из этих блоков мог выполнить любой тип шейдера. Когда вычислительные блоки графического процессора «унифицированы», то есть способны выполнять любой тип шейдерной программы, то это и называется «Унифицированная шейдерная архитектура». Чаще всего такие графические процессоры составлены из массива вычислительных блоков и блоков динамического планирования/баланса загрузки, для распределения выполнения шейдерных программ между всеми вычислительными блоками.

Аппаратное обеспечение не обязано иметь унифицированную шейдерную архитектуру для поддержки унифицированной шейдерной модели, и наоборот. Графические процессоры с поддержкой Direct3D 10 всё ещё могут иметь выделенные геометрические, вершинные и пиксельные процессоры. Технологически более ранние графические процессоры с поддержкой Shader Model 3.0 также могут частично выполнять унифицированную шейдерную модель, что видно на примере графического процессора Xenos для игровой консоли Xbox 360.

Унифицированная шейдерная архитектура позволяет более гибко использовать ресурсы графического процессора. [2] Например, в условиях с симуляцией тяжелой геометрии уровня унифицированная шейдерная архитектура может задействовать все блоки графического процессора для вычисления вершинных и геометрических шейдеров. И наоборот; когда геометрия не является сложной, а симулируется множество сложных пиксельных эффектов, таких как Parallax occlusion mapping, система частиц и т.д., все вычислительные блоки могут быть направлены на выполнение пиксельных шейдеров.

Унифицированную шейдерную архитектуру поддерживают графические процессоры начиная из таких серий:

Последнее обновление от 28.09.2012

Основные характеристики видеокарт

Современные графические процессоры содержат множество функциональных блоков, от количества и характеристик которых зависит и итоговая скорость рендеринга, влияющая на комфортность игры. По сравнительному количеству этих блоков в разных видеочипах можно примерно оценить, насколько быстр тот или иной GPU. Характеристик у видеочипов довольно много, в этом разделе мы рассмотрим лишь самые важные из них.

Тактовая частота видеочипа

Рабочая частота GPU обычно измеряется в мегагерцах, т. е. миллионах тактов в секунду. Эта характеристика прямо влияет на производительность видеочипа — чем она выше, тем больший объем работы GPU может выполнить в единицу времени, обработать большее количество вершин и пикселей. Пример из реальной жизни: частота видеочипа, установленного на плате Radeon HD 6670 равна 840 МГц, а точно такой же чип в модели Radeon HD 6570 работает на частоте в 650 МГц. Соответственно будут отличаться и все основные характеристики производительности. Но далеко не только рабочая частота чипа определяет производительность, на его скорость сильно влияет и сама графическая архитектура: устройство и количество исполнительных блоков, их характеристики и т. п.

В некоторых случаях тактовая частота отдельных блоков GPU отличается от частоты работы остального чипа. То есть, разные части GPU работают на разных частотах, и сделано это для увеличения эффективности, ведь некоторые блоки способны работать на повышенных частотах, а другие — нет. Такими GPU комплектуется большинство видеокарт GeForce от NVIDIA. Из свежих примеров приведём видеочип в модели GTX 580, большая часть которого работает на частоте 772 МГц, а универсальные вычислительные блоки чипа имеют повышенную вдвое частоту — 1544 МГц.

Скорость заполнения (филлрейт)

Скорость заполнения показывает, с какой скоростью видеочип способен отрисовывать пиксели. Различают два типа филлрейта: пиксельный (pixel fill rate) и текстурный (texel rate). Пиксельная скорость заполнения показывает скорость отрисовки пикселей на экране и зависит от рабочей частоты и количества блоков ROP (блоков операций растеризации и блендинга), а текстурная — это скорость выборки текстурных данных, которая зависит от частоты работы и количества текстурных блоков.

Например, пиковый пиксельный филлрейт у GeForce GTX 560 Ti равен 822 (частота чипа) × 32 (количество блоков ROP) = 26304 мегапикселей в секунду, а текстурный — 822 × 64 (кол-во блоков текстурирования) = 52608 мегатекселей/с. Упрощённо дело обстоит так — чем больше первое число — тем быстрее видеокарта может отрисовывать готовые пиксели, а чем больше второе — тем быстрее производится выборка текстурных данных.

Хотя важность "чистого" филлрейта в последнее время заметно снизилась, уступив скорости вычислений, эти параметры всё ещё остаются весьма важными, особенно для игр с несложной геометрией и сравнительно простыми пиксельными и вершинными вычислениями. Так что оба параметра остаются важными и для современных игр, но они должны быть сбалансированы. Поэтому количество блоков ROP в современных видеочипах обычно меньше количества текстурных блоков.

Количество вычислительных (шейдерных) блоков или процессоров

Пожалуй, сейчас эти блоки — главные части видеочипа. Они выполняют специальные программы, известные как шейдеры. Причём, если раньше пиксельные шейдеры выполняли блоки пиксельных шейдеров, а вершинные — вершинные блоки, то с некоторого времени графические архитектуры были унифицированы, и эти универсальные вычислительные блоки стали заниматься различными расчётами: вершинными, пиксельными, геометрическими и даже универсальными вычислениями.

Впервые унифицированная архитектура была применена в видеочипе игровой консоли Microsoft Xbox 360, этот графический процессор был разработан компанией ATI (впоследствии купленной AMD). А в видеочипах для персональных компьютеров унифицированные шейдерные блоки появились ещё в плате NVIDIA GeForce 8800. И с тех пор все новые видеочипы основаны на унифицированной архитектуре, которая имеет универсальный код для разных шейдерных программ (вершинных, пиксельных, геометрических и пр.), и соответствующие унифицированные процессоры могут выполнить любые программы.

По числу вычислительных блоков и их частоте можно сравнивать математическую производительность разных видеокарт. Большая часть игр сейчас ограничена производительностью исполнения пиксельных шейдеров, поэтому количество этих блоков весьма важно. К примеру, если одна модель видеокарты основана на GPU с 384 вычислительными процессорами в его составе, а другая из той же линейки имеет GPU с 192 вычислительными блоками, то при равной частоте вторая будет вдвое медленнее обрабатывать любой тип шейдеров, и в целом будет настолько же производительнее.

Хотя, исключительно на основании одного лишь количества вычислительных блоков делать однозначные выводы о производительности нельзя, обязательно нужно учесть и тактовую частоту и разную архитектуру блоков разных поколений и производителей чипов. Только по этим цифрам можно сравнивать чипы только в пределах одной линейки одного производителя: AMD или NVIDIA. В других же случаях нужно обращать внимание на тесты производительности в интересующих играх или приложениях.

Блоки текстурирования (TMU)

Эти блоки GPU работают совместно с вычислительными процессорами, ими осуществляется выборка и фильтрация текстурных и прочих данных, необходимых для построения сцены и универсальных вычислений. Число текстурных блоков в видеочипе определяет текстурную производительность — то есть скорость выборки текселей из текстур.

Хотя в последнее время больший упор делается на математические расчеты, а часть текстур заменяется процедурными, нагрузка на блоки TMU и сейчас довольно велика, так как кроме основных текстур, выборки необходимо делать и из карт нормалей и смещений, а также внеэкранных буферов рендеринга render target.

Читайте также:  Антидождь для стекла автомобиля

С учётом упора многих игр в том числе и в производительность блоков текстурирования, можно сказать, что количество блоков TMU и соответствующая высокая текстурная производительность также являются одними из важнейших параметров для видеочипов. Особенное влияние этот параметр оказывает на скорость рендеринга картинки при использовании анизотропной фильтрации, требующие дополнительных текстурных выборок, а также при сложных алгоритмах мягких теней и новомодных алгоритмах вроде Screen Space Ambient Occlusion.

Блоки операций растеризации (ROP)

Блоки растеризации осуществляют операции записи рассчитанных видеокартой пикселей в буферы и операции их смешивания (блендинга). Как мы уже отмечали выше, производительность блоков ROP влияет на филлрейт и это — одна из основных характеристик видеокарт всех времён. И хотя в последнее время её значение также несколько снизилось, всё ещё попадаются случаи, когда производительность приложений зависит от скорости и количества блоков ROP. Чаще всего это объясняется активным использованием фильтров постобработки и включенным антиалиасингом при высоких игровых настройках.

Ещё раз отметим, что современные видеочипы нельзя оценивать только числом разнообразных блоков и их частотой. Каждая серия GPU использует новую архитектуру, в которой исполнительные блоки сильно отличаются от старых, да и соотношение количества разных блоков может отличаться. Так, блоки ROP компании AMD в некоторых решениях могут выполнять за такт больше работы, чем блоки в решениях NVIDIA, и наоборот. То же самое касается и способностей текстурных блоков TMU — они разные в разных поколениях GPU разных производителей, и это нужно учитывать при сравнении.

Вплоть до последнего времени, количество блоков обработки геометрии было не особенно важным. Одного блока на GPU хватало для большинства задач, так как геометрия в играх была довольно простой и основным упором производительности были математические вычисления. Важность параллельной обработки геометрии и количества соответствующих блоков резко выросли при появлении в DirectX 11 поддержки тесселяции геометрии. Компания NVIDIA первой распараллелила обработку геометрических данных, когда в её чипах семейства GF1xx появилось по несколько соответстующих блоков. Затем, похожее решение выпустила и AMD (только в топовых решениях линейки Radeon HD 6700 на базе чипов Cayman).

В рамках этого материала мы не будем вдаваться в подробности, их можно прочитать в базовых материалах нашего сайта, посвященных DirectX 11-совместимым графическим процессорам. В данном случае для нас важно то, что количество блоков обработки геометрии очень сильно влияет на общую производительность в самых новых играх, использующих тесселяцию, вроде Metro 2033, HAWX 2 и Crysis 2 (с последними патчами). И при выборе современной игровой видеокарты очень важно обращать внимание и на геометрическую производительность.

Собственная память используется видеочипами для хранения необходимых данных: текстур, вершин, данных буферов и т. п. Казалось бы, что чем её больше — тем всегда лучше. Но не всё так просто, оценка мощности видеокарты по объему видеопамяти — это наиболее распространенная ошибка! Значение объёма видеопамяти неопытные пользователи переоценивают чаще всего, до сих пор используя именно его для сравнения разных моделей видеокарт. Оно и понятно — этот параметр указывается в списках характеристик готовых систем одним из первых, да и на коробках видеокарт его пишут крупным шрифтом. Поэтому неискушённому покупателю кажется, что раз памяти в два раза больше, то и скорость у такого решения должна быть в два раза выше. Реальность же от этого мифа отличается тем, что память бывает разных типов и характеристик, а рост производительности растёт лишь до определенного объёма, а после его достижения попросту останавливается.

Так, в каждой игре и при определённых настройках и игровых сценах есть некий объём видеопамяти, которого хватит для всех данных. И хоть ты 4 ГБ видеопамяти туда поставь — у неё не появится причин для ускорения рендеринга, скорость будут ограничивать исполнительные блоки, о которых речь шла выше, а памяти просто будет достаточно. Именно поэтому во многих случаях видеокарта с 1,5 ГБ видеопамяти работает с той же скоростью, что и карта с 3 ГБ (при прочих равных условиях).

Ситуации, когда больший объём памяти приводит к видимому увеличению производительности, существуют — это очень требовательные игры, особенно в сверхвысоких разрешениях и при максимальных настройках качества. Но такие случаи встречаются не всегда и объём памяти учитывать нужно, не забывая о том, что выше определённого объема производительность просто уже не вырастет. Есть у чипов памяти и более важные параметры, такие как ширина шины памяти и её рабочая частота. Эта тема настолько обширна, что подробнее о выборе объёма видеопамяти мы ещё остановимся в шестой части нашего материала.

Ширина шины памяти

Ширина шины памяти является важнейшей характеристикой, влияющей на пропускную способность памяти (ПСП). Большая ширина позволяет передавать большее количество информации из видеопамяти в GPU и обратно в единицу времени, что положительно влияет на производительность в большинстве случаев. Теоретически, по 256-битной шине можно передать в два раза больше данных за такт, чем по 128-битной. На практике разница в скорости рендеринга хоть и не достигает двух раз, но весьма близка к этому во многих случаях с упором в пропускную способность видеопамяти.

Современные игровые видеокарты используют разную ширину шины: от 64 до 384 бит (ранее были чипы и с 512-битной шиной), в зависимости от ценового диапазона и времени выпуска конкретной модели GPU. Для самых дешёвых видеокарт уровня low-end чаще всего используется 64 и реже 128 бит, для среднего уровня от 128 до 256 бит, ну а видеокарты из верхнего ценового диапазона используют шины от 256 до 384 бит шириной. Ширина шины уже не может расти чисто из-за физических ограничений — размер кристалла GPU недостаточен для разводки более чем 512-битной шины, и это обходится слишком дорого. Поэтому наращивание ПСП сейчас осуществляется при помощи использования новых типов памяти (см. далее).

Ещё одним параметром, влияющим на пропускную способность памяти, является её тактовая частота. А повышение ПСП часто напрямую влияет на производительность видеокарты в 3D-приложениях. Частота шины памяти на современных видеокартах бывает от 533(1066, с учётом удвоения) МГц до 1375(5500, с учётом учетверения) МГц, то есть, может отличаться более чем в пять раз! И так как ПСП зависит и от частоты памяти, и от ширины ее шины, то память с 256-битной шиной, работающая на частоте 800(3200) МГц, будет иметь бо́льшую пропускную способность по сравнению с памятью, работающей на 1000(4000) МГц со 128-битной шиной.

Особенное внимание на параметры ширины шины памяти, её типа и частоты работы следует уделять при покупке сравнительно недорогих видеокарт, на многие из которых ставят лишь 128-битные или даже 64-битные интерфейсы, что крайне негативно сказывается на их производительности. Вообще, покупка видеокарты с использованием 64-битной шины видеопамяти для игрового ПК нами не рекомендуется вовсе. Желательно отдать предпочтение хотя бы среднему уровню минимум со 128- или 192-битной шиной.

На современные видеокарты устанавливается сразу несколько различных типов памяти. Старую SDR-память с одинарной скоростью передачи уже нигде не встретишь, но и современные типы памяти DDR и GDDR имеют значительно отличающиеся характеристики. Различные типы DDR и GDDR позволяют передавать в два или четыре раза большее количество данных на той же тактовой частоте за единицу времени, и поэтому цифру рабочей частоты зачастую указывают удвоенной или учетверённой, умножая на 2 или 4. Так, если для DDR-памяти указана частота 1400 МГц, то эта память работает на физической частоте в 700 МГц, но указывают так называемую «эффективную» частоту, то есть ту, на которой должна работать SDR-память, чтобы обеспечить такую же пропускную способность. То же самое с GDDR5, но частоту тут даже учетверяют.

Основное преимущество новых типов памяти заключается в возможности работы на больших тактовых частотах, а соответственно — в увеличении пропускной способности по сравнению с предыдущими технологиями. Это достигается за счет увеличенных задержек, которые, впрочем, не так важны для видеокарт. Первой платой, использующей память DDR2, стала NVIDIA GeForce FX 5800 Ultra. С тех пор технологии графической памяти значительно продвинулись, был разработан стандарт GDDR3, который близок к спецификациям DDR2, с некоторыми изменениями специально для видеокарт.

Читайте также:  Где взять бланки европротокола при дтп

GDDR3 — это специально предназначенная для видеокарт память, с теми же технологиями, что и DDR2, но с улучшенными характеристиками потребления и тепловыделения, что позволило создать микросхемы, работающие на более высоких тактовых частотах. Несмотря на то, что стандарт был разработан в компании ATI, первой видеокартой, её использующей, стала вторая модификация NVIDIA GeForce FX 5700 Ultra, а следующей стала GeForce 6800 Ultra.

GDDR4 — это дальнейшее развитие «графической» памяти, работающее почти в два раза быстрее, чем GDDR3. Основными отличиями GDDR4 от GDDR3, существенными для пользователей, являются в очередной раз повышенные рабочие частоты и сниженное энергопотребление. Технически, память GDDR4 не сильно отличается от GDDR3, это дальнейшее развитие тех же идей. Первыми видеокартами с чипами GDDR4 на борту стали ATI Radeon X1950 XTX, а у компании NVIDIA продукты на базе этого типа памяти не выходили вовсе. Преимущества новых микросхем памяти перед GDDR3 в том, что энергопотребление модулей может быть примерно на треть ниже. Это достигается за счет более низкого номинального напряжения для GDDR4.

Впрочем, GDDR4 не получила широкого распространения даже в решениях AMD. Начиная с GPU семейства RV7x0, контроллерами памяти видеокарт поддерживается новый тип памяти GDDR5, работающий на эффективной учетверённой частоте до 5,5 ГГц и выше (теоретически возможны частоты до 7 ГГц), что даёт пропускную способность до 176 ГБ/с с применением 256-битного интерфейса. Если для повышения ПСП у памяти GDDR3/GDDR4 приходилось использовать 512-битную шину, то переход на использование GDDR5 позволил увеличить производительность вдвое при меньших размерах кристаллов и меньшем потреблении энергии.

Видеопамять самых современных типов — это GDDR3 и GDDR5, она отличается от DDR некоторыми деталями и также работает с удвоенной/учетверённой передачей данных. В этих типах памяти применяются некоторые специальные технологии, позволяющие поднять частоту работы. Так, память GDDR2 обычно работает на более высоких частотах по сравнению с DDR, GDDR3 — на еще более высоких, а GDDR5 обеспечивает максимальную частоту и пропускную способность на данный момент. Но на недорогие модели до сих пор ставят «неграфическую» память DDR3 со значительно меньшей частотой, поэтому нужно выбирать видеокарту внимательнее.

В прошлой статье мы рассказывали о процессорах и их характеристиках, а сегодня мы хотели бы рассказать о таком не менее важном устройстве в компьютере как видеокарта.

Виды видеокарт

Видеокарта – это устройство, которое отвечает за вывод изображения на экран монитора. В современных компьютерах видеокарты бывают двух видов – дискретные (в виде отдельной, вставляемой внутрь корпуса платы) и встроенные (интегрированные, распаянные на материнской плате компьютера).

Дискретные видеокарты наиболее производительные и подходящие для игр, но для того чтобы выбрать действительно хорошую видеокарту необходимо уметь разбираться в ее характеристиках, о которых мы и расскажем в этой статье. Сегодня наиболее популярной в этом сегменте является продукция компаний Nvidia и AMD.

Интегрированные видеокарты обладают меньшей производительностью, по сравнению с дискретными. В основном, они ориентированны на офисную работу с компьютером и для игр практически не подходят. Среди интегрированных видеокарт наибольшей популярностью пользуется продукция компаний Intel, AMD (используется в гибридных процессорах A-Series), VIA, S3 и SIS.

Основные параметры видеокарт

Видеокарта, это достаточно сложное устройство, которое состоит из множества блоков, каждый из которых выполняет свою функцию. От их количества и характеристик зависит скорость и качество рендеринга изображения. Сравнивая характеристики этих блоков можно, хотя бы примерно, понять, насколько быстра та или иная модель видеокарты.

Тактовая частота графического процессора (GPU)

Эта характеристика видеокарты напрямую влияет на производительность графического процессора. Ведь чем больше частота — тем больший объем информации (пикселей, вершин, и т.д.) GPU может обработать в определенный промежуток времени. То есть, одинаковый GPU работающий на частоте 950МГц, будет обладать большей производительностью, чем такой же чип, работающий на частоте 900МГц. И, скорее всего, остальные основные характеристики этих чипов будут отличаться таким же образом. Однако следует учитывать то, что в современных видеокартах все немного сложнее, и тактовая частота графического процессора — это не единственный параметр, который определяет его производительность. Помимо этого, на производительность графического чипа достаточно большое влияние также оказывает и его архитектура, а именно количество разнообразных исполнительных блоков и их характеристики.

В последних моделях графических процессоров также не редки случаи, когда тактовая частота из различных блоков может отличаться. То есть, различные блоки видеокарты могут работать на различных частотах. Это решение применяется в угоду эффективности, ведь одни блоки способны работать на более быстрой частоте, а другие — нет. Например, графический процессор может работать на частоте 600МГц, а шейдерный блок на частоте 1100МГц.

Скорость заполнения (fill rate, филлрейт)

Скорость заполнения — это одна из самых важных характеристик видеокарты. Она обозначает количество пикселей, для которых видеокарта способна просчитать освещение, фрагментные шейдеры, антиалиасинг и т.п. Для современных видеокарт различают два вида скорости заполнения:

Пиксельную — демонстрирует скорость отрисовки пикселей на экране;
Текстурную демонстрирует скорость выборки данных текстуры.

Пиксельная скорость заполнения зависит от рабочей частоты GPU и количества блоков ROP (блендинга и растеризации), а текстурная — зависит от частоты GPU и количества текстурных блоков. Для того чтобы узнать пиксельную или текстурную скорость заполнения, необходимо частоту умножить на количество пиксельных или текстурных блоков видеокарты. То есть, например, для видеокарты NV >
Несмотря на то, что важность скорости заполнения в последнее время снизилась, эти параметры еще остаются достаточно важными, особенно в играх с относительно простыми вершинными и пиксельными вычислениями. При этом необходимо учитывать, что для оптимальной производительности видеокарты эти параметры должны быть сбалансированными. Именно, поэтому в современных GPU количество текстурных блоков больше, чем блоков растеризации (ROP).

Количество процессоров/шейдерных блоков

На сегодняшний день шейдерные блоки — одна из главных составляющих видеокарты. Именно они выполняют специальные вычислительные графические программы — шейдеры. В отличие от старых видеокарт, в которых вершинные шейдеры выполнялись вершинными блоками, а пиксельные — пиксельными, в современных моделях эта часть графической архитектуры была унифицирована, теперь шейдерные блоки универсальные и занимаются как пиксельными, так и геометрическими и универсальными вычислениями.

Впервые это решение было применено в графическом процессоре компании ATI для консоли Xbox 360. А в графических процессорах для настольных ПК унифицированные шейдерные блоки впервые были реализованы в GeForce 8800.

По количеству шейдерных блоков и их тактовой частоте можно сравнить математическую производительность различных видеокарт. Например, если графический процессор видеокарты содержит 192 шейдерных блока, а второй — 384, то при одинаковой тактовой частоте вторая видеокарта будет вдвое медленнее при обработке любого типа шейдеров, и настолько же менее производительной.

Но, следует помнить, что только на основании количества шейдерных блоков нельзя судить о производительности видеокарты. Не менее важны и такие параметры как тактовая частота, различная архитектура у блоков и производителей чипов. По количеству шейдерных блоков можно сравнить графические процессоры одного производителя, и в пределах одной линейки. В других случаях лучше посмотреть на результаты тестов производительности в различных бенчмарках и играх.

Текстурные блоки (TMU)

Как можно понять из названия этих блоков, они осуществляют выборку и фильтрацию текстур и других необходимых для построения сцены данных. Количество текстурных блоков в графическом процессоре определяет его текстурную производительность — а именно скорость выборки текселей из текстур.

Несмотря на то, что в современных архитектурах графических процессоров все больший упор производится на математические расчеты, нагрузка на текстурные блоки по прежнему остается достаточно высока. Это происходит из-за того, что помимо основных текстур необходимо производить выборки из карт нормалей и смещений, а также внеэкранных буферов рендеринга (render targer). Именно поэтому высокая текстурная производительность является одной из самых важных характеристик графических процессоров. Особенно важен этот параметр при использовании в сценах антизотропной фильтрации, сложных алгоритмов мягких теней.

Читайте также:  Внедорожные шины российского производства

Блоки блендинга и растеризации (ROP)

Эти блоки отвечают за осуществление операций записи рассчитанных видеокартой пикселей в буферы, и операции по их смешиванию (блендинг). Как уже отмечалось выше, производительность блоков блендинга и растеризации влияет на пиксельный филлрейт, а это одна из главных характеристик видеокарт. Несмотря на то, что в современных видеокартах ее влияние на производительность снизилось, бывает, что производительность приложений зависит от количества блоков растеризации и их скорости. Наиболее часто это проявляется при активном использовании различных фильтров постобработки и включенном при высоких настройках графики в играх антиалиасинге.

Отметим, что производительность современных GPU нельзя оценить только по количеству различных блоков и их тактовой частоте. Следует учитывать и различия в архитектуре самих графических процессоров, поскольку в чипах различной архитектуры производительность за рабочий такт у блоков может сильно отличатся.

Блоки обработки геометрии

До недавнего времени количество этих блоков не имело большого значения, а графическому процессору достаточно часто хватало только одного блока. Важность количества этих блоков и параллельной обработки геометрии выросли с появлением поддержки тесселяции геометрии в Direct X11. Первенцем в параллельной обработке геометрических данных стала компания NVIDIA. Именно в графических процессорах GF1xx впервые появились сразу несколько этих блоков. Немногим позже аналогичное решение выпустила и компания AMD.

Поэтому, в современных играх, вроде HAWX 2 и Metro 2033 (использующих тесселяцию), количество блоков обработки геометрии очень сильно влияет на производительность. И именно поэтому на количество этих блоков также стоит обращать внимание при выборе видеокарты.

Ширина шины памяти

Ширина шины памяти — это одна из самых важных характеристик, которая влияет на пропускную способность памяти. Большая ширина шины позволяет за один рабочий такт передать большее количество информации из графического процессора в память видеокарты. В большинстве случаев это очень сильно влияет на производительность, ведь теоретически за 1 рабочий такт по 256-битной шине можно передать вдвое больше информации чем по 128-битной. На практике, при рендеринге сцен, разница в скорости хоть и меньше двух раз, но не сильно далека от этого показателя.

В современных видеокартах используется шина памяти с шириной от 64 до 384 бит. Стоит отметить, что раньше встречались модели видеокарт и с 512-битной шиной, но в современных видеокартах площадь кристалла GPU настолько мала, что физически не позволяет осуществить разводку на шину подобной ширины. Поэтому наращивание пропускной способности сейчас производится путем применения новых типов памяти.

Частота видеопамяти

Этот параметр также влияет на пропускную способность памяти видеокарты. Увеличение пропускной способности памяти зачастую сильно влияет на производительность видеокарты в трехмерных приложениях, таких как игры. В современных моделях видеокарт частота шины памяти бывает от 533 (с удвоением — 1066) МГц до 1735 (5500 с учетверением) МГц. То есть, частота может отличаться более чем в пять раз! А так как пропускная способность зависит не только от частоты, но и от ширины шины памяти, то у памяти работающей на частоте 800 (3200) МГц с 256-битной шиной будет большая пропускная способность, чем у памяти со 128-битной шиной, но на частоте 1000 (4000)МГц.

При покупке относительно недорогих видеокарт следует уделять этой характеристике особое значение, поскольку многие производители подобных моделей зачастую используют 128-битную или 64-битную шину, что весьма серьезно влияет на их производительность.

Типы видеопамяти

В современных видеокартах используется несколько типов видеопамяти. В основном, преимущество использования новых типов памяти в видеокартах заключается в возможности работы на более высоких частотах, а значить – с более высокой пропускной способностью. Как правило, в моделях современных видеокарт можно встретить видеопамять следующих типов:

GDDR3 – память, в которой применены аналогичные DDR2 технологии, но улучшены такие характеристики, как тепловыделение и энергопотребление. Благодаря этому модули этой памяти достигают больших тактовых частот по сравнению с DDR2.
GDDR4 – работает примерно вдвое быстрее GDDR3, а основные отличия между ними заключаются в повышенных тактовых частотах у GDDR4 и более низком энергопотреблении. Технически эта память представляет собой дальнейшее улучшение идей заложенных в GDDR3.
GDDR5 – работает на учетверенной тактовой частоте (до 5,5ГГц, теоретический максимум — 7ГГц), обеспечивает пропускную способность до 176ГБ/с с 256-битной шиной памяти. По сравнению с GDDR4, GDDR5 обладает вдвое меньшей площадью кристаллов и энергопотреблением, а ее производительность примерно вдвое выше.

Обращая внимание на тип памяти при выборе видеокарты, следует руководствоваться тем, что более поздние типы видеопамяти, как правило, обеспечивают большую производительность. Также стоит остерегаться недорогих видеокарт с "неграфической" памятью типа DDR3, она работает на значительно меньших частотах.

Разъемы видеокарт

При выборе дискретной видеокарты, необходимо знать какой разъем для ее подключения используется на материнской платы. Сегодня, для подключения видеокарты используют в основном разъем PCI-Express (PCI-E), но все еще можно и устаревший разъем AGP. Давайте рассмотрим их немного подробнее. На сегодняшний день существует три спецификации интерфейса PCI-E.

PCI-E 1.0 – это самая старая, и наиболее медленная спецификация стандарта. Поэтому при выборе видеокарты, лучше обратить свое внимание на модели с поддержкой более поздней спецификации.

Пропускная способность PCI-E 1.0:

PCI-E 2.0 – более поздняя спецификация стандарта, основное отличие от предшествующей — удвоенная пропускная способность каждой линии, в каждом направлении.

Пропускная способность PCI-E 2.0:

PCI-E 3.0 – это самая последняя спецификация стандарта на сегодняшний день. Она была принята в ноябре 2010 года, а ее основными отличиями от предшествующей стали — измененная схема кодирования (по шине можно передать 128 бит полезной информации из 130 бит отправленной, в отличие от ранних спецификаций которые подразумевали отправку 8 бит из 10 полезной информации). Помимо этого до 8 GT/s увеличена скорость передачи данных (в PCI-E 1.0 она составляла 2.5GT/s, а в PCI-E 2.0 — 5GT/s). Благодаря этим изменениям, по сравнению с PCI-E 2.0 пропускная способность была увеличена вдвое.

Пропускная способность PCI-E 3.0:

Таким образом, учитывая четырехкратную разницу в производительности различных спецификаций интерфейса, при выборе видеокарты, лучше всего обратить свое внимание на модель которая поддерживает спецификации PCI-E 3.0. А учитывая что все спецификации интерфейса PCI-E имеют обратную совместимость друг с другом, даже если материнская плата вашего ПК не поддерживает более новые спецификации интерфейса, видеокарта все равно будет нормально работать, правда с меньшей производительностью.

AGP – это 32-битная шина для видеокарт, разработанная компанией Intel. На сегодняшний день, этот интерфейс устарел, но все еще можно встретить компьютеры, в которых присутствует именно этот разъем. Шина AGP работает на частоте 66МГц.

Спецификации шины AGP:
• AGP 1x (AGP 1.0) — практически не используется, так как не обеспечивает необходимой скорости при работе с памятью в DME режиме, рабочее напряжение 3,3В;
• AGP 2x — главное отличие от 1х заключается в пересылке двух блоков данных за один рабочий такт;
• AGP 4x (AGP 2.0) — передает 4 блока данных за один такт, а пропускная способность составляет примерно 1ГБ/с, еще одно отличие от предшественников — уровень напряжения 1,5В (Вместо 3,3В у AGP 2.x);
• AGP 8x (AGP 3.0) — в передает 8 блоков данных за рабочий такт, пропускная способность составляет 2ГБ/с. Примечательным в этой спецификации было то, что в ней была заложена возможность работы двух видеокарт (аналогично режимам CrossFire или SLI), но она так и не была использована производителями.
• AGP Pro — спецификация появилась в ответ на рост энергопотребления видеокарт, так как шина AGP уже не могла справляться с возросшей мощностью (более 40 ватт), ее снабдили дополнительными разъемами питания.

На данный момент, видеокарты и материнские платы с этим интерфейсом практически не выпускаются. Его можно встретить лишь на устаревших ПК.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *