Вот что мы знаем о графических процессорах Nvidia Ampere после выступления Jen-Hsun : GameZ=

Вот и все, Nvidia Ampere GTC Keynote закончена. Дженсен Хуан вернулся в своей фирменной черной кожаной куртке, и все сразу стало правильно с миром. Мы все должны заглянуть внутрь кухни генерального директора Nvidia и поразиться тому, сколько у него лопаток (честно, почему столько лопаток?).

Если не считать кухонную атрибутику, лейтмотив состоял из восьми видеороликов, охватывающих все: от автономного вождения, медицинских исследований, разговорного искусственного интеллекта и робототехники — все это важно для Nvidia, но не для нас, геймеров. После всего этого вы можете думать, что реальной информации о следующих игровых видеокартах Nvidia не было. И хотя было несколько упоминаний об игровой графике, не было никаких прямых подробностей о самом оборудовании.

Тем не менее, основной доклад GTC состоял из множества деталей о A100. Несмотря на то, что A100 предназначен для центров обработки данных, эта же архитектура будет использоваться в видеокартах следующего поколения GeForce в будущем.

Таблица характеристик Nvidia A100

	Пиковая производительность
Количество транзисторов	54 миллиарда
Размер	826mm²
FP64 CUDA Cores	+3456
Ядра FP32 CUDA	6912
Тензорные Ядра	432
Потоковые мультипроцессоры	108
Память GPU	40GB
Пропускная способность памяти графического процессора	1,6 ТБ / с
Interconenct	NVLink 600 ГБ / с \| PCIe Gen 4 64 ГБ / с
Многоэкземплярные графические процессоры	Различные размеры экземпляров до 7MIG при 5 ГБ
Фактор формы	4/8 графических процессоров SXM в HGX A100
Максимальная мощность	400 Вт (SXM)

Отличительной чертой A100 является то, что это большой чип, и я не просто говорю о его физическом размере, хотя на 826-миллиметровом квадрате он мускулистый, это скорее тот факт, что он сжал там 54 миллиарда транзисторов. Здесь непросто проводить прямые сравнения с текущей архитектурой Turing, поскольку предыдущим предложением Nvidia для центров обработки данных был Volta V100, но все же есть некоторые серьезные улучшения в плане производительности. Nvidia заявляет о 20-кратном увеличении производительности по сравнению с Volta в определенных задачах. Для сравнения, этот чип имел 21,1 млрд транзисторов и имел площадь 815 мм. Таким образом, A100 имеет 2,5-кратные транзисторы, но только немного больше. Это прыжок к 7-нм процессу TSMC, показывающий его ценность.

Если вам нужна трассировка лучей в реальном времени, то во втором видео вы найдете множество видеороликов Minecraft RTX и восхитительную игру в мрамор под названием… Marble RTX. Тем не менее, речь не шла о RT-ядрах с трассировкой лучей, поскольку они не используются в центрах обработки данных, но производительность Tensor Core, по-видимому, значительно возросла. (Хотя они изменились, здесь нет простого сравнения).

Фактическое количество тензорных ядер на SM уменьшилось до четырех (у Тьюринга было восемь), но Nvidia по-прежнему заявляет об общем увеличении производительности — в некоторых случаях до 2,5x. Слухи о том, что производительность тензорной игры будет расти, похоже, на деньги, мы просто не ожидали, что на самом деле будет меньше ядер в целом.

Из всего этого мы не знаем, какую производительность мы получим на видеокартах следующего поколения. На данном этапе у нас нет количества ядер, тактовой частоты или чего-то подобного, хотя не забудьте проверить все, что мы знаем о Nvidia Ampere, для получения последней информации.