![Вот что мы знаем о графических процессорах Nvidia Ampere после выступления Jen-Hsun](https://0sheffieldjungle.com/wp-content/uploads/2020/05/fAF2tmLusNLRWW3c3TQ4TL-650-80.jpg)
Вот и все, Nvidia Ampere GTC Keynote закончена. Дженсен Хуан вернулся в своей фирменной черной кожаной куртке, и все сразу стало правильно с миром. Мы все должны заглянуть внутрь кухни генерального директора Nvidia и поразиться тому, сколько у него лопаток (честно, почему столько лопаток?).
Если не считать кухонную атрибутику, лейтмотив состоял из восьми видеороликов, охватывающих все: от автономного вождения, медицинских исследований, разговорного искусственного интеллекта и робототехники — все это важно для Nvidia, но не для нас, геймеров. После всего этого вы можете думать, что реальной информации о следующих игровых видеокартах Nvidia не было. И хотя было несколько упоминаний об игровой графике, не было никаких прямых подробностей о самом оборудовании.
Тем не менее, основной доклад GTC состоял из множества деталей о A100. Несмотря на то, что A100 предназначен для центров обработки данных, эта же архитектура будет использоваться в видеокартах следующего поколения GeForce в будущем.
Таблица характеристик Nvidia A100
Пиковая производительность | |
---|---|
Количество транзисторов | 54 миллиарда |
Размер | 826mm² |
FP64 CUDA Cores | +3456 |
Ядра FP32 CUDA | 6912 |
Тензорные Ядра | 432 |
Потоковые мультипроцессоры | 108 |
Память GPU | 40GB |
Пропускная способность памяти графического процессора | 1,6 ТБ / с |
Interconenct | NVLink 600 ГБ / с | PCIe Gen 4 64 ГБ / с |
Многоэкземплярные графические процессоры | Различные размеры экземпляров до 7MIG при 5 ГБ |
Фактор формы | 4/8 графических процессоров SXM в HGX A100 |
Максимальная мощность | 400 Вт (SXM) |
Отличительной чертой A100 является то, что это большой чип, и я не просто говорю о его физическом размере, хотя на 826-миллиметровом квадрате он мускулистый, это скорее тот факт, что он сжал там 54 миллиарда транзисторов. Здесь непросто проводить прямые сравнения с текущей архитектурой Turing, поскольку предыдущим предложением Nvidia для центров обработки данных был Volta V100, но все же есть некоторые серьезные улучшения в плане производительности. Nvidia заявляет о 20-кратном увеличении производительности по сравнению с Volta в определенных задачах. Для сравнения, этот чип имел 21,1 млрд транзисторов и имел площадь 815 мм. Таким образом, A100 имеет 2,5-кратные транзисторы, но только немного больше. Это прыжок к 7-нм процессу TSMC, показывающий его ценность.
![](https://cdn.mos.cms.futurecdn.net/GGwywCu98KfuxkhXH5WnFQ.jpg)
Если вам нужна трассировка лучей в реальном времени, то во втором видео вы найдете множество видеороликов Minecraft RTX и восхитительную игру в мрамор под названием… Marble RTX. Тем не менее, речь не шла о RT-ядрах с трассировкой лучей, поскольку они не используются в центрах обработки данных, но производительность Tensor Core, по-видимому, значительно возросла. (Хотя они изменились, здесь нет простого сравнения).
Фактическое количество тензорных ядер на SM уменьшилось до четырех (у Тьюринга было восемь), но Nvidia по-прежнему заявляет об общем увеличении производительности — в некоторых случаях до 2,5x. Слухи о том, что производительность тензорной игры будет расти, похоже, на деньги, мы просто не ожидали, что на самом деле будет меньше ядер в целом.
Из всего этого мы не знаем, какую производительность мы получим на видеокартах следующего поколения. На данном этапе у нас нет количества ядер, тактовой частоты или чего-то подобного, хотя не забудьте проверить все, что мы знаем о Nvidia Ampere, для получения последней информации.
Comments are closed, but trackbacks and pingbacks are open.