Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam

Пикабу Игры +1000 бесплатных онлайн игр

Стреляйте в преследующих вас врагов!
Оторвитесь от погони, ваш верный АК47 в этом поможет!
Огромный выбор оружия
Миниган, Арбалет, Стационарная пушка, Пулемет
Уничтожайте мотоциклы, квадроциклы, гоночные автомобили, вертолеты
Реалистичное оружие и машины

Погоня на Дороге: Шутер Реалистичное Оружие

Экшены, Аркады, Шутер

Играть
Начните с маленькой подводной лодки: устанавливайте бомбы, избавляйтесь от врагов и старайтесь не попадаться на глаза своим плавучим врагам. Вас ждет еще несколько игровых вселенных, много уникальных сюжетов и интересных загадок.

Пикабомбер

Аркады, Пиксельная, 2D

Играть
🔥 Дрифт и гонки без правил!
Садись за руль, жги резину и уноси баллы в безумных поворотах!
🚗 Реалистичный дрифт
🏁 Захватывающие трассы
💨 Улучши свою тачку и побеждай!

Дрифт Без Лимита

Гонки, Симуляторы, Спорт

Играть
Динамичный карточный батлер с PVE и PVP-боями онлайн! Собери коллекцию карточных героев, построй свою боевую колоду и вступай в бой с другими игроками.

Cards out!

Карточные, Ролевые, Стратегии

Играть
Собирайте комбинации из блоков! Бесконечный режим, более 100 уровней, ежедневные задания и турниры.

Расслабьтесь и отдохните: игра без ограничений по времени.

Проверьте свою смекалку: головоломка для любителей

Блоки Судоку - расслабляющая головоломка

Головоломки, Гиперказуальные, Мобильная

Играть

Топ прошлой недели

  • Oskanov Oskanov 8 постов
  • alekseyJHL alekseyJHL 6 постов
  • XpyMy XpyMy 1 пост
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Новости Пикабу Помощь Кодекс Пикабу Реклама О компании
Команда Пикабу Награды Контакты О проекте Зал славы
Промокоды Скидки Работа Курсы Блоги
Купоны Biggeek Купоны AliExpress Купоны М.Видео Купоны YandexTravel Купоны Lamoda
Мобильное приложение

Процессор

С этим тегом используют

Компьютер Intel Компьютерное железо AMD Видеокарта Электроника Сборка компьютера Все
977 постов сначала свежее
5
A.Kristina
A.Kristina
2 месяца назад
Интересный AliExpress

Как работает жидкостное охлаждение⁠⁠

Интересная система отвода излишнего тепла от процессора и видеокарты посредством контакта с циркулирующей охлаждающей жидкостью. Ссылка на набор

Охлаждение Система охлаждения Водяное охлаждение Электроника Компьютер Игровой ПК Компьютерное железо Сборка компьютера Материнская плата Кулер Геймеры Майнинг Компьютерная помощь Процессор Видео Короткие видео AliExpress
10
14
TechSavvyZone
TechSavvyZone
2 месяца назад

Технологии: "HBM память" цели, скорость, сфера применения⁠⁠

Технологии: "HBM память" цели, скорость, сфера применения Инженер, Технологии, Компьютерное железо, IT, Компьютер, Видеокарта, Электроника, AMD, Производство, История развития, Изобретения, Процессор, Искусственный интеллект, Длиннопост

HBM (память с высокой пропускной способностью) — это особый тип быстрой памяти, используемой в современных высокопроизводительных устройствах — видеокартах, AI ускорителях, DPU. За счет того, что HBM-память расположена на одной подложке с чипом GPU, она обеспечивает огромную скорость передачи данных.

История

HBM-память была разработана в 2013 году компанией AMD в сотрудничестве с Hynix и TSMC. Она предназначалась для использования в графических процессорах, предлагая гораздо большую пропускную способность по сравнению с традиционной DRAM. С тех пор последовательные поколения HBM многократно увеличили скорость передачи данных, с 128 Гбит/с в HBM1 до 819 Гбит/с в HBM3, что позволило современным GPU и другим высокопроизводительным устройствам получать значительные вычислительные возможности. HBM-память стала ключевым фактором развития суперкомпьютеров и передового оборудования для искусственного интеллекта.

Технологии: "HBM память" цели, скорость, сфера применения Инженер, Технологии, Компьютерное железо, IT, Компьютер, Видеокарта, Электроника, AMD, Производство, История развития, Изобретения, Процессор, Искусственный интеллект, Длиннопост

Смысл HBM-памяти

Архитектурно HBM-память, в отличии от GDDR-памяти, встраивается непосредственно в чип GPU, а не вынесена за его пределы. Она построена на использовании вертикально расположенных слоев памяти и вместо традиционной горизонтальной компоновки, в HBM применяют несколько (обычно от 4 до 8) отдельных кристаллов памяти, размещенных друг на друге. Важно отметить, что это позволяет сократить расстояние между графическим процессором и VRAM, уменьшая задержки и увеличивая пропускную способность.
Кристаллы памяти соединены между собой высокоскоростными связями, позволяющими передавать данные с очень высокой скоростью и в большом объеме. В сочетании с высокой плотностью размещения ячеек памяти, это дает HBM колоссальную пропускную способность — до 819 Гбит/с на один чиплет.

Технологии: "HBM память" цели, скорость, сфера применения Инженер, Технологии, Компьютерное железо, IT, Компьютер, Видеокарта, Электроника, AMD, Производство, История развития, Изобретения, Процессор, Искусственный интеллект, Длиннопост

Такая архитектура, с ее встроенной в GPU памятью, идеально подходит для высокопроизводительных устройств, таких как мощные видеокарты, ускорители ИИ и суперкомпьютеры, нуждающиеся в огромных вычислительных возможностях.

Технологии: "HBM память" цели, скорость, сфера применения Инженер, Технологии, Компьютерное железо, IT, Компьютер, Видеокарта, Электроника, AMD, Производство, История развития, Изобретения, Процессор, Искусственный интеллект, Длиннопост
Технологии: "HBM память" цели, скорость, сфера применения Инженер, Технологии, Компьютерное железо, IT, Компьютер, Видеокарта, Электроника, AMD, Производство, История развития, Изобретения, Процессор, Искусственный интеллект, Длиннопост

Ключевые отличия HBM от GDDR

Технологии: "HBM память" цели, скорость, сфера применения Инженер, Технологии, Компьютерное железо, IT, Компьютер, Видеокарта, Электроника, AMD, Производство, История развития, Изобретения, Процессор, Искусственный интеллект, Длиннопост

Ключевые отличия HBM от традиционной GDDR-памяти заключаются в архитектуре:
1. Компоновка памяти:

  • GDDR состоит из отдельных BGA чипов, распаянных на общем текстолите.

  • В HBM чиплеты памяти распаяны на одной кремниевой подложке с GPU.

2. Способ подключения к процессору:

  • GDDR соединяется с процессором через металлизированные дорожки в текстолите.

  • HBM напрямую подключается к процессору через короткие межсоединения в рамках одной кремниевой подложки, сокращая расстояние.

3. Пропускная способность:

  • GDDR уступает в скоростных показателях HBM-решениям.

  • HBM за счет 3D-компоновки обеспечивает гораздо более высокую пропускную способность. Это связано с тем, что у HBM гораздо большая шина памяти, поскольку она состоит из множества параллельных каналов, что позволяет передавать большие объемы данных одновременно. Именно благодаря этой широкой шине памяти HBM обеспечивает выдающуюся производительность.

Технологии: "HBM память" цели, скорость, сфера применения Инженер, Технологии, Компьютерное железо, IT, Компьютер, Видеокарта, Электроника, AMD, Производство, История развития, Изобретения, Процессор, Искусственный интеллект, Длиннопост

Таким образом, архитектура HBM позволяет добиться существенно более высокой производительности по сравнению с GDDR, что делает ее незаменимой для современных высокопроизводительных устройств.

Технологии: "HBM память" цели, скорость, сфера применения Инженер, Технологии, Компьютерное железо, IT, Компьютер, Видеокарта, Электроника, AMD, Производство, История развития, Изобретения, Процессор, Искусственный интеллект, Длиннопост

HBM в ускорителях для обучения ИИ

HBM это действительно прорывная технология, без которой решение современных задач было бы невозможно. Так высокоскоростная память используется в таких продуктах, как Nvidia Tesla и AMD Radeon Instinct, предназначенных для обучения искусственного интеллекта и нейронных сетей. Связанно это с тем, что HBM память способна дать ни с чем не сравнимый уровень производительности, так необходимый для развития AI-технологий. Одним из флагманских продуктов является AMD Instinct MI300X оснащен 192GB HBM3 памяти с пропускной способностью в 5.2TB/s. Такие скоростные показатели важны для эффективного обучения искусственного интеллекта.

Технологии: "HBM память" цели, скорость, сфера применения Инженер, Технологии, Компьютерное железо, IT, Компьютер, Видеокарта, Электроника, AMD, Производство, История развития, Изобретения, Процессор, Искусственный интеллект, Длиннопост

Преимущества HBM

Основные преимущества:

  1. Высокая пропускная способность: HBM обеспечивает беспрецедентные скорости передачи данных, достигающие до 819 Гбит/с на один чиплет в последних поколениях. Это существенно превосходит возможности традиционной GDDR-памяти.

  2. Низкие задержки: Благодаря короткому пути передачи данных, HBM демонстрирует очень низкую латентность доступа к памяти, что важно для высокопроизводительных приложений.

  3. Энергоэффективность: HBM потребляет значительно меньше энергии по сравнению с GDDR-памятью, что важно для решений с ограниченным тепловым бюджетом.

  4. Масштабируемость: поколения HBM постоянно эволюционируют, увеличивая объем доступной памяти и пропускную способность, обеспечивая высокую масштабируемость.

  5. Надежность: специальная архитектура и технология производства HBM гарантируют повышенную надежность и стабильность работы. Также HBM имеет поддержку ECC — технологии аппаратного исправления ошибок.

Эти ключевые преимущества HBM-памяти в области производительности, энергоэффективности и компактности делают ее идеальным выбором для широкого спектра высокопроизводительных вычислительных систем, от графических ускорителей до суперкомпьютеров.

Технологии: "HBM память" цели, скорость, сфера применения Инженер, Технологии, Компьютерное железо, IT, Компьютер, Видеокарта, Электроника, AMD, Производство, История развития, Изобретения, Процессор, Искусственный интеллект, Длиннопост

Недостатки HBM

Также у HBM-памяти есть ряд недостатков:

  1. Высокая стоимость: HBM-модули являются более дорогими по сравнению с традиционной GDDR-памятью. Это связано со сложностью производства и упаковки 3D-чипов.

  2. Сложность интеграции: интеграция HBM-памяти в системные решения является более сложной по сравнению с GDDR. Это требует специальной компоновки подложки кристалла GPU и более тщательной разводки сигналов.

  3. Меньший ассортимент продуктов: в отличие от GDDR, ассортимент продуктов с HBM-памятью пока более ограничен, особенно для конечных потребителей.

  4. Невозможность ремонта: из-за сложной 3D-компоновки, ремонт и замена вышедших из строя HBM-модулей невозможны — HBM нельзя выпаять, можно только заменить сам чип, а его цена составляет до 95% от стоимости ускорителя.

HBM на потребительском рынке

Не многие знают, что память HBM применялась в ряде десктопных графических адаптеров. Давайте совместно проследим за развитием сверхскоростной памяти на игровом рынке.

  1. AMD Radeon R9 FURY — адаптер имел на борту 4Gb HBM памяти первого поколения. Память имела пропускную способность 512.0 GB/s, что в почти в 1,5 раза опережало показатели GDDR5 в 2015 году(GTX980ti - 336.6 GB/s).

Технологии: "HBM память" цели, скорость, сфера применения Инженер, Технологии, Компьютерное железо, IT, Компьютер, Видеокарта, Электроника, AMD, Производство, История развития, Изобретения, Процессор, Искусственный интеллект, Длиннопост

2. AMD Radeon RX Vega 64 — ускоритель, дебютировавший в 2017 году на базе второго поколения сверхбыстрой памяти. 8GB HBM2 не могли похвастаться рекордными скоростями и ограничивались 483.8 GB/s. Отсутствие кратного роста производительности связано с применением лишь двух кристаллов HBM2, пока в R9 Fury использовалось 4. Тем не менее, эта планка производительности превосходила достижения конкурентов — GTX1080 могла похвастаться лишь 320.3 GB/s на базе GDDR5X памяти.

Технологии: "HBM память" цели, скорость, сфера применения Инженер, Технологии, Компьютерное железо, IT, Компьютер, Видеокарта, Электроника, AMD, Производство, История развития, Изобретения, Процессор, Искусственный интеллект, Длиннопост

3. AMD Radeon VII — GPU с 16GB на базе четырех чиплетов HBM2 памяти предоставлял пропускную способность в 1.02 TB/s! На момент 2019 года ближайший конкурент в лице RTX 2080 Ti имел лишь ПП 616.0 GB/s — это еще раз доказывает превосходство HBM памяти над GDDR.

Технологии: "HBM память" цели, скорость, сфера применения Инженер, Технологии, Компьютерное железо, IT, Компьютер, Видеокарта, Электроника, AMD, Производство, История развития, Изобретения, Процессор, Искусственный интеллект, Длиннопост

Период с 2015-2020 год можно смело назвать “экспериментом от AMD”. Красный гигант путем адаптации собственных профессиональных чипов для потребительского рынка пытался повысить серийность HBM, что должно было повлечь снижение стоимости конечных продуктов. Однако потребители не были готовы переплачивать за привычные объемы памяти, а игровые издатели не адаптировали релизы под производительную память. Эти факторы сделали HBM память в потребительском сегменте практически бессмысленной, в результате чего она была вытеснена с десктопного рынка. Наглядная разница строения чипов AMD с HBM памятью. Чип Fiji в R9 Fury имеет самые малые чиплеты HBM. Чип Vega 64 имеет два модуля HBM для оптимизации стоимости видеокарты. Radeon VII спроектирован без компромиссов, но в свою очередь имел стоимость в 700$ на старте продаж.

Технологии: "HBM память" цели, скорость, сфера применения Инженер, Технологии, Компьютерное железо, IT, Компьютер, Видеокарта, Электроника, AMD, Производство, История развития, Изобретения, Процессор, Искусственный интеллект, Длиннопост

Таким образом, сочетание высокой пропускной способности, энергоэффективности и масштабируемости делает HBM ключевым компонентом в разработке высокопроизводительных систем для широкого спектра приложений, включая обработку графики, обучение нейронных сетей, научные вычисления и другие ресурсоемкие задачи. HBM позволяет достигать значительных улучшений в производительности и сокращать энергопотребление, что является критически важным для современных высокопроизводительных вычислительных систем.
Развитие HBM открывает перспективы значительного повышения производительности и энергоэффективности высокопроизводительных вычислительных систем.

Показать полностью 13
Инженер Технологии Компьютерное железо IT Компьютер Видеокарта Электроника AMD Производство История развития Изобретения Процессор Искусственный интеллект Длиннопост
2
6
buhanka.chan
buhanka.chan
2 месяца назад

Играем в War Thunder на Эльбрусe 8C⁠⁠

Конфигурация рабочей станции Эльбрус-801: Эльбрус-8С (8 ядер по 1,3 ГГц), 32 Гб ОЗУ DDR3-ECC, Radeon RX Vega 64, версия ОС Эльбрус 8.1

Игровой ПК Эльбрус-8с Компьютерное железо War Thunder Процессор Видео RUTUBE
10
UnderwaterAlarm
UnderwaterAlarm
2 месяца назад

Ответ на пост «Intel Pentium 4 478 socket 3.4Ггц в 2020г ?»⁠⁠1

Ответ на пост «Intel Pentium 4 478 socket 3.4Ггц в 2020г ?» Процессор, Pentium 4, Вопрос, Спроси Пикабу, Текст, Ответ на пост

Неграмотность некоторых авторов зашкаливает.

Процессор Pentium 4 Вопрос Спроси Пикабу Текст Ответ на пост
4
15
TechSavvyZone
TechSavvyZone
2 месяца назад

Сердце ПК Кремниевый двигатель "AMD": "3D V-Cache" предназначение⁠⁠

Сердце ПК Кремниевый двигатель "AMD": "3D V-Cache" предназначение Компьютерное железо, Инженер, Компьютер, Технологии, IT, AMD, Процессор, Электроника, Производство, Тестирование, Длиннопост

3D V-Cache — новая ступень развития кэша центральных процессоров. Технология призвана увеличить производительность без внесения изменений в саму архитектуру ЦП. Как она работает?

Что такое кэш процессора

Кэш у центральных процессоров — небольшой объем быстрой памяти, призванный смягчить разницу между скоростью работы ЦП и оперативной памяти, а также сократить задержки. Последняя работает намного медленнее и не успевает своевременно подавать данные, необходимые для работы, процессору напрямую. Именно поэтому еще с далекого 1985 года, у массовых процессоров Intel появилась кэш-память. Уже через четыре года была добавлена возможность работы со вторым уровнем кэша — L2. Он был менее быстрым, чем первый уровень — L1, но большего объема. В совокупности два уровня кэша имели более высокую вероятность того, что нужные данные окажутся в них при запросе центрального процессора. Соответственно ситуаций, когда в кэше нет нужных данных («промах»), стало меньше и средняя производительность с применением двухуровнего кэша значительно возрастала.

Сердце ПК Кремниевый двигатель "AMD": "3D V-Cache" предназначение Компьютерное железо, Инженер, Компьютер, Технологии, IT, AMD, Процессор, Электроника, Производство, Тестирование, Длиннопост

Двухуровневая система кэшей использовалась процессорами Intel и AMD достаточно долгое время, пережив много архитектур и значительный рост производительности самих ЦП. Но уже в 2007 году AMD представила первые процессоры с кэшем третьего уровня – Phenom. Из-за активного внедрения многоядерности, кэш уровня L3 стал просто необходим для быстрого обмена данными между ядрами. В следующем году его внедрила и Intel в процессорах Core i7 первого поколения, и с тех пор он стал использоваться во всех новых ЦП поголовно.

В чем отличия 3D V-Cache и как он работает

Идея 3D V-Cache не нова и берет истоки у конкурента AMD — Intel. А точнее — у серии процессоров 2015 года под кодовым названием Broadwell. Да, еще семь лет назад Intel решила внедрить в свои процессоры большой кэш четвертого уровня — 128 Мб памяти eDRAM. Для сравнения — кэш L3 у массовых процессоров Intel не превышал объема в 8 Мб, а в Broadwell был сокращен до 6 Мб.

Кэш представлял собой отдельный кристалл под крышкой процессора рядом с вычислительным. Благодаря столь огромному объему процессоры Broadwell с eDRAM превосходили в производительности своих предшественников Haswell даже на более низких тактовых частотах и при практически неизменной процессорной архитектуре. Особенно этот разрыв был велик в 3D-играх. Объем в 128 Мб для четырехъядерного процессора перекрывал практически все возможные промахи и позволял полностью раскрыться и без того производительной архитектуре тех лет.

Однако в последующих поколениях процессоров Intel отказалась от eDRAM в силу его дороговизны, оставив дополнительный кристалл только для редких ноутбучных процессоров с производительной встроенной графикой, которая так же могла пользоваться кэшем, как и процессорные ядра. Из десктопного сегмента такие процессоры из ассортимента Intel после 2015 года ушли окончательно.

Сердце ПК Кремниевый двигатель "AMD": "3D V-Cache" предназначение Компьютерное железо, Инженер, Компьютер, Технологии, IT, AMD, Процессор, Электроника, Производство, Тестирование, Длиннопост

3D V-Cache не является кэшем четвертого уровня — вместо этого AMD решили увеличить объем кэша третьего уровня в три раза. К тому же, eDRAM медленнее L3, и простое расширение скоростного L3 даст даже больший эффект. Но общий принцип увеличения производительности у технологий схож: больше кэша = меньше промахов = меньше задержек = выше производительность.

Что даст 3D V-Cache процессорам

Как и любой кэш, 3D V-Cache уменьшает количество промахов при запросе нужных данных и снижает задержки обращения к ОЗУ. А благодаря большому объему это количество должно уменьшиться кратно, да и задержки сократятся существенно. Это позволит раскрыть весь потенциал процессоров архитектуры Zen 3+ и последующих, убирая узкие места. Особенно эффективен он в играх — рост производительности может достигать десятков процентов, но и многие другие приложения к нему чувствительны.

Сердце ПК Кремниевый двигатель "AMD": "3D V-Cache" предназначение Компьютерное железо, Инженер, Компьютер, Технологии, IT, AMD, Процессор, Электроника, Производство, Тестирование, Длиннопост

Однако скорости целочисленным операциям кэш не добавит, что следует учитывать для тех приложений, которые используют процессор исключительно как «числодробилку». К тому же, дополнительный кэш вносит свой вклад в нагрев процессора. В результате чего аналогичные процессоры с 3D V-Cache и без него могут отличаться базовыми частотами. У моделей с кэшем частота будет ниже, но само ускорение от применения технологии во многих сценариях позволит это нивелировать.

Особенности и перспективы технологии

3D V-Cache уже используется в серверных процессорах AMD EPYC 3 поколения. В смешанных серверных нагрузках одно только внедрение этого кэша способно увеличить производительность задач до полутора раз, а в некоторых задачах — и того больше. Поэтому неудивительно, что первые процессоры с данной технологией выпущены не среди массовых десктопных. Однако, AMD уже заявила и о массовых процессорах с 3D V-Cache. Первым из них будет Ryzen 7 5800X3D, который должен увидеть свет в этом году. В будущих процессорах на архитектуре Zen 4 моделей с поддержкой данной технологии будет больше.

Однако 3D V-Cache на данном этапе — далеко не массовая технология. При изготовлении такого процессора дополнительный многослойный кристалл памяти устанавливается на чиплет с ядрами и соединяется с ним по технологии сквозных соединений. Мало того, что производство таких чипов обходится недешево, так еще и сама кэш-память большого объема в производстве дорога. Количество транзисторов, используемых в ней, достигает нескольких миллиардов, что сравнимо с их количеством в самих чиплетах с ядрами ЦП.

Сердце ПК Кремниевый двигатель "AMD": "3D V-Cache" предназначение Компьютерное железо, Инженер, Компьютер, Технологии, IT, AMD, Процессор, Электроника, Производство, Тестирование, Длиннопост

Именно поэтому реальное использование технологии 3D V-Cache в ближайшие годы стоит ожидать только в топовых процессорах. В бюджетных моделях ее применение лишено экономического смысла, так как цена процессора с малым количеством ядер и этой технологией будет совсем не гуманна по сравнению с конкурентами.

Показать полностью 4
Компьютерное железо Инженер Компьютер Технологии IT AMD Процессор Электроника Производство Тестирование Длиннопост
7
0
Вопрос из ленты «Эксперты»
TheSunLiteBeta
TheSunLiteBeta
2 месяца назад

Intel Pentium 4 478 socket 3.4Ггц в 2020г ?⁠⁠1

Что физически не потдерживает процессор intel pentium 4 478 socket в 2020 году ?

Учитывая архетиктуру и инструкции процессора а не его частоту так как она может доходить до 3.4Ггц.

Из примеров:

1) когда спросил разработчика сможет ли он извлекать ресурсы из apk и obb файлов на intel pentium 4 он ответил что "Проц не потянет нужные дерективы".

2) Intel Pentium 4 478 socket не потдерживает Windows 10 Home 32x так как в процессоре физически отсуствует компонент NX Бит.

[моё] Процессор Pentium 4 Вопрос Спроси Пикабу Текст
14
KorkaH
2 месяца назад
pikabu GAMES

AMD X3D расхайпленый кал ?⁠⁠

AMD X3D расхайпленый кал ? AMD, Amd ryzen, Процессор, Видео, YouTube
Показать полностью 1
AMD Amd ryzen Процессор Видео YouTube
5
37
TechSavvyZone
TechSavvyZone
2 месяца назад

Технологии: "GPU" устройство графического процессора⁠⁠

Технологии: "GPU" устройство графического процессора Инженер, Компьютерное железо, Компьютер, Технологии, IT, Компьютерная графика, Видеокарта, Процессор, Электроника, Производство, История развития, Тестирование, Длиннопост

Графический процессор — «сердце» видеокарты. Он производит расчеты в играх и некоторых программах, которые умеют его использовать. Как устроен ГП внутри, какие блоки находятся в его составе, и как они работают?

Графический процессор (ГП) видеокарты — вычислительный чип, имеющий непростое внутреннее устройство. Современные топовые ГП технически сложнее, чем многоядерные центральные процессоры. А все потому, что вычислительные блоки в них хоть и устроены проще, но их количество в разы больше.

Технологии: "GPU" устройство графического процессора Инженер, Компьютерное железо, Компьютер, Технологии, IT, Компьютерная графика, Видеокарта, Процессор, Электроника, Производство, История развития, Тестирование, Длиннопост

Из каких частей состоит графический процессор? За что они отвечают, как работают, и как связаны между собой? Разбираем по порядку.

Шейдерные процессоры

В центральном процессоре расчеты производят вычислительные ядра. В ГП базовым вычислительным элементом является шейдерный процессор (Shader Processor, SP). До 2006 года шейдерные процессоры делились на вершинные и пиксельные. Первые вычисляли пространственные координаты вершин полигонов, необходимые для переноса 3D-картинки в двухмерное изображение на мониторе. Вторые занимались вычислением цвета каждой точки этого изображения с учетом данных о ее освещении. Современные ГП оснащены универсальными шейдерными процессорами, которые могут выполнять оба вида вычислений, а также генерировать новую геометрию на основе уже имеющихся вершин. Вдобавок к этому они поддерживают неграфические вычисления, благодаря которым мощь ГП можно задействовать в некоторых программах — например, для обработки и конвертации видео.

Технологии: "GPU" устройство графического процессора Инженер, Компьютерное железо, Компьютер, Технологии, IT, Компьютерная графика, Видеокарта, Процессор, Электроника, Производство, История развития, Тестирование, Длиннопост

NVIDIA называет свои шейдерные процессоры CUDA-ядрами — в честь одноименного API CUDA, разработанного компанией и предназначенного для вычислений на ГП собственного производства. Несмотря на другое название, их внутреннее устройство довольно схоже с шейдерными процессорами конкурентов — AMD и Intel.

Технологии: "GPU" устройство графического процессора Инженер, Компьютерное железо, Компьютер, Технологии, IT, Компьютерная графика, Видеокарта, Процессор, Электроника, Производство, История развития, Тестирование, Длиннопост

Текстурные блоки

Текстурные блоки (Texture Mapping Unit, TMU) занимаются выборкой, наложением и фильтрацией игровых текстур. В каждом TMU имеются блоки адресации (Texture Address, TA) и фильтрации (Texture Filtering, TF).

С помощью блоков адресации TMU «натягивают» текстуры на полигоны, которые рассчитали шейдерные процессоры.

Технологии: "GPU" устройство графического процессора Инженер, Компьютерное железо, Компьютер, Технологии, IT, Компьютерная графика, Видеокарта, Процессор, Электроника, Производство, История развития, Тестирование, Длиннопост

А с помощью блоков фильтрации они могут применять к текстурам один из видов фильтрации для их более четкого отображения: билинейную, трилинейную или анизотропную.

Технологии: "GPU" устройство графического процессора Инженер, Компьютерное железо, Компьютер, Технологии, IT, Компьютерная графика, Видеокарта, Процессор, Электроника, Производство, История развития, Тестирование, Длиннопост

Растровые блоки

Блоки растровых операций (Render Output Unit, ROP) занимаются финальным этапом появления 3D-изображения на экране — растеризацией.

Технологии: "GPU" устройство графического процессора Инженер, Компьютерное железо, Компьютер, Технологии, IT, Компьютерная графика, Видеокарта, Процессор, Электроника, Производство, История развития, Тестирование, Длиннопост

ROP собирают информацию от шейдерных процессоров и текстурных модулей. С помощью них эти блоки вычисляют конечное значение цвета для каждой точки двухмерного изображения, которое появляется на экране.

Некоторые методы сглаживания используют для своей работы именно блоки растровых операций — например, MSAA, SSAA и AAA.

Технологии: "GPU" устройство графического процессора Инженер, Компьютерное железо, Компьютер, Технологии, IT, Компьютерная графика, Видеокарта, Процессор, Электроника, Производство, История развития, Тестирование, Длиннопост

Блоки трассировки лучей

Современные графические процессоры оснащены специальными блоками, которые занимаются трассировкой лучей. Их также называют RT-ядрами (Ray Tracing Core).

RT-ядра просчитывают пересечения лучей с полигонами и боксами иерархии ограничивающих объемов (BVH), в которые помещаются 3D-объекты для более эффективных и быстрых расчетов трассировки лучей.

Технологии: "GPU" устройство графического процессора Инженер, Компьютерное железо, Компьютер, Технологии, IT, Компьютерная графика, Видеокарта, Процессор, Электроника, Производство, История развития, Тестирование, Длиннопост

Блоки матричных вычислений

Основная масса вычислений, необходимая для рендера игровой графики — это расчеты с 32-битной точностью. Иногда можно встретить и 16-битные графические расчеты, которые могут производиться с целью упрощения некоторых операций и повышения производительности. Однако в общем количестве их процент достаточно мал. Такие расчеты выполняют шейдерные процессоры ГП, оптимизированные под 32-битную точность. Однако есть целая категория вычислений, для которой столь точные расчеты попросту не нужны. К ним относятся технологии «умного» масштабирования изображения NVIDIA DLSS, AMD FSR и Intel XeSS. Аналогичных расчетов достаточно для подавления шумов, которые появляются при трассировке лучей, а также некоторых неигровых вычислений — например, нейросетей и программных продуктов на их базе.

Расчеты пониженной точности многие современные графические процессоры выполняют с помощью отдельных блоков матричных вычислений. Для всего вышеописанного парка технологий могут использоваться 16-битные расчеты, но более эффективны менее точные: восьми-, четырех- или даже двухбитные. Чем меньше точность, тем быстрее эти вычисления выполняются на матричных блоках.

Технологии: "GPU" устройство графического процессора Инженер, Компьютерное железо, Компьютер, Технологии, IT, Компьютерная графика, Видеокарта, Процессор, Электроника, Производство, История развития, Тестирование, Длиннопост

Как и шейдерные процессоры, такие блоки относятся к вычислительным. Но в силу пониженной точности вычислений они устроены заметно проще, чем SP. NVIDIA называет их тензорными ядрами, Intel – матричными ядрами XMX. В ГП AMD выделенные блоки для таких расчетов отсутствуют, но имеется возможность переключить шейдерные процессоры в альтернативный режим работы с помощью специальных блоков матричного ускорения.

Вычислительные модули

Все вышеописанные блоки — это базовые «кирпичики» графического процессора. Из них формируются более крупные вычислительные модули. В каждом поколении графической архитектуры соотношение блоков в вычислительных модулях отличается, но их общие принципы устройства остаются довольно схожими для всех ГП.

У ГП NVIDIA самый маленький вычислительный модуль — потоковый мультипроцессор (Streaming Multiprocessor, SM). К примеру, в видеокарте RTX4090 такой модуль разделен на четыре части, в каждой из которой находится 32 ядра CUDA и одно тензорное ядро. По аналогии с ядром центрального процессора, каждая часть оснащена блоками загрузки данных и регистровым файлом. Общая часть SM содержит 128 КБ кэша, четыре TMU, RT-ядро и процессор обработки геометрии.

Технологии: "GPU" устройство графического процессора Инженер, Компьютерное железо, Компьютер, Технологии, IT, Компьютерная графика, Видеокарта, Процессор, Электроника, Производство, История развития, Тестирование, Длиннопост

Два потоковых мультипроцессора объединены в кластер текстурной обработки (Texture Processing Cluster, TPC). Из шести TPC и 16 блоков ROP образуется один крупный графический вычислительный кластер (Graphics Processing Cluster, GPC) — вычислительная единица, содержащая все необходимое для работы с графикой. В каждом графическом процессоре таких кластеров несколько.

Технологии: "GPU" устройство графического процессора Инженер, Компьютерное железо, Компьютер, Технологии, IT, Компьютерная графика, Видеокарта, Процессор, Электроника, Производство, История развития, Тестирование, Длиннопост

Cхоже устроены и ГП AMD, с тем отличием, что модули у них называются по-другому. Самым небольшим из них является вычислительный блок (Compute Unit, CU). Каждый CU современных моделей содержит 64 шейдерных процессора, четыре блока TMU, одно RT-ядро, кэш-память и регистровый файл. Два вычислительных блока объединяются в один процессор групповой обработки (Work Group Processor, WGP). Или как его еще называют, Dual CU.

Технологии: "GPU" устройство графического процессора Инженер, Компьютерное железо, Компьютер, Технологии, IT, Компьютерная графика, Видеокарта, Процессор, Электроника, Производство, История развития, Тестирование, Длиннопост

В последнем поколении ГП Radeon RX7000 каждый CU вдобавок к этому набору имеет два блока матричного ускорения. Из восьми Dual CU и 32 ROP образуется один крупный шейдерный движок (Shader Engine, SE) — аналог графического вычислительного кластера от NVIDIA, содержащий в себе все необходимые блоки для работы с графикой. Аналогично конкуренту, в графических процессорах AMD таких шейдерных движков несколько.

Технологии: "GPU" устройство графического процессора Инженер, Компьютерное железо, Компьютер, Технологии, IT, Компьютерная графика, Видеокарта, Процессор, Электроника, Производство, История развития, Тестирование, Длиннопост

В ГП Intel группировка модулей немного другая. Каждые 16 шейдерных процессоров здесь объединены в векторный движок (Xe Vector Engine, XVE). К нему присоединены два матричных блока XMX. 16 таких связок вкупе с регистровым файлом и кэшем образуют вычислительную единицу графического процессора — ядро XE.

Технологии: "GPU" устройство графического процессора Инженер, Компьютерное железо, Компьютер, Технологии, IT, Компьютерная графика, Видеокарта, Процессор, Электроника, Производство, История развития, Тестирование, Длиннопост

Четыре ядра XE объединены в более крупный модуль Render Slice. Помимо ядер XE, в нем содержатся четыре RT-ядра, 16 блоков ROP и процессор обработки геометрии. Аналогично графическому вычислительному кластеру NVIDIA и шейдерному движку AMD, Render Slice имеет все нужные блоки для работы с графикой. Вычислительную часть графического процессора Intel образуют несколько подобных блоков.

Технологии: "GPU" устройство графического процессора Инженер, Компьютерное железо, Компьютер, Технологии, IT, Компьютерная графика, Видеокарта, Процессор, Электроника, Производство, История развития, Тестирование, Длиннопост

Подсистема памяти

Все вычислительные блоки объединены общей шиной, к которой подключен второй уровень кэша (L2). У NVIDIA и Intel сразу после L2 информация поступает на контроллеры памяти, которые связывают ГП с микросхемами графической ОЗУ.

В отличие от двух других производителей, в ГП AMD блоки обработки геометрии и асинхронных вычислений выделены из состава вычислительных блоков и находятся рядом с кэшем L2. Вслед за ним следует память Infinity Cache, которая играет роль кэша третьего уровня, и лишь потом графическая ОЗУ.

Технологии: "GPU" устройство графического процессора Инженер, Компьютерное железо, Компьютер, Технологии, IT, Компьютерная графика, Видеокарта, Процессор, Электроника, Производство, История развития, Тестирование, Длиннопост

Прочие блоки

Помимо уже упомянутых, в графическом процессоре содержатся и другие блоки, которые не относятся к вычислительным:

  • Контроллер шины PCI-Express. Служит для связи видеокарты с прочими компонентами компьютера посредством шины PCI-E.

  • Движок дисплея. Часть ГП, занимающаяся выводом изображения на цифровые интерфейсы — HDMI, DisplayPort или DVI (а ранее — и на аналоговый VGA).

  • Мультимедийный движок. Аппаратный декодер, позволяющий воспроизводить или кодировать видеофайлы различных форматов.

Технологии: "GPU" устройство графического процессора Инженер, Компьютерное железо, Компьютер, Технологии, IT, Компьютерная графика, Видеокарта, Процессор, Электроника, Производство, История развития, Тестирование, Длиннопост
Показать полностью 17
Инженер Компьютерное железо Компьютер Технологии IT Компьютерная графика Видеокарта Процессор Электроника Производство История развития Тестирование Длиннопост
2
Посты не найдены
О Нас
О Пикабу
Контакты
Реклама
Сообщить об ошибке
Сообщить о нарушении законодательства
Отзывы и предложения
Новости Пикабу
RSS
Информация
Помощь
Кодекс Пикабу
Награды
Команда Пикабу
Бан-лист
Конфиденциальность
Правила соцсети
О рекомендациях
Наши проекты
Блоги
Работа
Промокоды
Игры
Скидки
Курсы
Зал славы
Mobile
Мобильное приложение
Партнёры
Промокоды Biggeek
Промокоды Маркет Деливери
Промокоды Яндекс Путешествия
Промокоды М.Видео
Промокоды в Ленте Онлайн
Промокоды Тефаль
Промокоды Сбермаркет
Промокоды Спортмастер
Постила
Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии