Процессор

С этим тегом используют

2 месяца назад

Сердце ПК Кремниевый двигатель "AMD": "3D V-Cache" предназначение⁠⁠

3D V-Cache — новая ступень развития кэша центральных процессоров. Технология призвана увеличить производительность без внесения изменений в саму архитектуру ЦП. Как она работает?

Что такое кэш процессора

Кэш у центральных процессоров — небольшой объем быстрой памяти, призванный смягчить разницу между скоростью работы ЦП и оперативной памяти, а также сократить задержки. Последняя работает намного медленнее и не успевает своевременно подавать данные, необходимые для работы, процессору напрямую. Именно поэтому еще с далекого 1985 года, у массовых процессоров Intel появилась кэш-память. Уже через четыре года была добавлена возможность работы со вторым уровнем кэша — L2. Он был менее быстрым, чем первый уровень — L1, но большего объема. В совокупности два уровня кэша имели более высокую вероятность того, что нужные данные окажутся в них при запросе центрального процессора. Соответственно ситуаций, когда в кэше нет нужных данных («промах»), стало меньше и средняя производительность с применением двухуровнего кэша значительно возрастала.

Двухуровневая система кэшей использовалась процессорами Intel и AMD достаточно долгое время, пережив много архитектур и значительный рост производительности самих ЦП. Но уже в 2007 году AMD представила первые процессоры с кэшем третьего уровня – Phenom. Из-за активного внедрения многоядерности, кэш уровня L3 стал просто необходим для быстрого обмена данными между ядрами. В следующем году его внедрила и Intel в процессорах Core i7 первого поколения, и с тех пор он стал использоваться во всех новых ЦП поголовно.

В чем отличия 3D V-Cache и как он работает

Идея 3D V-Cache не нова и берет истоки у конкурента AMD — Intel. А точнее — у серии процессоров 2015 года под кодовым названием Broadwell. Да, еще семь лет назад Intel решила внедрить в свои процессоры большой кэш четвертого уровня — 128 Мб памяти eDRAM. Для сравнения — кэш L3 у массовых процессоров Intel не превышал объема в 8 Мб, а в Broadwell был сокращен до 6 Мб.

Кэш представлял собой отдельный кристалл под крышкой процессора рядом с вычислительным. Благодаря столь огромному объему процессоры Broadwell с eDRAM превосходили в производительности своих предшественников Haswell даже на более низких тактовых частотах и при практически неизменной процессорной архитектуре. Особенно этот разрыв был велик в 3D-играх. Объем в 128 Мб для четырехъядерного процессора перекрывал практически все возможные промахи и позволял полностью раскрыться и без того производительной архитектуре тех лет.

Однако в последующих поколениях процессоров Intel отказалась от eDRAM в силу его дороговизны, оставив дополнительный кристалл только для редких ноутбучных процессоров с производительной встроенной графикой, которая так же могла пользоваться кэшем, как и процессорные ядра. Из десктопного сегмента такие процессоры из ассортимента Intel после 2015 года ушли окончательно.

3D V-Cache не является кэшем четвертого уровня — вместо этого AMD решили увеличить объем кэша третьего уровня в три раза. К тому же, eDRAM медленнее L3, и простое расширение скоростного L3 даст даже больший эффект. Но общий принцип увеличения производительности у технологий схож: больше кэша = меньше промахов = меньше задержек = выше производительность.

Что даст 3D V-Cache процессорам

Как и любой кэш, 3D V-Cache уменьшает количество промахов при запросе нужных данных и снижает задержки обращения к ОЗУ. А благодаря большому объему это количество должно уменьшиться кратно, да и задержки сократятся существенно. Это позволит раскрыть весь потенциал процессоров архитектуры Zen 3+ и последующих, убирая узкие места. Особенно эффективен он в играх — рост производительности может достигать десятков процентов, но и многие другие приложения к нему чувствительны.

Однако скорости целочисленным операциям кэш не добавит, что следует учитывать для тех приложений, которые используют процессор исключительно как «числодробилку». К тому же, дополнительный кэш вносит свой вклад в нагрев процессора. В результате чего аналогичные процессоры с 3D V-Cache и без него могут отличаться базовыми частотами. У моделей с кэшем частота будет ниже, но само ускорение от применения технологии во многих сценариях позволит это нивелировать.

Особенности и перспективы технологии

3D V-Cache уже используется в серверных процессорах AMD EPYC 3 поколения. В смешанных серверных нагрузках одно только внедрение этого кэша способно увеличить производительность задач до полутора раз, а в некоторых задачах — и того больше. Поэтому неудивительно, что первые процессоры с данной технологией выпущены не среди массовых десктопных. Однако, AMD уже заявила и о массовых процессорах с 3D V-Cache. Первым из них будет Ryzen 7 5800X3D, который должен увидеть свет в этом году. В будущих процессорах на архитектуре Zen 4 моделей с поддержкой данной технологии будет больше.

Однако 3D V-Cache на данном этапе — далеко не массовая технология. При изготовлении такого процессора дополнительный многослойный кристалл памяти устанавливается на чиплет с ядрами и соединяется с ним по технологии сквозных соединений. Мало того, что производство таких чипов обходится недешево, так еще и сама кэш-память большого объема в производстве дорога. Количество транзисторов, используемых в ней, достигает нескольких миллиардов, что сравнимо с их количеством в самих чиплетах с ядрами ЦП.

Именно поэтому реальное использование технологии 3D V-Cache в ближайшие годы стоит ожидать только в топовых процессорах. В бюджетных моделях ее применение лишено экономического смысла, так как цена процессора с малым количеством ядер и этой технологией будет совсем не гуманна по сравнению с конкурентами.

Показать полностью 4

Компьютерное железо Инженер Компьютер Технологии IT AMD Процессор Электроника Производство Тестирование Длиннопост

Вопрос из ленты «Эксперты»

TheSunLiteBeta

2 месяца назад

Intel Pentium 4 478 socket 3.4Ггц в 2020г ?⁠⁠1

Что физически не потдерживает процессор intel pentium 4 478 socket в 2020 году ?

Учитывая архетиктуру и инструкции процессора а не его частоту так как она может доходить до 3.4Ггц.

Из примеров:

1) когда спросил разработчика сможет ли он извлекать ресурсы из apk и obb файлов на intel pentium 4 он ответил что "Проц не потянет нужные дерективы".

2) Intel Pentium 4 478 socket не потдерживает Windows 10 Home 32x так как в процессоре физически отсуствует компонент NX Бит.

[моё] Процессор Pentium 4 Вопрос Спроси Пикабу Текст

KorkaH

2 месяца назад

pikabu GAMES

AMD X3D расхайпленый кал ?⁠⁠

Показать полностью 1

AMD Amd ryzen Процессор Видео YouTube

TechSavvyZone

2 месяца назад

Технологии: "GPU" устройство графического процессора⁠⁠

Графический процессор — «сердце» видеокарты. Он производит расчеты в играх и некоторых программах, которые умеют его использовать. Как устроен ГП внутри, какие блоки находятся в его составе, и как они работают?

Графический процессор (ГП) видеокарты — вычислительный чип, имеющий непростое внутреннее устройство. Современные топовые ГП технически сложнее, чем многоядерные центральные процессоры. А все потому, что вычислительные блоки в них хоть и устроены проще, но их количество в разы больше.

Из каких частей состоит графический процессор? За что они отвечают, как работают, и как связаны между собой? Разбираем по порядку.

Шейдерные процессоры

В центральном процессоре расчеты производят вычислительные ядра. В ГП базовым вычислительным элементом является шейдерный процессор (Shader Processor, SP). До 2006 года шейдерные процессоры делились на вершинные и пиксельные. Первые вычисляли пространственные координаты вершин полигонов, необходимые для переноса 3D-картинки в двухмерное изображение на мониторе. Вторые занимались вычислением цвета каждой точки этого изображения с учетом данных о ее освещении. Современные ГП оснащены универсальными шейдерными процессорами, которые могут выполнять оба вида вычислений, а также генерировать новую геометрию на основе уже имеющихся вершин. Вдобавок к этому они поддерживают неграфические вычисления, благодаря которым мощь ГП можно задействовать в некоторых программах — например, для обработки и конвертации видео.

NVIDIA называет свои шейдерные процессоры CUDA-ядрами — в честь одноименного API CUDA, разработанного компанией и предназначенного для вычислений на ГП собственного производства. Несмотря на другое название, их внутреннее устройство довольно схоже с шейдерными процессорами конкурентов — AMD и Intel.

Текстурные блоки

Текстурные блоки (Texture Mapping Unit, TMU) занимаются выборкой, наложением и фильтрацией игровых текстур. В каждом TMU имеются блоки адресации (Texture Address, TA) и фильтрации (Texture Filtering, TF).

С помощью блоков адресации TMU «натягивают» текстуры на полигоны, которые рассчитали шейдерные процессоры.

А с помощью блоков фильтрации они могут применять к текстурам один из видов фильтрации для их более четкого отображения: билинейную, трилинейную или анизотропную.

Растровые блоки

Блоки растровых операций (Render Output Unit, ROP) занимаются финальным этапом появления 3D-изображения на экране — растеризацией.

ROP собирают информацию от шейдерных процессоров и текстурных модулей. С помощью них эти блоки вычисляют конечное значение цвета для каждой точки двухмерного изображения, которое появляется на экране.

Некоторые методы сглаживания используют для своей работы именно блоки растровых операций — например, MSAA, SSAA и AAA.

Блоки трассировки лучей

Современные графические процессоры оснащены специальными блоками, которые занимаются трассировкой лучей. Их также называют RT-ядрами (Ray Tracing Core).

RT-ядра просчитывают пересечения лучей с полигонами и боксами иерархии ограничивающих объемов (BVH), в которые помещаются 3D-объекты для более эффективных и быстрых расчетов трассировки лучей.

Блоки матричных вычислений

Основная масса вычислений, необходимая для рендера игровой графики — это расчеты с 32-битной точностью. Иногда можно встретить и 16-битные графические расчеты, которые могут производиться с целью упрощения некоторых операций и повышения производительности. Однако в общем количестве их процент достаточно мал. Такие расчеты выполняют шейдерные процессоры ГП, оптимизированные под 32-битную точность. Однако есть целая категория вычислений, для которой столь точные расчеты попросту не нужны. К ним относятся технологии «умного» масштабирования изображения NVIDIA DLSS, AMD FSR и Intel XeSS. Аналогичных расчетов достаточно для подавления шумов, которые появляются при трассировке лучей, а также некоторых неигровых вычислений — например, нейросетей и программных продуктов на их базе.

Расчеты пониженной точности многие современные графические процессоры выполняют с помощью отдельных блоков матричных вычислений. Для всего вышеописанного парка технологий могут использоваться 16-битные расчеты, но более эффективны менее точные: восьми-, четырех- или даже двухбитные. Чем меньше точность, тем быстрее эти вычисления выполняются на матричных блоках.

Как и шейдерные процессоры, такие блоки относятся к вычислительным. Но в силу пониженной точности вычислений они устроены заметно проще, чем SP. NVIDIA называет их тензорными ядрами, Intel – матричными ядрами XMX. В ГП AMD выделенные блоки для таких расчетов отсутствуют, но имеется возможность переключить шейдерные процессоры в альтернативный режим работы с помощью специальных блоков матричного ускорения.

Вычислительные модули

Все вышеописанные блоки — это базовые «кирпичики» графического процессора. Из них формируются более крупные вычислительные модули. В каждом поколении графической архитектуры соотношение блоков в вычислительных модулях отличается, но их общие принципы устройства остаются довольно схожими для всех ГП.

У ГП NVIDIA самый маленький вычислительный модуль — потоковый мультипроцессор (Streaming Multiprocessor, SM). К примеру, в видеокарте RTX4090 такой модуль разделен на четыре части, в каждой из которой находится 32 ядра CUDA и одно тензорное ядро. По аналогии с ядром центрального процессора, каждая часть оснащена блоками загрузки данных и регистровым файлом. Общая часть SM содержит 128 КБ кэша, четыре TMU, RT-ядро и процессор обработки геометрии.

Два потоковых мультипроцессора объединены в кластер текстурной обработки (Texture Processing Cluster, TPC). Из шести TPC и 16 блоков ROP образуется один крупный графический вычислительный кластер (Graphics Processing Cluster, GPC) — вычислительная единица, содержащая все необходимое для работы с графикой. В каждом графическом процессоре таких кластеров несколько.

Cхоже устроены и ГП AMD, с тем отличием, что модули у них называются по-другому. Самым небольшим из них является вычислительный блок (Compute Unit, CU). Каждый CU современных моделей содержит 64 шейдерных процессора, четыре блока TMU, одно RT-ядро, кэш-память и регистровый файл. Два вычислительных блока объединяются в один процессор групповой обработки (Work Group Processor, WGP). Или как его еще называют, Dual CU.

В последнем поколении ГП Radeon RX7000 каждый CU вдобавок к этому набору имеет два блока матричного ускорения. Из восьми Dual CU и 32 ROP образуется один крупный шейдерный движок (Shader Engine, SE) — аналог графического вычислительного кластера от NVIDIA, содержащий в себе все необходимые блоки для работы с графикой. Аналогично конкуренту, в графических процессорах AMD таких шейдерных движков несколько.

В ГП Intel группировка модулей немного другая. Каждые 16 шейдерных процессоров здесь объединены в векторный движок (Xe Vector Engine, XVE). К нему присоединены два матричных блока XMX. 16 таких связок вкупе с регистровым файлом и кэшем образуют вычислительную единицу графического процессора — ядро XE.

Четыре ядра XE объединены в более крупный модуль Render Slice. Помимо ядер XE, в нем содержатся четыре RT-ядра, 16 блоков ROP и процессор обработки геометрии. Аналогично графическому вычислительному кластеру NVIDIA и шейдерному движку AMD, Render Slice имеет все нужные блоки для работы с графикой. Вычислительную часть графического процессора Intel образуют несколько подобных блоков.

Подсистема памяти

Все вычислительные блоки объединены общей шиной, к которой подключен второй уровень кэша (L2). У NVIDIA и Intel сразу после L2 информация поступает на контроллеры памяти, которые связывают ГП с микросхемами графической ОЗУ.

В отличие от двух других производителей, в ГП AMD блоки обработки геометрии и асинхронных вычислений выделены из состава вычислительных блоков и находятся рядом с кэшем L2. Вслед за ним следует память Infinity Cache, которая играет роль кэша третьего уровня, и лишь потом графическая ОЗУ.

Прочие блоки

Помимо уже упомянутых, в графическом процессоре содержатся и другие блоки, которые не относятся к вычислительным:

Контроллер шины PCI-Express. Служит для связи видеокарты с прочими компонентами компьютера посредством шины PCI-E.

Движок дисплея. Часть ГП, занимающаяся выводом изображения на цифровые интерфейсы — HDMI, DisplayPort или DVI (а ранее — и на аналоговый VGA).

Мультимедийный движок. Аппаратный декодер, позволяющий воспроизводить или кодировать видеофайлы различных форматов.

Показать полностью 17

Инженер Компьютерное железо Компьютер Технологии IT Компьютерная графика Видеокарта Процессор Электроника Производство История развития Тестирование Длиннопост

TheDronBit

2 месяца назад

Ответ на пост «Апгрейд ПК»⁠⁠1

@dflyer, 1. 50k чтоб в 2к комфортно играть мало, тебе нужно 5700x3d для 2к. Материнка хорошая. 2. Тебе нужна хорошая видяха, к примеру 7900gre стоила 28к рублей, она никому не была нужна, а когда сдавали что она за свои бабки даже 4к может, ценник стал 80к. Сейчас не знаю, видел ее по 40к.

Мой тебе совет - у тебя хорошая материнка, и тебе при твоём бюджете важно понимать что 2к это ты загнул. Если говорить не о том чтоб играть с микрофризами и так далее, сделай по уму, возьми хорошую видяху 7900gre и не слушай эти бредни про нвидиа видяхи, они давно перестали быть хорошими видеокартами за свой прайс. Та же 7900gre даст шикарную производительность за свои деньги, она холодная и не требует мощный БП. Но у тебя останется слабое место - проц. Который в 2к себя не покажет с хорошей стороны. Возьми видяху, если будет возможность позже сделай так чтоб было 32 Гб ОЗУ, а если подкопишь чуть позже за 20к возьмёшь безумно мощный проц с адекватной ценой 5700х3д, топ за свои деньги, 5800х3д смысла брать нет в твоём случае. Это самый честный ответ. Я почитал какую дичь советуют - пусть себе на таком хламе собирают) я не в коем случае не пытаюсь оскорбить кого либо. Не перехожу на личности.

Вопрос Спроси Пикабу Сборка компьютера Апгрейд Видеокарта Процессор AMD Компьютерное железо Игровой ПК Ответ на пост Текст

A.Kristina

2 месяца назад

Интересный AliExpress

Жидкий металл вместо термопасты. Насколько лучше?⁠⁠

Преимущества жидкого металла:

Отличная теплопроводность. Она выше в 7-10 раз, чем у стандартных термопаст.

Недостатки:

Электропроводность
Невозможность использования с алюминиевыми и медными радиаторами из-за начала химических реакций.

Цена:

Стоит набор для нанесения около 700 руб. Ссылка на него

Жидкий металл вместо термопасты. Насколько лучше? Система охлаждения, Охлаждение, Процессор, Компьютер, Игровой ПК, Ноутбук, Ремонт ноутбуков, Мастер, Ремонт компьютеров, Сообщество ремонтеров, Компьютерное железо, Сборка компьютера, Материнская плата, Компьютерная помощь, Видеокарта, Термопаста, Замена термопасты, Жидкий металл, Видео, Короткие видео

Показать полностью 1

Система охлаждения Охлаждение Процессор Компьютер Игровой ПК Ноутбук Ремонт ноутбуков Мастер Ремонт компьютеров Сообщество ремонтеров Компьютерное железо Сборка компьютера Материнская плата Компьютерная помощь Видеокарта Термопаста Замена термопасты Жидкий металл Видео Короткие видео

migalev.vg

2 месяца назад

Про железо

Кратко о младших Ryzen на AM5⁠⁠

Ryzen 5 7400F (6 x 3.7-4.7 ГГц, L2 - 6 МБ, L3 - 32 МБ, PCIe 5.0 x24)– под крышкой термопаста. Это приводит к троттлингу при серьезной нагрузке. Не спасают даже мощные жидкостные системы охлаждения.

Ryzen 5 8400F (6 x 4.2-4.7 ГГц, L2 - 6 МБ, L3 - 16 МБ, PCIe 4.0 x16) – мало L3 кэша, меньше линий PCIe и ниже его версия.

Ryzen 5 7500F (6 x 3.7-5.0 ГГц, L2 - 6 МБ, L3 - 32 МБ, PCIe 5.0 x24) – под крышкой припой и вообще топ-за свои деньги.

Если разница в цене до 10-15% процентов, то из всей троицы лучше выбрать Ryzen 5 7500F. Если разница по цене больше, то тут уже нужно смотреть на свой кошелек.

Мой личный телеграм-канал

Показать полностью

[моё] Компьютер Компьютерное железо Электроника Сборка компьютера AMD Amd ryzen Процессор

Вопрос из ленты «Эксперты»

dflyer

2 месяца назад

Апгрейд ПК⁠⁠1

Что можно улучшить в текущей сборке, чтобы более комфотрно играть в современные игры? Бюджет 50'000 рублей, интересуют только новые комплектующие, не б\у.

Текущие харакретистики на картинке:

Апгрейд ПК Вопрос, Спроси Пикабу, Сборка компьютера, Апгрейд, Видеокарта, Процессор, AMD, Компьютерное железо, Игровой ПК

Продублирую характеристики текстом
Материнка: MSI B550 GAMING GEN3
Процессор: AMD Ryzen 5 5600X
Видеокарта: AMD Radeon RX 580 8GB GDDR5
ОЗУ: AMD DDR4 3200MHz 16 GB (две плашки по 8 GB)
Ну а остальное не столь важное - два SSD по терабатйту (один m2, второй sata), блок питания на 700W.

Сейчас играю во что-то новое с разрешением 1080p на средних, реже средне-высоких характеристиках. Хочется или в 2k на тех же характеристиках, или в 1080p на ультрах не задумываясь.

Вопрос Спроси Пикабу Сборка компьютера Апгрейд Видеокарта Процессор AMD Компьютерное железо Игровой ПК

132

Посты не найдены

5 6 7 8 9 10 11 12 13 14 15 20 30 40 50 100