Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam

Топ прошлой недели

  • CharlotteLink CharlotteLink 1 пост
  • Syslikagronom Syslikagronom 7 постов
  • BydniKydrashki BydniKydrashki 7 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Новости Пикабу Помощь Кодекс Пикабу Реклама О компании
Команда Пикабу Награды Контакты О проекте Зал славы
Промокоды Скидки Работа Курсы Блоги
Купоны Biggeek Купоны AliExpress Купоны М.Видео Купоны YandexTravel Купоны Lamoda
Мобильное приложение

Nvidia

С этим тегом используют

Видеокарта Компьютер Компьютерное железо Электроника Игровой ПК AMD Nvidia RTX Все
968 постов сначала свежее
11
TechSavvyZone
TechSavvyZone
8 дней назад

Технологии: "NVIDIA" доминант на рынке GPU для AI⁠⁠

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Компания NVIDIA является крупнейшим в мире производителем графических процессоров. Ее разработки на первом месте не только в игровых видеокартах, но и в решениях для различных вычислений. В том числе — в задачах искусственного интеллекта. В чем преимущества чипов NVIDIA, и почему конкурентам сложно их догнать в этом направлении?

Зарождение вычислений на ГП

GPU, или «графический процессор». Впервые это название было использовано в 1999 году для чипа видеокарты GeForce 256, в состав которого вошел блок аппаратной трансформации и освещения. В играх он выполнял эти нехитрые расчеты, освобождая от них центральный процессор ПК.

Но это было только начало. В 2001 году в графических процессорах появились куда более сложные компоненты — шейдерные блоки. Вначале степень их программируемости была ограниченной. Но уже через пару поколений видеокарт шейдеры получили поддержку графических вычислений с плавающей запятой (Floating Point, FP), а их количество в чипах кратно возросло.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

В линейке GeForce 6000 родом из 2004 года вертексные шейдеры впервые научились выполнять вычисления формата FP32

Уже тогда некоторые исследователи стали проводить собственные испытания в попытках ускорить математические вычисления с помощью ГП. Этот процесс был сложным, так как для расчетов приходилось переформулировать задачи в вызовы графических API DirectX или OpenGL. Для доступности подобных вычислений в сторонних программах был необходим собственный API, который невозможно было создать без поддержки производителей видеокарт.

В 2006 году на конференции SIGGRAPH, посвященной компьютерной графике, компания ATI представила «Close to Metal». Это был первый API для выполнения неграфических вычислений на видеокартах ATI, который вскоре был переименован в ATI Stream.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

В это время в недрах NVIDIA была почти готова новая графическая архитектура Tesla, которая изначально проектировалась с учетом возможности неграфических расчетов. После выпуска первых игровых видеокарт на ее основе, в феврале 2007 года компания представила свой собственный API для вычислений — CUDA. А три месяца спустя были выпущены первые продукты NVIDIA, предназначенных специально для вычислений: Tesla С870, D870 и S870. Этот момент можно считать началом главы массово доступных вычислений на графических процессорах.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Становление CUDA

Темп вычислений на графических чипах NVIDIA и ATI уже в 2007 году в несколько раз превышал значения, которые могли обеспечить центральные процессоры того времени. Топ NVIDIA обеспечивал 384 Гфлопс, а флагман ATI — 475 Гфлопс. По сравнению с 48 Гфлопс, которыми мог оперировать старший ЦП линейки Intel Core 2 Quad, разница была практически на порядок.

Однако все упиралось в возможность многопоточной обработки. NVIDIA G80 обладал 128 шейдерными процессорами, а конкурирующий ATI R600 — целыми 320. Распределить нагрузку между таким количеством вычислительных единиц в то время, когда даже четыре ядра процессора еще не везде использовались, было задачей не из простых. Но главный вектор продвижения все же нашелся — им стали научные проекты. Основная масса расчетов для них масштабируется практически линейно, поэтому именно они извлекали больше всего пользы из CUDA и Stream.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Через некоторое время неграфические вычисления нашли применение и в домашних ПК. С их помощью мощности видеокарт стали использоваться в различных программах для конвертации и кодирования видео. А в августе 2008 года NVIDIA решила использовать CUDA для просчетов PhysX — движка физического поведения объектов в играх.

В 2009 году свет увидел DirectX 11, в состав которого был включен API для неграфических вычислений DirectCompute. Практически одновременно с ним появляется и другой похожий, но открытый API — Open CL. Именно в его пользу делает выбор AMD, потихоньку забросив развитие Stream. А вот NVIDIA хоть и реализовывает поддержку новых API, но при этом не отказывается от своей CUDA. И, как покажет практика, совсем не зря.

Глубокое обучение

После появления универсальных шейдерных процессоров их количество в чипах росло по экспоненте. Благодаря этому топовый чип GF100, появившийся через три года после G80, работал с вычислениями вчетверо быстрее своего «предка». Ускорение, которые давали вычисления на ГП по сравнению с ЦП, становилось все больше, а сами вычисления распространялись все шире.

В 2012 году c помощью API CUDA группа энтузиастов в университете Торонто решает создать одну из первых сверточных нейросетей для распознавания изображений. Для этого они используют более миллиона изображений и три терафлопса вычислительной мощности, которые обеспечили две видеокарты GTX 580 на базе ГП GF110. Проект получает название AlexNet. Он был представлен на конкурсе ImageNet Large Scale Visual Recognition Challenge, получив первое место за распознавание c минимальным количеством ошибок.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Архитектура AlexNet оказала существенное влияние на многие последующие проекты в области глубокого обучения с помощью графических процессоров. И, как следствие, в разы увеличила интерес к самим ГП в роли вычислительных чипов для подобных расчетов.

До 2017 года NVIDIA продолжала наращивать «чистую» мощь своих графических процессоров. Если в 2007 году топовый G80 мог обеспечить 384 Гфлопс при расчетах, то в 2017 году чип GP102 достигал в них уже 12 Тфлопс. Но компания продолжала искать пути по более существенному наращиванию производительности, так как задачи для ГП со временем становились все сложнее и сложнее.

Конец 2017 года можно считать переломным моментом для нейросетевой отрасли. Тогда NVIDIA представила первый графический процессор с тензорными ядрами — GV100 на архитектуре Volta. В то время, как шейдерные процессоры могли работать с вычислениями полной точности (FP32), тензоры поддерживали только половинную (FP16), но с гораздо большим темпом. Вдобавок к этому появилась возможность использовать целочисленные вычисления (INT32) на шейдерах одновременно с плавающими. Для эффективного задействования всех вычислительных элементов вместе с чипом и видеокартами на его основе NVIDIA представила API CUDA версии 7.0.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Эксперимент был успешным: производительность в задачах глубокого обучения возросла кратно, ведь высокая точность им была не нужна. Чипы AMD, до этого хоть как-то конкурирующие за счет вычислительной мощности шейдеров, остались далеко позади. А NVIDIA занялась разработкой следующей графической архитектуры — Turing. Теперь каждое поколение компания совершенствовала тензорные ядра. Помимо рабочих нагрузок, они пригодились и в играх для технологии повышения производительности DLSS. В 2022 году NVIDIA представила графическую архитектуру Ada Lovelace. Ее тензорные ядра поддерживают вычисления в менее точном формате FP8, но в двойном темпе по сравнению с FP16. Таким образом, даже без учета роста количества тензоров, пиковую производительность обучения удалось удвоить. В следующей архитектуре Blackwell появилась поддержка вычислений FP4, которая в очередной раз удваивает пиковую производительность тензоров.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Сила ГП NVIDIA не только в «железе», но и в программной поддержке. С выходом каждой графической архитектуры компания обновляет API CUDA и предоставляет разработчикам подробные инструкции по работе с ним. Благодаря этому производители ПО своевременно учатся использовать особенности новых чипов, что позволяет «выжимать» из них в реальных задачах практически всю возможную производительность.

NVIDIA и ее конкуренты на рынке нейросетей

На сегодняшний день ГП NVIDIA — самые востребованные чипы для обучения и работы различных нейросетей. Высокая вычислительная мощность и постоянно развивающаяся программная платформа CUDA, совместимая со многими популярными фреймворками вроде TensorFlow и PyTorch, делают их лучшим выбором для вычислений глубокого обучения. И лидер этого рынка в лице Open AI, и недавно «выстрелившая» DeepSeek обучали свои модели именно на чипах от NVIDIA.

Для вычислительных центров компания выпускает отдельную линейку карт GPU Accelerator (бывшая Tesla). Многие из них основаны на тех же графических процессорах, что и игровые видеокарты. Но для наиболее производительных решений NVIDIA в последнее время разрабатывает отдельные чипы, совершенствуя их чуть раньше более доступных решений.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Тем не менее, все основные элементы графической архитектуры даже в таких «больших» чипах схожи с теми, что используются в игровых видеокартах GeForce. Поэтому их тоже можно использовать для несложных задач глубокого обучения, если хватает видеопамяти. В этом кроется огромный плюс: единая графическая архитектура и поддержка CUDA для игровых, профессиональных и вычислительных решений делает ГП NVIDIA доступными как для крупных фирм, так и для небольших стартапов.

В этом плане NVIDIA поступает умно: даже с одной игровой картой вместе с CUDA и ее развитыми инструментами разработчик может получить желаемый результат — пусть и заметно медленнее, чем с вычислительным сервером. При этом он привязывается к API, и при переходе на более производительные решения вновь будет использовать ГП NVIDIA.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Но лавры CUDA не дают покоя многим другим компаниям, в частности — Intel. В ответ она разработала открытый стандарт oneAPI, который призван унифицировать вычисления на различных чипах: центральных и графических процессорах, программируемых матрицах и специализированных ускорителях. В 2024 году Intel вместе с Google, Qualcomm, Samsung, ARM, Fujitsu, Imagination и VMware создали консорциум Unified Acceleration Foundation. Его целью будет дальнейшее развитие инициатив oneAPI.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Изменит ли как-то это баланс оборудования на рынке нейросетей — вопрос будущего, причем не самого ближнего. Сегодня реальный конкурент у NVIDIA на этом направлении все также один: это компания AMD с картами Instinct. С 2020 года «красные» разделили свою графическую архитектуру на две параллельно развивающиеся ветви. RDNA предназначена для игровых и профессиональных видеокарт, а CDNA — для центров обработки данных. Современные чипы AMD используют программный стек ROCm, и могут ускорять вычисления невысокой точности с помощью матричных блоков. Но до возможностей API CUDA и производительности тензорных ядер NVIDIA им все еще далеко.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Возможно, в скором времени определенную конкуренцию NVIDIA смогут предложить и чипы от Huawei. Компания разрабатывает собственные ИИ-ускорители, и последнее решение в лице Ascend 910C выглядит довольно неплохо. Однако стоит учитывать, что Huawei ограничена санкциями и не имеет доступа к самым современным техпроцессам. Поэтому, скорее всего, ускорители компании останутся эксклюзивным решением для китайского рынка, а будущие поколения из-за ограничений техпроцесса не получат существенного роста производительности на чип.

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

А пока лидерство NVIDIA в этой сфере не подлежит сомнению. Благодаря буму нейросетей ее доходы от вычислительных решений впервые превысили аналогичные от игровых видеокарт уже в 2023 году. 2024 год оказался для компании еще более успешным: на оборудовании для вычислений она заработала вчетверо больше, чем на игровом рынке. посмотрим что ей принесет год грядущий. Важно то, что NVIDIA не забывает вкладывать часть полученной прибыли в новые разработки. Каждый год компания представляет их на конференции GPU Technology Conference (GTC), основной темой которой в последнее время является искусственный интеллект. В этом году GTC прошел с 17 по 21 марта. NVIDIA раскрыла подробности о будущих графических архитектурах Blackwell Ultra и Rubin, а также презентовала новый вычислительный чип B300.

К сведению:

В 2006 году на конференции SIGGRAPH, посвященной компьютерной графике, компания ATI представила «Close to Metal»

Самое интересное, что первоначально ATI удалось реализовать вычисления не на универсальных шейдерах, а на пиксельных. Для этого в чипе R580, который стал основой для первой вычислительной карты, они уместили аж 48 (!) пиксельных шейдеров с продвинутым управляющим блоком. 

Технологии: "NVIDIA" доминант на рынке GPU для AI Инженер, Компьютерное железо, IT, Компьютер, Технологии, Искусственный интеллект, Программа, Nvidia, Чип, Электроника, Длиннопост, Видеокарта

Для сравнения: у старшего R520 из того же поколения, который был выпущен на 3 месяца раньше, было всего 16 пиксельных шейдеров, а у G70/G71 от главного конкурента - 24.

Показать полностью 13
Инженер Компьютерное железо IT Компьютер Технологии Искусственный интеллект Программа Nvidia Чип Электроника Длиннопост Видеокарта
1
593
CyberDump
CyberDump
9 дней назад
Лига Геймеров

Вообще-то мне и с разрешением в 1080 нормально⁠⁠

Вообще-то мне и с разрешением в 1080 нормально Картинка с текстом, Мемы, Высокое разрешение, Nvidia, AMD, Telegram (ссылка), Видеокарта, Монитор

https://t.me/cyberdump7

Показать полностью 1
Картинка с текстом Мемы Высокое разрешение Nvidia AMD Telegram (ссылка) Видеокарта Монитор
466
4
BigDataExclusive
BigDataExclusive
11 дней назад

Роботы-медсестры спешат на помощь⁠⁠

Тайваньские больницы внедряют роботов на базе технологий NVIDIA и Foxconn, чтобы справиться с нехваткой медперсонала и снизить выгорание.🐢

Теперь роботы будут доставлять лекарства, медкарты и даже дежурить.🦾

Знакомьтесь, Nurabot👋
Робот-медсестра создан для помощи в сложных клинических задачах и борьбы с выгоранием у персонала. 🚬🤖

Показать полностью
Будущее Технологии Робот Робототехника Nvidia Инновации Видео Без звука Короткие видео
7
6
a4u.su
a4u.su
12 дней назад

NVIDIA выкручивается: новые видеокарты для Китая⁠⁠


Когда нельзя — но очень хочется, включается смекалка. 
NVIDIA готовит обрезанные GPU специально под Китай. Встречайте B40 и 6000D: архитектура Blackwell, но с пониженной планкой — чтобы не поссориться с американским Минторгом.

🔧 Что урезали? 
- Пропускная способность — около 1,7 ТБ/с (разрешённый минимум). 
- Вместо элитной HBM3e — обычная GDDR7. 
- Никакого CoWoS — проще, дешевле, не надо ждать милости от TSMC.

💰 Цены — от 6,5 до 8 тысяч долларов, что ниже H20 (10–12k). 
⚙️ По мощности — между Hopper и устаревшими допусками.

Цель? 
Удержаться в Китае, где доля NVIDIA уже просела до 50% — спасибо Huawei и их Ascend 910B. А за углом уже маячит ещё более “диетный” Blackwell с кодовым именем B25. Если всё пойдёт по плану — массовый выпуск в сентябре.

А пока в бухгалтерии NVIDIA грустят: 
–15 млрд $ потенциальных потерь из-за санкций, 
–5 млрд $ уже списано с H20. 
Зато рынок остаётся — хоть и не весь.

Игра по новым правилам продолжается.

Источник: https://t.me/A4UAI/2315

Технологии Китай Nvidia Видеокарта Санкции Текст Telegram (ссылка)
3
92
TechSavvyZone
TechSavvyZone
14 дней назад

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят?⁠⁠

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Выпуск серии видеокарт RTX20 в свое время стал важнейшим событием в сфере компьютерных технологий. Десктопные видеокарты впервые получили отдельные тензорные ядра. Что это такое? Как работают эти ядра и для чего используются?

CUDA и тензорные ядра

Работа с графикой — специфическая задача для компьютерного «железа». Здесь требуется выполнять довольно однообразные команды с большим объемом данных. Архитектура CPU для этого подходит плохо. Из-за ограниченного числа ядер и АЛУ (арифметико-логических устройств) процессоры не могут быстро делать объемные операции по сложению и умножению.

Был необходим максимальный параллелизм — одновременная обработка данных. Одним из решений стали CUDA-ядра — технология, созданная Nvidia больше десяти лет назад. Эти ядра создали специально для параллельной работы. На чипе помещались сотни и тысячи CUDA-ядер, а их число стало одним из критериев оценки производительности видеокарты.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

CUDA-ядра имеют высокоскоростной доступ к видеопамяти, так что обработка выполняется с минимальными задержками. Это важнейший показатель для быстрого вывода подготовленных кадров на монитор.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Однако обработка больших объемов данных нужна не только при выводе графики. Она требуется для научных вычислений, моделирования физических процессов и машинного обучения. Во всех этих задачах одна из главных операций — перемножение матриц.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Задача непростая. Скажем, для решения вышеописанного примера нужны целых 64 умножения и 48 сложений. Не говоря о том, что промежуточные результаты нужно еще где-то хранить. Для операций чтения и записи нужны дополнительные регистры и достаточно скоростная кэш-память.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Может ли с этой задачей справиться CPU? Вообще-то, да. Специально для таких вычислений в процессорах начали появляться инструкции MMX, SSE и (самые совершенные) AVX. Однако видеокарты с их многочисленными CUDA-ядрами — более предпочтительный вариант. Они могут распараллелить большую часть простых операций сложения и умножения. Но даже для них задача просчета матриц оставалась трудоемкой. Решением стали тензорные ядра.

Одно такое ядро способно перемножить две матрицы за один такт. В то время как CUDA-ядрам требуется несколько тактов.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Первое тензорное ядро представляло собой микроблок, выполнявший суммирование-произведение матриц 4x4. Могли использоваться значения FP16 (числа с плавающей запятой размером 16 бит) или умножение FP16 с добавлением FP32.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Размерность рабочих матриц невелика. Ядра при обработке реальных наборов данных обрабатывают небольшие блоки более крупных матриц, в итоге формируя окончательный ответ.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Решение оказалось крайне эффективным. Специалисты из Anandtech провели замеры производительности топовых решений от Nvidia — без тензорных ядер и с ними.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост
Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

В операциях перемножения матриц (GEMM) прирост производительности с использованием тензорных ядер колоссальный.

Применение тензорных ядер

Научные вычисления

Тензорная математика активно используется в физике и инженерии для решения всех видов сложных вычислений. Например, в механике жидкостей, электромагнетизме, астрофизике, медицине и климатологии. В суперкомпьютерах для этих задач обычно используют крупные кластеры с тысячами высокопроизводительных процессоров уровня Xeon Platinum или AMD Epyc. Однако видеоускорители стали неотъемлемой частью практически любого суперкомпьютера. Подавляющее число машин из рейтинга Top500 работают на базе решений от Nvidia.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост
Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Машинное обучение

Задача глубокого обучения в самом простом смысле — это работа с математическими выражениями. Простейший вариант — нейронная сеть, состоящая из одного слоя с двумя нейронами и линейными функциями активации. Представлена она вот таким умножением вектора на матрицу:

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Задача обучения сводится к поиску наилучших коэффициентов W. То есть предполагаются матричные операции.

На практике нейросети чаще всего многослойные, и математические выражения получаются куда сложнее. Однако принципиально используются все те же действия — умножение и сложение матриц. Тензорные ядра как раз ориентированы на эти действия.

Самый яркий пример — суперкомпьютер, созданный Microsoft совместно c OpenAI. В нем использовали 10 тысяч графических процессоров Nvidia V100. Именно этот компьютер применили для обучения ChatGPT-3. Продукты Nvidia можно найти в Microsoft Azure, Oracle Cloud и Google Cloud.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Илон Маск для своего ИИ Grok также задействует продукцию Nvidia. Изначально это был кластер на 20 тысяч графических процессоров H100. Недавно для обучения версии GROK 3 миллиардер запустил суперкомпьютер с сотней тысяч NVIDIA H100! Теперь вы можете понять, почему NVIDIA стала самой дорогой компанией и продолжает наращивать прибыль.

Инференс нейросети

Инференс — это запуск уже обученной модели, «скармливание» данных и получение результата. Процесс менее требователен к вычислительной мощности. Но здесь все так же используются матричные операции. Сюда входит распознавание текста (например, в голосовых помощниках), поиск объектов на изображении (распознавание лиц, номерных знаков), шумоподавление и не только.

Тензорные ядра и здесь предлагают высокую производительность. Они позволяют запускать «легкие» нейросети прямо на домашних видеокартах средневысокого ценового сегмента. Например, запустить Chat with RTX — тут достаточно RTX 30 или 40 серии с минимум 8 ГБ видеопамяти. Stable Diffusion также можно запустить локально на видеокартах. Однако производительность каждой модели зависит еще и от ПО. Оно не всегда в полной мере задействует те же тензорные или CUDA-ядра.

DLSS (Deep Learning Super Sampling)

Один из самых доступных вариантов инференса нейросетей — технология DLSS. Специально обученная на игре нейросеть запускается на тензорных ядрах видеокарты, повышая разрешение картинки в реальном времени. Игрок, в свою очередь, получает более высокий FPS. DLSS 3 работает только на видеокартах серии RTX40.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Где имеются тензорные ядра

Nvidia

Поскольку это авторская разработка «зеленых», то именно «тензорные ядра» можно найти лишь в продукции этой компании.

Впервые появились в Nvidia TITAN V в 2017 году — карта имела 640 ядер. После этого ядра стали неотъемлемой частью профессиональных ускорителей

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост
Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

С каждой новой архитектурой появлялось усовершенствованное поколение тензорных ядер. Так что сравнивать их число в рамках разных поколений некорректно. Есть и различия в поддерживаемых форматах данных. Первые ядра могли складывать матрицы с данными только FP16, а современные имеют поддержку куда больших форматов.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

В десктопных и мобильных видеокартах технология стала доступна с приходом серии RTX20.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Именно благодаря тензорным ядрам пользовательские карты RTX можно использовать для работы с нейросетями. А также получить апскейл с использованием ИИ. Альтернативные технологии вроде XeSS и FSR базово специальных ядер не требуют.

AMD

Компания «красных» на рынок ИИ вышла относительно недавно. Аналогом тензорных ядер у них является Matrix Core Technologies, которая появилась в архитектуре CDNA 3.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Ядра Matrix Core Technologies пока встречаются только в AMD Instinct MI300A (912 штук) и MI300X (1216 штук). Новые ИИ-ускорители планируют поставить в немецкие суперкомпьютеры Hunter и Herder — в 2025 и 2027 годах соответственно. Сейчас же у немцев работают суперкомпьютеры Hawk и JUWELS на базе Nvidia A100.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Intel

У «синих» используются ядра XMX (Xe Matrix Extensions), созданные специально для матричных вычислений. На них аппаратно работает и фирменный апскейлер Intel XeSS. Встретить ядра XMX можно в линейке видеокарт ARC.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост
Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост

Ядра XMX используются и в Intel Xᵉ HPC 2, установленных в Data Center GPU Max. Графика Xe2-LPG будет встроена в процессоры Lunar Lake. Там также будут использоваться XMX-ядра для задач, связанных с работой ИИ.

Google

В компании не стали изобретать отдельные ядра, а нацелились сразу же на разработку полноценных плат. Они получили название TPU — Tensor Processing Unit. Эти платы специализируются на обработке матриц. Они подходят как для тренировки, так и выполнения нейросетей.

Технологии : "NVIDIA" тензорные ядра, что это и с чем едят? Технологии, IT, Компьютерное железо, Компьютер, Инженер, Nvidia, Видеокарта, Производство, Электроника, Чип, Компьютерная графика, Ядро, Длиннопост
Показать полностью 23
Технологии IT Компьютерное железо Компьютер Инженер Nvidia Видеокарта Производство Электроника Чип Компьютерная графика Ядро Длиннопост
6
7
webnoru
webnoru
14 дней назад

Nvidia, возможно, выпустит более дешевый чип искусственного интеллекта Blackwell для Китая⁠⁠

Nvidia, возможно, выпустит более дешевый чип искусственного интеллекта Blackwell для Китая Технологии, Искусственный интеллект, Nvidia, Новости, Политика, Чип, Санкции, США, Китай

Компания Nvidia выпустит новый чипсет искусственного интеллекта для Китая по значительно более низкой цене, чем ее недавно ограниченная модель H20, и планирует начать массовое производство уже в июне, сообщили источники, знакомые с вопросом.

GPU или графический процессор будет входить в состав последнего поколения процессоров Nvidia с архитектурой Blackwell и, как ожидается, будет стоить от $6 500 до $8 000, что значительно ниже цены на H20, которая составляет $10 000-12 000, по словам двух источников.

Более низкая цена отражает более слабые технические характеристики и более простые требования к производству.

По словам двух источников, он будет основан на RTX Pro 6000D от Nvidia, графическом процессоре серверного класса, и будет использовать обычную память GDDR7, а не более современную память с высокой пропускной способностью.

Представитель Nvidia заявил, что компания все еще оценивает свои «ограниченные» возможности. «Пока мы не определимся с дизайном нового продукта и не получим одобрение от правительства США, мы фактически лишены возможности выйти на китайский рынок центров обработки данных, объем которого составляет 50 миллиардов долларов».

Показать полностью
Технологии Искусственный интеллект Nvidia Новости Политика Чип Санкции США Китай
0
luis2gerallit
luis2gerallit
14 дней назад

Почему видеокарты AMD проигрывают Nvidia⁠⁠

На рынке компьютерного железа уже много лет продолжается битва двух гигантов — AMD и Nvidia. И если с процессорами у красной компании в последние годы дела обстоят неплохо, то о видеокартах сказать такого, к сожалению, нельзя. В этом небольшом материале вы узнаете, почему видеокарты AMD проигрывают ускорителям Nvidia.

Почему видеокарты AMD проигрывают Nvidia Видеокарта, Компьютерное железо, AMD, Nvidia, Amd Radeon, Длиннопост

Автор: Павел Прилуцкий | Источник: ixbt.games

Пролог

На середину февраля 2025 года доля видеокарт AMD среди пользователей сервиса Steam составляет менее 17%. Причём самыми популярными моделями считаются AMD Radeon RX 6600 и RX 580. Согласитесь, ситуация удручающая: бюджетная видеокарта и морально устаревшая «звезда» эпохи майнинга. Но как же компания, которая успешно конкурирует на рынке процессоров, допустила такое положение дел в сегменте графических ускорителей?

Почему видеокарты AMD проигрывают Nvidia Видеокарта, Компьютерное железо, AMD, Nvidia, Amd Radeon, Длиннопост

Статистика

Всё довольно банально. Компания долгие годы не могла обеспечить достойное финансирование подразделения, отвечающего за разработку GPU. Провальная линейка процессоров AMD FX и необходимость расплачиваться с кредиторами после приобретения ATI Technologies серьёзно ухудшили финансовое положение AMD. Кроме того, стоит упомянуть и ряд неудачных экспериментов с памятью HBM (High Bandwidth Memory), на которые было потрачено огромное количество ресурсов и сил. Учитывая все эти факторы, неудивительно, почему ускорители Nvidia смогли вырваться так далеко вперёд. Впрочем, это поверхностный анализ, который мало чего стоит без углубления в детали.

Восприятие бренда

Долгие годы среди геймеров, не без помощи конкурентов, культивировалось мнение, что видеокарты AMD Radeon стоит приобретать только от большой нужды, так как их тепловыделение и качество драйверов оставляли желать лучшего. И, кладя руку на сердце, я могу вас заверить, что всё так и было. Красный гигант не стыдился выпускать видеокарты, отличающиеся от предыдущего поколения лишь немного повышенными частотами GPU и VRAM. Но это уже давно в прошлом. Актуальная линейка видеокарт AMD Radeon RX 7000, благодаря использованию самых последних достижений в области литографии (техпроцесс, по которому изготовлен кристалл), достаточно холодна, а их производительность в играх сравнима с предтоповыми решениями Nvidia, а где-то и вовсе их превосходит.

Почему видеокарты AMD проигрывают Nvidia Видеокарта, Компьютерное железо, AMD, Nvidia, Amd Radeon, Длиннопост

Сравнение в играх

Технологии

В цифровой век, когда человечество стоит на пороге создания искусственного интеллекта, сравнивать производительность видеокарт в играх — это моветон. И вот мы натыкаемся на подводный камень, который уже долгие годы ставит крест на популярности видеокарт AMD Radeon. Красный гигант из-за отсутствия достойного финансирования, в отличие от Nvidia, не мог поощрять разработчиков ПО звонкой монетой, чтобы те не ленились внедрять в свои программные продукты поддержку фирменных технологий. В итоге зелёной компании удалось поселить в умах людей мысль, что любая рабочая задача, обсчитываемая на процессоре, — это прошлый век, а использовать стоит видеокарты Nvidia. Собственно, что мы и наблюдаем в популярных программах для видеомонтажа и 3D-моделирования, а в последнее время ещё и в нейронных сетях. Так что, если вы не фанат Linux и ваши задачи за ПК не ограничиваются играми и просмотром Rutube, то от продукции компании Nvidia уйти довольно сложно. И это я ещё не упомянул о CUDA, Tensor Cores, DLSS, RTX и т. п.

Почему видеокарты AMD проигрывают Nvidia Видеокарта, Компьютерное железо, AMD, Nvidia, Amd Radeon, Длиннопост

Профессиональное ПО

Доступность

Занимая меньшую долю рынка, видеокарты AMD Radeon часто оказываются недоступны для покупки в рознице. Честно говоря, не могу сказать, с чем это связано, — может быть, вы, уважаемые читатели, сделаете это за меня. Однако достаточно вспомнить эпоху майнинга или прямо сейчас зайти на веб-сайт любого популярного онлайн-магазина, чтобы убедиться в не самом богатом ассортименте GPU от AMD. Не говоря уже о программной части, когда Microsoft месяцами задерживает сертификацию видеодрайвера, оставляя пользователей без оптимизации в новых играх и исправления критических багов. Но это уже совсем другая история.

Почему видеокарты AMD проигрывают Nvidia Видеокарта, Компьютерное железо, AMD, Nvidia, Amd Radeon, Длиннопост

Доступность

Заключения

Видеокарты AMD уступают ускорителям Nvidia из-за совокупности факторов: чёрный пиар, посредственная производительность в профессиональном ПО, задержки в поставках продукции и сертификации новых версий драйверов. Надеюсь, компании удастся в скором времени преодолеть все трудности, и геймеры вновь смогут с гордостью заявить, что в их ПК установлена видеокарта AMD Radeon.

Оригинал

Показать полностью 4
[моё] Видеокарта Компьютерное железо AMD Nvidia Amd Radeon Длиннопост
32
3
Comrade28
14 дней назад

8 гигабайт хватит всем⁠⁠

AMD Nvidia Короткие видео Юмор Видеокарта Видео
0
Посты не найдены
О Нас
О Пикабу
Контакты
Реклама
Сообщить об ошибке
Сообщить о нарушении законодательства
Отзывы и предложения
Новости Пикабу
RSS
Информация
Помощь
Кодекс Пикабу
Награды
Команда Пикабу
Бан-лист
Конфиденциальность
Правила соцсети
О рекомендациях
Наши проекты
Блоги
Работа
Промокоды
Игры
Скидки
Курсы
Зал славы
Mobile
Мобильное приложение
Партнёры
Промокоды Biggeek
Промокоды Маркет Деливери
Промокоды Яндекс Путешествия
Промокоды М.Видео
Промокоды в Ленте Онлайн
Промокоды Тефаль
Промокоды Сбермаркет
Промокоды Спортмастер
Постила
Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии