Cuda

6 месяцев назад

Дата выхода линейки RTX 5000⁠⁠

Портал Benchlife, ссылаясь на свои источники в цепочке поставок, опубликовал новую информацию о готовящихся к выпуску видеокартах линейки GeForce RTX 5000.

Согласно этим данным, основная часть моделей из семейства RTX 5000 появится в продаже в первом квартале 2025 года. В этот период ожидается релиз GeForce RTX 5090, RTX 5090D, RTX 5080, RTX 5070 Ti и RTX 5070.

Интересно, что в списке отсутствует «антисанкционная» GeForce RTX 5080D. Это может свидетельствовать о том, что базовая версия GeForce RTX 5080 не подпадает под ограничения, введенные США, и NVIDIA не планирует выпускать специальную модификацию для китайского рынка.

Более доступные модели, такие как GeForce RTX 5060 Ti и RTX 5060, будут выпущены позже — их релиз запланирован на апрель 2025 года, то есть во втором квартале.

Кроме того, Benchlife подтвердил правдивость утекших ранее характеристик GeForce RTX 5070 Ti. Эта видеокарта будет оснащена 16 ГБ видеопамяти нового стандарта GDDR7. Источники портала также раскрыли спецификации GeForce RTX 5070: она получит 6400 ядер CUDA, 12 ГБ видеопамяти GDDR7 и показатель TDP в 250 Вт.

Таким образом, линейка GeForce RTX 5000 обещает стать одним из главных событий в индустрии графических технологий в 2025 году.

Показать полностью

111

ARCHiGAME

10 месяцев назад

Исходный код ZLUDA удален из сети — RX 7000 больше не смогут обрабатывать CUDA⁠⁠

🔧 Весной разработчик выпустил в сети исходный код инструментария под названием ZLUDA. Она позволяла ретранслировать библиотеку NVIDIA CUDA в понятные для видеокарт AMD Radeon.

🔥 Куртка и NVIDIA были в ярости от проекта ZLUDA. Зелёная компания заявила что разработчик не имеет права реконструировать и декомпилировать данные с использованием библиотек CUDA.

🔻 После того как к AMD наведались агенты-юристы Куртки, AMD потребовала удалить код ZLUDA из открытого доступа.

💭 В итоге код был удален с GitHub, но интернет помнит всё. Автор проекта сообщил, что полностью избавляться от ZLUDA не собирается и перезапустил работу над проектом.

#ZLUDA #CUDA #Куртка

Исходный код ZLUDA удален из сети — RX 7000 больше не смогут обрабатывать CUDA Видеокарта, Компьютерное железо, Компьютер, AMD, Amd Radeon, Nvidia, Электроника, Cuda, Дженсен Хуанг

Видеокарта Компьютерное железо Компьютер AMD Amd Radeon Nvidia Электроника Cuda Дженсен Хуанг

ARCHiGAME

10 месяцев назад

Компьютер это просто

Видеокарты AMD теперь могут работать с NVIDIA CUDA⁠⁠

💥 Такое стало возможным благодаря новой разработке британского стартапа Spectral Compute под названием SCALE.

💭 Набор инструментов GPGPU позволяет любым ускорителям работать с CUDA без переноса и портирования кода. Технология SCALE разрабатывается семь лет и имеет независимость от кода NVIDIA. У неё есть своя CUDA-совместимая цепочка библиотек, которая легко адаптируется к разным платформам.

🎫 Spectral Compute утверждает, что специалисты успешно протестировали ПО в нескольких популярных приложениях, таких как Blender, Llama-cpp, XGboost, FAISS, GOMC, STDGPU, Hashcat и NVIDIA Thrust, используя видеокарты RDNA 3 и RDNA 2.

🔧 Ускорители NVIDIA с их проприетарной технологией могут потерять эксклюзивность, по этому Куртка может начать закручивать гайки через подкупы, коррупцию и прочие махинации, тем самым попытавшись избавиться от конторы SCALE, ведь недавно Nvidia уничтожила проект Zluda который позволял видеокартам AMD работать с CUDA.

#Nvidia #Cuda #AMD

Видеокарты AMD теперь могут работать с NVIDIA CUDA Игровой ПК, Компьютерное железо, Видеокарта, Электроника, Компьютер, Nvidia, Nvidia RTX, Cuda, Технологии, Искусственный интеллект, Программа, Инновации, AMD, Amd Radeon

Игровой ПК Компьютерное железо Видеокарта Электроника Компьютер Nvidia Nvidia RTX Cuda Технологии Искусственный интеллект Программа Инновации AMD Amd Radeon

ARCHiGAME

1 год назад

У европейского ритейлера появились несколько RTX 4090 SUPER⁠⁠

На сайте крупного европейского магазина Proshop несколько неанонсированных видеокарт GeForce RTX 4090 SUPER.

В каталоге сразу появились 24 новых видеокарт 4090 Super, вследствии чего поползли слухи о возможном скором анонсе нового флагмана GeForce RTX 4090 SUPER с дикой стоимостью.

#Nvidia #RTX4090 #Cuda

Показать полностью 2

Электроника Видеокарта Nvidia Nvidia RTX Rtx 4090 Сборка компьютера Компьютерная графика Компьютер Микроэлектроника Технологии Cuda ВКонтакте (ссылка)

ARCHiGAME

1 год назад

«Вся индустрия заинтересована в ликвидации рынка CUDA»⁠⁠

Глава Intel раскритиковал Nvidia и её доминирование на рынке ИИ. Он считает, что статус-кво сохранится недолго.

😎☝ Суть претензий Intel в том, что CUDA является проприетарной платформой Nvidia, что ограничивает развитие рынка ИИ и заставляет различные компании активнее покупать ускорители Nvidia. Когда такой спрос обрушивается на одну компанию, это вредит конкуренции и, как следствие, рынку в целом. Впрочем, пока никто кроме Intel не делал публичных заявлений по этому поводу.

#intel #Ии #Nvidia

«Вся индустрия заинтересована в ликвидации рынка CUDA» Intel, Искусственный интеллект, Nvidia, Cuda, Электроника, Изобретения, Инновации, Рынок, Технологии, Видеокарта, Техника

Intel Искусственный интеллект Nvidia Cuda Электроника Изобретения Инновации Рынок Технологии Видеокарта Техника

861

FabLabCFU

4 года назад

Искусственный интеллект

На пути к нейросети⁠⁠

Мы занимаемся разработкой экзоскелета кисти с биологической обратной связью для реабилитации детей с синдромом ДЦП. А точнее, пытаемся обучить нейросеть распознавать сигналы мозга для управления экзокистью.

Хочу рассказать, с чего началось и как продвигается наше исследование.

Несколько месяцев назад мы начали подготовку данных - сняли около 1000 энцефалограмм, которые содержат признаки, характерные для мысленного представления определенных движений кистью. Всего планируем снять 2000 ЭЭГ, но уже сейчас у нас достаточно данных для начала работы.

Следующий этап - установка видеокарты GeForce RTX 3090 c GDDR6 24Гб. Она позволяет обрабатывать большие обучающие выборки благодаря наличию большого объема памяти и использованию технологии CUDA. Но в новизне видеокарты скрывались подводные камни, которые я не без труда, но с успехом преодолел.

На пути к нейросети Нейронные сети, Глубокое обучение, Cuda, Длиннопост, Nvidia, Текст, ЭЭГ

Видеокарта «взлетела» не сразу. Для начала стало ясно, что она не помещается ни в один из имеющихся в наличии корпусов. Был приобретен новый корпус Full Tower и отдельно блок питания на 750Вт. При попытке задействовать возможности CUDA в обучении нейронных сетей возникла следующая проблема – видеокарта слишком новая, фреймворки и библиотеки для искусственного интеллекта (DeepLearning4j, Theano, TensorFlow) её еще не поддерживают. Выход – скачать исходники фреймворков для ИИ и самостоятельно перекомпилировать их для поддержки видеокарты. Однако в процессе оказалось, что эти фреймворки ускоряются не только за счет ресурсов видеокарты, но и требуют поддержки современных инструкций процессора. Был приобретен современный процессор Inter Core I7-10700K с поддержкой AVX, AVX2 команд – , вместе с новой материнской платой и 32 Гб DDR4.

И вот наконец GeForce RTX 3090 смогла продемонстрировать свои возможности!

На первом графике видно, как задействуется память видеокарты и ресурсы GPU при обучении Convolution 1D — сверточной одномерной сети, обрабатывающей временные ряды — данные исследований ЭЭГ. Ранее обучение нейронной сети на этом датасете занимало около 4 часов. На новой видеокарте — порядка 3-4 секунд.

А вот задача посложнее: LSTM — рекуррентная сеть с долгой краткосрочной памятью. Те же данные считаются дольше — около 2 минут, и нагрузка на GPU выше:

Видеокарта решает! Раньше при внесении даже небольших изменений в конфигурацию сети, приходилось ждать несколько часов, чтобы понять, каким образом внесенные изменения отобразились на качестве распознавания признаков нейронной сетью. Теперь эта задача существенно облегчается.

Таким образом, видеокарту удалось запустить в Keras, используя только что вышедшее обновление TensorFlow в версии для GPU.

Однако эти решения используют Python, который при всех его положительных качествах (возможность быстрого прототипирования нейронных сетей, развитые библиотеки для работы с данными, простота и скорость разработки приложений) плохо подходит для многопоточных задач, когда в пределах одного приложения надо получать данные с устройства в реальном масштабе времени, обрабатывать их, подавать на вход ИНС, сохранять в файл, управлять внешними устройствами, рисовать данные на экране и т.д.

Поэтому необходимо было получить возможность работать с ИНС в Java-приложениях, но с этим из-за использования слишком нового железа возникли трудности. Описанными в мануалах способами GPU никак не хотел подключаться, и решения на тематических форумах на сайте разработчиков и GitHub не было, а те рецепты решения проблемы, которые советовали разработчики, не помогали.

Возникло понимание, что причина проблемы - в несовместимости ряда библиотек, компонентов фреймворка, с новыми библиотеками CUDA от NVIDIA.

Пришлось скачивать исходники и пытаться собирать библиотеки под необходимые платформы: CUDA 11.* и CuDNN 8.*, что оказалось нетривиальной задачей: имелось несколько тысяч файлов и масса условий окружения для нормальной сборки, а мануалы описывали сборки устаревших версий и не работали с новыми.

Кроме того, в исходных кодах возникали некоторые ошибки компиляции, одинаковые как для компиляции из Windows 10 (VS2019), так и из Ubuntu (gcc).

Удалось скомпилировать, после правки исходных кодов, часть зависимых библиотек проекта - libnd4j, а затем уже с ними библиотеку nd4j-cuda-11.1.

Ранее поддержка проекта рекомендовала использовать snapshots - версии библиотек из специального репозитория:

«we’ll be releasing a version with 11.0 in a bit, for now you can use snapshots and see if that works? https://deeplearning4j.konduit.ai/config/config-snapshots»

Однако, как оказалось, часть необходимых для работы файлов там отсутствовала, и рекомендация не помогла.

https://oss.sonatype.org/service/local/artifact/maven/redire...

404 — Not Found

Path /org/nd4j/nd4j-cuda-11.0/1.0.0-SNAPSHOT/nd4j-cuda-11.0-1.0.0-20201117.023522-181-windows-x86_64.jar not found in local storage of repository «Snapshots» [id=snapshots]

Что и обусловило компиляцию недостающих файлов. К счастью, версия deeplearniung4j для 11.0 версии CUDA импортировалась, и, добавив в проект в виде отдельных jar и dll файлов скомпилированные библиотеки, удалось запустить приложение на видеокарте!

Часть POM файла работоспособного проекта:

Скомпилированные библиотеки добавлены в зависимости вручную:

В данном случае - обучение на сравнительном не большом объеме данных заняло 42 минуты 37 секунд, на CPU эта же задача выполнялась более 2500 минут при полной загрузке процессора.

Вот так я сам добавил поддержку современных видеокарт в Deeplearniung4j, чтобы не дожидаться, пока это сделают разработчики.

Спасибо за внимание. Пока мы еще в начале пути, буду продолжать рассказывать о нашей работе!

Показать полностью 5

[моё] Нейронные сети Глубокое обучение Cuda Длиннопост Nvidia Текст ЭЭГ

126

SMdesign

6 лет назад

Как просто ускорить Adobe Premiere Pro⁠⁠

Для многих людей монтаж видео превращается в сущий ад при зависании программы. Покупать более мощный компьютер накладно, однако есть простой способ сберечь ваши нервы и время. Данный способ поможет людям со слабым компьютером, для вас появится возможность работать в реальном времени, без задержек программы, а рендеринг будет работать куда быстрее. Итак, что нам нужно сделать? Включить аппаратное ускорение премьер про (opencl. cuda) - Adobe Premiere Pro не всегда видит вашу видеокарту и не использует ее мощности в своей работе. Для того чтобы заработал Opencl или Cuda нужно:

1. Узнать какая у вас видеокарта

2. Открыть корневую папку Adobe Premiere Pro

3. Найти, если отсутствует то создать файл cuda_supported_cards для видеокарт Nvidia, opencl_supported_cards для видеокарт AMD

4. Добавить название вашей видеокарты в файл

5. При создании проекта в Premiere Pro в пункте "средство рендеринга" выбрать аппаратное ускорение ядра

Показать полностью

[моё] Adobe Premiere PRO Монтаж Cuda Видеомонтаж Видео

XAZAD

6 лет назад

Machine learning vs GameDev CUDA version⁠⁠

Один из читателей резонно заявил: “воды много, мясо где?»

CUDA

Я люблю слово итак, потому: итак CUDA и как его едят?

Начнем пожалуй с того, что, привыкли называть CUDA это GPGPU.

Зайдем издалека, года эдак с 70 – тогда встала проблема что мы умеем считать Integer (а по большому счет bool), а что такое float – процессор не знает.

Теперь немного теории – как мы помним из математики начальных классов, у нас есть реальные и вещественные числа, в IT они называются float и integer. Если с обычным интом микросхема обучена работать по умолчанию (если интересно как они зарождались – погуглите машина бэббиджа), да вспомните мою оговорку выше про тип bool (true, false), то c float все гораздо интереснее. Первые архитектуры с флотом вообще не работали, последующие выносили значения после запятой на отдельную микросхему. Потому пришла эпоха виртуализации(HyperThreading) и мы началидробную часть вытаскивай на виртуальное ядро, но работать мы с ним так и не научились.

Ну мы же знаем про ученых они муху под носом не видят, рядом с ними (года эдак с 1990) развивается целое поколение процессоров, которое изначально оперирует не двумя а тремя точками, GPU вроде как :D

Теперь к практике:

Все же знают что у вас в компе 16 ядер и каждое их них по 3Ghz?. В видеокарте 3000 ядер по 100Hz.

Если использовать терминологию языка С – это шейдеры, и к каждому из них ты можешь обратиться адресно.

Теперь мясо – если использовать всё тот же язык C(на нем написаны все ОС, что Apple, что Windows), ты можешь адресно обратиться к каждому шейдеру и накатить задачку. В случае с обычным процессором ты можешь только вызвать прерывание проца и поставить задачу в очередь. То есть это из раздела: ты либо спускаешь задачу на отдел специалистов, либо говоришь – Вась пойди сделай.

Показать полностью

[моё] Cuda IT Текст

Посты не найдены

1 2