Бенчмарк: истории из жизни, советы, новости, юмор и картинки — Горячее

20 дней назад

Новый уничтожитель GPU: 3Dmark выпустила кроссплатформенный Solar Bay Extreme⁠⁠

Этот бенчмарк доступен для Android, iOS, macOS и Windows, и предназначен для максимально жесткого тестирования видеокарт с обилием RT-эффектов, таких как зеркальные отражения с трассировкой лучей, отражения от стекла и мягкие тени для направленного света. Кроме того, в отличие от обычного Solar Bay, в Extreme-версию добавлена дополнительная тяжелая тестовая сцена.

Канал Осьминог Пауль

Показать полностью

Neurosonya

3 месяца назад

Полезные нейросети

Серия Полезность

Почему Claude Opus 4 платный, а Claude Sonnet 4 бесплатный? Как понять, какую модель выбрать? Разбираемся⁠⁠

Claude Opus 4 — самая мощная модель Anthropic на сегодняшний день и одна из лучших моделей кодирования в мире.

1. Она лидирует на SWE-bench с результатом 72,5 процента и на Terminal-bench с результатом 43,2 процента. Это тест по программной инженерии:

Почему Claude Opus 4 платный, а Claude Sonnet 4 бесплатный? Как понять, какую модель выбрать? Разбираемся Искусственный интеллект, Тестирование, Программирование, Нейронные сети, Чат-бот, Бесплатно, Digital, Будущее, Код, Агент, Тренд, Сравнение, Новинки, Технологии, Обзор, Мнение, Бенчмарк, Длиннопост

Что это означает:

Claude Opus 4 может выполнять сложные, длительные задачи в течение нескольких часов, не теряя фокуса. Он работает намного круче, чем все модели Sonnet, показывая, насколько больше теперь могут достичь ИИ-агенты.
Opus 4 - прогрессивен в кодировании, исследовании, письме и научных открытиях. А Sonnet 4 -это усовершенствованная Sonnet 3.7, у нее высокая производительность для повседневных задач.

2) Обе модели Claude 4 также лидируют в SWE-bench Verified:

SWE-bench Verified - это бенчмарк, который проверяет, насколько хорошо модели выполняют реальные задачи по разработке ПО. Обе модели демонстрируют высокую производительность в кодировании, рассуждениях, мультимодальных возможностях и агентских задачах. Но почему же одна платная, а другая нет? А вот внимательнее на скрин)

Почему Claude Opus 4 платный, а Claude Sonnet 4 бесплатный? Чем лучше Claude Opus 4 ?

Claude Opus 4 лучше справляется с длинными, многошаговыми задачами, особенно в reasoning и математике.
У Opus выше лимиты и мощнее долговременная память, что полезно для бизнеса и сложных кейсов.
В agentic terminal coding и math Opus работает значительно лучше, а это важно при разработке сложных агентов и решении инженерных задач.

Цены и как сэкономить

Для доступа к более мощной модели Claude Opus 4, предназначенной для сложных задач, таких как программирование и глубокий анализ, требуется подписка Claude Pro. Стоимость подписки составляет $20 в месяц или $200 в год (налоги не включены).

Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.

Цены на API

При использовании моделей через API действуют следующие тарифы:

Claude Opus 4: $15 за миллион входных токенов и $75 за миллион выходных токенов.
Claude Sonnet 4: $3 за миллион входных токенов и $15 за миллион выходных токенов.

Как сэкономить?

Оптимизировать расходы:

Кэширование запросов: позволяет сократить расходы до 90%, повторно используя ранее обработанные части запросов.
Пакетная обработка: позволяет сократить расходы до 50%, обрабатывая несколько запросов одновременно.

Стоит ли платить за Opus 4?

Если вы:

работаете с программированием, сложной математикой, или строите многошаговые агенты — да, Opus будет ощутимее лучше
используете Claude в личных целях или просто для текстов, идей, резюме, диалогов — Sonnet 4 более чем хватит.
Sonnet 4 — одна из лучших бесплатных моделей на сегодня. Она работает быстрее, но не обладает такими же возможностями с точки зрения мышления, кодирования и памяти как Claude Opus 4

А кто хочет больше эксклюзивных видеоинструкций, проверенных инструментов, советов с обратной связью, обучения промптингу - Добро пожаловать в мой Закрытый клуб

Показать полностью 1

[моё] Искусственный интеллект Тестирование Программирование Нейронные сети Чат-бот Бесплатно Digital Будущее Код Агент Тренд Сравнение Новинки Технологии Обзор Мнение Бенчмарк Длиннопост

KONEV.MARKETING

4 месяца назад

Молодые предприниматели

Серия НЕУСПЕШНЫЙ БИЗНЕС

Точная копия. Точный ПРОВАЛ бизнеса⁠⁠

Что происходит, когда предприниматель решает построить точную копию чужого бизнеса? Почему точное копирование не срабатывает?

И что важнее — идея или внутренняя "начинка" процесса?

Этот ролик — честный разговор о том, почему копирование бизнеса часто заканчивается точным провалом.

В этом видео мы разбираем реальные кейсы из 90-х и 2000-х, когда дистрибьюторы, менеджеры и даже целые команды пытались создать идентичные копии работающих бизнесов. Они брали базы данных, копировали бизнес-модель, налаживали аналогичное контрактное производство… и терпели фиаско.

📌 Главное — мы покажем, почему "копирование бизнеса" не работает на практике и в чём ключевые отличия между тупым клонированием и осмысленным бенчмаркингом.

Показать полностью

[моё] Бенчмарк Предпринимательство Бизнес Малый бизнес Видео YouTube

Вопрос из ленты «Эксперты»

user9005236

5 месяцев назад

Про железо

Помогите с выбором оперативной памяти для ноутбука⁠⁠

Хочу сделать апгрейд ноутбука. Не могу определиться какой брать, сейчас стоит 2 по 8гб.

Конкретно, что лучше? Выше частота, но больше тайминги или частота ниже и соответственно ниже тайминги. Верить рейтингу ДНС такое себе, так как на сайте memorybenchmark показывает другие результаты теста.

https://www.memorybenchmark.net/ram.php?ram=Kingston+KF432S20IBK2/32+16GB&id=24877

https://www.memorybenchmark.net/ram.php?ram=Kingston+KF426S15IB1/16-SP+16GB&id=20953

Показать полностью 2

[моё] Компьютерная помощь Тест Оперативная память Компьютер Ноутбук Апгрейд Бенчмарк Сложный выбор Компьютерное железо Игровой ПК Сборка компьютера Вопрос Спроси Пикабу

wingblack

8 месяцев назад

AV1 достаточно быстрый чтобы выкинуть H.264 (но это не точно)⁠⁠

Тут на днях задумался - а насколько там нынче хорош видео енкодер AV1 относительно H.264.
Сфера его применения сейчас растет, оно есть в Youtube, оно поддерживается в программах для стриминга, в сегодняшнем поколении видеокарт уже добавили его хардверную поддержку.

Не, так-то понято, что это очередное крутое поколение видео енкодеров, и ебучие шакалы AV1 по определению лучше чем в H.264 (x264).

AV1 достаточно быстрый чтобы выкинуть H.264 (но это не точно) Я сделяль, Сжатие, H264, AV1, Бенчмарк, Стрим, Мат, Длиннопост

картинка для привлечения внимания

Но в этом контексте всегда надо помнить, что нет универсального "всегда лучшее для всех",
как говорится, дано 3, ты можешь выбрать только 2
скорость - качество - объем

Когда появляются более крутые алгоритмы сжатия видео, то само собой разумеется что они требуют более тяжелых вычислений, а следовательно и работают медленнее.

И вот мне стало интересно, насколько AV1 может стать заменой H.264 в той области, когда у нас нет времени ждать. Надо вот прям щас срочно пережать видосик с адекватным качеством и объемом, или хочется записать видео с экрана или стрим без покупки второго компа который будет вывозить большую нагрузку.
К тому же в многими любимой программе для стриминга игр, OBS, уже имеется версии AV1 для CPU (хардверный вариант в видюхах рассматривать не буду, да и у меня и видюхи такой нет). Так неужели AV1 может затмить по скорости и качеству, да еще и с объемом не прогадать. Или нафик нам тогда вообще AV1 для цпу в OBS сдался.

Итак, берем в руки HandBrake, здесь будем шакалить видео с разными параметрами.
(было бы лучше взять ffmpeg и набыдлокодить скрипт который сам все делает, но у меня лапки)
Также надо чем-то измерять шакализацию, в качестве оценки попугаев возьмем VMAF, который обещает оценку в чем-то похожую на человеческий взгляд, а не просто разность пикселей посчитать. Такую штуку я нашел в Nmkoder

Взял кодеки AV1 (вариант реализации под названием SVT), H.264 (x264) и H.265 (x265) и прошелся с разными (но не особо медленными) настройками. Хотел было включить сюда и VP9, но он оказался слишком медленный даже на самой быстрой настройке, доступной в Handbrake.

В качестве первой и самой длинной проверки я взял один из видосиков с работы. Получились вот такие результаты

1/4

Пояснения к таблице
пресет av1 - настройка, больше = быстрее
пресет h264 - настройка, "медленнее" или "быстрее". (очевидно для знающих английский)
rf - настройка, качество с переменным битрейтом, меньше - лучше качество, но больше объем
VMAF - результат, больше = лучше (идеал = 100)
скорость - результат, множитель времени потраченного на сжатие относительно длительности видео

Общая мысль о выводах
- при кодировании на CPU (в области "сжать быстренько") енкодер AV1-SVT превосходит H.264 по всем трем пунктам - скорость-качество-размер. Т.е. здесь можно отказаться от H.264 и перейти на AV1 (SVT).
Разве что вам нужно ну вообще супер-скорость (или хотите записывать как вы играете даже на довольно слабом компе - тогда AV1 (SVT) может оказаться слишком медленным даже в самом быстром режиме, но из моего опыта x264+пресет=ultrafast можно использовать вместе с игрой даже на довольно слабых компах)

Также сделал коротенький тест на кусочке фильма где есть экшон ("v") и запись геймплея шутера ("р").
В целом, считаю что вводы подтверждаются.

1/2

P.S. Конечно, нельзя вот прям сейчас взять и отказаться от H.264, поддержка AV1 пока еще есть далеко не везде, и "переезд" будет длится еще довольно долго.

P.S.S. Я сначала было попытался найти такое в интернете, ведь наверняка кто-то подобное уже делал, но боги поисковых систем не были ко мне благосклонны.

Показать полностью 7

[моё] Я сделяль Сжатие H264 AV1 Бенчмарк Стрим Мат Длиннопост

ARCHiGAME

11 месяцев назад

Core Ultra 9 285K обогнал Core i9-14900KS⁠⁠

💥 Флагманский процессор Arrow Lake был протестирован в тесте V-Ray — программном обеспечении для 3D-рендеринга. В этом бенчмарке процессор набрал 44 883 балла. Для сравнения, самый быстрый в текущем поколении Core i9-14900KS набирает в этом же тесте 36 924 балла, а Core i9-14900K — всего 35 558 баллов.

⚡️ Прирост производительности от перехода на новую архитектуру должен составить не менее 20 % по сравнению с Core i9-14900KS и порядка 26 % по сравнению с Core i9-14900K. По крайне мере, в задачах на 3D-рендеринг. Это впечатляет так как новинка не имеет Hyper Threading, чип Arrow Lake имеет только 24 ядра против 32 потоков у Raptor Lake.

📆 24 октября Intel проведет презентацию где и расскажет подобности о процессорах Arrow Lake.

#Arrowlake #intel #Процессор

🎙 Подписывайтесь на ARCHiTECH

Core Ultra 9 285K обогнал Core i9-14900KS Компьютерное железо, Инновации, Электроника, Компьютер, Игровой ПК, Intel, Новинки, Процессор, Производительность, Бенчмарк, Windows

Показать полностью 2

Компьютерное железо Инновации Электроника Компьютер Игровой ПК Intel Новинки Процессор Производительность Бенчмарк Windows

buldozer333

1 год назад

Уголок ретрогеймера

3DMark⁠⁠

3DMark - известная серия бенчмарков, разрабатанная финской компанией Futuremark (ранее MadOnion.com). Что интересно, сама компания была создана Remedy Entertainment, сделавшей Max Payne, поэтому многие внутриигровые ресурсы да и сам движок (MaxFX, по 2003 год включительно) у них были общими.

В 3DMark 2001 была включена даже неплохая демо-игра с ездой на вооружённом Бигфуте, которая судя по всему являлась продолжением их самой первой игры - Death Rally (MS-DOS, 1996). На вики в статье про Remedy как раз писали, что одно время они подумывали разработать этот сиквел.

В общем, пример приятной компьютерной графики из двухтысячных.

https://vk.com/blissbmp?w=wall-223510516_164 (побольше видосов)

Показать полностью 3

[моё] Видеоигра Ретро-игры 3dmark Бенчмарк Олдскул Видео YouTube Длиннопост

ARCHiGAME

1 год назад

Процессоры intel 14 поколения - мусор⁠⁠

На первый взгляд кажется что на 14 поколение процессор intel всего несколько процентов прироста, как утверждают i22HARD, к тому же это без учёта возможностей разгона. 🤨

НО ☝️🧐

Не забывайте что intel выпустила APO - этот алгоритм оптимизации работы процессоров даёт сверху 20-30% производительности. Скажем так, ответ на DLSS от Nvidia только в мире процессоров.

На данном этапе intel APO работает только с 14-ым поколением процессоров intel, таких как 14700kf, 14700k, 14900kf, 14900k. В списке поддерживаемых игр пока что 2 игры. Рим не за день строился, уверен что intel добавит поддержку всех процессоров 14-ого поколения в список обслуживаемых APO, а также значительно расширит список поддерживаемых игр.

Что будет дальше - будем посмотреть.

#intel #i2hard #APO

Процессоры intel 14 поколения - мусор Электроника, Сборка компьютера, Intel, Процессор, Центральный процессор, AMD, Amd ryzen, Микроэлектроника, Программа, Оптимизация, Компьютерная помощь, Компьютер, Бенчмарк, Производительность

Электроника Сборка компьютера Intel Процессор Центральный процессор AMD Amd ryzen Микроэлектроника Программа Оптимизация Компьютерная помощь Компьютер Бенчмарк Производительность

Посты не найдены

1 2 3 4 5 6