Этот бенчмарк доступен для Android, iOS, macOS и Windows, и предназначен для максимально жесткого тестирования видеокарт с обилием RT-эффектов, таких как зеркальные отражения с трассировкой лучей, отражения от стекла и мягкие тени для направленного света. Кроме того, в отличие от обычного Solar Bay, в Extreme-версию добавлена дополнительная тяжелая тестовая сцена.
Claude Opus 4 — самая мощная модель Anthropic на сегодняшний день и одна из лучших моделей кодирования в мире.
1. Она лидирует на SWE-bench с результатом 72,5 процента и на Terminal-bench с результатом 43,2 процента. Это тест по программной инженерии:
Что это означает:
Claude Opus 4 может выполнять сложные, длительные задачи в течение нескольких часов, не теряя фокуса. Он работает намного круче, чем все модели Sonnet, показывая, насколько больше теперь могут достичь ИИ-агенты.
Opus 4 - прогрессивен в кодировании, исследовании, письме и научных открытиях. А Sonnet 4 -это усовершенствованная Sonnet 3.7, у нее высокая производительность для повседневных задач.
2) Обе модели Claude 4 также лидируют в SWE-bench Verified:
SWE-bench Verified - это бенчмарк, который проверяет, насколько хорошо модели выполняют реальные задачи по разработке ПО. Обе модели демонстрируют высокую производительность в кодировании, рассуждениях, мультимодальных возможностях и агентских задачах. Но почему же одна платная, а другая нет? А вот внимательнее на скрин)
Почему Claude Opus 4 платный, а Claude Sonnet 4 бесплатный? Чем лучше Claude Opus 4 ?
Claude Opus 4 лучше справляется с длинными, многошаговыми задачами, особенно в reasoning и математике.
У Opus выше лимиты и мощнее долговременная память, что полезно для бизнеса и сложных кейсов.
В agentic terminal coding и math Opus работает значительно лучше, а это важно при разработке сложных агентов и решении инженерных задач.
Цены и как сэкономить
Для доступа к более мощной модели Claude Opus 4, предназначенной для сложных задач, таких как программирование и глубокий анализ, требуется подписка Claude Pro. Стоимость подписки составляет $20 в месяц или $200 в год (налоги не включены).
Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.
Цены на API
При использовании моделей через API действуют следующие тарифы:
Claude Opus 4: $15 за миллион входных токенов и $75 за миллион выходных токенов.
Claude Sonnet 4: $3 за миллион входных токенов и $15 за миллион выходных токенов.
Как сэкономить?
Оптимизировать расходы:
Кэширование запросов: позволяет сократить расходы до 90%, повторно используя ранее обработанные части запросов.
Пакетная обработка: позволяет сократить расходы до 50%, обрабатывая несколько запросов одновременно.
Стоит ли платить за Opus 4?
Если вы:
работаете с программированием, сложной математикой, или строите многошаговые агенты — да, Opus будет ощутимее лучше
используете Claude в личных целях или просто для текстов, идей, резюме, диалогов — Sonnet 4 более чем хватит.
Sonnet 4 — одна из лучших бесплатных моделей на сегодня. Она работает быстрее, но не обладает такими же возможностями с точки зрения мышления, кодирования и памяти как Claude Opus 4
А кто хочет больше эксклюзивных видеоинструкций, проверенных инструментов, советов с обратной связью, обучения промптингу - Добро пожаловать в мой Закрытый клуб
Что происходит, когда предприниматель решает построить точную копию чужого бизнеса? Почему точное копирование не срабатывает?
И что важнее — идея или внутренняя "начинка" процесса?
Этот ролик — честный разговор о том, почему копирование бизнеса часто заканчивается точным провалом.
В этом видео мы разбираем реальные кейсы из 90-х и 2000-х, когда дистрибьюторы, менеджеры и даже целые команды пытались создать идентичные копии работающих бизнесов. Они брали базы данных, копировали бизнес-модель, налаживали аналогичное контрактное производство… и терпели фиаско.
📌 Главное — мы покажем, почему "копирование бизнеса" не работает на практике и в чём ключевые отличия между тупым клонированием и осмысленным бенчмаркингом.
Хочу сделать апгрейд ноутбука. Не могу определиться какой брать, сейчас стоит 2 по 8гб.
Конкретно, что лучше? Выше частота, но больше тайминги или частота ниже и соответственно ниже тайминги. Верить рейтингу ДНС такое себе, так как на сайте memorybenchmark показывает другие результаты теста.
Тут на днях задумался - а насколько там нынче хорош видео енкодер AV1 относительно H.264. Сфера его применения сейчас растет, оно есть в Youtube, оно поддерживается в программах для стриминга, в сегодняшнем поколении видеокарт уже добавили его хардверную поддержку.
Не, так-то понято, что это очередное крутое поколение видео енкодеров, и ебучие шакалы AV1 по определению лучше чем в H.264 (x264).
картинка для привлечения внимания
Но в этом контексте всегда надо помнить, что нет универсального "всегда лучшее для всех", как говорится, дано 3, ты можешь выбрать только 2 скорость - качество - объем
Когда появляются более крутые алгоритмы сжатия видео, то само собой разумеется что они требуют более тяжелых вычислений, а следовательно и работают медленнее.
И вот мне стало интересно, насколько AV1 может стать заменой H.264 в той области, когда у нас нет времени ждать. Надо вот прям щас срочно пережать видосик с адекватным качеством и объемом, или хочется записать видео с экрана или стрим без покупки второго компа который будет вывозить большую нагрузку. К тому же в многими любимой программе для стриминга игр, OBS, уже имеется версии AV1 для CPU (хардверный вариант в видюхах рассматривать не буду, да и у меня и видюхи такой нет). Так неужели AV1 может затмить по скорости и качеству, да еще и с объемом не прогадать. Или нафик нам тогда вообще AV1 для цпу в OBS сдался.
Итак, берем в руки HandBrake, здесь будем шакалить видео с разными параметрами. (было бы лучше взять ffmpeg и набыдлокодить скрипт который сам все делает, но у меня лапки) Также надо чем-то измерять шакализацию, в качестве оценки попугаев возьмем VMAF, который обещает оценку в чем-то похожую на человеческий взгляд, а не просто разность пикселей посчитать. Такую штуку я нашел в Nmkoder
Взял кодеки AV1 (вариант реализации под названием SVT), H.264 (x264) и H.265 (x265) и прошелся с разными (но не особо медленными) настройками. Хотел было включить сюда и VP9, но он оказался слишком медленный даже на самой быстрой настройке, доступной в Handbrake.
В качестве первой и самой длинной проверки я взял один из видосиков с работы. Получились вот такие результаты
1/4
Пояснения к таблице пресет av1 - настройка, больше = быстрее пресет h264 - настройка, "медленнее" или "быстрее". (очевидно для знающих английский) rf - настройка, качество с переменным битрейтом, меньше - лучше качество, но больше объем VMAF - результат, больше = лучше (идеал = 100) скорость - результат, множитель времени потраченного на сжатие относительно длительности видео
Общая мысль о выводах - при кодировании на CPU (в области "сжать быстренько") енкодер AV1-SVT превосходит H.264 по всем трем пунктам - скорость-качество-размер. Т.е. здесь можно отказаться от H.264 и перейти на AV1 (SVT). Разве что вам нужно ну вообще супер-скорость (или хотите записывать как вы играете даже на довольно слабом компе - тогда AV1 (SVT) может оказаться слишком медленным даже в самом быстром режиме, но из моего опыта x264+пресет=ultrafast можно использовать вместе с игрой даже на довольно слабых компах)
Также сделал коротенький тест на кусочке фильма где есть экшон ("v") и запись геймплея шутера ("р"). В целом, считаю что вводы подтверждаются.
1/2
P.S. Конечно, нельзя вот прям сейчас взять и отказаться от H.264, поддержка AV1 пока еще есть далеко не везде, и "переезд" будет длится еще довольно долго.
P.S.S. Я сначала было попытался найти такое в интернете, ведь наверняка кто-то подобное уже делал, но боги поисковых систем не были ко мне благосклонны.
💥 Флагманский процессор Arrow Lake был протестирован в тесте V-Ray — программном обеспечении для 3D-рендеринга. В этом бенчмарке процессор набрал 44 883 балла. Для сравнения, самый быстрый в текущем поколении Core i9-14900KS набирает в этом же тесте 36 924 балла, а Core i9-14900K — всего 35 558 баллов.
⚡️ Прирост производительности от перехода на новую архитектуру должен составить не менее 20 % по сравнению с Core i9-14900KS и порядка 26 % по сравнению с Core i9-14900K. По крайне мере, в задачах на 3D-рендеринг. Это впечатляет так как новинка не имеет Hyper Threading, чип Arrow Lake имеет только 24 ядра против 32 потоков у Raptor Lake.
📆 24 октября Intel проведет презентацию где и расскажет подобности о процессорах Arrow Lake.
3DMark - известная серия бенчмарков, разрабатанная финской компанией Futuremark (ранее MadOnion.com). Что интересно, сама компания была создана Remedy Entertainment, сделавшей Max Payne, поэтому многие внутриигровые ресурсы да и сам движок (MaxFX, по 2003 год включительно) у них были общими.
В 3DMark 2001 была включена даже неплохая демо-игра с ездой на вооружённом Бигфуте, которая судя по всему являлась продолжением их самой первой игры - Death Rally (MS-DOS, 1996). На вики в статье про Remedy как раз писали, что одно время они подумывали разработать этот сиквел.
В общем, пример приятной компьютерной графики из двухтысячных.
На первый взгляд кажется что на 14 поколение процессор intel всего несколько процентов прироста, как утверждают i22HARD, к тому же это без учёта возможностей разгона. 🤨
НО ☝️🧐
Не забывайте что intel выпустила APO - этот алгоритм оптимизации работы процессоров даёт сверху 20-30% производительности. Скажем так, ответ на DLSS от Nvidia только в мире процессоров.
На данном этапе intel APO работает только с 14-ым поколением процессоров intel, таких как 14700kf, 14700k, 14900kf, 14900k. В списке поддерживаемых игр пока что 2 игры. Рим не за день строился, уверен что intel добавит поддержку всех процессоров 14-ого поколения в список обслуживаемых APO, а также значительно расширит список поддерживаемых игр.