
Искусственный интеллект
Cursor для дизайнеров
Нашли Cursor для дизайнеров — Onlook соберет ЛЮБОЙ проект локально и сэкономит вам часы проектирования и верстки контента.
• Мгновенно делает прототип и пишет код под него, даже сложнейшие проекты рождаются за минуту.
• Макет сразу можно экспортировать и редачить в Figma.
• Готовая работа за один клик можно открыть в любой IDE.
• Главное, БЕСПЛАТНО.
OpenAI выпустила новую модель - ChanGPT o3 Pro
Компания OpenAI выпустила ChatGPT o3 Pro - принципиально новую модель искусственного интеллекта, которая уже доступна подписчикам Pro и через API. Стоимость использования заметно ниже предшественника - 20/80 за миллион токенов, по сравнению с 150/600 у o1 pro.
Уникальность o3 Pro в том, что это не собеседник, а мощнейший аналитический инструмент. Представьте: вы загружаете контекст, формулируете задачу и получаете детальный, глубоко проработанный отчет.
Один из тестировщиков поделился интересным опытом – загрузив историю планерок своего стартапа, они получили настолько точные и обоснованные рекомендации, что полностью пересмотрели стратегию развития компании.
Модель демонстрирует впечатляющее понимание контекста, точно определяет подходящие инструменты и моменты их применения. Однако без достаточного объема входных данных склонна к чрезмерному анализу даже простейших задач – своеобразный "перфекционизм" искусственного интеллекта.
В сравнительных тестах o3 Pro качественно превосходит конкурентов – Claude Opus и Gemini 2.5 Pro. Если Opus субъективно "ощущается мощным", но редко подтверждает это на практике, то o3 Pro стабильно выдает результаты нового уровня.
В бенчмарках AIME превзошла Gemini 2.5 Pro, а в тесте GPQA Diamond на знание науки уровня PhD обошла недавно выпущенный Claude 4 Opus.
--
Мой YouTube-канал с ежедневными выпусками новостей ИИ.
Китайцы научились превращать любые видео в 4D-ролики
ИИ-технология позволяет покрутить сцену, приблизить детали и посмотреть на персонажей с другого ракурса
Mistral AI выпустил свою первую модель рассуждений Magistral (есть русский язык)
Mistral AI представила Magistral — первую в своём арсенале модель, специализирующуюся на глубоком рассуждении и объединяющую мощную логическую обработку с прозрачностью мыслительного процесса.
Новая модель поддерживает 8 языков, включая русский! Magistral выпущен в двух вариантах. Общедоступный Magistral Small с 24 млрд параметров, доступный как открытый исходный код, и корпоративное решение Magistral Medium для бизнес-применений.
Особенность Magistral заключается в его архитектурном подходе к обработке информации. Модель буквально "размышляет", разбивая сложные проблемы на последовательность логических шагов. А технология Flash Answers ускоряет генерацию ответов в 10 раз по сравнению с конкурентами, по их заявлениям.
Особенно впечатляют результаты тестирования. Magistral Medium достиг 73.4% точности на сложнейших задачах AIME, демонстрируя исключительную производительность в физических симуляциях и математических вычислениях.
Мой YouTube-канал с ежедневными выпусками новостей ИИ.
Как сделать генеративную медитацию, и какие подводные камни в генерации голоса
Последние три месяца я выступаю CTO в проекте по генеративным медитациям. Вот он, если интересно. Процесс выглядит так:
🔘 Выбираешь практику (каждая практика — это отдельный ИИ-агент) →
🔘 вводишь свой запрос (он фильтруется LLM-кой на предмет качества/запрещёнки) →
🔘 запрос анализируется и оценивается по множеству параметров →
🔘 LLM генерирует индивидуальную медитацию на основе заданной методологии →
🔘 ElevenLabs генерирует озвучку по множеству кусочков →
🔘 затем специальный хитрый алгоритм аккуратно склеивает аудио с нужными паузами и музыкой.
На выходе получается весьма хорошо. Совсем глубоко раскрыть ноу-хау я не могу, но поделюсь важными находками, которые помогут многим в их проектах:
1. YandexGPT и GigaChat хуже расставляют ударения и окончания, чем зарубежный GPT. Даже на русском языке. Поэтому пока не стоит сильно надеяться на наши нейросетки — по крайней мере в таких задачах.
2. GPT-4.1 лучше всех «слушается» промпта, проверено. Почти идеально. Это проверял и в ИИ-саппорте/ИИ-продажнике, и во многих других задачах. GPT-4.5 и Claude-4 генерируют более оригинальный текст, но хуже следуют инструкциям в промпте.
3. ElevenLabs на текущий момент сильно несовершенна:
• Каждую аудиогенерацию нужно дробить на куски не больше 180-200 символов (а то и меньше), иначе модель начинает галлюцинировать.
• Даже профессиональные (PRO) голоса имеют свои дефекты: у одних возникают проблемы при использовании тире, у других — при простых фразах типа «как будто было так...». Это надо внимательно отслеживать для каждого голоса индивидуально. А сгенерированные голоса могут быть ещё хуже — если голос сгенерировался неудачно, то он переодически может вставлять китайский или идиш.
• Встроенный словарь ударений в ElevenLabs не работает через API, поэтому приходится вручную расставлять букву «ё» и отдельно ударения (например, слова «ноги», «бёдра» и подобные постоянно вызывают проблемы у модели).
• Но и при использовании LLM засада — модели тоже не всегда идеальное расставляют ударения, нужно это ещё делать это аккуратно, а то может стать ещё хуже. Поэтому нужно использовать цепочку LLM, где одна делает текст, вторая расставляет ударения и "ё".
Несмотря на всё это, ElevenLabs — лучшее решение для русского языка на данный момент, проверено практикой. Наши отечественные голосовые модели пока отстают от ElevenLabs примерно на 2 года.
(Google тоже крутая, да, но пока нельзя клонировать голос. А ещё сейчас тестирую fish.audio — тоже неплохо, но пока не elevenlabs, где-то на уровне playHT)
Таким образом, простое решение «взять текст и через API получить идеальную без галлюцнаций озвучку за 1 запрос» пока не работает без костылей и дополнительной настройки.
Хотя, может, у вас есть инсайты? 😉
Вот примеры медитаций, закинул на гугл диск: PRO голос 1, PRO голос 2, генеративный голос
У западных аналогов по генеративным медитациям вообще медитации без интонации и голос говорит очень быстро.
--
Загляните в мой тг-канал, где делюсь инсайтыми по ИИ-разработке, вайбкодингу и генеративке.
Китай заморозил ИИ, Apple убивает языковые барьеры, немытые массы vs элита ИИ
В этом выпуске новостей про искусственный интеллект вы узнаете, почему бывший сооснователь OpenAI призвал принимать реальность такой, какая она есть, как Китай временно перестроился ради образовательной честности, каким образом NVIDIA хочет построить 100 дата-центров для искусственного интеллекта и другие интересные новости.
Зум картинок
Вышла нейронка, которая ИДЕАЛЬНО зазумит любой объект — Chain-of-Zoom позволит рассмотреть даже самые мелкие детали на ваших фотках.
Умный ИИ нарезает картинку на куски и апскейлит их шаг за шагом, чтобы сохранить детали. На выходе получается идеальный зум, которому позавидует даже последний iPhone.
Как переводится "еврейка". Перевожу рассказ на английский нейросетью
Продолжаю мучить нейросеть Grok (это та, которой заведует Илон Маск).
Я попросил Грока перевести свой рассказ "Лосьоны Сатаны" (первый рассказ из цикла "Новенькая") с русского на английский.
Заодно я спросил, понял ли Грок, о чем там речь. И он понял! Вот что говорит:
Я не силен в английском, поэтому не могу оценить качество перевода, тем более художественный текст. Вроде бы неплохо, Грок переводит даже сленг и оформляет диалоги на манер западной fiction. Однако я не мог не заметить ТАКОЕ:
Оригинал:
– Ну ты еврейка, – сказал я, отсчитывая деньги.
Она улыбнулась, видимо, сочтя это комплиментом.
Перевод:
“Well, you’re quite the businesswoman,” I said, counting out the money.
She smiled, apparently taking it as a compliment.
“Как тебе такое, Валерий Муллагалеев?!” Elon Musk said :)
Есть и неоднозначные моменты, попахивающие потерей оттенков стилистики. Например:
К новой девчонке приглядывались все. Некоторые – особенно пристально. Среди некоторых был и я.
Everyone was sizing up the new girl. Some — especially closely. I was one of those.
Я нарочно использовал слово "некоторые" дважды (так звучит забавнее, на мой взгляд), но в переводе использованы разные слова. Не знаю, грамотно ли по-английски сказать "one of some"...
Если кто-то хорошо шпрехает инглиш и хотел бы полистать текст, указать на казусы или просто ошибки перевода, то здесь в телеге ссылка на гуглдок с возможностью делать примечания (англ. и рус. версии рассказа).