
Искусственный интеллект
Крутой союз Gemini и Veo, Цукерберг давал Китаю ИИ, $180К за переход в NVIDIA
В этом выпуске новостей про искусственный интеллект вы узнаете, почему OpenAI обязали хранить все ваши данные, как компания Марка Цукерберга тайно помогала Китаю развивать искусственный интеллект, каким образом Sparkify генерирует крутые короткие видео и другие интересные новости.
ИИ-диктор — OpenAudio S1
Появился шедевральный самый реалистичный ИИ-диктор — OpenAudio S1.
Эта нейросеть копирует паузы, интонации, даже шёпот и крик, как настоящий человек. Можно вручную указать, где добавить нужную эмоцию — от вдоха до сарказма.
• Поддерживает голоса знаменитостей, включая Маска и Трампа.
• Импорт любого голоса — достаточно 15 секунд записи.
• Подходит для озвучки игр, видео, подкастов и книг.
• На русском. Бесплатно.
«Неминуемые изменения. С днём рождения GPT»
🧐 Мои публикации изначально создавались для проверки гипотез и определения оптимального формата авторского контента. Чтобы сформировать твёрдую, независимую позицию, важно пройти весь путь от начала до конца. В основе моего эксперимента лежала идея обучить нейронную сеть на своих мыслях и рассуждениях, а также выявить пределы возможностей AI. Интернет — изменчивая среда, но развитие ИИ в последние годы кардинально меняет его принципы, особенно в отношении контента.
«Content is 👑»
Контент был королём интернета. На заре его развития, когда любой сайт и автор легко находили свою аудиторию. Это было время расширения интернет проникновения; отсутствие сайта означало отсутствие в сети. Вебмастера получали значительный доход от платных ссылок и баннерной рекламы.
🤑Даже 3-5M MAU тогда считались огромным успехом. Например, я создал первую и крупнейшую поисковую систему для GIFs - Slinky с ~2.9M MAU (стала частью $SOHU) задолго до GIPHY. Многие известные компании, как $ABNB, $META, Twitter, $TRIP, $VK, $HH, стартовали в этом цикле.
Контент оставался королём долго, но с ростом интернета его распространение требовало всё больших усилий. Google и Meta сыграли ключевую роль в формировании современного WEB.
👨💻 Тысячи алгоритмов создали новую индустрию с сотнями критериев ранжирования контента: от PageRank до уникальности и поведенческих факторов.
К 2018 году стало ясно: объёма контента стало слишком много. Это привело к появлению алгоритмических лент, умных рекомендаций и глубокому анализу ПФ. Хотя рост рекламных доходов был частью этих изменений, без рекламы не было бы столь бурного развития и технологических прорывов.
🧠
В 2018 году индустрия вышла на новый виток развития. Семь лет назад вышел GPT-1 от OpenAI. Хотя первая версия и не произвела фурора, её потенциал был очевиден для экспертов. Многие пользователи уже были знакомы с нейросетями через популярные приложения, использующие их возможности под капотом.
Мне посчастливилось быть на передовой этой трансформации. Среди B2C-стартапов, которые первыми показали нейросети миллионам, можно выделить Prisma (2017), FaceApp (2016), Teleport (2017, стал частью $SNAP), Fabby (2017, часть $GOOGL), Stickeroid (2018, стал частью Naver C.) и Spectral (часть $AAPL).
«2024»
Спустя годы развития GPT и AI, интернет действительно начал преобразовываться. В 2024 году, с появлением GPT-4o, многомодальные генеративные возможности достигли уровня, близкого или неотличимого от работы человека. После ~3 недель интенсивного тестирования и дообучения я задумался: что дальше? Мысль о глобальной трансформации и будущем интернета на ближайшие 10-20 лет не давала мне покоя. В этот период был создан канал — эксперимент по использованию всех возможных AI-инструментов. Наша цель была простой— найти формулу, которую AI сгенерировать не сможет.
«Now»
Последние версии GPT-трансформеров создают типизированный контент, который практически неотличим от человеческого и ранее преобладал в интернете.
На данный момент GPT-трансформеры пока не способны создавать:
- Воспоминания
- Человекоориентированный нарратив и креатив
- Гибкие гипотезы
- Эмоционально-ориентированный контент
«Прогноз. Проекция Будущего»
- К 2030 году значительная часть контента будет AI-сгенерирована. У читателей образуется «генеративная слепота»
- Авторский, уникальный контент приобретает полное превосходство
- Ценность креатива и неординарного подхода многократно возрастет
- Создание контента останется как-то ещё востребованным, но критерии форматов изменятся
- Социальные сети полностью адаптируются к генеративу, а UGC-платформы внедрят фильтры и новые правила
Выводы сделаны на основе наших экспериментов и полномасштабного анализа парса данных с UGC-платформ.
- Можно ли считать типичный блогинг перспективным?
Ответ - 💯 нет
Цифры:
- Проанализировано ~281298 публикаций в тематике: экономика, финансы, стартапы, lifestyle и бизнес.
- Более 3900 top-tier авторов, блогеров и контент-мейкеров.
- Анализ охватил T-каналы, Пульс, $RDDT, S-Lab, Quora и Medium
Автор: Виктор Кох и Ко.
Не знает и все-равно пишет...
Диалог с DeepSeek-r1-0528:
- Нашел нейросеть для генерации песен - музыка с вокалом YuE. Знаешь что-то о ней? Если не знаешь, то не пиши.
- Да, знаю о YuE ("Yu-E" или "YourEncoder") — это голосовая модель для разделения музыки (stem extraction), а именно для извлечения вокала из готовых треков. Она не генерирует музыку с нуля, но отлично справляется с выделением вокалов из смеси.
Ключевые моменты о YuE:
Где используется: На платформе MUSICFY.LOL (или подобных сервисах). Это ее основное применение.
Что делает: Анализирует MP3 или WAV файл песни и отделяет вокал от инструментального аккомпанемента (инструментала).
... и т.д.
Даже самые современные нейросети этим страдают. Gemini 2.5 Pro Preview 06-05 - то же самое чешет, только более обтекаемо. И даже Алиса в поиске предпочитает написать какую-нибудь дичь, чем ничего не отвечать.
В обучении нейросетей очень не хватает заданий которые бы вырабатывали способность самокритики, чтобы она могла честно признаться что чего-то не знает. Пока что это недостижимая для нейросетей высота.
***
А вот проект о котором я спрашивал. https://github.com/multimodal-art-projection/YuE
Это похоже на SUNO но можно запустить локально. (Если конечно у вас есть GPU H800 или A100 с 80Gb VRAM или 4-8 штук RTX4090)
Veo3 теперь по API, в n8n и вообще везде / Google удивляет через Sparkify
За последние 3-4 дня Veo3 действительно стала доступна по API, правда, не очень дёшево.
• Leonardo / Envato — если брать большие планы, то можно снизить до 2.5 долларов за генерацию (видео от Leonardo как раз 1)
Грабительские расценки, не так ли?
У Veo3 также есть отдельный API, но там вейт-лист, куда пускают только если компания крупная.
Кроме того, из-за появления Veo3 на fal.ai, сеть заполонили схемы n8n, по которым якобы можно стать тикток-миллионером за неделю. Но есть нюанс: Veo3 часто галлюцинирует, и только 30–50% кадров получаются удачными. До настоящего автопилота пока далеко. Так что не рекомендую.
А теперь самое интересное:
Google анонсировал Sparkify — новый сервис для создания коротких видео. Это платформа, где можно собирать видеоистории буквально за пару минут. Весь сюжет и текст придумывает ИИ Gemini, а за анимацию, музыку и озвучку отвечает Veo. Всё это — на одной платформе, в пару кликов.
Сейчас доступ только по вейт-листу, подать заявку можно здесь:
Давайте будем одними из первых)
--
Мой тг канал
Промт - Автоматизация workflow - Деньги
💡 Если ты ещё вручную переключаешь вкладки, копируешь данные между сервисами или думаешь, как бы прикрутить ChatGPT к работе — у меня для тебя БОМБЕЗНАЯ находка.
📦 n8nChat — это не просто автоматизация, это генератор ИИ-агентов, который:
✏️ по твоему промту собирает цепочку действий как в конструкторе;
✏️ подключает любой сервис (Notion, Google, Airtable, Telegram и т.д.);
✏️ выдаёт готовый воркфлоу. который можно редактировать, менять и запускать хоть сразу.
💬Пример запроса:
«Когда мне приходит письмо с вложением, пересылай его в Telegram и загружай копию в Google Drive».
n8nChat собирает всё это в визуальном редакторе прям в чате. Автоматизация работает через n8n, опенсорс‑альтернативу Zapier/Make, но на стероидах.
🧠 Плюс: у них есть 2000+ шаблонов и база промтов под любые задачи: https://n8nworkflows.xyz/
🤯 Каждый агент - это готовый сценарий под ключ. Не надо думать, как соединить ChatGPT, Notion, почту, соцсети или аналитику - всё уже собрано: Ведение соцсетей на автопилоте, генерация лидов и CRM-сбор, бухгалтерия и отчёты, продажи и маркетинг. SEO и глубинная аналитика, дизайн и т.д.
Каждый шаблон с пошаговым гайдом, описанием и рекомендацией, какие ИИ лучше ставить: GPT‑4o, Claude 3, Gemini или даже open-source‑модели.
👑 Если ты занимаешься продуктом, каналом, бизнесом — это must-have, чтобы освобождать руки и не тонуть в рутине.
🔗 Тестим здесь: https://n8nchat.com/?ref=neurosquad
Больше полезностей и свежих новостей с мира ИИ, опубликовываем в нашей команде NeuroСквад
Бесплатная расшифровка аудио и видео в текст
Бесплатная расшифровка аудио и видео в текст — офлайн и на любом железе.
WizWhisp на базе OpenAI Whisper можно установить прямо на комп и тянуть текст из любого файла без интернета.
— Работает с MP3, WAV, M4A, AVI и десятками других форматов
— Понимает 90+ языков
— Подходит для интервью, лекций, звонков и всего, где есть звук
— Запускается локально — и на CPU, и на GPU