Продолжаю развивать свой pet-проект под названием Human vs AI, где нейросети от разных компаний задают вопросы на различные темы.
Для тех, кто слышит впервые: это бесплатная игра, где каждый может столкнуть свой интеллект с искусственным, отвечая на каверзные вопросы, сгенерированные различными нейросетями. Некоторые уже видели, на что способны зарубежные ИИ (DeepSeek и ChatGPT), но пришло время для отечественных нейронок!
Сегодня я хочу анонсировать важное обновление! В нашем интеллектуальном ринге появляются новые бойцы: вопросы, созданные нашими отечественными, «скрепными» генеративными моделями от @Sber и @Yandex.
YandexGPT Pro — на мой взгляд, сгенерировал очень интересные вопросы и пояснения к ним. Качество контента порадовало.
GigaChat Max — очень необычно задаёт вопросы и пояснения к ним. Не знаю, плюс это или минус, но вот пару примеров:
Пример 1:
Вопрос: «Какой традиционный русский напиток готовят из ягод и фруктов путём брожения?»
Ответ от GigaChat: «Квас».
Пошёл гуглить — да, квас на ягодах бывает. Но всё же мы привыкли думать, что квас — это хлебный напиток, а ягодный — это морсик или компотик.
Пример 2:
Рубрика: «Головоломки».
Вопрос: «Сколько лап у кошки?».
Головоломка высшего порядка))
Было ещё забавное пояснение к вопросу о том, кто написал картину «Утро в сосновом бору».
Ответ: «Шишкин».
Пояснение: 🐻 + 🌲 = Шишкин!
Теперь об экономике процесса — сравнение стоимости генерации вопросов.
YandexGPT сгенерировал 2008 валидных вопросов, на что было потрачено 3250 рублей с копейками. Надо отдать должное Яндексу: 3000 рублей был выдан грант при регистрации. Выходит, личных денег я почти не потратил, а вот то, что ушёл в минус на 250 рублей… Яндекс, WTF? Получается, 1 валидный вопрос обошёлся в 1,61 рубля.
GigaChat сгенерировал всего 700 вопросов, потратив 3900 рублей. 1 вопрос = 5,57 рублей. Почему-то ИИ генерирует много дубликатов и невалидных вопросов. Пока не погружался в причины — возможно, я неверно ставлю задачи (хотя перепробовал с десяток промптов). Или нужно системно прописать промпт и делать запросы по нему, если API Сбера это позволяет. Буду тестить дальше.
Что дальше?
Работа над проектом продолжается! Следующее обновление будет просто пушка! Добавляю новую механику в игру, которая идеально впишется в интеллектуальный баттл.
Ссылка на игру - Human vs AI