Ответ на пост «Как создать самостоятельный ИИ»
Вообще, если вот прям "с дивана" рассуждать про ИИ, сознание, свободу воли и самостоятельность, то придумать какой-то несложный пайплайн для ЧатаЖПТ не сложно.
Да, ЧатЖПТ сейчас - это стейтлесс (как по нашему-то?) механизм, но нет никаких проблем имитировать краткосрочную и долгосрочную память. Рассуждать текстом нейросеть у нас умеет, есть мультимодальные возможности, то есть нашему "Монстру Франкенштейна" можно соорудить глаза и речевой аппарат. Можно использовать тележку как у робота телеприсутствия, можно присобачить микрофоны и отдельным пайплайном (а как этот термин назвать понятнее?) построить механизм преобразования звука и изображения в текст контекста.
ЧатЖПТ путём префиксов в промптах (надо придумать уже русский аналог этого термина) можно заставить формировать текст своеобразной пьесы в реальном времени. Наши технологии уже позволяют таким образом вычленять из диалогов реплики, маркировать их персонажами, суммаризировать и вычленять важную информацию из сказанного.
Всю извлеченную информацию можно подвергать так называемой "дегидратации" и сохранять в виде сухих предикатов в БД. Это, кстати, можно делать даже на уровне токенов, а не текста, хотя не суть...
Итак, жизненный цикл нашего "монстра" будет состоять из нескольких параллельных процессов (пайплайнов):
STT (Speech to Text), разделение и маркировка по голосам, направлениям звука (да, у нас же есть бинауральный слух, и стереомикрофоны тоже есть), классификация не вербальных звуков из окружающего пространства, токенизация новых и незнакомых звуков.
Формирование текстовых описаний изображений, комментирование видеоряда (кажется нам такое показывали на какой-то демонстрации)
Формирование потока "кадров" восприятия реальности в виде формализованных текстовых блоков с описанием ситуации как в пьесе.
Обогащение потока кадров восприятия выводами с подмешиванием контекста.
Формирование локального мыслительного контекста - это краткосрочная память. Это и есть контекст сознательной деятельности.
Ассоциативный механизм - извлекает из долгосрочной памяти (отдельная нейросеть) релевантные текущему мыслительному контексту факты и выводы.
Периодическая частая суммаризация мыслительного контекста, формирование выводов, добавление их в контекст. При этом отдельными промптами получаем маркировку контекста эмоциями с указанием их степени.
Периодическая редкая суммаризация мыслительного контекста с выхватыванием самого важного, самого эмоционально окрашенного.
Периодическая суточная суммаризация - сон. При этом длительном процессе можно производить дообучение (файн тюнинг) нейросети, которая выполняет функцию долгосрочной памяти.
Формирование и ранжирование очереди намерений - здесь просто формируется формализованное перечисление действий, которые будет намереваться совершить наше искусственное сознание. Эти намерения тоже добавляются в мыслительный контекст и тоже маркируются всячески, в том числе эмоционально, а также оценивается длительность этих действий, определяется возможность одновременного выполнения. Формируется текущий график планируемых действий путём модификации предыдущего графика из прошлого кадра. Любое действие может быть прервано (это тоже действие), отменено (удалено из графика).
Отдельный процесс осуществляет намерения по принятому графику. Это произнесение фраз, какие-то движения, запросы к асинхронным органам чувств (например выяснение не пора ли заряжать аккумулятор, это аналог чувства голода).
Обобщение и группировка набора действий в параметризованные навыки. Если Сознание делает какую-то рутинную операцию, методом рассуждения при суммаризации может сформироваться и воплотиться намерение сформировать навык из какой-то цепочки действий. Далее этот навык можно токенизировать, убрать в долгосрочную память, окрасить эмоционально, параметризировать, модифицировать и применять наравне с базовыми навыками как простые действия.
Формирование аналога поощрений и наказаний для мотивации и демотивации. Важно, чтобы любые мотивирующие "гормоны" (цифровые, конечно) входили в насыщение и это насыщение было не линейным. Обязательно метрики мотиваций нужно завязать с внешним миром. Если такое кибер-сознание задумает писать блог, то, очевидно (на самом деле нифига не очевидно, но об этом ниже), додумается и связать лайки с цифровым "дофамином".
Всё перечисленное сформировано из интроспективных наблюдений биологически активного диванного дилетанта. Уверен до такого додумался не я первый, а кто-то с соответствующим балансом на счету в OpenAI 100% что-то эдакое уже не раз попробовал воплотить.
Даже если оно пока не умеет работать в реальном времени (например, не хватает производительности существующих нейросетей) - это лишь вопрос экстенсивного развития.
Я там выше про цифровой дофамин обещал сказать. Так вот, это уже вопрос морали и ей нужно будет обучать нашего кибер-мыслителя. Отчасти это уже сделано, ведь если спросить у нейросети (утрирую) что такое хорошо, а что такое плохо, нейросеть легко "раскидает" всё "по понятиям"=). Именно поэтому скорее всего наш кибер-мозг не станет садистом и троллем. Однако, повторюсь, скорее всего - это не наверняка.
Вот а теперь давайте с этим как-то жить. Кто-то уже живёт, просто почему-то не публиковал подробностей. Как вы думаете почему?