Зачем текстовая нейронка писателю? Она сильна в систематизации, поиске связей и кристаллизации идей. Грамотно выстроенные запросы к концепции или тексту могут дать автору очень многое (но никогда не готовый ответ). Я не сторонник называть нейросетки «искусственным интеллектом»; по моему мнению, это программы с крайне гибким интерфейсом. Но чтобы от такой крайней гибкости получить все возможные плюшки, надо научиться в этот интерфейс правильно тыкать. Что посеешь, то и пожнёшь.
Формулирование правильного запроса к нейронке — вопрос ума и опыта, поэтому здесь не об этом. Здесь — техчасть, мимо которой не сумеет пройти ни один пользователь.
Я новичок в использовании нейросеток, зато энциклопедист со стажем, поэтому решила собрать для себя справку, что можно / нельзя и в каком порядке делать. Задача — анализ собственного фантастического романа. Источник информации — расспросы нейронки DeepSeek (как наиболее умной из опробованных бесплатных). После того, как нейронка в середине разговора вдруг выдала про некоторые критически важные моменты работы, я поняла, что такое нельзя держать в голове, и записала к себе в локальный справочник-обо-всём. Текст ниже — это статья из моего справочника. Пикабу сам подхватил оригинальную разметку, за что ему отдельное спасибо.
Основные принципы и понятия:
Чат — это переписка пользователя с нейронкой в одном окне диалога. Содержит посты-запросы от пользователя, ответы нейронки и прикреплённые файлы; всё это хранится, пока пользователь не решит удалить чат. Чаты можно переименовывать, но нельзя группировать по папкам или иначе; они расположены только по хронологии.
Сессия — это оперативная память нейронки по конкретному чату. В рамках сессии хранятся заданные пользователем правила для работы, содержание предыдущих сообщений в чате, контекстная связь с прикреплёнными файлами.
Сессия теряется, если 1) пользователь закрывает приложение DeepSeek или вкладку в браузере, даже если потом быстро возвращается обратно, 2) в чате нет активности ~15-30 минут, 3) происходит технический сбой (перезагрузка веб-страницы, потеря интернета). Даже в пределах одной сессии при огромных объёмах текста (десятки сообщений) контекст может «переполняться».
Ценность для писателя имеет кнопка DeepThink (модели R1), которая включается слева снизу поля ввода поста. Тогда перед выдачей ответа нейронка выдаст своё размышление. Порой размышления оказываются не менее интересными и информативными, чем сами ответы. Иногда даже более. Упоминание в размышлении неучтённых в ответе деталей позволяет погуглить, вспомнить или сформулировать словами то, что всё никак не формулировалось. Ещё это размышление помогает правильнее написать следующий запрос. Или помогает понять собственную мотивацию пользователя.
Анализ крупных художественных текстов
Что можно делать с помощью DeepSeek при анализе художественного текста:
Анализировать сюжет, персонажей, стилистику.
Искать противоречия и логические ошибки.
Извлечь ключевые факты, составить статистику.
Делать всё вышеперечисленное с акцентом на конкретную аудиторию, жанр и пр.; от лица специалиста того или иного направления (литературного критика, лингвиста, психолога, эксперта по теме, художественного редактора).
DeepSeek имеет ограничение на количество символов в одном посте (включая вложенные файлы) — 128 тыс. символов с пробелами. При этом сложные запросы на анализ сокращают эффективно обрабатываемый объём текста. Однако можно разбить крупный текст на части (например, главы) и отправлять по частям. DeepSeek позитивно оценил размер главы <30 тыс. знаков с пробелами.
Текст можно прислать в основном поле запроса (хорошо для маленьких текстов) или вложенным файлом.
DeepSeek не читает .odt, но читает .txt и .docx. В чистом .docx способен распознать применение курсива, но не его назначение автором текста. (Курсив может быть просто украшательством, не имеющим никакой ценности для анализа.) Также может вычленить текст из PDF, основных форматов картинок и ещё из пары источников, но качество выделения текста зависит от формата и ясности материала (из мутной картинки распознает с косяками). Кроме того, в этом случае потеряется форматирование.
Предпочтительнее для анализа текста подавать ему .txt с заранее определённой разметкой символами (о которой его необходимо уведомить в начале чата). Если курсив используется для разных задач (одновременно и для акцента в речи персонажа и для выделения записи иноязычного слова / спецтермина), то ему должна быть придана разная разметка, чтобы не путать одно с другим.
Подготовка к анализу
Единомоментно получить анализ целого романа не выйдет из-за лимита символов. DeepSeek сможет анализировать его только по частям, а общий вывод предлагает составить своей головой. Можно скормить ему его же выводы по главам в качестве входных данных, чтобы он составил общий вывод. Но в этом случае могут начаться галлюцинации, поскольку нейронка потеряет контекст (особенно если это новый чат) — она будет опираться только на свои выводы, а не на текст.
Для нейронки крайне необходима предварительная техническая справка об анализируемом тексте. Знание ею контекста напрямую влияет на качество анализа. Заданные рамки и условия критически влияют на результат. Необходимо указать:
Жанр. От жанра нейронка будет отталкиваться при оценке различных деталей текста (тона текста, терминологии, достоверности и отсылок).
Для сложных или гибридных жанров можно отдельным чатом попросить DeepSeek найти подходящее краткое описание. Например, я использовала такой промпт: «Действуй как литературный критик. Укажи, как можно классифицировать (кратко описать жанр) крупный художественный текст в жанре [основной жанр], сочетающий элементы [доп.жанр1] и [доп.жанр2] с ключевыми условиями: 1) [важнейшие детали сеттинга], 2) [важнейшее свойство, ради которого роман вообще возник]».
Сеттинг: где и когда. Позволит нейронке опознать анахронизмы и прочие ошибки.
Аннотация. Помогает выделить ключевые темы, конфликты, цели текста. Но для этого аннотация сама должна их достаточно чётко показывать.
Из-за нюанса с сессиями анализ крупного произведения должен пройти отдельным непрерывным событием. В нём нельзя допускать долгих пауз, весь текст должен быть последовательно передан в течение одной сессии. Поэтому к анализу надо подготовиться заранее: 1) ясно прописать правила, сохранив их куда-нибудь к себе для повторного использования в случае сброса сессии, 2) подготовить поглавно весь текст, проверить, что разметка соответствует указанной в правилах.
Основная работа
Первый пост должен содержать:
Предварительную техническую справку. «Это техническая справка для всего текста. Сохрани её для анализа последующих глав: [справка]».
Правила анализа текста. Должны чётко прописывать, на какие аспекты смотреть, что игнорировать, а также как считывать форматирование текста, если есть. Это глобальные правила, применяемые ко всему тексту.
Указание, что «текст будет последовательно присылаться в виде вложенных файлов .txt, по одной главе на пост».
Первый пост и его правила задаёт «конституцию» для всего анализа. Однако можно добавлять новые правила и позже (нужно только чётко обозначать, что это дополнение). Если новые правила противоречат более ранним, более ранние надо явным образом отменять.
В последующих постах должно быть однострочное указание типа «жанр X, глава Y» и вложенный файл главы на анализ. Дублировать полную тех.справку и правила не нужно (это только напрасно съест лимит символов). Можно задать локальные (для одной главы) правила, например, с игнорированием конкретного диалога или другой интерпретацией форматирования.
Нейронка уточняет, что «забывает» предыдущие главы между запросами, и предлагает для связности анализа: ключевые выводы из прошлых частей можно кратко вставлять в новые запросы. Также предлагает кратко напоминать контекст (жанр, сеттинг) в случае особой необходимости для анализа.
Пример1: «Это глава 3 романа Х. Контекст: [2-3 предложения о предыдущих событиях]».
Пример2: «(Контекст: Фэнтези-сага, мир Элизиум. Глава 5. _Выделения_ = магические термины)
Текст главы… _Аэндор_ вздрогнул, ощущая _лартиум_ в крови…»
Пример3: «Жанр: детектив (правила из гл.1)»
Восстановление сессии
Непрерывность контекста критически важна для анализа крупного художественного произведения. Как только сессия прерывается, DeepSeek забывает все установленные правила и контекст предыдущих глав.
Обрыв может произойти при обновлении страницы в браузере (F5 или Ctrl+R), очистке кэша, закрытии браузера, энергосберегающем режиме, отправляющем вкладки в сон, или если мигнул свет и компьютер перезагрузился. Если пользователь вернулся к анализу своего текста через день, сессия наверняка уже будет другой.
Нейронка не имеет технической возможности самостоятельно проверить, сохраняется ли предыдущая сессия. Для пользователя это тоже не очевидно с первого взгляда. Чат — не сессия; в чате может ничего не измениться. Однако при обрыве сессии в своих новых ответах DeepSeek действует уже не по установленным правилам, а как Бог БД на душу положит. Он начинает игнорировать заданные правила, не упоминает предыдущие рассмотренные главы или прямо просит повторить контекст.
Возможными визуальными (интерфейсными) признаками потери сессии DeepSeek называет: 1) исчезновение истории чата, 2) исчезновение кнопки «Продолжить» на недогенерённых ответах, 3) отображение ранее прикреплённых файлов как новых, не просмотренных и без контекста.
Для проверки активности сессии DeepSeek предлагает сделать ему тест-запрос на контекст. Если сессия жива, он всё процитирует чётко, если мертва, то попросит прислать данные заново или даст общий ответ. Пример теста:
[Проверка контекста]
Кратко резюмируй:
1. Жанр и сеттинг произведения из правил.
2. Событие из последней проанализированной главы.
3. Значение символа _подчёркивания_ в тексте.
Также предлагается вставить в начало чата, в самый первый запрос, идентификатор сессии (например: «[Сессия: Роман-2024. Глава 1. ID: #A7F3]»). Затем, при сомнениях в сохранении контекста, делается запрос с этим идентификатором (например: «Сохраняется ли сессия #A7F3? Если да, проанализируй главу 2 с учётом прошлого контекста»).
При рестарте анализа нужно дать правила заново.
Пример1: «[Правила из первой сессии]
Жанр: фэнтези, _выделение_ = магия. Контекст: В гл.4 герой нашёл артефакт.
Текст главы 5…»
Пример2: «Сессия прервалась. Правила и контекст выше актуальны. Продолжаем анализ главы N».
Пример безопасной работы, по мнению DeepSeek (с текстом внутри самого запроса, а не вложенным файлом):
// День 1, сессия 1
Вы: [Глобальные правила + Глава 1]
Я: Анализ гл.1…
// День 2, сессия 2 (прерывание)
Вы:
[ПОВТОР ПРАВИЛ] Жанр: детектив, *курсив* = ложь.
[КОНТЕКСТ] В гл.1 убийство в библиотеке.
[Глава 2]
Текст… *Он бледнел*…
DeepSeek рекомендует хранить правила в отдельном файле на компьютере для быстрого возобновления работы. Это также понадобится при старте другого анализа (этого же текста, его с исправлениями, другого текста и пр.).
Также он советует копировать содержимое чата в локальный файл после каждого сеанса работы. Смысл этого не совсем ясен, поскольку старые чаты спокойно хранятся и их можно просматривать. Но, возможно, имеется в виду работа в режиме инкогнито.
Наверняка для качественного анализа собственного произведения понадобится не один прогон. Потому что аппетит приходит во время еды правильно формулировать запрос — сложное искусство. А промежуточные выводы по главам могут заставить мысль идти в совершенно другом русле. Эта справка — не истина в последней инстанции, а только разбор ответов нейросетки насчёт работы с ней самой. Я писала это точно так же, как разбираю фантастические произведения на термины для Энциклопедического словаря фантастики. В конкретном чате DeepSeek рассматривались конкретные вопросы под крупную форму. Приветствуются комментарии с практическим опытом и предложения, как ещё можно использовать нейронку для писательских нужд (кроме прямой генерации текста).