Что общего между пятой теоремой и застрявшим на орбите нигерийцем?
Начнём с вопроса для офлайн-Что? Где? Когда?, придуманного мною.
Брат африканского космонавта, застрявшего на орбите. Дочь свергнутого президента Конго-Киншасы. Американский разведчик, нашедший золото Саддама Хусейна. Они все разделили между собой одну Шнобелевскую (шуточную Нобелевскую) премию.
В какой отрасли была премия?
Ответ: Литература.
Это всё герои нигерийских писем — им требуется совсем немного ваших денег, чтобы завладеть несметными богатствами. Согласитесь, довольно странная плеяда? А если ещё и почитать письма в оригинале, то получается крайне корявый язык.
Политическая теорема номер пять в одном из частных случаев звучит:
Достаточно задать телефонному спамеру провокационный вопрос, на который идеологический ответ не совпадает с действительным состоянием дел, и он расколется.
Между тем и другим много общего. И это общее чисто экономическое, из старого доброго принципа «время — деньги».
Нигерийские письма
Их изучил с помощью простеньких вероятностных моделей некто Кормак Херли из исследовательского отдела Microsoft. [источник] И вот к чему он пришёл.
Мошенник хочет денег.
Только малая часть жертв отдаёт деньги.
Ручная разработка жертвы отнимает время, много времени.
Потому хотелось бы сделать автоматический классификатор, который говорит: пойдёт жертва на сотрудничество или нет? (Будем говорить: годная ли жертва?)
У бинарного классификатора есть два параметра полноты: вероятность опознать заведомо годного/негодного. Полнота (вероятность опознать заведомо) годного называется чувствительность, полнота негодного — специфичность.
Многие классификаторы могут менять порог срабатывания, увеличивая чувствительность за счёт специфичности и наоборот. Если задача — при неограниченных мощностях заполучить максимум денег, у классификатора есть оптимальный порог срабатывания, зависящий от двух параметров:
базового процента — какой процент годных жертв в генеральной совокупности;
насколько прибыльна удачная разработка по сравнению с расходами на неудачную.
Другими словами: курортный шулер знает прикуп, обыграет любого, и потому может встрять в любую игру на деньги и в ней выиграть. А коммерческий спам вытекает из посылки, что отправка одного сообщения почти бесплатна.
Известная фраза преферансистов: знал бы прикуп — жил бы в Сочи.
И производный анекдот. Табличка в Сочи: «Не играйте с местными — они знают прикуп».
Если и мощности ограничены, нужно поднять другой параметр — точность. Точность определяется так: ну, допустим, классификатор обозвал жертву годной. А какова вероятность, что жертва действительно годна?
И тут существует так называемый…
Парадокс базового процента
Отойдём пока от нигерийского спама и попробуем решить такую задачу.
Один водитель из тысячи — пьяный. У нас есть алкотестер, который пьяного ловит всегда (чувствительность абсолютная), а вот трезвого раз из сотни объявляет пьяным (специфичность 99%). И вот в очереди в больницу стоит сотня таких неудачников, попавшихся на пьяном вождении. Сколько из них будет алкоголиков?
Примерно один из одиннадцати — то есть 9 из сотни!
Другими словами: если базовый процент (вероятность найти годного) чудовищно мал, нужна чудовищная специфичность, чтобы добиться приемлемых цифр точности: скажем, каждый двадцатый разработанный закончился удачей.
Потому хотелось бы автоматический фильтр, который оставляет только самых-самых доверчивых.
Для этого и нужны такие вот невероятные истории и корявый язык. Правда, из этого следует никакая чувствительность: большая часть годных жертв остаётся за бортом.
Телефонный спам
А теперь о спаме.
Спамят такие же люди, как вы — просто их за спам совсем не ловят, а наоборот, поощряют. Им удаётся прикинуться своими просто потому, что они действительно очень похожи на своих — а не из-за какого-то выдающегося актёрского мастерства или шпионской школы языка. Достаточно не говорить ключевых слов вроде «скучаю за тобой», и всё.
Провокационный вопрос означает: жертва подозревает подвох и может соскочить с крючка. И лучшей стратегией в данном случае будет бросить её. Не пытаться выехать на харизме (которой зачастую просто нет), а всего лишь бросить.
В зависимости от настроения повесить трубку, выругаться или рассмеяться вместе с жертвой.
И перейти к новой.