Провёл небольшое исследование killpls.me. Выкачал около 30 тыс. постов с Главной. Изучил теги, лайки, динамику и сезонность публикаций, содержание текстов.
Весна – самое депрессивное время года
Ресурс был наиболее популярен в 2010-2013 гг. Затем количество публикаций стало плавно сокращаться, а количество лайков (вовлечённость читателей) в 2014 г. рухнуло и продолжает падать.
Динамика постов имеет ярко выраженную сезонность. На май приходится наибольшее количество жалоб, в январе-феврале наблюдается спад активности.
Деньги и Здоровье стали важнее, чем Секс и Внешность
Соотношение тегов и лайков со временем меняется. Десять лет назад больше всего волновали секс, внешность, отношения. Постепенно фокус сместился на семью, здоровье, родителей, деньги. Скорее всего, это связано с повзрослением аудитории сайта.
Повесть о Ромео и Джульетте не самая печальная
В 2021 году наиболее волнующие по совокупности темы: 1. деньги/техника (техника тоже про деньги: кредитные айфоны, разбитые машины, сломанные бытовые приборы и невозможность купить новые); 2. семья/родители; 3. здоровье.
Самые частотные теги и самый залайканные не всегда совпадают. Например, Отношения неизменно находятся на первом месте по количеству публикаций, но никогда не были в топе по лайкам. То есть подобные посты сочувствия у читателей обычно не вызывают.
Краткий пересказ содержания
Чтобы лучше понять, о чём всё-таки истории, я взял предобученную нейронную сеть от Гугла (universal-sentence-encoder-multilingual), векторизовал тексты и поделил их на кластеры (Kmeans). Всего получилось 6 тем.
К каждой группе применил простой алгоритм экстрактивной суммаризации: взвесил все предложения по количеству самых популярных значимых слов и выбрал с наибольшим весом, наиболее типичные для каждой группы.
1. Отношения
До этого жили вместе 5 лет, а знаем друг друга всю жизнь. И все это время у него есть девушка, они вместе уже 7 лет. Мужу боюсь сказать, это его лучший друг с 12 лет. Мне кажется это он все подстроил. И при этом я хотела бы всю жизнь провести с ними вместе… КМП.
И тут я понял, почему истории об отношениях вызывают меньше всего сочувствия. Сплошная обыденность.
2. Работа
Работаю с 17 лет, и всю жизнь с работой не везёт. Идёт третий год, как я работаю на нелюбимой работе. В принципе все это проходящее, но че-то так устала - КМП. Все это время пыталась найти более серьезную работу - везде отказ. 2020 год, апрель, осталась без работы, денег, все как всегда. При всем при этом - мне только 20 лет. Ни работы, ни дома, не парня, ни денег…
Сначала работа была адом, а потом уволили.
3. Здоровье
Скоро Новый Год, а все, что я хочу - это вылечиться. КМП, я просто хочу жить как все. 26 лет - это очень много, если человек постоянно болеет. Толком не ем, все что делаю - это просто сплю. Больше всего боюсь, что это в будущем может передаться моим детям. КМП, пока это не сделали врачи.
О долгих, часто хронических заболеваниях, когда сил терпеть уже не осталось.
4. Семья
Я очень хочу детей, с мужем пытались больше 5 лет и всё никак. Я давно хочу детей, муж об этом знал еще до свадьбы. Я всегда хотела жить в большом городе, и мой будущий муж это знал. КМП, я просто не могу понять, за что мне это и как жить дальше. КМП, я думала, это была наша мечта.
Самый сложный по структуре кластер. Большое количество проблем связано с детьми. Но в основном истории об обманутых ожиданиях.
5. Разное
В общем, я устала от этого, хочу нормально жить, ПМП. Я не понимаю, зачем я всё это делаю, ПМП. КМП - я очень так конкретно чего-то не понимаю в этом мире. ПМП, я не знаю, как с этим справиться. Но это еще не КМП. Это еще не КМП. Но это еще не КМП, нет.
Действительно, об очень разном, общее – КМП.
6. Секс
18+
Прямо с Главной невозможно скачать тексты этой тематики, а персонально ходить по каждой ссылке я посчитал нецелесообразным.
Большинство самых типичных историй написано девушками. Есть у меня некоторые предположения об основной аудитории этого сайта, но специально не проверял.
Ради эксперимента попытался ужать вообще весь контент до одной фразы – с помощью кастомной нейронной сети на основе трансформеров – идея сомнительная, но результат получился адекватный:
КМП. Я живу.
Возможно, когда всё-таки появится полноценный искусственный разум, это будут его первые и последние слова.
Ссылка на данные