Так вот, еще материалы про то, как люди пытались либо хакнуть алгоритмы дейтинговых приложений, либо сами моделировали CRM-подобные алгоритмы для своих романтических целей:



Первый кейс происходил на OkCupid (запущен, кстати, выпускниками Гарварда). Специфика сайта в том, что вы рандомно выбираете пул вопросов, на которые вы отвечаете, и оцениваете, насколько отношение к какому-то вопросу вам приницпиально в другом человеке (от веры в бога до любви к ужастикам). Проблема в том, что если вы выбрали непопулярные вопросы, ваша совместимость с другими в любом случае будет низкой.



В итоге чел создал алгоритм, чтобы семплировать только те вопросы, которые были важны женщинам, которые ему нравились. Для этого была проскреплена дата с профилей + несколько ботов рандомно отвечали на вопросы, чтобы посмотреть, что на этот же вопрос отвечали женщины. OkCupid этих ботов быстро заблочил, поэтому боты должны были become human. Для этого чел с согласия друга, который тоже сидел на сайте, установил контроль над его компом, боты копировали его поведение с какой-то случайной погрешностью.



Потом данные 20 000 профилей удалось уложить в 7 кластеров, из которых 2 этому челу понравилось. Он создал два акканута – один тюнился под один кластер, второй – под другой. На вопросы он отвечал честно, но алгоритм (адаптивный бустинг) должен был подсказывать ему, насколько "важным" отметить тот или иной вопрос, чтобы понравиться тому или иному кластеру женщин.



По результатам: десятки профилей с совместимостью > 90%, 88 (!) свиданий и long lasting relationship спустя несколько месяцев. И это в районе Сан-Франциско, где вообще мало женщин, и при условии того, что чел получал пхд по математике, а не был программистом с зп 1000$/секунда.



Конечно, к таким ресерчам всегда хочется приделать контрольную группу и посмотреть, что бы было, если бы человек с похожими параметрами не занимался никаким реверс инжинирингом, но все равно интересное чтиво, и статистика по кластерам тоже ничего