Alexander Rubin написал в блоге Percona статью о том, как можно увеличить производительность обработки запросов MySQL более чем в 10 раз с помощью Apache Spark. Внутри много примеров кода и бенчмарков.
http://amp.gs/8DBj
http://amp.gs/8DBj