Мой топ Approximated Nearest Neighbors (ANN) либ для поиска соседей по векторам.



Такс други, тут часто заходят с вопросом по поиску на эмбеддингах. Из личного опыта советую:



1. ScaNN, основывается на max dot prod подходе, разработка Google, соответственно требует tf2+



2. FAISS на мой взгляд оптимально по функционалу и сложности освоения. Разработка META.



3. Можно также попробовать Milvus и qdrant, но это уже нечто большее чем просто поиск. Там уже и свои эмбеды можно обучить, к примеру в qdrant, и свою кастом логику.



Бонус.

+ личный ноутбук демонстрации работы SBERT + ANN и другие классик вещи. Код с топ-3 мастер-класса/доклада по мнению зрителей на PyCon2021.