Мой топ Approximated Nearest Neighbors (ANN) либ для поиска соседей по векторам.
Такс други, тут часто заходят с вопросом по поиску на эмбеддингах. Из личного опыта советую:
1. ScaNN, основывается на max dot prod подходе, разработка Google, соответственно требует tf2+
2. FAISS на мой взгляд оптимально по функционалу и сложности освоения. Разработка META.
3. Можно также попробовать Milvus и qdrant, но это уже нечто большее чем просто поиск. Там уже и свои эмбеды можно обучить, к примеру в qdrant, и свою кастом логику.
Бонус.
+ личный ноутбук демонстрации работы SBERT + ANN и другие классик вещи. Код с топ-3 мастер-класса/доклада по мнению зрителей на PyCon2021.
Такс други, тут часто заходят с вопросом по поиску на эмбеддингах. Из личного опыта советую:
1. ScaNN, основывается на max dot prod подходе, разработка Google, соответственно требует tf2+
2. FAISS на мой взгляд оптимально по функционалу и сложности освоения. Разработка META.
3. Можно также попробовать Milvus и qdrant, но это уже нечто большее чем просто поиск. Там уже и свои эмбеды можно обучить, к примеру в qdrant, и свою кастом логику.
Бонус.
+ личный ноутбук демонстрации работы SBERT + ANN и другие классик вещи. Код с топ-3 мастер-класса/доклада по мнению зрителей на PyCon2021.