Dado que no ha dado los detalles de la pregunta. Permítame asumir algunos escenarios: puede estar interesado en construir cada parte del motor de búsqueda por su cuenta, como indexador, rastreador, buscador, etc., o puede estar interesado en usar bibliotecas de terceros para indexar y buscar.
Entonces, si piensa en el primer escenario, debe elegir Python. Como será mucho más fácil para usted escribir API de rastreo, indexación y búsqueda. Pero esto llevará su propio tiempo y agregar todas las funciones de búsqueda existentes llevará mucho tiempo.
Y si piensa en el segundo escenario, entonces debería elegir Java. Como la mejor biblioteca de código abierto para construir su propio sistema de recuperación de información, Lucene está escrito en Java.
Dos de mi paquete favorito Elasticsearch, Solr, todos escritos en Java y desarrollados sobre Lucene. También hay pyLucene – Lucene para Python. Pero esta no es la versión de desarrollo principal de Core Lucene. Por lo tanto, extrañará algunas características, en algún momento que están allí en el núcleo de Lucene.
Consulte si desea ir con la segunda opción:
Apache Lucene Core
Apache Lucene – Apache Solr
Código abierto distribuido en tiempo real de búsqueda y análisis | Elasticsearch
- ¿Cuáles son las mejores prácticas publicitarias para una aplicación de forma gratuita?
- ¿Qué empresas de desarrollo de aplicaciones móviles (Android, iOS y Windows) son las mejores, confiables y más baratas para el desarrollo de productos de inicio en Ahmedabad?
- ¿Cuál es el mejor curso de pre-medicina?
- ¿Qué combo de CSS framework / JS es el mejor y más rápido para desarrollar un sitio web móvil?
- ¿Cuál es el mejor conector electrónico jamás inventado?
Contáctame si necesitas más ayuda.
Gracias