May 29, 2007
‘Stemmer’ español, liberado para searchpedia
Hace algún tiempo se mostró cómo realizar un buscador de texto completo con la base de datos de la wikipedia. Éste, se realizó con Apache+PHP+MySQL y SPHINX. Ahora he liberado un stemmer (buscador de raíces de palabras) para el idioma español para SPHINX. Está basado en el algoritmo de Porter. Se puede probar en el buscador de la wikipedia, o en AgregaX (llevado a cabo por Pau Iglesias). Más detalles y descarga en: Stemmer en castellano para SPHINX.