argentinidad.py 1.23 KB
import unidecode
#ESTO NO DEBERIA EXISTIR LO SE PERO.....
#NO FUNCINA CON HUMANOS EL SISTEMA SINO
#NO PUEDO NORMALIZAR LA LENGUA 
#ES LA PUTA VERDAD
def arg(texto):
    texto = unidecode.unidecode(texto)#saco acentos
    texto = texto.lower()#paso a minuscula
    texto = texto.replace("ü","u")#Casi no se usa
    texto = texto.replace("ñ","n")#Ignoro las ñ
    texto = texto.replace("m","n")#Este deberia ser inesesario
    texto = texto.replace("cc","s")#todo c z x es s
    texto = texto.replace("rr","r")#vurros > buros
    texto = texto.replace("pc","s")#descripcion > dessrision
#    texto = texto.replace("pt","t")#descripcion > dessrision
#    texto = texto.replace("ps","s")#descripcion > dessrision
    texto = texto.replace("x","s")#todo c z x es s
    texto = texto.replace("ll","y")#olvidate de ll
    texto = texto.replace("h","")#nadie usa la h
    texto = texto.replace("c","s")#todo c z x es s
    texto = texto.replace("z","s")#todo c z x es s
    texto = texto.replace("v","b")#Esto si que es al repedo
    texto = texto.replace("j","g")#Tema fonetico
    texto = texto.replace("w","g")#tmb fonetico
    texto = texto.replace(",","")#mejora performance de busqueda
    texto = texto.replace(" ","")#mejora performance de db
    return(texto)