argentinidad.py
1.23 KB
import unidecode
#ESTO NO DEBERIA EXISTIR LO SE PERO.....
#NO FUNCINA CON HUMANOS EL SISTEMA SINO
#NO PUEDO NORMALIZAR LA LENGUA
#ES LA PUTA VERDAD
def arg(texto):
texto = unidecode.unidecode(texto)#saco acentos
texto = texto.lower()#paso a minuscula
texto = texto.replace("ü","u")#Casi no se usa
texto = texto.replace("ñ","n")#Ignoro las ñ
texto = texto.replace("m","n")#Este deberia ser inesesario
texto = texto.replace("cc","s")#todo c z x es s
texto = texto.replace("rr","r")#vurros > buros
texto = texto.replace("pc","s")#descripcion > dessrision
# texto = texto.replace("pt","t")#descripcion > dessrision
# texto = texto.replace("ps","s")#descripcion > dessrision
texto = texto.replace("x","s")#todo c z x es s
texto = texto.replace("ll","y")#olvidate de ll
texto = texto.replace("h","")#nadie usa la h
texto = texto.replace("c","s")#todo c z x es s
texto = texto.replace("z","s")#todo c z x es s
texto = texto.replace("v","b")#Esto si que es al repedo
texto = texto.replace("j","g")#Tema fonetico
texto = texto.replace("w","g")#tmb fonetico
texto = texto.replace(",","")#mejora performance de busqueda
texto = texto.replace(" ","")#mejora performance de db
return(texto)