argentinidad.py
1008 Bytes
import unidecode
def arg(texto):
texto = unidecode.unidecode(texto)#saco acentos
texto = texto.lower()#paso a minuscula
texto = texto.replace("ü","u")#Casi no se usa
texto = texto.replace("ñ","n")#Ignoro las ñ
texto = texto.replace("m","n")#Este deberia ser inesesario
texto = texto.replace("cc","s")#todo c z x es s
texto = texto.replace("rr","r")#vurros > buros
texto = texto.replace("pc","s")#descripcion > dessrision
texto = texto.replace("x","s")#todo c z x es s
texto = texto.replace("ll","y")#olvidate de ll
texto = texto.replace("h","")#nadie usa la h
texto = texto.replace("c","s")#todo c z x es s
texto = texto.replace("z","s")#todo c z x es s
texto = texto.replace("v","b")#Esto si que es al repedo
texto = texto.replace("j","g")#Tema fonetico
texto = texto.replace("w","g")#tmb fonetico
texto = texto.replace(",","")#mejora performance de busqueda
texto = texto.replace(" ","")#mejora performance de db
return(texto)