R Scripts en Power Query: Remover acentos de todos los caracteres acentuados en una columna de texto
- PowerPro Consulting
- 28 ene 2019
- 1 Min. de lectura
Actualizado: 21 feb 2019
Hoy mismo se me presentó el siguiente problema: ¿Cómo remover todos los acentos de caracteres acentuados en una columna de texto en Power BI?
En otras palabras como llegar de A (columna con acentos) a B (misma columna pero sin acentos), de manera automatizada en Power BI.

Solamente me interesa remover los acentos de cada cadena de texto, todo lo demás deber de quedar exactamente igual. Al principio se me ocurrió utilizar alguna función M como TEXT.REPLACE. El gran incoveniente de este enfoque es que tendría que declarar cada uno de los posible caracteres acentuados dentro de la una función diferente. Lo cual va en contra de mi máxima en la vida: SIMPLICIDAD = ELEGANCIA.
Entonces se me ocurrió intentar con un lenguage diferente: R. Desde hace ya tiempo que es posible correr scripts de R dentro de Power Query.
Instrucciones para instalar R en tu computadora y habilitar el complemento en Power BI --> Click aqui.
Una vez realizado el paso anterior, procedemos a ejecutar el siguiente script de R en nuestro editor de consultas:

# 'dataset' holds the input data for this script
library (dplyr) library (stringi)
newcalc <- dataset %>% mutate ( ProductCategoryDescription = stri_trans_general (ProductCategoryDescription, "Latin-ASCII") )
El resultado es el siguiente:

Básicamente lo que hicimos a través de los paquetes dplyr y stringi de R, es tomar una columna existente: ProductCategoryDescription la cual contiene caracteres acentuados y transformándola en una columna con caracteres ASCII exclusivamente, es decir sin acentos.
Comments