En ocasiones, trabajando con SAS, hemos hecho una
transformación arriesgada en nuestros datos y necesitamos comprobar que todo el
dataset o algunas de sus variables siguen teniendo los mismos valores que
antes.
Un sencillo procedimiento para lograrlo es utilizar el
comando “proc compare”, que compara una tabla A con una tabla B, informándonos
de si los datos son idénticos o desiguales. Tras la ejecución del comando
podremos ver detalles como número de variables y número de observaciones de
cada conjunto de datos, entre otros. Pero, sobre todo, obtendremos la relación
de variables con valores comunes y diferentes.
Por defecto, podremos ver una relación de los primeros 50
valores diferentes de ambas tablas. Para anular ese tipo de listado, podemos
colocar la opción “Novalues”.
Para contar en el reporte con el listado de variables no
coincidentes que están en uno de los datasets y no en el otro, podemos utilizar
la opción “Listvar”.
Si lo que necesitamos es comparar sólo los valores de
determinadas variables, utilizamos el subcomando “var” seguido de las variables
que queremos incluir.
proc compare base=a compare=b novalues;
run;
Por último, puede ser útil la posibilidad de comparar dos variables diferentes dentro de un mismo dataset, para comprobar que dos maneras de crear una columna conducen a los mismos resultados. En ese caso usaremos el subcomando “with” seguido de los nombres de las variables que necesitamos contrastar.
No hay comentarios:
Publicar un comentario