Importar datos de otros formatos

Top  Previous  Next

Gandia BarbWin da al usuario la posibilidad de abrir y guardar los ficheros desde /como archivos de tipo ASCII delimitados o no delimitados y de bases de datos como dBase o Paradox. En cualquier caso la forma de elegir estas opciones será desde la opción de menú inicio >> abrir >> seleccionar tipo de archivo, eligiendo en el cuadro desplegable de tipos de archivo la opción deseada.

Abrir / Guardar un fichero ASCII delimitado

Desde la opción de menú <Archivo – Nuevo> se despliega el cuadro de diálogo de Abrir y en la parte inferior del cuadro de diálogo está la lista de tipos de ficheros.

Si elegimos la opción de ficheros tipo texto (extensiones de archivo *.txt, *.doc, *.dat, *.csv) nos aparecerá un cuadro de importación en el que podremos definir las opciones en las que se encuentra el fichero texto a importar. Opciones como si el fichero viene como DOS o viene como Windows, si los campos de texto están entrecomillados o no lo están, opciones sobre cualquier separador que se haya podido utilizar, si el fichero viene con los nombres de las variables o no, etc.

Como podemos observar, en el cuadro están implícitas todas las opciones del fichero texto para poder ser importado. El usuario elige las convenientes y puede, en la rejilla inferior, ver si el fichero va adecuándose bien a la tabla de datos. Esta pequeña tabla de datos, sólo representa los 100 primeros registros que encuentra del fichero a abrir. Una vez abierto el fichero, el programa intenta reconocer las variables abiertas y les asigna tipo y formato, el usuario puede necesitar variar el tipo de variable para alguna de ellas. Están permitidos los cambios que no afecten a la estructura de los datos.

De la misma forma que se puede abrir un fichero de tipo texto, también se puede guardar un fichero para ser utilizado por otros programas. En este caso la opción de menú que se utiliza es <Archivo – Guardar como>. Aconsejamos que se realice una copia del fichero a guardar como texto, en formato Gandia BarbWin (*. gbw del programa), ya que de otra forma el usuario perderá todas las definiciones de códigos, controles, saltos y bases que haya definido.

Para guardar el fichero como texto delimitado volvemos a encontrar el mismo diálogo que en Abrir, dónde el usuario decidirá bajo qué forma quiere guardar el fichero.

Destacar que en esta forma de guardar el fichero, las variables de tipo múltiple, se almacenan en el fichero texto como tantas variables categóricas de tipo lógico y binario (0/1), como códigos definidos por el usuario tiene.

Por ejemplo, si tenemos una variable de tipo múltiple llamada P1, con cuatro códigos definidos 1, 2, 3, 4, y con este formato en Gandia BarbWin:

REGISTRO MÚLTIPLE

1 2;4

2 1;2;3;4

3 2;3

una vez exportada la variable, en el fichero texto encontraríamos:

REGISTRO P1 – 1 P1 – 2 P1 – 3 P1 – 4

1 0 1 0 1

2 1 1 1 1

3 0 1 1 0

es decir figuraría un 1 cuando se cita el ítem correspondiente a la múltiple y un 0 cuando no se cita. El fichero resultante puede ser abierto por cualquier otro programa para seguir realizando análisis de la información que contiene. En cada programa se abrirá según las especificaciones del mismo.

Abrir ficheros Barbro 90 DOS y Catibar

En la lista de tipos de fichero a abrir, figura también el tipo fichero Barbro DOS. Con sólo dar el nombre del fichero de datos Barbro, se importa el fichero y se crea automáticamente la lista de variables. El fichero queda listo para ser trabajado.

En la lista de tipos de fichero a abrir, figura también el tipo fichero Barbro – Catibar. Con sólo dar el nombre del fichero de datos, se importa el fichero y se crea automáticamente la lista de variables. El fichero queda listo para ser trabajado.

Abrir ficheros de texto en columnas (sin delimitador)

En muchas ocasiones disponemos de ficheros ASCII, pero sin ningún tipo de separador entre las variables. El usuario conoce las posiciones o columnas que ocupan cada una de las variables y para proceder a su importación, se debe crear una estructura muy sencilla, que no tiene porque ser del fichero completo, sino sólo aquellas columnas que se deseen leer.

El fichero que contenga los datos deberá tener extensión *. txt y el fichero que contenga la estructura deberá tener extensión *. str. Ambos deben estar en texto plano. En la estructura se definirá:

Nombre de la variable (necesario)
Columnas que ocupa (necesario)
Tipo de variable (necesario)
C si es de categoría
M si es múltiple (se supone que de tipo cadena donde los valores se separan por el separador de listas de Windows)
NM si es numérica métrica
NO si es numérica ordinal
A si es alfanumérica
F si es fecha
H si es hora
Listado de códigos (a partir de la columna 2 del fichero texto)

Tanto fecha como hora deben estar en formato de 10 dígitos y con el separador que utilice Windows para ello. Lo normal es utilizar la / para fechas y el símbolo: para horas.

Por ejemplo si el fichero texto fuera:

10000112/12/198712: 00: 00GLORIA MARQUES 12345

el texto de la estructura sería:

SEXO=1=C

COLORES=2_6=M

FECHA NACIMIENTO=7_16=F

HORA NACIMIENTO=17_25=H

NOMBRE=26_46=A

VALOR =47_51=NM

La estructura BÁSICA correspondiente sería la del cuadro anexo. Sin embargo podríamos complementar esta estructura básica con listados de códigos para que fueran reconocidos por el programa.

SEXO=1=C

Hombre=1

Mujer=2

COLORES=2_6=M

Rojo=1

Verde=2

Amarillo=3

Azul=4

Rosa=5

FECHA NACIMIENTO=7_16=F

HORA NACIMIENTO=17_25=H

NOMBRE=26_46=A

VALOR =47_51=NM

La mejor forma de conocer como funciona esta estructura es guardar cualquiera de los ficheros entregados como prueba con estructura y ver como queda reflejado.

Variables múltiples en *.str

Las múltiples de un fichero texto pueden ser reagrupadas en una sola variable de tipo múltiple en el fichero Gandia BarbWin o pueden ser tratadas de forma individual como si fueran variables dicotómicas.

SEXO=1=C

HOMBRE=1

Mujer=2

ROJO=2=C

Sí=1

No=0

VERDE=3=C

Sí=1

No=0

AMARILLO=4=C

Sí=1

No=0

AZUL=5=C

Sí=1

No=0

ROSA=6=C

Sí=1

No=0

FECHA NACIMIENTO=7_16=F

HORA NACIMIENTO=17_25=H

NOMBRE=26_46=A

VALOR =47_51=NM

En nuestro ejemplo hemos preparado la estructura para que fuera una variable múltiple. Si quisiéramos que fueran de categoría. A la hora de guardar el fichero con estructura, (desde Guardar como...), la pregunta de como guardamos las múltiples, hace referencia a si las podemos guardar como variables de tipo binario o lógico (0/1), o como variables alfanuméricas. Lógicamente si nuestra aspiración es trabajar con el archivo en otro soporte, SPSS, Dbase, Paradox, Access, Fox Pro etc., sería conveniente almacenar las múltiples como variables binarias.

Si modificamos los nombres de las variables que forman la múltiple y lo sustituimos por lo siguiente:

SEXO=1=C

HOMBRE=1

Mujer=2

XX_1=2=C

Sí=1

No=0

XX_2=3=C

Sí=1

No=0

XX_3=4=C

Sí=1

No=0

XX_4=5=C

Sí=1

No=0

XX_5=6=C

Sí=1

No=0

FECHA NACIMIENTO=7_16=F

HORA NACIMIENTO=17_25=H

NOMBRE=26_46=A

VALOR =47_51=NM

El programa automáticamente detectará que el conjunto formado por XX_1 hasta XX_5 forman una múltiple. Detecta esto porque son binarias, tienen una misma raíz común en el nombre, y van correlativas.

Abrir / guardar archivos de base de datos (DBASE, PARADOX, ACCESS)

Denominamos archivos de base de datos a aquellos archivos que provienen de programas gestores de bases de datos. En estos momentos Gandia BarbWin abre automáticamente archivos de Dbase III, Dbase IV y Paradox hasta la versión 7 y Access 95 / 97. Los archivos de base de datos son abiertos y convertidos de forma transparente en archivos de Gandia BarbWin. De la misma forma se pueden guardar como archivos del mismo tipo.

Estos archivos resultantes son archivos de base de datos, pero debemos resaltar algunas peculiaridades derivadas de la posible utilización por parte del usuario de Gandia BarbWin de las variables especiales que el sistema posee. Imaginemos que el usuario de Gandia BarbWin abre un archivo de Dbase dónde tiene unos datos de producción, y una vez en Gandia BarbWin, genera una variable de tipo virtual y una variable múltiple; estas variables no existen directamente en el sistema Dbase o Paradox, ¿qué sucedería a la hora de guardar el archivo?.

Gandia BarbWin no permitirá que se guarde el archivo con el mismo nombre, a no ser que así lo afirme y reitere el usuario por dos veces, siendo advertido del potencial cambio de estructura que puede haber sufrido el archivo (añadir variables nuevas).
Una variable de tipo múltiple en Gandia BarbWin, se desdoblaría en x variables de tipo lógico (0/1), tantas variables como distintos valores pudiera adoptar esa variable múltiple.
Una variable de tipo virtual, se convertiría en un conjunto de variables de tipo lógico (0/1), tantas como condiciones diferentes (líneas de código) tuviera esa variable en Gandia BarbWin.
Una variable de tipo expresión aritmética, se evaluará, calculará y pasara al fichero como una variable numérica más.

Detección de múltiples en importaciones

Cuando importamos la base de datos el sistema puede llegar a reconocer la existencia de variables que para Gandia BarbWin puedan ser tratadas como múltiples. Se solicitará al usuario confirmación, y si ésta es afirmativa, se presenta una tabla en la que se pueden estudiar las binarias que el programa reconoce y elegir aquellas variables a transformar automáticamente. Dos son los criterios que el programa utiliza para el reconocimiento de múltiples en archivos de bases de datos:

Que las variables sean de tipo binario
Que las variables tengan la siguiente estructura de nombre: Nombre de Variable_X.

Por ejemplo las variables P1_1, P1_2, P1_3 Y P1_4 si fueran binarias (0/1) y estuvieran correlativas en el fichero se reconocerían como una variable llamada P1 de tipo múltiple.

Abrir desde ODBC / BDE

Existen dos sistemas comunes para compartir archivos entre distintos programas. Se traspasa la información de variable (nombre) y los datos. Si se disponen de controladores ODBC y BDE, Gandia BarbWin puede abrir archivos con estas conexiones. La interface es muy simple. Se elige el acceso, y se importa el fichero. Consulte los manuales de BDE (Borland) o de ODBC (Microsoft) para ver como se pueden conectar los accesos.

Abrir Excel (XLS)

Permite abrir hojas de cálculo, definiendo un rango de celdas. Sin embargo en ocasiones es necesario abrir desde EXCEL un archivo multihoja (derivado del límite de columnas y filas de EXCEL en una hoja). Para ello se puede optar por el nuevo método de carga, donde se definen qué hojas contienen variables y qué hojas contienen datos.

En este segunda opción, debe desactivarse la selección de rango a importar y debe indicarse mediante el botón clip0551 qué hojas contienen los nombres (cabeceras) de variable.

Para ello, se deben organizar las hojas tomando como modelo la matriz que resultará tras la importación como se puede observar en la imagen, de formas que las hojas de la parte superior contengan los nombres de las variables a crear (y también por supuesto datos) mientras que las inferiores contienen los registros de datos que exceden de 65000.

Se deben identificar cuáles son las hojas que contienen los nombres de las variables y la matriz de hojas ha de ser simétrica para todos los conjuntos de variables en cuanto a número de registros.

clip0549

Abrir SPSS (SAV)

Seleccionar el archivo sav y cargar el mismo utilizando las facilidades que ofrece SPSS Inc para la carga de archivos en su formato. Necesarios disponer de versión 7.2 al meonos de Gandia BarbWin.