Búsqueda de datos para consejos y trucos de mapeo gc digital fellows seguridad social y beneficios por discapacidad

En los talleres de mapeo que ofrecemos, una pregunta recurrente se refiere a dónde obtener los datos. Cada vez que los estudiantes asisten a uno de estos talleres, se les dan todos los conjuntos de datos, por lo que es comprensible que muchos se pregunten de dónde obtienen esta información los instructores. Esto es lo que nos inspiró a desarrollar un nuevo taller este semestre, Encontrar datos para mapear: consejos y trucos. Pero como no todos podrían estar presentes en el taller el 3 de octubre, ahora aprovecho la oportunidad para compartir algunos de los consejos y trucos que analizamos para encontrar datos y hacer mapas para su trabajo académico o pedagógico. En cierto modo, esto será una “precuela” (ya que son tan populares hoy en día) y un complemento a la publicación Intro to Mapping usando QGIS hace algunos años. Lo primero es lo primero: ¿cómo funciona el mapeo?

Cuando creas un mapa, estás haciendo más que solo dibujar límites geográficos y colocar colores que representan algo; estás combinando datos no espaciales con características espaciales. Para hacer esto, vamos a necesitar un software especializado, llamado Sistemas de Información Geográfica (SIG). QGIS es solo una de las muchas opciones disponibles, y mi favorito personal porque es gratis (a diferencia del ArcGIS, también popular), es versátil y es de código abierto. Así que usaré QGIS como base para los ejemplos que se dan en esta publicación, pero tenga en cuenta que esto puede aplicarse a cualquier plataforma o software GIS que decida usar (por ejemplo, para el taller, usamos Carto). En la imagen a continuación, verá cómo es una interfaz gráfica de usuario (GUI) GIS típica.

En SIG, los datos se organizan en capas. Cada capa generalmente tiene vectores (formas) que se representan gráficamente en el espacio, y una tabla de atributos, que muestra la “hoja de cálculo” de todas las diferentes variables (o atributos) que tiene cada elemento (o característica) en la capa. Tenga en cuenta que también puede tener una capa que tenga una tabla de atributos sin vectores asociados o capas de vectores que no tengan atributos. Pero ninguno de ellos es difícilmente útil en el análisis de SIG, y es por eso que le voy a enseñar cómo unir estos dos tipos de datos para que pueda explorar nuevos métodos de análisis en SIG. Los cuatro pasos

Algo que es muy importante antes de comenzar a buscar sus datos es lo que podría haber llamado Paso 0: Planificación. En esta etapa, antes de hacer algo, pregúntate: ¿Qué es lo que quieres hacer? ¿Qué tienes ya? ¿Que te falta? Intente visualizar el producto final: ¿Desea un mapa que lo ayude en su análisis? ¿Desea que sea solo para visualizar y hacer que otros tengan una mejor comprensión de su trabajo? ¿Tal vez ambos? Finalmente, puede querer pensar en la escala: ¿Qué es lo que quiere representar en un mapa? ¿Son los países? ¿Son las ciudades? ¿Se trata de rutas comerciales? ¿O tal vez solo individuos, o ubicaciones de restaurantes? Esto te ayudará a entender lo que tienes que buscar. A partir de aquí, repasemos los posibles escenarios. Escenario 1. Ya tienes los datos, solo te faltan los mapas.

Es posible que ya tenga datos de su investigación o trabajo, probablemente en un formato de hoja de cálculo común como Excel. O bien, lo tienes en software estadístico como SPSS o SAS. En cualquiera de estos casos, es recomendable que convierta sus archivos de datos en archivos de texto de valores separados por comas (archivos CSV, para abreviar). trabajar en la discapacidad de la seguridad social En Excel es tan simple como cambiar el formato “Guardar como …” en el menú desplegable de extensión, mientras que en otro software es posible que tenga que buscar una sección “Exportar datos …” en el menú Archivo. Los archivos CSV son universalmente legibles; La mayoría del software de análisis de datos puede leer estos archivos.

Es posible que tengas una idea de investigación increíble y mucha motivación, pero no sabes por dónde empezar. Por muy desagradable que parezca, tengo que decirlo: Google (o su proveedor de búsqueda favorito, en realidad) es su amigo. En serio, es muy probable que alguien ya haya recopilado algunos / la mayoría / todos los datos que está interesado en analizar, por lo que lo más práctico que puede hacer es buscar palabras clave asociadas a su interés de investigación. Esta persona generalmente puede ser una agencia gubernamental (municipalidades, agencias federales, etc.), que generalmente proporciona datos de forma gratuita. Este es el caso de los datos del Censo, por ejemplo, que es uno de los datos más comúnmente analizados. Otros proveedores de datos típicos son universidades, grupos de investigación, ONG y personas interesadas en el acceso abierto a la información. Como último recurso, también hay empresas del sector privado, agencias consultoras, que pueden ofrecer datos, por un precio. O puede salir al campo y capturar datos de su interés (y tal vez considere compartirlos con sus compañeros de forma gratuita).

Una vez que descargue y descomprima el archivo, notará que hay varios archivos diferentes en la carpeta. Entre ellos se encuentra un archivo readme que explica qué es cada uno de los archivos, o puede inferir qué son de los nombres. Habrá tres archivos csv: uno contiene el conjunto de datos; el otro es un archivo de anotaciones y el último es el archivo de metadatos. Adelante, abre tu conjunto de datos. Se dará cuenta de que todos los nombres de atributos están codificados (HD01_S001, HD01_S002…). Entonces, ¿cómo sabemos cuál es la edad mediana? La respuesta está en el archivo de metadatos. Adelante, ábralo y haga una búsqueda de “mediana de edad”. Debería encontrar dos valores: HD01_S020 y HD02_S020, el primero es el valor real y el último es un porcentaje. Solo necesitamos el valor real, y continuaremos trabajando en esto en el Paso 2, Limpiando los datos.

En cualquiera de los dos escenarios, deberá encontrar un mapa que le ayude a visualizar sus datos. Supongamos que está interesado en analizar los datos del Censo, pero aún no está seguro de en qué escala está interesado, es decir, no sabe en qué formas quiere que se representen sus datos: ¿tal vez a nivel estatal? ¿O a nivel de condado? ¿O bloques? ¿O tratados? Lo mejor que puedes hacer es buscar cuáles son tus opciones. Así que adelante, use su proveedor de búsqueda favorito y escriba “formas de censo”. La primera opción leerá algo como: “Geografía Tiger / LINE – Oficina del Censo de EE. UU.”, Y eso es precisamente lo que estás buscando (¡por eso dije que Google era tu amigo!). Si hace clic allí, podrá ver todas las formas diferentes que ofrece la Oficina del Censo para analizar sus datos. Estas formas se distribuyen en “shapefiles” (extensión .SHP), que es uno de los formatos más comunes para compartir formas vectoriales. Si está buscando algo distinto a los datos del Censo, intente buscar la “palabra clave de su investigación” + shapefile en Google, y vea si surge algo.

Hay dos cosas importantes que vale la pena mencionar de shapefiles. Primero, es que pueden tener algunos datos, pero generalmente están vacíos; Represéntelos como contenedores vacíos en forma de países / condados / tratados / etc. donde puedes verter todos tus datos (guiñar a Olivia). Segundo, son un tipo de archivo común pero antiguo, lo que significa que tienen sus molestias / limitaciones. Vale la pena mencionar: a) nunca vienen solos, pero están (y deben estar siempre) acompañados por varios otros archivos con el mismo nombre pero con diferentes extensiones (.prj, .shx, .dbf, etc.), por lo que ‘ normalmente se comparten como archivos zip (que la mayoría del software GIS puede abrir directamente); y b) los nombres de los atributos están limitados a 10 caracteres, por lo que si uno de sus atributos es “Fecha de finalización estimada”, se truncará a algo como “Estimat ~ 1″, por lo que se recomienda usar códigos como ” EstComplet ”en el ejemplo anterior, o Guardar en un formato diferente. Ahora sabes por qué los conjuntos de datos generalmente usan nombres de atributos codificados, como vimos anteriormente en el archivo del Censo. Paso 2. Limpia tus datos

La limpieza de sus datos es tan importante como encontrar el conjunto de datos adecuado. Si no cuenta con la “higiene de datos” adecuada, corre el riesgo de perderse en sus propios datos o, lo que es peor, que las operaciones espaciales den resultados incorrectos o cambien sus datos. Con respecto a los atributos en su tabla de atributos, una buena regla general que puede aplicar es: si está seguro de que no lo necesita, ¡asegúrese de eliminarlo! En nuestro ejemplo, ya que solo estamos interesados ​​en la Edad media por estado (HD01_S020), podemos eliminar todo lo demás de forma segura, con una excepción. Necesitará mantener otro atributo que identifique sus datos, de modo que sepa qué valor corresponde a qué estados, y así tenga un elemento común entre el conjunto de datos y el shapefile para realizar la unión espacial. El conjunto de datos de ejemplo tiene tres identificadores posibles: GEO.id, GEO.id2 y GEO.display-label. Cualquiera que elija, lo único que debe asegurarse es que el archivo de forma que pretende utilizar como el “contenedor” de sus datos use un identificador que sea compatible con su conjunto de datos. Alternativamente, puedes optar por mantener los tres identificadores en caso de que quieras unirte a otros conjuntos de datos que puedan usar uno u otro identificador.

Una vez que haga clic en Aceptar, debería ver un mapa de los Estados Unidos de América emergente en su ventana de mapa de QGIS. A la izquierda del mapa, verá un cuadro llamado “Capas”, y allí debería ver algo como “tl_2010_us_state10” (el nombre del vector shapefile que acaba de agregar). Si hace clic con el botón derecho en él, aparecerá un menú emergente y podrá abrir la Tabla de atributos. Cuando lo hagas, aparecerá una hoja de cálculo. Estos son los datos en el shapefile. Cada fila está representada por un polígono (o más, en el caso de Hawai, por ejemplo), y al seleccionar una fila también se seleccionarán sus polígonos correspondientes en el mapa. verificación de seguridad social No tenemos un archivo de metadatos disponible para esto, aunque los metadatos están disponibles en el sitio web de Tiger / Line, pero practiquemos qué hacer cuando no lo tiene. Podemos reconocer al menos tres identificadores: Statefp10, Geoid10 y Name10. Si comparas el conjunto de datos y el shapefile, notarás que Geoid10 parece corresponder a Geo.id2, pero usaremos GEO.display-label y su homólogo Name10, descubrirás por qué más adelante. No es importante que los nombres de las características sean diferentes, pero tenga cuidado, los nombres de los estados deben coincidir o la unión saldrá mal. Un error tipográfico hará que Massachusetts sea completamente diferente de Massachusets, reconocido como un estado diferente por el software. Incluso un espacio después de “Alaska” lo hará totalmente diferente de “Alaska”. Puedo confirmar que, en este caso, los nombres coinciden, por lo que no tendrá problemas de combinación, pero tenga esto en cuenta al verificar futuras combinaciones. Paso 3. Unir la base de datos + forma

Ahora que tenemos QGIS con un shapefile abierto y un conjunto de datos CSV limpio que solo contiene una edad mediana y un identificador, es hora de agregar el conjunto de datos a QGIS para realizar la unión. Para hacer esto, haga clic en el botón “Agregar datos” (en el mismo botón que hicimos clic para agregar el vector shapefile), pero esta vez elegiremos los datos de “texto delimitado”. Navegue por su computadora para el CSV clean_data En la opción “definición de geometría”, haga clic en “Sin geometría”, luego haga clic en Agregar. Una vez que lo haga, notará que no ocurre nada en el mapa, pero se agregó una nueva Capa al cuadro de capas. Si hace clic con el botón derecho en esta nueva capa y abre la Tabla de atributos, verá su conjunto de datos.

En este cuadro, la capa clean_data se selecciona como predeterminada para la unión porque no hay otras capas disponibles en su proyecto de QGIS. Aquí tendrá que decirle a QGIS qué característica del conjunto de datos corresponde a qué característica del shapefile. Como dijimos anteriormente, usaremos Geo.display-label y Name10, así que búsquelos en los menús desplegables apropiados. Opcionalmente, puedes elegir qué campos se unirán, solo haré que se una a todo. Luego, puede elegir un prefijo de nombre de campo personalizado, que se agregará a cada nombre de atributo unido. Para evitar abarrotar el espacio de los nombres de las funciones, generalmente elijo tener un prefijo corto, como “” o “a”, “x_” y así sucesivamente. También puede simplemente no poner nada “”, pero no lo recomiendo porque podría perder de vista de dónde proviene un atributo en caso de que tenga que rastrear sus pasos. impuestos sobre los beneficios de la seguridad social Cuando esté listo, haga clic en Aceptar, luego verá aparecer la unión en el cuadro y ahora puede hacer clic en Aceptar para cerrar el cuadro de diálogo de propiedades.

Al igual que en la programación, es muy común que un pequeño error tipográfico o un error en el procedimiento afecte el resto del trabajo, por lo que la verificación es un paso importante en el proceso de unión. Una verificación simple es tomar de dos a tres valores aleatorios en la capa posterior a la unión y asegurarse de que correspondan a los valores del conjunto de datos original. Un problema común es ver que uno o varios atributos muestran “NULL”. Esto tiende a ocurrir cuando los nombres de los atributos de unión no coinciden. Esto es exactamente lo que podría haber ocurrido si eligió hacer la unión utilizando Geoid10 y Geo.id2, porque aunque técnicamente son iguales, tienen un formato diferente: QGIS reconoce Geoid10 como una Cadena (texto), mientras que Excel identificó Geo.id2 como un entero (ver imagen abajo). El problema viene porque cuando Excel interpreta esto como un entero, automáticamente elimina el “0” a la izquierda, que se mantiene en el shapefile, por lo que “01” no corresponde a “1”, y así sucesivamente. Una forma de evitar esta conversión automática es crear un archivo .csvt, que debe estar en la misma carpeta que el archivo csv original (más información sobre cómo crear un archivo csvt aquí).

Si el software que está utilizando no reconoce el archivo que desea abrir, no se asuste. El software como QGIS puede convertir tipos de archivos a prácticamente cualquier otro tipo que pueda leer el software o la aplicación que desee utilizar. Antes de ejecutar un análisis complejo en los conjuntos de datos que tiene, asegúrese de realizar una comprobación en línea rápida. Existe la posibilidad de que alguien haya hecho un análisis similar que puedas usar. No reinventes la rueda. En software como QGIS, las capas con diferentes proyecciones se pueden alinear sobre la marcha. TODAVÍA, podría ser una buena idea reproyectarlos para que todos estén en la misma proyección.