Mais

Como posso associar uma área de polígono consistente a um conjunto de atributos usando uma topologia?

Como posso associar uma área de polígono consistente a um conjunto de atributos usando uma topologia?


Considere a seguinte topologia.

SELECT CreateTopology ('topotestschema', 0, 0,01); CREATE TABLE topotest (id SERIAL PRIMARY KEY, data TEXT); SELECT AddTopoGeometryColumn ('topotestschema', 'public', 'topotest', 'topogeom', 'polygon'); INSERT INTO topotest (data, topogeom) VALUES ('outer', toTopoGeom ('POLYGON ((0 0,0 10,10 10,10 0,0 0))' :: geometria, 'topotestschema', 1, 0,01)) ;

Quando olhamos para o que está na topologia:

SELECT *, ST_AsText (topogeom :: geometry) FROM topotest;

Nós temos

╔════╦═══════╦═══════════╦════════════════════════ ═══════════════════╗ ║ id ║ data ║ topogeom ║ st_astext ║ ╠════╬═══════╬═══════ ════╬═══════════════════════════════════════════╣ ║ 1 ║ externo ║ (3,1,1,3) ║ MULTIPOLÍGONO (((0 0,0 10,10 10,10 0,0 0))) ║ ╚════╩═══════╩ ═══════════╩══════════════════════════════════════ ═════╝

Mas isso muda quando adiciono mais formas:

INSERT INTO topotest (data, topogeom) VALUES ('right', toTopoGeom ('POLYGON ((9 1,11 1,11 9,9 9,9 1))' :: geometria, 'topotestschema', 1, 0,01)) , ('interno', toTopoGeom ('POLYGON ((3 3,3 7,7 7,7 3,3 3))' :: geometria, 'topotestschema', 1, 0,01));

Agora a camada é:

╔════╦═══════╦═══════════╦════════════════════════ ══════════════════════════════╗ ║ id ║ data ║ topogeom ║ st_astext ║ ╠════╬════ ═══╬═══════════╬══════════════════════════════════ ════════════════════╣ ║ 1 ║ externo ║ (3,1,1,3) ║ MULTIPOLYGON (((10 9,10 1,10 0,0 0,0 10,10 10,10 9))) ║ ║ 2 ║ direito ║ (3,1,2,3) ║ MULTIPOLÍGONO (((10 9,11 9,11 1,10 1,9 1,9 9 , 10 9))) ║ ║ 3 ║ interno ║ (3,1,3,3) ║ MULTIPOLYGON (((3 3,3 7,7 7,7 3,3 3))) ║ ╚════╩ ═══════╩═══════════╩══════════════════════════════ ════════════════════════╝

Como posso evitar que ele modifique o polígono associado às linhas existentes ao adicionar novas?

Sinta-se à vontade para dizer algo se parecer que estou no caminho totalmente errado aqui. Basicamente, estou experimentando uma topologia e tentando descobrir se ela é útil para o que estou fazendo.


ARMAZENAMENTO DE OBJETOS ESPACIAIS COMPLEXOS

Burrough, P.A., 1986. Princípios de Sistemas de Informação Geográfica para Avaliação de Recursos Terrestres, Clarendon Press, Oxford. Veja o Capítulo 2.

Haralick, R.M., 1980. "A Spatial Data Structure for Geographic Information Systems", em H. Freeman e G.G. Pieroni, eds., Processamento de dados do mapa, Academic Press, New York.

Peuker, T.K. e N. Chrisman, 1975. "Geographic Data Structures", Cartógrafo americano 2(1):55-69.

van Roessel, J.W. e E.A. Fosnight, 1984. "Uma abordagem relacional para conversão de estrutura de dados vetoriais", Procedimentos, Simpósio Internacional sobre Manuseio de Dados Espaciais, Zurique, pp. 78-95.

1. Faça uma lista dos tipos de relações que podem existir entre pares de objetos espaciais, para cada par de pontos, linhas e áreas, por ex. ponto a ponto, ponto a linha, área a ponto etc. Existem exemplos de relações entre triplos de objetos, por ex. ponto-ponto-ponto?

2. A indústria GIS tem tradicionalmente fornecido modelos de dados que assumem que dentro de qualquer camada do banco de dados, os objetos poligonais não se sobrepõem e esgotam o espaço disponível. Comente até que ponto essa suposição tem limitado a aplicação de bancos de dados GIS em áreas específicas. Eles são suficientemente significativos para garantir uma mudança nos modelos de dados no futuro?

3. Discuta as áreas de aplicação nas quais o conceito de um tipo de recurso complexo seria útil. Quais operações você deseja executar em recursos complexos e simples, respectivamente?


Palavras-chave

Palavras-chave do tema

Thesaurus Palavra-chave
Palavras-chave científicas do Global Change Master Directory (GCMD) Ciências da Terra & gt Dimensões Humanas & gt Impactos Ambientais & gt Derramamentos de óleo
Categoria de tópico ISO 19115 Biota
Categoria de tópico ISO 19115 meio Ambiente
Nenhum Recursos costeiros
Nenhum Gestão da Zona Costeira
Nenhum Monitoramento ambiental
Nenhum ESI
Nenhum Recursos de uso humano
Nenhum Áreas administradas
Nenhum Áreas de gestão
Nenhum Planejamento de derramamento de óleo
Nenhum Mapas de sensibilidade
Nenhum Recursos socioeconômicos

Palavras-chave Espaciais

Thesaurus Palavra-chave
Palavras-chave de localização do Global Change Master Directory (GCMD) Continente & gt América do Norte & gt Estados Unidos da América & gt Maine
Palavras-chave de localização do Global Change Master Directory (GCMD) Continente & gt América do Norte & gt Estados Unidos da América & gt New Hampshire

Idiomas do conjunto de dados Inglês (ESTADOS UNIDOS) Conjunto de caracteres do conjunto de dados utf8 - Formato de transferência UCS de 8 bits

Status concluído Vetor de tipo de representação espacial

Informações complementares * Ambiente de processamento Microsoft Windows 7 Versão 6.1 (Build 7601) Service Pack 1 Esri ArcGIS 10.2.2.3552

Créditos propriedades do item ArcGIS * Nome GISVIEW.MEIFW.Twwh * Local Server = sql-gisview-prod.som.w2k.state.me.us Service = sde: sqlserver: sql-gisview-prod.som.w2k.state.me. us, 1633 Database = GISVIEW User = meifw Version = dbo.DEFAULT * Protocolo de acesso Conexão ArcSDE


Estruturas de modelos de dados vetoriais

Os modelos de dados vetoriais podem ser estruturados de muitas maneiras diferentes. Examinaremos duas das estruturas de dados mais comuns aqui. A estrutura de dados vetoriais mais simples é chamada de modelo de dados espaguete (Dangermond 1982) .Dangermond, J. 1982. & ldquoA Classification of Software Components Commonly Used in Geographic Information Systems. & Rdquo In Proceedings of the U.S.-Australia Workshop on the Design and Implementation of Computer-Based Geographic Information Systems, 70 & ndash91. Honolulu, HI. No modelo espaguete, cada recurso de ponto, linha e / ou polígono é representado como uma sequência de pares de coordenadas X, Y (ou como um único par de coordenadas X, Y no caso de uma imagem vetorial com um único ponto) sem estrutura inerente (Figura 4.9 & quotSpaghetti Data Model & quot). Pode-se imaginar que cada linha neste modelo seja um único fio de espaguete que é formado em formas complexas pela adição de mais e mais fios de espaguete. É notável que neste modelo, quaisquer polígonos adjacentes um ao outro devem ser constituídos por suas próprias linhas, ou suportes de espaguete. Em outras palavras, cada polígono deve ser definido exclusivamente por seu próprio conjunto de pares de coordenadas X, Y, mesmo se os polígonos adjacentes compartilham exatamente as mesmas informações de limite. Isso cria algumas redundâncias no modelo de dados e, portanto, reduz a eficiência.

Figura 4.9 Modelo de Dados Spaghetti

Apesar das designações de localização associadas a cada linha ou fio de espaguete, as relações espaciais não são explicitamente codificadas no modelo de espaguete, mas estão implícitas em sua localização. Isso resulta em uma falta de informações topológicas, o que é problemático se o usuário tentar fazer medições ou análises. Os requisitos computacionais, portanto, são muito elevados se quaisquer técnicas analíticas avançadas forem empregadas em arquivos vetoriais estruturados dessa forma. No entanto, a estrutura simples do modelo de dados spaghetti permite a reprodução eficiente de mapas e gráficos, pois essas informações topológicas são desnecessárias para plotagem e impressão.

Em contraste com o modelo de dados espaguete, o modelo de dados topológicos é caracterizado pela inclusão de informações topológicas no conjunto de dados, como o nome indica. Topologia é um conjunto de regras que modelam as relações entre pontos, linhas e polígonos vizinhos e determina como eles compartilham a geometria. Por exemplo, considere dois polígonos adjacentes. No modelo espaguete, o limite compartilhado de dois polígonos vizinhos é definido como duas linhas idênticas e separadas. A inclusão da topologia no modelo de dados permite que uma única linha represente esse limite compartilhado com uma referência explícita para denotar qual lado da linha pertence a qual polígono. A topologia também se preocupa com a preservação das propriedades espaciais quando as formas são dobradas, alongadas ou colocadas sob transformações geométricas semelhantes, o que permite uma projeção e reprojeção mais eficiente de arquivos de mapa.

Três preceitos topológicos básicos que são necessários para entender o modelo de dados topológicos são descritos aqui. Primeiro, conectividade descreve a topologia de nó de arco para o conjunto de dados de recursos. Conforme discutido anteriormente, os nós são mais do que simples pontos. No modelo de dados topológicos, os nós são os pontos de interseção onde dois ou mais arcos se encontram. No caso da topologia de nó de arco, os arcos têm tanto um nó de origem (isto é, nó inicial) indicando onde o arco começa e um nó final (isto é, nó final) indicando onde o arco termina (Figura 4.10 & quot Topologia de nó arco & quot ) Além disso, entre cada par de nós há um segmento de linha, às vezes chamado de link, que tem seu próprio número de identificação e faz referência a ambos, de nó e nó. Na Figura 4.10 & quot Topologia de nó-arco & quot, os arcos 1, 2 e 3 se cruzam porque compartilham o nó 11. Portanto, o computador pode determinar que é possível mover ao longo do arco 1 e virar para o arco 3, enquanto não é possível mova do arco 1 para o arco 5, pois eles não compartilham um nó comum.

Figura 4.10 Topologia de Arc-Node

O segundo preceito topológico básico é definição de área. A definição de área afirma que um arco que se conecta para circundar uma área define um polígono, também chamado de topologia de arco poligonal. No caso da topologia de arco poligonal, os arcos são usados ​​para construir polígonos, e cada arco é armazenado apenas uma vez (Figura 4.11 & quotPolígono-Arco Topologia & quot). Isso resulta em uma redução na quantidade de dados armazenados e garante que os limites do polígono adjacentes não se sobreponham. Na Figura 4.11 "Topologia do polígono-arco", a topologia do polígono-arco deixa claro que o polígono F é feito dos arcos 8, 9 e 10.

Figura 4.11 Topologia Polygon-Arc

Contiguidade, o terceiro preceito topológico, é baseado no conceito de que os polígonos que compartilham uma fronteira são considerados adjacentes. Especificamente, a topologia do polígono requer que todos os arcos em um polígono tenham uma direção (um de nó e um nó), o que permite que a informação de adjacência seja determinada (Figura 4.12 & quotPolígono Topologia & quot). Os polígonos que compartilham um arco são considerados adjacentes ou contíguos e, portanto, os lados & ldquoleft & rdquo e & ldquoright & rdquo de cada arco podem ser definidos. Essas informações do polígono esquerdo e direito são armazenadas explicitamente nas informações de atributo do modelo de dados topológicos. O & ldquouniverse polygon & rdquo é um componente essencial da topologia do polígono que representa a área externa localizada fora da área de estudo. A Figura 4.12 & quotPolígono Topologia & quot mostra que o arco 6 é limitado à esquerda pelo polígono B e à direita pelo polígono C. O polígono A, o polígono do universo, está à esquerda dos arcos 1, 2 e 3.

Figura 4.12 Topologia do polígono

A topologia permite que o computador determine e analise rapidamente as relações espaciais de todos os recursos incluídos. Além disso, as informações topológicas são importantes porque permitem a detecção de erros eficiente em um conjunto de dados vetoriais. No caso de feições de polígonos, polígonos abertos ou não fechados, que ocorrem quando um arco não volta completamente sobre si mesmo, e polígonos não rotulados, que ocorrem quando uma área não contém nenhuma informação de atributo, violam as regras de topologia de arco de polígono. Outro erro topológico encontrado com recursos de polígono é o lasca. As lascas ocorrem quando o limite compartilhado de dois polígonos não se encontram exatamente (Figura 4.13 & quot Erros topológicos comuns & quot).

No caso de recursos de linha, erros topológicos ocorrem quando duas linhas não se encontram perfeitamente em um nó. Esse erro é chamado de & ldquoundershoot & rdquo quando as linhas não se estendem o suficiente para se encontrarem e de & ldquoovershoot & rdquo quando a linha se estende além do recurso ao qual deve se conectar (Figura 4.13 & quotErros topológicos comuns & quot). O resultado de overshoots e undershoots é um & ldquodangling node & rdquo no final da linha. No entanto, nós pendentes são sempre um erro, pois ocorrem no caso de ruas sem saída em um mapa rodoviário.

Figura 4.13 Erros topológicos comuns

Muitos tipos de análise espacial requerem o grau de organização oferecido por modelos de dados topologicamente explícitos. Em particular, a análise de rede (por exemplo, encontrar a melhor rota de um local para outro) e medição (por exemplo, encontrar o comprimento de um segmento de rio) depende muito do conceito de para e de nós e usa essas informações, juntamente com informações de atributos, para calcular distâncias, rotas mais curtas, rotas mais rápidas e assim por diante. A topologia também permite análises sofisticadas de vizinhança, como determinação de adjacência, agrupamento, vizinhos mais próximos e assim por diante.

Agora que os conceitos básicos de topologia foram delineados, podemos começar a entender melhor o modelo de dados topológicos. Neste modelo, o nó atua como mais do que um simples ponto ao longo de uma linha ou polígono. O nó representa o ponto de intersecção de dois ou mais arcos. Os arcos podem ou não ser inseridos em polígonos. Independentemente disso, todos os nós, arcos e polígonos são numerados individualmente. Essa numeração permite uma referência rápida e fácil dentro do modelo de dados.


Como posso associar uma área de polígono consistente a um conjunto de atributos usando uma topologia? - Sistemas de Informação Geográfica

UNIDADE 30 - ARMAZENAMENTO DE OBJETOS COMPLEXOS

Compilado com a assistência de David H. Douglas, Universidade de Ottawa

UNIDADE 30 - ARMAZENAMENTO DE OBJETOS COMPLEXOS

Compilado com a assistência de David H. Douglas, Universidade de Ottawa

    unidades anteriores se preocuparam em especificar e transformar locais

  • objetos (pontos, linhas e áreas)
  • atributos associados a objetos
  • relações entre objetos

  • existem muitas alternativas para estruturar dados espaciais dentro de uma loja digital
  • aqui, revisamos alguns dos mais comuns que se mostraram úteis por anos de experiência e aplicação

  • objetos espaciais - pontos, linhas, áreas - podem ser codificados como pares de coordenadas x, y:
    • ponto: (x, y)
    • linha: (x1, y1), (x2, y2),. , (xn, yn)
    • área: (x1, y1), (x2, y2),. , (xn, yn)
    • note que a representação digital dos três objetos espaciais é idêntica, n = 1 no primeiro caso
    • observe a convenção usada em toda esta unidade:
      • o nome do tipo de registro, seguido por dois pontos e, em seguida, os itens que formam o registro

        atributos de objetos podem ser armazenados como tabelas

      • a estrutura de dados geralmente consiste em duas partes:
        • coordenadas em um arquivo, cada conjunto representando um único objeto identificado por um ID único
        • atributos em uma tabela com um atributo identificando os objetos aos quais cada um está vinculado

          muitos pacotes comuns para mapeamento usam esta estrutura
            SAS / GRAPH e ATLAS (de Strategic Locations Planning) são exemplos

            a chave para uma estrutura de dados GIS, diferente de bancos de dados cartográficos, é a ênfase na codificação de relações entre objetos
              no GIS, o termo topologia é usado para se referir a essas relações entre objetos

              As propriedades topológicas são aquelas que são preservadas quando um objeto é esticado ou distorcido e, portanto, são distintas das propriedades geométricas
                por exemplo. um círculo pode ser esticado para formar qualquer forma de polígono, mas nenhuma distorção irá transformá-lo em um cubo

              • relacionamentos em redes
              • relações entre áreas

              • redes consistem em dois tipos de objetos:
                • linhas, também conhecidas como links, arestas ou arcos
                • nós, também conhecidos como cruzamentos ou cruzamentos

                • 1. coordenadas do arco: (x1, y1), (x2, y2),. , (xn, yn)
                • 2. atributos de arco: até o nó, a partir do nó, comprimento, atributos

                • os conjuntos de dados DIME criados pelo Bureau of the Census para o Censo de 1970 usaram esse conceito para codificar as redes de ruas dos EUA
                  • cada nó ou interseção recebeu um ID único

                  • isso pode ser feito adicionando um terceiro tipo de registro:
                  • 3. nó: (x, y), arcos adjacentes (positivo para nó até, negativo para nó de origem)
                    • veja acima

                    posição do nó posição 1 1 a 1 2 -5 b 3 3 3 c 6 4 2 d 9 5 -1

                      saber a adjacência é importante ao trabalhar com objetos de área
                        muitos programas são mais eficientes se sabemos quais áreas compartilham limites comuns

                      • duplicação na digitalização
                      • problemas que surgem quando as duas versões de cada limite comum não coincidem

                      • despesas gerais / apostila - Relações entre áreas
                      • uma tabela de atributos de polígono
                      • uma tabela de atributos de arco
                      • um conjunto de pares (x, y) representando a geometria do arco
                      • observação: em ARC / INFO, eles são chamados de arquivos .PAT, .AAT e .ARC, respectivamente

                      • para construir polígonos, deve procurar arcos com IDs de polígonos corretos e, em seguida, combinar os números dos nós
                        • para o polígono B acima, o resultado seria os arcos 3, 4 e 5, com 5 na ordem inversa

                          um exemplo de uma estrutura de dados mais desenvolvida é o banco de dados do Canadian Soil Information System (CanSIS)
                            desenvolvido pelo Departamento Canadense de Agricultura na década de 1970

                            • tipos de solo seriam codificados como objetos
                            • um objeto pode descrever muitos polígonos descontínuos compartilhando os mesmos atributos 2. Polígono: ID do objeto, próximo polígono, primeiro arco, último arco
                            • aqui "objeto" é o objeto do qual o polígono é uma parte 3. Arco: R-polígono, L-polígono, próximo-R-arco, próximo-L-arco, anterior-R-arco, anterior-L-arco, primeiro ponto, último ponto
                            • os ponteiros do arco são para os próximos arcos em torno dos polígonos esquerdo e direito

                              • o primeiro e o último ponto identificam o primeiro e o último (x, y) pares deste arco nos dados do ponto abaixo de 4. Ponto: (x, y)
                              • os pontos pertencentes a cada arco são armazenados em sequência neste conjunto de dados

                                áreas nem sempre esgotam o espaço
                                  o método pode ser ineficiente para codificar conjuntos de dados que consistem em polígonos isolados, e. bosques em uma área agrícola, vários tipos de uso da terra, pegadas de casas em um mapa urbano

                                  um banco de dados de queimadas antigas em uma floresta contém polígonos que podem se sobrepor e não esgotam o espaço, portanto, há poucos ou nenhum limite comum

                                  a rede e as estruturas de dados de área discutidas acima refletem a prática comum no GIS existente, mas estão longe de ser abrangentes

                                  • arcos são mais eficientes do que polígonos para muitas operações 2. modelagem precisa da realidade
                                  • os objetos são abstrações da realidade às condições impostas, por ex. polígonos não sobrepostos afetarão a precisão da abstração

                                  • um recurso simples, como um ponto, pode fazer parte de vários recursos complexos
                                  • esta ideia é útil em aplicações de serviços públicos, onde pode ser necessário agrupar vários objetos, como uma casa, terreno, cano, válvula de corte e medidor de gás, em um objeto complexo ("conta")

                                  Exemplo: analistas de informações espaciais devem frequentemente lidar com o fato de que as zonas de relatório, como condados, mudam de tempos em tempos

                                  • Great American History Project - para analisar a distribuição espacial da população dos EUA por condado desde 1800, requer um banco de dados que pode apresentar ao usuário diferentes visões do conjunto de condados em momentos diferentes, conforme os limites mudam
                                  • uma solução é definir um conjunto comum de arcos, mas construí-los seletivamente em objetos de área em cada período de tempo
                                    • a lista de arcos contém todas as linhas que já fizeram parte da fronteira de um condado dos EUA
                                    • os limites dos objetos (condados) são definidos de forma diferente em cada período de tempo
                                    • um arco é parte da rede de limites no período t se os IDs do polígono à sua direita e esquerda pertencem a objetos diferentes no tempo t

                                    Burrough, P.A., 1986. Princípios de Sistemas de Informação Geográfica para Avaliação de Recursos Terrestres, Clarendon Press, Oxford. Veja o Capítulo 2.

                                    Haralick, R.M., 1980. "A Spatial Data Structure for Geographic Information Systems", em H. Freeman e G.G. Pieroni, eds., Map Data Processing, Academic Press, New York.

                                    Peuker, T.K. e N. Chrisman, 1975. "Geographic Data Structures", American Cartographer 2 (1): 55-69.

                                    van Roessel, J.W. e E.A. Fosnight, 1984. "A abordagem relational to vector data structure conversion," Proceedings, International Symposium on Spatial Data Handling, Zurich, pp. 78-95.

                                    1. Faça uma lista dos tipos de relações que podem existir entre pares de objetos espaciais, para cada par de pontos, linhas e áreas, por ex. ponto a ponto, ponto a linha, área a ponto etc. Existem exemplos de relações entre triplos de objetos, por ex. ponto-ponto-ponto?

                                    2. Escreva a estrutura de dados do CanSIS para um mapa simples de três ou quatro polígonos, formando um número igual ou menor de objetos (incluindo os pares de coordenadas x, y) (precisa incluir um exemplo desenhado).

                                    3. A indústria de GIS tradicionalmente fornece modelos de dados que pressupõem que, em qualquer camada do banco de dados, os objetos poligonais não se sobrepõem e esgotam o espaço disponível. Comente sobre o grau em que esta suposição tem limitado a aplicação de bancos de dados GIS em áreas específicas. Eles são suficientemente significativos para garantir uma mudança nos modelos de dados no futuro?

                                    4. Discuta as áreas de aplicação nas quais o conceito de um tipo de recurso complexo seria útil. Quais operações você deseja executar em recursos complexos e simples, respectivamente?


                                    Envie comentários sobre o conteúdo para: Brian Klinkenberg
                                    Envie comentários sobre os problemas do site para: The Techmaster
                                    Última atualização: 30 de agosto de 1997.


                                    4. Shapefiles

                                    Desde 2007, os extratos TIGER / Line do banco de dados MAF / TIGER são distribuídos em formato shapefile. A Esri introduziu shapefiles no início dos anos 1990 como o formato de dados vetoriais digital nativo de seu produto de software ArcView. O formato do arquivo de forma é proprietário, mas aberto, suas especificações técnicas são publicadas e podem ser implementadas e usadas livremente. Em grande parte como resultado da popularidade do ArcView, o shapefile se tornou um padrão de fato para a criação e intercâmbio de dados geoespaciais vetoriais. A adoção do Shapefile pelo Census Bureau como um formato de distribuição é, portanto, consistente com sua estratégia geral de conformidade com as principais práticas de tecnologia da informação.

                                    Elementos de um conjunto de dados Shapefile

                                    A primeira coisa que os profissionais de GIS precisam saber sobre shapefiles é que cada conjunto de dados shapefile inclui um mínimo de três arquivos. Um dos três arquivos necessários armazena a geometria dos recursos digitais como conjuntos de coordenadas vetoriais. Um segundo arquivo necessário contém um índice que, assim como o índice de um livro, permite acesso rápido aos recursos espaciais e, portanto, acelera o processamento de uma determinada operação envolvendo um subconjunto de recursos. O terceiro arquivo necessário armazena dados de atributos no formato dBASE ©, um dos formatos de sistema de gerenciamento de banco de dados digital mais antigos e amplamente usados. Todos os arquivos que compõem um conjunto de dados Shapefile têm o mesmo nome de raiz ou prefixo, seguido por um sufixo de três letras ou extensão de arquivo. A lista abaixo mostra os nomes dos três arquivos necessários que compõem um conjunto de dados shapefile denominado "condados". Observe as extensões de arquivo:

                                    • counties.shp: o arquivo de forma principal, contendo dados de coordenadas vetoriais
                                    • counties.shx: o arquivo de índice
                                    • counties.dbf: a tabela dBASE

                                    A Esri lista doze arquivos opcionais adicionais e os profissionais podem incluir ainda outros. Dois dos arquivos opcionais mais importantes são o arquivo “.prj”, que inclui a definição do sistema de coordenadas, e “.xml”, que armazena metadados. (Por que você acha que algo tão essencial como a definição de um sistema de coordenadas é considerado "opcional"?)

                                    Experimente isso!

                                    Baixando e visualizando um arquivo de forma TIGER / Line

                                    Nisso Experimente isso! (o segundo de 3 lidando com TIGER / Line Shapefiles), você fará o download de um conjunto de dados TIGER / Line Shapefile, investigará a estrutura do arquivo de um shapefile Esri típico e o visualizará no software GIS.

                                    Você pode usar um aplicativo de software gratuito chamado Mapeador Global (originalmente conhecido como dlgv32 Pro) para investigar arquivos de forma TIGER / Linha. Originalmente desenvolvido pela equipe da Divisão de Mapeamento do USGS em Rolla, Missouri, como visualizador de dados do USGS, o Mapeador Global já foi comercializado, mas está disponível em uma versão de teste gratuita. As instruções abaixo irão guiá-lo através do processo de instalação do software e abertura dos dados TIGER / Line.

                                    1. Baixando TIGER / arquivos de formas de linha: Você usará os 2010 TIGER / Line Shapefiles.
                                      • Retorne à página de download de 2010 TIGER / Line Shapefiles.
                                      • De Selecione um tipo de camada lista de seleção, em Características, escolher Todas as linhas, e clique enviar. (Você é bem-vindo para baixar e investigar qualquer arquivo de forma TIGER / linha, mas usaremos um Todas as linhas conjunto de dados na geocodificação Tente isto posteriormente neste capítulo, então, ao baixar um aqui, você se familiarizará com o conteúdo.)
                                      • Na lista de seleção Todas as linhas, selecione um estado ou território e clique em Enviar.
                                      • Selecione um condado na próxima lista de seleção que aparece e clique em Download.
                                      • Salve o arquivo no computador.
                                        O arquivo que você baixar deve ter um nome como tl_2010_42027_edges.zip. O nome raiz deste arquivo, tl_2010_42027_arestas neste exemplo, também será o nome do conjunto de dados do arquivo de forma. O 42027 é um código federal que representa a Pensilvânia (estado 42) e o Condado de Center (condado 027). O código de cinco dígitos em seu nome de arquivo dependerá de qual estado e município você selecionou.
                                      • Os dados são compactados em um arquivo .zip. Extraia os dados para uma nova pasta nomeada em um local conhecido. (Na hierarquia de arquivos extraída, pode haver um segundo arquivo .zip que precisa ser descompactado.)
                                    2. Investigando o conjunto de dados shapefile:
                                      • Navegar para dentro de a pasta na qual você armazenou seu conjunto de dados TIGER / Line Shapefile descompactado.
                                      • Observe os vários arquivos que compõem o conjunto de dados do arquivo de forma, incluindo:
                                        • tl_2010_42027_edges.shp, contendo os dados de coordenadas vetoriais
                                        • tl_2010_42027_edges.shp.xml, contendo metadados
                                        • tl_2010_42027_edges.shx, o arquivo de índice
                                        • tl_2010_42027_edges.dbf, o arquivo dBASE
                                        • tl_2010_42027_edges.prj, contendo a projeção / referência espacial
                                      • Todos os arquivos funcionam em conjunto para armazenar os componentes necessários do Esri conjunto de dados shapefile. Você pode estar familiarizado com alguns dos tipos de arquivos individuais. O conteúdo de três deles pode ser facilmente visualizado. Vamos abrir esses três. Você pode clicar duas vezes no arquivo e selecionar "em uma lista de programas instalados" ou pode ser necessário executar o aplicativo sugerido e abrir o arquivo a partir dele.
                                        • Abra o .dbf arquivo usando o Microsoft Excel.
                                          Observe a estrutura típica de linha e coluna de um banco de dados de arquivo simples. Você consegue encontrar as quatro colunas ou campos que contêm as informações do intervalo de endereços? Procure LFROMADD, etc. O nome do campo LFROMADD é uma abreviação de Endereço à esquerda. O comprimento de 10 caracteres do nome do campo aponta para uma das restrições do formato dBASE - os nomes dos campos são limitados a 10 caracteres.
                                        • Abra o .xml arquivo usando seu navegador da web.
                                          Você deve ver as informações de metadados entre colchetes Tag contido entre colchetes direcionais & lt & gt. XML significa Extensible Markup Language e é um conjunto comum de regras para a codificação de documentos. Você consegue localizar a parte do documento relacionada à precisão espacial horizontal? (Metadados de precisão espacial estão disponíveis quando você escolhe o Todas as linhas como seu arquivo de forma candidato.)
                                        • Abra o .prj arquivo usando o bloco de notas ou qualquer editor de texto vanilla.
                                          Existem cinco informações neste arquivo, separadas por vírgulas. O que eles são? Eles devem reforçar um pouco do que você aprendeu no Capítulo 2 sobre o que define um sistema de coordenadas geográficas.
                                        • O .shp e .shx os arquivos são proprietários e específicos para a funcionalidade do conjunto de dados do arquivo de forma.
                                      • Observe que não se deve alterar o conteúdo de nenhum desses arquivos com qualquer aplicativo que não seja um programa GIS projetado para essa tarefa.
                                    3. Visualizando o conjunto de dados shapefile no Mapeador Global:
                                      • Baixe e instale o software Global Mapper:
                                        1. Navegue até o site do Blue Marble Global Mapper.
                                        2. Baixe a versão de teste do software.
                                        3. Clique duas vezes no arquivo de instalação que você baixou para instalar o programa.
                                        4. Inicie o programa Mapeador Global.

                                        Shapefile Primitivos

                                        Um único conjunto de dados shapefile pode conter um dos três tipos de primitivos de dados espaciais ou recursos - pontos, linhas ou polígonos (áreas). A especificação técnica os define da seguinte forma:

                                        • Pontos: Um ponto consiste em um par de coordenadas de precisão dupla na ordem X, Y.
                                        • Linhas: Mais especificamente, uma polilinha, é um conjunto ordenado de pontos, ou vértices, que consiste em um ou mais partes. Uma parte é uma sequência conectada de dois ou mais pontos. As peças podem ou não ser conectadas umas às outras. As peças podem ou não se cruzar.
                                        • Polígonos: Um polígono consiste em um ou mais argolas. Um anel é uma sequência conectada de quatro ou mais pontos, ou vértices, que formam um loop fechado e sem auto-intersecção.
                                        • Outro: Versões M (dados de rota medidos) e Z (datum vertical 3D) de conjuntos de dados de Shapefile de ponto, polilinha e polígono podem ser criados, mas não estão incluídos nos extratos de Shapefile de TIGER / Linha.

                                        À esquerda na figura acima, um polígono conjunto de dados Shapefile contém os blocos do Censo nos quais as arestas do banco de dados MAF / TIGER foram combinadas para formar dois polígonos distintos, P1 e P2. O diagrama mostra os dois polígonos separados para enfatizar o fato de que o que é a única aresta E12 no banco de dados MAF / TIGER (consulte a Figura 4.4.1 na página 4) agora está presente em cada um dos recursos do polígono do bloco do Censo.

                                        No meio da ilustração, acima, um conjunto de dados Shapefile polilinha contém sete feições de linha (L1-7) que correspondem às sete arestas no banco de dados MAF / TIGER. A direcionalidade dos recursos de linha que representam as ruas corresponde aos atributos do intervalo de endereços na tabela dBASE © associada. Os vértices definem a forma de um polígono ou de uma linha, e os nós inicial e final do banco de dados MAF / TIGER são agora o primeiro e o último vértices.

                                        Finalmente, à direita na ilustração acima, um ponto conjunto de dados Shapefile contém os três nós isolados do banco de dados MAF / TIGER.


                                        8. Estratégias de representação para mapeamento

                                        Lembre-se de que os dados consistem em símbolos que representam medições. Os dados geográficos digitais são codificados como símbolos alfanuméricos que representam locais e atributos de locais medidos na ou perto da superfície da Terra. Nenhum conjunto de dados geográficos representa todas as localizações possíveis, é claro. A Terra é muito grande e o número de locais exclusivos é muito grande. Da mesma forma que a opinião pública é medida por meio de pesquisas, os dados geográficos são construídos medindo-se amostras de locais. E assim como as pesquisas de opinião sérias são baseadas em princípios sólidos de amostragem estatística, também os dados geográficos representam a realidade medindo amostras cuidadosamente escolhidas de locais. Os dados vetoriais e rasterizados são, em essência, duas estratégias de amostragem distintas.

                                        O vetor A abordagem envolve a amostragem de locais em intervalos ao longo do comprimento de entidades lineares (como estradas), ou ao redor do perímetro de entidades de área (como parcelas de propriedade). Quando eles são conectados por linhas, os pontos amostrados formam recursos de linha e recursos de polígono que se aproximam das formas de suas contrapartes do mundo real.

                                        Experimente isso!

                                        Click the graphic above (Figure 1.9.1) to download and view the animation file (vector.avi, 1.6 Mb) in a separate Microsoft Media Player window.

                                        The aerial photograph above (Figure 1.9.1) shows two entities, a reservoir and a highway. The graphic above right illustrates how the entities might be represented with vector data. The small squares are nodes: point locations specified by latitude and longitude coordinates. Line segments connect nodes to form line features. In this case, the line feature colored red represents the highway. Series of line segments that begin and end at the same node form polygon features. In this case, two polygons (filled with blue) represent the reservoir.

                                        The vector data model is consistent with how surveyors measure locations at intervals as they traverse a property boundary. Computer-aided drafting (CAD) software used by surveyors, engineers, and others, stores data in vector form. CAD operators encode the locations and extents of entities by tracing maps mounted on electronic drafting tables, or by key-entering location coordinates, angles, and distances. Instead of graphic features, CAD data consist of digital features, each of which is composed of a set of point locations.

                                        The vector strategy is well suited to mapping entities with well-defined edges, such as highways or pipelines or property parcels. Many of the features shown on paper maps, including contour lines, transportation routes, and political boundaries, can be represented effectively in digital form using the vector data model.

                                        O raster approach involves sampling attributes at fixed intervals. Each sample represents one cell in a checkerboard-shaped grid.

                                        Try This!

                                        Click the graphic above (Figure 1.9.2) to download and view the animation file (raster.avi, 0.8 Mb) in a separate Microsoft Media Player window.

                                        The graphic above (Figure 1.9.2) illustrates a raster representation of the same reservoir and highway as shown in the vector representation. The area covered by the aerial photograph has been divided into a grid. Every grid cell that overlaps one of the two selected entities is encoded with an attribute that associates it with the entity it represents. Actual raster data would not consist of a picture of red and blue grid cells, of course they would consist of a list of numbers, one number for each grid cell, each number representing an entity. For example, grid cells that represent the highway might be coded with the number "1" and grid cells representing the reservoir might be coded with the number "2."

                                        The raster strategy is a smart choice for representing phenomena that lack clear-cut boundaries, such as terrain elevation, vegetation, and precipitation. Digital airborne imaging systems, which are replacing photographic cameras as primary sources of detailed geographic data, produce raster data by scanning the Earth's surface pixel by pixel and row by row.

                                        Both the vector and raster approaches accomplish the same thing: they allow us to caricature the Earth's surface with a limited number of locations. What distinguishes the two is the sampling strategies they embody. The vector approach is like creating a picture of a landscape with shards of stained glass cut to various shapes and sizes. The raster approach, by contrast, is more like creating a mosaic with tiles of uniform size. Neither is well suited to all applications, however. Several variations on the vector and raster themes are in use for specialized applications, and the development of new object-oriented approaches is underway.


                                        Informação Geográfica

                                        In GIS geographic information is made up of spatial location data and attribute data.

                                        Spatial location data is data with geographic component. It answers the question where something is.

                                        Attribute data answers the question what something is.

                                        The database that contains these geographic information is called an attribute table and it can be used to symbolise features, make queries and to analyse the data.

                                        The example below shows a choropleth map of Internet users (per 100 people) in 2016 and its associated attribute table.

                                        World map of Internet users (per 100 people) in 2016

                                        Screenshot of the associated attribute table


                                        How can I associate a consistent polygon area with a set of attributes using a topology? - Sistemas de Informação Geográfica

                                        Data Model Definition: an abstraction of real world entities and their relationships into structures that can be implemented with a computer language.

                                        1. Definição
                                        2. Requirements for a DBMS
                                        3. Terminology
                                        4. Entity-Relationship conceptual model
                                        5. Hierarchical logical model
                                        6. Network logical model
                                        7. Relational logical model
                                        8. Integration of DBMS with spatial data models
                                        1. Introdução
                                        2. Raster conceptual data model
                                        3. Vector conceptual data model
                                        4. Object-oriented data model
                                          : referencing of an entity to a coordinate system (i.e. UTM, state plane . etc).
                                      • Data description:
                                        1. data as entities: geographic data often described in phenomenological concepts such as roads, towns, rives floodplains, eoctypes, soil associations, . etc. These concepts are often referred to as entities.
                                        2. entity hierarchy: Data is often hierarchical in form (i.e. country > state > county > village forest > deciduous/coniferous > upland/lowland)
                                        3. gradients between entities: separations between some entities are not always clear cut and there may be a transitional zone between entities (ecotones).
                                        4. Geographic data can be represented using three basic topological concepts, the point, the line and the area. Every geographical phenomena can in principle be represented by these three concepts plus a label or attribute that defines it.
                                        5. What is a map? "A map is a set of points, lines and areas that are defined by their spatial location with respect to a coordinate system and by their non-spatial attributes" (Burrough 1986). A map legend links the non-spatial attributes to the spatial attributes.
                                        1. a record is a data structure containing information about an entity that can be manipulated as a unit.
                                        2. a pointer is a memory address that references the start of data in the RAM
                                        1. simple lists: unstructured data, each item is placed at the end of a list, search time (n + 1)/2.
                                        2. ordered sequential files: additions placed in proper position (insertion). Binary search is possible reducing search time log2(n+1). Item found in set of 65,535 + 1 items in 16 tries.
                                        3. indexed files:
                                          : Rapid data retrieval according to key attribute (i.e. dictionary spelling. Key attribute + additional information). In direct files the data items themselves provides means of ordering (soil series name with index to location of each name beginning with a particular letter) : May have ordered soil profiles but may want info on soil depth, drainage, ph, texture or erosion. If the poorly drained soils need to be identified we must use a linear search unless we invert the file. Inverted files are initially ordered using a linear search. An example of an inverted file is a topic index in a book.
                                          1. limitations of simple structures: file modification is difficult, a new record is added to the end of a file, then the index is updated. Data can be accessed only via a key contained in the indexed file, while other types of information requires a sequential search

                                          These data structures provide very efficient access to information pertaining to a single entity. But we need more. We need to relate different entities.

                                          II. Data Models (Laurini and Thompson, 1992 and ANSI/X3/SPARC, 1978)

                                          As data management became more complex a framework was need to understand the transformation of real world systems and processes into structures that could be implemented in a computer.

                                          1. External model: provide the basis for understanding the real world (e.g. non-spatial: a set entities spatial: the world as a constantly varying surface the world as a discrete set of objects in space or as a set of thematic layers)

                                          2. Conceptual data model: provide the organizing principles that translates the external data models into functional descriptions of how data objects are related to one another (e.g. non-spatial: E-R model spatial: raster, vector, object representation).

                                          3. Logical data model: provide the explicit forms that the conceptual models can take and is the first step in computing (e.g. non-spatial: hierarchical, network, relational spatial: 2-d matrix, map file, location list, point dictionary, arc/nodes).

                                          4. Internal data model: low level data structures, records, pointers, etc.

                                          III. Data Base Management Systems (DBMS)

                                          1- Definition:

                                          Data Base Management Systems: A system used to organize, access, maintain and manipulate object or entity data. A DBMS controls input, output, storage and retrieval of entity data. Essential features of a data base are fast access and cross referencing of entities.

                                          2- Requirements for a DBMS

                                          A DBMS should provide:

                                          1. Data Independence: the data base can change with little or no impact on the user programs
                                          2. Data Sharing: must have coordinated simultaneous access. Concurrency control mechanism.
                                          3. Maintenance of Data Integrity: DBMS helps enforce certain consistency constraints (i.e. coordinate has both lat and long, # of seats sold on an airplane <= # seats on plane)
                                          4. Security: DBMS provides mechanism for security/authorization from disclosure/destruction of data.
                                          5. Centrality of Control: DB administrator to resolve conflicts and meet user requirements
                                          6. Reduce Application Development Time

                                          3- E-R data model: a conceptual data model in which information is represented by entities and relationships between entities

                                          a. entity - a distinguishable object in the real world (people, forest stand, watershed, . etc.)
                                          b. relationship - a correspondence or association between two or more entities.
                                          c. attributes - the properties which describe an entity.
                                          d. functionality - how many entities from one entity set can be associated with another set
                                          e. primary key - main key for entity identification, one record per indexed attribute.
                                          f. secondary key - may have multiple record occurrences per index attribute.

                                          + easy to update and expand.
                                          + easy data access for keys.
                                          + ideal for data that is inherently hierarchical.
                                          - poor access for associated attributes.
                                          - Restrictive paths.
                                          - one to many relationships

                                          + reduces redundancy.
                                          + more flexible paths to data.
                                          + very fast
                                          - pointers expensive and difficult to update when inserting and deleting.

                                          7- Relational data model: data stored as records known as tuples grouped together in two-dimensional tables known as relations. Whereas hierarchical structures rely on the hierarchy and networks depend on pointers to associate entities, the relational model uses data redundancy in the form of unique keys that identify records in each file. Simplifies data maintenance because data for an entity type is stored in simple tables. Relational joins are used to cross reference entities using a primary key in one table and a foreign key in another table. Thus, in order to perform relational joins there needs to be at least one column in common between tables being related.

                                          The relational model is design to reduce redundancy of data whenever possible. A set of rules called the normal forms were developed by Codd (1970) to guide this process.

                                          + structures very flexible.
                                          + boolean logic and math operations.
                                          + insert and delete easy.
                                          - often use sequential search unless previously sorted.

                                          8- Integration of DBMS with the spatial data models

                                          IV. Data Models for Spatial Data

                                          Data structures are complex for GIS because they must include information pertaining to entities with respect to: position, topological relationships, and attribute information. It is the topologic and spatial aspects of GIS that distinguish it from other types of data bases.

                                          1. Introduction: There are presently three types of representations for geographic data: raster vector, and objects.

                                            - set of cells on a grid that represents an entity (entity --> symbol/color --> cells). -an entity is represented by nodes and their connecting arc or line segment (entity --> points, lines or areas --> connectivity)
                                      • object – an entity is represented by an object which has as one of its attributes spatial information.
                                      • Definition: realization of the external model which sees the world as a continuously varying surface (field) through the use of 2-D Cartesian arrays forming sets of thematic layers. Space is discretized into a set of connected two dimensional units called a tessellation.

                                        1. Each overlay is a 2-D matrix of points carrying the value of a single attribute.
                                        2. Each point is represented by a vertical array in which each array position carries a value of the attribute associated with the overlay. - each mapping unit has the coordinates for cell in which it occurs (greater structure, many to one relationship).

                                        Vertical array not conducive to compact data coding because it references different entities in sequence and it lacks many to one relationship. The third structure references a set of points for a region (or mapping unit) and allows for compaction.

                                        + reduced storage.
                                        + area, perimeter, shape est.
                                        - overlay difficult.

                                        + reduce storage.
                                        - overlay difficult.

                                        + reduced storage.
                                        + U & I of regions easy.

                                        Definition:realization of the discrete model of real world using structures for storing and relating points, lines and polygons in sets of thematic layers.

                                          1. represents an entity as exact as possible.
                                          2. coordinate space continuous (not quantized like raster).
                                          3. Structured as a set of thematic layers
                                            1. Point entities: geographic entities that are positioned by a single x,y coordinate. (historic site, wells, rare flora. The data record consists for x,y - attribute.
                                            2. Line Entity: (rivers, roads, rail)
                                              1. all linear feature are made up of line segments.
                                              2. a simple line 2 (x,y) coordinates.
                                              3. an arc or chain or string is a set of n (x,y) coordinate pairs that describe a continuous line. The shorter the line segments the closer the chain will approximate a continuous curve. Data record n(x,y).
                                              4. a line network gives information about connectivity between line segments in the form of pointers or relations contained in the data structure. Often build into nodes pointers to define connections and angles indicating orientation of connections (fully defines topology).

                                              3. Area Entity: data structures for storing regions. Data types, land cover, soils, geology, land tenure, census tract, etc.

                                                1. Cartographic spaghetti or "connect the dots". Early development in automated cartography, a substitute for mechanical drawing. Numerical storage, spatial structure evident only after plotting, not in file.
                                                  • describe each entity by specifying coordinates around its perimeter.
                                                  • shared lines between polygons.
                                                  • polygon sliver problems.
                                                  • no topology (neighbor and island problems).
                                                  • error checking a problem.
                                        • unique points for entire file, no sharing of lines as in location lists (eliminate sliver problem) but still has other problems.
                                        • expensive searches to construct polygons.

                                        d. Dime Files (Dual Independent Mapping and Encoding)

                                          • designed to represent points lines and areas that form a city though a complete representation of network of streets and other linear features.
                                          • allowed for topologically based verification.
                                          • no systems of directories linking segments together (maintenance problem).
                                            • same topological principles as the DIME system.
                                            • DIME defined by line segments, chains based on records of uncrossed boundary lines (curved roads a problem for DIME).
                                            • chains or boundaries serve the topological function of connecting two end points called a node and separating two zones.
                                            • points between zones cartographically not topologically required (generalization possible).
                                            • solves problems discussed above (neighbor, dead ends, weird polygons).
                                            • can treat data input and structure independently.

                                            Definition: realization of the discrete model of real world using an object centered approach in which an object has both physical (attribute) and geometric characteristics. Different types of objects can interact because they are not confined to separate layers.

                                            The biggest single difference between the object-oriented conceptual model and the vector-layered based conceptual model, for representing geographic information, is that in the object model, the real world object is the basis for abstraction, not its geometry. In other words, the objects not the geometric components of layers are the "units" for modeling and interactions


                                            Assista o vídeo: SEXTO GRADO,BLOQUE MEDIDAS, LECCIÓN 1, CALCULEMOS EL ÁREA DE POLÍGONOS REGULARES, MATEMÁTICAS VI