Mais

O ArcGIS Desktop possui o equivalente ao RStudio Console do Windows?

O ArcGIS Desktop possui o equivalente ao RStudio Console do Windows?


Eu sei que o Esri fornece capacidade de script, por meio da janela do Python, mas tive dificuldades com isso. Pular da calculadora de campo para a janela Python foi demais para mim. Tentar manter 3 conjuntos diferentes de sintaxe correta (Esri, VBA e Python) foi uma pena (Esri não se preocupa com maiúsculas ou espaços em branco, Python sim ...)

Começando a usar o RStudio como GIS. Um dos motivos pelos quais estou começando a mudar do ArcGIS para o R é a necessidade de reprodutibilidade em minha análise. Grande parte da análise que estou fazendo é baseada em um script. Mas me perguntando se há uma maneira de continuar usando o Esri.

Um dos recursos que eu realmente gosto do RStudio é o Console, que atua como uma interface de linha de comando. Mas também registra o equivalente ao código da linha de comando que você teria digitado ao executar algo a partir da GUI. Isso tem sido muito útil para aprender R.

Existe um equivalente para a janela Python, para que eu pudesse ver as entradas da minha GUI no Esri como o código de saída Python equivalente?

Isso tornaria a tradução de entradas GUI em um script Python muito mais fácil. Isso também tornaria a reprodução da análise muito mais fácil, já que sou repetidamente chamado para realizar análises semelhantes, mas com meses de intervalo.

Usando 'Gravar Macro' no EXCEL para gravar o equivalente em VBA de meus comandos GUI e, em seguida, editar o código VBA para criar um novo script / macro.

Existe uma maneira semelhante de documentar meu fluxo de trabalho no ArcGIS?

Relacionado:


Ele não está incluído na instalação do ArcGIS, mas adicionar o iPython Notebook ao seu fluxo de trabalho parece exatamente o que você está procurando.


Você pode querer adicionar seu voto ao ArcGIS Idea para ter uma opção de macro Gravar no ArcMap:

Acho que uma opção de gravação de macro deve aumentar a velocidade de trabalho de muitas pessoas com ArcMap, sem a necessidade de habilidades de programação de ponta, semelhante ao MS Excel.


Anos depois, parece que se tornou viável (para algumas ferramentas), depois de executar, na caixa Resultados, clicar com o botão direito e selecionar 'copiar como trecho Python'.


Existe algo como RStudio para Python? [fechado]

Quer melhorar esta questão? Atualize a pergunta para que fique no tópico do Stack Overflow.

No RStudio, você pode executar partes do código na janela de edição de código e os resultados aparecem no console.

Você também pode fazer coisas legais como selecionar se deseja que tudo até o cursor seja executado, ou tudo após o cursor, ou apenas a parte que você selecionou e assim por diante. E existem teclas de atalho para todas essas coisas.

É como uma etapa acima do shell interativo em Python - lá você pode usar readline para voltar às linhas individuais anteriores, mas não tem nenhum "conceito" do que é uma função, uma seção de código, etc.

Existe uma ferramenta assim para Python? Ou você tem algum tipo de solução alternativa semelhante que usa, digamos, no vim?


4 Programação (para análise de dados) usando R e R-Studio

Parabéns por passar pela semana 3 - e bem-vindo à nossa introdução ao uso de programação, na forma de R e R-Studio, para análise de dados.

Esta semana é fortemente orientada para a prática - com muitos aspectos de sua prática integrados em vários pontos do workshop - bem como, é claro, uma seção de análise de dados no final.

Como sempre, dividimos o conteúdo em partes menores para ajudá-lo a fazer pausas e voltar a ele como e quando puder na próxima semana.

Semana 4 na Geocomp

O conteúdo desta semana apresenta os conceitos básicos associados a Programação para Análise de Dados, onde temos três áreas de trabalho em que nos concentrar:

  1. Princípios gerais de programação
  2. Como usar R e R-Studio efetivamente para análise de dados programáticos
  3. A filosofia ‘Tidyverse’

O conteúdo desta semana está dividido em 4 partes:

Esta semana, temos uma abordagem ligeiramente diferente para nossa estrutura de fluxo de trabalho, com uma mistura de palestras curtas, vídeos instrutivos e Atividades para completar em cada parte.

Um único Leitura da Chave é encontrado no final do workshop.

Esta semana, você tem 1 tarefa, que será destacado na apostila.

Parte 4 é a parte principal da análise da nossa Prática para esta semana, mas você encontrará aspectos de programação em Partes 1-3 que você precisará fazer para para preparar nossos dados para a parte final.

Se você não conseguiu fazer o download do R-Studio Desktop ou não pode acessá-lo através do Desktop @ UCL Anywhere, você terá acesso ao nosso site do R-Studio Server. As instruções sobre como acessá-lo são fornecidas abaixo.

objetivos de aprendizado

Ao final desta semana, você deverá ser capaz de:

  • Entenda os fundamentos da programação e por que ela é útil para análise de dados
  • Reconhecer as diferenças e o propósito de um comando de console versus a criação de um script
  • Explique o que é uma biblioteca / pacote e como usá-los no R / R-Studio
  • Explique a filosofia do tidyverse e por que ela é útil para nós, analistas de dados
  • Combine e gerencie dados tabulares para prepará-los para análise
  • Conduza estatísticas descritivas básicas usando R-Studio e R e produza um gráfico de barras

Vamos nos basear na análise de dados que concluímos na semana passada e procurar entender melhor o crime em Londres, observando sua prevalência mês a mês.

Uma introdução à programação

A programação é a nossa forma mais fundamental de interagir com um computador - foi assim que os computadores foram construídos e operados pela primeira vez - e para um longo Com o tempo, a interface de linha de comando (CLI) era nossa principal forma de usar computadores antes de nossos sistemas operacionais (SO) e software de interface gráfica do usuário (GUI) se tornarem convencionais.

Hoje em dia, a maioria de nós usa nossos computadores clicando - e não digitando. No entanto, a programação e o código de computador sustentam cada aplicativo que usamos em nossos computadores ... ou realmente qualquer dispositivo tecnológico.

Afinal, a programação é usada para tantos propósitos e aplicações, que nós, como usuários, consideramos natural - da engenharia de software e desenvolvimento de aplicativos à criação de sites e gerenciamento de bancos de dados em escalas substanciais.

Para ajudar com essa diversidade de aplicativos, vários tipos de linguagens de programação (e maneiras de usar linguagens de programação!) Foram desenvolvidos - a Wikipedia, por exemplo, tem uma lista de 50 tipos diferentes de idiomas, embora haja alguma sobreposição entre muitos deles e alguns sejam usados ​​para atividades de nicho incrivelmente.

Em geral, as principais linguagens de programação que as pessoas se concentram em aprender no momento incluem:


As 10 principais linguagens de programação e suas aplicações de acordo com DZone em 2017.

Alguns podem ser usados ​​para uma variedade de propósitos - outros são mais específicos, por exemplo, HTML para construção de sites. Existem também diferentes formas de funcionamento das linguagens de programação, o que oferece algumas vantagens sobre outras.

Isso tem a ver com a forma como o código é escrito e 'fala com o computador' - por trás de nossas principais linguagens de programação, existe algo chamado um compilador que pega o código que escrevemos em nossas várias linguagens de programação e o traduz em código de máquina, também conhecido como código nossos computadores sabem como entender.

Este código é escrito puramente em binário e, como resultado, parece bastante diferente do código que iremos escrever em nossas práticas (pense muito em 1s e 0s!).

Para algumas linguagens, esta tradução é concluída quando seu código é compilado antes de ser executado, ou seja, o "compilador" examinará todo o seu código, traduzirá para o código de máquina e, em seguida, executará o código de máquina de acordo.

Essas línguas são conhecidas como compilado, ou nível baixo linguagens e podem, a princípio, ser lentos para escrever, mas são incrivelmente eficientes ao executar grandes quantidades de código (por exemplo, ao criar software). No entanto, eles exigem uma compreensão de coisas chamadas de registradores, endereços de memória e pilhas de chamadas e são, como resultado, muito mais complicados de aprender e usar (e não, eu pessoalmente não sei como codificar em nenhuma linguagem de baixo nível ... nem eu particularmente quero!).

Para outras linguagens, como R e Python, eles se enquadram no interpretado categoria de idioma. Aqui, cada linha de código é executada sem uma tradução pré-execução. Nesse caso, um programa chamado interpretador lê cada instrução do programa e, seguindo o fluxo do programa, decide o que fazer e o faz.

O problema com estes alto nível linguagens de programação é que esta abordagem pode ser cara em recursos computacionais (ou seja, tempo de processamento e espaço de memória).

Como não há compilação de pré-execução, os bugs não são encontrados antes que o código seja executado, mas, em vez disso, conforme o código é executado - como resultado (e o que você pode ver acontecer em seu próprio código), seu computador pode ficar preso tentando execute código que é completamente inviável para o seu computador executar (por exemplo, seu computador não consegue lidar com o tamanho dos dados que você está alimentando) ou termina em um loop sem saída - exceto para você interromper o código.

No entanto, a vantagem de usar essas linguagens é que seu foco principal está em coisas como variáveis, arrays, objetos, expressões aritméticas ou booleanas complexas, sub-rotinas e funções, loops, threads, bloqueios e outros conceitos abstratos da ciência da computação - todos os quais nós usarei em nosso módulo, acredite ou não!

Essas linguagens têm um foco principal na usabilidade em vez da eficiência ideal do programa, que, quando estamos apenas aprendendo a codificar, são ideais para nós em geocomputação!

Não se preocupe se você não entender o que isso significa, você entenderá no final deste módulo!

Como não estamos cursando Ciência da Computação aqui, não entraremos em mais detalhes sobre isso, mas é suficiente dizer que há muito mais para programação do que o que vamos cobrir em Geocomputação.

Mas o que é importante reconhecer é que bastante de trabalho foi para criar os ambientes de programação que podemos usar hoje - e eu, por exemplo, estou extremamente feliz por nunca ter aprendido a escrever um compilador!

Se entender um pouco mais sobre compiladores e código de máquina é de seu interesse, o vídeo a seguir fornece uma explicação acessível - embora você possa querer voltar a ele no final da prática:

Como os computadores leem o código?

A interface de linha de comando

O mais básico de programação que podemos usar sem instalar nada em nossos computadores é usar o Interface da Linha de comando(CLI) já integrado, conhecido como o Concha.

O Concha é um programa simples que permite que você interaja com seu computador usando comandos de texto (Interface de linha de comando) em vez de apontar e clicar Interface gráfica do usuário (GLI).

O shell simplesmente pega seus comandos e os fornece ao sistema operacional do seu computador.

Cada sistema operacional tem seu próprio programa de shell:

Mac / Linux = zsh (novo) / bash (Bourne-again Shell) (anterior)

Microsoft = PowerShell (e alguns outros).

Para a maioria dos sistemas operacionais, você pode acessar o shell usando um programa baseado em janela, conhecido como emulador de terminal (TE).

O padrão TE para Mac e Linux usuários é: terminal.

O padrão TE para janelas usuários usam Prompt de comando (antigo) ou terminal (novo).

(Se você se lembra da minha palestra introdutória, é assim que eu costumava interagir com meu primeiro computador muito jovem, provavelmente 5 anos, ao tentar carregar um jogo de computador!)

O Concha é um programa incrivelmente útil - e se você levar a programação mais longe no futuro (por exemplo, análise de grandes conjuntos de dados por meio de servidores, executando vários scripts, lidando com controle de versão, engenharia de software), ele se tornará uma ferramenta com a qual você se tornará incrivelmente familiar .

Mas, por enquanto, queremos apenas ilustrar o quão legal pode ser para nós sermos capazes de dizer ao nosso computador para fazer coisas em algumas linhas de código - ao invés de ter que clicar e apontar - especialmente quando você sabe como usar a CLI -shell e pode lembrar comandos específicos.

Vamos dar uma olhada ao completar uma tarefa simples com nosso shell para dizer ao nosso computador para fazer algo - vamos fazer algumas Gerenciamento de arquivos para nossa prática hoje.

Usando a interface de linha de comando em seu computador

Como você deve se lembrar da prática da semana passada, forneci nossos dados de crimes em um único arquivo csv processado.

No entanto, quando você baixa os dados de data.police.uk, os dados não estão formatados tão bem!

Essencialmente, todos os nossos dados que baixamos sobre o crime em Londres serão fornecidos em csvs individuais, de acordo com primeiro por mês e, em seguida, para a força policial da seguinte forma:

Para poder processar esses dados facilmente em R, queremos mover todos os nossos arquivos para uma única pasta.

E acredite ou não, leva apenas algumas linhas de código para fazer isso.

Usando a linha de comando para copiar e mover arquivos.

Como vimos no vídeo acima, pode ser muito útil - e rápido - usar nosso Shell para organizar nossos arquivos de dados antes de carregá-los no R-Studio.

Só para provar isso, a primeira parte da programação que faremos hoje é usar o shell embutido em seu computador para repetir o mesmo processo e copiar os dados do crime em uma única pasta.

Gerenciamento de arquivos usando a linha de comando

Agora que você viu como copio os arquivos, vamos prosseguir e fazer isso nós mesmos.

  1. Dirigir a data.police.uk e baixe todos os dados de crime disponíveis para Londres em 2020 (isso pode incluir apenas até novembro) e para ambas as forças policiais.

Agora você deve ter seus dados baixados em uma única pasta principal em seus downloads (pode receber um nome de arquivo codificado ridiculamente longo).

Copie esta pasta para o seu GEOG0030 - & gt data - & gt raw - & gt crime pasta usando copiar e colar / arrastar e soltar (conforme sua preferência).

  • Sobre Mac, espera CMD e acertar espaço para abrir sua barra de pesquisa e digite terminal, e uma janela de terminal deve aparecer.
  • Sobre janelas, pressione o botão do Windows e faça o mesmo. Alternativamente, pesquise por Concha ou prompt de comando.

Com sua cápsula aberta, navegaremos até sua pasta de dados brutos e copiaremos os dados do crime em uma única pasta.

Para fazer isso, usaremos seis comandos de terminal principais:

Comandos de terminal / shell comuns

  • pwd (Mac e Windows): Imprimir diretório de trabalho - isso vai nos mostrar onde estamos no sistema de arquivos do nosso computador. Por padrão, você deve estar localizado na “base” do arquivo do usuário.
  • dir (Windows) ou ls (Mac): Listas todos os arquivos no diretório em que você está localizado.
  • CD (Mac e Windows): Mudar em um novo diretório (ou seja, pasta) - pode ser uma "etapa" de caminho único ou várias etapas para chegar ao diretório desejado.
  • md (Windows) ou mkdir (Mac e Windows): Faço uma nova diretório (ou seja, pasta) onde você está localizado no momento.
  • cp (Mac e Windows): cópia de conteúdo de um diretório ou arquivo específico para um novo local. Este comando pode levar curingas para ajudar a pesquisar várias pastas de uma vez, como veremos em nossa consulta.
  • mover (Windows) ou mv (Mac): Mover diretório para um novo destino.

Agora você deve ver um caminho de arquivo aparecer sob o seu comando - o computador está dizendo onde você está localizado no momento no sistema do seu computador.

O computador agora lista todas as pastas em seu diretório para as quais você pode mover como uma próxima etapa da pasta atual.


Agora você precisa identificar em qual pasta seu trabalho GEOG0030 está contido - e qual é o seu “caminho” para chegar lá, pois agora precisamos continuar mudando os diretórios para chegar à nossa pasta GEOG0030.

  1. Em seguida, digite cd seguido da (s) pasta (s) para a qual você precisa mudar para chegar à pasta GEOG0030 principal. Lembre-se de pressionar Enter para executar seu código.

Cada vez que você muda de pasta, esta pasta é adicionada ao caminho do arquivo próximo ao seu Incitar - dê uma olhada rápida nisso agora.

Continue mudando de pasta até que você esteja na pasta que contém seus dados de crime baixados.

Preenchimento automático de caminhos de arquivo

Uma dica é que seu terminal pode preencher automaticamente os nomes das pastas para você quando houver informações suficientes para eles determinarem a pasta exclusiva. Para fazer isso, pressione tab no teclado.

Por exemplo. sua pasta de crime provavelmente será uma longa lista de números e letras, se você não a renomeou enquanto copiava para sua pasta raw. Portanto, eu recomendo que o uso dessa abordagem economize tempo ao inserir todos esses números.

Você também pode mudar para esta pasta em um comando, simplesmente continue adicionando ao caminho da pasta da seguinte forma:

  • Digite (e use a guia) cd GEOG0030 / data / raw / crime / 52c6b758bceaf2244fc1b6f93e85d7f00f234ccf / e pressione Enter.
    • Observe que se você estiver usando um PC com WINDOWS, precisará usar uma barra invertida () no caminho do arquivo, não uma barra.
    • Observe que você não precisa de uma barra no início dos caminhos dos arquivos. *

    Assim que estiver na pasta correta, primeiro queremos fazer um nova pasta conter tudo o csvs do crime (sem seu sistema de subpasta atual):

    Se você digitar agora dir ou ls, deverá ver a nova pasta listada na pasta atual.

    Vamos copiar todos os nossos csvs para esta única pasta.

    1. Digite cp ** / *. Csv all_crime e pressione Enter.
      • Novamente, use uma barra invertida ()) se estiver em um PC com Windows.
      • Este comando usa o curinga * para pesquisar qualquer arquivo em qualquer pasta, desde que seja do tipo .csv.
      • Usando curingas é uma ferramenta de programação muito comum e é provável que a utilizemos em nossas práticas futuras. Você também pode usá-los em pesquisas em mecanismos de pesquisa como o Google!

    Agora podemos mudar para nossa nova pasta e, em seguida, listar seu conteúdo para verificar se nossos arquivos foram movidos.

    1. Digite cd all_crime e pressione return. Em seguida, digite dir ou ls. Verifique se você tem todos os seus arquivos (22 ou 24, dependendo de quando você estiver concluindo esta prática!).

    Ótimo, temos nossos arquivos todos em uma única pasta, o que tornará seu uso no R muito mais fácil. Faremos uma última coisa - mover esta pasta do original para a pasta principal do crime.

    Ainda no terminal, digite: cd .. para voltar à nossa pasta de dados do crime policial.

    A seguir, para mover nossa pasta all_crime: (WINDOWS) move all_crime .. ou (MAC): mv all_crime ..

    Finalmente, digite cd .. e pressione return.

    Agora você deve se encontrar um passo de volta ao seu sistema de arquivos na pasta principal do crime. Podemos verificar se nossa mudança funcionou listando novamente o conteúdo da pasta.

    Excelente! Você acabou de fazer sua primeira programação de linha de comando!

    Pense em como foi rápido digitar esses comandos e mover os arquivos - em vez de ter que fazer tudo isso manualmente.

    É claro que ajudou o fato de eu ter dito a você quais comandos escrever - mas quanto mais tempo você gasta com programação, mais rápido (e mais familiarizado) você aprenderá a codificar e executar esses comandos.

    Caminhos de linha de comando

    Observe, o uso de .. em nossos dois comandos acima significa retroceder no caminho do sistema de arquivos, como fizemos em ambos os casos aqui (ou seja, a pasta ‘pai’.

    Além disso, dois outros comandos a serem considerados incluem:

    (Mac) para denotar o raiz ou casa diretório, por exemplo CD

    A linha de comando é apenas um aspecto da programação - mas também queremos ter a capacidade de criar e executar scripts.

    Os scripts são extremamente importantes para nós ao completar a análise de dados e, como tal, veremos as diferenças entre os dois quando começarmos a usar o R ​​/ R-Studio para nossa análise de dados hoje.

    Uma coisa legal sobre o terminal é que temos a capacidade de criar e executar scripts apenas dentro do próprio terminal.

    Podemos fazer isso abrindo um editor de texto em nosso terminal para escrever um script em qualquer linguagem de programação e, em seguida, executar nosso script dentro do terminal. Executamos nosso script definindo o terminal para aquela linguagem de programação e, em seguida, chamando o script.

    Tudo isso parece extremamente complicado - mas na verdade não é depois de passar algum tempo trabalhando com a CLI.

    Podemos dar uma olhada rápida aqui:

    Usando a linha de comando para criar e executar scripts (em Python).

    Embora possamos usar este tipo de abordagem para análise de dados para a realização de análises espaciais reais, não o faremos na Geocomptuação (provavelmente você ficará feliz em ler!).

    Isso ocorre porque, francamente, o terminal é bastante limitado em sua exibição de mapas e gráficos, um resultado importante de nosso trabalho aqui em Geocomputação e funcionalidade geral amigável. Na verdade, precisaríamos salvar nossas saídas em um arquivo cada vez para visualizá-las, o que acabaria sendo um fluxo de trabalho bastante desajeitado ...

    Em vez disso, o que é ótimo é que temos vários tipos diferentes de software e ambientes de desenvolvimento integrado que trazem a funcionalidade de execução de scripts junto com a capacidade de visualização que gostamos em nosso software GIS.

    Para nós da Geocomputação, nossa ferramenta de escolha para isso é R-Studio.

    Usando R e R-Studio para análise de dados

    Antes de prosseguirmos, o que quero deixar claro com este workshop - e o restante do módulo - é que a programação usando R e R-Studio é, em última análise, um ferramenta usaremos para concluir tarefas específicas que precisamos fazer para nossa análise de dados.

    Existem bastante de diferentes ferramentas por aí que você pode usar para alcançar os mesmos resultados (como você viu com Q-GIS, e sem dúvida tinha experiência no uso de alguns softwares de estatísticas / planilhas), mas escolhemos usar esta ferramenta porque ela nos fornece muitas vantagens sobre essas outras ferramentas - mais na próxima semana.

    Com isso ferramenta entretanto, há muito o que aprender sobre o princípios e a teoria por trás das linguagens de programação.

    Como evidente acima, embora possamos olhar para isso em muitos detalhes (há bastante da teoria por trás da programação que simplesmente não cobriremos - isso é para cientistas da computação), vamos nos concentrar no aspectos mais importante para nosso uso, que é abordado em nosso vídeo de aula principal abaixo: Princípios de programação para análise de dados na seção Programação para análise de dados.

    A segunda coisa a deixar claro é que R e R-Studio são duas coisas diferentes:

    R é a nossa linguagem de programação, que precisamos entender em termos de princípios gerais, sintaxe e estrutura.

    R-Studio é nosso Ambiente de desenvolvimento integrado, que precisamos entender em termos de funcionalidade e fluxo de trabalho.

    Ambiente de desenvolvimento integrado
    Um Ambiente de Desenvolvimento Integrado (IDE) é simplesmente uma maneira complicada de dizer “um lugar onde escrevo e construo scripts e executo meu código”.

    Hoje em dia, temos alguns IDEs realmente sofisticados que, quando souberem em qual linguagem você está codificando, destacarão diferentes tipos de código de acordo com o que representam (por exemplo, uma variável, uma função), bem como tentarão revisar / decifrar bug seu código "on-the-fly" antes mesmo de executá-lo.

    R-Studio é definitivamente um muito IDE sofisticado - uma vez que oferece bastante de funcionalidade além de apenas escrever scripts e executar códigos, como veremos nas próximas semanas.

    Como você já deve saber, R é uma linguagem de programação gratuita e de código aberto, que foi originalmente criada para focar na análise estatística.

    Em conjunto com o desenvolvimento de R como um idioma, a mesma comunidade criou o R-Studio IDE (ou realmente software agora!) para executar essa programação estatística.

    Junto, R e R-Studio tornou-se uma parceria de sucesso incrível de linguagem de programação analítica e software de análise - e é amplamente usada para pesquisas acadêmicas e também no setor comercial.

    Um dos grandes pontos fortes do R é que ele é de código aberto, pode ser usado em todos os principais sistemas operacionais de computador e é gratuito para qualquer pessoa. Como resultado, ele tem uma comunidade de colaboradores enorme e ativa que constantemente adiciona funcionalidade à linguagem e ao software, tornando-o uma ferramenta incrivelmente útil para muitos propósitos e aplicações além da análise estatística.

    Acredite ou não, toda a apostila que você está lendo agora foi criada no R-Studio, utilizando uma mistura de linguagens de programação, incluindo R, HTML, CSS e Markdown.

    R-Studio tem o flexibilidade para entender outras linguagens de programação que não R (incluindo Python!), enquanto R pode ser implantado fora do R-Studio ambiente em scripts autônomos e outros IDEs.

    No entanto, para nós, a parceria entre R e R-Studio funciona muito bem para o que queremos alcançar - então é isso que usaremos para o restante do módulo de Geocomputação.

    Como faço para usar o R-Studio?

    Ao contrário dos programas tradicionais de análise estatística, você pode ter usado, como Microsoft Excel ou mesmo SPSS, dentro do IDE R-Studio, o usuário precisa digitar comandos para fazer com que execute tarefas como carregar em um conjunto de dados ou realizar um cálculo.

    Fazemos isso principalmente construindo um script (ou documento semelhante, mais sobre isso na Semana 10), que fornece um registro do que você fez, ao mesmo tempo que permite a repetição direta de tarefas.

    Também podemos usar o R Console para executar instruções simples que não precisam ser repetidas - como instalar bibliotecas ou visualizar dados rapidamente (veremos isso em um segundo).

    Além disso, R, seus vários "pacotes" orientados para gráficos e R-Studio são capazes de fazer gráficos, tabelas e mapas através de apenas algumas linhas de código (você pode notar um Enredos janela à sua direita na janela do R-Studio) - que pode então ser facilmente modificada e ajustada fazendo pequenas alterações no script se houver erros.

    Infelizmente, a computação de linha de comando também pode ser desanimadora no início. É fácil cometer erros que nem sempre são óbvios de detectar e, portanto, depurar.

    No entanto, existem boas razões para ficar com R e R-Studio.

    É amplamente intuitivo com um forte foco em gráficos de qualidade publicável.

    É 'inteligente' e oferece boas práticas integradas - tende a seguir as convenções estatísticas e apresentar dados de forma sensata.

    Isto é gratuitamente, plataforma cruzada, personalizável e extensível com uma gama completa de pacotes / bibliotecas ('add ons'), incluindo aqueles para escolha discreta, regressão multinível e longitudinal e mapeamento, estatísticas espaciais, regressão espacial e geoestatística.

    É muito respeitado e usado nas maiores empresas de tecnologia do mundo (incluindo Google, Microsoft e Facebook, e em centenas de outras empresas).

    Oferece um habilidade transferível que mostra aos empregadores em potencial experiência tanto em estatística quanto em computação.

    A intenção dos elementos práticos desta semana é fornecer uma introdução completa ao R-Studio para você começar:

    1. Os princípios básicos de programação por trás de R.

    2. Carregar dados de arquivos csv, filtrar e subdividir em pedaços menores e juntá-los.

    3. Calculando uma série de estatísticas para exploração e verificação de dados.

    4. Criação de gráficos básicos e mais complexos para visualizar os valores de distribuição dentro de um conjunto de dados.

    O que você deve lembrar é que o R / R-Studio tem uma curva de aprendizado acentuada, mas os benefícios de usá-lo valem o esforço.

    Eu recomendo fortemente que você tome seu tempo e pense em cada pedaço de código que você digita - e também lembre-se de comentar seu código (nós falaremos sobre isso em breve!).

    A melhor maneira de aprender R é pegar o código básico fornecido em tutoriais e experimentar a alteração de parâmetros - como a cor dos pontos em um gráfico - para realmente "entrar no capô" do software.

    Faça muitas anotações à medida que avança e se estiver realmente ficando frustrado, faça uma pausa!

    Esta semana, nos concentramos exclusivamente no uso de R e R-Studio (de agora em diante, isso pode ser simplesmente denotado como R) para análise de dados estatísticos básicos.

    Na próxima semana, vamos apresentar o uso de R para análise espacial (dados) - mas há muito o que fazer hoje para entender os princípios fundamentais do uso de R (e da programação em geral).

    Acessando R-Studio para Geocomputação

    Você tem duas opções para usar o R-Studio neste módulo.

    Usando R-Studio Desktop: Você deve ter instalado isso na semana 1 de acordo com as instruções de instalação do software.

    • Primeiro faça login no UCL VPN ou UCL China Connect.
    • Para usar o servidor R-Studio, abra um navegador da web e navegue até: https://rstudio.data-science.rc.ucl.ac.uk/
    • Faça login com o seu nome de usuário e senha UCL usuais.
    • Você deve ver a interface do RStudio aparecer.
    • Se for a primeira vez que você faz logon no servidor RStudio, você só verá a interface do RStudio aparecer depois de clicar em iniciar uma nova sessão botão.

    Você pode usar qualquer uma das abordagens - mas reconheça que podem haver algumas diferenças em como nosso código aparece.

    O código abaixo foi criado em um R-Studio Desktop versão 1.2.5033 e testado no servidor R-Studio.

    O servidor RStudio só funcionará com uma conexão VPN ativa que conecta seu computador pessoal à rede da UCL. Estudantes na China continental podem querer usar o UCL China Connect. Os alunos que usam um computador Mac que está executando na versão mais recente do MacOS (MacOS Big Sur), são aconselhados a usar o Desktop @ UCL, pois o aplicativo VPN Cisco AnyConnect pode não funcionar. Se você não conseguir acessar o servidor (por exemplo, seu navegador exibe um Este site não pode ser acessado mensagem), significa que sua conexão VPN não está funcionando corretamente. Certifique-se de que sua VPN está funcionando corretamente ou use Desktop @ UCL Anywhere em seu lugar.

    Uma introdução ao R-Studio e sua interface

    Vamos abrir o R-Studio (Desktop ou Servidor) e primeiro faremos um rápido tour pelos vários componentes da interface do ambiente R-Studio e como e quando usá-los:

    Apresentando a interface R-Studio

    Como você já ouviu falar, o R-Studio tem várias janelas que você usa para diferentes propósitos - e você pode personalizar seu layout de acordo com sua preferência.

    Quando você abre o R-Studio pela primeira vez, ele deve ser parecido com isto:

    As janelas principais (painel / painel) para manter o foco agora são:

    Console: onde escrevemos código “único”, como a instalação de bibliotecas / pacotes, bem como a execução de visualizações rápidas ou gráficos de nossos dados.

    arquivos: onde nossos arquivos são armazenados em nosso sistema de computador - pode ajudar a verificar caminhos de arquivos, bem como nomes de arquivos e gerenciamento geral de arquivos.

    Meio Ambiente: onde nossas variáveis ​​são registradas - podemos descobrir bastante sobre nossas variáveis ​​olhando para a janela Ambiente, incluindo estrutura de dados, tipo (s) de dados e os campos e "atributos" de nossas variáveis.

    Enredos: os resultados de nossos gráficos, tabelas e mapas são mostrados aqui.

    Ajuda: onde você busca por ajuda, por ex. digitando uma função para descobrir seus parâmetros.

    Você também pode ter o seu Janela de Script open, que é onde construímos e escrevemos o código, para a) manter um registro de nosso trabalho, b) nos permitir repetir e executar novamente o código, muitas vezes com parâmetros diferentes. Não usaremos esta janela até que cheguemos às instruções práticas finais.

    Veremos como usamos essas janelas à medida que avançamos neste tutorial e entenderemos em mais detalhes o que queremos dizer com palavras como "atributos" (não se confunda aqui com o Tabela de Atributos para Q-GIS) e estruturas de dados.

    Programação para Análise de Dados

    Antes de começarmos a usar o R-Studio, primeiro precisamos dar alguns passos para trás e abordar a maior curva de aprendizado da sala, que é: Como faço para programar?.

    Como afirmado anteriormente, R / R-Studio é apenas uma ferramenta - mas para usá-lo, você precisa entender como escrever código em R de forma eficaz e, é claro, com precisão para fazer sua análise funcionar.

    Isso significa que precisamos aprender e compreender:

    • Sintaxe Básica
    • Estruturas e tipos de dados
    • Funções e bibliotecas / pacotes
    • Programação Orientada a Objetos

    Aqui, fornecemos uma breve introdução aos princípios básicos da programação, com foco na Programação Orientada a Objetos.

    Este é um vídeo que você pode querer assistir novamente depois de concluir o prático de hoje.

    Princípios de programação para análise de dados

    Na palestra acima, você ouviu sobre os diferentes, incluindo:

    Sintaxe usando variáveis e funções

    Importância de tipos de dados e estruturas de dados

    O papel de pacotes / bibliotecas na expansão da funcionalidade do R

    E uma breve introdução ao Object-Oriented Programin (OOP)

    Podemos colocar alguns desses princípios em ação testando alguns dos recursos do R-Studio com algumas pequenas peças de codificação agora.

    Usando o console no R-Studio

    Vamos primeiro começar usando Console do R-Studio para testar algumas das funcionalidades embutidas do R, criando algumas variáveis, bem como um conjunto de dados fictício que seremos capazes de analisar - e para nos familiarizarmos com a escrita de código.

    Observe que pode ser necessário clicar na janela do console para expandi-la - você pode arrastá-la para ocupar um espaço maior na janela do R-Studio.

    O vídeo abaixo fornece uma visão geral do breve tutorial com explicações adicionais, então se você já está um pouco preso, você pode assistir quando começar a completar as instruções a seguir.

    Usando o console no R-Studio para programação

    No console do R-Studio, você verá um sinal de prompt - & gt à esquerda - isso significa que estamos prontos para começar a escrever código (um pouco como antes no shell).

    Avisos de erro no console

    Qualquer coisa que apareça em vermelho na linha de comando significa que é um erro (ou um aviso), então você provavelmente precisará corrigir seu código.

    Se você vir um & gt à esquerda, significa que você pode digitar sua próxima linha, um + significa que você não terminou a linha de código anterior.

    Como ficará claro, os sinais + costumam aparecer se você não fechar os colchetes ou se não terminar seu comando da maneira que R esperava.

    Em seu console, vamos prosseguir e conduzir alguns cálculos matemáticos rápidos - em sua forma mais básica, todas as linguagens de programação podem funcionar como calculadoras!

    Entrada de Comando

    Depois de pressionar Enter, você verá a resposta de 120 retornada abaixo.

    Ótimo, agora você aprendeu como inserir o código no console do R-Studio! Muito semelhante à CLI do seu computador, certo ?!

    Armazenando Variáveis

    Mas em vez de usar números e valores "brutos" ou "autônomos", queremos principalmente usar variáveis ​​que armazenam esses valores (ou grupos deles) sob um nome memorável para fácil referência posterior.

    Na terminologia R, isso é chamado criando um objeto e este objeto é armazenado como um variável.

    Fazemos isso usando o símbolo & lt- é usado para atribuir o valor ao nome da variável que você forneceu.

    Vamos tentar isso.

    Vamos criar duas variáveis ​​para experimentar:

    2. Digite dez & lt-10 no console e execute.

    Você acabou de criar sua primeira variável.

    Você verá que nada é retornado no console - mas se você verificar a janela Ambiente, ela agora aparece como uma nova variável que contém o valor associado.

    Mais uma vez, você não verá nada retornado ao console, mas verifique sua janela de ambiente para sua variável.

    Agora armazenamos dois números em nosso ambiente - e dados a eles nomes de variáveis ​​muito bons para fácil referência.

    R armazena esses objetos como variáveis ​​na RAM do seu computador para que possam ser processados ​​rapidamente.

    Sem salvar seu ambiente (veremos isso a seguir), essas variáveis ​​seriam perdidas se você fechasse R (ou ele travaria).

    Agora que temos nossas variáveis, vamos prosseguir e fazer a mesma matemática de multiplicação simples:

    Você deve ver a saída no console do 120 (é claro. ).

    Embora essa matemática possa parecer trivial, é, na verdade, extremamente poderosa, pois mostra como essas variáveis podem ser tratados da mesma forma que os valores que contêm.

    Você deve obter uma resposta de 960. Como você pode ver, podemos misturar variáveis com valores brutos sem quaisquer problemas.

    Nós também podemos armazenar a saída de cálculos variáveis como um nova variável.

    Como armazenamos a saída de nossa matemática em uma nova variável, a resposta não retornará à tela.

    Acessando e retornando variáveis

    Podemos pedir ao nosso computador para retornar essa saída simplesmente digitando-a no console.

    1. Peça ao computador para retornar a saída da variável. Você deve ver que obtemos o mesmo valor da equação anterior.

    Variáveis ​​de diferentes tipos de dados

    Também podemos armazenar variáveis ​​de diferentes tipos de dados, não apenas números, mas também texto.

    Acabamos de armazenar nossa frase feita de uma combinação de caracteres, incluindo letras e números.

    Uma variável que armazena “palavras” (que podem ser sentenças, códigos ou nomes de arquivos) é conhecida como string. Uma string é sempre denotada pelo uso do " ".

    Vamos acessar nossa variável para ver o que agora está armazenado em nosso computador.

    Você deve ver toda a nossa frase retornada - e incluída em "".

    Novamente, simplesmente inserindo nossa variável no console, pedimos a R para retornar nossa variável para nós.

    Chamando funções em nossas variáveis

    Nós também podemos ligar uma função em nossa variável.

    Este uso de ligar é um termo de programação muito específico e geralmente o que você costuma dizer "usar" uma função.

    O que significa simplesmente é que usaremos um específico função para faça alguma coisa à nossa variável.

    Por exemplo, também podemos pedir a R para impressão nossa variável, que nos dará a mesma saída que acessá-la diretamente por meio do console:

    Acabamos de usar nossa primeira função: print (). Esta função encontra ativamente a variável e então retorna isso para a nossa tela.

    Você pode digitar? Print no console para saber mais sobre a função print ().

    Isso pode ser usado com qualquer função para obter acesso a seus documentação que é essencial para saber como usar a função corretamente e entender sua saída.

    Em muitos casos, uma função levará mais de um argumento ou parâmetro, por isso é importante saber o que você precisa fornecer à função para que ela funcione.

    Por enquanto, estamos usando funções que só precisam de um argumento.

    Retornando funções

    Quando uma função fornece uma saída, como esta, é conhecida como voltando.

    Nem todas as funções irão Retorna uma saída para sua tela - eles simplesmente Faz o que você os acessa para fazer, então frequentemente usaremos um print () demonstração ou outro tipo de voltando função para verificar se a função foi bem-sucedida ou não - mais sobre isso mais tarde na oficina.

    Examinando nossas variáveis ​​usando funções

    Dentro do base Na linguagem R, existem várias funções que foram escritas para nos ajudar a examinar e descobrir informações sobre nossas variáveis.

    Por exemplo, podemos usar a função typeof () para verificar que tipo de dados nossa variável é:

    Você deverá ver a resposta: "personagem". Como é evidente, nossa str_variable é um tipo de dados de caractere.

    Podemos tentar testar isso em uma de nossas variáveis ​​anteriores.

    Você deverá ver a resposta: "duplo". Como é evidente, nosso dez é um tipo de dados duplo.

    Para objetos de alto nível que envolvem estruturas de dados (mais complicadas), como quando carregamos um csv em R como um quadro de dados, também podemos verificar o que aula nosso objeto é o seguinte:

    Neste caso, você obterá a mesma resposta - "personagem" - porque, em R, sua classe e tipo são os mesmos: um caractere.

    Em outras linguagens de programação, você pode ter retornado "string", mas isso significa efetivamente a mesma coisa.

    Vamos tentar testar nossas dez variáveis:

    Nesse caso, você obterá uma resposta diferente - "numérica" ​​- porque a classe desta variável é numérica.

    Isso ocorre porque a classe de objetos numéricos pode conter duplos (decimais) ou inteiros (números inteiros).

    Podemos testar isso perguntando se nossas dez variáveis ​​são inteiras ou não.

    Você deve ver que obtemos a resposta FALSE - como sabemos de nossa função typeof () anterior, nossa variável dez é armazenada como um duplo e, portanto, não pode ser um inteiro.

    Embora saber disso possa não parecer importante agora, quando se trata de nossa análise de dados, a diferença de um número decimal em relação a um número inteiro pode facilmente adicionar bugs em nosso código!

    Podemos incorporar esses testes em nosso código quando precisamos avaliar uma saída de um processo e fazer alguns testes de garantia de qualidade de nossa análise de dados.

    Também podemos perguntar como longo nossa variável é - neste caso, descobriremos quantos conjuntos de caracteres (strings) são armazenados em nossa variável, str_variable.

    Você deve obter a resposta 1 - já que temos apenas um conjunto de caracteres.

    Também podemos perguntar quanto tempo cada conjunto de caracteres está dentro de nossa variável, ou seja, perguntar quanto tempo a string contida por nossa variável tem.

    Você deve obter uma resposta de 31.

    Criação de um objeto de dois elementos

    Vamos continuar e testar essas duas funções um pouco mais, criando uma nova variável para armazenar dois conjuntos de strings dentro de nosso objeto, ou seja, nossa variável conterá dois elementos.

    1. Digite two_str_variable & lt- c ("Esta é nossa segunda variável", "Ela tem duas partes") no console e execute.

    Neste trecho de código, criamos uma nova variável usando o c função em R, que significa "combinar valores em um vetor ou lista.

    Fornecemos essa função com dois conjuntos de strings, usando um vírgula para separar nossas duas strings - todas contidas no ().

    Agora você deve ver uma nova variável em sua janela de ambiente que nos diz que é a) chr: characters, b) contém 2 itens, ec) lista esses itens.

    Vamos agora tentar os nossos comprimento() e nchar () em nossa nova variável e veja quais são os resultados.

    Você deve ter visto que a função length () agora retornou um 2 e a função nchar () retornou dois valores de 34 e 22.

    Há uma função final que frequentemente queremos usar com nossas variáveis ​​quando as exploramos pela primeira vez, que é os atributos () - como nossas variáveis ​​são muito simples, elas atualmente não têm nenhum atributo (você pode digitar o código e tente), mas é uma função realmente útil, que veremos mais tarde.

    Nós nos divertimos experimentando variáveis ​​simples em nosso console - e aprendemos sobre muitas novas funções podemos usar com nosso código.

    Na verdade, nós aprendemos 7 funções - você pode nomear / lembrar de todos sem rolar para cima?

    Se você não puder, eu altamente recomendado tomar notas sobre cada uma das funções - mesmo que seja apenas um lista curta das funções e o que elas fazem.

    Agora vamos prosseguir para a criação e análise de nosso conjunto de dados fictício - portanto, dedos cruzados para que você se lembre deles à medida que avançamos.

    Usando comentários em nosso código

    Além de fazer anotações sobre as funções que encontrará no workshop, você deve observar que, a cada linha de código que escrevi, forneci um Comente para explicar o que o código faz.

    Os comentários são denotados com o símbolo de hash #. Isso comenta essa linha específica para que R a ignore quando o código for executado.

    Esses comentários irão ajudá-lo no futuro quando você retornar aos scripts uma semana ou mais depois de escrever o código - bem como ajudar outras pessoas a entender o que está acontecendo ao compartilhar seu código.

    É uma boa prática escrever comentários como você codifica e não deixá-lo fazer retrospectivamente - porque posso dizer por experiência própria - você certamente não o fará.

    Embora estejamos usando o console, o uso de comentários não é necessário - mas à medida que começamos a construir um script em toda a nossa prática, você vai considerá-los essenciais para ajudar a entender seu fluxo de trabalho no futuro!

    Analisando dados fictícios no R-Studio usando o console

    Os objetos que criamos e jogamos acima são muito simples: armazenamos strings simples ou valores numéricos - mas o verdadeiro poder do R vem quando podemos começar a executar funções em objetos mais complexos.

    Como ouvimos em nossa palestra, R aceita quatro principais tipos de estruturas de dados: vetores, matrizes, quadros de dados, e listas.

    Até agora, nos envolvemos com um único item ou um item duplo vetor - para o último, usamos a função c () para nos permitir combinar nossas duas strings em um único vetor.

    Podemos usar essa mesma função para criar e construir objetos mais complexos - que podemos usar com alguns funções estatísticas.

    Vamos tentar fazer isso usando um conjunto simples de dados fictícios: vamos usar o número total de páginas e datas de publicação das várias edições de Ciência e Sistemas de Informação Geográfica (GISS) para nossa breve análise simulada:

    Edição de livro Ano Número total de páginas
    2001 454
    2005 517
    2011 560
    2015 477

    Como podemos ver, em última instância desejaremos armazenar os dados em uma tabela como acima (e poderíamos facilmente copiar isso para um csv para carregar em R, se quiséssemos).

    Mas queremos aprender um pouco mais sobre estruturas de dados em R, portanto, iremos em frente e construiremos esta tabela “manualmente”.

    Limpando nosso espaço de trabalho Environemnt

    Primeiro, vamos limpar nosso espaço de trabalho e remover nossas variáveis ​​atuais:

    Observe, é claro que você pode copiar e colar este código - ou tentar usar a função tab para preencher automaticamente os nomes das variáveis ​​no console conforme você começa a digitá-los, assim como fizemos ao usar a linha de comando.

    Agora você deve ver que não temos mais nenhuma variável em nossa janela - acabamos de usar a função rm () para remover essas variáveis ​​de nosso ambiente.

    Manter um espaço de trabalho limpo é outra recomendação de boas práticas no futuro.

    Claro, não queremos nos livrar de quaisquer variáveis ​​que possamos precisar usar mais tarde - mas remover quaisquer variáveis ​​que não precisamos mais (como variáveis ​​de teste) ajudará você a entender e gerenciar seu código e seu ambiente de trabalho.

    Criação de um vetor atômico de vários elementos

    O primeiro objeto de dados complexo que criaremos é um vetor.

    Um vetor é a estrutura de dados mais comum e básica em R e é praticamente o burro de carga de R.

    Os vetores são uma coleção de elementos compostos principalmente por caracteres, números inteiros lógicos ou tipos de dados numéricos.

    Tecnicamente, os vetores podem ser de dois tipos:

    • Vetores atômicos (todos os elementos são do mesmo tipo de dados)
    • Listas (os elementos podem ser de diferentes tipos de dados)

    Embora na prática o termo “vetor” se refira mais comumente aos tipos atômicos e não a listas.

    As variáveis ​​que criamos acima são, na verdade, vetores - no entanto, são compostas por apenas um ou dois elementos. Queremos fazer vetores complexos com mais elementos para eles.

    Vamos criar nosso primeiro vetor "complexo" oficial, detalhando os diferentes números totais de páginas para GISS:

    Podemos ver que temos nosso número total de páginas coletadas em um único vetor. Poderíamos, se quisermos, executar algumas funções estatísticas em nosso objeto vetorial:

    Agora completamos nosso primeiro conjunto de estatísticas descritivas em R!

    Agora sabemos que o número médio de páginas que o livro GISS contém é de 497 páginas - é claro que é uma coisa realmente emocionante, mas esperamos que seja um exemplo fácil de usar.

    Mas vamos ver como podemos construir nosso objeto vetorial adicionando um segundo objeto vetorial que detalha os anos relevantes de nosso livro.

    Observe que inseri o número total de páginas em uma ordem específica para corresponder a essas datas de publicação (ou seja, cronológica), conforme descrito na tabela acima.

    Como resultado, inserirei o ano de publicação na mesma ordem.

    Mais uma vez, coisas realmente emocionantes.

    É claro que, por si só, os dois vetores não significam muito - mas podemos usar a mesma função c () para combinar os dois para criar uma matriz.

    Criando uma matriz de dois vetores

    Em R, uma matriz é simplesmente uma extensão dos vetores numéricos ou de caracteres.

    Eles não são um tipo separado de objeto em si, mas simplesmente um vetor que tem duas dimensões.

    Ou seja, eles contêm ambos filas e colunas.

    Tal como acontece com os vetores atômicos, os elementos de uma matriz devem ser do mesmo tipo de dados.

    Como tanto os números das nossas páginas quanto os nossos anos são numéricos (podemos verificar isso usando qual função?), podemos adicioná-los para criar uma matriz usando a função matrix ():

    Mais uma vez, vamos verificar os resultados.

    O problema das matrizes - como você pode ver acima - é que, para nós, elas não têm uma grande utilidade.

    Se olhássemos para esta matriz isoladamente do que sabemos que ela representa, não saberíamos realmente o que fazer com ela.

    Como resultado, tendemos a usar principalmente Frames de dados em R, pois oferecem a oportunidade de adicionar nomes de campo às nossas colunas para ajudar na sua interpretação.

    Argumentos / parâmetros em funções

    A função que acabamos de usar acima, ‘matrix ()’, foi a primeira função que usamos que recebeu mais de um argumento.

    Nesse caso, os argumentos que a matriz precisava para ser executada eram:

    1. Quais dados ou conjunto de dados devem ser armazenados na matriz.
    2. Em quantas colunas (ncol =) precisamos armazenar nossos dados.

    A função pode, na verdade, aceitar vários outros argumentos - mas eles não eram úteis para nós neste cenário, portanto, não os incluímos.

    Para quase qualquer pacote R, a documentação conterá uma lista dos argumentos que a função irá assumir, bem como em que formato as funções esperam esses argumentos e um conjunto de exemplos de uso.

    Entender como descobrir qual objeto e tipo de dados uma variável é essencial para saber se ela pode ser usada dentro de uma função - e se precisaremos transformar nossa variável em uma estrutura de dados diferente a ser usada para aquela função específica.

    Para qualquer função, haverá obrigatoriedade argumentos (ou seja, não será executado sem eles) ou opcional argumentos (ou seja, ele será executado sem eles, já que o padrão para este argumento foi definido geralmente como FALSE, 0 ou NULL).

    Criando um quadro de dados a partir de nossa matriz

    Um quadro de dados é um tipo de dados extremamente importante em R.

    É basicamente o estrutura de dados de fato para a maioria dos dados tabulares e o que usamos para estatísticas.

    É também a estrutura subjacente aos dados da tabela (o que chamaríamos de tabela de atributos no Q-GIS) que associamos aos dados espaciais - mais na próxima semana.

    Um quadro de dados é um tipo especial de lista em que cada elemento da lista terá o mesmo comprimento (ou seja, o quadro de dados é uma lista "retangular"),

    Essencialmente, um quadro de dados é construído a partir de colunas (que representam uma lista) e linhas (que representam um elemento correspondente em cada lista). Cada coluna terá a mesma quantidade de entradas - mesmo se, para essa linha, por exemplo, a entrada for simplesmente NULL.

    Os frames de dados podem ter atributos adicionais, como rownames (), que podem ser úteis para anotar dados, como subject_id ou sample_id ou mesmo UID. Em estatística, eles geralmente não são usados ​​- mas em análise espacial, esses IDs podem ser muito úteis.

    Algumas informações adicionais sobre frames de dados:

    Eles geralmente são criados por read.csv () e read.table (), ou seja, ao importar os dados para R.

    Assumindo que todas as colunas em um quadro de dados sejam do mesmo tipo, um quadro de dados pode ser convertido em uma matriz com data.matrix () (preferencial) ou as.matrix ().

    Você também pode criar um novo quadro de dados com a função data.frame (), por exemplo, uma matriz pode ser convertida em um quadro de dados, como veremos a seguir.

    Você pode descobrir o número de linhas e colunas com nrow () e ncol (), respectivamente.

    Frequentemente, os nomes de domínio são gerados automaticamente e têm a aparência 1, 2,…, n. A consistência na numeração de nomes de linhas pode não ser respeitada quando as linhas são reorganizadas ou subconjuntos.

    Vamos em frente e criar um novo quadro de dados a partir de nossa matriz:

    Agora temos um quadro de dados, podemos finalmente usar a função View () em R.

    Agora você deve ver uma tabela pop-up como uma nova guia em sua janela de script.

    Agora está começando a se parecer com a nossa mesa original - mas não ficaremos exatamente felizes com X1 e X2 como nossos nomes de campo - eles não são muito informativos.

    Renomeando nossos nomes de campo de coluna

    Em vez disso, o que podemos fazer é renomear nossos nomes de campo de coluna de quadro de dados usando a função names ().

    Antes de fazermos isso, leia o que a função names () faz.

    Como você pode ver, a função obterá ou definirá os nomes de um objeto, com a renomeação ocorrendo usando a seguinte sintaxe:

    O valor em si precisa ser um vetor de caracteres de até o mesmo comprimento de x ou NULL.

    Este é um dos aspectos legais da OOP, em que podemos acessar partes específicas de nosso objeto e alterá-lo sem alterar o objeto como um todo ou ter que criar um novo objeto / variável para efetuar nossas alterações.

    Temos duas colunas em nosso quadro de dados, então precisamos analisar nossa função names () com um vetor de caracteres com dois elementos.

    1. No console, devemos inserir duas linhas de código, uma após a outra. Primeiro, nosso vetor de caracteres com nossos novos nomes, new_names & lt- c ("ano", "page_nos") e, em seguida, a função names () contendo este vetor para renomear, nomes (giss_df) & lt- new_names:

    Você pode verificar seu quadro de dados novamente e ver os novos nomes usando a função View () ou clicando na guia no topo.

    Adicionando uma coluna ao nosso quadro de dados

    Ainda estamos perdendo uma coluna final de nosso quadro de dados - essa é a nossa edição do livro didático. Como este é um personagem tipo de dados, não teríamos sido capazes de adicionar isso diretamente à nossa matriz - em vez disso, teríamos esperado até que tivéssemos nosso quadro de dados para fazer isso.

    Isso ocorre porque os quadros de dados podem ter diferentes tipos de dados, ao contrário de matrizes - então, vamos em frente e adicionar o edição como uma nova coluna.

    Para fazer isso, seguimos um processo semelhante de criação de um vetor com nossas edições listadas em ordem cronológica, mas, em seguida, adicionamos isso ao nosso quadro de dados, armazenando esse vetor como uma nova coluna em nosso quadro de dados.

    Nós usamos o $ assine com nosso código que nos dá "acesso" à coluna do quadro de dados - então especificamos a edição da coluna, que embora não exista no momento, será criada a partir de nosso código que atribui nossa variável de edição a esta coluna.

    este $ é outro recurso do OOP.

    1. Crie uma variável de vetor de edição contendo nossos números de edição de livro didático - digite e execute a edição & lt- c ("1ª", "2ª", "3ª", "4ª"). Em seguida, armazenamos isso como uma nova coluna em nosso quadro de dados sob o nome da coluna edição digitando e executando giss_df $ edition & lt- edition:

    Novamente, você pode verificar seu quadro de dados e ver a nova coluna usando a função View () ou clicando na guia no topo.

    Agora você deve ter um quadro de dados semelhante a:

    Agora que temos nosso quadro de dados, vamos descobrir um pouco sobre ele.

    Podemos primeiro retornar as dimensões (o tamanho) de nosso quadro de dados usando a função dim () (dim significa simplesmente dimensões neste caso.).

    Podemos ver que temos quatro filas e três colunas.

    E podemos finalmente usar nossa função de atributos () para obter os atributos de nosso quadro de dados.

    Você deve ver que agora obtemos uma lista dos nomes das colunas e das linhas, além da classe do quadro de dados.

    muito mais poderíamos agora fazer com nosso quadro de dados, mas simplesmente não temos tempo - e preferiríamos implementar algumas dessas funções ou técnicas de gerenciamento de dados com um conjunto de dados muito mais emocionante do que os detalhes do GISS livro didático.

    Esperançosamente, porém, isso serviu como uma boa introdução às diferentes estruturas de dados que você encontrará nas próximas 6 semanas à medida que usarmos R - e forneceu-lhe um código simples que você pode retornar repetidamente para lembretes, como criar uma nova coluna em seu quadro de dados.

    Antes de deixarmos o console (e para ser honesto, não vamos deixá-lo exatamente para trás), inseriremos uma última linha de código por enquanto:

    Deixe este código rodar - pode levar algum tempo, mas você não precisa se preocupar com isso até que você passe para a seção prática.

    Agora estamos prontos para passar para nossa próxima seção, mas primeiro - depois de ler as dicas e recapitulação abaixo - eu recomendo que você faça uma intervalo grande desta pasta de trabalho!

    Dicas e truques de amplificação

    R faz distinção entre maiúsculas e minúsculas, portanto, certifique-se de capitalizar tudo corretamente, se necessário.

    Os espaços entre as palavras não importam, mas as posições das vírgulas e colchetes sim. Lembre-se, se você encontrar o prompt, & gt, substituído por um +, é porque o comando está incompleto. Se necessário, pressione a tecla Escape (esc) e tente novamente.

    É importante inventar bons nomes para seus objetos. No caso da maioria de nossas variáveis, usamos um sublinhado _ para separar as palavras. É uma boa prática manter os nomes dos objetos o mais curtos possível, mas eles ainda precisam ser fáceis de ler e limpar o que estão se referindo. Estar ciente: você não pode começar um nome de objeto com um número!

    Avanços na codificação

    1. Inseriu seus primeiros comandos na interface de linha de comando R.
    2. Objetos criados em R.
    3. Criou um vetor de valores.
    4. Executou algumas funções R simples.
    5. Criou um quadro de dados.

    A filosofia e os princípios do Tidyverse

    Nas últimas semanas, muitas informações chegaram até você, mergulhando fundo no mundo do GIScience ... e agora da programação.

    No entanto, enquanto você está lentamente se tornando proficiente no uso de dados espaciais e felizmente gostando de aprender como codificar, também precisamos aprender sobre como nosso dados é estruturada e organizado.


    Eu disse que havia algumas curvas de aprendizado neste módulo!

    Isso é crucial para quando você está trabalhando em seus próprios projetos, nos quais você mesmo precisa fornecer dados: a grande maioria dos dados que você encontrará no domínio público (ou domínio privado, nesse caso) será o que está se tornando coloquialmente chamado : dados sujos.

    O que queremos dizer com dados sujos são dados que precisam de alguma forma de pré-processamento, limpeza e ligação antes que você possa usá-los para sua análise.

    Vamos relembrar os dados da população de distrito e distrito que você baixou do ONS - não poderíamos usar a planilha do Excel imediatamente, pois estava dentro de uma grande pasta de trabalho com a) muitas guias eb) muita formatação adicional (por exemplo, linhas vazias, “Espaço em branco”).

    Em vez disso, extraímos os dados que queríamos e os formatamos em uma tabela muito simples, consistindo apenas em campos que continham registros individuais para cada um de nossos Wards ou Boroughs.

    Esta tabela se encaixaria no que é entendido como o dados organizados abordagem, que é uma perspectiva geral sobre como estruturar seus dados em R para facilitar sua análise.

    Dados organizados foi formalizado por R Wizard Hadley Wickham em sua contribuição para o Journal of Statistical Software como uma forma de estruturar seus dados de forma consistente.

    Nas palavras do Wizard:

    Depois de ter os dados organizados e as ferramentas organizadas fornecidas pelos pacotes no tidyverse, você gastará muito menos tempo transferindo os dados de uma representação para outra, permitindo que dedique mais tempo às questões analíticas em questão.

    este dados organizados A abordagem está no centro do pacote tidyverse R que acabamos de instalar - e para nós, que logo seremos conhecedores de dados secundários, também é de grande importância ao organizar seus dados para projetos futuros.

    Então, como são os dados organizados?

    Dados organizados na prática

    Acredite ou não, muitas vezes você pode representar os mesmos dados subjacentes de várias maneiras.

    O exemplo abaixo, retirado do pacote tidyverse e descrito no livro R for Data Science, mostra que os mesmos dados podem ser organizados de quatro maneiras diferentes.

    Os dados mostram a população e os casos (de alguma coisa, por exemplo, malária) para cada país, para 1999 e 2000:

    Nenhuma dessas representações está errada per se, no entanto, não são igualmente fáceis de usar.

    Apenas mesa 1 podem ser considerados dados organizados porque é a única tabela que segue as três regras que tornam um conjunto de dados organizado:

    1. Cada variável deve ter sua própria coluna.
    2. Cada observação deve ter sua própria linha.
    3. Cada valor deve ter sua própria célula.

    No caso da Tabela 4 - temos até duas tabelas!

    Essas três regras estão inter-relacionadas porque é impossível satisfazer apenas duas das três. Essa inter-relação leva a um conjunto ainda mais simples de instruções práticas:

    Coloque cada conjunto de dados em uma tabela / quadro de dados / tabela.

    Coloque cada variável em uma coluna.

    Figura 4.1: Uma representação visual de dados organizados por Hadley Wickham.

    Por que garantir que seus dados estejam organizados?

    Bem, existem duas vantagens principais (de acordo com Hadley Wickham):

    Há uma vantagem geral em escolher uma maneira consistente de armazenar dados. Se você tem uma estrutura de dados consistente, é mais fácil aprender as ferramentas que funcionam com ela, porque elas têm uma uniformidade subjacente.

    Há uma vantagem específica em colocar variáveis ​​em colunas porque permite que a natureza vetorizada de R brilhe. Como você aprendeu nas funções de mutação e resumo, a maioria das funções R integradas funcionam com vetores de valores. Isso faz com que a transformação de dados organizados pareça particularmente natural.

    Veremos tudo isso em ação nas próximas semanas - mas, se desejar, você pode ouvir essa explicação diretamente de um dos cientistas de dados residentes da R-Studio abaixo.

    Você não precisa ouvir o vídeo inteiro, mas desde o início até aproximadamente 7: 40 minutos.

    O R-Studio Youtube Geralmente, o canal também é um ótimo recurso para você estar ciente ao prosseguir com seu aprendizado na R.

    Então, qual é o Tidyverse?

    O tidyverse é uma coleção de pacotes projetados especificamente para essas tarefas de data sciencey de preparação, gerenciamento, limpeza, análise e visualização de dados dentro do R-Studio.

    Nossa aula anterior apresentou o conceito de pacote - mas eles são explicados com mais detalhes a seguir.

    Embora em muitos casos diferentes pacotes funcionem de maneira ligeiramente diferente, todos os pacotes do tidyverse compartilham a filosofia de design subjacente, gramática e estruturas de dados, como veremos nas próximas semanas.

    O próprio tidyverse é tratado e carregado como um único pacote, mas isso significa que se você carregar o pacote tidyverse dentro do seu script (por meio da biblioteca (tidyverse)), terá acesso direto a todas as funções que fazem parte de cada um dos pacotes que estão dentro do tidyverse geral. Isso significa que você não precisa carregar cada pacote separadamente - economizando linhas de código, ótimo!

    Já executamos o código para instalar o tidyverse em nossas várias versões de R - mas, como o tidyverse consiste em vários pacotes, pode demorar um pouco antes de tudo ser instalado, então seja paciente!

    Para obter mais informações sobre o tidyverse, dê uma olhada em https://www.tidyverse.org/.

    Como o tidyverse ajuda a organizar os dados?

    Existem algumas funções específicas no conjunto tidyverse de pacotes que nos ajudarão a limpar e preparar nossos conjuntos de dados para criar um conjunto de dados organizado.

    As funções mais importantes e úteis, dos pacotes tidyr e dplyr, são:

    Pacote Função Use para
    dplyr selecionar selecionar colunas
    dplyr filtro selecionar linhas
    dplyr mutação transformar ou recodificar variáveis
    dplyr resumir resumir dados
    dplyr agrupar por agrupar dados em subgropus para processamento posterior
    tidyr pivot_longer converter dados de formato amplo para formato longo
    tidyr pivot_wider converter conjunto de dados de formato longo para formato amplo

    Todas essas funções completam tarefas fundamentais que precisamos para manipular e manipular nossos dados.

    Vamos começar a usá-los nas próximas semanas, então não entre em pânico tentando se lembrar de todos eles agora.

    Instalando e usando bibliotecas / pacotes para análise de dados

    Como você deve ter ouvido em nossa aula anterior, nossas linguagens comuns de análise de dados, incluindo Python e R, desenvolveram grandes bases comunitárias e, como resultado, há uma quantidade significativa de ajuda e recursos de suporte para aqueles que trabalham com ciência de dados.

    Além de ajuda e suporte, essas grandes bases comunitárias têm sido essenciais para expandir a utilidade de uma linguagem de programação para tipos específicos de análise de dados.

    Isso ocorre por causa de como as linguagens de programação funcionam - elas têm uma biblioteca central de funções para fazer certas coisas, como calcular a média de um conjunto de dados como fizemos anteriormente.

    Mas para fazer uma análise mais específica ou especializada, como criar um buffer em torno de um ponto, uma função precisa ser escrita para habilitar isso.

    Você precisa escrever a função sozinho - ou esperar que outra pessoa a tenha escrito - além disso, você precisa saber que existem funções de suporte em torno dela. Por exemplo. seu código pode “ler” seus dados espaciais e saber a) seu espaço eb) o sistema de projeção é capaz de calcular uma distância.

    Sem isso, você não será capaz de executar sua função ou fazer sua análise.

    Essas bases da comunidade identificaram essas lacunas, como para leitura e análise de dados espaciais, e passaram uma quantidade considerável de tempo escrevendo essas funções e funções de suporte para adicionar à biblioteca central.

    Essas funções geralmente são empacotadas em uma biblioteca adicional (ou podem ser chamadas de pacote) que você adiciona à sua própria biblioteca central instalando essa biblioteca em seu computador E depois importando-a para seu trabalho por meio de seu script.

    Os pacotes tidyr e dplyr com o tidyverse são apenas dois exemplos dessas bibliotecas adicionais criadas pela comunidade R mais ampla.

    O código que você acabou de executar perguntou R-Studio para buscar e instalar o tidyverse em seu R-Studio - isso significa que poderemos usar essas bibliotecas em nossa prática a seguir, simplesmente usando o código da biblioteca (tidyverse) na parte superior de nosso script.

    Uma coisa que precisamos ser consciente de quando se trata de usar funções nestes adicional bibliotecas, é que às vezes essas funções são chamadas da mesma coisa que a base R pacote, ou mesmo, em alguns casos, outra biblioteca adicional.

    Portanto, muitas vezes precisamos especificar de qual biblioteca queremos usar esta função, e isso pode ser feito com um comando simples (library :: function) em nosso código - como veremos na prática nas próximas semanas, então apenas faça uma anotação mental disso por enquanto.

    Embora tenhamos ido em frente e instalado o tidyverse, cada vez que iniciarmos um novo script, precisaremos carregar o tidyverse.

    Vamos mostrar tudo isso em nosso próximo Prcatical, que permite que você analise o crime em Londres enquanto põe em prática tudo o que discutimos hoje.

    Prática 3: Analisando o Crime em 2020 em Londres

    Uau, passamos por muito hoje - e mal começamos nossa prática!

    Mas, o que posso dizer, é que não há muito mais para aprender em termos de princípios e aspectos práticos da programação além de construir seu “dicionário / vocabulário” de bibliotecas de programação e respectivos comandos.

    Há alguns mais complicado codificando coisas que podemos fazer, como loops for e while e instruções if, mas, por enquanto, considere-se um programador iniciante sólido.

    Como resultado, estamos prontos para colocar tudo isso em prática em nossa prática hoje, que será relativamente curta em comparação com tudo o que você já passou acima.

    O que faremos hoje é executar uma análise exploratória de dados, usando estatísticas básicas, do crime em Londres durante um por mês base.

    Configurando o R-Studio para GEOG0030

    Na seção anterior, R pode ter parecido bastante trabalhoso. Tínhamos que inserir todos os nossos dados manualmente e cada linha de código tinha que ser escrita na linha de comando. Felizmente, esse não é o caso rotineiramente.

    No RStudio, podemos usar scripts para construir nosso código que podemos executar repetidamente - e salvar para uso futuro.

    Antes de iniciar um novo script, primeiro queremos nos preparar para o resto de nossas práticas, criando um novo projeto.

    Para colocá-lo de forma sucinta, projetos no R-Studio, mantenha todos os arquivos associados a um projeto juntos - dados de entrada, scripts R, resultados analíticos, números.

    Isso significa que podemos facilmente acompanhar - e acessar - entradas e saídas de diferentes semanas em nosso módulo, enquanto ainda criamos scripts autônomos para cada bit de análise de processamento que fazemos.

    Também faz com que lidar com diretórios e caminhos muito mais fácil - especialmente se você seguiram a estrutura de pastas que aconselhei no início do módulo.

    Vamos em frente e fazer um Novo projeto diretamente dentro de nosso GEOG0030 pasta.

    1. Clique em Arquivo - & gt Novo Projeto - & gt Diretório Existente e navegue até o seu GEOG0030 pasta. Clique em Criar Projeto.

    Agora você deve ver sua janela principal mudar para este novo projeto - e se você verificar arquivos janela, você deve ver agora um novo Projeto R chamado GEOG0030:

    Agora estamos “dentro” do projeto GEOG0030 - e qualquer pasta dentro do projeto GEOG0030 pode ser facilmente acessada por nosso código. Além disso, todos os scripts que criarmos serão salvos neste projeto. Observe que não existe uma pasta “script” em si, mas seus scripts simplesmente existirão neste projeto.

    Você pode testar essa mudança diretamente selecionando o terminal janela (ao lado do seu Console janela) para acessar o Terminal no R-Studio e digite nosso comando pwd. Você deve ver que nosso diretório atual é a sua pasta GEOG0030.

    R for Data Science de Hadley Wickham e Garret Grolemund

    Sua única leitura importante para esta semana é ler o R para ciência de dados manual - embora você possa ler cada seção em seu próprio lazer nas próximas semanas. Para esta semana, eu recomendo altamente ler mais sobre por que usamos Projetos, enquanto esta seção nos fala mais sobre Scripts. Eu ficaria com essas seções por enquanto, mas dê uma olhada rápida no que está disponível no livro.

    Configurando nosso script

    Em nossas sessões práticas mais curtas acima, nos divertimos um pouco brincando com o código R no console R e vendo como podemos armazenar variáveis ​​e acessar informações sobre elas. Além disso, vimos as diferentes estruturas de dados que podemos usar no futuro.

    Mas, em última análise, isso realmente não oferece a funcionalidade que desejamos para o nosso trabalho - ou mesmo a realidade do que precisamos fazer com a análise espacial.

    O que realmente queremos fazer é começar a construir scripts e adicione começar a analisar alguns dados!

    Portanto, para a maioria do nosso trabalho de análise, digitaremos nosso código dentro de um script e não o console.

    Vamos criar nosso primeiro script:

    1. Clique em Arquivo - & gt Novo arquivo - & gt R Script.
      • Você também pode usar o símbolo de mais sobre um quadrado branco como um atalho ou até mesmo Ctrl / CMD + Shift + N.

    Isso deve fornecer a você um documento em branco que se parece um pouco com a linha de comando. A diferença é que tudo o que você digitar aqui pode ser salvo como um script e executado novamente em uma data posterior.

    Vamos prosseguir e salvar este script imediatamente.

    Por meio do nosso nome, sabemos agora que nosso script foi criado na Semana 4 de Geocomputação e o código que ele conterá está relacionado ao processamento csv. Isso nos ajudará muito no futuro, quando encontrarmos o código que precisamos para outros projetos.

    Eu pessoalmente costumo usar um script por tipo de processamento ou análise que estou concluindo.

    Por exemplo, se você está fazendo bastante de limpeza de dados para criar um conjunto de dados final que você analisará, a prática recomendada é separar isso de seu script de análise para que você não limpe continuamente seus conjuntos de dados brutos ao executar seu script.

    Fornecendo ao nosso script alguns metadados

    O primeiro pedaço de código que você deseja adicionar a qualquer script é adicionar um TÍTULO. Este título deve dar a qualquer leitor uma compreensão rápida do que seu código alcança.

    Ao escrever um script, é importante fazer anotações sobre o que cada etapa está fazendo. Para fazer isso, o símbolo hash (#) é colocado antes de qualquer código. Isso comenta essa linha específica para que R a ignore quando o script for executado.

    Vamos seguir em frente e dar ao nosso script um TÍTULO - e talvez algumas informações adicionais:

    Carregue nossas bibliotecas

    Agora temos nosso título, o segundo pedaço de código que queremos incluir em nosso script é para carregar nossas bibliotecas (ou seja, os pacotes instalados de que precisaremos em nosso script):

    Ao carregar simplesmente o tidyverse, temos uma boa estimativa de que seremos capazes de acessar todas as funções de que precisaremos hoje.

    No entanto, frequentemente, ao desenvolver um script, você perceberá que precisará adicionar bibliotecas conforme avança para usar uma função específica, etc.

    Quando você faz isso, sempre adicione sua biblioteca ao topo de seu script - se você compartilhar seu script, isso ajuda a pessoa com quem você está compartilhando a reconhecer rapidamente se ela precisa instalar qualquer pacote adicional antes de tentar executar o script. Isso também significa que suas bibliotecas não se perdem nas várias linhas de código que você está escrevendo.

    Configurando nosso diretório

    Compreender e acessar nosso caminho de diretório costumava ser a pior parte da programação. E se você não usar a abordagem de Projeto defendida acima, certamente continuará a ser.

    Se, por exemplo, não usamos uma abordagem de projeto, precisaríamos definir nosso diretório de trabalho diretamente em nosso script usando o comando:

    Portanto, precisamos saber qual é o nosso caminho e esperar não cometer erros. Existem alguns atalhos automatizados para fazer isso em R usando a janela Arquivos, mas, em última análise, ter que definir um diretório de trabalho está se tornando uma coisa do passado.

    Porque estamos usando uma abordagem de projeto - não precisamos definir um diretório de trabalho - porque já estamos nele!

    Portanto, ao procurar dados em nossas pastas, sabemos muito bem o caminho que precisaremos seguir.

    No entanto, ainda podemos precisar acessar dados de outra pasta fora de nossa pasta GEOG0030 - portanto, precisamos saber como fazer isso.

    Para ajudar com isso, vamos adicionar mais uma biblioteca à nossa lista de bibliotecas, chamada de biblioteca here. Não entraremos em muitos detalhes sobre o que esta biblioteca faz em si, mas essencialmente permite que você direcione R para uma área específica em seu computador e um arquivo específico com relativa facilidade.

    Na verdade, não o usaremos nesta prática, mas eu queria que você adquirisse o hábito de adicioná-lo aos seus scripts por padrão.

    Primeiro, você precisará instalar esta biblioteca em seu computador.

    Depois de instalado, podemos prosseguir e carregá-lo após nossa biblioteca tidyverse - seu script deve ser assim:

    Uma coisa a ser observada, não apenas a instalação e o carregamento das bibliotecas precisam ocorrer em duas partes diferentes do R-Studio, mas ao instalar, sua biblioteca precisa estar "" mas ao carregar, isso não acontece.

    Prática recomendada para nomes de arquivos e pastas

    Certifique-se de que nomes de pastas e nomes de arquivos não contêm espaços ou caracteres especiais como *. "/ []: | =, & lt? & gt & amp $ #! '<> ().

    Diferentes sistemas operacionais e linguagens de programação lidam de maneira diferente com espaços e caracteres especiais e, como tal, incluí-los nos nomes de pastas e arquivos pode causar muitos problemas e erros inesperados.

    Como alternativa ao uso de espaço em branco, você pode usar um sublinhado _ se desejar.

    Lembre-se de salvar seu script.

    Agora estamos prontos para executar essas duas primeiras linhas de código.

    Executando um script no R-Studio

    Existem duas maneiras principais de executar um script no R-Studio - tudo de uma vez ou por linha / pedaço por linha / pedaço.

    Pode ser vantajoso seguir com a segunda opção quando você começa a construir seu script, pois ela permite que você teste seu código iterativamente.

    Para executar linha por linha:

    • Selecione a linha ou parte do código que deseja executar e clique em Código e escolher Executar as linhas selecionadas.
    • Selecione a linha ou pedaço de código que deseja executar e segure Ctl ou Cmd e pressione Retornar.

    Para executar todo o script

    • Clique em Corre no canto superior direito da janela de script e escolha Executar tudo.
    • Espera Opção mais Ctl ou Cmd e R.

    Interrompendo a execução de um script

    Se você estiver executando um script que parece estar travado (por qualquer motivo) ou notar que algum de seu código está errado, você precisará interromper R.

    Para fazer isso, clique em Sessão - & gt Interromper R. Se isso não funcionar, você pode acabar precisando Terminar R mas isso pode perder qualquer progresso não salvo.

    Execute seu código linha por linha

    Nesta prática, eu recomendo executando cada linha (ou conjunto de linhas) de código que você insere à medida que avança - em vez de esperar até o fim e executar todo o script. Dessa forma, você será capaz de encontrar quaisquer bugs à medida que avança.

    Não se esqueça de rolar para o topo do seu script e executar carregamentos de sua biblioteca!

    Importação e processamento de dados

    Agora estamos prontos para começar a usar os dados do crime csvs que estão atualmente em nossa pasta all_crime.

    Para fazer isso, primeiro precisamos descobrir como importar o csv e entender a estrutura de dados que ficará após a importação.

    Importando e carregando dados

    Para ler um csv em R requer o uso de uma função muito simples: read_csv ().

    Podemos olhar a documentação de ajuda para entender o que precisamos para fornecer a função (ou melhor, os argumentos opcionais), mas como queremos apenas carregar um csv único, iremos em frente e apenas usaremos a função com um parâmetro simples.

    Podemos explorar o csv que acabamos de carregar como nossa nova variável crime_csv e entender a classe, atributos e dimensões de nossa variável.

    Descobrimos que nossa variável é um quadro de dados, contendo 96914 linhas e 12 colunas.

    Também podemos dizer que é um arquivo grande - então é melhor não carregá-lo agora.

    No entanto, não queremos apenas o csv único e, em vez disso, o que combinar todos os nossos csvs em nossa pasta all_crime em um único dataframe - então, como fazemos isso?

    Juntando todos os nossos arquivos csvs em um único quadro de dados

    Esta será a seção de código mais complicada que você encontrará hoje e usaremos algumas funções que você não viu antes - também precisamos instalar e carregar uma biblioteca adicional para usar algo conhecido como função de tubo que explicarei com mais detalhes na próxima semana.

    Em seu console, instale o pacote magrittr:

    E na seção # Carregar bibliotecas do seu script, adicione a biblioteca magrittr. A seção da sua biblioteca deve ser assim:

    Lembre-se de executar o carregamento da biblioteca magrittr selecionando a linha e executando o código.

    Agora estamos prontos para adicionar e executar o seguinte código:

    Isso pode demorar um pouco para ser processado (ou não), pois temos muitos dados para ler.

    Você deve ver um novo datafarme aparecer em seu ambiente global chamado all_crime, para o qual agora temos 1.099.507 observações!

    Explicando o código acima

    É um pouco difícil explicar o código acima sem entrar em uma explicação detalhada do que é um pipe (na próxima semana), mas essencialmente o que essas três linhas de código fazem é:

    Lista dos arquivos encontrados no caminho de dados: "data / raw / crime / all_crime

    Leia cada um deles como um csv (esta é a função lapply ()) em um dataframe

    E então vincule as linhas desses dataframes a um único dataframe chamado all_crime_df

    Entraremos em mais detalhes sobre tubos na próxima semana.

    Agora podemos dar uma olhada em nosso grande dataframe com mais detalhes.

    Agora você deve ver com ter o mesmo número de colunas que nosso csv único anterior, mas 1.099.507 linhas!

    Você também pode ver que a função head () nos fornece o primeiro cinco linhas de nosso dataframe. Você também pode usar tail () para fornecer as últimas cinco linhas.

    Filtrando nossos dados para uma nova variável

    Por enquanto, em nossa análise, queremos apenas extrair o roubo crime em nosso dataframe - então, vamos querer filtrar nossos dados com base no Tipo de crime coluna.

    No entanto, como podemos ver, temos um espaço em nosso nome de campo para Tipo de crime e, de fato, muitos dos outros campos.

    Como queremos evitar espaços em nossos nomes de campo durante a codificação (caso contrário, nosso código será interrompido!), Precisamos renomear nossos campos.

    Para fazer isso, primeiro obteremos todos os nomes de nossos campos para que possamos copiá-los e colá-los em nosso código:

    Agora podemos copiar esses valores em nosso código para criar um novo vetor variável que contém esses nomes de campo, atualizado sem espaços.

    Podemos então renomear os nomes dos campos em nosso conjunto de dados - assim como fizemos com nossa tabela GISS anteriormente:

    Observe, poderíamos ter limpado nossos dados ainda mais e, portanto, só precisaríamos renomear algumas colunas usando o fatiamento - mas vamos salvar o fatiamento do frame de dados para a próxima semana!.

    Agora temos nosso dataframe pronto para filtragem - e para fazer isso, usaremos a função filter () para a biblioteca dplyr.

    Esta função é realmente fácil de usar - mas também há uma função filter () na biblioteca base R - que faz algo diferente da função em dplyr.

    Como resultado, precisamos usar um tipo específico de sintaxe - library :: function - para dizer a R para procurar e usar a função de filtro da biblioteca dplyr ao invés da biblioteca base padrão.

    Em seguida, também precisamos preencher nossa função filter () com os parâmetros necessários para extrair apenas o tipo de crime “Roubo da pessoa”. Isso inclui fornecer a função com nosso dataframe principal mais a consulta de filtro, conforme mostrado abaixo:

    Agora você deve ver a nova variável aparecer em seu ambiente com 28.476 observações.

    Ótimo, você concluiu seu primeiro filtro usando programação.

    Agora queremos seguir o dados organizados filosofia e criar um dataframe final para nos permitir analisar o crime em Londres por mês.

    Para isso, queremos contar quantos roubos ocorrem a cada mês em Londres - e felizmente para nós, dplyr tem outra função que fará isso por nós, conhecida simplesmente como count ().

    Talvez você já possa ver que dplyr provavelmente se tornará uma biblioteca bem usada por nós em Geocomputação ...!

    Vá em frente e pesquise a ajuda para entender a função count () - você também verá que há apenas 1 função chamada count () até agora, ou seja, aquele na biblioteca dplyr, portanto, não precisamos usar a sintaxe adicional que usamos acima.

    Vamos em frente e contar o número de roubos em Londres por mês.

    O código para isso é bastante simples:

    Armazenamos a saída de nossa função count () em um novo dataframe: theft_month_df.

    Vá em frente e olhe para o dataframe para ver o resultado - é uma tabela muito simples contendo simplesmente o mês e n, ou seja, o número de crimes que ocorrem por mês.

    Podemos e devemos prosseguir e renomear esta coluna para ajudar em nossa interpretação do dataframe.

    Usaremos uma abordagem rápida para fazer isso, que usa seleção da coluna precisa para renomear apenas a segunda coluna:

    Essa seleção é feita por meio do [2] elemento de código adicionado após a função names () que usamos anteriormente. Veremos mais sobre seleção, divisão e indexação na prática da próxima semana.

    Análise de dados: distribuição do crime em Londres por mês em 2020

    Agora temos nosso conjunto de dados final pronto para nossa análise simples para nossa atribuição.

    Tarefa 1: Análise do crime por mês em Londres em 2020

    Para sua tarefa esta semana, gostaria que você concluísse duas tarefas.

    1. Estatísticas básicas

    Primeiro, o que eu gostaria que você fizesse, usando o código que você escreveu anteriormente, é descobrir:

    Qual é a média de crimes por mês?

    Qual é a mediana do crime médio por mês?

    Você também pode automatizar a coleta de max, min e alcance do nosso crime por dataframe mês.

    2. Gráfico mensal

    A segunda coisa que gostaria que você fizesse é apresentar nossos dados em um gráfico de barras simples.

    O código básico para gerar um gráfico de barras é fornecido aqui:

    Como você verá, adicionamos um Título ao nosso gráfico (principal = argumento), embora use o parâmetro names.arg para adicionar os meses do ano ao longo do eixo x.

    Usando a documentação do barplot (), gostaria que você descobrisse como alterar o preenchimento do gráfico de barras e as bordas de outra cor de cinza e preto, respectivamente.

    Você também pode querer personalizar ainda mais seu gráfico, mas, principalmente, gostaria que você descobrisse como mudar essas cores para algo mais esteticamente atraente!

    Você não precisa enviar seu gráfico de barras esta semana, mas deixe-o pronto para o seu trabalho na semana 5.

    Além da tarefa, basta dar uma olhada em seu gráfico de barras e como a distribuição do crime mudou no ano passado ...

    Bem, isso é muito legal, hein ?! Eu me pergunto o que aconteceu em março para diminuir tanto o roubo de uma pessoa?

    Conseguimos pegar um conjunto de dados de mais de 1 milhão de registros, limpar e filtrar para fornecer um gráfico que realmente mostra o impacto potencial do bloqueio do COVID-19 no crime de roubo em Londres.

    Claro, há muito mais pesquisas e análises exploratórias de dados que precisaríamos concluir antes que pudéssemos realmente substanciar nossas descobertas, mas este primeiro gráfico é certamente um passo na direção certa!

    Na próxima semana, estaremos fazendo bastante mais com nosso conjunto de dados - incluindo muito mais organização de dados e, claro, análise espacial, mas espero que esta semana tenha mostrado o que você deseja, pode alcançar com apenas algumas linhas de código.

    Agora, certifique-se de salvar seu script, para que possamos voltar a ele na próxima semana.

    Você não precisa salvar seu espaço de trabalho - mas pode fazer isso se desejar. Salvar o espaço de trabalho manterá todas as variáveis ​​geradas durante sua sessão atual salvas e disponíveis em uma sessão futura.

    Atividade de extensão: mapeamento de outras distribuições de tipo de crime em Londres

    Se você já passou por este workshop e gostaria de um desafio adicional, você é mais que bem-vindo para implantar o código que você usou acima em um ou mais tipos de crime em Londres.

    Se você se lembra, cada crime é classificado em um de 14 tipos.

    Tipo de crime Descrição
    Todo crime Total para todas as categorias.
    Comportamento antisocial Inclui comportamento anti-social pessoal, ambiental e incômodo.
    Roubo de bicicleta Inclui a obtenção sem consentimento ou roubo de uma bicicleta a pedal.
    Roubo Inclui crimes em que uma pessoa entra em uma casa ou outro prédio com a intenção de roubar.
    Danos criminais e incêndio criminoso Inclui danos a edifícios e veículos e danos deliberados por fogo.
    Drogas Inclui crimes relacionados com posse, fornecimento e produção.
    Outro crime Inclui falsificação, perjúrio e outros crimes diversos.
    Outro roubo Inclui roubo por funcionário, chantagem e fuga sem pagamento.
    Posse de armas Inclui a posse de uma arma, como arma de fogo ou faca.
    Ordem pública Inclui ofensas que causam medo, alarme ou angústia.
    Roubo Inclui ofensas em que uma pessoa usa força ou ameaça de força para roubar.
    Furto em lojas Inclui roubo de lojas ou barracas.
    Roubo da pessoa Inclui crimes que envolvem roubo diretamente da vítima (incluindo bolsa, carteira, dinheiro, telefones celulares), mas sem o uso ou ameaça de força física.
    Crime de veículo Inclui roubo de ou de um veículo ou interferência com um veículo.
    Violência e ofensas sexuais Inclui ofensas contra a pessoa, como agressões comuns, Dano Corporal Grave e ofensas sexuais.

    Você pode realizar a mesma análise em uma ou mais dessas categorias, além do roubo, para ver se consegue encontrar um padrão semelhante em sua prevalência / distribuição nos mesmos meses.

    R for Data Science de Hadley Wickham e Garret Grolemund

    Conforme destacado anteriormente, sua única leitura importante para esta semana é ler o R para ciência de dados manual - embora você possa ler cada seção em seu próprio lazer nas próximas semanas.

    Para esta semana, eu recomendo altamente ler mais sobre por que usamos Projetos, enquanto esta seção nos fala mais sobre Scripts.

    Além disso, você pode olhar as Seções: 1, 2, 4, 11 e 12. Eu ficaria com essas seções por enquanto, mas daria uma olhada rápida no que mais está disponível no livro. Estaremos olhando para Transformação de Dados (5) e Visualização (3) na próxima semana, além de mais sobre Análise Exploratória de Dados (7) na Semana 6.


    QGIS

    Em geral, identificar o QGIS é o fim da busca por uma alternativa ArcGIS. O QGIS tem uma interface limpa, é fácil de usar e funciona bem. O QGIS suporta uma variedade diferente de formatos raster e vetoriais e, para um usuário Linux, há uma oportunidade melhor do que os já empacotados para os repositórios padrão de distribuição. Além disso, Linux, downloads e instruções para macOS, Windows e Android podem ser iniciados no site do projeto & # 8217s.

    QGIS tem uma boa documentação que pode ser mostrada em seu manual do usuário, bem como uma comunidade de usuários vital que originou vários tutoriais, guias e livros para ajudar. Há também um grande número de plug-ins que adicionam uma tonelada de propósitos não encontrados no pacote básico, e sua interface Python torna quase fácil para os caloiros criarem novos.

    Pode-se encontrar o código-fonte do QGIS, que é escrito principalmente em C ++, no GitHub abaixo de uma licença GPLv2.


    Conteúdo

    Histórico de versão do ArcGIS
    Versão Lançado
    8.0 1999-12-27 [6]
    8.0.1 2000-01-13 [7]
    8.1 2001-05-01 [8]
    8.2 2002-05-10 [9]
    8.3 2003-02-10 [10]
    9.0 2004-05-11 [11]
    9.1 2005-05-25 [12]
    9.2 2006-11-14 [13]
    9.3 2008-06-25 [14]
    9.3.1 2009-04-28 [15]
    10.0 2010-06-29 [16]
    10.1 2012-06-11 [17] [18] [19]
    10.2 2013-07-30 [20] [21]
    10.2.1 2014-01-07 [22]
    10.2.2 2014-04-15 [23]
    10.3 2014-12-10 [24]
    10.3.1 2015-05-13 [25]
    10.4 2016-02-18 [26]
    10.4.1 2016-05-31 [27] [26]
    10.5 2016-12-15 [28] [29]
    10.5.1 2017-06-29 [30]
    10.6 2018-01-17
    10.6.1 2018-07-16
    10.7 2019-03-21 [31]
    10.7.1 2019-06-27 [32] [33]
    10.8 2020-02-20 [34]
    10.8.1 2020-07 [35]

    Antes do conjunto ArcGIS, a Esri focava seu desenvolvimento de software no programa de estação de trabalho Arc / INFO de linha de comando e vários produtos baseados em Interface Gráfica de Usuário, como o programa de desktop ArcView GIS 3.x Outros produtos da Esri incluíram MapObjects, uma biblioteca de programação para desenvolvedores, e ArcSDE como um sistema de gerenciamento de banco de dados relacional. Os vários produtos se ramificaram em várias árvores de origem e não se integraram bem uns com os outros. Em janeiro de 1997, a Esri decidiu renovar sua plataforma de software GIS, criando uma única arquitetura de software integrada. [36]

    ArcMap 8.0 Editar

    No final de 1999, a Esri lançou o ArcMap 8.0, que rodava no sistema operacional Microsoft Windows. [36] O ArcGIS combinou o aspecto da interface de usuário visual da interface do ArcView GIS 3.x com parte do poder da estação de trabalho Arc / INFO versão 7.2. Esse emparelhamento resultou em um novo pacote de software chamado ArcGIS, incluindo a estação de trabalho ArcInfo de linha de comando (v8.0) e um novo aplicativo de interface gráfica do usuário chamado ArcMap (v8.0). Este ArcMAP incorpora algumas das funcionalidades do ArcInfo com uma interface mais intuitiva, bem como um aplicativo de gerenciamento de arquivos chamado ArcCatalog (v8.0). O lançamento do ArcMap constituiu uma grande mudança nas ofertas de software da Esri, alinhando todos os seus produtos de cliente e servidor em uma arquitetura de software conhecida como ArcGIS, desenvolvida usando os padrões Microsoft Windows COM. [37] Embora a interface e os nomes do ArcMap 8.0 sejam semelhantes às versões posteriores do ArcGIS Desktop, eles são produtos diferentes. O ArcGIS 8.1 substituiu o ArcMap 8.0 na linha de produtos, mas não foi uma atualização para ele.

    Editar ArcGIS Desktop 8.1 a 8.3

    ArcGIS 8.1 foi revelado na Esri International User Conference em 2000. [38] ArcGIS 8.1 foi oficialmente lançado em 24 de abril de 2001. Este novo aplicativo incluía três extensões: 3D Analyst, Spatial Analyst e GeoStatistics Analyst. Essas três extensões se tornaram muito poderosas e populares na linha de produtos ArcView GIS 3.x. O ArcGIS 8.1 também adicionou a capacidade de acessar dados online, diretamente do site da Geography Network ou outros serviços de mapa do ArcIMS. [39] ArcGIS 8.3 foi introduzido em 2002, adicionando topologia a bancos de dados geográficos, que era um recurso originalmente disponível apenas com coberturas ArcInfo. [40]

    Uma diferença importante são as linguagens de programação (script) disponíveis para personalizar ou estender o software para atender às necessidades específicas do usuário. Na transição para o ArcGIS, a Esri abandonou o suporte de suas linguagens de script específicas para aplicativos, Avenue e ARC Macro Language (AML), em favor do script Visual Basic for Applications e acesso aberto aos componentes ArcGIS usando os padrões Microsoft COM. [39] ArcGIS é projetado para armazenar dados em um formato RDBMS proprietário, conhecido como geodatabase. O ArcGIS 8.x introduziu outros novos recursos, incluindo projeções de mapa em tempo real e anotações no banco de dados. [41]

    Editar ArcGIS 9.x

    ArcGIS 9 foi lançado em maio de 2004, incluindo ArcGIS Server e ArcGIS Engine para desenvolvedores. [36] O lançamento do ArcGIS 9 inclui um geoprocessamento ambiente que permite a execução de ferramentas tradicionais de processamento GIS (como recorte, sobreposição e análise espacial) interativamente ou a partir de qualquer linguagem de script que suporte os padrões COM. Embora o mais popular deles seja o Python, outros foram usados, especialmente Perl e VBScript. ArcGIS 9 inclui um ambiente de programação visual, semelhante ao Model Maker do ERDAS IMAGINE (lançado em 1994, v8.0.2). A versão Esri é chamada de ModelBuilder e, assim como a versão ERDAS IMAGINE, permite aos usuários vincular graficamente ferramentas de geoprocessamento em novas ferramentas chamadas modelos. Esses modelos podem ser executados diretamente ou exportados para linguagens de script que podem ser executados em modo de lote (inicializados a partir de uma linha de comando), ou podem ser submetidos a outras edições para adicionar ramificações ou loops.

    Em 26 de junho de 2008, a Esri lançou o ArcGIS 9.3. A nova versão do ArcGIS Desktop possui novas ferramentas de modelagem e recursos de rastreamento de erros geoestatísticos, enquanto o ArcGIS Server melhorou o desempenho e suporte para segurança baseada em funções. Também existem novas APIs JavaScript que podem ser usadas para criar mashups e integradas ao Google Maps ou ao Microsoft Virtual Earth. [42] [43]

    No Esri Developers Summit 2008, houve pouca ênfase no ArcIMS, exceto por uma sessão na transição de ArcIMS para aplicativos baseados no ArcGIS Server, indicando uma mudança no foco do Esri com ArcGIS 9.3 para aplicativos de mapeamento baseados na web. [44]

    Em maio de 2009, a Esri lançou o ArcGIS 9.3.1, que melhorou o desempenho da publicação de mapas dinâmicos e introduziu um melhor compartilhamento de informações geográficas.

    ArcGIS 10.x Editar

    Em 2010, a Esri anunciou que a versão prospectiva 9.4 se tornaria a versão 10 e seria lançada no segundo trimestre de 2010. [45]

    O lançamento do ArcGIS 10.3 incluiu o ArcGIS Pro 1.0, que se tornou disponível em janeiro de 2015.

    Em 21 de outubro de 2020, a Esri anunciou publicamente que este seria o último lançamento do ArcGIS Desktop. [46] Seus produtos, incluindo ArcMap, terão suporte até 1 de março de 2026.[47] Este anúncio confirmou as previsões de que o ArcGIS Pro (e produtos relacionados) foi planejado para ser um substituto completo para o ArcMap.

    ArcGIS Pro Edit

    ArcGIS Pro é um software GIS de 64 bits que é a versão mais moderna do ArcGIS Desktop. Ao contrário do ArcGIS Desktop, as funcionalidades ArcCatalog e ArcMap são acessadas através do mesmo aplicativo, mais comumente através do painel Catálogo. [48] ​​Os requisitos gráficos para ArcGIS Pro são consideravelmente maiores do que para ArcGIS Desktop, a fim de suportar a visualização atualizada. O ArcGIS Pro também oferece suporte a fluxos de trabalho simplificados que envolvem a publicação e o consumo de camadas de feições usando o ArcGIS Online. [49]

    ArcGIS Pro 1.0 foi lançado em janeiro de 2015. [50]

    ArcGIS Pro 2.6 foi lançado em julho de 2020. [51] Recursos notados adicionados incluem: [52]

    • Camadas Voxel
    • Redes de rastreamento
    • Análise de adequação interativa usando o novo Modelador de Adequação
    • Camadas gráficas
    • Ajuste de parcela
    • Análise de link
    • Recuperação de projeto

    Formatos de dados Editar

    Produtos Esri mais antigos, incluindo ArcView 3.x, trabalhavam com dados no formato shapefile. A estação de trabalho ArcInfo manipulava coberturas, que armazenavam informações de topologia sobre os dados espaciais. As coberturas, que foram introduzidas em 1981 quando o ArcInfo foi lançado pela primeira vez, têm limitações em como lidam com os tipos de recursos. Alguns recursos, como estradas com cruzamentos de ruas ou passagens superiores e inferiores, devem ser tratados de forma diferente de outros tipos de recursos. [53]

    O ArcGIS é construído em torno de um geodatabase, que usa uma abordagem de banco de dados objeto-relacional para armazenar dados espaciais. Uma geodatabase é um "contêiner" para armazenar conjuntos de dados, amarrando as características espaciais com atributos. A geodatabase também pode conter informações de topologia e pode modelar o comportamento de recursos, como interseções de estradas, com regras sobre como os recursos se relacionam uns com os outros. [54] Ao trabalhar com bancos de dados geográficos, é importante entender as classes de recursos que são um conjunto de recursos, representados por pontos, linhas ou polígonos. Com shapefiles, cada arquivo pode lidar com apenas um tipo de recurso. Um geodatabase pode armazenar várias classes de recursos ou tipos de recursos em um arquivo. [55]

    As bases de dados geográficas no ArcGIS podem ser armazenadas de três maneiras diferentes - como uma "geodatabase de arquivo", uma "geodatabase pessoal" ou uma "geodatabase corporativa" (anteriormente conhecida como uma geodatabase SDE ou ArcSDE). [56] Introduzido em 9.2, o arquivo geodatabase armazena informações em uma pasta chamada com uma extensão .gdb. O interior parece semelhante ao de uma cobertura, mas não é, na verdade, uma cobertura. Semelhante ao geodatabase pessoal, o arquivo de geodatabase suporta apenas um único editor. No entanto, ao contrário da geodatabase pessoal, virtualmente não há limite de tamanho. Por padrão, qualquer tabela não pode exceder 1 TB, mas isso pode ser alterado. As bases de dados geográficas pessoais armazenam dados em arquivos do Microsoft Access, usando um campo BLOB para armazenar os dados geométricos. A biblioteca OGR é capaz de lidar com este tipo de arquivo, para convertê-lo em outros formatos de arquivo. [57] Tarefas de administração de banco de dados para geodatabase pessoais, como gerenciamento de usuários e criação de backups, podem ser feitas através do ArcCatalog e ArcGIS Pro. As bases de dados geográficas pessoais, baseadas no Microsoft Access, funcionam apenas no Microsoft Windows e têm um limite de tamanho de 2 gigabytes. [58] As bases de dados geográficas empresariais (multiusuário) assentam em DBMS de ponta, como PostgreSQL, Oracle, Microsoft SQL Server, DB2 e Informix para lidar com aspectos de gerenciamento de banco de dados, enquanto ArcGIS lida com gerenciamento de dados espaciais. [59] Os bancos de dados geográficos de nível empresarial suportam replicação de banco de dados, controle de versão e gerenciamento de transações, e são compatíveis com várias plataformas, podendo ser executados em Linux, Windows e Solaris. [58]

    Também lançado na versão 9.2 está o banco de dados SDE pessoal que opera com o SQL Server Express. Os bancos de dados SDE pessoais não oferecem suporte para edição multiusuário, mas oferecem suporte para controle de versão e edição desconectada. A Microsoft limita os bancos de dados do SQL Server Express a 4 GB.

    ArcGIS Pro (que é um aplicativo de 64 bits) não suporta o formato de geodatabase pessoal, mas pode convertê-los em formatos suportados usando ferramentas de geoprocessamento. [60]

    Editar ArcGIS Desktop

    Níveis de produto Editar

    O ArcGIS Desktop está disponível em diferentes níveis de produto, com funcionalidade crescente.

    • ArcReader (freeware, viewer) é um visualizador de dados básico para mapas e dados GIS publicados no formato proprietário da Esri usando ArcGIS Publisher. O software também fornece algumas ferramentas básicas para visualização de mapas, impressão e consulta de dados espaciais. O ArcReader está incluído em qualquer conjunto de produtos ArcGIS e também está disponível para download gratuito. O ArcReader só funciona com arquivos de mapas publicados pré-criados, criados com o ArcGIS Publisher. [61]
    • ArcGIS Desktop Basic, anteriormente conhecido como ArcView, [62] é o nível de entrada do licenciamento do ArcGIS. Com ArcView, é possível visualizar e editar dados GIS mantidos em arquivos planos, ou visualizar dados armazenados em um sistema de gerenciamento de banco de dados relacional acessando-o através do ArcSDE. Também é possível criar mapas em camadas e realizar análises espaciais básicas.
    • ArcGIS Desktop Standard, anteriormente conhecido como ArcEditor, é o conjunto de software de nível médio projetado para edição avançada de dados espaciais em shapefiles e geodatabase. Ele fornece ferramentas para a criação de mapas e dados espaciais usados ​​em GIS, incluindo a capacidade de edição de arquivos e dados de geodatabase, edição de geodatabase multiusuário, versionamento, edição e vetorização de dados raster, edição avançada de dados vetoriais, gerenciamento de coberturas, geometria coordenada (COGO) e edição de redes geométricas. O ArcEditor não se destina a análises espaciais avançadas. [63]
    • ArcGIS Desktop Advanced, anteriormente conhecido como ArcInfo, permite aos usuários maior flexibilidade e controle em "todos os aspectos da construção de dados, modelagem, análise e exibição de mapas". [64] ArcInfo inclui maior capacidade nas áreas de análise espacial, geoprocessamento, gerenciamento de dados e outros. [63]

    Outros softwares de desktop GIS incluem ArcGIS Explorer e ArcGIS Engine. ArcGIS Explorer é um visualizador GIS que pode funcionar como um cliente para ArcGIS Server, ArcIMS, ArcWeb Services e Web Map Service (WMS).

    • ArcGIS Online[65] é uma aplicação web que permite compartilhar e pesquisar informações geográficas, bem como conteúdo publicado pela Esri, usuários do ArcGIS e outros provedores de dados autorizados. Ele permite que os usuários criem e participem de grupos e controlem o acesso a itens compartilhados publicamente ou dentro de grupos.
    • ArcGIS Web Mapping APIs são APIs para vários idiomas, permitindo aos usuários construir e implementar aplicativos que incluem funcionalidade GIS e serviços da Web do ArcGIS Online e ArcGIS Server. Adobe Flex, JavaScript e Microsoft Silverlight são compatíveis com aplicativos que podem ser incorporados em páginas da Web ou iniciados como aplicativos da Web autônomos. Flex, Adobe Air e Windows Presentation Foundation (WPF) são compatíveis com aplicativos de desktop.

    Edição de Componentes

    O ArcGIS Desktop consiste em vários aplicativos integrados, incluindo ArcMap, ArcCatalog, ArcToolbox, ArcScene, ArcGlobe e ArcGIS Pro. ArcCatalog é o aplicativo de gerenciamento de dados, usado para navegar por conjuntos de dados e arquivos no computador, banco de dados ou outras fontes. Além de mostrar quais dados estão disponíveis, o ArcCatalog também permite que os usuários visualizem os dados em um mapa. O ArcCatalog também oferece a capacidade de visualizar e gerenciar metadados para conjuntos de dados espaciais. [66] ArcMap é o aplicativo usado para visualizar, editar e consultar dados geoespaciais e criar mapas. A interface ArcMap possui duas seções principais, incluindo uma tabela de conteúdo à esquerda e os quadros de dados que exibem o mapa. Os itens do índice correspondem às camadas do mapa. [67] ArcToolbox contém geoprocessamento, conversão de dados e ferramentas de análise, junto com muitas das funcionalidades do ArcInfo. Também é possível usar o processamento em lote com ArcToolbox, para tarefas repetidas com frequência. [68] ArcScene é um aplicativo que permite ao usuário visualizar seus dados GIS em 3-D e está disponível com a Licença de analista 3D. [69] Nas propriedades da camada do ArcScene há uma função de extrusão que permite ao usuário exagerar as características tridimensionalmente. [70] ArcGlobe é outro dos aplicativos de visualização 3D do ArcGIS disponíveis com a Licença de analista 3D. ArcGlobe é um aplicativo de visualização 3D que permite visualizar grandes quantidades de dados GIS em uma superfície de globo. [71] O aplicativo ArcGIS Pro foi adicionado ao ArcGIS Desktop em fevereiro de 2015. [72] Ele tinha os recursos combinados de outros aplicativos integrados e foi construído como um aplicativo de software totalmente de 64 bits. [73] ArcGIS Pro possui script ArcPy Python para programação de banco de dados. [74]

    Edição de extensões

    Existem várias extensões de software que podem ser adicionadas ao ArcGIS Desktop que fornecem funcionalidade adicional, incluindo analista 3D, analista espacial, analista de rede, analista de pesquisa, analista de rastreamento e analista geoestatístico. [75] A etiquetagem de mapa avançado está disponível com a extensão Maplex, como um add-on para ArcView e ArcEditor e é empacotado com ArcInfo. [63] Numerosas extensões também foram desenvolvidas por terceiros, como o corretor ortográfico MapSpeller, ST-Links PgMap, XTools Pro [1] e MAP2PDF para a criação de PDFs georreferenciados (GeoPDF), [76] ERDAS 'Image Analysis and Stereo Analyst for ArcGIS e PurVIEW do ISM, que converte desktops Arc em janelas de visualização estéreo precisas para trabalhar com modelos de imagens estereoscópicas georreferenciadas para edição direta de geodatabase ou digitalização de recursos.

    Editar localizador de endereço

    Um localizador de endereço é um conjunto de dados no ArcGIS que armazena os atributos de endereço, índices associados e regras que definem o processo de tradução de descrições não espaciais de lugares, como endereços de ruas, em dados espaciais que podem ser exibidos como feições em um mapa. Um localizador de endereço contém um instantâneo dos dados de referência usados ​​para geocodificação e parâmetros para padronizar endereços, pesquisar por locais de correspondência e criar saída. Os arquivos do localizador de endereço têm uma extensão de arquivo .loc. No ArcGIS 8.3 e nas versões anteriores, um localizador de endereço era chamado de serviço de geocodificação. [77]

    Outros produtos Editar

    ArcGIS Mobile e ArcPad são produtos projetados para dispositivos móveis. ArcGIS Mobile é um kit de desenvolvimento de software para desenvolvedores usarem para criar aplicativos para dispositivos móveis, como smartphones ou tablets. Se conectado à Internet, os aplicativos móveis podem se conectar ao ArcGIS Server para acessar ou atualizar dados. ArcGIS Mobile está disponível apenas no nível Enterprise [78]

    Os produtos GIS de servidor incluem ArcIMS (servidor de mapeamento da web), ArcGIS Server e ArcGIS Image Server. Tal como acontece com ArcGIS Desktop, ArcGIS Server está disponível em diferentes níveis de produto, incluindo Basic, Standard e Advanced Editions. O ArcGIS Server vem com SQL Server Express DBMS embutido e pode funcionar com DBMS corporativos, como SQL Server Enterprise e Oracle. [79] O Esri Developer Network (EDN) inclui ArcObjects e outras ferramentas para a construção de aplicativos de software personalizados, e ArcGIS Engine fornece uma interface de programação para desenvolvedores. [80]

    Para fins não comerciais, a Esri oferece um programa de uso doméstico com uma taxa de licença anual mais baixa. [81]

    O ArcGIS Engine é um mecanismo de software ArcGIS, um produto de desenvolvedor para a criação de aplicativos de desktop GIS customizados.

    O ArcGIS Engine fornece interfaces de programação de aplicativos (APIs) para COM, .NET, Java e C ++ para as plataformas Windows, Linux e Solaris. As APIs incluem documentação e uma série de componentes visuais de alto nível para facilitar a construção de aplicativos ArcGIS.

    O ArcGIS Engine inclui o conjunto principal de componentes, ArcObjects, a partir do qual os produtos ArcGIS Desktop são construídos. Com o ArcGIS Engine, pode-se construir aplicativos independentes ou estender os aplicativos existentes para usuários GIS e não-GIS. A distribuição do ArcGIS Engine inclui adicionalmente utilitários, amostras e documentação.

    É necessária uma licença ArcGIS Engine Runtime ou ArcGIS Desktop por computador.

    Os produtos ArcGIS Desktop e ArcPad estão disponíveis com uma licença de uso único. A maioria dos produtos também está disponível com licença de uso simultâneo, enquanto licenças de servidor de desenvolvimento e outros tipos de licenças de software estão disponíveis para outros produtos. [82] Produtos descartáveis ​​podem ser adquiridos online na Esri Store, enquanto todos os produtos ArcGIS estão disponíveis através de um representante de vendas ou revendedor. Manutenção anual de software e suporte também estão disponíveis para ArcGIS. [83] Embora existam produtos alternativos disponíveis de fornecedores como MapInfo, Maptitude, AutoCAD Map 3D e QGIS de código aberto, a Esri tem uma participação dominante no mercado de software GIS, estimado em 2015 em 43%. [84]

    Os problemas com o ArcGIS incluem preços elevados percebidos para os produtos, formatos proprietários e dificuldades de portar dados entre a Esri e outro software GIS. [85] [86] [87]

    A transição da Esri para a plataforma ArcGIS, começando com o lançamento de 1999 do ArcGIS 8.0, tornou incompatível uma ampla gama de software e scripts complementares desenvolvidos por usuários e de terceiros. Uma base de usuários minoritária resiste à migração para o ArcGIS por causa das mudanças na capacidade de script, funcionalidade, sistema operacional (a Esri desenvolveu o software ArcGIS Desktop exclusivamente para o sistema operacional Microsoft Windows), bem como os recursos de sistema significativamente maiores exigidos pelo software ArcGIS. [88] [89]


    [100% Off] - Como Produzir Mapa de Previsão em GIS com ArcGIS e Excel?

    Obtenha o código de cupom de desconto Udemy 100% gratuito (UDEMY Free Promo Code), você poderá se inscrever neste curso & # 8220Como Produzir Mapa de Previsão em GIS com ArcGIS e Excel?& # 8221 totalmente GRÁTIS para acesso vitalício. Apresse-se ou terá que pagar $ $.

    Requisitos

    • Nenhum fundo de modelagem estatística anterior é necessário
    • Interesse em desenvolver um mapa de suscetibilidade válido para aplicações em geociências usando dados da vida real
    • Familiaridade prévia com os sistemas de informação geográfica
    • Experiência básica em software ArcGIS da Esri e Microsoft Excel
    • Este curso será demonstrado em um sistema operacional Windows

    Instrutor do curso: Omar AlThuwaynee

    Descrição

    Desde o final da década de 1980, o amplamente popular e eficiente sistema de informações geográficas (GIS) facilitou o desenvolvimento de novos métodos de aprendizado de máquina, orientados por dados e empíricos que reduzem os erros de generalização.

    Neste curso, compartilhei uma famosa e sólida técnica bivariada (razão de frequência), para ajudá-lo a iniciar seu primeiro mapa de previsão usando apenas ArcMap e Excel.

    Explicarei a correlação espacial entre os fatores de previsão e o fator dependente. Além disso, como encontrar as autocorrelações entre os fatores de previsão, considerando sua importância ou contribuição de previsão. Finalmente, irei produzir um mapa de suscetibilidade usando apenas Microsoft Excel e ESRI ArcGIS. A validação da previsão do modelo será medida pelo método estatístico mais comum de Área sob a curva (AUC).


    1 resposta 1

    Atualmente não há uma maneira elegante de fazer isso. Esta preferência é armazenada dentro de um arquivo de estado RStudio interno, em% localappdata% RStudio-Desktop monitoring user-settings. Se você estiver suficientemente motivado, pode escrever um script que defina a preferência rmd_chunk_output_inline, mas será desagradável.

    Uma coisa que você pode fazer é definir o tipo de saída do fragmento no cabeçalho YAML, assim:

    Você também pode usar um modelo de documento R Markdown com esta configuração para você (talvez seu script possa escrever isso).

    Finalmente, há um problema aberto para isso na página do github do RStudio, que você pode comentar e / ou votar:


    ArcGIS

    ArcGIS é um sistema de informações geográficas que permite trabalhar com mapas e informações geográficas.

    Você precisará de um código de autorização de estudante fornecido pelo coordenador do curso ou professor. Entre em contato com o Service Desk para providenciar um código, caso não tenha recebido um.

    O ArcGIS está disponível apenas no Windows.

    Cambridge Structural Database (CSD)

    O CSD é um banco de dados usado pela Escola de Química que permite descobrir o conhecimento contido em mais de 650.000 estruturas cristalinas.

    Você precisará aceitar o Contrato de Uso do Sistema CSD enquanto estiver conectado à rede UniSydney.

    CSD está disponível no Windows e Mac OS X.

    Dropbox

    O Dropbox permite armazenar seus arquivos na nuvem e acessá-los de qualquer navegador ou dispositivo com o aplicativo Dropbox instalado. Sua conta do Dropbox da universidade vem com 15 GB e aplicativos de colaboração como Paper e Showcase.

    A inscrição é um processo fácil de três etapas:

    1. Visite o portal e inscreva-se na sua UniKey
    2. Verifique se há um convite do Dropbox na caixa de entrada do aluno
    3. Siga as instruções do convite para finalizar sua ativação

    Sua conta é válida durante o período de seu diploma.

    Echo360

    Echo360 é um serviço de captura e streaming de vídeo usado principalmente para gravar palestras e outros eventos ao vivo para acesso posterior. O aplicativo Echo360 oferece a flexibilidade e conveniência de assistir a palestras em seu próprio dispositivo. Você pode até baixar gravações de palestras usando o wi-fi da universidade e assisti-las off-line durante o trajeto.

    • acesse o site da sua unidade de estudo em seu Learning Management System (Canvas) e selecione ‘Recorded Lectures’ (2019 Recordings for Compass users), no menu de navegação à esquerda.
    • baixe o aplicativo Echo360 para o seu smartphone
    • siga as instruções e digite seu endereço de e-mail da University of Sydney, seguido de sua UniKey.

    Se estiver baixando o aplicativo em um navegador de tablet, consulte estas instruções para configuração do iPad.

    EndNote

    EndNote é uma ferramenta de pesquisa que permite organizar, publicar e compartilhar suas referências e bibliografias. Você pode obter treinamento através de nossas bibliotecas.

    EndNote está disponível no Windows e Mac OS X.

    GenStat

    GenStat é um pacote estatístico e ferramenta de análise de dados. Para usar o GenStat, você precisa estar conectado à rede da Universidade ou por meio de uma conexão VPN. GenStat está disponível apenas no Windows.

    LinkedIn Learning

    O LinkedIn Learning é uma plataforma de aprendizado online que oferece aos alunos da University of Sydney acesso a cursos básicos que auxiliam no seu estudo na universidade.

    Entre no LinkedIn Learning usando suas credenciais UniKey ou siga estas instruções de login.

    MATLAB

    O MATLAB ajuda você com computação numérica, visualização e programação. Com o MATLAB você pode analisar dados, desenvolver algoritmos e criar modelos.

    O MATLAB está disponível para Windows e Mac OS X.

    Mathematica

    Mathematica é um ambiente computacional usado em muitos campos científicos, de engenharia, matemáticos e de computação.

    O Mathematica está disponível para Windows, Mac OS X e Linux.

    Ferramentas de desenvolvimento do Microsoft Azure para ensino

    Todos os alunos e professores da University of Sydney podem baixar e instalar cópias de vários produtos Microsoft por meio do portal Azure Dev Tools for Teaching.

    Existem 140 produtos diferentes da Microsoft disponíveis, incluindo:

    • Microsoft Project
    • servidor SQL
    • Estúdio visual
    • Visio
    • Windows 10
    • Windows Server 2019

    Siga as etapas fáceis para acessar esses produtos:

    1. Vá para Azure Dev Tools.
    2. Faça login ou inscreva-se com seu endereço de e-mail da Universidade. Não use uma conta de e-mail pessoal.
    3. Concorde com os termos e condições e execute o processo de autenticação da Microsoft.
    4. Use o menu para navegar até o software e recursos disponíveis.

    Microsoft Office 365

    Você pode acessar a assinatura do Microsoft Office 365 ProPlus em até cinco dos seus dispositivos. Isso fornece acesso às versões mais recentes do Word, Excel, PowerPoint, Outlook e OneNote.

    Seu software Office 365 permanecerá ativado enquanto você estiver matriculado na Universidade e se conectar à Internet pelo menos uma vez a cada 30 dias.

    • visite o Portal Microsoft Online, insira seu endereço de e-mail de aluno e senha e selecione a conta de trabalho ou escola
    • você será redirecionado para a página do Office 365. Selecione ‘Instalar’ para baixar o cliente
    • abra o cliente e siga as instruções.

    O Office 365 está disponível no Windows e Mac OS.

    Microsoft OneDrive

    OneDrive for Business é um lugar onde você pode armazenar, sincronizar e compartilhar seus arquivos. Ele permite que você atualize e compartilhe seus arquivos de qualquer lugar e colabore em documentos ao mesmo tempo que outros alunos.

    NVivo

    O NVivo permite que você lide com informações baseadas em rich text. Ele automatiza muitas tarefas manuais associadas à análise, como classificação e classificação de dados.

    Ele está disponível no Windows e Mac OS X.

    Gerente de Referência

    O Reference Manager é usado para publicar e gerenciar bibliografias.

    Ele está disponível apenas no Windows.

    RStudio

    RStudio é um ambiente de desenvolvimento integrado (IDE) para R. Inclui um console, editor de realce de sintaxe que oferece suporte à execução direta de código, bem como ferramentas para plotagem, histórico, depuração e gerenciamento de espaço de trabalho.

    R é uma linguagem e ambiente para computação estatística e gráficos.

    R fornece uma ampla variedade de técnicas estatísticas (modelagem linear e não linear, testes estatísticos clássicos, análise de série temporal, classificação, agrupamento) e gráficas, e é altamente extensível. A linguagem S é frequentemente o veículo de escolha para pesquisa em metodologia estatística, e R fornece uma rota de código aberto para a participação nessa atividade.


    Construindo computador para GIS: O AMD Ryzen 5 funcionará ou devo usar um i5 7600k / i7 7700k?

    Jogos, Sistemas de Informação Geográfica. Para o contexto de GIS, provavelmente estou trabalhando com conjuntos de dados do tamanho de um condado para minha análise. Por exemplo, a camada de pacotes do Condado de Travis tem até 400k recursos e 140 MB. Atualmente estou tentando entrar em campo, mas estou fazendo um trabalho de consultoria no momento. Se eu for contratado por uma empresa ou órgão público, eles me darão minha própria estação de trabalho.

    Se jogar, que tipo de desempenho você está procurando? (Resolução da tela, taxa de quadros, configurações do jogo)

    1080p ou mais nas configurações High / Ultra.

    Qual é o seu orçamento (está tudo bem com o estádio)?

    $ 1000 +/- $ 100 para o desktop, sem incluir monitores, mouses e teclados.

    Em que país você está comprando suas peças?

    Publique um rascunho de sua construção potencial aqui (peças específicas, por favor). Considere formatar sua lista de peças. Não peça para alimentar uma compilação (leia as regras!).

    Isso é o que eu criei no PC Part Picker.

    ModeloItemPreço
    CPUIntel - processador Core i5-7600K 3,8 GHz Quad-Core$ 221,89 @ OutletPC
    Cooler CPUNoctua - NH-U12S 55.0 CFM CPU Cooler$ 57,99 na Amazon
    Placa-mãeASRock - placa-mãe B250M Pro4 Micro ATX LGA1151$ 74,99 no SuperBiiz
    MemóriaCrucial - Ballistix Sport LT 16 GB (2 x 8 GB) de memória DDR4-2400$ 142,95 na Amazon
    ArmazenarSK hynix - SL308 250 GB 2,5 & quot Solid State Drive$ 87,88 @ OutletPC
    ArmazenarSeagate - BarraCuda 1 TB 3,5 & quot 7200 RPM disco rígido interno$ 44,78 @ OutletPC
    Cartão de vídeoEVGA - placa de vídeo GeForce GTX 1060 6GB 6GB SC GAMING$ 289,88 @ OutletPC
    CasoDesign Fractal - Focus G Mini (Preto) Estojo MicroATX Mini Tower$ 49,99 na NCIX US
    Fonte de energiaSeaSonic - Fonte de alimentação ATX totalmente modular com certificação FOCUS Plus Gold 550W 80+ Gold$ 79,90 na Amazon
    Drive ópticoAsus - Gravador de DVD / CD DRW-24B1ST / BLK / B / AS$ 18,69 @ OutletPC
    Sistema operacionalMicrosoft - Windows 10 Home OEM de 64 bits$ 89,89 @ OutletPC
    Os preços incluem frete, impostos, abatimentos e descontos
    Total (antes dos descontos pelo correio)$1168.83
    Descontos por correio-$10.00
    Total$1158.83
    Gerado por PCPartPicker 2017-09-13 14:40 EDT-0400

    Forneça quaisquer detalhes adicionais que desejar abaixo.

    Eu baseei minha construção no Manirelli & # x27s Modest Gaming Build. Acho que é uma boa escolha, mas não tinha certeza sobre o desempenho do AMD Ryzen 5 no ArcGIS vs Intel & # x27s i5 ou i7. Os incrementos lógicos sugerem que o i5 e o i7 têm desempenho superior de thread único. Não planeje fazer overclock neste momento.

    Como um aluno visual / espacial / tátil, é muito difícil comparar as partes listadas online. Prefiro montar um PC como um conjunto de lego, veja o que se encaixa. Marcas exatas de RAM, HDD e unidade óptica são mais flexíveis do que CPU, placa-mãe e GPU. Monitores, mouses e teclado provavelmente serão comprados da Discount Electronics aqui em Austin. Também é provável que precise de uma nova cadeira de escritório.


    Fundamentos de GIS

    Explore o mundo da análise espacial e cartografia com sistemas de informação geográfica (SIG). Nesta aula, você aprenderá os fundamentos da ferramenta de software líder da indústria, ArcGIS, durante quatro módulos de uma semana: Semana 1: Aprenda como o GIS cresceu de mapas de papel para os pacotes de software eletrônicos globalmente integrados de hoje. Você instalará o ArcGIS em seu computador e aprenderá como usar a ajuda online para responder a questões técnicas. Semana 2: Abra o ArcGIS e explore os dados usando o ArcMap. Aprenda os conceitos básicos do GIS, como analisar dados e fazer seu primeiro mapa. Semana 3: Faça seus próprios mapas! Simbolize os dados e crie um produto final atraente. Semana 4: compartilhe seus dados e mapas e aprenda a armazenar e organizar seus dados. Faça os Fundamentos de GIS como um curso autônomo ou como parte da Especialização em Sistemas de Informações Geográficas (GIS). Ao concluir a primeira aula na Especialização, você obterá as habilidades necessárias para ser bem-sucedido no programa completo. Os alunos que precisam de uma licença ArcGIS receberão uma licença de estudante não comercial de 1 ano para participação neste curso e especialização.

    Получаемые навыки

    Análise Espacial, Análise de Dados, Visualização de Dados (DataViz), Software

    Рецензии

    o conteúdo é incrível. Eu recomendaria para aqueles que precisam ter algum conhecimento básico de GIS. É muito fácil aprender o ArcGIS por causa das instruções e demonstrações fornecidas pelo instrutor.

    Muy buen curso, me sirvió mucho, aprendí demasiado sobre as cosas básicas y el profesor es muy bueno !! Super recomendado si não saben nada de GIS y está empezando a comprender las herramientas

    Neste módulo, cobriremos as expectativas do curso, daremos uma visão geral rápida do GIS e o que há de bom nele, daremos uma olhada no ArcGIS e identificaremos os elementos-chave na interface e definiremos os principais conceitos geoespaciais e terminologia. Na Seção 2, discutiremos as opções para o GIS de desktop, a história do GIS e como ele é usado hoje, discutiremos os recursos e a ajuda que você pode usar e definiremos as principais habilidades que são relevantes para você como analista de GIS. Concluiremos mostrando como obter uma cópia do ArcGIS para este curso e com um tutorial sobre como começar no ArcGIS.


    Assista o vídeo: Rstudio: GIS - Read ESRI ASCII file and matrix as a raster