Mais

Análise dimensional / problema de conversão: escala do mapa para resolução da imagem (dpi)

Análise dimensional / problema de conversão: escala do mapa para resolução da imagem (dpi)


Dada uma escala de mapa de 1: 17.200 e um raster cujo tamanho de célula é 6 polegadas, que resolução (pontos por polegada) devo escolher ao exportar o mapa para uma imagem, a fim de manter a resolução nativa do raster (1 célula = 1 ponto) . Precisa de uma atualização rápida nas fórmulas de conversão.


Encontrei esta fórmula no blog do ESRI Mapping Center:

1 / x = 1 / (tamanho do solo do pixel [m / pixel] × densidade do pixel [pixels / m]), de modo que 1 metro no mapa representa x metros no solo

Que, reorganizado para resolver a densidade de pixels (resolução) é:

densidade de pixels [pixels / m] = tamanho do solo x / pixel [m / pixel]

Conectando meus números / unidades isto é:

densidade de pixels [pixels / polegada] = 17.200 / 6 polegadas = 2866.67 pixels / polegada

Vai ser um grande arquivo ...


Resolução espacial, tamanho do pixel e escala

Para alguns instrumentos de sensoriamento remoto, a distância entre o alvo que está sendo captado e a plataforma desempenha um grande papel na determinação do detalhe das informações obtidas e da área total capturada pelo sensor. Sensores a bordo de plataformas distantes de seus alvos, normalmente visualizam uma área maior, mas não podem fornecer grandes detalhes. Compare o que um astronauta a bordo do ônibus espacial vê da Terra com o que você pode ver de um avião. O astronauta pode ver toda a sua província ou país com um olhar, mas não consegue distinguir casas individuais. Voando sobre uma cidade ou vilarejo, você seria capaz de ver edifícios e carros individuais, mas estaria vendo uma área muito menor do que o astronauta. Há uma diferença semelhante entre imagens de satélite e fotos aéreas.

O detalhe discernível em uma imagem depende do resolução espacial do sensor e se refere ao tamanho do menor recurso possível que pode ser detectado. A resolução espacial de sensores passivos (veremos o caso especial de sensores ativos de micro-ondas mais tarde) depende principalmente de seus Campo de visão instantâneo (IFOV). O IFOV é o cone angular de visibilidade do sensor (A) e determina a área da superfície da Terra que é "vista" de uma dada altitude em um determinado momento no tempo (B). O tamanho da área visualizada é determinado multiplicando o IFOV pela distância do solo ao sensor (C). Esta área no solo é chamada de célula de resolução e determina a resolução espacial máxima de um sensor. Para que uma característica homogênea seja detectada, seu tamanho geralmente deve ser igual ou maior do que a célula de resolução. Se o recurso for menor do que isso, pode não ser detectável, pois o brilho médio de todos os recursos nessa célula de resolução será registrado. No entanto, recursos menores às vezes podem ser detectados se sua refletância dominar dentro de uma célula de resolução articular, permitindo a detecção de sub-pixel ou célula de resolução.

Como mencionamos no Capítulo 1, a maioria das imagens de sensoriamento remoto são compostas de uma matriz de elementos de imagem, ou píxeis, que são as unidades menores de uma imagem. Os pixels da imagem são normalmente quadrados e representam uma determinada área da imagem. É importante distinguir entre o tamanho do pixel e a resolução espacial - eles não são intercambiáveis. Se um sensor tem uma resolução espacial de 20 metros e uma imagem desse sensor é exibida em resolução total, cada pixel representa uma área de 20m x 20m no solo. Neste caso, o tamanho do pixel e a resolução são os mesmos. No entanto, é possível exibir uma imagem com um tamanho de pixel diferente da resolução. Muitos pôsteres de imagens de satélite da Terra têm seus pixels calculados para representar áreas maiores, embora a resolução espacial original do sensor que coletou as imagens permaneça a mesma.

Imagens onde apenas grandes recursos são visíveis são consideradas como tendo resolução grosseira ou baixa. Em fina ou alta resolução imagens, pequenos objetos podem ser detectados. Sensores militares, por exemplo, são projetados para visualizar o máximo de detalhes possível e, portanto, têm uma resolução muito precisa. Os satélites comerciais fornecem imagens com resoluções que variam de alguns metros a vários quilômetros. De modo geral, quanto mais precisa a resolução, menos área total de terreno pode ser vista.

A relação entre a distância em uma imagem ou mapa e a distância real no solo é chamada de escala. Se você tivesse um mapa com uma escala de 1: 100.000, um objeto de 1 cm de comprimento no mapa seria, na verdade, um objeto de 100.000 cm (1 km) de comprimento no solo. Mapas ou imagens com pequenas "proporções mapa-solo" são chamados de pequena escala (por exemplo, 1: 100.000), e aqueles com proporções maiores (por exemplo, 1: 5.000) são chamados de grande escala.


6 Respostas 6

"Eu quero um Bitmap d, que é em tons de cinza. Eu vejo um consructor que inclui System.Drawing.Imaging.PixelFormat, mas não entendo como usar isso."

EDITAR: Para converter para escala de cinza

Versão mais rápida do switchonthecode, siga o link para uma análise completa:

Desta forma, também mantém o canal alfa.
Aproveitar.

Existe um método estático na classe ToolStripRenderer, denominado CreateDisabledImage. Seu uso é tão simples como:

Ele usa uma matriz um pouco diferente daquela na resposta aceita e adicionalmente a multiplica por uma transparência de valor 0,7, então o efeito é um pouco diferente do que apenas tons de cinza, mas se você quiser apenas tornar sua imagem cinza, é o mais simples e melhor solução.

Nenhum dos exemplos acima cria imagens de bitmap de 8 bits (8bpp). Alguns softwares, como processamento de imagem, oferecem suporte apenas a 8bpp. Infelizmente, as bibliotecas do MS .NET não têm solução. O formato PixelFormat.Format8bppIndexed parece promissor, mas depois de muitas tentativas não consegui fazê-lo funcionar.

Para criar um arquivo bitmap verdadeiro de 8 bits, você precisa criar os cabeçalhos adequados. Por fim, encontrei a solução da biblioteca em tons de cinza para a criação de arquivos bitmap de 8 bits (BMP). O código é muito simples:


Análise dimensional / problema de conversão: Escala do mapa para resolução de imagem (dpi) - Sistemas de Informação Geográfica

para o
nitidez da imagem
Series

Nitidez e detalhes da imagem

A nitidez de um sistema de imagem fotográfica ou de um componente do sistema (lente, filme, sensor de imagem, scanner, lente de aumento, etc.) é caracterizada por um parâmetro denominado Função de transferência de modulação (MTF), também conhecido como resposta de frequência espacial. Apresentamos uma explicação visual única do MTF e como ele se relaciona com a qualidade da imagem. Uma amostra é mostrada à direita. O topo é um alvo composto por bandas de frequência espacial crescente, representando 2 a 200 pares de linhas por mm (lp / mm) no plano da imagem. Abaixo você pode ver os efeitos cumulativos da lente, filme, lente + filme, scanner e algoritmo de nitidez, com base em modelos de computador precisos derivados de dados publicados. Se isso interessa a você, continue lendo. Fica um pouco técnico, mas tento ao máximo mantê-lo legível.

  • Esta página apresenta o MTF e o relaciona às medições de resolução tradicionais. ilustra seu efeito no filme e nas lentes. continua com scanners (sensores de imagem) e algoritmos de nitidez.
  • A Parte 3 discute impressoras e impressões e como caracterizar sua nitidez e resolução.
  • A Parte 4 apresenta resultados detalhados do teste da impressora.
  • A Parte 5 discute o teste de lentes usando um novo alvo para download com frequência espacial variável continuamente.
  • A Parte 6 discute a profundidade de campo (DOF), enfatizando a nitidez nos limites da escala DOF. compara câmeras digitais com filme e responde à pergunta: "Quantos pixels são necessários para um sensor digital superar o desempenho de um filme de 35 mm?"
  • A Parte 8 compara granulação e nitidez para três scanners com uma impressão ampliadora bem elaborada, e examinamos o aliasing de granulação e soluções de software.

Introdução à função de transferência de modulação (MTF)

A frequência espacial é normalmente medida em ciclos ou pares de linhas por milímetro (lp / mm), que é análogo a ciclos por segundo (Hertz) em sistemas de áudio. Lp / mm é mais apropriado para câmeras de filme, onde os formatos são relativamente fixos (ou seja, 35mm full frame = 24x36mm), mas ciclos / pixel (c / p) ou larguras de linha por altura de imagem (LW / PH) podem ser mais apropriados para câmeras digitais, que possuem uma grande variedade de tamanhos de sensores.

A maioria de nós está familiarizada com a frequência do som, que é percebida como altura e medida em ciclos por segundo, agora chamada de Hertz. Os componentes de áudio & # 8212 amplificadores, alto-falantes, etc. & # 8212 são caracterizados por curvas de resposta de frequência. MTF também é uma resposta de frequência, exceto que envolve espacial freqüência & # 8212 ciclos (pares de linha) por distância (milímetros ou polegadas) em vez de Tempo. A matemática é a mesma. Os gráficos nessas páginas têm frequências espaciais que aumentam continuamente da esquerda para a direita. As altas frequências espaciais correspondem a detalhes finos da imagem. A resposta de componentes fotográficos (filme, lentes, scanners, etc.) tende a rolar em altas frequências espaciais. Esses componentes podem ser considerados como filtros passa-baixa e filtros # 8212 que passam baixas frequências e atenuam altas frequências.

Pares de linhas ou linhas?
Todos os gráficos MTF e a maioria gráficos de resolução exibem frequência espacial em ciclos ou pares de linha por unidade de comprimento (mm ou polegadas). Mas existem exceções. Um padrão antigo para medir a resolução da TV usa linha larguras ao invés de pares , onde há duas larguras de linha por par, sobre a altura total da tela. Quando dpreview.com recomenda multiplicar os valores do gráfico em seus testes de lente por 100 para obter o total de linhas verticais na imagem, eles se referem à linha larguras , não pares . Confuso, mas tento manter as coisas certas. Imatest SFR exibe MTF em ciclos (pares de linha) por pixel, larguras de linha por altura de imagem (LW / PH derivado de medições de TV) e pares de linha por distância (mm ou pol).

O significado essencial de MTF é bastante simples. Suponha que você tenha um padrão que consiste em um tom puro (uma onda senoidal). Em frequências onde o MTF de um sistema de imagem ou componente (filme, lente, etc.) é 100%, o padrão não é atenuado & # 8212 ele retém o contraste total. Na frequência em que o MTF é 50%, o contraste tem a metade de seu valor original e assim por diante. MTF é geralmente normalizado a 100% em frequências muito baixas. Mas pode ir acima de 100% com resultados interessantes.

Os níveis de contraste de 100% a 2% são ilustrados à direita para um padrão senoidal de frequência variável. O contraste é moderadamente atenuado para MTF = 50% e severamente atenuado para MTF = 10%. O padrão de 2% é visível apenas porque as condições de visualização são favoráveis: ele é cercado por um cinza neutro, não faz barulho (sem granulação) e o contraste da tela para CRTs e a maioria das telas LCD é relativamente alto. Ele poderia facilmente se tornar invisível em condições menos favoráveis.

Como o MTF está relacionado à resolução de linhas por milímetro? A medição de resolução antiga & # 8212 lp / mm & # 8212 distinguível corresponde aproximadamente a frequências espaciais onde MTF está entre 5% e 2% (0,05 a 0,02). Esse número varia de acordo com o observador, a maioria dos quais o estende o máximo que pode. Um MTF de 9% está implícito na definição do limite de difração de Rayleigh.

A figura abaixo representa um padrão senoidal (frequências puras) com frequências espaciais de 2 a 200 ciclos (pares de linhas) por mm em uma tira de filme de 0,5 mm. A metade superior do padrão senoidal tem contraste uniforme. A metade inferior ilustra os efeitos do Provia 100F no MTF. O contraste do padrão cai para metade a 42 ciclos / mm.

VB A luminância mínima (ou valor de pixel) para áreas pretas & # 8212 em baixas frequências espaciais. A frequência deve ser baixa o suficiente para que o contraste não mude se for reduzido.
VC A luminância máxima para áreas brancas & # 8212 em baixas frequências espaciais.
Vmin A luminância mínima para um padrão próximo à frequência espacial f (um "vale" ou "pico negativo").
Vmax A luminância máxima para um padrão próximo à frequência espacial f (um "pico").
C (0) = (VC-VB) / (VC+ VB) é o contraste de baixa frequência (preto e branco).
C ( f ) = (Vmax-Vmin) / (Vmax+ Vmin) é o contraste na frequência espacial f . Normalizando o contraste desta forma & # 8212 dividindo por Vmax+ Vmin (VC+ VB em baixas frequências espaciais) & # 8212 minimiza erros devido a não linearidades relacionadas com gama na aquisição do padrão.
MTF ( f ) = 100% * C ( f ) / C (0)

Sistemas de imagem

Os sistemas de imagem de filme consistem em uma lente, filme, revelador, scanner, editor de imagem e impressora (para impressões digitais) ou lente, filme, revelador, lente de ampliação e papel (para impressões tradicionais em câmara escura). Os sistemas de imagem baseados em câmera digital consistem em uma lente, sensor de imagem digital, programa de desmonteçamento, editor de imagem e impressora. Cada um desses componentes tem uma resposta de frequência característica MTF é apenas seu nome em fotografia. A beleza de trabalhar no domínio da frequência é que a resposta de todo o sistema (ou grupo de componentes) pode ser calculada multiplicando-se as respostas de cada componente.

As frequências típicas de 50% de MTF estão em torno de 40 a 80 lp / mm para componentes individuais (lentes, filme, scanners) e muitas vezes tão baixas quanto 30 lp / mm para sistemas de imagem inteiros & # 8212 muito mais baixo do que as linhas de 80-160 / mm números típicos das medições de resolução antigas. Demora algum tempo para se acostumar, se você cresceu com as medidas antigas.

  1. Converta o sinal no domínio da frequência usando uma operação matemática conhecida como transformada de Fourier, que é rápido e fácil de executar em computadores modernos usando o algoritmo FFT (Fast Fourier Transform). O resultado da transformação é chamado de componentes de frequência ou FFT do sinal. As imagens diferem das funções de tempo, como o som, por serem bidimensional. O filme tem o mesmo MTF em qualquer direção, mas não as lentes.
  2. Multiplique os componentes de frequência do sinal pela resposta de frequência (ou MTF) do componente ou sistema.
  3. O inverso transforma o sinal de volta no tempo ou domínio espacial.

Um gráfico virtual para visualizar MTF

O vermelho curva é a resposta espacial do padrão de barra ao filme + lente. O azul curva é o MTF combinado, ou seja, o resposta de frequência espacial do filme + lente, expresso em porcentagem da resposta de baixa frequência, indicada na escala à esquerda. (Ultrapassa 100% (10 2).) O fino azul a curva tracejada é o MTF da lente apenas.

As bordas do padrão de barra foram alargadas e há pequenos picos em cada lado das bordas. A forma da borda está inversamente relacionada à resposta do MTF: quanto mais estendida a resposta do MTF, mais nítida (ou estreita) a borda. O aumento de frequência média da resposta de MTF está relacionado aos pequenos picos em ambos os lados das bordas.

A curva MTF está relacionada à resposta ao impulso por uma operação matemática conhecida como transformada de Fourier ( F ), que é bem conhecido de engenheiros e físicos.

Resposta MTF = F(Resposta de impulso)
resposta ao impulso = F -1 (resposta MTF)

A imagem acima representa apenas 0,5 mm de filme, mas ocupa cerca de 5 polegadas (13 cm) no meu monitor. Com esta ampliação (260 x), uma imagem de 35 mm de quadro inteiro (24 x 36 mm) teria 240 polegadas (6,2 metros) de altura e 360 ​​polegadas (9,2 metros) de largura. Um pouco excessivo, mas se você se afastar da tela, terá uma ideia dos efeitos da lente, filme, scanner (ou câmera digital) e nitidez em imagens reais.

Links para artigos gerais sobre MTF

Acuidade visual humana

À distância d do olho (que tem uma distância focal nominal de 16,5 mm), isso corresponde a objetos de comprimento = (ângulo em radianos)*d = 0.000291*d. Por exemplo, para um objeto visualizado a uma distância de 25 cm (cerca de 10 polegadas), a distância que você pode usar para um exame minucioso de uma impressão fotográfica de 8 x 10 polegadas, isso corresponderia a 0,0727 mm = 0,0029 polegadas. Como um par de linhas corresponde a duas linhas desse tamanho, a frequência espacial correspondente é 6,88 lp / mm ou 175 lp / polegada. Suponha agora que a imagem foi impressa a partir de um quadro de 35 mm ampliado em 8 x. A frequência espacial correspondente no filme seria de 55 lp / mm.

Isso significa que, para uma impressão de 8 x 10 polegadas, o MTF de uma câmera de 35 mm (lente + filme, etc.) acima de 55 lp / mm ou o MTF de uma câmera digital acima de 2800 LW / PH (larguras de linha por altura de imagem) medido por Imatest SFR, tem não efeito na aparência da impressão. É por isso que as frequências espaciais mais altas usadas nos gráficos MTF do fabricante são normalmente 40 lp / mm, o que fornece uma excelente indicação da nitidez percebida de uma lente em uma impressão de 8 x 10 polegadas ampliada em 8 x. É claro que frequências espaciais mais altas são de interesse para impressões maiores.

As escalas de profundidade de campo (DOF) padrão nas lentes são baseadas na suposição, feita na década de 1930, de que o menor recurso de importância, visto a 25 cm, é 0,01 polegadas & # 8212 3 vezes maior. Não deveria ser uma surpresa que o foco não seja tão nítido nos limites do DOF. Veja a página DOF para mais detalhes.

A afirmação de que o olho não consegue distinguir traços menores do que um minuto de arco é, obviamente, simplificada demais. O olho tem uma resposta MTF, assim como qualquer outro componente óptico. Ele é ilustrado à direita na Apostila nº 9: Percepção Visual Humana do curso EE368B da Universidade de Stanford - Compressão de Imagem e Vídeo do Professor Bernd Girod. O eixo horizontal é a frequência angular em ciclos por grau (CPD). MTF é mostrado para tamanhos de pupila de 2 mm (iluminação forte f / 8) a 5,8 mm (iluminação fraca f / 2.8). Em 30 CPD, correspondendo a um minuto de um tamanho de recurso de arco, MTF cai de 0,4 para a pupila de 2 mm para 0,16 para a pupila de 5,8 mm. (Agora você conhece o alcance f-stop do seu olho. É semelhante a câmeras digitais compactas.) Outra página de Stanford tem modelos de computador Matlab do MTF do olho.

Explicações adicionais sobre a acuidade visual humana podem ser encontradas nas páginas do centro de recursos de testes não destrutivos e da Universidade de Stanford. A página 3 de Stanford tem um gráfico da MTF do olho humano. Acredito que as unidades do eixo x (CPD) são Ciclos por Grau, onde um par de recursos de 1/60 de grau corresponde a 30 CPD.


Edição especial "Morfologia Matemática em Geoinformática"

Geoinformática é a ciência que lida com a captura, análise, interpretação, disseminação e uso de informações geográficas. As informações geográficas são amplamente utilizadas em aplicações como mapeamento básico, gestão ambiental, transporte e telecomunicações ou planejamento urbano, gestão agrícola, monitoramento de mudanças climáticas e muitos outros.

Durante as últimas décadas, vários novos sistemas de aquisição evoluídos foram desenvolvidos. Eles fornecem uma quantidade cada vez maior de dados extremamente ricos: sistemas Lidar, aéreos ou terrestres, imagens hiperespectrais com um número crescente de canais e resolução melhorada, entre outros. Técnicas de processamento automático ou semiautomático são necessárias para extrair informações semânticas desses dados, úteis para o desenvolvimento de aplicações práticas.

A Morfologia Matemática é uma técnica de processamento de imagens não linear, baseada na teoria dos conjuntos. Descreve quantitativamente o conteúdo da imagem em termos de forma e tamanho, em uma estrutura matemática elegante. Provou ser uma técnica extremamente eficaz em muitas aplicações e, em particular, em aplicações geográficas e geoinformáticas.

Esta edição especial tem como objetivo fornecer uma visão de ponta dos avanços da morfologia matemática para aplicações geoinformáticas.Resultados experimentais e teóricos são esperados.

Os tópicos de interesse para esta edição especial incluem, mas não estão limitados a:

  • Segmentação de nuvem de pontos, classificação.
  • Análise e modelagem de cenários urbanos.
  • Filtragem, segmentação, classificação de imagens hiperespectrais
  • Uso do solo
  • Detecção de mudança
  • Serviços geográficos baseados em satélite: monitoramento florestal, umidade do solo, avaliação de danos e hellip

Os autores da academia ou da indústria que trabalham nas áreas de pesquisa acima ou relacionadas são encorajados a enviar manuscritos originais que não foram publicados e não estão atualmente sob revisão por outras revistas. Os possíveis autores devem enviar o manuscrito completo por meio do sistema online (https://susy.mdpi.com/user/manuscripts/upload?journal=ijgi).

Dra. Beatriz Marcotegui
Editor Convidado

Os manuscritos devem ser submetidos online em www.mdpi.com, registrando-se e fazendo login neste site. Depois de registrado, clique aqui para acessar o formulário de inscrição. Os manuscritos podem ser submetidos até a data limite. Os artigos serão publicados continuamente (assim que forem aceitos) e serão listados juntos no site da edição especial. Artigos de pesquisa, artigos de revisão, bem como comunicações são convidados. Para trabalhos planejados, um título e um resumo curto (cerca de 100 palavras) podem ser enviados ao Escritório Editorial para divulgação neste site.

Os manuscritos enviados não devem ter sido publicados anteriormente, nem estar sob consideração para publicação em outro lugar (exceto artigos de anais de conferências). Todos os manuscritos são avaliados por meio de um processo de revisão por pares. Um guia para autores e outras informações relevantes para a submissão de manuscritos estão disponíveis na página de Instruções para Autores. ISPRS International Journal of Geo-Information é um jornal mensal de Acesso Aberto revisado por pares internacionais publicado pela MDPI.

Visite a página de Instruções para Autores antes de enviar um manuscrito. A taxa de processamento de artigos (APC) para publicação nesta edição especial é de 150 CHF (francos suíços).


Sistemas de imagem digital e armazenamento em disco óptico de dados digitais

Nos últimos anos, as agências federais tornaram-se cada vez mais interessadas no uso de tecnologias de informação digital para armazenar grandes quantidades de informações de maneira econômica e eficiente. Isso é particularmente verdadeiro para programas destinados a fornecer informações federais aos cidadãos, uma vez que uma redução correspondente na criação de registros em papel poderia reduzir custos e melhorar a prestação de serviços ao público. No entanto, as agências precisam garantir que quaisquer tecnologias que empreguem para armazenar informações sejam capazes de recuperar essas informações pelo tempo que for necessário.

Em 1991, a Administração Nacional de Arquivos e Registros (NARA), em conjunto com a Associação Nacional de Administradores de Arquivos e Registros do Governo, conduziu um estudo de imagens digitais e tecnologias de armazenamento de mídia óptica nos níveis de governo estadual e local. Com base no relatório de 1991, o NARA iniciou um estudo do uso federal dessas duas tecnologias. Uma equipe de projeto da equipe de pesquisa de tecnologia da NARA analisou quinze aplicativos federais de imagem digital e armazenamento em disco digital óptico e entrevistou vários especialistas na área. Este Documento de Informações Técnicas, que faz recomendações para garantir o acesso de longo prazo às imagens digitais armazenadas em discos ópticos de dados digitais, é o resultado desse estudo.

Como guardiã da memória da nação e como gerente de registros institucionais do governo federal, o NARA tem o mandato de fornecer orientação de gerenciamento de registros aos funcionários federais. Ao mesmo tempo, convidamos arquivistas, gerentes de registros, gerentes de recursos de informação e outros profissionais da informação para compartilhar suas experiências e observações conosco. Juntos, podemos desenvolver estratégias para usar novas tecnologias para armazenar informações federais, garantindo que os requisitos de retenção e acesso sejam atendidos.

TRUDY HUSKAMP PETERSON
Arquivista em exercício dos Estados Unidos
Administração Nacional de Arquivos e Registros

Índice

  • Integração do Sistema
  • Arquitetura de sistemas abertos
  • Configuração do sistema de imagem digital
  • Conversão de registros originais
  • Scanners de imagem digital
    • Scanners de documentos
    • Digitalização digital e microformas
    • Configuração do sistema de disco óptico de dados digitais
    • Tecnologias ópticas de gravação em disco digital de dados
      • Sistemas Write Once Read Many (WORM).
      • Sistemas regraváveis
      • Estações de trabalho de exibição de imagens
      • Impressoras de imagens digitais
      • Software de aplicativos de recuperação
      • Custo-eficácia
      • Disposição de registros originais
      • Admissibilidade Legal
      • Acesso de longo prazo
      • Obstáculos ao acesso
        • Instabilidade do fornecedor
        • Expectativa de vida da mídia / transferência de dados e backups
        • Obsolescência do sistema

        • Agência de Registro de Doenças e Substâncias Tóxicas
        • Corpo de Engenheiros do Exército dos EUA (USACE)
        • Bureau of Land Management (Eastern States)
        • Comissão de negociação de futuros de commodities
        • Departamento do Exército (Gabinete do Chefe do Estado-Maior)
        • Departamento do Exército (PERMS)
        • Agência de Proteção Ambiental
        • Comissão Federal de Comunicações
        • Biblioteca do Congresso
        • Serviço de gestão de minerais
        • Administração Oceânica e Atmosférica Nacional
        • Patent and Trademark Office
        • Administração da Segurança Social
        • Departamento de Estado
        • Pesquisa Geológica dos Estados Unidos

        Em 1983, o Arquivista dos Estados Unidos determinou que a recém-criada Equipe de Pesquisa e Avaliação de Arquivos iniciasse um programa para monitorar os desenvolvimentos em imagens digitais e tecnologias de armazenamento em disco óptico de dados digitais. Em 1985, a equipe havia iniciado uma agenda de pesquisa que incluía vários programas importantes. Um projeto piloto de imagem digital e disco óptico de dados digitais, concluído em 1989, avaliou a adequação das tecnologias de imagem digital e disco óptico de dados digitais para acervos dos Arquivos Nacionais. Outro programa financiou um projeto de pesquisa do Instituto Nacional de Padrões e Tecnologia (NIST) para desenvolver uma metodologia de teste genérica para prever a expectativa de vida de gravação após leitura de várias mídias ópticas (WORM). Este estudo do NIST foi concluído em 1990. Subseqüentemente, um grupo de padrões internacionais sobre permanência de imagens baseou-se nos resultados e conclusões do trabalho do NIST no desenvolvimento de padrões de expectativa de vida para sistemas ópticos de armazenamento em disco digital de dados. Até agora, este grupo de padrões desenvolveu um esboço de padrão de expectativa de vida para mídia de CD-ROM e atualmente está desenvolvendo um semelhante para discos de dados digitais ópticos regraváveis.

        Embora o NIST tenha desenvolvido e demonstrado uma metodologia de teste genérica bem-sucedida, ela é útil apenas como um indicador geral da expectativa de vida da mídia. Isso ocorre porque discos ópticos de dados digitais específicos podem falhar em diferentes períodos de tempo que podem variar ao longo de muitos anos. Mesmo que este indicador seja útil, talvez como um guia geral na seleção de mídia, ele não pode indicar quando recopiar dados armazenados em um disco óptico de dados digital específico. Consequentemente, em 1990, a Administração Nacional de Arquivos e Registros (NARA) contratou o Instituto Nacional de Padrões e Tecnologia para tratar desse problema como parte de um estudo mais amplo sobre a integridade de dados da mídia óptica. A equipe do programa NIST organizou um grupo de trabalho que desenvolveu um conjunto de procedimentos para monitorar e relatar resultados de detecção de erros e códigos de correção de erros em unidades de disco óptico. Essas atividades de detecção e correção de erros são executadas automaticamente, sem nenhuma ação dos usuários. Um problema existente é que a maioria das unidades de disco óptico não fornece uma funcionalidade para monitorar e relatar os resultados da verificação de erros. Os resultados do NIST / grupo de trabalho da indústria foram usados ​​como base para um projeto de padrão da Association for Information and Image Management (AIIM) que estipula o monitoramento de erros de mídia e técnicas de relatório para verificação das informações armazenadas em discos ópticos de dados digitais. Este projeto de padrão da AIIM está sendo votado. O estudo de integridade de dados do NIST inclui pesquisas sobre cuidados e manuseio de discos ópticos de dados digitais. Os resultados desses experimentos serão publicados em um relatório do NIST previsto para o outono de 1994.

        Ao mesmo tempo, a equipe de pesquisa em tecnologia da NARA iniciou um estudo sobre o uso de imagens digitais e tecnologias de mídia óptica em programas de registros públicos para governos estaduais e locais. Embora o ímpeto para este estudo tenha sido um pedido da Associação Nacional de Administradores de Arquivos e Registros do Governo (NAGARA), o plano de trabalho descritivo do projeto afirmava que era a primeira fase de um projeto de duas fases. O projeto culminaria em um relatório de estratégia de acesso à informação para agências federais. O NARA e o NAGARA publicaram o relatório da primeira fase, o estudo do governo estadual e local, em dezembro de 1991. Pouco depois, a Equipe de Pesquisa em Tecnologia do NARA começou a pesquisar a segunda fase e produziu este relatório detalhando estratégias para acesso de longo prazo para agências federais.

        Com base no que foi aprendido no relatório dos governos estaduais e locais, a equipe do projeto desenvolveu uma metodologia de pesquisa baseada em:

        • Uma revisão do mercado de imagem digital e disco óptico de dados digitais e literatura técnica (por exemplo, jornais da indústria óptica, estudos especiais e relatórios técnicos) para identificar tendências emergentes,
        • Uma avaliação da indústria privada e experiências de administrador de sistema de agência federal com projetos de imagem digital e disco óptico de dados digitais, e
        • Um exame no local em todo o país de 15 aplicativos de imagem digital ou disco óptico de dados digitais de agências federais.

        O objetivo desta análise de três partes foi identificar problemas de gerenciamento críticos e relacioná-los às tendências técnicas e experiências do usuário. Este relatório consiste em um resumo executivo, uma lista de recomendações, uma visão geral dos desafios envolvidos no acesso a dados de longo prazo, seguido por cinco seções que descrevem a captura de imagem digital, sistemas de indexação, sistemas ópticos de armazenamento em disco digital de dados, recuperação de informações e política de gestão da informação. Cada uma das cinco seções principais do relatório contém problemas de gerenciamento, tendências de tecnologia, experiências do usuário e recomendações.

        A maioria das recomendações fornecidas neste relatório está em conformidade com o estudo do governo estadual e local, embora haja várias divergências claras. Geralmente, essas saídas levam em consideração um melhor entendimento das questões e refletem as tendências de mudança na tecnologia da informação digital. Quatro apêndices do relatório fornecem descrições detalhadas das visitas ao local da agência, um resumo dos padrões técnicos relevantes, um glossário de termos técnicos e uma bibliografia comentada. Para ajudar os leitores deste relatório, os autores selecionaram negrito para identificar os termos técnicos que são subsequentemente definidos no apêndice C, "Glossário de termos".

        A equipe do Arquivo Nacional responsável pela preparação deste relatório de estratégias de longo prazo incluiu Charles Dollar, Barry Roginski, Peter Hirtle e Charles Obermeyer II. Barry Roginski tinha a responsabilidade principal de coletar as descrições das visitas locais da agência e organizar o relatório.

        Agradecimentos

        A Equipe de Pesquisa de Tecnologia da NARA gostaria de aproveitar esta oportunidade para reconhecer a assistência especial fornecida por aqueles indivíduos e agências federais cujas contribuições tornaram este relatório possível. Os seguintes indivíduos participaram generosamente de nossas visitas ao local e forneceram assistência editorial durante a preparação dos relatórios de visita ao local:

        Tim Allard, Serviço de Gerenciamento de Minerais Ray Buland, Centro Nacional de Informações sobre Terremotos Ann Christy e Kristin Vajs, Biblioteca do Congresso Malcolm Ewell, Administração da Previdência Social James F. Gegen e Linda Brooks, Escritório de Gerenciamento de Terras David Grooms, Escritório de Marcas e Patentes Sharon O. Jacobs, Agency for Toxic Substances and Disease Registry Rick Kanner, Federal Communications Commission Jacqui Lilly, Departamento de Estado Charles MacFarland, National Oceanic and Atmospheric Administration Gail Martin, Departamento do Exército Hunton G. Oliver, Commodity Futures Trading Commission Major Perkins, Departamento de o Exército Linda Worthington, Corpo de Engenheiros do Exército dos EUA Charles Young, Agência de Proteção Ambiental

        Agradecimentos especiais também são devidos às seguintes pessoas por suas contribuições durante as fases de coleta de dados, análise técnica e revisão editorial deste relatório:

        Robert M. Blatt, Grupo de Sistemas Telos

        Eric Chaskes, Mary Donovan, Steven Puglia e Sandra Tilley, NARA

        Paul Conway, Universidade de Yale

        Marilyn Courtot, Literatura Infantil

        Howard N. Greenhalgh e Eric E. Tolbert, Departamento do Exército

        Richard Harrington, Biblioteca Estadual da Virgínia

        Anne R. Kenney, Universidade Cornell

        Basil Manns, Biblioteca do Congresso

        Lance W. Morgan, Science Applications International Corporation

        Fernando L. Podio, Instituto Nacional de Padrões e Tecnologia

        William K. Saffady, Universidade Estadual de Nova York em Albany

        Seção 1: Resumo Executivo

        A Administração Nacional de Arquivos e Registros (NARA) concluiu recentemente um estudo de imagem digital e sistemas de armazenamento em disco óptico de dados digitais no Governo Federal. Este relatório, preparado pela Equipe de Pesquisa de Tecnologia da NARA, discute as descobertas desse estudo. As principais áreas identificadas são questões críticas de gerenciamento de informações, tendências tecnológicas e experiências de usuário pertinentes. Os elementos do estudo de pesquisa incluíram a análise dos desenvolvimentos tecnológicos de disco óptico digital de dados, revisão da literatura técnica relevante, avaliação de experiências de gerenciamento de programa de agência federal com sistemas de disco óptico de dados digitais e visitas a 15 projetos de disco óptico de agência federal. Os apêndices do relatório consistem em resumos descritivos das visitas ao local, uma lista de padrões técnicos, um glossário que define os termos técnicos e uma bibliografia comentada.

        Os benefícios potenciais dos sistemas de imagem podem ser melhor alcançados quando o sistema de disco óptico digital de dados oferece suporte às necessidades de informação da agência como um todo e quando a tecnologia é usada para aprimorar o serviço - não simplesmente para resolver um problema único e isolado. Agentes federais de gerenciamento de registros e arquivistas têm um interesse vital em discos ópticos de dados digitais, mas também devem estar cientes dos perigos da obsolescência tecnológica, especificações inconsistentes de desempenho de equipamentos, novos produtos incompatíveis e escassez de padrões técnicos e administrativos. Observe que o termo "valor de longo prazo" (definido pela necessidade da agência) não é sinônimo de "permanente", o que denota valor histórico e retenção permanente pelos Arquivos Nacionais. A política atual dos Arquivos Nacionais em relação aos discos ópticos de dados digitais como meio de transferência de informações de valor permanente está descrita na seção 8, "Disposição de Registros Originais".

        Os gerentes de programas de agências federais responsáveis ​​por registros com valor de longo prazo devem considerar as recomendações deste relatório úteis para projetar e implementar um sistema de disco óptico de dados digitais. Este relatório não é uma visão abrangente de todas as questões importantes relacionadas ao acesso de longo prazo aos registros eletrônicos. Em vez disso, destina-se a complementar os estudos técnicos existentes e outra literatura geralmente disponível referente às tecnologias de imagem digital e disco óptico de dados digitais. Em particular, este relatório não se destina a fornecer uma análise exaustiva de questões relacionadas à indexação e recuperação de banco de dados, o desenvolvimento de padrões de disco óptico de dados digitais ou tecnologia de memória somente leitura de disco compacto (CD-ROM). O disco compacto gravável (CD-R), por exemplo, tem padrões formais e de fato para fatores como estrutura de diretório e formato físico e oferece uma relativa independência dos dados armazenados de mecanismos de recuperação proprietários. A escassez de sistemas de CD-R observáveis ​​durante as 15 visitas ao local impediu uma ampla discussão sobre as experiências do usuário com a tecnologia de CD-R neste relatório.

        Funcionários de órgãos federais responsáveis ​​por selecionar e gerenciar sistemas de armazenamento óptico devem adotar como objetivo geral manter o acesso a registros de valor de longo prazo armazenados em formato digital. Para atingir esse objetivo, esses funcionários devem:

        • Garantir a qualidade das imagens digitais capturadas por meio de um processo de conversão eletrônica,
        • Fornece a funcionalidade contínua de componentes do sistema,
        • Monitore e limite a deterioração do armazenamento em disco óptico de dados digitais e
        • Antecipe e planeje novos desenvolvimentos tecnológicos.

        A usabilidade de longo prazo de informações armazenadas digitalmente, incluindo imagens de documentos digitalizados, dados digitais e dados de índice descritivos, será melhor alcançada com a implementação de uma política sólida para a migração de dados para as gerações futuras de tecnologia, aderindo a formatos de cabeçalho de arquivo de imagem bem documentados, e monitorar a degradação da mídia. Os gerentes de sistema devem criar a infraestrutura técnica e administrativa necessária para implementar os padrões de tecnologia da informação relevantes à medida que são desenvolvidos.

        Garantir a qualidade das imagens digitais significa exercer controle contínuo sobre três processos: conversão da imagem original em aprimoramento de dados digitais da imagem digital, se necessário, e compactação e / ou descompressão dos dados digitais para transmissão, armazenamento e recuperação. As inspeções de controle de qualidade, seja na estação de trabalho do scanner de documentos ou como uma tarefa de acompanhamento, devem comparar os documentos originais com as imagens eletrônicas capturadas e dados de índice.

        Garantir que as informações armazenadas em discos ópticos de dados digitais continuarão a servir a função para a qual foram originalmente destinadas, enquanto for necessário:

        • Um compromisso de longo prazo com uma arquitetura de sistemas abertos e
        • Adoção de uma abordagem metódica para atualização de componentes do sistema e migração de dados que garante a interoperabilidade das tecnologias atuais com aquelas ainda a serem desenvolvidas.

        Os administradores de agências federais podem utilizar tecnologias de gravação única de muitas leituras (WORM) ou de disco digital óptico regravável para armazenar registros de valor de longo prazo. Os administradores que usam discos ópticos de dados digitais regraváveis ​​devem garantir que os privilégios de leitura / gravação sejam meticulosamente controlados e que uma trilha de auditoria das regravações seja mantida. A menos que haja justificativas específicas para o programa, os administradores devem selecionar o formato de armazenamento em disco óptico de dados digital de tamanho mais adequado que satisfaça as necessidades do programa de agência de longo prazo, ao mesmo tempo em que está em conformidade com os padrões da indústria.

        A NARA há muito reconheceu os benefícios potenciais da tecnologia de disco óptico de dados digitais para armazenar e recuperar grandes quantidades de informações. Vários anos atrás, devido ao estado instável da tecnologia de mídia ótica e especialmente à ausência de padrões, o NARA publicou um boletim de política de mídia ótica. Este boletim notificou as agências federais de que o NARA não poderia acessar discos ópticos de dados digitais contendo registros de valor permanente. Os registros permanentes armazenados originalmente em discos ópticos de dados digitais exigiam a conversão para um meio aceitável para o NARA no momento da transferência para a custódia legal do NARA. Um boletim revisado abordando essas preocupações foi publicado recentemente pelo NARA.

        A estabilidade de longo prazo dos discos ópticos de dados digitais requer a especificação de uma tecnologia confiável de armazenamento / gravação e proteção contínua da mídia contra danos e abusos por meio do manuseio e de condições ambientais adversas. Embora os discos ópticos de dados digitais pareçam ser mais duráveis ​​e estáveis ​​do que o hardware e o software necessários para manter o acesso, as alegações do fornecedor em relação à durabilidade devem ser examinadas cuidadosamente.Este exame deve envolver uma avaliação dos dados de fabricação do disco óptico de dados digitais, metodologia e procedimentos de teste e resultados de teste com base nas descobertas descritas no NIST SP-200. Essa avaliação deve suportar uma vida útil prevista de pré-gravação de cinco anos e uma expectativa de vida pós-gravação de pelo menos vinte anos. Como os discos ópticos de dados digitais não são imunes a condições hostis de armazenamento, é prudente armazená-los em um ambiente estável.

        Por si só, os sistemas de armazenamento de dados digitais ópticos e de imagem digital não podem resolver os problemas de acesso decorrentes de manuais ineficientes ou sistemas e práticas de informação computadorizada existentes. Na verdade, automatizar processos ineficientes pode apenas exacerbar as deficiências existentes. Os administradores de agências que aproveitam a oportunidade para reavaliar os procedimentos operacionais de escritório ao adotar novas tecnologias têm maior probabilidade de se beneficiar de uma produtividade administrativa aprimorada, serviços de usuário aprimorados e economia de custos operacionais.

        O acesso de longo prazo a registros de valor duradouro armazenados em discos ópticos de dados digitais envolve mais, entretanto, do que a qualidade da imagem, a funcionalidade do sistema e a estabilidade da mídia. A adoção do armazenamento digital de informações em discos ópticos digitais de dados vincula efetivamente a agência a uma evolução tecnológica que ela não controla. Os administradores devem continuar a monitorar o plano de tendências tecnológicas para manutenção sistemática, atualização e eventual migração para tecnologias mais novas, usar padrões existentes e emergentes, apoiar o desenvolvimento de padrões de intercâmbio de dados e adotar medidas prudentes de preservação de informações nesse ínterim.

        Administradores de agências, funcionários de gerenciamento de informações, analistas de desenvolvimento de sistemas, gerentes de registros e historiadores de agências devem trabalhar juntos para desenvolver e implementar políticas e procedimentos que regem o cuidado de registros de agências federais avaliados como permanentes pelo NARA.

        Seção 2: Lista de recomendações

        Esta seção lista as recomendações técnicas e administrativas significativas que são descritas em mais detalhes neste relatório. Para facilitar a referência do usuário, a organização básica desta seção está em conformidade com as principais seções e subtítulos no restante deste relatório.

        CAPTURA DE IMAGEM DIGITAL

        Adote uma arquitetura de sistemas abertos para novos aplicativos de disco óptico de dados digitais. ou

        Requer uma "ponte" para sistemas com configurações não proprietárias.

        Configuração do sistema de imagem digital

        Defina claramente os requisitos do usuário e da agência durante a fase de análise de requisitos do projeto de imagem.

        Verifique se o sistema de imagem tem flexibilidade inerente e tem um design aberto, ou não proprietário, que aceita futuras atualizações de hardware e software.

        Conversão de registros originais

        Analise o domínio dos documentos a serem digitalizados, identifique os níveis de uniformidade e considere o uso de um contratante de conversão de documentos quando os acervos de backfile forem extensos.

        Implemente um processo abrangente de contabilidade e rastreamento de registros durante a fase de conversão do projeto.

        Invista pessoal suficiente ou recursos de contratados na preparação de documentos para aumentar a produtividade da digitalização.

        Conforme apropriado, designe uma equipe experiente da agência para processos de conversão que se beneficiem de seu conhecimento das operações existentes da agência.

        Antes da aquisição do sistema, valide as declarações do fornecedor em relação às taxas de transferência de documentos, qualidade de imagem e facilidade de operação usando uma amostra representativa dos acervos da agência.

        Siga os procedimentos de teste padrão descritos em FIPS PUB 157 "Diretrizes para controle de qualidade de scanners de imagem."

        Empregue uma resolução de digitalização de pelo menos 300 dpi para documentos de escritório quando futuras aplicações (por exemplo, OCR) para as imagens digitais forem antecipadas.

        Especifique uma resolução de digitalização mais alta (entre 300 e 600 dpi ou superior) conforme necessário, para desenhos de engenharia, mapas e documentos que contenham linhas finas significativas e informações detalhadas de fundo.

        Empregue tecnologia de imagem em escala de cinza ou colorida conforme necessário para imagens em tons contínuos adequados, como fotografias, mapas e registros relacionados.

        Conforme apropriado, utilize a tecnologia de imagem em escala de cinza de 8 bits por pixel para capturar fotografias e / ou negativos em preto e branco de tom contínuo e o modo de 24 bits para obter a reprodução de cores reais.

        Conduza o teste do scanner usando documentos selecionados durante a fase de design do sistema para determinar a necessidade de modificações especiais no hardware do scanner.

        Reter imagens digitalizadas sem aprimoramento de documentos de valor intrínseco.

        Cabeçalhos de arquivo de imagem digital

        Use formatos de arquivo que promovam / facilitem a transferência de dados de rede, como Aldus / Microsoft TIFF Versão 5.0, que atende à definição padrão da Força-Tarefa de Engenharia da Internet para troca de imagens em preto e branco na Internet.

        Requer o uso de um rótulo de cabeçalho de arquivo de imagem não proprietário. Ou Exigir uma "ponte" para um rótulo de cabeçalho de arquivo de imagem não proprietário. Ou Exigir uma definição detalhada da estrutura da etiqueta do cabeçalho do arquivo de imagem.

        Técnicas de compressão de dados

        Use um esquema de compactação sem perdas quando for possível e desejada fidelidade contínua à aparência exata do documento original.

        Use JPEG ou MPEG para imagens com qualidades tonais contínuas quando alguma perda de detalhes for aceitável.

        Para imagens digitais sem qualidades tonais contínuas, requerem técnicas de compressão padronizadas, como CCITT Grupo 3, CCITT Grupo 4 ou JBIG.

        Se um sistema de compactação sem perdas proprietário for usado, exija que o fornecedor forneça um meio de descompactar os dados para seu formato original.

        Garantia de qualidade de imagem digital

        Avalie rotineiramente o desempenho do scanner com base nos procedimentos de controle de qualidade recomendados no FIPS PUB 157 "Diretrizes para controle de qualidade de scanners de imagem".

        Estabeleça um consenso sobre o que constitui a "melhor" imagem para os diferentes tipos de documentos de origem da agência e monitore a qualidade da imagem em andamento usando as telas do sistema e impressoras a laser.

        Realize uma avaliação de qualidade visual de 100 por cento de cada imagem digitalizada e as inspeções de controle de qualidade de dados de índice relacionadas devem ser meticulosas se os documentos originais não forem retidos após a conversão.

        Verifique as informações como copiadas ao transferir imagens / dados para qualquer outra mídia do disco rígido magnético original ou disco óptico de dados digitais.

        Se os discos WORM forem o meio de armazenamento de sua escolha, grave as informações permanentemente somente após conduzir uma inspeção completa de controle de qualidade das imagens digitalizadas e dados de índice.

        SISTEMAS DE INDEXAÇÃO

        Conforme apropriado, certifique-se de que o software de recuperação de informações seja compatível com SQL.

        Independentemente da metodologia de captura usada, conduza uma inspeção de controle de qualidade de 100 por cento de todos os dados do índice.

        Armazene os dados de índice magneticamente para operações aprimoradas e opticamente se a preservação de longo prazo for uma preocupação.

        Complexidade do banco de dados de indexação

        O design do sistema de índice e as decisões de capacidade devem ser baseados em uma análise completa das operações da agência e das necessidades do usuário.

        SISTEMAS DE ARMAZENAMENTO DE DISCO DE DADOS DIGITAIS ÓPTICOS

        Tecnologias ópticas de gravação em disco digital de dados

        Podem ser usadas tecnologias WORM ou regraváveis, com a seleção real determinada pelos requisitos de aplicação específicos da agência. Certifique-se de que os privilégios de leitura / gravação sejam cuidadosamente controlados e que uma trilha de auditoria de regravações seja mantida quando a tecnologia regravável for usada.

        Capacidade de armazenamento em disco óptico de dados digitais

        Com base em uma análise de requisitos e estudo de design de sistemas das operações de uma agência, selecione o fator de forma de armazenamento ótico de tamanho mais adequado que satisfaça as necessidades programáticas de longo prazo da agência e esteja em conformidade com os padrões da indústria.

        Ao selecionar uma jukebox de disco digital óptico de dados, considere os seguintes fatores: as necessidades gerais de acesso às informações (pessoal e público), considerações de orçamento e aquisições e requisitos de equipe de operações existentes.

        Detecção e correção de erros

        Exigir que o equipamento esteja em conformidade com o padrão nacional proposto ANSI / AIIM MS59-199X, "Uso de Monitoramento de Erros de Mídia e Técnicas de Relatório para Verificação das Informações Armazenadas em Discos Ópticos de Dados Digitais."

        Interface de pequenos sistemas de computador

        Especifique o comando SCSI "Write and Verify" ao gravar dados em discos ópticos de dados digitais.

        Exigir que os fabricantes e integradores do sistema forneçam documentação completa sobre a configuração específica do hardware e software SCSI (ou outra interface).

        Compatibilidade com versões anteriores de sistemas ópticos

        Exigir atualizações ou sistemas de substituição para serem compatíveis com os sistemas de informação existentes.

        Converta as informações digitais existentes para o novo formato no momento da atualização ou aquisição do sistema.

        Longevidade de disco óptico de dados digitais

        Além de conduzir uma análise cuidadosa das metodologias e procedimentos de teste de expectativa de vida de mídia de cada fabricante, exigem o uso de discos ópticos de dados digitais com uma vida útil pré-escrita de pelo menos cinco anos.

        Exigem uma vida útil pós-gravação mínima de vinte anos com base nos testes de expectativa de vida de disco óptico de dados digitais do fabricante que estão em conformidade com as descobertas do NIST SP-200.

        Substratos de disco óptico de dados digitais

        Substratos de disco óptico de dados digitais de policarbonato ou vidro óptico temperado são aceitáveis.

        Ambientes ópticos de armazenamento em disco de dados digitais

        Os discos ópticos de dados digitais devem ser armazenados em áreas com temperatura ambiente estável e com faixas de umidade relativa compatíveis com o armazenamento de mídia de fita magnética. Evite áreas de armazenamento com umidade excessiva e alta temperatura, e não submeta os discos ópticos de dados digitais a altas temperaturas extremas.

        Se possível, não opere sistemas ou armazene discos ópticos de dados digitais em ambientes com excesso de partículas no ar.

        Os procedimentos de limpeza para discos ópticos de dados digitais devem estar em conformidade estrita com as recomendações do fabricante da mídia.

        RECUPERAÇÃO DE INFORMAÇÃO

        Realize uma análise abrangente dos requisitos das necessidades de acesso às informações dos usuários finais e um estudo de projeto de sistemas antes de adquirir os componentes do sistema de imagem.

        POLÍTICA DE GESTÃO DE INFORMAÇÕES

        Para maximizar a viabilidade de longo prazo dos sistemas, desenvolva imagens digitais e aplicativos de disco digital óptico de maneira econômica.

        Sempre que possível, vincule o projeto do sistema às iniciativas de melhoria do Governo, como a Avaliação Nacional de Desempenho.

        Reexamine os sistemas de registros em papel existentes antes da conversão em sistemas de disco óptico de dados digitais para maximizar a produtividade e melhorar a entrega de serviços de informação.

        Disposição de registros originais

        Conformidade com a política da NARA em relação à disposição dos registros originais ao converter para um sistema de disco óptico digital de dados.

        Familiarize-se com a forma como as regras de evidências se aplicam aos registros federais e assegure-se de que os controles de procedimentos que protegem sua integridade estejam em vigor e sejam cumpridos.

        Implementar as recomendações previstas no AIIM TR31, Partes I e II, aplicáveis ​​a projetos de agências que utilizem tecnologias de imagem digital e armazenamento em disco óptico de dados digitais, seja na conversão de documentos em papel para formato digital, seja na sua criação inicial em formato digital.

        Desenvolva um plano de migração de dados e recuperação de desastres para toda a agência bem antes de tal evento para o sistema de imagem digital e armazenamento em disco digital óptico de dados.

        Caso apareçam sinais de alerta de obsolescência iminente, os gerentes devem fazer planos imediatos para migrar o aplicativo para um novo sistema.

        Exigir que os fornecedores depositem uma cópia dos códigos de software do aplicativo do sistema de computador e a documentação associada em um banco, arquivos ou instalação de registros seguros em caso de falha comercial.

        Expectativa de vida da mídia / transferência de dados e backups

        Recopie os dados armazenados em discos ópticos de dados digitais com base nas informações obtidas por meio da verificação periódica da degradação da mídia.

        Crie uma cópia de backup das informações armazenadas em discos ópticos de dados digitais para retenção em uma instalação externa, usando a mídia de armazenamento apropriada (óptica, magnética, papel ou microfilme) que melhor atenda aos requisitos da agência.

        Especifique que o fornecedor forneça um conjunto completo de documentação, incluindo código-fonte com diagramas de fluxo, código-objeto e manuais de operação e manutenção como uma entrega contratual.

        Reveja e revise periodicamente a documentação do sistema para garantir que todas as modificações e melhorias subsequentes do sistema sejam adequadamente descritas.

        Atualize o equipamento conforme a tecnologia evolui e copie novamente os discos ópticos de dados digitais conforme necessário. Ou copie novamente os discos ópticos de dados digitais com base na verificação periódica. Ou Transfira dados de uma geração quase obsoleta de discos ópticos de dados digitais para uma geração emergente, em alguns casos contornando a geração intermediária que está madura, mas corre o risco de se tornar obsoleta.

        Padrões de Tecnologia da Informação

        Monitore regularmente as tendências no ambiente tecnológico que estão em conformidade com os padrões de sistemas abertos.

        Especifique os padrões de tecnologia não proprietária existentes e emergentes no projeto do sistema. Sempre que possível, os componentes do sistema devem estar em conformidade com práticas não proprietárias ou comumente aceitas.

        Avalie a possível degradação de dados das informações armazenadas em discos ópticos de dados digitais e a funcionalidade do sistema regularmente usando ferramentas de monitoramento e relatório de erros de mídia descritas em padrões propostos e em evolução, como ANSI / AIIM MS59-199X.

        Apoiar o desenvolvimento contínuo de padrões não proprietários para troca de dados e interoperabilidade.

        Seção 3: O desafio do acesso de longo prazo

        As tecnologias de imagem digital e armazenamento em disco óptico de dados digitais estão disponíveis no mercado comercial há mais de uma década. A imagem digital normalmente envolve a conversão de documentos em papel existentes (por exemplo, formulários, relatórios, mapas, desenhos, correspondência), fotografias ou microformas em uma representação eletrônica para armazenamento computadorizado e recuperação. Devido às vastas capacidades de armazenamento de dados que oferecem, os discos ópticos de dados digitais costumam ser componentes integrais dos sistemas de imagem digital. A vinculação da imagem digital, que gera arquivos eletrônicos consideráveis, à capacidade superior de armazenamento de discos ópticos de dados digitais tornou as duas tecnologias cada vez mais atraentes para aqueles que buscam maior produtividade da equipe e melhores serviços ao usuário.

        Dadas as afirmações dos fornecedores sobre a relação custo-benefício das tecnologias de imagem digital e armazenamento óptico, não é surpreendente que o interesse por essas duas tecnologias esteja crescendo rapidamente. Boletins informativos, periódicos e periódicos relacionados a essas tecnologias descrevem regularmente um número crescente de aplicativos de imagem digital e disco óptico de dados digitais em serviços de saúde, bancos, seguradoras, empresas farmacêuticas e universidades, para citar apenas alguns. Dois fatores estão impulsionando o uso de tecnologias de armazenamento em disco digital óptico e digital: a disponibilidade de uma variedade cada vez maior de dispositivos e custos decrescentes. Consequentemente, não é surpreendente que o número de aplicativos de imagem digital e disco óptico de dados digitais sendo planejados ou realmente implementados em todos os níveis de governo & # 151 Federal, Estadual e local & # 151 continue a crescer. Uma análise recente das principais aplicações de imagem digital e mídia óptica do Governo Federal destaca o enorme investimento financeiro comprometido com essas duas tecnologias.

        Muitos gerentes de programas de agências federais consideram as tecnologias de imagem digital e armazenamento em disco óptico de dados digitais como ferramentas essenciais para o fornecimento de serviços aprimorados e com melhor custo-benefício. No entanto, há outro grupo de administradores governamentais cuja principal preocupação é o impacto dessas duas tecnologias no descarte dos registros federais. Os gerentes de registros, que implementam o descarte aprovado dos registros federais, e os arquivistas, que protegem e fazem a manutenção de registros permanentes valiosos, têm um interesse vital na viabilidade de sistemas de imagem digital e armazenamento em disco óptico de dados digitais. Muitos gerentes de registros estão preocupados com a admissibilidade legal dos registros federais em um tribunal. Tanto os gerentes de registros quanto os arquivistas estão preocupados com a longevidade da mídia de armazenamento e a obsolescência do sistema de informação.

        Este relatório aborda essas, bem como outras questões relevantes para a administração de sistemas de informação de disco óptico digital de dados. O relatório também identifica problemas que as indústrias de imagem digital e disco óptico de dados digitais devem abordar e resolver se essas tecnologias se provarem viáveis ​​para aplicativos que requerem acesso de longo prazo. A este respeito, espera-se que a orientação fornecida aqui ajude a iniciar um fornecedor muito necessário e o impulso do usuário para garantir que as considerações de acesso a informações de arquivo sejam levadas em consideração durante a análise de requisitos de um sistema de informação, projeto de sistema, desenvolvimento de engenharia e fases de integração.

        Para os fins deste relatório, os sistemas de disco óptico de dados digitais são definidos como um amálgama de processos tecnológicos que incluem, no mínimo, imagens digitais ou armazenamento de dados digitais em discos ópticos de dados digitais ou mídia óptica semelhante. Com base em uma análise das questões de gerenciamento central, tendências técnicas e experiências do usuário, o relatório cobre uma variedade de tópicos que são exclusivos dessas tecnologias. As tendências tecnológicas foram identificadas por meio de pesquisas de mercado e uma revisão diligente das especificações técnicas, literatura do produto e relatórios analíticos publicados em uma ampla gama de periódicos e periódicos. Para enriquecer o estudo e fornecer um ambiente adequado para "testar" ideias e conceitos-chave, foram pesquisadas 15 aplicações de discos ópticos digitais de dados do Governo Federal. Embora esses 15 aplicativos não sejam totalmente representativos de todos os sistemas de armazenamento óptico atualmente em operação, eles fornecem informações importantes para visualizar a implementação de imagens digitais e sistemas de armazenamento de informações em disco óptico digital de dados dentro do Governo Federal.

        Os funcionários do governo responsáveis ​​pela seleção de sistemas de armazenamento em disco óptico de dados digitais e imagens digitais devem abordar vários fatores críticos. Eles devem, é claro, garantir que o sistema de imagem digital e armazenamento em disco óptico de dados digital que escolherem atenda às necessidades imediatas de sua agência de maneira econômica. Eles também devem garantir que os registros programados como permanentes sejam mantidos em seu formato original após a conversão ou convertidos em um meio aceitável para o NARA no momento da transferência para os Arquivos Nacionais.

        A decisão de adquirir ou construir um sistema de registro de imagem usando discos ópticos de dados digitais com recursos de sistema específicos deve ser baseada em uma análise completa dos requisitos de processamento de informações imediatos e de longo prazo da agência. Ao mesmo tempo, a adoção de discos de dados digitais ópticos e de imagem digital não é isenta de perigos, devido aos inúmeros desafios decorrentes de uma rápida evolução tecnológica. Por exemplo:

        • Novos produtos de armazenamento óptico, muitos incompatíveis uns com os outros, estão surgindo constantemente
        • A escassez de padrões técnicos e administrativos limita o desenvolvimento de critérios objetivos para a seleção de equipamentos
        • A rápida adoção de tecnologia óptica por órgãos governamentais aumenta a pressão para agir
        • A proliferação de fornecedores nos níveis nacional e local, com reivindicações concorrentes, pode complicar a definição de especificações de desempenho e
        • A longevidade (vida de mercado) dos produtos de tecnologia de imagem digital e a comunidade de fornecedores de sistemas e serviços técnicos é volátil.

        É claro que essas "armadilhas" são manifestações de um problema mais abrangente de obsolescência tecnológica. Com muita frequência, as implicações desses riscos ao acesso de longo prazo, vinculadas à responsabilidade das agências por seus programas, não são suficientemente levadas em consideração. O acesso de longo prazo ou a usabilidade de dados de imagem digital ou baseados em caracteres devem ser vistos de forma distinta do meio em que as informações são armazenadas. Essa distinção permite um compromisso contínuo com as informações em formato digitalizado, ao mesmo tempo em que reconhece que a mídia que armazena esses dados deve ser substituída devido à inevitável obsolescência.

        Estabelecer o compromisso de manter a usabilidade de longo prazo das informações digitalizadas, em oposição à própria mídia, não é suficiente. Manter esse compromisso de longo prazo de usar as informações armazenadas digitalmente também exige:

        A legibilidade dos dados se refere à capacidade de processar as informações em um sistema de computador ou dispositivo diferente daquele que inicialmente criou as informações digitais ou no qual estão armazenadas atualmente. Normalmente, a não legibilidade envolve algum aspecto de um dispositivo de armazenamento mais antigo (uma fita ou disco) que o torna fisicamente incompatível com o equipamento existente. Essa "obsolescência do hardware" ocorre quando os dispositivos de armazenamento e a mídia usados ​​hoje se tornam incompatíveis com os desenvolvidos no futuro. Por exemplo, as fitas de armazenamento magnético de 556 bits por polegada (bpi) comumente usadas na década de 1960 não podem ser lidas pelas unidades de fita atuais. É claro que, desde que uma fita magnética ou unidade de disco rígido continue a funcionar corretamente e haja peças de reparo disponíveis, sua vida útil pode ser estendida por um tempo. Da mesma forma, a vida útil dos discos ópticos de dados digitais pode ser estendida por meio de práticas adequadas de armazenamento e manutenção.

        A capacidade de recuperação de dados, que pressupõe a legibilidade conforme definida, significa que registros identificáveis ​​ou partes de registros podem ser selecionados e acessados. A recuperação precisa requer chaves, ou ponteiros, que vinculam a estrutura lógica dos registros (ou seja, campos de dados, strings de texto, diretórios e índices) aos locais de armazenamento físico dos dados em um disco. A estrutura lógica do disco óptico de dados digitais pode ter pouca relação com a mídia e o formato envolvidos. Normalmente, essas informações de ligação são encontradas em um cabeçalho ou rótulo de arquivo. O rótulo pode incluir informações necessárias para localizar o início de um arquivo, para indicar o número de bytes que cada registro contém e onde esses bytes estão fisicamente localizados, e para distinguir entre as várias unidades de informação de campos que formam os registros. Normalmente, a interpretação da estrutura lógica do registro é uma função do sistema operacional do computador (por exemplo, MS-DOS). Garantir a capacidade de recuperação de registros em longo prazo requer a funcionalidade contínua dos sistemas operacionais ou drivers de dispositivo originais, porque eles também podem se tornar obsoletos com o tempo.

        A inteligibilidade de dados significa que as informações que um computador recupera são compreensíveis para outro sistema de computador ou um visualizador humano. A inteligibilidade pode ocorrer em três níveis. Em seu nível mais simples, a inteligibilidade ocorre quando dois sistemas de computador usam ou entendem a mesma representação digital da informação, e essa representação é traduzida em uma forma que os humanos reconhecem e entendem. Um excelente exemplo de uma forma compreensível é um arquivo de texto ASCII (American Standard Code for Information Interchange). O segundo nível ocorre quando dois sistemas de computador podem usar ou entender a mesma representação da informação (por exemplo, ASCII), mas quando a representação é apresentada aos usuários, ela não carrega informações suficientes (por exemplo, não é autorreferencial) para um humano para compreender. Normalmente, esse problema está associado a dados codificados e numéricos, e a inteligibilidade de tais informações só pode ser garantida por meio de documentação que defina os valores representados pelos números e códigos. O terceiro nível ocorre quando dois aplicativos de software diferentes, funcionando em ambientes de computação diferentes, podem processar os mesmos dados digitais e obter resultados idênticos. Um exemplo disso é um documento de texto embutido em um sistema de processamento de texto que pode ser processado por um sistema de processamento de texto totalmente diferente, sem perda de informações ou detalhes de formatação de página, como fontes de tipo e espaçamento entre linhas. Essa falta de inteligibilidade se torna particularmente evidente quando um esquema de criptografia proprietário é encontrado ou quando as imagens digitais são compactadas com base em uma técnica proprietária.

        Fatores como rótulos de cabeçalhos de arquivos proprietários, técnicas de compactação de dados e obsolescência do software são as principais barreiras para alcançar a inteligibilidade ao longo do tempo. Os padrões não proprietários podem começar a abordar e resolver algumas dessas preocupações. Apesar da ausência de padrões de tecnologia da informação em algumas áreas que possam ajudar a garantir a acessibilidade dos registros de longo prazo, os gerentes de sistema devem criar a infraestrutura técnica e administrativa necessária para implementar os padrões de tecnologia da informação relevantes à medida que são desenvolvidos.

        Uma camada adicional de complexidade pode surgir com a maneira como alguns sistemas de armazenamento e recuperação de disco digital óptico de dados gravam informações de ponteiro de índice. Além disso, o software de busca e recuperação associado a um sistema de aplicativo específico geralmente requer uma plataforma de sistema operacional específica, como o MS-DOS. Normalmente, um aplicativo de software de recuperação adicionará outros indicadores à estrutura lógica dos registros. A recuperabilidade desses registros está, portanto, intrinsecamente ligada ao aplicativo de software. A menos que caminhos de migração de dados integrados sejam estabelecidos ou novas gerações de software sejam instaladas que ofereçam compatibilidade com versões anteriores, o acesso aos registros será impossível.

        O acesso de longo prazo às informações armazenadas digitalmente, incluindo imagens de documentos digitalizados e dados de índice descritivos, pode ser garantido por meio da migração para as gerações futuras de tecnologia. Para que esta migração seja possível, os aplicativos devem seguir certas práticas na captura inicial da imagem digital e seu armazenamento em sistemas de armazenamento em disco digital óptico de dados. Além disso, os sistemas de indexação e recuperação existentes ainda devem ser úteis em novos ambientes tecnológicos. O estabelecimento de uma estratégia clara de migração de dados deve ser estabelecida, e uma política de gerenciamento de informações com procedimentos administrativos abrangentes para os dados e sua migração também é necessária. Este relatório aborda cada uma dessas áreas críticas separadamente.

        Em particular, espera-se que as descobertas do relatório ajudem os gerentes de programa, arquivistas e gerentes de registros a manter a usabilidade de longo prazo das informações armazenadas digitalmente, incluindo documentos digitalizados e imagens de microformas, arquivos de dados eletrônicos e bancos de dados de índice de caracteres que os acompanham. A probabilidade de legibilidade, recuperabilidade e inteligibilidade de longo prazo aumentará se os programas:

        • Garantir a qualidade das imagens digitais capturadas por meio de um processo de conversão eletrônica,
        • Fornece a funcionalidade contínua de componentes de hardware e software do sistema ao longo do tempo,
        • Monitore para qualquer degradação potencial de dados de discos ópticos de dados digitais, e
        • Antecipe os desenvolvimentos tecnológicos e planeje de acordo.

        Este relatório assume que as agências federais decidiram implementar um aplicativo de disco óptico digital de dados seguindo a análise de requisitos aprovados, design de sistema e processos de estudo de custo-benefício e de acordo com os regulamentos NARA cobrindo a programação de registros e a transferência de registros permanentes para os Arquivos Nacionais ( consulte a seção 8, "Disposição de registros originais"). Outras fontes de informação prontamente disponíveis, algumas das quais estão listadas na bibliografia, examinam e revisam abordagens para o processo de tomada de decisão de tecnologia. Este relatório não discute os conhecimentos de informática e conhecimentos técnicos exigidos dos funcionários da agência que implementam e operam um aplicativo de disco óptico digital de dados.

        Os Arquivos Nacionais reconhecem os benefícios potenciais da tecnologia de disco óptico de dados digitais para armazenar e recuperar grandes quantidades de informações digitais. Vários anos atrás, devido a vários fatores que incluíam o estado instável e em rápida evolução do mercado de tecnologia de mídia óptica e a ausência de padrões da indústria formalmente adotados, os Arquivos Nacionais notificaram as agências federais que discos ópticos de dados digitais contendo registros de valor permanente não poderiam ser acessado. Nos termos desta notificação, os registros permanentes armazenados em discos ópticos de dados digitais devem ser convertidos em um meio aceitável para o NARA no momento da transferência para a custódia legal do NARA. Os registros não programados convertidos para um meio óptico devem ser mantidos em seu formato original com programação pendente ou, se posteriormente forem considerados permanentes, devem ser convertidos para um meio aceitável para o NARA no momento da transferência. Os registros da agência federal não podem ser descartados sem a autorização do Arquivista dos Estados Unidos.

        A NARA continua monitorando os desenvolvimentos na tecnologia de disco óptico de dados digitais e recentemente emitiu boletins de política descrevendo a adesão de discos ópticos de dados digitais. Os administradores de agências federais são encorajados a informar os Arquivos Nacionais sobre aplicações significativas para a implementação de tecnologia de disco óptico de dados digitais.

        As recomendações citadas neste relatório de estratégias não têm como objetivo definir padrões para o desenvolvimento de sistemas ou determinar a aquisição de sistemas de aplicação de disco óptico digital de dados, nem devem ser vistas como padrões de arquivamento de fato. Em vez disso, eles são oferecidos como conclusões fundamentadas que gerentes prudentes de programas envolvendo registros de valor de longo prazo podem achar úteis no projeto e implementação de sistemas de armazenamento de informações em disco digital óptico.

        Seção 4: captura de imagem digital

        A transformação de documentos em papel em imagens eletrônicas armazenadas digitalmente oferece às agências federais vários benefícios imediatos, incluindo custos muito reduzidos de manuseio de registros, maior eficiência operacional e maior eficácia do processamento de informações no local de trabalho. Visto que os documentos originais podem se deteriorar (ou até mesmo desaparecer) quando usados ​​como referência, em muitos casos é prudente convertê-los para outra forma ou meio que possa fornecer utilidade igual ou maior sem prejudicar os originais. Historicamente, os micrográficos têm sido, de longe, o meio mais popular de transferência de cópias de referência de documentos originais. A tecnologia de imagem digital demonstrou a capacidade de converter e armazenar imagens eletrônicas de documentos em discos ópticos de dados digitais e recuperar automaticamente as informações em uma tela ou impressora para referência. A maioria das 15 agências federais visitadas para este relatório utiliza tecnologia de imagem digital para digitalizar documentos. A popularidade da imagem digital é compreensível, considerando o grande volume de informações da agência federal que já existe em formato de papel. Os sistemas tradicionais de armazenamento e recuperação de registros em papel costumam ser processos que demandam muito tempo e trabalho. Como alternativa, uma conversão digital de registros do Governo Federal envolve questões complexas, como conversão de acervos, esquemas de cabeçalho de arquivo, compactação de dados e controle de qualidade.

        Problemas de Gestão

        Uma questão fundamental enfrentada pelos administradores de agências é a compensação entre os custos de integração de sistemas de imagem digital e os benefícios que resultam para os usuários do sistema. Projetos de imagem digital em grande escala exigem um compromisso contínuo da agência com equipamentos altamente especializados, uma equipe orientada para a tecnologia e instalações de conversão devidamente equipadas. Itens de custo de projeto de conversão significativos podem incluir a identificação e preparação dos materiais a serem convertidos, captura de imagem, indexação, inspeções de qualidade e refilmagem de registros. A indexação sofisticada no nível de item de imagem requer um investimento considerável em recursos humanos. A geração de imagens oferece muitos benefícios potenciais ao usuário, incluindo acesso múltiplo simultâneo a imagens, recuperações rápidas e precisas, comunicação econômica de dados de imagem a grandes distâncias, exibição de imagem de alta resolução em um terminal de desktop e saída impressa a laser.

        Uma alternativa de conversão possível é o uso de um bureau de serviços de imagem para uma conversão única de backfile. Essa abordagem elimina a necessidade de estabelecer um equipamento interno e capacidade de equipe de operações para um empreendimento único. Visto que o pessoal da agência federal possui um maior conhecimento prático dos acervos de registros da agência, eles funcionam mais efetivamente como equipe de preparação de documentos, inspetores de controle de qualidade ou como monitores do desempenho do contratado. Nessas circunstâncias, a equipe do contratado costuma ser designada para as tarefas mais repetitivas de digitalização e entrada de dados. Os contratos de conversão são facilitados quando o universo de documentos é relativamente estático, como um conjunto de títulos de propriedade históricos existentes, e quando a conversão é realizada internamente ou em um local de manutenção de registro pré-estabelecido. O controle da agência sobre o site de conversão oferece várias vantagens, incluindo custos reduzidos de transporte de registros, segurança aprimorada de documentos e simplificação do rastreamento de registros administrativos.

        Custos adicionais podem ser incorridos ao tentar aumentar a qualidade técnica da imagem em cada estágio do processo de conversão. Várias abordagens para melhorar a qualidade da imagem estão disponíveis, dependendo das características dos documentos originais. Por exemplo, selecionar uma resolução de digitalização mais alta geralmente melhora a nitidez da imagem. Como alternativa, especificar uma resolução de digitalização mais baixa combinada com a escala de cinza calculada também pode melhorar a aparência da imagem. Esses benefícios podem ser compensados ​​por tamanhos de arquivo de imagem digital maiores e, muito possivelmente, tempos de espera um pouco mais longos durante a recuperação da imagem. Imagens de qualidade mais alta têm maior probabilidade de ter maior valor no futuro, estendendo a vida útil dos arquivos digitais e adiando a necessidade de digitalizar novamente (assumindo que os documentos originais sejam retidos). Garantir que a melhor representação possível de cada documento original seja capturada e preservada pode aumentar o nível de confiança do gerenciamento da agência no sistema de imagem.

        Atualmente, não há indicadores empíricos objetivos de qualidade de imagem aceitável para imagens digitalizadas. A Association for Information and Image Management (AIIM) está apoiando o trabalho para desenvolver abordagens independentes de documentos de origem para avaliar a qualidade das imagens capturadas nas conversões de documentos. Uma abordagem possível é categorizar os documentos com base nos tipos de problemas de digitalização percebidos. Um comitê de revisão imparcial da agência poderia comparar os documentos originais às imagens digitais digitalizadas e chegar a um consenso sobre a captura da "melhor" imagem para cada categoria de documento. Independentemente do padrão de qualidade selecionado, a adesão aos procedimentos de garantia de qualidade é uma responsabilidade da gerência. Este elemento crítico não deve ser deixado exclusivamente ao critério da equipe de operações de conversão.

        Várias questões devem ser abordadas durante as fases de planejamento e orçamento do sistema do programa: requisitos iniciais de manutenção do custo do sistema e demandas imprevistas colocadas no sistema devido ao uso criativo. Os custos iniciais do sistema incluem fatores como capacidade do sistema, requisitos de desempenho e configurações de equipamento e software de aplicativos. Os requisitos de manutenção incluem conformidade com as revisões do sistema, atualizações e substituições de componentes necessárias para as operações contínuas do sistema. Como parte da manutenção do sistema, benchmarks específicos do sistema também devem ser estabelecidos e continuamente revisados ​​para garantir que o sistema instalado esteja atendendo aos requisitos da agência. Por último, o uso criativo imprevisto do sistema aumentará as demandas por serviços adicionais de referência do usuário. Essas demandas adicionais exigirão uma agência ou equipe de fornecedores altamente qualificada para executar serviços como integração de componentes de sistema adicionais, atualização do sistema de gerenciamento de banco de dados (DBMS) e aprimoramento do desempenho da rede de comunicação de dados do sistema de imagem.

        Integração do Sistema

        A fase de desenvolvimento do sistema de um projeto de imagem digital ou disco óptico de dados digitais geralmente inclui a identificação, coleta e organização dos materiais da agência federal a serem processados. Os dados de imagem armazenados em discos ópticos de dados digitais são frequentemente criados por uma conversão retrospectiva de todas as informações existentes nos arquivos de uma agência ou, inversamente, a adoção de um conceito de conversão "hoje para frente", em que apenas os registros mais recentes ou ativos são convertidos. Além disso, existem aplicativos de sistema voltados para registros de agências federais que nunca existiram originalmente em formato de papel e não exigem uma conversão para digitalização de documentos.

        Uma imagem raster digitalizada é essencialmente uma "fotografia" eletrônica de um documento, dividida em uma "grade" composta de milhares de elementos minúsculos de imagem, ou pixels. O valor de brilho de cada pixel é convertido em uma representação digital. Ao contrário dos dados alfanuméricos, as imagens raster consistem em 1s e 0s binários que em si não carregam nenhuma inteligência e, portanto, não podem ser consultadas em termos de quais informações a imagem representa. É por esse motivo que a indexação abrangente e precisa de imagens digitais é obrigatória para o acesso de recuperação do usuário eficiente. Imagens digitais eletrônicas devidamente indexadas podem ser exibidas em telas de alta resolução, transmitidas a sites de usuários remotos ou distribuídas como cópia impressa.

        O mercado de armazenamento em disco óptico de dados digitais e imagem digital continuará a apresentar novos produtos que variam em configuração, capacidade e custo. Esse processo reflete a diversidade das necessidades de acesso às informações do usuário. Os projetos pioneiros de imagem digital eram frequentemente programas-piloto de pesquisa ou operações autônomas, sem vínculos diretos com os sistemas de informação existentes. Este conceito está passando por uma mudança fundamental, pois os administradores de agências e usuários finais de hoje estão mais sofisticados tecnicamente e esperam resultados tangíveis. Em resposta, os sistemas de armazenamento em disco digital óptico e de imagem digital estão cada vez mais assumindo papéis de maior perfil nas agências, servindo como catalisadores para mudanças organizacionais.

        A gestão da agência federal deve reconhecer o impacto potencial que a tecnologia de imagem pode impor aos processos de fluxo de trabalho, incluindo o design e administração de formulários da agência, gestão e supervisão de pessoal, gestão de documentos e registros e relações agência-patrono. A introdução de um sistema de imagem no local de trabalho não irá, por si só, fornecer necessariamente uma solução imediata para as deficiências operacionais inerentes, a menos que um esforço significativo seja despendido para o controle e indexação de documentos. Os benefícios máximos são obtidos quando os processos de fluxo de trabalho e procedimentos operacionais existentes são adaptados à nova tecnologia.

        Os 15 sistemas da agência federal visitados para este relatório foram integrados usando uma das várias abordagens, e muitos dos sistemas utilizam componentes obtidos de diversos fabricantes de equipamentos, em vez de depender de uma única fonte de produto. Aproximadamente um terço dos sistemas, incluindo o Sistema de Gerenciamento de Registros Eletrônicos de Pessoal do Exército (PERMS) e os projetos de imagem do Bureau of Land Management, foram obtidos de um grande integrador ou fornecedor corporativo.Outro terço, incluindo os projetos Minerals Management Service e Commodity Futures Trading Commission, foram obtidos de fornecedores um pouco menores e mais localizados, responsáveis ​​por projetar e montar os componentes obtidos de uma variedade de fabricantes. O terço final dos sistemas, incluindo sistemas de imagem no Patent and Trademark Office e o programa de imagem na Agency for Toxic Substances and Disease Registry, foram projetados, desenvolvidos e integrados por meio de um esforço colaborativo entre o pessoal da empresa de integração e o Federal pessoal da agência.

        Arquitetura de sistemas abertos

        Os sistemas de imagem digital que apresentam componentes de hardware e software proprietários podem ter capacidade limitada para aceitar componentes fornecidos por fabricantes alternativos. À medida que o mercado de tecnologia de imagem continua a evoluir, uma ênfase crescente é colocada em sistemas "abertos" que incorporam um ambiente de vários fornecedores. A arquitetura de sistemas abertos é definida para os fins deste relatório como um projeto de sistema que:

        • Permite atualizações de componentes com degradação insignificante das funções do sistema
        • Permite que o sistema seja atualizado ao longo do tempo sem um risco significativo de perda de informações
        • Suporta a importação e exportação de dados digitais.

        A ênfase da comunidade de usuários e da indústria de imagem digital está mudando para arquiteturas de sistema com flexibilidade operacional e de configuração inerentes. Um ambiente de sistemas abertos oferece suporte à integração de componentes de sistema padronizados, ao mesmo tempo que atende às necessidades exclusivas do usuário. Um dos principais fatores para se obter verdadeiros sistemas abertos é o desenvolvimento, a aceitação e a adoção generalizada de padrões não proprietários.

        A maioria dos 15 sites de agências federais visitados tem alguns componentes ou processos proprietários. Esses elementos incluem cabeçalhos de arquivo exclusivos, processos de compactação de imagem e transmissão de dados, componentes de hardware, software de aplicativos e a configuração geral do sistema operacional. Os administradores de sistemas de agências federais estão cientes da necessidade de avançar em direção a sistemas abertos e estão dando passos positivos nessa direção. Muitos dos administradores de sistema entrevistados observaram que, embora seus sistemas existentes contenham componentes proprietários, os objetivos de longo prazo da agência são, eventualmente, mover-se em direção a um conceito de sistema aberto. Esses planos envolvem a adoção de padrões de toda a indústria e a integração de hardware e software de sistemas operacionais prontos para uso. Os administradores da agência observaram que essas etapas devem aumentar a interoperabilidade do sistema de armazenamento em disco digital óptico de dados existente. Ou seja, eles esperam benefícios imediatos do compartilhamento de dados e vínculos de comunicação aprimorados com outros sistemas de informação, tanto dentro quanto fora da aplicação imediata da agência, embora reconheçam que em alguns casos uma substituição total do sistema pode ser necessária.

        Adote uma arquitetura de sistemas abertos para novos aplicativos de disco óptico de dados digitais. Ou

        Requer uma "ponte" para sistemas com configurações não proprietárias.

        Configuração do sistema de imagem digital

        A seleção do sistema de imagem só deve ser tentada após a realização de uma análise detalhada dos requisitos de informação da agência existentes e planejados. Dependendo da quantidade de registros e dos requisitos de acesso do usuário, a instalação de um sistema de imagem de prateleira é a abordagem menos complicada e econômica. Os sistemas de imagem prontos para uso fornecem recursos genéricos, aceitando pequenos refinamentos de hardware e software para melhor atender às necessidades exclusivas do usuário. Se os componentes proprietários impedem a capacidade de aceitar a reconfiguração de componentes para atender aos requisitos organizacionais, as agências podem precisar adquirir sistemas especialmente projetados. Idealmente, uma agência adotaria uma abordagem de sistemas totais para gerenciamento de registros que forneça soluções práticas para apoiar os aplicativos de processamento de informações da agência.

        Um sistema de captura de imagem permite que a tecnologia de imagem digital assuma muitas configurações diferentes se esse sistema tiver os seguintes componentes básicos de hardware:

        • Scanner de documentos / equipamento de captura de imagem digital
        • Monitor de alta resolução,
        • Plataforma de sistema de computador pessoal (PC),
        • Dispositivos de armazenamento de arquivos temporários e
        • Impressora a laser.

        Dependendo dos requisitos da agência, a configuração final do sistema pode incluir componentes opcionais, como servidores de arquivos, indexação e estações de trabalho de inspeção de qualidade de imagem, scanners de documentos de alta velocidade, scanners de microformas e redes locais (LAN). A Figura 1 ilustra os elementos básicos de um subsistema de captura de imagem digital.

        Figura 1 Subsistema de captura de imagem digital

        O software do computador conecta os módulos do sistema, mantendo a flexibilidade necessária para atender às necessidades exclusivas do usuário. Os sistemas de imagem digital implementados no início da curva de crescimento da tecnologia muitas vezes exigiam um amplo desenvolvimento de software único que resultava em configurações incompatíveis. Os esforços para modificar ou atualizar sistemas especializados eram difíceis e demorados, frequentemente exigindo assistência da equipe de engenharia de software original do fornecedor. Esta situação melhorou ao longo do tempo, à medida que mais aplicativos de software foram desenvolvidos para as seguintes áreas:

        Comunicação de dados: o software de comunicação facilita a movimentação de dados dentro do hardware do sistema, entre sistemas conectados em uma rede local e através de canais que conectam sistemas separados geograficamente, até mesmo em todo o mundo.

        Gerenciamento de banco de dados: o software de indexação e banco de dados fornece a base para a recuperação, controlando a natureza e a estrutura das informações registradas sobre cada imagem ou grupo de imagens, organizando essas informações de maneira significativa para o usuário, vinculando imagens em documentos e arquivos e permitindo ao usuário para identificar e exibir imagens sob demanda.

        Aprimoramento de imagem: o software de aprimoramento de imagem permite a manipulação das características da imagem para melhorar a legibilidade, limpar imagens e reduzir o tamanho dos arquivos.

        Gerenciamento do sistema de exibição: O software de exibição de imagem da estação de trabalho permite o controle da imagem para zoom, rotação, rolagem e vários formatos de tela de exibição de imagem.

        Gerenciamento de fluxo de trabalho: o software de fluxo de trabalho do sistema controla todas as fases de captura, rastreamento, roteamento, indexação, recuperação e impressão de imagens de documentos.

        Reconhecimento óptico de caracteres: o software de reconhecimento óptico de caracteres pode interpretar e converter dados de imagem raster em dados textuais manipuláveis ​​por máquina.

        Várias semelhanças significativas foram observadas nos 15 sistemas de imagem da agência federal visitados, embora as aplicações variassem consideravelmente. Por exemplo, mais da metade das agências usa scanners de mesa para converter registros em papel, enquanto aproximadamente um terço dos sites adotou scanners de documentos de alta velocidade para processar com mais eficiência um grande volume diário de registros. A maioria dos sistemas visitados utiliza plataformas de PC, servidores de arquivos e comunicações de rede local. Quase metade dos sistemas pesquisados ​​estavam conectados (ou compartilhavam informações de índice com) os sistemas existentes de mainframe ou minicomputador da agência, e as conexões de computador mainframe para outros estão em estágios de planejamento e desenvolvimento.

        A maioria dos sistemas de imagem digital visitados usa estações de trabalho equipadas com monitores de alta resolução. Os demais sites armazenam dados eletrônicos alfanuméricos ou gráficos, onde a exibição de imagens digitais em alta resolução não é um requisito. Vários sistemas integraram scanners de microforma ou dispositivos de saída de filme e outros testaram ou usam tecnologias de reconhecimento óptico de caracteres. A maioria dos sistemas visitados tem instalado um jukebox de disco óptico de dados digitais para armazenamento e recuperação automatizados, e também utilizam impressoras a laser para distribuição de cópias impressas.

        Em vários graus, muitas das agências visitadas mudaram ou estão considerando atualizar seus sistemas de imagem em áreas como scanners de documentos de alto desempenho, aumento de memória em estações de trabalho, servidores de arquivos mais poderosos, novos monitores de estação de trabalho e diferentes unidades de disco óptico ou mídia. Os administradores da agência observaram que as arquiteturas de sistema de tipo aberto são mais receptivas às alterações de configuração, pois o hardware proprietário ou os componentes de software são mais difíceis de atualizar ao responder a demandas adicionais inesperadas do usuário.

        Defina claramente os requisitos do usuário e da agência durante a fase de análise de requisitos do projeto de imagem.

        Verifique se o sistema de imagem tem flexibilidade inerente e tem um design aberto, ou não proprietário, que aceita futuras atualizações de hardware e software.

        Conversão de registros originais

        A conversão retrospectiva de registros em papel em imagens digitais requer a integração de instalações de produção especialmente configuradas, equipamentos de conversão e uma equipe de operações voltada para a tecnologia. Não é incomum que as agências federais limitem as conversões de registros a um conceito "hoje em diante", convertendo apenas os registros mais atuais e acessados ​​com frequência. Esse conceito é especialmente atraente quando os registros mais antigos e menos solicitados são um segmento significativo dos acervos de uma organização.

        Os sistemas de imagem convertem informações em imagens eletrônicas que podem ser indexadas e pesquisadas, encaminhadas para as estações de trabalho dos usuários e distribuídas e impressas remotamente. As principais etapas de processamento de entrada incluem:

        • Converter registros originais (papel, microformas, dados analógicos) em um formato digital,
        • Melhorar eletronicamente as imagens que são difíceis de ler para melhorar a legibilidade,
        • Anexar um cabeçalho de arquivo e compactar as imagens digitais para reduzir a transmissão de dados e os requisitos de armazenamento,
        • Indexando as imagens em níveis apropriados,
        • Realizar inspeções de controle de qualidade do índice e dados de imagem e digitalizar novamente os documentos conforme necessário, e
        • Gravar as informações digitais em um meio de armazenamento adequado.

        Um processo abrangente de controle e contabilidade de registros é necessário para todos os esforços de conversão para garantir que todos os registros designados para conversão foram de fato convertidos e para monitorar exatamente o que foi convertido. O rastreamento e o monitoramento devem começar quando um registro é identificado para conversão e não cessar até a conclusão de todas as tarefas relacionadas à aceitação do novo formulário de registro e descarte do formulário de registro antigo.

        O ponto de entrada (dispositivo de entrada) para registros em papel é um scanner de documentos, disponível em várias configurações: alguns usam um modo autônomo e armazenamento magnético das imagens eletrônicas, alguns são anexados a uma estação de trabalho de imagem e alguns são operados sob um configuração do servidor de arquivos do computador. Os processos de aprimoramento de imagem podem ser aplicados às imagens digitais para melhorar sua legibilidade, ao mesmo tempo que reduzem os tamanhos gerais dos arquivos. O processo de digitalização geralmente inclui compactação de dados de imagem de acordo com um formato padrão ou proprietário. As imagens do documento são então indexadas usando a entrada manual tradicional de chave, leitura de código de barras ou reconhecimento óptico de caracteres.

        Dependendo dos requisitos de uma agência, o subsistema de índice pode ser mantido de várias maneiras, incluindo armazenamento dos dados de índice como parte do sistema de imagem ou armazenamento de dados de índice em um sistema de gerenciamento de banco de dados separado. Em ambos os casos, os dados do índice são geralmente retidos em mídia de armazenamento magnético. O armazenamento magnético simplifica a revisão dos dados do índice e permite um acesso mais rápido do usuário às informações. As imagens digitalizadas também podem ser armazenadas magneticamente, mas os discos ópticos de dados digitais são uma opção viável para retenção de informações de longo prazo. Uma única imagem digitalizada pode exigir entre 20.000 e 300.000 ou mais bytes de armazenamento (compactação de imagem em 10: 1). Ao planejar um sistema, é útil realizar testes com os materiais originais a serem convertidos para determinar as taxas de transferência de digitalização em potencial, requisitos de armazenamento e velocidades de transferência de arquivo de imagem. As informações digitais podem ser distribuídas de várias maneiras, incluindo exibição de imagens em monitores de alta resolução, impressoras a laser, microformas de saída de computador ou transmissão remota de imagens. Esses processos geralmente estão sob o controle de um sistema de gerenciamento de processos de fluxo de trabalho que também pode rotear imagens para estações de trabalho, distribuir a saída e conduzir o rastreamento de imagens e relatórios de status.

        Vários padrões salientes surgiram durante as visitas ao local que ilustram estratégias genéricas de agências federais. Os gerentes de produção de agências federais entendem a função crítica da preparação de documentos em conversões de alto volume. A preparação de documentos é um componente não técnico de uma conversão de registros que afeta a produtividade operacional geral. As etapas envolvidas na preparação de documentos para digitalização são muito semelhantes às usadas na preparação de registros para microfilmagem. A remoção de grampos, encadernações e outros fechos e a ordenação sequencial adequada dos documentos são etapas importantes que são melhor executadas off-line. A execução dessas etapas reduz diligentemente o tempo de espera não produtivo ou ocioso na estação de trabalho de digitalização e melhora as taxas de transferência de digitalização de documentos, especialmente para sistemas de imagem com equipamento de alta velocidade.

        Oito dos quinze sistemas de agências federais pesquisados ​​usam a equipe existente da agência para realizar conversões internas de documentos ou dados. Cinco agências visitadas utilizam contratados locais para serviços de digitalização e indexação organizados por meio de contratos com bureaus de serviços ou fornecedores de integração. A pesquisa indicou que várias agências usam uma abordagem de combinação, ou "equipe", para o processo de conversão real, em que empreiteiros e funcionários federais compartilham as tarefas de conversão. O sistema de imagem do Departamento de Estado, por exemplo, opera com funcionários da agência processando as solicitações de correspondência que chegam e funcionários fornecidos por contratados operando os sistemas de digitalização e indexação.

        Várias das agências visitadas realizam digitalização de documentos em sites de conversão que não estão localizados perto dos sistemas de armazenamento e recuperação. Nestes casos, as imagens digitalizadas são temporariamente armazenadas usando mídia magnética ou discos ópticos de dados digitais regraváveis. Por exemplo, a digitalização de documentos para o projeto de conversão do Patent and Trademark Office foi conduzida por pessoal contratado em uma instalação externa de armazenamento de documentos.

        Três agências federais visitadas empregam discos ópticos de dados digitais para armazenar digitalmente dados ASCII gráficos ou alfanuméricos. A Administração Oceânica e Atmosférica Nacional (NOAA), por exemplo, usa tecnologia de disco digital óptico para retenção de dados ambientais costeiros. A NOAA monitora eventos climáticos naturais e fatores ambientais provocados pelo homem e analisa seu impacto nos processos globais em rápida mudança. O Centro Nacional de Informações sobre Terremotos usa tecnologia de disco óptico digital para armazenar dados sísmicos detectados em tremores de terra causados ​​por eventos como terremotos, atividade vulcânica, testes nucleares e prospecção de petróleo. E, finalmente, a Administração do Seguro Social retém os dados dos rendimentos dos trabalhadores em formato digital, usando discos de dados digitais ópticos regraváveis.

        Analise o domínio dos documentos a serem digitalizados, identifique os níveis de uniformidade e considere o uso de um contratante de conversão de documentos quando os acervos de backfile forem extensos.

        Implemente um processo abrangente de contabilidade e rastreamento de registros durante a fase de conversão do projeto.

        Invista pessoal suficiente ou recursos de contratados na preparação de documentos para aumentar a produtividade da digitalização.

        Conforme apropriado, designe uma equipe experiente da agência para processos de conversão que se beneficiem de seu conhecimento das operações existentes da agência.

        Scanners de imagem digital

        Scanners de documentos: Um scanner é o componente de hardware que converte documentos originais em imagens digitais eletrônicas. O mercado de imagens comerciais oferece equipamentos de digitalização com uma diversidade de velocidades de processamento, recursos de operador automatizado e custos de aquisição. Os tempos reais decorridos para digitalizar e exibir as imagens variam com base em vários fatores, incluindo o desempenho inerente da unidade de digitalização específica, as dimensões físicas dos documentos e a resolução de digitalização selecionada. Esses fatores contribuem para taxas de produção de scanner de classe de desktop entre 2 e 20 documentos por minuto. Portanto, quando equipados com alimentadores de documentos e capacidade de digitalização frente e verso, os scanners de mesa são úteis para aplicativos de imagem menores com volumes de conversão diários mais baixos e para sistemas de imagem de escritório de médio porte. Quando equipados com recursos especiais de aprimoramento de imagem, os scanners de mesa também são eficazes para digitalizar documentos de baixo contraste, que são difíceis de ler. Esses scanners também funcionam de forma eficaz para redigitalizar imagens de baixa qualidade rejeitadas durante as inspeções de controle de qualidade de imagem de rotina.

        Para aplicações de conversão de documentos maiores, scanners de alto desempenho que empregam transportes de documentos mecanizados para serviços pesados ​​e vários arranjos de dispositivos acoplados de carga de digitalização (CCD) estão disponíveis. Este equipamento oferece taxas de transferência que variam de aproximadamente 40 a 120 ou mais páginas por minuto. Dependendo da unidade específica, esses scanners podem capturar os dois lados de cada documento em uma passagem, melhorando a produtividade por meio da redução do manuseio de papel. Como as taxas de produção do scanner podem ser afetadas pela condição física do documento, as alegações do fabricante sobre as taxas de produção do scanner devem ser verificadas antes da aquisição do equipamento. A verificação é melhor realizada usando uma amostra representativa dos registros reais da agência. Scanners especializados também estão disponíveis para capturar documentos maiores, como mapas e desenhos de engenharia.

        Os scanners de documentos geralmente são instalados e calibrados de acordo com as instruções estabelecidas nos guias de operação e manutenção do fabricante. Para determinar a qualidade de uma imagem adquirida com um scanner calibrado recentemente, é recomendado que um alvo padronizado seja digitalizado e avaliado de acordo com FIPS PUB 157 "Diretriz para Controle de Qualidade de Scanners de Imagem". Alvos de teste estão disponíveis para avaliar o desempenho do scanner para uma variedade de características de imagem, incluindo cor, tamanho do tipo e resolução.

        Digitalização digital e microformas: Dependendo dos requisitos de armazenamento e recuperação de dados de uma organização, várias alternativas estão disponíveis para migrar informações entre sistemas de imagem digital e tecnologias de microforma analógica. Essas abordagens incluem:

        • Digitalizar e microfilmar documentos simultaneamente na fase de captura de imagem,
        • Criação de microformas a partir de dados existentes armazenados digitalmente e
        • Converter microformas existentes em dados digitais para armazenamento em discos ópticos de dados digitais.

        A primeira abordagem requer um equipamento de captura de imagens que digitalize digitalmente os documentos em papel e, ao mesmo tempo, registre fotograficamente as imagens em microfilme. Essa capacidade de dois níveis oferece potencialmente o melhor dos dois mundos. Ou seja, as imagens digitais são armazenadas em discos ópticos de dados digitais para armazenamento e recuperação automatizados, enquanto as microformas, quando processadas e armazenadas de acordo com os regulamentos de micrografia da NARA (36 CFR 1230), atendem aos requisitos de retenção de informações de longo prazo. Uma desvantagem potencial que poderia anular quaisquer benefícios potenciais dessa abordagem seria quando problemas de controle de qualidade fossem descobertos com as microformas processadas e o lote de documentos precisasse ser completamente refilmado.

        Uma segunda abordagem é criar microformas a partir de imagens digitais existentes e dados de texto armazenados em discos ópticos de dados digitais. Várias configurações de equipamento gravador de microformas estão disponíveis para a produção de microformas a partir de formatos de texto e imagem raster armazenados digitalmente.Uma técnica usa uma tecnologia de gravação de feixe de laser para "escrever" a informação digital, linha por linha, diretamente nos materiais de microforma com padrões de pixel do tamanho de um mícron. A segunda técnica, que se aplica apenas a dados codificados incluindo texto, usa a tecnologia de imagem mais convencional de tubo de raios catódicos (CRT) fornecida na saída de computador para dispositivos de gravação de microfilme (COM). A disponibilidade comercial é bastante limitada para gravadores de microforma de alta resolução que criam imagens COM raster em filmes de 35 mm. Uma vez que esses sistemas também são complexos de operar e caros, os usuários devem considerar um bureau de serviços para aplicativos de baixo volume. Mais complexidade é introduzida quando as informações digitais são marcadas com informações de cabeçalho de arquivo de imagem exclusivas ou proprietárias, exigindo conversão para um formato amplamente utilizado (por exemplo, Tagged Image File Format [TIFF]).

        Uma terceira abordagem envolve a conversão digital de microformas. Esses microformas podem já existir nos arquivos de uma agência. Por outro lado, eles podem ter sido criados no lugar da digitalização digital dos documentos sob um conceito de microfilme primeiro, digitalização posterior. Se esta abordagem estiver sendo considerada, investigue os requisitos de entrada do equipamento de digitalização de microforma disponível comercialmente. Garantir que as especificações técnicas de produção do microforma estejam em conformidade com os requisitos do scanner irá agilizar o processo de digitalização. Ao contrário dos scanners de documentos em papel que detectam a luz refletida, os scanners de microforma transmitem um feixe de luz através da mídia de filme. A qualidade técnica das microformas de entrada originais impacta diretamente a legibilidade das imagens digitais. Microformas de alta qualidade fornecem as imagens digitais mais legíveis (mais limpas), com o benefício adicional de tamanhos de arquivo digital menores. Dependendo das necessidades do usuário, o mercado comercial oferece scanners de microfilme com vários recursos de desempenho operacional. Equipamentos de varredura de microformas de última geração podem incluir algoritmos de aprimoramento de imagem poderosos que melhoram a legibilidade de microformas de baixo contraste e sensores eletrônicos para detectar imagens distorcidas ou desalinhadas.

        As 15 agências federais visitadas usaram scanners de mesa ou de alta velocidade para converter registros existentes em papel ou microforma. Vários aplicativos iniciados com scanners de desktop de baixo volume consideraram necessário atualizar para equipamentos de desempenho superior. Outras agências alcançaram uma produção maior adicionando alimentadores automáticos a scanners alimentados por folhas de mesa ou integrando scanners adicionais de alta velocidade. Os gerentes locais observaram que, nas condições reais de produção, as taxas de rendimento do scanner de documentos podem variar consideravelmente em relação às estimativas do fabricante. Os administradores de sistema observaram que as demandas crescentes colocadas nos componentes existentes foram baseadas em parte em uma maior conscientização e aceitação da tecnologia de imagem. Em horários de pico, esse aumento inesperado da demanda em sistemas de imagem pode sobrecarregar os recursos inerentes.

        A conversão de microforma em imagens digitais oferece vários benefícios potenciais, mas pode haver uma desvantagem significativa. A qualidade original da microforma, incluindo contraste, espaçamento, inclinação e nitidez da imagem, tudo contribui para as taxas de produção de digitalização em potencial e a qualidade das imagens digitalizadas. Para lidar efetivamente com essas questões, o sistema PERMS do Departamento do Exército emprega sistemas especializados de scanner de microforma. Várias outras agências pesquisadas escolheram a tecnologia de disco óptico digital de dados como um substituto para os sistemas de informação baseados em microformas existentes, realizada por meio de uma conversão de varredura digital das microformas existentes ou gravando dados diretamente em discos ópticos de dados digitais sem registros de papel criados como intermediários.

        Antes da aquisição do sistema, valide as declarações do fornecedor em relação às taxas de transferência de documentos, qualidade de imagem e facilidade de operação usando uma amostra representativa dos acervos da agência.

        Siga os procedimentos de teste padrão descritos em FIPS PUB 157 "Diretrizes para controle de qualidade de scanners de imagem."

        Resolução do scanner

        A resolução do scanner de documento selecionada impacta diretamente vários fatores importantes, incluindo a legibilidade da tela de exibição de imagens digitais, a legibilidade da saída de cópia impressa e a utilidade das imagens digitais para aplicações futuras em agências. A seleção da resolução de digitalização ideal é crítica para aplicações imediatas e de longo prazo, pois a resolução de digitalização original nunca pode ser aumentada, mesmo se as tecnologias de recuperação de informações futuras exigirem uma imagem de qualidade superior. Conseqüentemente, um caso forte pode ser feito para digitalizar na resolução mais alta que é atualmente acessível.

        A resolução do scanner é uma equação complexa: a resolução da imagem, o espectro de cores, o tamanho do armazenamento de arquivos e os algoritmos de compactação são interdependentes e dependem do equipamento de digitalização, exibição e impressão disponível. Os tamanhos dos arquivos de imagem digital, por exemplo, dependem da resolução do scanner selecionada. Um documento de escritório padrão requer aproximadamente 500.000 bytes (não compactado) a 200 pontos por polegada (dpi) e quase 2 milhões de bytes antes da compactação a 400 dpi. Este fator de armazenamento quatro para um torna-se significativo ao capturar milhares de imagens.

        No passado, eram principalmente as limitações do scanner e do equipamento de exibição que determinavam a prática de digitalização digital, e pouca atenção era dada aos critérios objetivos. Como a resolução do scanner também afeta a produtividade de entrada, os fornecedores anteriormente especificavam configurações de resolução mais baixas para atingir velocidades de produção eficientes e custos reduzidos de armazenamento e processamento de dados. Uma resolução de digitalização de 300 dpi produz uma qualidade comparável à de uma impressora a laser de escritório comum (embora inferior a uma fotocopiadora) e pode ser adequada para documentos de escritório típicos que não contêm nenhum tamanho de fonte menor que 6 pontos. Se uma agência federal planeja integrar a tecnologia de reconhecimento óptico de caracteres (OCR), uma resolução mínima de digitalização de 300 pontos por polegada é recomendada.

        Desenhos de engenharia, mapas e documentos que possuem informações muito detalhadas, linhas finas e manuscritas podem exigir uma resolução de digitalização de até 600 dpi ou mais. Em todos os casos, mas especialmente se os documentos a serem digitalizados incluírem mapas, desenhos ou documentos com linhas finas e detalhes de fundo, os testes devem ser realizados para verificar a resolução de digitalização apropriada caso a caso com amostras reais de documentos antes de aquisição de equipamentos.

        A resolução do scanner é freqüentemente especificada por gerentes de programa responsáveis ​​por equilibrar dois fatores críticos: armazenamento de dados de imagem e legibilidade de exibição de imagem. A resolução de digitalização em 12 sites de agências federais que capturam documentos originais variam de 200 a 400 dpi, com a maioria empregando 300 dpi. As agências que valorizam menos a qualidade da tela enquanto enfatizam a economia de armazenamento tendem a digitalizar na faixa de 150 a 200 dpi, argumentando que um número muito maior de imagens compactadas pode ser colocado em qualquer disco óptico de dados digitais. As agências que exigem uma exibição de imagem de qualidade superior aceitam tamanhos de arquivo maiores, digitalizando em 400 dpi e intervalos superiores. Por exemplo, o sistema de imagem REDAC do Departamento de Estado digitaliza rotineiramente a 200 pontos por polegada, enquanto documentos de baixa qualidade são digitalizados em até 400 dpi. O sistema de Projeto de Automação de Registros Gerais de Terrenos do Bureau of Land Management captura imagens de documentos em resolução de 300 dpi, exibe imagens em 150 dpi e imprime imagens a laser em 300 dpi.

        Empregue uma resolução de digitalização de pelo menos 300 dpi para documentos de escritório quando futuras aplicações (por exemplo, OCR) para as imagens digitais forem antecipadas.

        Especifique uma resolução de digitalização mais alta (entre 300 e 600 dpi ou superior) conforme necessário, para desenhos de engenharia, mapas e documentos que contenham linhas finas significativas e informações detalhadas de fundo.

        Faixa Dinâmica

        Os sistemas de imagem digital normalmente incluem digitalização do tipo binário e equipamentos de exibição. Ou seja, cada ponto (pixel) de um mapa de bits de imagem raster é interpretado como preto ou branco. Scanners binários não são ideais para capturar imagens de documentos coloridos, fotografias, ilustrações ou outros itens que contenham tons contínuos. Para capturar essas imagens de maneira ideal, é necessário um scanner com uma faixa dinâmica maior. A faixa dinâmica é definida para este relatório como a variação do tom em qualquer ponto escaneado. Em imagens em preto e branco, a faixa é representada por uma escala de tons de cinza. O grau de escuridão associado a cada elemento de imagem, ou pixel, em uma imagem em escala de cinza é controlado pela informação digital, ou bits, associados a esse pixel. Da mesma forma, em imagens coloridas, cada pixel é representado por um valor para as três cores primárias (geralmente vermelho, verde e azul) que, quando combinadas, produzem a cor desejada.

        Os sistemas de imagem que gravam imagens em escala de cinza e coloridas exigem componentes especializados, como um scanner com escala de cinza ou capacidade de cor, monitores de vídeo que podem refletir a maior faixa dinâmica do sistema e um software de processamento de imagem mais poderoso. Um scanner em escala de cinza é obrigatório ao digitalizar fotografias ou negativos em preto e branco em tons contínuos. Essas imagens devem ser escaneadas a 8 bits por pixel, permitindo a expressão de 256 valores de cinza, a menos que possa ser determinado com antecedência que não há necessidade atual ou futura prevista para este nível de detalhe. As técnicas de digitalização em escala de cinza também podem ser aplicadas com eficácia na digitalização de documentos em preto e branco. Como o olho humano é altamente sensível a variações de luminância, documentos digitalizados em uma resolução relativamente baixa (por exemplo, 200 dpi), mas com escala de cinza de 4 ou 6 bits, podem realmente ser mais legíveis em monitores de baixa resolução do que documentos digitalizados em uma resolução mais alta em um modo de dois níveis. O uso de um monitor de resolução mais alta ou impressão geralmente requer uma digitalização de resolução mais alta (por exemplo, 300 e shy400 dpi) com imagens em escala de cinza de 8 bits.

        A digitalização em cores apresenta desafios técnicos ainda maiores. Por exemplo, todo o espectro de cores visíveis pode não ser capturado com precisão por todos os scanners. Problemas adicionais ocorrem na saída. Enquanto os valores de vermelho, verde e azul dos documentos geralmente são capturados durante a digitalização, a saída da impressora é obtida equilibrando ciano, magenta, amarelo e preto. Para uma representação precisa das cores na saída, os dispositivos de entrada e saída devem ser calibrados. Mesmo com técnicas sofisticadas de compactação de imagem, as imagens em tons de cinza e em cores requerem uma capacidade substancial de armazenamento de dados. Uma imagem digital binária não compactada padrão consiste em centenas de milhares de pixels, cada um representado por 1 bit de informação. Como uma imagem em escala de cinza de 8 bits representa cada um desses pixels com 8 bits, o arquivo descompactado resultante é oito vezes maior. Por exemplo, uma imagem bitonal de 300 dpi não compactada requer 1,05 megabytes de armazenamento, enquanto uma imagem em escala de cinza em tom contínuo de 300 dpi descompactado (8 bits por pixel) exige 8,4 megabytes de armazenamento. Os algoritmos de compactação em escala de cinza são, por natureza, menos eficientes do que os esquemas de compactação binária (ou seja, os arquivos de imagem em escala de cinza compactados podem ser muito maiores do que 8 vezes o tamanho dos arquivos binários compactados). Com base nos requisitos da agência, este fator pode tornar a escala de cinza ou digitalização em cores uma opção de armazenamento proibitivamente cara.

        Apenas um dos sites da agência federal visitados, o National Earthquake Information Center do US Geological Survey, utiliza estações de trabalho de computador com monitores de 800 x 1.000 pixels para exibir imagens de dados digitais sísmicos que contêm 256 tons de cinza. Nenhum dos demais sites da agência visitados está digitalizando ou armazenando rotineiramente imagens em escala de cinza.

        Empregue tecnologia de imagem em escala de cinza ou colorida conforme necessário para imagens em tons contínuos adequados, como fotografias, mapas e registros relacionados.

        Conforme apropriado, utilize a tecnologia de imagem em escala de cinza de 8 bits por pixel para capturar fotografias e / ou negativos em preto e branco de tom contínuo e o modo de 24 bits para obter a reprodução de cores reais.

        Melhoria de imagem

        O aprimoramento de imagem digital invoca algoritmos de software usados ​​para "limpar" a aparência visual e a qualidade das imagens digitais. O aprimoramento da imagem deve ser usado com cuidado, porque esse processo pode, na verdade, remover elementos mínimos dos dados da imagem. Esta exclusão de dados de imagem pode ocorrer seletiva ou automaticamente, com o produto final tendo um contraste visual aumentado e legibilidade aprimorada. Imagens aprimoradas eletronicamente podem aumentar drasticamente a legibilidade da tela e da cópia impressa. O aprimoramento de imagem também pode reduzir os requisitos de armazenamento, melhorando a eficiência do software de compactação de imagem. Documentos que são difíceis de capturar, como cópias carbono com caracteres floridos, fotocópias de várias gerações, mimeógrafos em azul claro e roxo, originais desbotados ou manchados e anotações esmaecidas a lápis e tinta são os principais candidatos para aprimoramento de imagem. Os sistemas de geração de imagens normalmente fornecem um recurso fundamental de manipulação de contraste de imagem. Hardware e software adicionais estão disponíveis para expandir o poder de aprimoramento e a velocidade ao mesmo tempo em que aumentam os recursos de compactação.

        Um aspecto negativo de certos algoritmos de aprimoramento de imagem é uma possível perda de detalhes contidos nos documentos originais. Por exemplo, documentos que contêm impressão em cores, anotações manuscritas ou marginálias podem não ter imagens uniformes. Nesses casos, o software de aprimoramento de imagem pode remover inadvertidamente algumas marcas esmaecidas ou de baixo contraste. Da mesma forma, todos os sistemas bitonais convertem as cores em preto, aumentando os problemas de legibilidade. Filtros especiais podem ser usados ​​no processo de digitalização para minimizar esse problema, e os administradores devem garantir que a capacidade de digitalização do sistema proposto corresponda às características dos documentos a serem digitalizados. É prudente testar o sistema de imagem com uma amostra de documentos da agência antes de uma conversão em escala real.

        Se um documento de origem tiver valor intrínseco, o original deve ser retido após a digitalização da imagem digital. Os dados de imagem raster digitalizados de documentos intrinsecamente valiosos devem ser armazenados de forma não aprimorada para garantir que todas as informações digitais capturadas estejam disponíveis para processamento no futuro por meio de técnicas de aprimoramento de imagem mais poderosas.

        O aprimoramento da imagem é atraente devido à sua capacidade de melhorar a legibilidade de documentos manchados, envelhecidos e de baixo contraste. Embora a maioria dos scanners de documentos forneça controles básicos de contraste (claro / escuro) para ajustar a aparência da imagem digital, vários dos sites visitados estão considerando ou já integraram recursos adicionais de aprimoramento de imagem. Por exemplo, o programa PERMS do Exército dos EUA usa aprimoramento de software para limpar imagens "ruidosas", obtendo assim uma maior compactação no armazenamento de dados e imagens de maior qualidade. Outro exemplo é a Commodity Futures Trading Commission, onde uma placa de circuito de computador de aprimoramento de imagem foi instalada no scanner de mesa para obter imagens de maior qualidade. Os operadores do sistema também observaram a utilidade de uma capacidade de reversão da tela de exibição (positiva e negativa) que aumenta a legibilidade da imagem visual de documentos difíceis de ler, microfilmes negativos digitalizados e fotostáticas desbotadas.

        Conduza o teste do scanner usando documentos selecionados durante a fase de design do sistema para determinar a necessidade de modificações especiais no hardware do scanner.

        Reter imagens digitalizadas sem aprimoramento de documentos de valor intrínseco.

        Cabeçalhos de arquivo de imagem digital

        Os sistemas de imagem digital usam um conjunto complexo de software de computador para funções de captura, armazenamento e recuperação de imagens. O pedido do usuário por uma imagem está vinculado a um local específico no disco óptico de dados digitais ou outro meio de armazenamento. A vinculação é realizada por meio de um cabeçalho que antecede os dados digitais de cada imagem discreta ou grupo de imagens. Os dados do cabeçalho do arquivo de imagem podem incluir itens como tamanho do arquivo, tipo de técnica de compactação e resolução de digitalização. Os cabeçalhos dos arquivos costumam ser proprietários e normalmente são fornecidos como um componente integral do sistema de imagem. Apesar da importância do cabeçalho de um arquivo para a recuperação de imagens por um longo período, os cabeçalhos de arquivo costumam ser esquecidos pelos usuários até que surjam problemas. As dificuldades geralmente ocorrem quando os dados da imagem devem ser transferidos ou quando um sistema é atualizado ou modificado de outra forma.

        É essencial usar formatos de arquivo de imagem não proprietários e estruturas de cabeçalho ou ter a capacidade de migrar arquivos de imagem para um formato padronizado comum. Quando formatos e cabeçalhos de arquivo de imagem proprietários não podem ser evitados, o desenvolvedor do sistema deve ser solicitado a fornecer uma "ponte" para formatos de arquivo de imagem não proprietários ou, no mínimo, documentação abrangente que descreve a estrutura do arquivo de imagem. No momento, não há nenhum padrão acordado em toda a indústria para formatos e cabeçalhos de arquivo de imagem, embora muitos na indústria estejam atualmente trabalhando para desenvolver tais padrões. Um Image Interchange Facility (IIF), por exemplo, está atualmente em desenvolvimento sob os auspícios da International Standards Organization como parte de seu International Image Processing and Interchange Standard. O principal componente do IIF será a definição de um formato de dados para a troca de dados de imagem estruturados arbitrariamente em limites de aplicativos heterogêneos.

        Na ausência de um formato de imagem padrão aceito, muitos sistemas de imagem usam o Tagged Image File Format, ou TIFF. É um dos formatos de arquivo de imagem mais amplamente suportados para computadores pessoais. Cada arquivo TIFF inclui um cabeçalho, um ou mais diretórios de arquivo de imagem e dados de conteúdo. Os cabeçalhos TIFF e os diretórios de arquivos de imagem informam ao sistema do computador como ler os dados e contêm informações como largura, comprimento e resolução da imagem. Alguns desenvolvedores de sistemas de imagem estão adotando o TIFF para oferecer suporte à transferência de imagens entre sistemas. Infelizmente, diferentes versões de cabeçalhos TIFF podem ser implementadas, portanto, o TIFF não garante automaticamente o sucesso com transferências de imagens entre sistemas distintos. Recomenda-se adquirir documentação abrangente sobre a estrutura do cabeçalho, mesmo ao usar o Tagged Image File Format.

        Mais da metade dos sites de agências federais pesquisados ​​para este relatório usam cabeçalhos de arquivos de imagem digital proprietários. Apenas três dos sites de agências federais empregam alguma versão do Tagged Image File Format, mais amplamente usado. A terminologia complexa e os detalhes específicos dos cabeçalhos dos arquivos de imagem contribuem para a falta de compreensão e reconhecimento universal de sua importância. Como resultado, muitos administradores de sistema contam com empresas de integração, fornecedores e fabricantes de discos ópticos de dados digitais para guiá-los pelo labirinto de detalhes técnicos e especificações de formato de cabeçalho de arquivo. Essa confiança em soluções de fornecedores proprietários pode contribuir para futuras dificuldades na migração de dados.

        Use formatos de arquivo que promovam / facilitem a transferência de dados de rede, como Aldus / Microsoft TIFF Versão 5.0, que atende à definição padrão da Força-Tarefa de Engenharia da Internet para troca de imagens em preto e branco na Internet.

        Requer o uso de um rótulo de cabeçalho de arquivo de imagem não proprietário. Ou Exigir uma "ponte" para um rótulo de cabeçalho de arquivo de imagem não proprietário. Ou Exigir uma definição detalhada da estrutura da etiqueta do cabeçalho do arquivo de imagem.

        Técnicas de compressão de dados

        As imagens digitais são geralmente compactadas como parte do processo de digitalização e armazenamento e, posteriormente, descompactadas na recuperação. Um algoritmo de compressão transforma o padrão raster de imagem digital original em um código matemático que é armazenado de forma mais compacta, com técnicas de compressão unidimensionais ou bidimensionais.A compressão unidimensional usa pixels contíguos (adjacentes) na mesma linha digitalizada, enquanto a compressão bidimensional compara as diferenças entre as linhas digitalizadas, bem como dentro da mesma linha. Dependendo das características e técnicas do documento escolhidas, as taxas de compressão reais obtidas podem variar amplamente. Os sistemas de imagem típicos podem compactar em uma proporção de 10 para 1, enquanto uma proporção de 20 para 1 ou até maior, é viável com esquemas de compactação mais sofisticados.

        Embora existam muitas técnicas de compressão em uso hoje, elas geralmente se enquadram em duas categorias: proprietárias ou padrão. Algoritmos de compressão proprietários tendem a operar mais rápido e oferecer maior compactação de dados. No entanto, as imagens armazenadas podem não ser facilmente transportáveis ​​entre sistemas diferentes devido às características especializadas do algoritmo. Os algoritmos de compactação padronizados podem não ser tão poderosos, mas podem oferecer suporte à transferência de dados de imagem entre sistemas que, de outra forma, poderiam ser incompatíveis. Técnicas de compressão padrão ou não proprietárias são, portanto, uma parte indispensável de uma estratégia de migração para registros de valor de longo prazo.

        As técnicas de compressão patenteadas e padrão podem ser subdivididas em métodos de compressão "com perdas" e "sem perdas". Com a compactação com perdas, uma certa quantidade das informações originais é descartada como parte do processo de compactação. A compressão sem perdas, como o próprio nome indica, permite a reconstrução de um arquivo idêntico ao original. Quando realizada corretamente em um documento adequado, a compactação com perdas tem a vantagem de diminuir drasticamente o tamanho dos arquivos digitais originais de uma forma quase indetectável ao olho humano. Para aqueles documentos de arquivo em que a fidelidade contínua à aparência exata do documento original é importante, um esquema de compactação sem perdas é recomendado.

        Uma das técnicas de compressão sem perdas mais comumente usadas utiliza um método chamado codificação de comprimento de execução. Ele avalia os padrões de pixels adjacentes em uma única linha horizontal e codifica as transições binárias. A codificação de execução é mais eficiente para documentos com grandes áreas de espaço em branco, comumente encontrados em arquivos de texto de escritório. Documentos mais complexos que incluem desenhos de linhas, gráficos, fotografias e mapas, entre outros, podem ser compactados com mais eficiência usando técnicas que usam "tabelas de consulta" para comparação com a imagem digitalizada.

        O antigo Comitê Consultivo de Telégrafos e Telefones Internacionais (CCITT), agora denominado Setor de Padronização de Telecomunicações (TSS), desenvolveu padrões internacionais para transmissão de dados em linhas de comunicação nos modos unidimensional e bidimensional. Esses padrões de fac-símile são conhecidos como Grupo 3 e Grupo 4. O Grupo 4 fornece maior capacidade de compressão (embora em certo ponto com perda) e opera em um modo bidimensional. Atualmente em desenvolvimento pelo Joint BI-level Image Group (JBIG) é um novo padrão internacional destinado a substituir os padrões de compressão CCITT Grupo 3 e CCITT Grupo 4.

        Além dos padrões anteriores, os desenvolvedores de software de sistema podem ocasionalmente precisar implementar outros esquemas de compactação. Dois esquemas de compressão significativos são o Joint Photographic Experts Group (JPEG) e o Motion Picture Experts Group (MPEG). JPEG é projetado para compactar imagens digitais em cores ou em escala de cinza com qualidade de tom contínuo. Ele oferece uma alternativa de compactação com e sem perdas. O primeiro ocorre quando um processo matemático denominado transformada discreta de cosseno (DCT) é invocado e utiliza um quadro de 8 x 8 pixels e produz uma compressão substancial. Este processo produz uma imagem com perdas com alguma perda de detalhes que pode não ser necessariamente detectável ao olho humano. A quantidade real de perda depende da taxa de compressão selecionada. Em contraste, a alternativa de compressão sem perdas atinge fidelidade completa à imagem de origem porque a área de amostragem ou quadro é de 2 x 2 pixels, três dos quais estão alinhados ao longo de eixos diferentes em relação ao quarto. A taxa de compressão é controlada pelo usuário e limitada a 2: 1 ou 3: 1.

        MPEG é um esquema de compressão para imagens de vídeo full motion. Ele usa JPEG para a compactação de quadros individuais e também usa outras técnicas com perdas para compactar dados entre os quadros. As crescentes demandas de computação multimídia, videoconferência e televisão digital de alta definição tornam provável que novos padrões sejam desenvolvidos em breve para a rápida transmissão de imagens em movimento. Como o MPEG é inerentemente com perdas e a alta taxa de compactação do JPEG só é possível com a técnica de compactação com perdas, os administradores de sistema devem avaliar cuidadosamente as necessidades funcionais do sistema para determinar se qualquer uma das técnicas atenderá aos requisitos de imagem atuais e futuros previstos.

        Os desenvolvedores e administradores de sistema devem escolher entre técnicas de compactação padrão e proprietárias. O uso de técnicas de compressão em conformidade com CCITT ou as especificações JBIG em desenvolvimento ao armazenar dados não tonais aumentará a probabilidade de que as imagens possam ser usadas com outras tecnologias ou migradas entre sistemas. Embora as técnicas proprietárias possam fornecer maior compactação de dados, a compatibilidade não é garantida. Na verdade, se o software que suporta uma técnica de compressão proprietária se tornar obsoleto, então, para todos os efeitos práticos, a imagem não pode ser restaurada. Pode haver momentos em que o uso de uma técnica proprietária de compactação sem perdas seja inevitável, mas nesses casos o fornecedor deve fornecer um utilitário para descompactar os dados em seu formato original de dados digitalizados. Em algum momento futuro, os dados podem ser compactados novamente usando qualquer método desejado. A Tabela 1 fornece uma comparação das técnicas de compactação de dados e exemplos de seus aplicativos.

        Imagem
        Fonte

        Os sites pesquisados ​​usaram esquemas de compressão patenteados e padronizados. Mais da metade dos 15 sites adotaram algum tipo de algoritmo de compressão de dados proprietário, enquanto apenas 5 usaram a técnica de compressão CCITT Grupo 4 padronizada. Embora os vários esquemas de compactação proprietários reduzam efetivamente os tamanhos dos arquivos digitais, resultando em uma transmissão de imagem mais rápida e armazenamento reduzido nos discos ópticos de dados digitais, a adoção de uma abordagem proprietária apresenta um nível de risco em qualquer esforço de migração de dados subsequente. Independentemente da técnica adotada, os administradores de sistema reconheceram a importância de obter documentação descritiva sobre os algoritmos de compressão empregados.

        Use um esquema de compactação sem perdas quando for possível e desejada fidelidade contínua à aparência exata do documento original.

        Use JPEG ou MPEG para imagens com qualidades tonais contínuas quando alguma perda de detalhes for aceitável.

        Para imagens digitais sem qualidades tonais contínuas, requerem técnicas de compressão padronizadas, como CCITT Grupo 3, CCITT Grupo 4 ou JBIG.

        Se um sistema de compactação sem perdas proprietário for usado, exija que o fornecedor forneça um meio de descompactar os dados para seu formato original.

        Garantia de qualidade de imagem digital

        O controle de processo garante que o equipamento de produção (por exemplo, scanners de documentos, hardware de compressão de imagem, impressoras a laser) e processos de sistema relacionados estão funcionando em níveis ideais de acordo com critérios pré-estabelecidos. Idealmente, esses critérios de controle de processo são usados ​​rotineiramente para monitorar o desempenho do sistema de imagem e seus componentes individuais. Ferramentas especializadas de diagnóstico e avaliação técnica, combinadas com livros de registro detalhados, são um recurso inestimável na solução de problemas futuros do sistema.

        O controle de qualidade do produto avalia a qualidade das imagens digitais individuais e os dados de índice relacionados produzidos pelo sistema de imagem. Este nível de controle de qualidade é acelerado quando as imagens digitais digitalizadas são temporariamente armazenadas no cache de disco magnético. O armazenamento magnético permite digitalizar novamente antes de gravar os dados da imagem nos discos ópticos de dados digitais. A nova varredura corretiva é um recurso especialmente importante para sistemas que utilizam discos ópticos de dados digitais de gravação única. Dependendo da configuração do sistema, as correções podem ser realizadas na estação de captura do scanner ou em estações de trabalho de inspeção ou nova varredura especialmente designadas.

        O treinamento e a supervisão da equipe de operações é um fator chave para manter uma qualidade de imagem aceitável. Conforme observado anteriormente, não há indicadores empíricos objetivos de qualidade de imagem aceitável para imagens digitalizadas. Uma alternativa é categorizar os documentos com base em problemas de digitalização e chegar a um consenso sobre como capturar a "melhor" imagem da maneira mais eficaz. Idealmente, esse processo de decisão envolveria uma equipe composta por equipe de produção do sistema de imagens, gerentes de registros e usuários e pesquisadores do sistema. Essas avaliações devem incluir a análise visual das imagens da tela da estação de trabalho e da saída da impressora a laser. Reter um conjunto de impressões a laser representativas para referência futura seria uma valiosa ferramenta de referência de análise de imagens.

        Os programas de inspeção de controle de qualidade têm um impacto direto na produtividade da conversão de documentos e na utilidade geral do sistema de imagem. Por exemplo, um programa de inspeção pode incluir uma comparação visual abrangente de 100 por cento das imagens digitalizadas para os documentos originais, ou pode ser limitado a definir a população de inspeção com base em uma porcentagem calculada ou plano de amostragem. O nível geral de inspeção de controle de qualidade deve ser extremamente alto se os documentos originais não forem retidos após a conversão. Em alguns sistemas, as decisões de aprovação / reprovação sobre a adequação das imagens digitalizadas são baseadas nos julgamentos do operador. Esses julgamentos podem ser ajustados por meio de treinamento e experiência prática, em vez de depender de critérios mais objetivos, como diretrizes escritas da agência ou procedimentos operacionais. Ou seja, se uma imagem da tela "parecer correta" para o operador do scanner ou técnico de controle de qualidade, os critérios de qualidade do sistema foram alcançados. Em qualquer caso, gerentes de agências federais prudentes devem exigir avaliação imediata de cada entrada de índice e imagem de documento.

        É importante não apenas verificar as imagens digitais conforme capturadas na estação de varredura, mas também quando as imagens são gravadas em um disco óptico de dados digitais ou depois de criar uma cópia de backup disco para disco óptico. Problemas durante esses processos podem resultar em imagens que são contadas estatisticamente pelo sistema como "páginas", mas não podem ser recuperadas quando os usuários tentam visualizar ou imprimir o arquivo. Dependendo da extensão do problema, se apenas uma parte da página foi copiada ou transferida, esses arquivos corrompidos podem conter ruído gerado pelo sistema inútil ou linhas estranhas. Esses problemas são causados ​​por várias fontes, como falhas de componentes de hardware, falhas de software ou até mesmo picos de energia. Portanto, é aconselhável, ao transferir dados de imagem para qualquer outra mídia do disco rígido magnético original ou disco óptico de dados digitais, verificar as imagens como copiadas. Este processo pode ser executado manualmente ou automaticamente usando um software de verificação de imagem.

        Uma inspeção de 100 por cento da qualidade dos dados de índice é obrigatória para uma operação bem-sucedida contínua e para manter a confiança do usuário do sistema no programa de imagem digital de uma agência. Se os dados de índice forem inseridos incorretamente ou se erros forem introduzidos durante o processo de captura de dados automatizada de OCR / código de barras, as imagens digitais relacionadas são essencialmente irrecuperáveis. A verificação do índice pode ser realizada de várias maneiras, incluindo uma comparação visual dos dados inseridos por chave com as imagens digitalizadas ou documentos em papel exibidos. Os dados do índice também podem ser verificados por meio de digitação dupla, em que os dados do índice são recodificados manualmente, com o software do sistema de computador executando automaticamente uma comparação das duas entradas.

        Praticamente todos os sites de agências federais visitados têm algum tipo de programa de inspeção de controle de qualidade. Os programas de inspeção variam quanto à verificação visual ou automatizada dos arquivos de imagem. Os inspetores de imagem usam monitores de exibição para verificar visualmente a qualidade dos documentos digitalizados. Alguns gerentes de sistema expressaram confiança de que operadores de scanner experientes são suficientemente qualificados para obter a qualidade de imagem adequada sem inspecionar cada imagem capturada. Um dos locais visitados usa um empreiteiro de controle de qualidade independente responsável por monitorar as operações de conversão no local e verificar as calibrações dos equipamentos. Sob essa configuração, a gerência da agência supervisiona o processo de controle de qualidade e verifica os esforços de produção para verificar a conformidade contínua com as diretrizes estabelecidas. Menos da metade dos sites visitados emprega alvos de teste especializados para avaliação da qualidade da imagem (consulte FIPS PUB 157) para monitorar o desempenho contínuo do sistema. Conforme observado por um administrador de sistema com ampla experiência no mundo real, "uma imagem de destino de teste é sempre melhor do que um pedaço de papel com uma pegada sobre ele."

        Avalie rotineiramente o desempenho do scanner com base nos procedimentos de controle de qualidade recomendados no FIPS PUB 157 "Diretrizes para controle de qualidade de scanners de imagem".

        Estabeleça um consenso sobre o que constitui a "melhor" imagem para os diferentes tipos de documentos de origem da agência, monitorando a qualidade contínua da imagem usando as telas do sistema e impressoras a laser.

        Realize uma avaliação de qualidade visual de 100 por cento de cada imagem digitalizada e as inspeções de controle de qualidade de dados de índice relacionadas devem ser meticulosas se os documentos originais não forem retidos após a conversão.

        Verifique as informações como copiadas ao transferir imagens / dados para qualquer outra mídia do disco rígido magnético original ou disco óptico de dados digitais.

        Se os discos WORM forem o meio de armazenamento de sua escolha, grave as informações permanentemente somente após conduzir uma inspeção completa de controle de qualidade das imagens digitalizadas e dados de índice.

        Seção 5: Sistemas de indexação

        Problemas de Gestão

        A recuperação eficiente de imagens de documentos digitalizados e dados gráficos depende de um banco de dados de índice preciso e atualizado. A indexação de uma imagem digital envolve a vinculação de informações descritivas da imagem às informações do cabeçalho do arquivo. Os dados de índice são normalmente digitados manualmente usando os documentos originais ou as imagens digitalizadas, no momento da captura da imagem ou posteriormente no processo de produção. A verificação dos dados do índice em que as entradas do banco de dados são comparadas com os documentos de origem originais para integridade e precisão é crucial: um termo de índice incorreto pode resultar na não recuperação da imagem relacionada.

        As informações do cabeçalho do arquivo são fornecidas automaticamente pelo subsistema de armazenamento do sistema de imagem e geralmente incorporam um número de referência da imagem que está incluído no índice de informações descritivas. O índice descritivo e o índice do cabeçalho do arquivo freqüentemente existem como entidades separadas, criando um problema de gerenciamento para informações de arquivamento armazenadas opticamente. A função de indexação de um subsistema de captura de imagem pode usar qualquer uma das várias abordagens diferentes normalmente controladas por três fatores:

        A sequência de operações refere-se à ordem em que o índice é inserido no sistema. Alguns aplicativos se beneficiam de um banco de dados existente que pode ser utilizado em conjunto com ponteiros para o arquivo de imagem relacionado. Em aplicativos onde o índice deve ser criado, duas abordagens estão disponíveis em relação a quando o índice será inserido no sistema. A primeira abordagem envolve a criação do índice antes da digitalização, seguida pela digitalização e, em seguida, a criação dos arquivos de imagem com ponteiros para eles imediatamente colocados nas entradas de índice correspondentes. A segunda é realizar a digitalização do documento sem um índice existente, permitindo a criação do índice após a criação do arquivo de imagem. Nesse caso, o operador de entrada de dados digita os dados do índice e indica o início e o fim do arquivo, tudo em uma única etapa.

        A complexidade dos dados é um fator significativo a ser considerado ao projetar um sistema de indexação. Na maioria dos sistemas baseados em imagens digitais, o número de campos de índice é mantido em uma quantidade razoável, suficiente para fornecer ao pesquisador informações adequadas para localizar o arquivo sem sobrecarregar a busca no banco de dados. É responsabilidade do pesquisador ler a imagem e extrair as informações e não depender do índice para fornecer todos os dados necessários. No entanto, se um sistema de imagem baseado em varredura estiver sobrecarregado com um sistema de indexação grande e complexo, o tempo de pesquisa poderá ser aumentado e a eficiência do sistema será um tanto prejudicada.

        Com a metodologia de entrada de chave, o operador de entrada de dados digita os campos pré-identificados da imagem digital ou dos documentos originais em papel. O ponto mais baixo de acesso direto (geralmente no nível do arquivo) deve conter seus próprios dados de índice. Um arquivo pode consistir em qualquer número de páginas e as páginas individuais de um arquivo podem ser acessadas diretamente após o arquivo ser recuperado do disco óptico de dados digitais. Em alguns aplicativos, no entanto, cada página do documento é seu próprio arquivo e, como resultado, cada página deve ser indexada individualmente. Dependendo das características do documento, o reconhecimento óptico de caracteres (OCR) pode ser útil para identificação e captura de dados de índice. As zonas predefinidas do documento são digitalizadas e os dados da imagem raster que residem nela são convertidos em dados de caracteres ASCII. Os aplicativos que usam formulários padrão ou qualquer tipo de layout de página que contém localizações de campo consistentes podem se qualificar para esta tecnologia. Atualmente, a tecnologia OCR padrão pode converter com eficiência a maioria das fontes de tipo padrão e algumas impressões manuais estruturadas em ASCII. Os custos de conversão podem aumentar drasticamente (dobrando para cada percentual de precisão aprimorada) ao redigitar erros de OCR para obter uma taxa de precisão de dados de índice de 100%. Se a precisão de 100 por cento do índice não for obrigatória para um aplicativo específico, é possível (embora não recomendado) utilizar a versão de índice OCR não corrigida para dar suporte a pesquisas dos arquivos de imagem.

        Uma metodologia alternativa para os aplicativos de agência que têm pouca consistência na localização dos dados utiliza etiquetas pré-impressas, ou folhas de cabeçalho, que podem ser inseridas no início de cada arquivo a ser digitalizado. Essas etiquetas podem usar códigos de barras legíveis por máquina ou dados de caracteres que são facilmente convertidos pela tecnologia OCR. De modo geral, se for possível utilizar OCR ou alguma outra forma de legibilidade por máquina para entrada de índice e for vantajoso em termos de custos, esse formulário deve ser utilizado para ganhar velocidade, precisão e facilidade de uso. No entanto, a entrada manual da chave pode fornecer taxas de conversão rápidas se os tamanhos dos arquivos forem grandes e os campos de entrada de dados forem minimizados.

        Muitos sistemas de indexação com suporte para mainframe podem atender aos padrões existentes de banco de dados do Governo Federal, como Federal Information Processing Standards Publication (FIPS PUB) Número 127, "Structured Query Language (SQL)". No entanto, muitos sistemas de imagem digital de pequena a média escala tendem a ser direcionados para uma rede local (LAN) ou ambiente de desktop. Sistemas menores podem usar bancos de dados de índice otimizados para desempenho de pesquisa e recuperação, em vez de conformidade com padrões de interoperabilidade e portabilidade. Como resultado, como sistemas menores superam sua plataforma operacional, é muito difícil migrá-los para um ambiente de banco de dados maior. Portanto, sistemas menores que têm potencial para evoluir para ambientes SQL maiores devem ser desenvolvidos com o FIPS PUB 127 em mente e o processo de análise de requisitos deve considerar o crescimento futuro para determinar se há um requisito de portabilidade de dados.

        Problemas de desempenho e tamanho geralmente conduzem o design dos sistemas de indexação. Quando esses sistemas de indexação estão vinculados a sistemas óticos de recuperação de imagens, o resultado final geralmente é uma solução proprietária. Em alguns casos, pode ser melhor relaxar os requisitos de desempenho em favor de uma abordagem de sistemas abertos (consulte FIPS PUB 127) que facilita a migração do banco de dados de índice enquanto mantém o banco de dados de imagens existente.

        A pesquisa e o desenvolvimento de métodos automatizados para capturar com precisão os dados de indexação necessários, incluindo OCR e tecnologias de código de barras, estão em andamento. O OCR está progredindo rapidamente, conforme demonstrado pelos recursos de reconhecimento aprimorados e velocidades de conversão de conversão mais altas. Os sistemas de imagem para pequenos escritórios agora oferecem suporte ao recurso de reconhecimento óptico de caracteres integrado, embora documentos de baixa qualidade possam exigir uma digitalização de alto desempenho do que a oferecida atualmente pelos sistemas prontos para uso. Os fornecedores também integraram a tecnologia de código de barras para controle do scanner, delineamento de arquivos e coleta de dados de índice.

        Os sistemas operacionais LAN estão começando a utilizar técnicas de compressão de dados em servidores LAN otimizados para recuperação de dados. Essas técnicas podem possibilitar o armazenamento de bancos de dados de médio porte em servidores de rede em vez de em sistemas de mainframe. Essa tendência pode diminuir o custo de implementação de sistemas de recuperação de informações vinculados ou integrados a sistemas de recuperação de imagens. Por fim, grandes conjuntos de dados de índice agora podem ser armazenados em subsistemas de cartucho de fita de capacidade muito alta, que podem ser integrados em subsistemas de armazenamento e recuperação multicartridge e multidrive. Essa tecnologia traz backup de dados de mainframe e capacidade de arquivamento para um ambiente de servidor LAN, tornando a imagem baseada em servidor atraente e econômica.

        Os acervos de registros de agências federais contêm documentos que são difíceis de ler, como documentos datilografados manualmente, fac-símiles, cópias carbono e documentos excessivamente complexos. Historicamente e na prática, a existência de tais documentos restringiu a adoção generalizada de tecnologias de indexação automatizada. Os sistemas automatizados de reconhecimento de caracteres costumavam ser limitados a aplicativos que continham uma porcentagem significativa de formulários padronizados de alta qualidade. Durante as visitas ao local realizadas para este relatório, um gerente de projeto de uma agência federal observou que "a indexação é o lado negro da imagem". O comentário faz alusão aos esforços manuais de trabalho intensivo necessários para obter dados de campo de índice altamente precisos, muitas vezes sob as restrições de uma programação de produção pressurizada.

        Os sites de agências federais visitados usavam processos de indexação de entrada manual e automática de dados. Os operadores de entrada de dados em 10 dos locais digitam manualmente os dados de índice descritivos, usando os documentos originais ou as imagens digitalizadas exibidas. A equipe contratada do Bureau of Land Management (BLM), por exemplo, visualiza as imagens da tela digital enquanto digita os dados em 35 campos distintos. Os dados digitados são subsequentemente verificados pela equipe da agência BLM, e uma taxa geral de precisão de 99,5 por cento é reivindicada. O sistema de computador auxilia os operadores de digitação, preenchendo automaticamente certos campos predefinidos. Outro exemplo é o sistema de imagem digital Superfund da Agência de Proteção Ambiental, que oferece suporte à indexação manual usando um teclado, mouse ou leitor de código de barras.

        O software do sistema observado em três sistemas que armazenam dados digitais (imagens não digitalizadas) seleciona e cria automaticamente as informações de índice. Por exemplo, a Rede Sismográfica Nacional do National Earthquake Information Center automatiza as funções de captura, indexação e transmissão de dados e acesso do usuário. A indexação automatizada dos arquivos de dados ocorre no ponto de captura e armazenamento inicial dos dados, com o tempo cronológico decorrido (duração) registrado do evento sísmico servindo como chave de índice primária. A Biblioteca do Congresso automatizou a criação do banco de dados de índice capturando dados de índice (neste caso, um número de acesso exclusivo) de folhas de cabeçalho de entrada especialmente criadas, com os erros de OCR exigindo correções por operadores de entrada de chave. Automatizar o processo de indexação de uma agência melhora o rendimento do projeto de conversão e também aumenta a precisão dos dados registrados.

        Conforme apropriado, certifique-se de que o software de recuperação de informações seja compatível com SQL.

        Independentemente da metodologia de captura utilizada, conduza uma inspeção de controle de qualidade de 100 por cento de todos os dados do índice.

        Localização do banco de dados de índice

        Várias opções estão disponíveis para armazenar dados de índice vinculados a imagens raster armazenadas opticamente ou dados digitais. Dados de índice armazenados magneticamente fornecem pesquisa de dados aprimorada, acesso a imagens e procedimentos menos complexos ao modificar as informações de índice. No entanto, essa abordagem requer a retenção e a recopia periódica de dois sistemas separados: os dados de índice armazenados magneticamente e as imagens armazenadas opticamente. Dependendo dos requisitos de armazenamento de dados de uma agência, as cópias de backup dos dados do índice também devem ser consideradas, fornecendo redundância e proteção contra perda acidental de dados. Os dados de índice também podem ser gravados diretamente nos discos ópticos de dados digitais, servindo como um índice permanente para as imagens armazenadas adjacentemente. Essa técnica pode ser útil para agências com requisitos especializados de indexação, preservação ou segurança de dados.

        Todos os 15 sites de agências federais visitados armazenam seus dados de índice usando tecnologia de armazenamento magnético. A Biblioteca do Congresso, por exemplo, mantém um número de acesso de índice de documento exclusivo junto com indicadores de localização de documento para as imagens armazenadas opticamente. Armazenar essas informações de acesso do índice magneticamente permite que a equipe da Biblioteca atualize ou modifique os dados conforme necessário. O Patent and Trademark Office mantém dados de índice de patentes em formato magnético, mas ao contrário de outras agências pesquisadas, mantém os dados em formato óptico. Enquanto os dados de índice armazenados magneticamente do Escritório de Patentes fornecem facilidade de pesquisa e modificação, os administradores do sistema também registram dados de índice permanentemente em cada disco óptico de dados digitais. Os dados de índice armazenados opticamente funcionam como um diretório permanente ou índice para as imagens digitais. No conceito de armazenamento duplo do Patent Office, o índice e os dados da imagem são inseparáveis, ajudando a garantir a vinculação de longo prazo desses dois recursos de informação.

        Armazene os dados de índice magneticamente para operações aprimoradas e opticamente se a preservação de longo prazo for uma preocupação.

        Complexidade do banco de dados de índice

        Os dados de índice processados ​​pelo software de banco de dados podem ser suficientemente descritivos para responder às perguntas do usuário sem a necessidade de recuperar as imagens digitais. A produtividade do operador é mais alta quando os dados do índice podem ser facilmente extraídos. Dependendo dos requisitos do sistema de indexação, um tempo considerável da equipe é necessário para digitar manualmente vários campos de dados ou o texto completo para pesquisa de texto completo. Com base nas visitas ao local e nas discussões com os administradores de sistema da agência federal, os sistemas de imagem ótica observados são baseados em um dos seguintes conceitos de recuperação genéricos.

          Imagens (dados digitais) ou grupos de imagens agrupados são vinculados a um identificador pessoal exclusivo, como um número de previdência social, armazenado em um banco de dados simples e plano. Tal banco de dados é facilmente criado e mantido, exigindo pouco do administrador do sistema em termos de programação sofisticada.

        Os subsistemas de recuperação de informação descritiva geralmente devem ser capazes de pesquisa rápida em grandes bancos de dados com uma variedade de opções de consulta. Os subsistemas de recuperação de imagem geralmente não requerem muito espaço de armazenamento para o índice do cabeçalho do arquivo e sua capacidade de entregar a imagem à estação de trabalho do usuário depende dos recursos do dispositivo de armazenamento ou acesso e do subsistema de comunicações. Os subsistemas de recuperação de dados de índice e de recuperação de imagens devem ser suficientemente integrados para que um sistema de imagens funcione de acordo com as expectativas do usuário.

        Algumas variações do sistema de indexação de tipo de arquivo simples, menos complexo, foram observadas em operação em 10 sites de agências federais visitados. O sistema de indexação da Commodity Futures Trading Commission usa um servidor OCR que converte imagens mapeadas em bits em texto ASCII. Os arquivos de texto ASCII são direcionados ao servidor de rede para indexação por software de aplicativos. Os itens de índice marcados incluem manchetes de recortes de jornais, fontes de notícias de origem e aproximadamente 50 categorias de tópicos de página inseridos para uso posterior como palavras-chave de banco de dados pesquisáveis. O sistema de imagem da Agência de Proteção Ambiental (EPA), por outro lado, usa um sistema de indexação mais complexo vinculado aos minicomputadores host IBM AS / 400 existentes da agência. O pessoal de operações do escritório regional da EPA digita manualmente as informações de índice usando os documentos originais antes da digitalização. As informações com código de barras servem como uma alternativa para a entrada manual da chave sempre que possível. O software de indexação fornece menus suspensos da interface do usuário da estação de trabalho controlados pelo mouse ou teclado. A produtividade operacional é ainda mais aprimorada quando as telas de exibição de dados de índice fornecem aos usuários informações suficientes para evitar efetivamente a necessidade de recuperar as imagens digitais.

        O design do sistema de índice e as decisões de capacidade devem ser baseados em uma análise completa das operações da agência e das necessidades do usuário.

        Seções 6: Sistemas de disco óptico de dados digitais

        Figura 2 Subsistema de armazenamento em disco óptico

        Problemas de Gestão

        Os administradores de agências federais responsáveis ​​pela custódia de registros de longo prazo podem se beneficiar da adoção de um sistema de armazenamento e recuperação de informações baseado em tecnologia. O armazenamento de dados de alta capacidade oferecido com discos ópticos de dados digitais é de interesse especial para arquivistas, gerentes de registros e outros interessados ​​na preservação de informações. A seleção do sistema de armazenamento de informações mais apropriado deve ser baseada em uma análise abrangente das necessidades imediatas e de longo prazo de cada agência federal. Uma análise das necessidades funcionais de uma agência deve refletir os requisitos de toda a comunidade de usuários da agência, incluindo administradores, gerentes de programa, funcionários de gerenciamento de recursos de informação (IRM), equipe de suporte técnico e o público em geral, se apropriado. Embora a indústria de imagem enfatize os benefícios do acesso eficiente e do manuseio de arquivos, muitas vezes os fatores de custo assumem um papel significativo no processo de tomada de decisão. Preocupações com a preservação, como longevidade do sistema ou da mídia, a necessidade de atualizações de rotina do sistema, transferência de imagem ou dados de indexação e problemas semelhantes, são posteriormente relegados a um status subordinado. Um elemento importante a se considerar é a usabilidade esperada da mídia de armazenamento de informações ao longo da vida do sistema de armazenamento de dados digitais ópticos e de imagem digital.

        Configuração do sistema de disco óptico de dados digitais

        Os componentes ópticos de armazenamento em disco digital de dados podem ser integrados em diversas configurações de sistema, desde estações de trabalho de um único usuário ou vários usuários operando em configurações cliente-servidor até computadores mainframe com centenas de terminais de usuário remotos. Um subsistema de armazenamento óptico pode incluir:

        • Plataformas de servidor de mainframe de sistema, minicomputador ou computador pessoal (PC)
        • Unidade de disco ótico e mídia de disco ótico digital de dados
        • Equipamento de armazenamento de jukebox
        • Software de sistemas e aplicativos

        A Figura 2 ilustra uma configuração possível de um subsistema de recuperação e armazenamento em disco digital óptico de dados.

        Os requisitos de armazenamento de informações de uma agência federal devem ser avaliados com base em vários fatores, incluindo a capacidade de armazenamento de dados necessária, a eficácia da recuperação, a confiabilidade do sistema e dos componentes, a capacidade de garantir a integridade dos dados e a longevidade da mídia de armazenamento selecionada e dos componentes do sistema de imagem relacionados. Fatores técnicos adicionais a serem considerados são as características físicas da mídia, o processo de gravação de disco óptico digital de dados especificado, características de gravação de dados e capacidade de armazenamento utilizável geralmente expressa em gigabytes (GB) e durabilidade de disco óptico digital de dados e conformidade com os padrões nacionais e internacionais .

        Devido às rápidas mudanças tecnológicas, os gerentes de programas de agências federais estão lutando para criar planos realistas de migração de armazenamento. Entrevistas no local com administradores de agências federais indicaram uma consciência geral da necessidade de, eventualmente, atualizar os componentes do sistema ou desenvolver abordagens alternativas. As visitas no local revelaram que algumas agências federais já modificaram, atualizaram ou substituíram componentes individuais ou subsistemas inteiros. Eles seguiram essas etapas enquanto buscavam melhor desempenho e melhor acesso às informações armazenadas. As mudanças incluem melhorias no software de aplicativos do sistema, telas de estação de trabalho de alta resolução e memória cache aumentada, integração de estações de trabalho Reduced Instruction Set Computer (RISC) de alto desempenho e a aquisição de unidades de disco óptico de dados digitais adicionais ou jukeboxes e dados digitais ópticos de maior capacidade discos.

        A maioria dos 15 sites de agências pesquisados ​​usam plataformas baseadas em PC como estações de trabalho ou servidores, e mais da metade são controlados por ou têm ligações com um mainframe ou sistema de minicomputador. Esses links de mainframe normalmente aumentam o acesso do usuário aos dados armazenados opticamente, ao mesmo tempo que fornecem uma passagem para os sistemas de recuperação de banco de dados de índice existentes. Além disso, embora quase todos os sistemas pesquisados ​​utilizem algum tipo de rede local (LAN), os sistemas de disco óptico de dados digitais variam em tamanho, complexidade e metodologia. A indexação de dados, a construção de arquivos e os procedimentos de fluxo de trabalho são, em muitos casos, ajustados aos requisitos de aplicação exclusivos de locais individuais.

        A maioria dos sites de sistema visitados para este relatório utiliza uma jukebox para armazenamento em disco óptico de dados digitais. O Patent and Trademark Office adotou uma abordagem única integrando uma série de unidades ópticas de acesso rápido (RAD) de disco único dedicadas, além de jukeboxes convencionais. A tecnologia RAD fornece recuperação otimizada de informações em suporte às solicitações do usuário. Em contraste, vários dos locais pesquisados ​​usam sistemas de unidade óptica autônomos nos quais os discos são manuseados manualmente pela equipe de operações. Esses sistemas manuais são frequentemente atualizados para operações mais automatizadas conforme as necessidades do usuário ditam uma resposta aprimorada do sistema. Todos os sistemas visitados que processam dados de imagem digital usam monitores de alta resolução (100 dpi a 150 dpi) e equipamento de impressão a laser.

        Tecnologias ópticas de gravação em disco digital de dados

        Dependendo dos requisitos da agência, os sistemas de armazenamento de dados digitais ópticos e de imagem digital podem incorporar uma das duas abordagens incompatíveis para registrar informações digitais:

        Sistemas Write Once Read Many (WORM). A mídia ótica Write once read many, ou WORM, foi introduzida pela primeira vez no início dos anos 80 e continua sendo uma escolha popular para sistemas de imagem digital. WORM processa dados de registro por meio de um feixe de laser que altera permanentemente as características reflexivas da superfície de gravação do disco ou camada (s) sensibilizada (s). Os processos de tecnologia de gravação óptica WORM incluem ablativo, bolha térmica, liga bimetálica, polímero corante e mudança de fase. O processo ablativo, a mais antiga tecnologia de gravação óptica disponível comercialmente, altera as características reflexivas do disco óptico de dados digitais criando poços de tamanho submicrônico, ou bolhas, para indicar 1s e 0s. A gravação de bolha térmica cria bolhas na superfície da mídia óptica usando a energia concentrada do feixe de laser. A tecnologia bimetálica usa um feixe de laser para fundir várias ligas em uma liga totalmente nova com um índice reflexivo diferente. Nas tecnologias de polímero de tinta e de gravação de mudança de fase, o feixe de laser altera a cor física e as características reflexivas da mídia, com as informações significadas pelas mudanças de cor. Como essas tecnologias de gravação envolvem uma alteração física não reversível da superfície de gravação, elas são designadas "gravar uma vez". Embora cada técnica tenha vantagens e desvantagens, de uma perspectiva de gerenciamento de arquivos e registros, nenhuma é conhecida por ser inerentemente superior. No momento, não existe um processo de registro preferencial para registros de valor de longo prazo.

        Quando a integridade dos dados é a principal preocupação, os discos ópticos de dados digitais WORM tornam-se atraentes porque os dados gravados não podem ser alterados ou apagados. Se em algum ponto uma imagem existente for determinada como incorreta ou não for mais necessária, o ponteiro eletrônico para esse local de pesquisa pode ser desabilitado. Este processo de desabilitação do ponteiro elimina efetivamente o acesso do usuário futuro. Os dados novos ou corrigidos são então gravados em uma área diferente e não utilizada do disco óptico de dados digitais. Este processo é essencialmente transparente para a comunidade de usuários. Embora o acesso à imagem original seja bloqueado, os dados ainda estão no disco WORM e potencialmente permanecem acessíveis, a menos que sejam expressamente sobrescritos pelo gerenciador do sistema para obliterar o padrão de dados gravado.

        Um dos desenvolvimentos mais recentes na escrita uma vez lida em muitos discos ópticos de dados digitais é o surgimento do disco compacto gravável, ou CD-R. A partir de meados da década de 1980, a memória somente para leitura de discos compactos (CD-ROM) tornou-se rapidamente um meio popular de publicação e distribuição de informações digitais. Esse processo de aceitação foi especialmente aprimorado à medida que os padrões internacionais foram desenvolvidos para garantir o intercâmbio de discos CD-ROM entre uma variedade de reprodutores. O processo convencional de publicação de CD-ROM é complexo e freqüentemente requer acesso a recursos de masterização comerciais que alcançam economias de escala somente quando um número adequado de discos é produzido. Conseqüentemente, a utilidade do CD-ROM na produção de apenas um ou dois discos, prática comum em ambientes de arquivamento e gerenciamento de registros, tem sido limitada. Essa situação está mudando rapidamente com a introdução de equipamentos de CD-R de custo relativamente baixo que gravam dados diretamente em discos individuais internamente. Uma grande vantagem é que o CD-R emprega os mesmos padrões da International Standards Organization (ISO) para mídia física (ISO 10419) e formatos de arquivo (ISO 9660) do CD-ROM. A adoção desses padrões aprimora muito o intercâmbio de discos e a capacidade de acessar informações armazenadas em discos CD-R.

        Sistemas regraváveis. Os discos ópticos de dados digitais regraváveis ​​oferecem uma alternativa viável para dados digitais que requerem atualização ou revisão frequente. Os discos regraváveis ​​oferecem aos usuários a capacidade de atualizar os dados gravados como agora é feito com discos rígidos magnéticos. Os discos ópticos de dados digitais regraváveis ​​estão disponíveis comercialmente nos diâmetros de 3,5 polegadas e 5,25 polegadas, com outros formatos em pesquisa e desenvolvimento. Embora os sistemas WORM atualmente sejam predominantes, os observadores da indústria preveem um crescimento contínuo de formatos regraváveis. O mercado atualmente oferece duas técnicas regraváveis ​​incompatíveis: magneto-óptico (MO) e mudança de fase.

        Os sistemas magneto-ópticos combinam propriedades de tecnologias magnéticas e ópticas. O processo de gravação de dados, ou "gravação", usa um feixe de laser para aquecer (geralmente até o ponto Curie) um local pré-magnetizado na superfície de gravação da mídia óptica. O processo de calor causa uma reversão da polaridade magnética, resultando em diferenças reflexivas sutis que são detectadas pelo feixe de laser "lido". O processo é reversível para apagar efetivamente os dados digitais. Existem padrões nacionais e internacionais aprovados para alguns tipos de mídia magneto-óptica.

        Os processos regraváveis ​​de mudança de fase alteram a superfície de gravação amorfa da mídia óptica.Os dados existentes podem ser apagados e novos dados gravados durante a mesma rotação do disco, fornecendo uma capacidade de sobregravação direta de dados. A padronização das unidades de mudança de fase e da mídia tem sido lenta em comparação com a tecnologia magneto-óptica.

        As agências federais têm várias opções com relação à seleção de sistemas de mídia óptica disponíveis comercialmente. Os sistemas WORM convencionais do tipo ablativo foram unidos no mercado por sistemas regraváveis ​​oferecidos como alternativas basicamente equivalentes aos sistemas de gravação WORM. Dependendo da abordagem do fabricante, esses sistemas ópticos regraváveis ​​utilizam códigos de segurança pré-gravados ou "travas" de software integradas às unidades ópticas ou à mídia óptica regravável ou ambos. Essas medidas de segurança de firmware / software servem para controlar a autoridade de gravação e substituição de dados do gerente do sistema, fornecendo efetivamente uma função WORM com mídia regravável.

        Na análise final, a seleção de tecnologias de disco digital óptico de dados WORM ou regravável depende de vários fatores, incluindo os requisitos de aplicação da agência federal, restrições regulatórias, recursos disponíveis e questões de padronização. A tecnologia WORM do tipo ablativo parece oferecer um grau substancial de segurança da informação e confiança do usuário porque, ao contrário da tecnologia regravável, é irreversível. É importante observar que a confiança do usuário na integridade dos dados armazenados geralmente se baseia em mais do que reversibilidade ou não reversibilidade da mídia. Na verdade, as funcionalidades de segurança de dados, que podem limitar os usuários a "somente leitura" ou fornecer uma capacidade de auditoria que rastreia os usuários com privilégios de "gravação", são muito mais importantes.

        Nenhum processo WORM foi identificado como a escolha definitiva e esmagadora entre os 15 sites de agências federais pesquisados. O processo de gravação real foi apenas um dos vários fatores considerados, incluindo o reconhecimento do nome do fabricante do disco óptico digital, a reputação da indústria e o histórico de produção de produtos de qualidade. Cinco dos quinze sistemas empregavam tecnologia regravável. Um exemplo é a utilização do programa PERMS do Departamento do Exército da tecnologia de gravação magneto-óptica regravável de 5,25 polegadas como armazenamento de imagem digitalizada provisória ou temporária (em processo) antes de transferir os dados da imagem para a mídia WORM de 12 polegadas. Outro exemplo é o sistema de documentos capturados do Exército (DOCEX), que usava a tecnologia de fita de áudio digital (DAT) como armazenamento temporário, seguido pela transferência de dados de imagem em discos magneto-ópticos regraváveis ​​de 5,25 polegadas para armazenamento permanente. Independentemente do formato selecionado, as visitas ao local indicaram que todos os sistemas de discos ópticos digitais de dados estavam funcionando em conformidade com as especificações do fabricante e atendendo às necessidades do usuário.

        Podem ser usadas tecnologias WORM ou regraváveis, com a seleção real determinada pelos requisitos de aplicação específicos da agência. Certifique-se de que os privilégios de leitura / gravação sejam cuidadosamente controlados e que uma trilha de auditoria de regravações seja mantida quando a tecnologia regravável for usada.

        Capacidade de armazenamento em disco óptico de dados digitais

        A capacidade de armazenamento em disco óptico de dados digitais é baseada em vários fatores, incluindo o diâmetro físico (por exemplo, 5,25 polegadas) de um disco específico, o estado da tecnologia de gravação óptica e a conformidade com os padrões da indústria aplicáveis. Os desenvolvimentos contínuos de engenharia em áreas técnicas, como larguras de trilha, gravação de dados e diodos de laser de comprimento de onda mais curto (por exemplo, azul e verde) devem melhorar drasticamente as capacidades de armazenamento de disco óptico de dados digitais. Por exemplo, diminuir a distância entre trilhas adjacentes ou reduzir o tamanho do ponto do feixe de laser de gravação permitirá que mais dados sejam gravados em cada disco óptico de dados digitais.

        A Tabela 2 ilustra as capacidades gerais de armazenamento de vários formatos de mídia ótica e tecnologias de gravação.

        Tabela 2. Capacidades de armazenamento em disco óptico de dados digitais
        Tipo de disco Diâmetro Capacidade
        CD-ROM 4,72 pol. 550 megabytes (MB)
        CD-R 4,72 pol. 600 MB
        MINHOCA 5,25 pol. (130 mm) 650 MB e 2 GB tímidos
        MINHOCA 12 pol. (300 mm) 2,18 GB e 5,6 GB tímidos
        MINHOCA 14 pol. (356 mm) 6,8 GB e tímidos 13 GB
        Regravável - MO 3,5 pol. (86 mm) 128 MB-384 MB
        Rewritable-MO 5,25 pol. (130 mm) 650 MB e # 150 2 GB
        Mudança de fase 5,25 pol. (130 mm) 940 MB - 1,5 GB

        Muitos observadores do setor acreditam que a capacidade de remover e trocar mídia é um fator chave para o sucesso de mercado a longo prazo e a viabilidade dos discos ópticos de dados digitais. A intensa competição de mercado que existia durante o desenvolvimento inicial da tecnologia de disco óptico digital WORM de 12 polegadas significava que pouco esforço era dedicado à padronização. Conseqüentemente, os discos WORM de 12 polegadas não são intercambiáveis. Aprendendo com essa experiência, os líderes da indústria adotaram uma abordagem mais cooperativa com outros formatos de disco óptico de dados digitais e alcançaram maior padronização técnica.

        Por exemplo, formatos de disco óptico digital de 5,25 polegadas de diâmetro e menores são cada vez mais populares devido a vários fatores: maior capacidade de armazenamento de dados, custos reduzidos para unidades ópticas e mídia, jukeboxes de alto desempenho e padrões amplamente aceitos da indústria. Os defensores do CD-R acreditam que a capacidade atual de armazenamento de aproximadamente 600 megabytes para os discos de 4,72 polegadas aumentará dramaticamente. Os observadores da indústria esperam que a maior capacidade de armazenamento, menores custos com equipamentos e mídia, além da capacidade de intercâmbio oferecida com os CD-Rs, tornem-nos a mídia óptica preferida para muitas aplicações. No entanto, os discos ópticos de dados digitais WORM de diâmetro maior provavelmente continuarão em ambientes de imagem digital em grande escala. A pesquisa e o desenvolvimento de laboratório em áreas como comprimentos de onda de laser e design de cabeçote de leitura aumentarão ainda mais as capacidades e o desempenho de armazenamento de mídia óptica. Esses esforços de pesquisa irão impor demandas adicionais à mídia óptica e levar os fabricantes a continuar melhorando o desempenho do produto. Os produtos recém-introduzidos devem ser avaliados em termos de recursos exclusivos do sistema, aplicabilidade às necessidades da agência e conformidade com os padrões existentes da indústria.

        O formato de disco óptico de dados digitais WORM de 12 polegadas foi a mídia predominante nos 15 sites de agências federais pesquisados. Por exemplo, o sistema de imagem Superfund da Agência de Proteção Ambiental usa mídia WORM de 12 polegadas para auxiliar na compilação, retenção e distribuição de relatórios de recuperação de custos e documentos legais associados à limpeza de locais de resíduos tóxicos de alta prioridade. A Federal Communication Commission usa discos de dados digitais ópticos WORM de 12 polegadas para armazenar e recuperar registros oficiais de regulamentação de agências e questões judiciais.

        Em comparação, várias agências visitadas usam mais de um formato de disco óptico de dados digitais. A Commodity Futures Trading Commission, por exemplo, utiliza a tecnologia WORM de 12 polegadas e multifuncional de 5,25 polegadas (WORM e MO) em uma plataforma de imagem para clipes de notícias e arquivos jurídicos de agências. Outro exemplo é o sistema PERMS do Departamento do Exército. O site de conversão PERMS armazena as imagens digitais digitalizadas em discos magneto-ópticos regraváveis ​​de 5,25 polegadas. Esses dados de imagem são subsequentemente transferidos para discos ópticos de dados digitais WORM de 12 polegadas para acesso de recuperação de jukebox. Nenhuma agência pesquisada utilizou mídia WORM de 14 polegadas.

        A Tabela 3 ilustra os dados coletados durante as 15 visitas ao local da agência federal referentes a tamanhos de disco, metodologias de registro e datas de inicialização do sistema. Mais da metade dos sites visitados instalou seus sistemas de disco óptico digital de dados WORM de 12 polegadas desde 1990, com o formato magneto-óptico regravável crescendo em 1991 & # 15092. Os administradores do programa da agência federal observaram que a seleção de critérios funcionais críticos do sistema, como formato de disco óptico de dados digitais ou tecnologia de gravação de dados, é idealmente baseada em uma análise das necessidades organizacionais e do usuário final.

        Tabela 3. Tamanho do Disco Óptico de Dados Digitais / Metodologia de Gravação
        Data de início do sistema WORM de 12 polegadas SEM-FIM de 5,25 polegadas MO de 5,25 polegadas (regravável)
        1985-1988 3 0 0
        1989 1 0 0
        1990 3 0 0
        1991 3 0 2
        1992 2 1 2
        1993 0 1 1
        Totais 12 2 5

        Com base em uma análise de requisitos e estudo de design de sistemas das operações de uma agência, selecione o fator de forma de armazenamento ótico de tamanho mais adequado que satisfaça as necessidades programáticas de longo prazo da agência e esteja em conformidade com os padrões da indústria.

        Sistemas de armazenamento Jukebox

        Uma jukebox automatiza o armazenamento e a recuperação de discos ópticos de dados digitais. Os sistemas de imagem digital com apenas alguns discos ou solicitações mínimas de referência podem depender de uma configuração de torre de várias unidades, sistema de cartucho ou até mesmo carregamento manual de mídia ótica individual em unidades óticas autônomas. Os fatores a serem considerados na seleção de uma jukebox incluem as taxas de crescimento de dados planejadas, as necessidades de recuperação de informações da agência e os custos de aquisição e manutenção do sistema. Um sistema de armazenamento jukebox é especialmente valioso em ambientes de acesso público para evitar riscos de danos ou roubo inerentes à seleção manual, inserção e refil de discos ópticos de dados digitais. As vantagens das jukeboxes incluem a eliminação do carregamento manual do disco, maior segurança física para os discos ópticos de dados digitais e melhor acesso do usuário. Por outro lado, as desvantagens das jukeboxes incluem custos de aquisição do sistema, manutenção adicional de hardware e acesso mais lento às informações em comparação com a tecnologia de armazenamento magnético.

        As jukeboxes contêm uma ou mais unidades óticas internas, um "selecionador" ou seletor de disco, mecanismo de um número especificado de compartimentos ou slots de armazenamento em disco e controladores de interface de sistema de computador. Alinhamentos mecânicos de jukebox internos precisos são necessários para evitar danos à mídia óptica. Os dados de identificação do disco são lidos durante o carregamento e registrados na memória do controlador. O disco óptico de dados digitais é então transportado para um local de armazenamento ou caixa de jukebox disponível. Ao atender à solicitação de um usuário, o software de banco de dados do sistema de computador corresponde automaticamente a consulta a um local de disco óptico de dados digitais. O mecanismo seletor de disco da jukebox entrega o disco óptico de dados digital solicitado a uma unidade óptica disponível. Após as operações de leitura / gravação de dados, o disco óptico de dados digitais é automaticamente devolvido ao seu compartimento pré-atribuído. Essas etapas operacionais são normalmente invisíveis para os usuários finais.

        Os sistemas Jukebox podem ser obtidos para todos os tamanhos de mídia ótica existentes, embora os formatos de 5,25 e 12 polegadas sejam atualmente os mais procurados. Uma variação da jukebox de tamanho normal é a jukebox de revistas, suportando menos pratos ópticos em cartuchos ou cartuchos removíveis de tipo modular. Esses sistemas podem ser econômicos para aplicações de imagem de pequeno a médio porte. O mecanismo seletor de disco do tipo cartucho é geralmente mais rápido do que uma jukebox de tamanho normal, e o hardware suporta leitura / gravação em ambos os lados da mídia óptica sem a necessidade de virar fisicamente o disco. Embora várias jukeboxes menores possam ser vinculadas ou encadeadas, os aplicativos de agências federais em grande escala ainda devem avaliar as jukeboxes de alto desempenho em tamanho real.

        Outra alternativa concebível para uma jukebox é uma rede de várias unidades autônomas carregadas com discos ópticos de dados digitais em rotação contínua. Essa configuração responde quase imediatamente às solicitações do usuário por informações armazenadas opticamente, limitadas apenas pelo acesso aos dados da unidade óptica e pelas taxas de transferência. As desvantagens dessas configurações de disco dedicado com várias unidades são os maiores custos de aquisição de hardware, espaço físico na sala de computadores e custos mais altos de manutenção de equipamentos.

        Jukeboxes são usados ​​na maioria dos 15 sites de agências federais visitados para este relatório. Um exemplo é o Patent and Trademark Office, que emprega uma série de jukeboxes para armazenar imagens de 300 dpi para atender às necessidades de impressão da agência, aumentadas com drives de disco de acesso rápido que armazenam imagens de 150 dpi. Em comparação, a Commodity Futures Trading Commission tem demandas de referência mais baixas e, conseqüentemente, instalou um autochanger de disco óptico de magazine multicartridge. Em vez de obter uma jukebox, o sistema de documentos capturados do Exército usou com sucesso uma configuração de torre multidrive para discos de dados digitais ópticos regraváveis. Os locais visitados que não possuem equipamento de jukebox atribuem essa condição a problemas de aquisição ou restrições de orçamento.

        Ao selecionar uma jukebox de disco digital óptico de dados, considere os seguintes fatores: as necessidades gerais de acesso às informações (pessoal e público), considerações de orçamento e aquisições e requisitos de equipe de operações existentes.

        Detecção e correção de erros

        A tecnologia de disco óptico de dados digitais usa dois métodos para minimizar os erros de gravação e recuperação de dados digitais. O primeiro usa códigos de correção de erros algorítmicos poderosos para detectar e corrigir erros de leitura de dados automaticamente. A segunda técnica emprega software de código de correção de erro para determinar se e quando a utilização de códigos de correção de erro está se aproximando de um ponto crítico. Nesse caso, o setor de dados é regravado automaticamente em outro setor no disco óptico de dados digital, conhecido como área de setor sobressalente.

        Os chips de computador de detecção e correção de erros (EDAC) no subsistema eletrônico da unidade óptica monitoram rotineiramente as informações sobre as taxas de erro não corrigidas brutas e fornecem correção automática. O sistema EDAC também monitora a gravidade da correção necessária. Quando a correção de erros atinge ou excede certos limites, o setor com erro é copiado para outra área e as tabelas apropriadas são atualizadas. Infelizmente, o sistema EDAC da unidade de disco nem sempre fornece aviso prévio de uma operação de cópia iminente para o sistema operacional do computador. Para os usuários, e até mesmo para o próprio sistema de computador, tudo pode parecer normal quando de fato os limites de erro para invocar a cópia automática (realocação) podem ser invocados na próxima operação de leitura. Se a taxa de erro aumentasse repentinamente, como no caso de uma nova mancha na mídia, a disponibilidade de setores sobressalentes para operações de cópia de disco digital óptico de dados poderia ser seriamente afetada. Esta situação pode levar a uma incapacidade permanente de recuperar os dados armazenados opticamente. As informações de status de correção de erros também fornecem uma trilha de auditoria para medir o progresso e o grau de degradação dos dados.

        O Comitê C21 da Associação para Gerenciamento de Informações e Imagens (AIIM) (Aplicativos de disco óptico) está trabalhando com usuários de discos ópticos de dados digitais e fornecedores de unidades para desenvolver um conjunto padronizado de ferramentas para monitorar e relatar erros de mídia ao sistema. Essas ferramentas de relatório e monitoramento de erros de mídia podem ser usadas pelos usuários para monitorar uma possível degradação de dados. Esses esforços levaram ao padrão nacional proposto ANSI / AIIM MS59-199X, intitulado Uso de Monitoramento de Erros de Mídia e Técnicas de Relatório para Verificação das Informações Armazenadas em Discos Ópticos de Dados Digitais. Prever o ponto em que um disco óptico de dados digitais não é mais legível é crítico para que os dados possam ser recopiados a tempo. O padrão ANSI / AIIM MS59 proposto fornece um conjunto de ferramentas de relatório e monitoramento de erros de mídia de disco digital óptico que um usuário ou integrador de sistema pode usar para projetar um utilitário que permitiria ao usuário obter informações de erro de mídia. O Comitê C21 da AIIM também está desenvolvendo um Relatório Técnico que fornecerá diretrizes sobre como usar as ferramentas incluídas no ANSI / AIIM MS59.

        As 15 visitas ao local revelaram que nenhuma informação é fornecida rotineiramente aos administradores do sistema, detalhando até que ponto os mecanismos automatizados de detecção e correção de erros são acionados durante as operações de leitura ou gravação do disco digital óptico de dados. A grande maioria dos administradores de sistema relatou que não tem um entendimento profundo do uso do recurso de detecção de erros fornecido pelo fabricante do equipamento. Nenhuma perda de informação armazenada na mídia ótica foi atribuída aos subsistemas de correção de erros.

        Exigir que o equipamento esteja em conformidade com o padrão nacional proposto ANSI / AIIM MS59-199X, "Uso de Monitoramento de Erros de Mídia e Técnicas de Relatório para Verificação das Informações Armazenadas em Discos Ópticos de Dados Digitais."

        Interface de pequenos sistemas de computador

        A Small Computer Systems Interface (SCSI) é um dos mais importantes desenvolvimentos de componentes de sistema nos últimos anos. O SCSI é a principal interface de comunicação usada em sistemas de disco óptico de dados digitais. O comitê do American National Standards Institute (ANSI) X3T9.2 desenvolveu a interface paralela inteligente para transferência de informações de e para dispositivos de armazenamento em massa, como fita, disco magnético e unidades de disco óptico. É o principal mecanismo que permite que unidades ópticas e outros dispositivos periféricos de diferentes fabricantes se comuniquem livremente entre si. Embora este padrão seja abrangente, muitos dos fatores de implementação específicos do método de acesso SCSI são de responsabilidade das empresas de integração de sistemas locais. Essa situação resulta em incompatibilidades no nível do software entre as unidades de disco dos diferentes fabricantes.

        O comando "Gravar e verificar" disponível no SCSI é um comando particularmente valioso para avaliar a verificação de erros. Este comando pode ajudar a garantir que dados precisos sejam gravados no disco óptico de dados digitais durante o processo de gravação inicial. Na linguagem SCSI, quando o comando "Gravar e verificar" é invocado, ele requer que o dispositivo de destino (normalmente a placa controladora da unidade óptica) grave os dados transferidos do dispositivo iniciador (normalmente a unidade de processamento central ou CPU) para o meio e em seguida, verifique se os dados estão gravados corretamente. A tecnologia de disco óptico de dados digitais (incluindo a interface SCSI) não se estabilizou a ponto de "tamanho único". A existência de padrões de interface como SCSI-1 e SCSI-2 não significa necessariamente que todas as interfaces SCSI serão compatíveis. Um sistema de armazenamento óptico de massa adequadamente projetado pode superar esse problema incluindo uma capacidade de comunicação de alta velocidade ou uma unidade de fita magnética com software associado.

        Os dados coletados durante as visitas ao local da agência federal indicaram que os detalhes técnicos relativos à implementação do SCSI são geralmente de responsabilidade do integrador de sistemas. Os gerentes de programa podem utilizar sistemas de armazenamento de mídia ótica sem nenhum conhecimento operacional SCSI aprofundado. Nenhuma perda de funcionalidade do sistema foi atribuída a qualquer interface SCSI em uso.

        Especifique o comando SCSI "Write and Verify" ao gravar dados em discos ópticos de dados digitais.

        Exigir que os fabricantes e integradores do sistema forneçam documentação completa sobre a configuração específica do hardware e software SCSI (ou outra interface).

        Compatibilidade com versões anteriores de sistemas ópticos

        Ao contrário dos formatos analógicos de papel ou microfilme, os discos ópticos de dados digitais são codificados digitalmente e não são "legíveis por humanos", necessitando de acesso contínuo a equipamentos de recuperação especializados, portanto, equipamentos de recuperação compatíveis serão necessários enquanto os dados precisarem ser acessados. A obsolescência tecnológica é um grande obstáculo ao acesso aos dados digitais ao longo do tempo. A compatibilidade com versões anteriores minimiza o impacto da obsolescência ao adquirir sistemas de armazenamento de informações novos ou substitutos, garantindo que as informações armazenadas por um sistema de armazenamento digital mais antigo possam ser lidas, convertidas e integradas na nova geração.Como a vida útil da maioria dos componentes do computador é finita, os administradores da agência são responsáveis ​​por transferir os dados digitais para qualquer sistema recém-adquirido.

        As 15 visitas ao local revelaram que os problemas de compatibilidade com versões anteriores não são uma grande preocupação. O Patent and Trademark Office, o primeiro a adotar a tecnologia de armazenamento óptico pesquisado, "migrou" com êxito os dados de imagem de uma geração de disco óptico de dados digitais mais antiga para uma mais nova. Essa migração foi parcialmente realizada pela conversão de um sistema de rede proprietário em um ambiente de sistemas abertos no qual os controladores de unidade mais antigos (quando atualizados) podiam se comunicar com o programa de aplicativos da mesma forma que os sistemas de unidade mais recentes. Depois que as unidades ópticas de próxima geração se tornaram operacionais, foi possível copiar ou carregar as informações armazenadas na mídia mais antiga para a mídia de tecnologia mais recente. Os administradores do programa observaram que a migração de dados bem-sucedida requer planejamento de alto nível e previsão de tecnologia crítica para ser eficaz. Um arquiteto de sistema interno da agência, ou "visionário", é importante para garantir que os processos existentes e de substituição sejam compatíveis.

        Exigir atualizações ou sistemas de substituição para serem compatíveis com os sistemas de informação existentes.

        Converta as informações digitais existentes para o novo formato no momento da atualização ou aquisição do sistema.

        Longevidade de disco óptico de dados digitais

        A longevidade é definida neste relatório como a expectativa de vida útil dos discos ópticos de dados digitais antes da gravação (pré-gravação), mais a vida útil estimada dos dados pós-gravação. A maioria dos fabricantes de discos ópticos de dados digitais garante uma vida útil mínima de pré-gravação de 5 anos, o que é considerado suficiente para a maioria dos programas que empregam controles de estoque de suprimentos. Uma expectativa de vida pós-escrita de pelo menos 20 anos deve ser exigida.

        Embora a Joint Technical Commission (JTC) do IT9-5 Committee of Image Permanence (que é uma organização ANSI credenciada) e a Audio Engineering Society (AES) estejam juntos desenvolvendo padrões para determinar a expectativa de vida (LE) de sistemas de mídia óptica, em no momento não há padrões aprovados para LE. As alegações do fabricante sobre a longevidade do disco óptico de dados digitais, especialmente após a gravação, devem ser analisadas com cuidado. Como os valores extrapolados de expectativa de vida podem variar amplamente como resultado de diferentes suposições, abordagens e metodologias de teste, é especialmente importante determinar a base do processo de teste do fabricante. Esta determinação deve incluir uma avaliação dos dados de fabricação, metodologia de teste, procedimentos de teste e resultados de teste com base nas descobertas descritas no NIST SP-200. A natureza desta análise requer que usuários tecnicamente qualificados avaliem adequadamente os procedimentos de teste, resultados e outros critérios. Idealmente, quaisquer resultados de teste de envelhecimento acelerado anunciados são baseados em testes de áreas específicas (externa, média e interna), em vez de uma leitura média de toda a superfície do disco óptico de dados digitais. Essa questão importante continuará sendo uma preocupação até que uma metodologia de teste de referência padrão em toda a indústria para discos ópticos de dados digitais seja amplamente adotada. Um grupo de trabalho conjunto ANSI e Audio Engineering Society desenvolveu um projeto de padrão que propõe uma metodologia de teste padrão para prever a expectativa de vida da mídia de CD-ROM.

        Durante a pesquisa dos 15 sites da agência, não foram relatados problemas de gravação de dados digitais ou recuperação de informações relacionados à longevidade da mídia óptica. Uma vez que a maioria dos 15 sistemas visitados não foram instalados até 1990 ou mais tarde, não eram esperados problemas de vida útil ou longevidade pós-gravação. Problemas isolados durante a recuperação de informações, se ocorrerem em um estágio inicial, podem ser melhor investigados como defeitos de fabricação (ou lapsos de cuidado ou manuseio) em discos ópticos de dados digitais específicos.

        Além de conduzir uma análise cuidadosa das metodologias e procedimentos de teste de expectativa de vida de mídia de cada fabricante, exigem o uso de discos ópticos de dados digitais com uma vida útil pré-escrita de pelo menos cinco anos.

        Exigem uma vida útil pós-gravação mínima de vinte anos com base nos testes de expectativa de vida de disco óptico de dados digitais do fabricante que estão em conformidade com as descobertas do NIST SP-200.

        Substratos de disco óptico de dados digitais

        O substrato de um disco óptico de dados digitais constitui a base básica da mídia óptica. Substratos ópticos requerem fabricação de precisão usando materiais como policarbonato e vidro temperado. A escolha dos materiais pelo fabricante depende de vários fatores: benefícios de custo, armazenamento de dados, características de longevidade e durabilidade da mídia. As informações registradas em qualquer um desses substratos provavelmente sobreviverão aos componentes de hardware e software do sistema, assumindo que os discos ópticos de dados digitais sejam fabricados de acordo com as especificações estabelecidas e mantidos sob condições de armazenamento ambiental controladas.

        O vidro temperado e o policarbonato foram os materiais de substrato observados em uso nos 15 locais da agência federal pesquisados. Os gerentes de programas federais não parecem considerar as características do substrato da mídia como um fator significativo na seleção do produto. As agências federais geralmente permitem que tais decisões técnicas permaneçam com os fabricantes de mídia individuais. Nenhum problema operacional ou perda de dados diretamente atribuível aos substratos de disco óptico de dados digital foi observado.

        Substratos de disco óptico de dados digitais de policarbonato ou vidro óptico temperado são aceitáveis.

        Ambientes ópticos de armazenamento em disco de dados digitais

        As informações gravadas em discos ópticos de dados digitais não são imunes à degradação de ambientes de armazenamento hostis. A alta umidade relativa pode oxidar as camadas de gravação de um disco óptico digital de dados e prejudicar seriamente a recuperação de informações. Os padrões atuais para ambiente de armazenamento são baseados no armazenamento de mídia magnética ou, mais especificamente, fita magnética. Geralmente as mesmas condições são adequadas para mídia óptica, mas algumas notas de cautela são necessárias. A mídia óptica geralmente não tolera flutuações rápidas de temperatura em amplas faixas. Flutuações de temperatura muito rápidas podem fazer com que algumas mídias ópticas se separem parcialmente, o que, por sua vez, permite que a umidade entre entre as camadas do substrato. Além disso, a mídia óptica deve ter sua temperatura estabilizada antes do uso. A alta umidade também pode promover o crescimento de moldes em superfícies de discos ópticos de dados digitais. Idealmente, a umidade relativa não deve exceder 50 por cento (menor é aceitável), com a temperatura ambiente não superior a 75 graus Fahrenheit. A capacidade de manter condições ambientais estáveis ​​é mais importante do que quaisquer configurações pré-determinadas de temperatura e umidade.

        Os sistemas de disco óptico de dados digitais não devem ser operados, ou os discos individuais armazenados, sob altos níveis de poeira, sujeira ou outras partículas. Isso se aplica a partículas de toner de carbono no ar liberadas por impressoras a laser e copiadoras eletrostáticas. O acúmulo de partículas de poeira nas superfícies da mídia óptica pode reduzir a capacidade do diodo laser de detectar diferenças na refletividade. Se os discos ópticos de dados digitais exigirem limpeza para remover contaminação, como poeira, partículas ou impressões digitais, isso só deve ser feito sob estrita observância das diretrizes do fabricante. Técnicas inadequadas de limpeza de disco podem resultar em danos permanentes à mídia óptica. Se o fabricante da mídia óptica recomendar a limpeza do disco, siga os procedimentos sugeridos pelo fabricante.

        Nem sempre é possível operar sistemas de imagem digital ou armazenar discos ópticos de dados digitais em condições ambientais ideais. Por exemplo, o sistema de documentos capturados do Exército digitalizou registros e armazenou os dados em cartuchos de fita de áudio digital (DAT) sob condições de campo extremamente adversas. Embora os dados da imagem tenham sido devolvidos aos Estados Unidos, a experiência do Exército fornece um exemplo dos extremos sob os quais a tecnologia de imagem digital pode ser utilizada (embora tais extremos não sejam preferíveis).

        O Patent and Trademark Office experimentou uma degradação gradual na capacidade de seu sistema de acessar os dados de imagem armazenados opticamente. Erros de leitura de dados foram diagnosticados e rastreados até partículas de poeira e sujeira nas superfícies da mídia óptica. Uma análise mais aprofundada do problema indicou que a fonte do material particulado eram as impressoras a laser do sistema. Partículas de toner de carbono e poeira de papel geradas durante as operações normais da impressora a laser eventualmente causaram erros de leitura de disco. A realocação das impressoras a laser eliminou o problema.

        Pesquisas relacionadas ao NARA indicam que esse problema de poeira e sujeira também existe em outras tecnologias de base óptica. As unidades de CD-ROM instaladas em áreas não comerciais, como depósitos, oficinas de reparo e locais de construção, são vulneráveis. Nesses ambientes, a limpeza de rotina dos discos e do mecanismo de lente da unidade pode ser necessária. Em qualquer caso, o equipamento óptico deve ser instalado no ambiente mais limpo possível e a manutenção preventiva deve ser realizada de acordo com as recomendações do fabricante do equipamento.

        Os discos ópticos de dados digitais devem ser armazenados em áreas com temperatura ambiente estável e com faixas de umidade relativa compatíveis com o armazenamento de mídia de fita magnética. Evite áreas de armazenamento com umidade excessiva e alta temperatura, e não submeta os discos ópticos de dados digitais a altas temperaturas extremas.

        Se possível, não opere sistemas ou armazene discos ópticos de dados digitais em ambientes com excesso de partículas no ar.

        Os procedimentos de limpeza para discos ópticos de dados digitais devem estar em conformidade estrita com as recomendações do fabricante da mídia.

        Seção 7: Recuperação de informações

        Fornecer aos usuários acesso conveniente e inclusivo à imagem armazenada e aos dados de índice é um objetivo fundamental dos sistemas de armazenamento e recuperação de informações. As agências federais estão reconhecendo as vantagens inerentes da imagem digital e dos sistemas ópticos de armazenamento em disco digital de dados para:

        • Melhorar a preservação de registros originais,
        • Custos mais baixos de armazenamento de documentos e
        • Melhore a recuperação de informações.

        Uma vez que os registros originais em papel estão expostos ao risco de roubo, danos físicos e arquivamento incorreto durante a referência do usuário, as imagens eletrônicas digitalizadas fornecem uma medida extra de controle do documento. Além disso, os custos de armazenamento podem ser reduzidos transferindo os registros originais raramente acessados ​​de espaços de escritórios nobres caros.

        O subsistema de recuperação é o principal ponto de contato do usuário com o sistema ótico de armazenamento em disco digital de dados e, geralmente, é a única conexão que um pesquisador típico tem com o sistema de imagem. É crucial que o componente de interface do usuário do sistema de imagem seja poderoso, mas fácil de entender e ofereça suporte aos requisitos de acesso às informações do pesquisador. A recuperação de informações inclui a pesquisa no banco de dados de índice, a identificação do arquivo de imagem e a criação de uma cópia impressa ou eletrônica (ou seja, exibição na tela) para visualização.

        Dependendo da natureza das operações da agência e da classificação das informações armazenadas, pode ser necessário restringir o acesso às informações armazenadas digitalmente. Essas restrições podem ser instituídas por meio de controles de software do sistema vinculados a senhas ou códigos de identificação de usuário ou ambos. Esses controles podem ser instituídos no local e, no caso de sistemas de imagem com recursos de telecomunicações, externamente. Os administradores do sistema também podem impor restrições físicas, como não permitir que o público em geral tenha acesso pessoal às estações de trabalho do sistema e diferentes níveis de restrições de software, como permitir que certos indivíduos autorizados acessem índices específicos ou dados de imagem. Os controles de software também podem restringir os tipos de operações que usuários específicos podem executar. Assim, um determinado usuário ou grupo de usuários pode ter permissão para acessar certos registros do banco de dados, mas não outros da mesma forma, essas autorizações podem se estender para recuperar informações do banco de dados, mas não a capacidade de editar os dados.

        Para recuperar um arquivo de imagem digital, uma pesquisa de índice deve ser conduzida com base no banco de dados de índice existente. O software de banco de dados é útil para gerenciar índices de arquivo de imagem, contando com campos de dados-chave pesquisáveis ​​com a ajuda de vários operadores de pesquisa booleanos (como AND, OR e NOT) para aumentar o processo de pesquisa. Os resultados de uma pesquisa bem-sucedida (quando pelo menos um arquivo atende aos critérios de pesquisa) geralmente são fornecidos em uma lista de "acertos", com o pesquisador livre para selecionar as imagens desejadas para visualização ou impressão. O pesquisador também pode optar por continuar a refinar o processo de pesquisa usando o software de banco de dados antes de realmente recuperar qualquer uma das imagens armazenadas digitalmente.

        Os sistemas de disco óptico de dados digitais frequentemente utilizam armazenamento temporário em buffer de disco magnético para armazenar imagens localmente. Mediante solicitação do usuário, as imagens digitais são transferidas dos discos ópticos de dados digitais para buffers de armazenamento temporário (primário). As imagens são então enviadas automaticamente para a estação de trabalho local ou para os buffers de armazenamento em cache do servidor de impressão, liberando o subsistema de mídia ótica para aceitar outros pedidos do usuário ou executar outras funções. Para acelerar a resposta aparente do sistema e permitir que os usuários comecem a referência o mais rápido possível, o subsistema de recuperação pode transmitir e exibir a primeira imagem em um arquivo enquanto as outras imagens são subsequentemente transferidas para a estação de trabalho do solicitante. O buffer de cache da estação de trabalho local, que pode ser disco rígido magnético ou armazenamento em memória de acesso aleatório (RAM), fornece um local de armazenamento de imagens para descompactação de imagens e facilita uma resposta mais rápida de "virar a página".

        Uma estação de trabalho habilitada para imagem é definida como qualquer terminal equipado com uma tela de exibição que renderiza uma representação de uma imagem de documento. Uma estação de trabalho de imagem é a principal ferramenta de referência do usuário em um sistema baseado em imagem digital. Uma vez que uma imagem digital pode ser efetivamente exibida e aparecer como um fac-símile do documento original em papel, um sistema de referência sem papel é teoricamente possível. Na realidade, no entanto, muitos usuários ainda solicitarão cópias impressas (se disponíveis), pelo menos até que alcancem um nível de conforto com os monitores do sistema de imagem. A resolução da tela é semelhante à resolução da digitalização, com base no número de linhas que determinam a legibilidade da imagem. Do ponto de vista de aquisição do sistema, conforme aumenta a qualidade de exibição da imagem, o mesmo acontece com a estação de trabalho por custo unitário. Visto que a exibição de imagens na tela pode não ser suficiente para todos os aplicativos, virtualmente todos os sistemas de imagem digital requerem um recurso de saída de cópia impressa. De longe, o equipamento de impressão mais comum é a tecnologia de impressão a laser, utilizando componentes semelhantes aos usados ​​em copiadoras eletrostáticas, o que representa uma tecnologia de imagem digital comprovada e confiável.

        Os sistemas de imagem digital são projetados para responder rapidamente às solicitações de informações do usuário, usando monitores de imagens de alta resolução e impressões a laser. A indústria de armazenamento e recuperação de informações está pesquisando e desenvolvendo tecnologias de exibição e saída de alto desempenho para incluir telas de exibição de tamanho maior com capacidades de resolução mais altas, integração de servidores de fax na rede, impressoras a laser com qualidades de impressão e velocidades de saída mais altas, técnicas de compressão de imagem , sistemas de saída de computador para disco laser (COLD) evoluindo como substitutos para aplicativos de microforma existentes e saída de computador raster de alto desempenho para gravadores de microfilme (COM).

        Estações de trabalho de exibição de imagens. Uma das principais preocupações dos designers de sistema e usuários é determinar o nível exato de resolução de tela adequado para a exibição legível de imagens digitais. Embora os monitores monocromáticos típicos fornecidos com computadores pessoais para exibição de texto sejam de baixo custo, eles não têm resolução suficiente para exibir legivelmente uma imagem digital de um documento de escritório regenerado em tamanho real. Quando esses monitores de baixa resolução são usados ​​para sistemas de imagem digital, a visualização de áreas selecionadas da imagem em modo ampliado ou ampliado deve ser legível.

        Normalmente, as telas de monitor selecionadas para sistemas baseados em imagens têm diâmetro e resolução de tela suficientes para exibir legivelmente um documento de 8,5 por 11 polegadas em tamanho real, o que geralmente requer um mínimo de resolução de exibição de 100 dpi tanto horizontal quanto verticalmente. Dependendo das características dos documentos originais, a resolução da tela de exibição ainda pode exigir ampliações frequentes da imagem para obter legibilidade adequada. Uma resolução de exibição mais alta de 150 dpi tanto horizontal quanto verticalmente é bastante comum em sistemas de imagem e fornece exibição de tela legível do tipo 4 pontos sem a necessidade de ampliar a imagem. Uma vantagem adicional da tecnologia de exibição de maior resolução é a capacidade de exibir dados de caractere (índice e sistema) e dados de imagem simultaneamente.

        Existem vários processos que podem ser aplicados a uma imagem digital para aumentar sua utilidade para os usuários. Na maioria dos casos, as modificações da imagem são temporárias apenas para exibição e não resultam em alterações permanentes nos arquivos de imagem armazenados. As alterações permanentes nas imagens geralmente assumem a forma de edição de imagem que envolve a adição ou remoção de pixels da imagem. Um exemplo de modificação temporária da imagem é o dimensionamento da imagem, processo que se refere ao aumento ou diminuição do tamanho da imagem em relação às dimensões físicas da tela de exibição. Imagens que são muito grandes para serem exibidas completamente na tela podem ser reduzidas usando a redução de pixels, normalmente executada igualmente nas dimensões horizontal e vertical para evitar distorção. Uma técnica para exibir imagens superdimensionadas sem recorrer à redução de pixels usa os recursos de rolagem de imagem e -pan, em que a tela exibe apenas uma parte da imagem por vez. O pesquisador desloca horizontalmente ou rola verticalmente pela imagem usando um dispositivo de mouse ou as teclas do cursor do teclado.

        Também é possível exibir partes selecionadas de imagens digitais em suas resoluções de digitalização originais (por exemplo, 200 dpi) em telas de exibição que não têm essa capacidade de resolução específica. Esta função de exibição é conhecida como ampliação ou zoom da imagem. Por exemplo, se uma imagem foi digitalizada a 200 dpi e exibida em uma tela de 100 dpi, o segmento da imagem seria ampliado por um fator de dois nas dimensões horizontal e vertical. Isso fornece um fator de zoom efetivo de 4: 1 (dimensões x-y) e exibe todos os pixels digitalizados para aquela janela de imagem específica.

        Outro recurso de alteração visual é a capacidade de alternar seletivamente a aparência positiva e negativa das imagens digitais. Ou seja, o pesquisador pode converter do caractere preto normal e formato de tela de fundo branco para um modo de fundo branco sobre preto reverso. Este processo é realizado eletronicamente alterando o pixel digital 1 e 0, e é especialmente útil ao digitalizar de microformas de aparência negativa ou fotostatos antigos. Outro recurso útil de exibição de imagem é a rotação de imagem eletrônica entre as orientações retrato e paisagem, permitindo ao pesquisador girar as imagens usando um número predeterminado ou variável de graus.

        Impressoras de imagens digitais. Praticamente todos os sistemas de imagem digital têm uma capacidade integrada para produzir cópias impressas. A qualidade de impressão a laser é superior a outras tecnologias de impressão, como matricial, jato de tinta e outras.As impressoras a laser são a tecnologia de impressão mais comum para sistemas de imagem, usando um feixe de laser ou outra fonte de luz para criar uma imagem temporária em uma superfície fotossensível. Partículas eletrostáticas de toner são aplicadas a essa imagem temporária e, subsequentemente, transferidas e fundidas por calor em uma folha de papel. Semelhante a scanners e telas de terminal de exibição, a resolução da imagem é um fator crítico de qualidade da imagem de impressão. A grande maioria das impressoras a laser é atualmente baseada na resolução de 300 dpi, enquanto as impressoras a laser mais novas oferecem 400 dpi e resolução superior. Se a resolução da digitalização original corresponder à saída da impressora (ou seja, 300 dpi), a impressão será um processo simples de escala um para um. No entanto, se a resolução da digitalização for diferente, o dimensionamento da imagem digital será necessário para sincronizar com a resolução da impressora. Desenvolvimentos recentes em componentes de controlador de impressora a laser podem melhorar significativamente a qualidade e a resolução de impressão, alterando o tamanho ou a localização dos pontos para reduzir a aparência de linhas em degraus ou recortes, imprimir em resoluções superiores a 300 dpi e imprimir meios-tons verdadeiros .

        Outra consideração é a velocidade da impressora, geralmente expressa em páginas por minuto (ppm). As impressoras de baixo custo são normalmente avaliadas em 7 a 8 páginas por minuto, a faixa média pode chegar a 20 páginas por minuto e as impressoras de alta velocidade podem produzir mais de 100 páginas por minuto. A velocidade da impressora é uma função de muitos fatores inter-relacionados, com o desempenho de armazenamento do buffer de imagem como um problema significativo. Como o equipamento de impressão só pode imprimir os dados digitais de que dispõe, o buffer de imagem pode influenciar a quantidade e a velocidade de processamento do processo de produção de impressão. As impressões de tela são úteis para fornecer a um pesquisador um "instantâneo" do conteúdo da tela de exibição. Os usuários acham esse recurso benéfico ao usar uma tela grande que fornece dados de índice e de imagem simultaneamente. As impressões de tela fornecem um registro unificado da imagem digital e informações de índice relacionadas.

        Software de aplicativos de recuperação. Esse elemento vital dos sistemas de imagem também contribui para melhorar o fluxo de trabalho em processo e a saída de dados. Os processos do sistema de imagem digital controlados por software incluem comunicação de dados, captura de imagem e gerenciamento de fluxo de trabalho, criação de índice e banco de dados e gerenciamento de sistema. O software de fluxo de trabalho do sistema controla todas as fases de captura, rastreamento, roteamento, indexação, recuperação e impressão de imagens de documentos. O software de aprimoramento de imagem permite a manipulação de imagens para melhorar a legibilidade e reduzir o tamanho dos arquivos digitais. O software de exibição de imagens da estação de trabalho permite o controle da imagem para funções como zoom, rotação e rolagem, bem como formatos de tela de várias páginas.

        Os sites da agência federal visitados para este relatório eram geralmente equipados com componentes de recuperação de informações de hardware e software adequados para as aplicações pretendidas. Por exemplo, os sistemas que capturam e exibem imagens de documentos foram equipados com monitores de alta resolução e hardware de impressão, enquanto os sistemas que armazenam dados ASCII requerem componentes de recuperação ligeiramente diferentes.

        Monitores de alta resolução: Doze dos quinze sistemas de agências federais visitados estão digitalizando documentos e visualizando as imagens em monitores de 114 dpi a 150 dpi de resolução. A dimensão predominante da tela é de 19 polegadas (diagonal), fornecendo exibição simultânea de duas imagens digitais lado a lado.

        Exibições de dados de texto: dois dos sistemas visitados que capturam, armazenam e recuperam dados textuais digitais (não-imagem) utilizam terminais de exibição convencionais do tipo de caractere de computador. Os terminais de exibição de imagem de resolução mais alta (e custo mais alto) são desnecessários para essas aplicações.

        Tela em escala de cinza: O Centro Nacional de Informações sobre Terremotos (NEIC) do US Geological Survey utiliza tecnologia de tela com 800 x 1.000 pixels e 256 tons de cinza. Essas estações de trabalho suportam resolução mais alta e exibição de detalhes mais precisos do formato de dados de imagem digital NEIC de 24 bits.

        Impressão a laser: as impressoras a laser foram os dispositivos de saída preferidos para a maioria dos sistemas visitados. A impressão a laser oferece a capacidade de imprimir dados de imagem raster, além de oferecer recursos de fontes múltiplas. Os sistemas não equipados com impressoras a laser utilizam impressoras convencionais do tipo computador de impacto.

        Saída COM: O sistema PERMS do Departamento do Exército oferece várias opções de saída: Todo o registro de pessoal de um soldado (ou partes selecionadas dele) pode ser recriado a partir de discos ópticos de dados digitais usando impressoras a laser, gravador de microficha ou fita magnética. O gravador de microficha PERMS produz filme com resolução de 300 dpi a uma taxa de produção de 60 imagens por minuto.

        Redes locais (LAN): a maioria dos sites visitados utiliza uma rede local (ou ampla) como capacidade de sistema integral. A conectividade da estação de trabalho varia de alguns terminais internamente vinculados ao sistema de imagem a uma grande rede de centenas de estações de trabalho, como a planejada pelo Patent and Trademark Office. Vários dos sistemas apresentam conexões de rede para sistemas de computador de minicomputador ou mainframe para acesso de dados de índice ou distribuição eletrônica de dados de imagem para usuários remotos.

        Redação de imagens: o sistema REDAC do Departamento de Estado permite a revisão online e a edição eletrônica seletiva de imagens de documentos antes do lançamento. O processamento seletivo das imagens eletrônicas permite que a saída do sistema seja ajustada para atender aos requisitos de segurança da informação.

        Realize uma análise abrangente dos requisitos das necessidades de acesso às informações dos usuários finais e um estudo de projeto de sistemas antes de adquirir os componentes do sistema de imagem.

        Seção 8: Política de gestão de informações

        A fim de maximizar os benefícios das tecnologias de armazenamento óptico digital, os administradores de agências federais devem levar em consideração quatro questões de política de gerenciamento de informações significativas: (1) vincular tecnologias de disco óptico de dados digitais com entrega mais eficaz e menos onerosa de serviços aos cidadãos, (2) disposição de registros originais convertidos para o formato digital e armazenados em mídia óptica digital, (3) admissibilidade legal de imagens digitais armazenadas em mídia digital óptica e (4) acesso de longo prazo às informações armazenadas. Os dados coletados durante as visitas às 15 agências federais revelaram várias abordagens diferentes para lidar com essas questões. Embora os administradores da agência não tenham sido especificamente solicitados a avaliar a viabilidade da admissibilidade legal de imagens digitais, há ampla evidência de que a admissibilidade legal é uma questão de considerável preocupação. Geralmente, os administradores da agência não consideram o acesso de longo prazo às informações um problema significativo no momento.

        Custo-eficácia

        A viabilidade de longo prazo de um sistema de armazenamento em disco óptico de dados digital e imagem digital é aprimorada quando o sistema fornece valor visível para o investimento despendido. Em termos dos objetivos da Avaliação de Desempenho Nacional, os sistemas de armazenamento de dados digitais ópticos e de imagem digital podem fornecer serviços de informação aprimorados aos cidadãos a um custo menor. Certamente, o design de sistemas eficazes e a administração do programa devem ser o coração de qualquer sistema de informações de registros de agências federais.

        Um fator chave no desenvolvimento de sistemas eficazes é estabelecer logo no início do processo de design o propósito do sistema de imagem digital ou disco óptico de dados digital proposto e como o sistema fornecerá um serviço melhor a um custo reduzido. Convém que as práticas de informações existentes em papel e as necessidades gerais de informações sejam reexaminadas para identificar quaisquer mudanças necessárias nas práticas operacionais internas, procedimentos ou responsabilidades da equipe. Um sistema de registros em papel mal projetado ou desajeitado tende a ser difícil de manejar quando convertido diretamente para a forma eletrônica, especialmente quando os processos existentes não são avaliados e as alterações não são adotadas.

        Os administradores de agências federais que estão considerando um sistema de imagem digital devem reconhecer que a integração da tecnologia de disco digital óptico de dados não é um paliativo automático para práticas de gerenciamento de registros inadequadas. Se os sistemas de geração de imagens apenas automatizarem os procedimentos de controle de documentos existentes, os problemas e ineficiências operacionais preexistentes persistirão. Os administradores da agência devem estar dispostos a adotar novos processos organizacionais para melhorar significativamente as funções internas da agência que podem ser alcançadas com novas tecnologias. Geralmente conhecida como "reengenharia de processos de negócios", essa abordagem vê a introdução de novas tecnologias como uma oportunidade para reavaliar procedimentos operacionais de escritório preexistentes, maximizar os benefícios do maior acesso às informações e reduzir interrupções administrativas e custos operacionais. Uma meta geral deve ser melhorar a capacidade de resposta de uma agência federal ao seu constituinte, eliminando processos manuais de mão-de-obra intensiva, aprimorando os controles internos de documentos e melhorando os processos organizacionais internos. Qualquer sistema que atenda a essa meta provavelmente permanecerá de valor duradouro.

        As respostas das 15 visitas ao local indicam que os administradores da agência geralmente estão dispostos a considerar a alteração dos procedimentos organizacionais existentes se os benefícios correspondentes parecerem viáveis. As pesquisas mostraram uma diversidade de benefícios, muitas vezes diretamente proporcionais ao nível de comprometimento para passar por uma mudança. Os benefícios obtidos frequentemente dependiam do tamanho e da configuração do sistema de imagem, bem como das expectativas dos administradores da agência e usuários finais. As modificações das áreas de fluxo de trabalho funcional para acomodar os novos sistemas variaram de pequenos ajustes no processamento de registros existentes até o redesenho completo dos processos organizacionais de rotina.

        Por exemplo, a Federal Communications Commission adotou mudanças nos procedimentos da agência no processamento e retenção de registros em papel originais e duplicados. A Biblioteca do Congresso redesenhou as operações em sua Unidade de Arquivo Mestre para capitalizar os benefícios oferecidos pela tecnologia de imagem e percebeu uma melhoria imediata no processamento de entrada mais rápido. Após a integração da imagem, a Agência de Registro de Substâncias Tóxicas e Doenças experimentou uma grande mudança na forma como os cientistas (os principais usuários da agência) conduzem seu trabalho de pesquisa. As melhorias no fluxo de informações eliminaram as atualizações manuais de arquivos em papel, fornecendo acesso aprimorado às informações para a comunidade científica. Os benefícios diretos incluíram o acesso a um banco de dados científico mais eficiente, o que acabou melhorando a resposta da agência de saúde pública aos constituintes.

        A fim de maximizar a viabilidade de longo prazo dos sistemas, desenvolva imagens digitais e aplicativos de disco óptico de dados digitais de maneira econômica.

        Sempre que possível, vincule o projeto do sistema às iniciativas de melhoria do Governo, como a Avaliação Nacional de Desempenho.

        Reexamine os sistemas de registros em papel existentes antes da conversão em sistemas de disco óptico de dados digitais para maximizar a produtividade e melhorar a entrega de serviços de informação.

        Disposição de registros originais

        A disposição de registros federais é regida por regulamentos emitidos pelo National Archives and Records Administration (NARA). Os registros não podem ser destruídos ou descartados sem a autorização do Arquivista dos Estados Unidos. Essa autorização é concedida pela aprovação de um cronograma de disposição de registros ou emissão de um cronograma de registros gerais. A aprovação de programações de disposição de registros e Programações de registros gerais envolve um processo de avaliação para determinar o período de retenção apropriado para os registros. Em geral, entre 3 e 5 por cento dos registros federais são de valor suficiente para merecer retenção permanente nos Arquivos Nacionais. Os registros avaliados pela NARA como temporários podem ser armazenados em qualquer meio, inclusive discos ópticos de dados digitais, que garantem a manutenção das informações até o término do período de retenção autorizado. No entanto, quando os registros em papel avaliados como permanentes são convertidos para outro formato, os registros em papel originais e os registros no novo formato devem ser programados. Nenhum registro permanente convertido em discos ópticos de dados digitais pode ser destruído sem a aprovação do NARA. Em alguns casos, o NARA pode autorizar uma agência a destruir registros permanentes após copiá-los em um disco óptico de dados digital, desde que a agência concorde em converter os registros em um meio aceitável para o NARA no momento da transferência para a custódia legal do NARA.

        Os regulamentos do NARA especificam as condições sob as quais os registros em mídia diferente de papel, como registros em microforma, mídia digital ou eletrônica, podem ser aceitos para transferência para os Arquivos Nacionais. Os Arquivos Nacionais aceitam registros em mídia magnética que estejam em conformidade com os padrões ANSI (fita de rolo aberto de 6250 bpi e fita de cartucho classe 3480) e CD-ROM. Os regulamentos da NARA não cobrem o processo de conversão real. Conseqüentemente, as agências que desejam destruir os registros permanentes após copiá-los em discos ópticos de dados digitais devem enviar uma proposta de cronograma de descarte de registros ao NARA. A agência deve certificar em um Formulário Padrão 115 que os discos ópticos atendem aos requisitos do Boletim NARA 94-4 ou que a agência converterá as imagens do disco óptico em um meio que atenda aos padrões especificados no Subcapítulo B do 36 CFR Capítulo XII antes da transferência para a custódia legal do NARA.

        As 15 agências federais pesquisadas para este relatório adotaram sistemas de imagem digital para processar registros não permanentes e permanentemente valiosos. Os sistemas de imagem digital para registros federais com cronogramas de retenção de mais de 10 anos eram a maioria. Os tipos mais comuns de registros permanentes pesquisados ​​incluem registros de pessoal militar, registros de concessão de terras, arquivos de recuperação de custos ambientais, tribunais legais e documentos normativos e registros de registro de patentes. Por exemplo, os arquivos de protocolo da Federal Communication Communication contêm registros relativos à formulação de regras e questões judiciais e, portanto, são designados para retenção permanente.

        O sistema de imagens REDAC do Departamento de Estado digitaliza as fotocópias que são posteriormente descartadas; no entanto, os documentos originais permanecem em seus sistemas de arquivamento que dão suporte às operações do dia-a-dia. A Agência de Proteção Ambiental normalmente retém seus acervos de registro por 20 anos após a conclusão do litígio de recuperação de custos. Com exceção dos registros do Patent and Trademark Office, onde os originais são retidos em um depósito subterrâneo em Boyers, PA, o custo adicional de também reter os registros originais em papel não pôde ser verificado. No caso do Patent and Trademark Office, outros benefícios substanciais mais do que compensaram o custo de armazenamento dos registros originais.

        Exemplos de registros temporários ou de prazo mais curto (retidos por um período de 1 a 10 anos) incluem formulários padrão (registros de compras e contas), relatórios técnicos, diário e informações periódicas e correspondência geral do escritório. Nesses casos, os sistemas ópticos de armazenamento em disco digital de dados fornecem acesso aprimorado aos arquivos, especialmente quando mais de um departamento ou usuário pode precisar de acesso simultaneamente. Na Biblioteca do Congresso, por exemplo, parte da literatura de periódicos e outras documentações digitalizadas são destruídas após a digitalização, enquanto outras são mantidas por um período provisório (3 anos ou menos).

        Conformidade com a política da NARA em relação à disposição dos registros originais ao converter para um sistema de armazenamento em disco digital óptico de dados.

        Admissibilidade Legal

        Nos últimos anos, tem havido considerável debate e discussão sobre a admissibilidade legal de imagens digitais armazenadas em discos ópticos de dados digitais, especialmente discos usados ​​para armazenar registros federais após o descarte dos registros originais em papel. Uma diretriz emitida pelo Departamento de Justiça (DOJ) em 1992, juntamente com um estudo e recomendações da Association for Information and Image Management (AIIM), chama a atenção para o fato de que a questão-chave não é a mídia de armazenamento, mas sim a integridade da registra-se. Portanto, o relatório do DOJ se refere a "registros eletrônicos" e argumenta que as informações armazenadas em um disco óptico de dados digital "não devem ser tratadas de maneira diferente das informações armazenadas em disco magnético ou fita quanto à sua admissibilidade e confiabilidade". A questão principal para os gerentes de registros federais é familiarizar-se com a forma como as regras de evidências se aplicam a esses registros e garantir que os controles de procedimentos que protegem a integridade dos registros federais estejam em vigor e sejam cumpridos.

        O relatório técnico TR31-1992 da AIIM, "Guia de desempenho para a aceitação legal de registros produzidos por sistemas de tecnologia da informação", baseia-se na diretriz do DOJ, identificando estratégias que devem ser seguidas na criação, armazenamento e manutenção de documentos eletrônicos para garantir a admissibilidade legal. O relatório da AIIM foi elaborado para auxiliar as organizações do Governo Federal e Estadual na promulgação de leis, promulgação de regulamentos e adoção de políticas relacionadas à aceitação legal de registros produzidos por sistemas de tecnologia da informação. Além disso, o relatório fornece orientação em áreas como os tipos de linguagem jurídica e procedimentos organizacionais que devem ser adotados para obter a admissibilidade dos registros em um tribunal. Embora AIIM TR31-1992 seja independente de mídia, na medida em que a orientação é aplicável para microfilme ou armazenamento magnético, as diretrizes de desempenho nele contidas são especialmente relevantes para registros em papel convertidos em imagens digitais.

        AIIM TR31 identifica e discute três questões cruciais que estabelecem a precisão e autenticidade dos registros eletrônicos. Em primeiro lugar, deve-se demonstrar que o sistema utilizado para produzir as informações é capaz de produzir registros precisos e confiáveis. Uma medida dessa capacidade é que os registros são produzidos "como parte de uma atividade conduzida regularmente, como os produzidos no curso normal dos negócios" e são usados ​​para realizar os negócios do dia-a-dia. A segunda questão crucial é que "os procedimentos [escritos] estabelecidos demonstram o que uma organização planeja fazer ao gerenciar e controlar o processo ou sistema - ao contrário do que realmente faz", especialmente quando os registros são modificados, duplicados, convertidos ou destruídos . A terceira questão crucial é o uso de auditorias periódicas para documentar "que o processo ou sistema produz resultados precisos". As diretrizes de desempenho delineadas no relatório da AIIM estão enraizadas em boas práticas de gestão, apoiadas por procedimentos escritos que levam em consideração as três áreas de problemas cruciais anteriores. É importante notar que, de acordo com a regra da melhor evidência, os tribunais federais são mais propensos a aceitar como evidência os registros nos quais as agências se baseavam na condução de seus negócios do dia-a-dia.

        Conforme observado anteriormente neste relatório, o estudo da NARA de 15 aplicativos de agências federais que armazenam imagens de documentos em discos de dados digitais ópticos digitais não identificou especificamente a admissibilidade legal como um problema. Existem várias explicações possíveis que podem explicar essa falta de preocupação. O principal motivo é que muitos dos registros em papel convertidos em imagens digitais eram registros não correntes e provavelmente não seriam objeto de litígio. Em segundo lugar, em vários casos, os registros em papel originais foram retidos como a "cópia de registro", com a consequência de que os registros em papel seriam a "melhor evidência disponível" em qualquer litígio. É claro que essas circunstâncias específicas provavelmente serão encontradas com menos frequência no futuro.

        Familiarize-se com a forma como as regras de evidências se aplicam aos registros federais e assegure-se de que os controles de procedimentos que protegem sua integridade estejam em vigor e sejam cumpridos.

        Implementar as recomendações previstas no AIIM TR31, Partes I e II, aplicáveis ​​a projetos de agências que utilizem tecnologias de imagem digital e armazenamento em disco óptico de dados digitais, seja na conversão de documentos em papel para formato digital, seja na sua criação inicial em formato digital.

        Acesso de longo prazo

        As tecnologias de imagem digital e armazenamento em disco óptico de dados digitais estão evoluindo rapidamente. Ambas as áreas são marcadas por um desenvolvimento quase contínuo de novas abordagens para converter, armazenar e recuperar informações. Garantir o acesso de longo prazo a registros de valor duradouro armazenados em sistemas de disco óptico de dados digital é mais do que uma questão de qualidade de imagem, funcionalidade do sistema e estabilidade da mídia. A adoção de imagens e armazenamento em disco óptico de dados digitais exige um compromisso da agência com uma evolução tecnológica que ela não controla. Conseqüentemente, as necessidades de longo prazo dos usuários do sistema não serão atendidas meramente por uma decisão organizacional de adquirir tecnologia de disco óptico de dados digitais. As agências do governo federal que usam a tecnologia de disco digital óptico de dados para o armazenamento e recuperação de registros necessários para mais do que a vida útil de um sistema de 7 a 10 anos devem tomar medidas para garantir que as informações permaneçam acessíveis no futuro.

        A importância do planejamento para obsolescência tecnológica e recuperação de desastres, e a necessidade de migrar dados sob essas condições adversas devem ser reconhecidas pela alta administração. Um plano coeso ajudará a evitar ser oprimido pela incerteza e desperdiçar recursos valiosos em um jogo perpétuo de atualização tecnológica. Os administradores de agências federais que adotam a tecnologia de disco óptico de dados digitais também devem continuar monitorando o plano de tendências tecnológicas para manutenção sistemática, atualização e eventual migração para tecnologias mais recentes e, em geral, agir com responsabilidade para garantir que a qualidade, integridade e valor de informações importantes da agência sejam preservado.

        Desenvolva um plano de migração de dados e recuperação de desastres para toda a agência bem antes de tal evento para o sistema de imagem digital e armazenamento em disco digital óptico de dados.

        Obstáculos ao acesso

        A viabilidade de longo prazo dos sistemas de armazenamento em disco digital óptico e de imagem digital é limitada por sua incapacidade atual de reter conteúdo, contexto e funcionalidade ao longo do tempo. Essas limitações são motivadas principalmente por três considerações:

        • Instabilidade do vendedor
        • Expectativa de vida do disco óptico de dados digitais
        • Obsolescência do sistema (hardware ou software)

        Instabilidade do fornecedor. É da natureza do comportamento fabricante-fornecedor que os benefícios de curto prazo para o cliente tenham precedência sobre as necessidades de longo prazo, embora claramente definidas. Portanto, os administradores de sistema devem avaliar cuidadosamente a viabilidade dos fornecedores ao adquirir sistemas ópticos que obviamente dependem de fornecedores ou fabricantes específicos. Uma situação em que um fornecedor de sistema fecha o negócio ou retira abruptamente a manutenção pode resultar na perda de suporte de software e a operação contínua de um sistema pode ser prejudicada. Para minimizar esses riscos, existem dois sinais de aviso de obsolescência iminente aos quais os gerentes devem estar alertas: (1) quando os fabricantes anunciam a interrupção de um determinado produto ou linha de produtos ou (2) quando o fabricante ou fornecedor anuncia o fim do suporte de manutenção. Em qualquer circunstância, os gerentes devem fazer planos imediatos para migrar o aplicativo de registros para um novo sistema de armazenamento.

        Algumas agências federais estão explorando a opção de colocar códigos de software de aplicativos de computador proprietários e fabricantes em um local seguro e acessível em caso de falha corporativa. Os fornecedores podem, por exemplo, ser solicitados a depositar em um banco ou instalação semelhante uma cópia dos códigos do aplicativo de software de computador. A administração da agência federal teria acesso e propriedade do código do software de computador no caso de reorganização ou dissolução da empresa.

        No caso de surgirem sinais de alerta de obsolescência iminente, os gerentes devem fazer planos imediatos para migrar o aplicativo para um novo sistema.

        Exigir que os fornecedores depositem uma cópia dos códigos de software do aplicativo do sistema de computador e a documentação associada em um banco, arquivos ou instalação de registros seguros em caso de falha comercial.

        Expectativa de vida da mídia / transferência de dados e backups. A expectativa de vida da mídia é baseada em testes de envelhecimento acelerado que são apenas um indicador geral e não necessariamente um preditor da expectativa de vida de discos ópticos de dados digitais individuais. Portanto, os administradores da agência não devem confiar exclusivamente em uma expectativa de vida prevista para determinar quando copiar para uma nova mídia. A verificação periódica da degradação do disco obtida por meio de informações sobre a detecção de erros e a atividade de correção de erros é essencial.

        A combinação da expectativa de vida da mídia projetada com a verificação periódica da degradação do disco óptico de dados digitais é útil para identificar quando recopiar a mídia, mas não oferece solução para uma catástrofe natural ou causada pelo homem. A criação de uma cópia duplicada das informações, de preferência armazenada em um local externo, fornece a melhor proteção no caso de tal catástrofe. Uma abordagem possível para obter uma cópia de backup é gravar os dados em dois discos ópticos de dados digitais simultaneamente no momento da criação. Sem dúvida, essa duplicação acarretaria um custo maior e poderia degradar o desempenho geral do sistema. Uma segunda alternativa é copiar as informações para uma mídia de armazenamento magnético de alta densidade e econômica. Uma terceira alternativa, a retenção dos registros originais em papel ou a criação de uma cópia em microfilme das informações, minimizaria os problemas de obsolescência da tecnologia.

        Recopie os dados armazenados em discos ópticos de dados digitais com base nas informações obtidas por meio da verificação periódica da degradação da mídia.

        Crie uma cópia de backup das informações armazenadas em discos ópticos de dados digitais para retenção em uma instalação externa, usando a mídia de armazenamento apropriada (óptica, magnética, papel ou microfilme) que melhor atenda aos requisitos da agência.

        Obsolescência do sistema. Os discos ópticos de dados digitais são muito mais duráveis ​​e estáveis ​​do que o hardware e o software necessários para manter o acesso. Todas as tecnologias em rápida evolução, incluindo imagens digitais e sistemas de armazenamento em disco óptico de dados digitais, tornam aplicativos específicos obsoletos em um ritmo assustador. A alta tecnologia impõe um processo de atualização sem fim para aqueles que são responsáveis ​​por manter o acesso às informações. Arquivistas, gerentes de registros e administradores de programas devem presumir que o acesso contínuo aos dados armazenados em discos ópticos de dados digitais pode exigir algum grau de atualização do sistema. A atualização requer planejamento e orçamento a partir do ponto em que o sistema original é adquirido.

        Os sistemas de informação da agência federal que armazenam registros ou outros dados digitais com valor de longo prazo devem ser capazes de transferir dados para as gerações futuras de tecnologia. A capacidade de garantir a atualização do sistema e a capacidade de transferência de dados a um custo mínimo envolve compensações entre vários fatores, incluindo segurança do sistema, desempenho do sistema e eficiência de armazenamento. Conforme observado em outra parte deste relatório, a adesão aos padrões internacionais que garantem a compatibilidade com versões anteriores entre as gerações de tecnologia nova e velha é uma ferramenta eficaz para combater a obsolescência do sistema. Levará vários anos, entretanto, antes que todos esses padrões sejam implementados, e é possível que os fornecedores optem por não criar compatibilidade retroativa com alguns dos sistemas atuais. Nesse caso, pode ser necessário que a agência assuma a responsabilidade direta pela transferência de dados. Conseqüentemente, é importante que as agências recebam a documentação técnica completa dos componentes do sistema, software aplicativo e sistemas operacionais. Os requisitos mínimos de documentação incluem:

        • Um manual do administrador de sistemas de hardware, especificando configurações de hardware padrão (incluindo cabeamento) e outras configurações especializadas (ou seja, comunicações de dados)
        • Documentação de aplicativos de software dos desenvolvedores apropriados (ou seja, manuais do usuário, documentação de design e manuais de manutenção)
        • Procedimentos operacionais específicos do aplicativo para digitalizar imagens, indexar e verificar a precisão dos termos de índice e da qualidade da imagem e salvaguardas para evitar adulteração ou uso não autorizado.

        Especifique que o fornecedor forneça um conjunto completo de documentação, incluindo código-fonte com diagramas de fluxo, código-objeto, operações e manuais de manutenção como uma entrega contratual.

        Reveja e revise periodicamente a documentação do sistema para garantir que todas as modificações e melhorias subsequentes do sistema sejam adequadamente descritas.

        Estratégias de migração

        É responsabilidade dos administradores, arquivistas e gerentes de registros da agência que trabalham juntos, em vez de fornecedores e fabricantes, garantir o acesso de longo prazo aos registros que estão sujeitos à obsolescência da tecnologia. Cumprir essa responsabilidade envolve um continuum de ações já analisadas nesta seção. Em última análise, no entanto, uma estratégia explícita para a migração de sistemas ópticos de disco digital de dados para sucessivas gerações tecnológicas ainda indefinidas deve ser adotada e seguida de forma consistente. Existem pelo menos três abordagens para gerenciar esse continuum:

        • Atualização seletiva de equipamentos e cópia programada de disco óptico digital de dados
        • Recopiação de atacado dos dados, com base nas informações sobre a possível degradação dos dados obtidas usando ferramentas que testam periodicamente a mídia para verificar a integridade dos dados
        • Transferência de dados para uma geração totalmente nova de tecnologia da informação.

        A primeira abordagem é um processo contínuo de manutenção da funcionalidade do sistema por meio de atualizações seletivas de equipamentos à medida que a tecnologia evolui, combinada com a recopia sistemática programada de dados conforme necessário. A vantagem dessa abordagem é a oportunidade de trabalhar com fornecedores e fabricantes estabelecidos à medida que suas linhas de produtos evoluem para aproveitar os avanços tecnológicos mais recentes. Em um mercado em rápida evolução, essa abordagem incorre no mínimo de risco. As desvantagens são os custos de atualização contínua de equipamentos e recopias periódicas de dados, além da dependência da estabilidade e do compromisso do fabricante com a atualização, em vez da substituição no atacado do equipamento existente do cliente. Em um mercado em rápida evolução, nenhum desses fatores é certo.

        A segunda abordagem envolve uma recópia completa dos dados em uma programação periódica vinculada às informações sobre possíveis erros de mídia obtidos pela verificação periódica da degradação do disco, mas independente da vida útil esperada do sistema. Essa estratégia pressupõe que a compatibilidade de hardware e software é um problema "incontrolável" que depende mais da dinâmica do mercado do que das necessidades da comunidade de gerenciamento de arquivos e registros. A vantagem dessa abordagem é que ela concentra as energias dos administradores de sistemas na proteção da integridade dos dados. A desvantagem é o risco de que a suposição de compatibilidade de sistemas futuros seja incorreta.

        A terceira abordagem envolve a transferência de imagem óptica e dados de índice de uma geração quase obsoleta para uma geração emergente, em alguns casos contornando uma que está começando a se tornar obsoleta. Em certo sentido, essa estratégia "salta" da tecnologia óptica à beira de perder sua utilidade para a tecnologia de ponta, que pode ou não utilizar mídia de armazenamento em disco digital óptico de dados. A principal vantagem dessa estratégia é o tempo que ela ganha para os administradores de sistemas, enquanto a indústria de disco óptico digital se acomoda em uma rotina de desenvolvimento mais previsível ou é substituída por tecnologias ainda não desenvolvidas. A estratégia exige que os fabricantes de sistemas garantam a "compatibilidade com versões anteriores", que é a capacidade de um novo equipamento funcionar de maneira semelhante ao equipamento que substitui, além de suas novas e diferentes capacidades. A adoção da estratégia de salto exige que os administradores de sistemas monitorem de perto as tendências e não tenham fé cega na viabilidade futura de qualquer tecnologia.

        Em vez de adquirir inicialmente um grande sistema integrado, as agências federais podem optar por instalar um protótipo ou sistema de pesquisa para ganhar experiência com tecnologias de imagem digital e disco óptico de dados digitais. Esta abordagem permite a experimentação em condições operacionais, sem incorrer no risco e despesa de uma aquisição de sistema principal. Os sistemas protótipos também permitem testar conceitos de design, adquirir informações dos usuários do sistema e ajudar a demonstrar a viabilidade tecnológica e validar as capacidades operacionais. No entanto, os administradores da agência federal precisam estar cientes de vários fatores, incluindo as dificuldades inerentes envolvidas na expansão de um sistema único ou protótipo de capacidade limitada para uma configuração de produção completa, problemas de obsolescência de tecnologia de componente de sistema e desafios na migração as informações armazenadas digitalmente de um sistema de protótipo para um sistema de escala maior sucessivo.

        Atualize o equipamento conforme a tecnologia evolui e copie novamente os discos ópticos de dados digitais conforme necessário. Ou copie novamente os discos ópticos de dados digitais com base na verificação periódica. Ou Transfira dados de uma geração quase obsoleta de discos ópticos de dados digitais para uma geração emergente, em alguns casos contornando a geração intermediária que está madura, mas corre o risco de se tornar obsoleta.

        Padrões de Tecnologia da Informação

        A base sobre a qual repousam as abordagens de gerenciamento anteriores é a adesão aos padrões de tecnologia não proprietária. Os padrões não proprietários minimizam e, em alguns casos, talvez eliminem, a troca de dados e as incompatibilidades do computador. Embora esses padrões inevitavelmente devam mudar à medida que a tecnologia evolui, eles fornecem um mínimo de estabilidade em meio a mudanças rápidas. Conseqüentemente, seu uso aumenta a probabilidade de que as informações armazenadas em um determinado sistema óptico de armazenamento de imagens digitais ainda possam ser lidas, recuperadas e inteligíveis no futuro. Inquestionavelmente, as configurações do sistema proprietário podem criar sérios impedimentos para o acesso de longo prazo aos registros armazenados em discos ópticos de dados digitais. Portanto, os administradores devem exigir uma arquitetura de sistemas abertos que utilize produtos que estejam em conformidade com os padrões não proprietários para sistemas de aplicação de disco óptico de dados digitais. Se essa estratégia não for possível, o fornecedor deve ser solicitado a fornecer uma "ponte" para os sistemas que estão em conformidade com os padrões não proprietários.

        O Apêndice B deste relatório resume os padrões não proprietários atuais e emergentes que os administradores de sistemas devem incorporar às estratégias de migração de tecnologia da agência federal. Uma estratégia de migração de tecnologia viável e agressiva é essencial, uma vez que é improvável que a legibilidade, recuperabilidade e inteligibilidade de dados de imagem óptica em sistemas possam ser mantidas ao longo do tempo sem a participação ativa de todas as partes interessadas. O principal desafio para os administradores de agências responsáveis ​​pelo gerenciamento de sistemas ópticos de dados digitais nos próximos anos é garantir que a estratégia de migração de tecnologia:

        • Leva em consideração as tendências do ambiente tecnológico
        • Usa padrões de tecnologia não proprietária existentes e emergentes e apóia o desenvolvimento contínuo de padrões de intercâmbio de dados
        • Adota medidas de preservação prudentes nesse ínterim

        A adoção da tecnologia de disco óptico digital de dados por uma agência governamental é uma decisão importante que acarreta responsabilidades que vão muito além da aquisição do hardware e software originais. Somente com um planejamento cuidadoso, a viabilidade de longo prazo dos sistemas de armazenamento óptico de dados digitais e imagens digitais pode ser garantida.

        Monitore regularmente as tendências no ambiente tecnológico que estão em conformidade com os padrões de sistemas abertos.

        Especifique os padrões de tecnologia não proprietária existentes e emergentes no projeto do sistema. Sempre que possível, os componentes do sistema devem estar em conformidade com práticas não proprietárias ou comumente aceitas.

        Avalie a possível degradação de dados das informações armazenadas em discos ópticos de dados digitais e a funcionalidade do sistema regularmente usando ferramentas de monitoramento e relatório de erros de mídia descritas em padrões propostos e em evolução, como ANSI / AIIM MS59-199X.

        Apoiar o desenvolvimento contínuo de padrões não proprietários para troca de dados e interoperabilidade.

        O nome deste escritório foi alterado para Equipe de Pesquisa de Tecnologia em 1992 como parte de uma reorganização geral do NARA.

        Disco óptico é um termo genérico que inclui tecnologias analógicas e digitais. O link comum é a metodologia óptica usada para ler / gravar as informações em diversos formatos, como discos ópticos de dados digitais, fitas ópticas, discos de vídeo e CD-ROM. O termo disco óptico de dados digitais aparece extensivamente neste relatório para descrever a forma de mídia de disco óptico usada para armazenar dados digitais.

        National Archives and Records Administration e National Association of Government Archives and Records Administrators, "Digital Imaging and Optical Media Storage Systems: Guidelines for State and Local Government Agencies", dezembro de 1991.

        Perguntas sobre esta política ou solicitações de informações sobre os boletins NARA atualmente em vigor podem ser dirigidas aos Arquivos Nacionais em College Park, Office of Record Administration, Agency Services Division (NIA), 8601 Adelphi Road, College Park, MD 20740, 301-713 -6677.

        National Institute of Standards and Technology, "Development of a Testing Methodology to Predict Optical Disk Life Expectancy Values," NIST Special Publication 500-200, 1991.

        Yvonne Kidd, "Federal Imaging in 1993: Electronic Imaging Comes of Age & # 150 Part I," Inform (março de 1993): 14 & # 15027 "Federal Imaging in 1993: Electronic Imaging Comes of Age & # 150Part II," Inform (junho de 1993 ): 36 e # 15040.

        Mais informações sobre as políticas e boletins da NARA atualmente em vigor podem ser obtidas entrando em contato com o Office of Record Administration, Agency Services Division (NIA), 8601 Adelphi Road, College Park, MD 20740, 301-713-6677.

        National Archives and Records Administration, "Optical Digital Image Storage System", março de 1991. Para obter informações adicionais sobre este projeto, entre em contato com o Diretor, Padrões e Serviços Técnicos, Associação para Gerenciamento de Informações e Imagens, 1100 Wayne Avenue, Suite 1100, Silver Spring, MD 20910.

        Consulte também American National Standards Institute and Association for Information and Image Management, ANSI / AIIM MS52-1991, "Práticas recomendadas para os requisitos e características de documentos originais pretendidos para digitalização óptica", 1991.

        Association for Information and Image Management, AIIM TR25-1990, "The Use of Optical Disks for Public Records", 1990.

        Association for Information and Image Management, AIIM TR25-1990, "The Use of Optical Disks for Public Records", 1990.

        Para obter uma definição do conceito de valor intrínseco, consulte National Archives and Records Administration, "Intrinsic Value in Archival Material", Staff Information Paper 21, Washington, DC, 1982.

        O rascunho do padrão internacional será conhecido como ISO 12087. O trabalho neste padrão está avançando em um bom ritmo e a aprovação é esperada em 1994.

        National Archives and Records Administration, "Optical Digital Image Storage System", março de 1991.

        Adaptado dos EUAGeneral Services Administration, "Applying Technology to Record Systems: A Media Guideline", maio de 1993. As capacidades de armazenamento em disco digital óptico de dados listadas refletem o estado da arte no momento da publicação deste relatório de estratégias e estão sujeitas a alterações.

        A soma total indica mais do que 15 agências originalmente visitadas devido a vários sites usando mais de um formato de disco óptico de dados digitais.

        A expectativa de vida pós-gravação não deve ser considerada exclusivamente para determinar quando recopiar os dados em discos ópticos de dados digitais.

        O Grupo de Trabalho concluiu um rascunho de metodologia de teste para prever a expectativa de vida da mídia de CD-ROM e prevê que voltará sua atenção para o desenvolvimento de uma metodologia de teste para mídia regravável, particularmente magneto-óptica. Posteriormente, o Grupo de Trabalho se concentrará em uma metodologia de teste para a mídia WORM. Essas prioridades refletem o que é percebido como sendo as preocupações do mercado, especialmente da perspectiva dos fornecedores.

        Um projeto do Instituto Nacional de Padrões e Tecnologia (NIST) financiado pelos Arquivos Nacionais está atualmente pesquisando questões críticas no cuidado, manuseio e armazenamento de discos ópticos de dados digitais.

        National Archives and Records Administration, "Optical Digital Image Storage System", março de 1991.

        Association for Information and Image Management, AIIM TR25-1990, "The Use of Optical Disks for Public Records", 1990.

        Vice-presidente Al Gore, "Da Burocracia aos Resultados: Criando um Governo que Funciona Melhor e Custa Menos: Relatório da Revisão de Desempenho Nacional", 7 de setembro de 1993.

        Informações adicionais sobre a política ou boletins NARA atualmente em vigor estão disponíveis nos Arquivos Nacionais em College Park, Office of Record Administration, Agency Services Division (NIA), 8601 Adelphi Road, College Park, MD 20740, 301-713-6677.

        A maioria desses registros data dos séculos 18 e 19 e é provável que tenham um valor intrínseco que impede sua eliminação após a conversão para imagens digitais.

        Muitos desses registros datam do início do século 19 e têm valor intrínseco.

        Departamento de Justiça dos EUA, Divisão de Gestão da Justiça, "Admissibility of Electronically Filed Federal Records as Evidence", Washington, DC, 1991.

        TR31-1992 Parte 1: Guia de Desempenho para Admissibilidade de Registros Produzidos por Sistemas de Tecnologia da Informação como Prova, e TR31-1993 Parte 2: Aceitação de Registros Produzidos por Sistemas de Tecnologia da Informação por Agências Federais ou Estaduais (relatórios publicados) Parte 3: Diretrizes do Usuário, e Parte 4: Modelo de Regra e Modelo de Lei (relatórios preliminares).

        Association for Information and Image Management, "Diretrizes de Desempenho para a Aceitação Legal de Registros Produzidos por Sistemas de Tecnologia da Informação," Parte I, "Diretrizes de Desempenho para a Admissibilidade de Registros Produzidos por Sistemas de Tecnologia da Informação como Prova," Silver Spring, MD, 1992, p. 10

        Cartuchos de um quarto de polegada (QIC), fitas magnéticas de 8 mm e 4 mm são baratos, assim como as próprias unidades de fita. A capacidade de armazenamento varia de 3 a 6 gigabytes. Suas principais desvantagens são as taxas de transferência de dados lentas, que nominalmente são de cerca de 1 gigabyte por hora, e uma expectativa de vida projetada de cerca de 10 anos.

        Mais detalhes que descrevem a abordagem do NARA para o desenvolvimento e adoção de padrões para gerenciamento de registros eletrônicos e arquivos são fornecidos em: "Uma Estratégia de Arquivos Nacionais para o Desenvolvimento e Implementação de Padrões para a Criação, Transferência, Acesso e Armazenamento de Longo Prazo de Registros Eletrônicos do Governo Federal, "Technical Information Paper No. 8, June 1990.

        Esta página foi revisada pela última vez em 15 de agosto de 2016.
        Contate-nos com perguntas ou comentários.


        Introdução

        Os recifes de coral estão entre os ecossistemas mais diversos e complexos do mundo e fornecem valiosos serviços de ecossistema (Moberg e Folke 1999). Os recifes de coral em todo o mundo estão experimentando um aumento de estressores globais, de eventos de branqueamento em massa mais frequentes e graves (Berkelmans et al. 2004 Hughes et al. 2017), bem como um conjunto de estressores antropogênicos locais. É essencial desenvolver métodos de avaliação das comunidades de recifes de coral em amplas áreas geográficas para apoiar ações de gestão urgentes, sem as restrições de tempo e altos custos associados com no local pesquisas de campo. O sensoriamento remoto foi utilizado pela primeira vez para estudar ecossistemas de recifes de coral quando o sensor multiespectral Landsat foi aplicado na década de 1970 (Smith et al. 1975). Desde a primeira aplicação de sensoriamento remoto em um ambiente de recife de coral, a tecnologia e os recursos dos sensores remotos progrediram significativamente e estão se tornando cada vez mais importantes para o mapeamento, monitoramento e compreensão dos sistemas marinhos globais.

        Mapear e identificar habitats estruturalmente complexos que representam importantes pontos críticos de biodiversidade têm implicações de gestão significativas para as comunidades costeiras que dependem dos muitos serviços fornecidos por populações saudáveis ​​de peixes de recife (por exemplo, pesca, segurança alimentar, turismo, cultura, etc.). O recente advento da tecnologia de sensoriamento remoto que fornece a capacidade de incorporar a estrutura de habitat vertical mostra-se promissora para o avanço da análise ecológica da paisagem (Turner 2005). LiDAR (detecção e variação de luz) é um sensor remoto ativo que permite a quantificação e análise espacial de habitats estruturalmente complexos (Lefsky et al. 2002). LiDAR foi aplicado no ambiente marinho para mapear a estrutura do recife de coral (Storlazzi et al. 2003), medir a complexidade do habitat do recife (Brock et al. 2004) e também demonstrar fortes relações preditivas com várias medidas da estrutura da assembleia de peixes (Casamento e Friedlander 2008 Wedding et al. 2008).

        Dados de sensoriamento remoto podem informar mapas preditivos e modelos de assembléias de peixes de recife que destacam habitats críticos de alto valor de conservação e representam uma etapa essencial no planejamento de conservação, zoneamento oceânico e avaliação de reserva marinha (Pittman et al. 2007b Mellin et al. 2009). Os dois principais tipos de dados de sensoriamento remoto utilizados na modelagem preditiva são (1) mapas categóricos bidimensionais [2D] (por exemplo, mapas de habitat bentônicos) e (2) superfícies tridimensionais [3D] continuamente variáveis ​​(por exemplo, modelos digitais de elevação ) A maioria dos estudos de modelagem preditiva foi conduzida usando variáveis ​​ambientais baseadas em mapas categóricos 2D do ambiente marinho (Kendall et al. 2003 Pittman et al. 2004, 2007a). Até recentemente, isso limitou a ecologia da paisagem marinha a uma ciência bidimensional focada na padronização espacial de superfícies planas, o que representa uma simplificação excessiva da verdadeira variabilidade na complexidade estrutural que existe na natureza (Lausch et al. 2015). No entanto, houve uma mudança em direção à aplicação de superfícies 3D continuamente variáveis ​​para derivar variáveis ​​ambientais que caracterizaram a complexidade física para apoiar a modelagem preditiva (Pittman et al. 2009 Knudby et al. 2010 Darling et al. 2017 Stamoulis et al. 2018).

        Mudar de mapas categóricos 2D para morfometria de superfície 3D, que incorporam estrutura vertical e complexidade de habitat, mostra uma grande promessa para o avanço da quantificação de padrões de paisagem (Turner 2005 McGarigal & Cushman 2005 Pittman et al. 2009 Wedding et al. 2011). Compreender o mundo de uma perspectiva 3D oferece um grande potencial para avançar nosso conhecimento dos padrões e processos da paisagem (Davies e Asner 2014) e pode expandir nossa compreensão da relação entre os organismos e a geometria da paisagem marinha. Pittman et al. (2007b) utilizaram dados 2D e 3D para explicar as respostas da fauna à estrutura da paisagem marinha e descobriram que, quando a complexidade topográfica 3D em escala fina foi integrada com as métricas da paisagem marinha 2D, ela se tornou o melhor preditor individual. Isso indica que um modelo integrado de paisagem marinha 2D e 3D (modelo patch-mosaico-continuum) captura mais da heterogeneidade ecologicamente significativa da paisagem marinha (Pittman et al. 2007b). Há uma necessidade de avaliar modelos integrados de paisagem marinha 2D e 3D para determinar se esses modelos suportam modelagem preditiva mais robusta de comunidades de peixes quando comparados à abordagem clássica baseada em métricas 2D. Aqui, formulamos a hipótese de que covariáveis ​​tridimensionais derivadas de LiDAR suportam modelagem espacial preditiva mais robusta da estrutura da assembléia de peixes de recife de coral quando acoplada a modelos que usam variáveis ​​ambientais 2D derivadas de mapas de habitat bentônicos. Para testar essa hipótese, aplicamos modelos estatísticos que contêm conjuntos de covariáveis ​​2D e 3D e os comparamos com modelos com apenas covariáveis ​​2D e apenas covariáveis ​​3D.


        INTRODUÇÃO

        Um dos objetivos finais nas ciências biológicas é relacionar o genótipo ao fenótipo. Embora os últimos anos tenham gerado uma infinidade de sequências genômicas, a quantificação sistemática de fenótipos complexos em organismos multicelulares, como aqueles relacionados ao crescimento e desenvolvimento, continua sendo um enorme desafio. A planta modelo Arabidopsis thaliana é altamente adequado para quantificação de características relacionadas ao crescimento, uma vez que o crescimento ocorre continuamente ao longo da vida do organismo. É suscetível a abordagens transgênicas altamente eficientes (Lloyd et al., 1986 Clough e Bent, 1998), tem grandes coleções de mutantes (Alonso et al., 2003) e muitas cepas isogênicas de origem geográfica diversa (acessos) que são sequenciadas ou densamente genotipados estão disponíveis para a comunidade (Horton et al., 2012), fornecendo uma caixa de ferramentas poderosa para estudar relações de genótipo para fenótipo (Atwell et al., 2010). Em particular, o Arabidopsis root é um modelo que promete facilitar a compreensão de nível de sistema das relações genótipo-a-fenótipo devido a uma coleção única de recursos genômicos funcionais no nível dos tipos de células e para várias condições de crescimento (Brady et al., 2007, 2011 Dinneny et al., 2008 Iyer-Pascuzzi et al., 2011 Breakfield et al., 2012 (Petricka et al., 2012). O que é necessário atualmente é a capacidade de avaliar com precisão os fenótipos de raízes de grandes populações de raízes geneticamente distintas, a fim de quantificar sistematicamente as consequências fenotípicas de diferentes genótipos. No entanto, embora as características de crescimento da raiz tenham sido quantificadas em muitos laboratórios, as ferramentas de fenotipagem disponíveis não são ideais para a quantificação das características da raiz de grandes populações. Uma limitação é que a produção de imagens de alta qualidade é tecnologicamente desafiadora e geralmente requer investimentos significativos. Além disso, embora exista um conjunto diversificado de soluções de software para extrair computacionalmente características de tais imagens (para uma coleção abrangente, consulte http://www.plant-image-analysis.org/), a maioria dos softwares de análise de raiz existentes requer entrada do usuário interativo, impedindo assim a capacidade de aumentar a escala e, portanto, limitando o número de raízes que podem ser quantificadas. O que está faltando para tornar as análises de crescimento de raiz de alto rendimento amplamente tratáveis ​​são ferramentas eficientes, fáceis de usar e de baixo custo para adquirir dados de imagem de raiz de alta qualidade emparelhados com ferramentas de processamento e análise de imagem amplamente automatizadas.

        Desenvolvemos um sistema de fenotipagem de baixo custo para Arabidopsis raízes que permitem a aquisição e processamento escalonáveis ​​de imagens, bem como o armazenamento de informações posicionais de genótipos de plantas e a anotação automática de vários genótipos por placa, e que podem ser facilmente configurados em outros laboratórios. Aqui, descrevemos sua configuração e avaliamos seu desempenho para produzir e processar um grande conjunto de dados, bem como sua robustez para diferentes condições de crescimento. Além disso, mostramos sua utilidade realizando o mapeamento de associação do genoma (GWA) em todas as características quantificadas por um período de 5 dias. Finalmente, avaliamos o papel biológico do gene candidato exibindo a associação mais significativa para uma característica da taxa de crescimento da raiz. Nós descobrimos que a perturbação genética deste gene sensor de cálcio resulta em alterações significativas no crescimento da raiz e fornecem evidências para um significado adaptativo da variação alélica neste locus para o crescimento em ambientes costeiros.


        Impressoras não profissionais, como jato de tinta, laser e outras impressoras comuns, podem imprimir melhor imagens com pelo menos 200 a 300 ppi ou mais. Para imagens que precisam apenas de uma & quot boa aparência & quot, 200 ppi funcionará. Recomenda-se que as impressões fotográficas tenham pelo menos 300 ppi. Imagens para impressão de pôster em grande formato podem ter cerca de 150-300 ppi, dependendo de quão perto a imagem será visualizada. *

        As imagens da tela são diferentes das imagens para impressão porque devemos pensar nas dimensões em pixels de monitores, TVs, projetores ou monitores, em vez de PPI. Use PPI para imagens impressas, mas as dimensões de pixel da imagem são o que realmente determinam o tamanho da imagem e a qualidade de como ela será exibida na web ou nos dispositivos.

        Há muitos anos a ideia é que as imagens sejam salvas com uma resolução de 72 PPI. . Mas o equívoco comum é que essa resolução ou valor PPI é o fator decisivo da qualidade da imagem para imagens da web, onde na verdade se trata de dimensões de pixel (http://medialoot.com/blog/high-resolution-web/).

        Cada monitor é diferente e tem uma resolução diferente, o que torna difícil projetar um site que contenha imagens que serão exibidas perfeitamente em todos os tipos de tela. Com o passar dos anos, a tecnologia melhorou, assim como a qualidade de nossos monitores. Os mais populares são os novos monitores de retina da Apple que estão nos Macbooks, iPhones e iPads mais recentes.


        DISCUSSÃO

        A determinação do volume 3-D de PilQ tem uma série de implicações importantes para os processos de secreção em geral e para o mecanismo de biogênese de Tfp em particular. Trabalhos anteriores estabeleceram que os complexos de secretina purificados formam canais de condutância bloqueados quando reconstituídos em membranas lipídicas (3, 27, 31). A estrutura apresentada aqui estabeleceria uma explicação estrutural para este fenômeno, fornecendo evidências para um & # x0201cplug & # x0201d ou constrição no canal que está previsto para percorrer a membrana externa. É claramente vantajoso para a célula bacteriana regular a acessibilidade das subunidades de pilina a PilQ, uma vez que esta secretina é expressa constitutivamente em níveis elevados (50) e um canal de 6,5 nm aberto persistentemente permitiria que proteínas periplasmáticas e outras moléculas periplasmáticas valiosas se difundissem para longe de a célula. Uma limitação da estrutura atual é que ela não atribui as faces externas ou internas do complexo. Presumimos que a boca aberta da cavidade está voltada para fora da célula porque ela precisa abrigar a Tfp à medida que é extrudada, mas não há evidência direta para essa suposição nos dados apresentados aqui. Se este for realmente o caso, isso sugeriria que a extremidade comprimida do canal fica no lado periplasmático da membrana externa. Esta é uma proposta atraente porque permitiria a esta região de PilQ interagir com outras proteínas da biogênese Tfp do periplasma e da membrana interna.

        Também é tentador especular sobre como a PilQ pode interagir com o crescimento ou retração da fibra Tfp. A estrutura apresentada aqui sugere duas possibilidades. A primeira é que a montagem da fibra do pilus ocorre fora da cavidade PilQ e que a fibra é extrudada através da proteína em sua forma intacta. Para que isso aconteça, as dimensões da cavidade precisariam se expandir marginalmente, possivelmente por meio de uma mudança conformacional induzida por interações de PilQ com outros componentes proteicos, e a região P precisaria de & # x0201cunfurl. & # X0201d A segunda possibilidade é que o local da formação do pilus está na verdade dentro da própria cavidade PilQ e que as subunidades individuais do pilin são liberadas ou removidas desse local, dependendo das atividades relativas de montagem de Tfp ou proteínas de retração, como PilT. Não é possível, com base nesses dados estruturais, distinguir entre esses modelos alternativos, embora seja interessante que ambos requeiram um grau substancial de flexibilidade conformacional da região P da molécula. É importante ressaltar, como ressalva, que os resultados aqui apresentados foram obtidos a partir de proteína purificada solubilizada em detergente e que a extração de PilQ da membrana meningocócica e a remoção de outros componentes proteicos podem afetar a conformação ou estrutura da proteína. Outra questão importante é a posição da membrana externa: novamente, isso é impossível de discernir a partir dessas observações sobre o material solubilizado em detergente, embora o tamanho e a morfologia da região R sugiram que esta porção poderia conter as porções que abrangem a membrana do complexo .

        Nossa estrutura de PilQ pode ser comparada às estruturas de baixa resolução de dois outros complexos de secretina. As observações de varredura de transmissão EM de duas orientações do canal do fago filamentoso pIV mostraram que o complexo formou um conjunto cilíndrico de 12 a 14 monômeros (26). Mais recentemente, a estrutura do multímero pIV foi determinada para uma resolução de 22 - & # x000c5 por crio-EM (34). O complexo pIV exibe 14 vezes, em vez de 12 vezes, simetria rotacional e forma uma estrutura semelhante a um barril. O canal através da molécula está bloqueado, como é o caso com PilQ, mas em uma porção central do poro, ao invés de em uma extremidade. Outra secretina que foi estudada com algum detalhe é o complexo PulD-PulS de K. oxytoca (31). Os resultados mostraram um complexo cilíndrico assimétrico composto por 12 monômeros com altura de 19 nm e diâmetro de 25,8 nm. Em torno da periferia do complexo 12 densidades radiais separadas foram observadas: essas características foram propostas para se originar do conjunto de secretina da lipoproteína PulS. A cavidade central era grande em diâmetro (& # x0223c7,5 a 8,0 nm) e aparentemente contínua em todo o complexo, embora houvesse evidências bioquímicas de que o canal era fechado (31). Outras observações de PulD-PulS em coloração negativa mostraram uma visão lateral do complexo, em uma organização dimérica com simetria de pseudo-espelho (32). Dado que PulD e PilQ exibem homologia apenas dentro dos domínios C-terminais de seus genes, é possível que algumas dessas diferenças estruturais sejam atribuíveis a variações na estrutura da metade N-terminal de cada proteína.

        Ao fornecer novas informações sobre a cavidade dos poros, a estrutura PilQ apresentada aqui representa um primeiro passo para a compreensão da estrutura do aparelho biossintético Tfp. Existem muitos aspectos intrigantes dessa complexa máquina molecular, e não menos dos quais são as questões sobre como a extrusão do pilus é regulada e como o processo de extensão é revertido para retração. Claramente, os estudos 3-D fornecem uma contribuição significativa para explicar esses fenômenos.