Tecnologias aplicadas [...] / 11ª e 12ª aulas, 11 de Maio

20 05 2011

ksPD – Kit de Sensibilização à Preservação Digital. O paradigma da computação em nuvem. As exigências levantadas pelos Arquivos Electrónicos: persistência de formatos e tecnologias, segurança de sistemas de informação, preservação de suportes de informação, auditoria em sistemas de informação. Condições de preservação e segurança – o caso extremo dos data havens. O futuro – um panorama de mudança.

Slides das 11ª  e 12ª aulas





Tecnologias aplicadas [...] / 10ª aula, 4 de Maio

20 05 2011

Condições de preservação de informação. Guia prático para destruir suportes de armazenamento de informação. As soluções relacionadas com a existência e continuidade de um arquivo electrónico.

Slides da 10ª aula





Tecnologias aplicadas [...] / 9ª aula, 27 de Abril

20 05 2011

Manutenção de formatos de codificação e armazenamento de informação. Que formatos para quê? – adequação de formatos ao uso que lhes é dado. A importância transversal dos backups (cópias de segurança).

Slides da 9ª aula





Tecnologias aplicadas [...] / 8ª aula, 13 de Abril

28 04 2011

Limitações  no acesso à informação. O papel das tecnologias de Gestão Digital de Direitos de acesso (DRM – Digital Rights Management). Exemplos conhecidos e polémicos. Exemplos ridículos (DVD e Blu-ray). Discussão sobre direitos de autor.

Slides da 8ª aula





Tecnologias aplicadas [...] / 7ª aula, 6 de Abril

28 04 2011

Considerações sobre imagens estáticas e imagens em movimento (enquanto formatos de armazenamento). Ficheiros de som. (Alguns dos) problemas levantados pelo correio electrónico.

Slides da 7ª aula





Tecnologias aplicadas [...] / 6ª aula, 30 de Março

8 04 2011

Tipos de informação (codificação digital de som, contentores multi-formato, descrições de conteúdo, outros). Tipos mais comuns de informação. Considerações variadas sobre as imagens de natureza estática.

Slides da 6ª aula





Tecnologias aplicadas [...] / 5ª aula, 23 de Março

8 04 2011

Áreas de incidência da tecnologia nos arquivos. Armazenamento de informação. Tipos de informação (textual ou numérica, bases de dados, imagens estáticas, imagens em movimento).

Slides da 5ª aula





Tecnologias Aplicadas [...] / 4ª aula, 16 de Março

7 04 2011

As grandes funções dos arquivos. Técnicas e tecnologias. A relação arquivo / tecnologia. A relação humanos / tecnologias.

Slides da 4ª aula





Tecnologias Aplicadas [...] / 3ª aula, 2 de Março

3 03 2011

Mais conceitos. Considerações sobre a utilização de computadores nos arquivos. Os arquivos perante a utilização de tecnologias – de que forma elas podem ser utilizadas, áreas de incidência.

Slides da 3ª aula





Tecnologias Aplicadas [...] / 2ª aula, 16 de Fevereiro

21 02 2011

Alguns conceitos associados ao uso de tecnologias nos Arquivos (ainda que a um nível muito fundamental e genérico).

 

Documento / Documento electrónico / Formato digital / Preservação digital

Qualquer linha de discurso que seja levada a cabo sobre arquivos, tenha ou não tenha um cariz tecnológico, envolve inevitavelmente ter que lidar com vários conceitos. Aquele que é basilar (não só nesta área como em várias outras) é o de documento: o que é um documento?

As definições abundam, por vezes com algumas disparidades entre si. Dada a importância fundamental do tema, trata-se de algo que tem vindo a ser discutido (e definido) desde há muitas décadas:

  • Objectos como documentos [Paul Otlet, 1934].
  • Documento como qualquer fonte de informação, de natureza material, passível de ser utilizada para referência, estudo ou como fonte de autoridade [International Institute of Intellectual Co-operation, 1937].
  • Documento como a prova que suporta um facto [Suzanne Briet, 1951], definição que acabava por incluir desde objectos físicos a seres vivos, dependendo do contexto em que se encontravam.
  • Documento como um repositório da expressão de um pensamento [Donker Duyvis, 1942].
  • Documento como um pensamento embebido em papel ou noutro material, apropriado à manipulação física, transportável no espaço e preservável no tempo [Indian Standards Institute, 1963].
  • Documento como um «veículo de significados» – serve um propósito mas também serve para comunicar informação [Roland Barthes, 1988].

(Todas estas definições foram extraídas de Buckland, 1997)

A definição do ICA (International Council on Archives) é mais completa, pelo menos ao falar de «documento de arquivo»:

“Informação registada, produzida ou recebida no início, condução ou conclusão de uma actividade individual ou organizacional, e que compreende suficiente conteúdo, contexto e estrutura para fazer prova dessa actividade”  (International Council on Archives, 2005)

Simplificando a questão, temos o contraponto entre uma versão resumida, que equaciona um documento a um conjunto «informação num suporte» e uma versão mais elaborada que envolve conteúdo, contexto e estrutura. Fazer esta definição abarcar o âmbito electrónico (como em «documento electrónico» ou «documento de arquivo electrónico»), envolve considerar etapas como a produção, armazenamento, manipulação e reprodução, aplicadas a um documento através de meios informáticos.

Quando a nossa atenção se desloca para os meios informáticos, há que considerar outros conceitos. Falamos em «formato digital» para designar um conjunto de regras de codificação de informação, que a converte de forma a ficar com uma natureza numérica e assim poder ser processada computacionalmente. Isto é válido para qualquer tipo de informação original - quer se trate de texto, de imagem, de som, de vídeo ou de qualquer outra representação. Os meios informáticos actuais são, por natureza, digitais, isto é, lidam com valores numéricos descontínuos. No apontamento anterior já falámos em bits e bytes, bem como nas unidades daí derivadas. Elas servem para agrupar os valores numéricos nos quais se transforma toda a informação processada por computador. Veja-se a seguinte imagem:

Este programa, denominado Disk Investigator, permite ter uma visão aprofundada do conteúdo de um suporte de armazenamento, de uma forma que os interfaces habituais (gestores de ficheiros e afins) não conseguem transmitir. A totalidade do conteúdo de um disco rígido pode ser vista byte a byte. As três colunas com sombreados coloridos representam outras tantas formas de ver o mesmo conteúdo: na primeira coluna são apresentados valores em notação hexadecimal (o destaque a preto identifica o primeiro byte do disco), na segunda coluna a sua representação enquanto caracteres do código ASCII e na terceira coluna o valor decimal que lhes é atribuído. As cores identificam o mesmo bloco de informação nas três formas de representação: a palavra NTFS (abreviatura de NT File System, o sistema de ficheiros no qual este disco em particular foi formatado). A representação que mais se aproxima da verdadeira natureza do que está no disco, é a da coluna da direita, numérica. Na coluna do meio surge a interpretação mais adequada para nós, humanos.

O sistema operativo e restantes aplicações instaladas actuam sobre estes amontoados de valores, transformando-os visualmente em realidades palpáveis para nós. A visualização numérica de informação pouco ou nada nos diz (mesmo quando há meta-informação embebida, como é o caso da imagem seguinte):

Quando o Disk Investigator é utilizado para navegar no conteúdo de um disco, pode facilmente mostrar ficheiros de formas alternativas. Na imagem anterior estão a ser mostrados os primeiros bytes que compõem uma fotografia digital. Nada nos diz explicitamente de que formato se trata, a não ser alguns elementos de meta-informação (por exemplo, o sombrado azul identifica a sequência de bytes que contém a marca da câmara fotográfica utilizada – Panasonic). Só que estes também só são úteis quando o seu significado é conhecido.

Quando o segmento do disco onde estes valores se encontram é «observado» através de um qualquer programa de visualização de imagens, vemos algo que já é palpável para nós:

Cada tipo de informação que seja humanamente concebível e por nós interpretável, pode ser de alguma forma digitalizado. Os passos lógicos seguintes são o seu armazenamento, a sua preservação e a sua reprodução. As principais dificuldades incidem sobre acções ou sensações em relação às quais ainda não há tecnologia [completamente] à altura – armazenar e reproduzir um aroma, um gosto, um gesto, uma sensação táctil. O que existe nestas áreas ainda não se destina ao consumo alargado.

Foi em atenção a estas características da informação com existência e validade em ambientes informáticos que se tornou inevitável começar a falar de «preservação digital»:

“Designa-se, assim, por preservação digital o conjunto de actividades ou processos responsáveis por garantir o acesso continuado a longo-prazo à informação e restante património cultural existente em formatos digitais”
(Ferreira, 2006)

A importância destas actividades é evidente. Não se trata apenas de preservar os conteúdos no abstracto, trata-se de garantir também as condições técnicas para que isso possa ser feito. A preservação para a posteridade de uma sala cheia de papel também exige o recurso a determinadas técnicas e tecnologias associadas à conservação de espécies físicas. Abordagem idêntica tem que ser aplicada a todas as camadas que suportam a existência de conteúdos digitais:

suportes de armazenamento
hardware para lhes aceder
arquitectura informática que enquadre esse hardware
sistema operativo para mantenha vivo todo este equipamento
software para aceder a esses suportes
software para descodificar e apresentar, mantendo o significado original,
o conteúdo dos suportes de armazenamento

 

Cada uma destas camadas adiciona um pouco mais de complexidade às operações que contempla. Se a última operação for a de apresentação de conteúdos (com significado), ela só vai resultar se todas as outras também funcionarem. Veremos mais tarde como algumas delas levantam problemas diabólicos no que à preservação ao longo do tempo diz respeito.

 

Slides da 2ª aula








Seguir

Get every new post delivered to your Inbox.