Leitura

Scripts para ler as informações dos metadados contidos nos arquivos de imagem

As informações dos metadados lidas devem gerar uma saída tabular adequada para ser carregada em uma tabela do banco de dados.

1. Arquivos JPEG
Fonte:
getimgmeta.sh
Descrição:
Este script chama o programa ExifTool para ler as meta informações dos arquivos JPEG armazenados no diretório atual e em seus subdiretórios;
A saída é direcionada para stdout;
Produz uma saída no formato tabular (opção -table), com valores de data/hora no formato “YYYY-MM-DD H:M:S” (opção -dateFormat) e coordenadas GPS com seis casas decimais (opção -coordFormat).
Resultado:
Para criar um arquivo usando a saída produzida pelo script, é necessário redirecionar sua saída;
Isso é feito usando o símbolo de redirecionamento ‘>’;
Por exemplo:

$ getimgmeta.sh > SeagateBackupPlusDrive.tsv

Correções:
Para evitar erros quando os dados são carregados na tabela, é necessário fazer algumas correções no arquivo gerado:
a) Caracteres inválidos
Caracteres diferentes dos caracteres UTF-8 válidos (Latin1 ou outra página de código) devem ser removidos do arquivo;
Para fazer isso, foi usado o utilitário iconv;
Por exemplo:

$ iconv -c --from-code=utf8 --to-code=utf8 --output=SeagateBackupPlusDriveUTF8.tsv SeagateBackupPlusDrive.tsv
$ ls -lt *.tsv
-rw-r--r-- 1 halley halley 60456660 fev 16 05:51 SeagateBackupPlusDriveUTF8.tsv  (tamanho dois bytes menor)
-rw-rw-r-- 1 halley halley 60456662 fev 16 04:42 SeagateBackupPlusDrive.tsv

b) Correções de erros
Algumas correções adicionais devem ser feitas nos dados antes de carregá-los no banco de dados, especialmente nos casos em que o programa ExifTool não colocou o hífen nos valores inexistentes;
Para fazer isso, foi usado o utilitário sed;
Por exemplo:

$ sed 's/jpg\t\t\t-\timage/jpg\t-\t-\t-\timage/g' <SeagateBackupPlusDriveUTF8.tsv >SeagateBackupPlusDriveUTF8sed.tsv

2. Arquivos XMP do programa Darktable
Fonte:
getdtxmp.py
Descrição:
Arquivos XMP são arquivos secundários de metadados (sidecars) que acompanham os arquivos RAW. Eles são uma maneira padrão de salvar as edições sem alterar o arquivo RAW original. (Corel);
O Darktable armazena quaisquer metadados recém-adicionados, tags e parâmetros de operações de imagem (a “pilha histórica”) em arquivos .xmp separados, os chamados sidecars. (Sidecar files);
Este programa extrai informações desses arquivos XMP e grava no arquivo dtxmp.tsv.
3. Arquivos Canon Raw
Fonte:
getcr2meta.sh
Descrição:
Este script chama o programa ExifTool para ler as meta informações nos arquivos .CR2 armazenados no diretório atual e em seus subdiretórios;
A saída é direcionada para stdout e tem o mesmo formato dos arquivos JPEG acima.
Resultado:
Para criar um arquivo usando a saída produzida pelo script, é necessário redirecionar sua saída;
Isso é feito usando o símbolo de redirecionamento ‘>’;
Por exemplo:

$ getcr2meta.sh > canonraw.tsv

Correções:
Algumas correções adicionais devem ser feitas nos dados antes de carregá-los no banco de dados, especialmente nos casos em que o programa ExifTool não colocou o hífen nos valores inexistentes ou colocou Unknown (nnn) no lugar do valor;
Para fazer isso, foi usado o utilitário sed;
Por exemplo:

$ sed -i -e 's/Unknown ([0-9]*)/-/g' -e 's/\t\t/\t-\t/g' canonraw.tsv

← Anterior Topo ↑ Próxima →