El proyecto de digitalización

 

Motivación

 

El archivo de placas del observatorio de Hamburg ha juntado alrededor de 45000 placas fotográficas tomadas desde el primero de diciembre de 1911 y hasta finales del siglo pasado. Este archivo de placas ha sido escasamente utilizado hasta ahora debido a la ausencia de la posibilidad de búsqueda de meta-datos.

 La digitalización regular de placas fotográficas comenzó en 1984 tras la instalación de un densitómetro microscópico PDS G1010 con el que fueron digitalizadas todas las placas del survey de cuásares de Hamburg (HQS por Hamburg-Quasar Survey) y el survey de Hamburg-ESO (HES por Hamburg-ESO-Survey).

 Casi todas las placas tomadas antes de esta fecha nunca fueron ni digitalizadas, ni analizadas digitalmente. Hasta ahora una completa digitalización parecía imposible debido a la enorme cantidad de datos disponibles (alrededor de 20 TB) y a la larga duración del escaneado.

 Las placas fotográficas son hasta hoy el medio de almacenamiento más duradero (más de 100 años aunque con calidad decreciente) en comparación con los 10 años de los soportes digitales actuales, si uno incluye la vida útil de los dispositivos de lectura actuales.

 Sin embargo, hay muy buenas razones para comenzar con la digitalización hoy (- degradación, + favorable):

 1- Las placas más viejas muestran efectos de envejecimiento de la emulsión a altas densidades. Debido a un almacenamiento y embalaje inapropiado, la emulsión fue desprendiéndose y algunas placas están infestadas de moho. Además, las emulsiones son sensibles a rasguños y al polvo.

 2- El número de personas que utilizan placas fotográficas decrece rápidamente. Esto significa que el interés científico en las placas disminuye, aunque cada placa sea una observación única, especialmente interesante para objetos que muestran variaciones de brillo o de posición en el cielo.

 3+ Los costos de los escáners y los medios de almacenamiento están decreciendo continuamente.

 4+ El almacenamiento a largo plazo de los datos digitales parece hoy posible a costos aceptables.

 5+ El acceso a datos a través de internet es posible debido al aumento continuo del ancho de banda.

 Hay tres grupos de personas que presentan intereses científico por los datos:

 

Investigación astronómica: las series de placas digitalizadas del mismo campo ofrecen la posibilidad de buscar objetos a través de software especializado. Muchas placas fueron tomadas para analizar solamente un objeto, y el resto de los objetos presentes en el campo fueron en su momento descartados o no analizados. La digitalización de las placas cubrirá todos los objetos dentro de su campo, sin pérdida de información. Cambios drásticos en objetos estelares como novas o supernovas, o variaciones en la órbita de objetos del sistema solar, harán que inmediatamente crezca el interés en estas observaciones.

 Historia de la ciencia: la colección de placas en conjunto con la información escrita en las bitácoras de observación, muestran un siglo de investigación astronómica, y cuentan la historia de las observaciones, sus problemas, y las muchas ideas nuevas que mejoraron su calidad. La posibilidad de que el Observatorio de Hamburgo se convierta en Patrimonio de la Humanidad de la UNESCO incrementará el interés público en los datos.

 Astronomía aficionada: los datos de libre acceso serán un tesoro para miles de astrónomos aficionados que pueden observar hoy los mismos objetos con telescopios más pequeños pero con detectores CCD más sensibles.

 La combinación de un banco de datos y un servidor web que mostrará toda la información disponible en alta y baja resolución del escaneado de las placas, así como de las fundas y de las páginas de la bitácora de observaciones facilitará la búsqueda y el uso de los datos almacenados en estas placas.

 

 Método y catálogo

 

En un proyecto piloto, más de 3500 placas fueron escaneadas y se desarrolló además la presentación en páginas web de esta información.

 El escáner elegido fue el Epson Expression 10000 XL, que puede medir densidades de hasta 3.8. El tamaño de píxel de 10.6 micras da una resolución razonable de 2400 dpi, que es similar a la de escaneados con una PDS. El rango de densidades es ligeramente más pequeño que el de una PDS, aunque es suficiente para las placas históricas. La única desventaja es la inexactitud en la posición de la dirección de escaneado, la cual se mejora con un segundo escaneado después de rotar la placa 90 grados. Este segundo escaneo sería solamente necesario para aquellas placas fotográficas cuya finalidad fuera realizar astrometría. Otras ventajas de este escáner son el autofoco y la calibración automática. Asimismo, la ventaja más importante es el corto tiempo necesario para realizar el escaneado, que permite que se escaneen alrededor de 10 pulgadas en unos 7 minutos. Con una PDS se necesitaría más de 7 horas.

 El tiempo total del escaneado de las placas, bitácora de observaciones y fundas de las placas le llevarían a una sola persona alrededor de 10 años. El uso de varios escáners y más personal para el escaneado disminuiría este número a unos pocos años.

 Un problema a la hora de catalogar las placas es la gran variedad de telescopios, cámaras y tamaños de placas que fueron utilizados. La estructura de directorios utilizada es la siguiente:

 Escaneado / fotografía directa / telescopio / tamaño de placa / [ jpegs | x-scans | y-scans ]
                  / espectro               / telescopio / tamaño de placa / [ jpegs | x-scans | y-scans ]

 en donde los nombres de los archivos son creados mediante 2 caracteres correspondientes a las iniciales de los telescopios y 5 números. Escaneados de baja resolución (.jpeg) son hechos a color si hay información escrita en la superficie libre de emulsión de la placa. En los otros casos los ficheros JPEGs de baja resolución son creados directamente a partir de los datos de 16 bits de escala de grises correspondientes a los escaneados de alta resolución. Éstos serán guardados en formato FITS, el cual es habitualmente utilizado por la comunidad astronómica.

 Una ordenador de escaneado guardará los datos temporalmente en un disco local. Después de adaptar los datos al formato adecuado, estos son almacenados en dos sistemas Raid, uno de ellos como copia de seguridad. Adicionalmente, los datos son guardados en una biblioteca de cintas en la universidad para asegurar su almacenamiento a largo plazo. Los costes de almacenamiento irán decreciendo con el tiempo, ya que cada par de años se puede almacenar el doble de datos por el mismo coste.

 Utilizando las bitácoras de observaciones y las fundas de las placas, se crean los meta-datos, que serán utilizados para la búsqueda en la base de datos. Además del número de la placa, se recopila diversa información, como por ejemplo la posición del centro de la placa, el nombre del objeto, el día y la hora de observación, el tiempo de exposición, las condiciones del cielo, el filtro o el prisma objetivo.

 El catálogo es ordenado primero por el tipo de telescopio según sus propiedades, por ejemplo si las placas fueron tomadas con el telescopio refractor, astrográfico, con espejo o tipo Schmidt, ya que el tipo de telescopio se traduce directamente en diferencias de la calidad de las placas fotográficas, como la coma en el espejo parabólico, donde solamente el centro de la placa es utilizable.

 El link de cada telescopio muestra tablas de los meda-data, en donde uno puede buscar por objetos, coordenadas, etc. Tras el nombre de cada placa se encuentra una página web que muestra una imagen de la placa fotográfica, la funda de la placa y la bitácora de observaciones, junto con un link para acceder a la misma imagen pero con mayor resolución y en formato .FITS.

La imagen en baja resolución sirve para comprobar la calidad de la placa, antes de acceder al fichero FITS. Éstos ficheros tiene unos tamaños de 400 MB para placas de 13x18, 1 GB para placas de 24x24 y 1.5 GB para placas de 30x30. Otra opción posible es acceder a la bitácora de observaciones dentro de un rango de tiempo determinado.

 

Enlaces e identificación

 

En la mayor parte de los casos el numero de placa es usado para identificar las placas y las fundas. Sin embargo hay excepciones, como p.ej. las placas del Gran-Refractor. En este caso existen varias series con números de placa
que comienzan con "1". Estas placas fueron ordenadas de forma cronológica y las letras en minúsculas sustituyen los ceros a la izquierda. Asimismo, no todas las bitácoras de los observatores están disponibles para este telescopio, y por tanto sólo se puede usar la información disponible en la placa o en la funda. En algunos casos excepcionales incluso falta la fecha o el nombre del objeto.

Aún más compleja es la identificación de las placas espectrales del telescopio reflector de 1 metro. El nombre de las placas de este telescopio tienen como abreviatura del telescopio sólo la letra "S". Sin embargo, para las placas espectrales la abreviatura son dos letras, p.ej. "DS" o "KS". Como la última de estas abreviaturas fue usada como acrónimo del telescopio reflector Schmidt pequeño ("Kleiner Schmidtspiegel") estas identificaciones fueron permutadas (o sea KS pasó a ser SK y DS pasó a ser SD), donde S se entiende como el acrónimo del telescopio y la segunda letra designa la serie. Esto no es lo deseable, pero no se puede hacer de otra manera ya que el enlace de todos los datos es automático y la denominación de todas las placas tiene que ser inconfundible.

En el caso de que las páginas de la bitácora o las fundas no contengan información alguna, estas son omitidas.

Las bitácoras son el registro de las placas, comparable con los metadatos de hoy en día. Estas fueron escritos a mano, aunque muchas veces no por el observador. Para tablas preimpresas, la línea que corresponde a la placa, fue cortada y enlazada a la página web. Si esto no fue posible, sólo la página completa fue enlazada.

 

Comentarios generales de las placas fotográficas

 

Las placas fotográficas no son medios digitales y tras la digitalización no serán lineales con respecto al ennegrecimiento. Antaño se usaron placas de calibración con puntos o franjas (para
los espectros) con razones de brillos conocidos, parcialmente incluso directamente sobre las fotoplacas. Sin estas, la calibración de brillo de las placas era imposible. Hoy en día es factible calibrar las placas con posterioridad, usando catálogos disponibles online de estrellas con brillo y gradiente de color conocido.

 

Errores

 

Todos las entradas de datos pueden contener errores, a pesar de una inspección cuidadosa. Presentando toda la información escrita a mano, así como los metadatos, siempre es posible revisar su exactitud. En el caso de se encuentre alguna discrepancia o incorrección, por favor comuníquelo por correo electrónico al responsable del proyecto.