<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=974250883405448&amp;ev=PageView&amp;noscript=1">
Luces en la oscuridad. Búsqueda de inteligencia con Machine Learning

Machine Learning & Deep Learning

,

Rhinno

Luces en la oscuridad. Búsqueda de inteligencia con Machine Learning

Yoel González | dic 30, 2021

“Mira ese punto. Eso es aquí. Ese es nuestro hogar. Eso somos nosotros. En él, todos los que amas, todos los que conoces, todos de los que alguna vez escuchaste, cada ser humano que ha existido vivió su vida. La suma de todas nuestras alegrías y sufrimientos, miles de religiones seguras de sí mismas, ideologías y doctrinas económicas, cada cazador y recolector, cada héroe y cobarde, cada creador y destructor de civilizaciones, cada rey y campesino, cada joven pareja enamorada, cada madre y padre, niño esperanzado, inventor y explorador, cada maestro de la moral, cada político corrupto, cada “superestrella”, cada “líder supremo”, cada santo y pecador en la historia de nuestra especie, vivió ahí – en una mota de polvo suspendida en un rayo de sol.” — Carl Sagan.

La ubicación de la humanidad en el universo ha sufrido un duro golpe de realidad en los últimos siglos, pasando de ser el centro y origen de la creación, a animales inteligentes producto de la evolución en un planeta cualquiera orbitando una estrella común en la inmensidad del Cosmos.

Foto de la Tierra tomada por Voyager 1 en 1990

El universo observable alcanza alrededor de 90 trillones de años luz en diámetro. Existen a su vez 100 trillones de galaxias, que contienen cada una entre 100 y un trillón de estrellas. Los planetas son cuerpos celestes que orbitan alrededor de estas estrellas, y debido a la gran cantidad existente, el número de planetas potencialmente habitables en el universo es inmenso. Por este motivo, cabría esperar que la vida en el universo fuese también abundante, y sin embargo, no hemos encontrado señal alguna que indique que no estamos solos.

A día de hoy, no solo no hemos visto naves espaciales ni grandes imperios galácticos, sino que no hemos podido encontrar señales electromagnéticas de su presencia ni hemos encontrado microorganismos asociados con la vida fuera de nuestro planeta.

La búsqueda de vida inteligente, o SETI (Search for Extraterrestrial Intelligence), es un término colectivo utilizado en el mundo científico para la detección de vida extraterrestre, utilizando, por ejemplo, la monitorización de la radiación electromagnética en búsqueda de transmisiones de otras civilizaciones.

Como parte de esta investigación, un equipo de investigadores de la universidad de Berkeley, California, que utiliza algunos de los radiotelescopios más potentes del mundo para rastrear millones de estrellas en búsqueda de signos de tecnología, ha pedido la ayuda de la comunidad científica internacional para desarrollar algoritmos capaces de manejar la ingente cantidad de datos que se obtienen y poder encontrar en ellos señales de origen no natural.

Para ello, se ha financiado un concurso a través de Kaggle (plataforma y comunidad de científicos de datos y expertos en Machine Learning) en el cual se proporciona una serie de datos obtenidos de observaciones del Green Bank Telescope (GBT). Debido a que no hay ejemplos confirmados de señales alienígenas para utilizar como datos en el entrenamiento de modelos de Machine Learning, se han introducido señales simuladas anómalas correspondientes con señales de origen no natural, llamadas “needles”. El algoritmo debe de ser capaz de identificar con la mayor exactitud posible estas “needles”.

rhinno-labs-contact

El instrumento utilizado en el Green Bank Telescope para obtener estos datos es un espectrómetro digital, que toma los datos en crudo procedentes del telescopio (del orden de cientos de TB diarios) y realiza una Transformada de Fourier para generar un espectrograma. Estos espectrogramas consisten en medidas de la intensidad de señal como funciones de frecuencia y tiempo. 

La información se guarda en formato HDF5, pero esencialmente son arrays de intensidades en función de la frecuencia y tiempo, acompañados por unos metadatos que muestran la dirección en la que el telescopio estaba apuntado, la escala de frecuencias, etc.

Lo que se busca en estos datos son candidatos a firmas tecnológicas extraterrestres, las llamadas tecnofirmas. El mayor obstáculo para encontrarlas es nuestra propia tecnología. No solo las estaciones de radio, si no también los router wifi, móviles y otros dispositivos electrónicos no específicamente diseñados para transmitir señales de radio, pero que las producen. 

Nos referimos a este tipo de señales generadas por el ser humano como Interferencias (RFI del inglés Radio Frequency Interference). Uno de los métodos para aislar este tipo de tecnofirmas de RFI es buscar señales que aparentemente proceden de una particular dirección en el cielo. Esto se suele hacer alternando observaciones de la estrella, que es el objetivo principal, con observaciones de otras 3 estrellas cercanas: 5 minutos en la estrella “A”, luego 5 minutos en la estrella “B”, y luego otros 5 de vuelta en “A”, después 5 en “C”, otros 5 en “A” y para terminar 5 en “C”. De esta manera se obtiene un set de 6 observaciones (ABACAD) al que se denomina “cadencia”.

Pero, ¿Cómo se vería entonces? Limitando el espectro de frecuencias de la cadencia por motivos de representación, un ejemplo de señal extraterrestre sería el siguiente:

Cadencia obtenida de Voyager 1 mediante GBT

Incluso a pesar de que se encuentra a 20.000 millones de Km de la Tierra, la señal procedente de la Voyager 1 es captada con nitidez por el telescopio GBT. Las franjas 1,3 y 5 corresponden con el objetivo “A” (la sonda Voyager, en este caso). La diagonal amarilla es la señal procedente de la sonda. Se detecta al apuntar directamente a la sonda, y se pierde cuando se apunta hacia otro lado. Además, se ve como una línea inclinada debido a la velocidad relativa de la sonda con respecto a la Tierra y al efecto Doppler sobre la señal de la sonda al alejarse. Este efecto es otra forma de detectar y eliminar interferencias, debido a que estas señales tienen una mayor tendencia a mantenerse a frecuencia constante.

Sería estupendo poder entrenar algoritmos basados completamente en observaciones de naves interplanetarias, pero por desgracia, no tenemos muchos ejemplos de este tipo. Además, también limitaría el rango de posibles tipos de señal a buscar. Por este motivo, y para el entrenamiento y detección de este tipo de algoritmos, se han simulado varios tipos de tecnofirmas. A continuación, se muestran diversos ejemplos de tecnofirmas de este dataset.

Ejemplos de cadencias con tecnofirmas

Algunas de ellas son similares a la de la Voyager 1 y son fáciles de detectar incluso con algoritmos relativamente sencillos, mientras que otras están escondidas en regiones muy ruidosas del espectro y pueden ser muy difíciles de encontrar por un ordenador, aunque puedan parecer obvias a simple vista. No todas las señales son líneas diagonales, sino que pueden tomar configuraciones y patrones muy diversos.

Todos los resultados y algoritmos desarrollados a lo largo de la competición servirán para mejorar el entendimiento y los métodos de detección de estas tecnofirmas. Además, el equipo SETI de Berkeley, almacena y libera de forma periódica datos del Green Bank Telescope en West Virginia y del Arecibo Telescope en Puerto Rico, para que aquellos con la suficiente experiencia técnica puedan descargar y experimentar con estos datos para crear algoritmos y técnicas de análisis nuevas y aprovechar al máximo este dataset sin precedentes.

Quizás, con tiempo y un esfuerzo conjunto, esta vez sí, podamos responder a la pregunta. ¿Estamos solos?

Contacta con nosotros

¡Suscríbete!