langitselatan
Beranda » Infrastruktur Data Observatorium Rubin

Infrastruktur Data Observatorium Rubin

Era baru pemetaan langit selatan serta demokratisasi data dalam dunia astronomi dimulai dengan kehadiran Observatorium Vera C. Rubin

Observatorium Rubin dalam proses konstruksi di Cerro Pachón, Chile. Kredit: RubinObs / NOIRLab / SLAC / NSF / DOE / AURA / A. Pizarro D
Observatorium Rubin dalam proses konstruksi di Cerro Pachón, Chile. Kredit: RubinObs / NOIRLab / SLAC / NSF / DOE / AURA / A. Pizarro D

Observatorium Vera C. Rubin di Cerro Pachón, Chile, merupakan bagian dari Legacy Survey of Space and Time (LSST) – pengamatan survei langit selatan yang akan berlangsung selama 10 tahun. Sebagai misi survei termutakhir saat ini, Rubin dilengkapi dengan kamera digital terbesar di dunia dan infrastruktur data yang inovatif. Rubin memiliki kapabilitas untuk memetakan langit selatan dengan resolusi yang sangat tinggi dan menghasilkan volume data yang sangat besar. Ini menandai awal fase baru demokratisasi data dalam dunia astronomi.

Skala Terbesar Survei Langit

Observatorium Rubin merupakan proyek yang didanai oleh National Science Foundation (NSF) dan Office of Science pada Department of Energy (DOE) Amerika Serikat. Operasional observatorium dipegang oleh NSF NOIRLab dan SLAC National Accelerator Laboratory. Nama observatorium ini sendiri diambil dari Vera C. Rubin – astronom perempuan yang menemukan bukti keberadaan materi gelap berdasarkan pengamatan laju rotasi galaksi.

LSST pada prinsipnya merupakan kesinambungan berbagai misi survei yang sudah ada sebelumnya (seperti SDSS, Pan-STARRS, 2MASS, dan IRAS), tapi dalam skala yang jauh lebih besar. Ambil contoh SDSS. Selama tahun 2000 – 2010, survei ini menghasilkan sekitar 20 TB (Terabytes) data hasil pengamatan. Salah satu produk penelitian dari survei ini adalah peta tiga dimensi alam semesta yang berbasiskan data pergeseran merah (redshift) galaksi dan quasar yang mengindikasikan posisi mereka.

Setelah mulai beroperasi nanti, Rubin akan menghasilkan volume data dalam jumlah yang hampir sama, tapi dalam 24 jam. Setelah 10 tahun, volume data citra mentah yang dihasilkan dapat mencapai 60 PB (Petabytes, atau 60 juta Gigabytes). Ini setara dengan kuota data yang diperlukan untuk menonton film di Netflix secara nonstop selama 9.000 tahun. Ini bahkan belum termasuk 20 PB data yang akan disimpan dalam basis data katalognya.

Teleskop survei 8,4 meter di Observatorium Rubin. Kredit: RubinObs / NOIRLab / SLAC / NSF / DOE / AURA / H. Stockebrand
Teleskop survei 8,4 meter di Observatorium Rubin. Kredit: RubinObs / NOIRLab / SLAC / NSF / DOE / AURA / H. Stockebrand

Desain teleskop, kamera, dan infrastruktur data pada Rubin memang menekankan optimasi pada aspek kecepatan, skala, dan repetisi. Kamera digital yang dimilikinya merupakan yang terbesar di dunia – hampir 1 ton, seukuran mobil SUV, dilengkapi dengan enam filter panjang gelombang, dan 189 sensor CCD dengan total resolusi 3,2 Gigapixels.

Kamera LSST dalam proses pemindahan untuk dipasang pada teleskop. Kredit: NOIRLab
Kamera LSST dalam proses pemindahan untuk dipasang pada teleskop. Kredit: NOIRLab
Skema rangkaian sensor CCD pada bidang fokus kamera LSST. Resolusinya cukup tinggi untuk dapat mendeteksi bola golf dari jarak 24 km. Kredit: Greg Stewart / SLAC National Accelerator Laboratory
Skema rangkaian sensor CCD pada bidang fokus kamera LSST. Resolusinya cukup tinggi untuk dapat mendeteksi bola golf dari jarak 24 km. Kredit: Greg Stewart / SLAC National Accelerator Laboratory

Dikombinasikan dengan desain optik teleskop survei Simonyi berdiameter 8,4 meternya, Rubin memiliki medan pandang seluas ~10 derajat persegi atau setara dengan 45 Bulan purnama. Setiap malam, teleskop akan memindai langit dan menghasilkan citra berukuran 6 – 8 Gigabytes tiap 15 – 40 detik.

Setelah tiga malam, Rubin akan kembali mengamati area yang sama di langit. Setelah 10 tahun, satu area di langit dapat memiliki ratusan eksposur, sehingga dapat diamati perubahannya.

Tapi kenapa dan untuk apa volume data semasif itu?

Semua kembali ke empat misi ilmiah Rubin, yang menjadi faktor penentu rancangan infrastruktur observatorium ini:

  • Memetakan milyaran galaksi dan mengamati bagaimana materi dan energi gelap mempengaruhi struktur dan evolusi alam semesta.
  • Melakukan pengukuran terhadap jutaan objek kecil (komet dan asteroid) di Tata Surya dan memberikan wawasan baru tentang pembentukan planet serta evolusi Tata Surya.
  • Memetakan milyaran bintang di galaksi Bima Sakti, termasuk menghasilkan peta galaksi yang jauh lebih luas dan dalam dibanding survei sebelumnya.
  • Memantau perubahan yang terjadi di langit terkait fenomena transien (supernova, bintang variabel, dll.) dan memicu peringatan secara waktu nyata (real-time alert) bagi para peneliti.

Pertanyaan berikutnya, bagaimana data secepat dan sebesar itu dikelola? Bagaimana cara pemrosesan data mentah agar dapat digunakan oleh para peneliti?

Jaringan Data Lintas Samudera

Sistem manajemen data pada Observatorium Rubin terbagi menjadi tiga lapis:

  • Infrastruktur, dengan fungsi utama untuk komputasi, penyimpanan, dan jaringan data.
  • Middleware, untuk pemrosesan data secara terdistribusi, manajemen akses dan komunikasi data, dan kebutuhan operasional sistem yang lain.
  • Aplikasi, untuk alur (pipeline) dan akses produk serta arsip data.

Berbagai proses di atas berlangsung di seluruh fasilitas data yang tersebar di beberapa negara: Chile, Amerika Serikat, Prancis, dan Britania Raya. Bagaimana persisnya alur transfer data dari Rubin ke berbagai fasilitas ini?

Lokasi fasilitas data Observatorium Rubin. Kredit: RubinObs
Lokasi fasilitas data Observatorium Rubin. Kredit: RubinObs

Perjalanan data dimulai pada bagian fokus (detektor) kamera LSST. Data dikonversi menjadi sinyal optik agar bisa ditransmisikan melalui kabel serat optik. Transmisi data menggunakan serat optik dikarenakan kabel tembaga (untuk sinyal listrik biasa) tidak dapat mengakomodasi kebutuhan kecepatan transfer data yang dapat mencapai tiga Gigabit per detik. Faktor lain adalah panjangnya kabel yang digunakan. Semakin panjang, semakin meningkat resiko derau (noise) dan hilangnya sinyal apabila menggunakan kabel tembaga. Jalur kabel juga bisa berbelok-belok, sehingga dapat mempengaruhi laju transfer dan kualitas data. Belum lagi faktor ukuran dan massa kabel yang dapat mempengaruhi sistem mekanika teleskop.

Dalam waktu sedetik, data akan dikirim ke base site di kota La Serena (sekitar 60 km dari Cerro Pachón) dengan jaringan kabel serat optik berkecepatan tinggi. Kabel optik ini memiliki lebar pita hingga 400 Gigabit per detik – ribuan kali lebih besar dibandingkan dengan jaringan internet rumah biasa. Di La Serena, data akan disalin sebelum diteruskan ke Santiago, ibukota Chile.

Dari Santiago, data akan dikirim ke Amerika Serikat. Ada dua jalur jaringan untuk ini. Jalur utama adalah melalui São Paolo, Brazil, kemudian menuju ke Florida melalui kabel bawah laut. Apabila jalur utama ini terganggu, alternatif lainnya tersedia melalui Panama. Transmisi data melalui jalur sepanjang lebih dari 8.000 km ini dapat ditempuh hanya dalam waktu kurang dari lima detik.

Akhirnya, dalam waktu tujuh detik setelah akuisisi data, citra hasil pengamatan akan tiba di pusat infrastruktur data di US Data Facility (USDF), SLAC National Accelerator Laboratory,Menlo Park, California. Fase awal pemrosesan data dilakukan di sini: membandingkan tiap citra baru dengan citra referensi atau hasil pengamatan sebelumnya, mendeteksi perbedaan dari malam ke malam (bahkan antar jam), dan memicu peringatan (trigger alert) atau notifikasi apabila ada fenomena baru terdeteksi.

USDF di California sebagai pusat utama infrastruktur data Rubin. Kredit: Olivier Bonin / SLAC National Accelerator Laboratory
USDF di California sebagai pusat utama infrastruktur data Rubin. Kredit: Olivier Bonin / SLAC National Accelerator Laboratory

Jumlah peringatan / notifikasi yang dihasilkan tiap malam dapat mencapai 10 juta. Semua notifikasi ini akan dialirkan, diklasifikasikan, dan didistribusikan ke para peneliti di seluruh dunia melalui sebuah sistem broker berbasis algoritma klasifikasi pembelajaran mesin. Respon cepat berbasis deteksi mendekati waktu nyata (near real-time) ini sangatlah esensial bagi para astronom yang meneliti fenomena transien, seperti semburan sinar gamma (skala detik), supernova (skala hari atau mingguan), dan asteroid berpotensi bahaya (PHA). Mereka dapat menerima notifikasi dalam waktu maksimal satu menit setelah suatu fenomena terjadi. Dengan demikian, mereka dapat mengkoordinasikan pengamatan tindak lanjut secara cepat.

Dalam 24 jam, katalog dari objek-objek yang diamati akan dipublikasikan. Setelah 80 jam, data akan ditransfer ke pusat data France Data Facility (FrDF) di IN2P3 / CNRS Computing Center di Lyon, Prancis, dan UK Data Facility (UKDF) di Britania Raya. Di kedua lokasi ini, data akan disalin (copy) dan disimpan. Sebagai informasi, sistem perangkat lunak yang digunakan dalam proses ini awalnya dikembangkan untuk penelitian fisika partikel di CERN. Sebuah contoh transfer pengetahuan dan keahlian antar domain keilmuan.

Setiap tahun, katalog berisi semua data baru akan dirilis. Ratusan citra yang telah dikalibrasi disatukan menjadi berbagai citra komposit ultra-deep setelah melalui pemrosesan di ketiga pusat data. Katalog ini juga akan mencakup pengukuran properti lain dari milyaran objek yang diamati, seperti posisi, bentuk, dan emisi cahayanya. Tim data LSST juga mengembangkan algoritma pembelajaran mesin khusus untuk mengklasifikasikan berbagai objek yang berhasil ditangkap oleh Rubin.

Akses dan Analisis Data

Biasanya, para peneliti akan mengunduh data hasil pengamatan dari teleskop ke sistem server lokal di universitas atau institusi mereka, sebelum kemudian dipindahkan ke komputer / laptop masing-masing untuk dianalisa. Namun, dengan LSST dan volume datanya yang sangat masif, tentu cara ini tidak lagi dimungkinkan. Lebih mendasar lagi, tidak semua orang memiliki akses ke fasilitas server dan komputer untuk pengolahan data dalam jumlah besar, apalagi mengajukan proposal pengamatan ke observatorium. Berbagai tantangan inilah yang coba dijawab oleh tim manajemen data Observatorium Rubin.

Data hasil pengamatan akan disimpan di berbagai pusat data di beberapa negara. Komunitas ilmiah dapat mengakses data tersebut, baik yang sudah diolah maupun masih mentah, di Rubin Science Platform (RSP) melalui peramban internet (browser) komputer masing-masing. Platform daring ini dibangun dengan memanfaatkan sistem komputasi awan dan memiliki tiga aspek:

  • Portal: Graphical user interface (GUI) di mana pengguna bisa mencari, menyaring, dan memvisualisasikan data tanpa perlu menulis kode pemrograman.
  • Notebooks: Berbasis sistem JupyterLab. Pengguna bisa langsung menulis kode Python untuk mengakses dan mengolah data.
  • API (Application Programming Interface): Akses programmatik ke berbagai produk data Rubin melalui antarmuka Visual Observatory (VO). Pengguna dapat mengakses data (salah satu caranya) melalui library Python AstroPy. Pada dasarnya, aspek portal dan Notebook juga menggunakan API yang sama untuk mengakses data LSST.

Platform ini juga dirancang untuk memiliki tampilan antarmuka yang mudah dipahami oleh berbagai tipe pengguna, mulai dari para peneliti profesional, peserta didik di sekolah dan universitas, sampai ilmuwan warga. Tersedia juga tutorial untuk mendukung proses eksplorasi dan analisis data.

Setelah dua tahun operasi awal, data hasil pengamatan akan mulai dibuka secara penuh ke publik. Dengan demikian, diharapkan berbagai pihak dapat dengan mudah melakukan proses eksplorasi dan berkontribusi pada proses ilmiah dengan data LSST.

Tampilan antarmuka situs Rubin Science Platform, dapat diakses melalui https://data.lsst.cloud/ untuk menguji coba dan membaca dokumentasi cara penggunaan.
Tampilan antarmuka situs Rubin Science Platform, dapat diakses melalui https://data.lsst.cloud/ untuk menguji coba dan membaca dokumentasi cara penggunaan.

Fleksibilitas adalah kunci utama pengembangan desain platform ini. Pendanaan LSST mensyaratkan agar semua perangkat lunak tersedia secara open source. Itu berarti, siapapun bebas untuk menggunakan dan mengajukan modifikasi terhadap berbagai kode pemrograman yang tersedia. Ini untuk mengantisipasi kebutuhan jangka panjang di mana mungkin saja akan muncul tipe analisis baru yang membutuhkan suatu fitur atau fungsi baru pada perangkat lunak yang digunakan.

Era Baru Astronomi

Observatorium Rubin menunjukkan bahwa kemajuan astronomi dan astrofisika masa kini sangat bergantung pada arsitektur data yang terdistribusi, kemampuan pemrosesan data secara near real-time, serta akses data yang lebih ramah pengguna dan inklusif. Integrasi pembelajaran mesin dan kecerdasan buatan (AI) ke dalam prosesnya juga sangatlah esensial guna menjawab berbagai pertanyaan kosmologis. Diharapkan ini semua akan mempercepat proses penemuan jawaban dan memperdalam pemahaman mengenai alam semesta kita.

Avatar photo

Manoressy Tobias

Saat ini aktif bekerja di bidang data analytics untuk tech industry. Sebelumnya menempuh pendidikan S1 Teknik Fisika di ITB dan S2 Astronomy & Instrumentation di Universiteit Leiden. Penelitian yang pernah dikerjakan mencakup eksoplanet dan polarimetri.

Tulis Komentar

Tulis komentar dan diskusi di sini

Kanal LS

Toko LS
tanya LS
Gerhana

Paling Banyak Dicari

Fenomena Langit Bulan Juli 2025
Tahun Cahaya: Satuan Waktu atau Jarak?
Himalaya Kosmik: Kisah Misterius Sebelas Kuasar
Venus Muncul di Foto Bumi

Langanan LS