Dalam perkembangan terkini, tim peneliti dari MIT dan MIT-Watson AI Lab menemukan pendekatan revolusioner untuk menyederhanakan proses penemuan obat dan bahan baru. Penemuan baru ini memanfaatkan teknologi machine learning untuk memprediksi sifat-sifat molekuler dan menciptakan molekul-molekul baru dengan efisiensi yang luar biasa. Metode inovatif ini bukan hanya mempercepat proses penemuan, tetapi juga mengurangi biaya secara signifikan, yang mungkin akan mengubah lanskap kimia dan ilmu material.
Sebelumnya, karena masih dilakukan secara tradisional, penemuan obat dan bahan baru adalah proses yang rumit dan memakan biaya. Proses ini bisa berlangsung puluhan tahun dan menghabiskan jutaan dolar. Para ilmuwan biasanya harus melakukan percobaan secara manual, mencoba-coba untuk menemukan molekul-molekul yang menjanjikan yang harus disintesis dan diuji. Untuk membuat proses lebih cepat, para peneliti pun akhirnya menggunakan teknologi machine learning untuk memprediksi sifat-sifat molekuler berdasarkan kumpulan data molekul yang telah diberi label. Meski demikian, kumpulan data pelatihan yang besar sangat sulit didapatkan, dan biaya penemuan molekul baru sangat tinggi, yang menghambat efektivitas pendekatan berbasis mesin ini.
Minghao Guo, mahasiswa pascasarjana di jurusan ilmu komputer dan teknik elektro (EECS) yang menjadi penulis utama, menekankan tujuan proyek ini. “Tujuan kami dengan proyek ini adalah mempercepat penemuan molekul-molekul baru dengan menggunakan metode berbasis data, sehingga kita dapat melatih model untuk melakukan prediksi tanpa harus melakukan eksperimen yang mahal,” ungkapnya.
Pendekatan yang digunakan oleh tim MIT ini berbeda dari metode-metode tradisional. Mereka menciptakan sistem machine learning yang dapat mempelajari sendiri “bahasa” molekul, yang disebut sebagai tata bahasa molekuler, dengan hanya menggunakan dataset khusus dalam skala kecil. Tata bahasa molekuler ini berfungsi seperti aturan-aturan produksi yang mengatur bagaimana atom dan substruktur dapat digabungkan untuk membentuk molekul. Persis seperti aturan-aturan tata bahasa yang menghasilkan kalimat, tata bahasa molekuler menghasilkan molekul dengan struktur yang serupa dengan aturan yang telah ditetapkan. Pemahaman sistem terhadap kesamaan struktural ini membantu dalam memprediksi sifat-sifat molekul baru dengan efisien.
Namun, mengingat ada banyak cara atom dan substruktur dapat digabungkan, proses pembelajaran ini sebenarnya akan menjadi sangat mahal secara komputasi jika digunakan untuk dataset yang lebih besar.
Untuk mengatasi masalah ini, para peneliti MIT membagi tata bahasa molekuler menjadi dua bagian. Bagian pertama, yang mereka sebut sebagai metagrammar, adalah tata bahasa yang umum dan dapat diterapkan secara luas yang mereka desain secara manual dan berikan kepada sistem sejak awal. Metagrammar ini memungkinkan sistem untuk mempelajari tata bahasa molekuler yang jauh lebih kecil dan spesifik untuk dataset tertentu, sehingga mempercepat proses pembelajaran.
Dalam serangkaian eksperimen yang luas, sistem inovatif yang diciptakan oleh peneliti MIT ini secara konsisten lebih unggul dibandingkan dengan metode pembelajaran mesin populer lainnya. Sistem ini menunjukkan akurasi yang luar biasa dalam menciptakan molekul-molekul baru dan memprediksi sifat-sifatnya, bahkan ketika bekerja dengan dataset khusus dalam skala kecil yang hanya berisi beberapa ratus sampel. Yang menarik, metode ini menghilangkan kebutuhan akan tahap pre-training yang mahal yang diperlukan oleh teknik-teknik lainnya.
Salah satu pencapaian menonjol dari sistem ini adalah kemampuannya untuk memprediksi sifat-sifat fisik polimer, seperti suhu transisi kaca, yang biasanya memerlukan eksperimen mahal yang dilakukan pada suhu dan tekanan yang ekstrem. Keefektifan sistem ini memiliki potensi besar untuk merevolusi penelitian dalam bidang polimer.
Minghao Guo mengungkapkan tentang fleksibilitas sistem ini. “Representasi yang didasarkan pada tata bahasa ini sangat kuat. Dan karena tata bahasa tersebut sendiri adalah representasi yang sangat umum, maka bisa digunakan pada berbagai jenis data berbentuk grafis. Kami juga sedang berusaha mencari aplikasi di luar bidang kimia atau ilmu material,” terangnya.
Ke depannya, para peneliti MIT ini berencana untuk mengembangkan tata bahasa molekuler mereka yang mencakup geometri 3D dari molekul dan polimer, yang merupakan hal kunci untuk memahami interaksi antara rantai polimer. Selain itu, mereka sedang mengembangkan antarmuka yang akan menampilkan aturan-aturan produksi tata bahasa yang telah dipelajari kepada pengguna dan meminta masukan untuk meningkatkan akurasi sistem.
Penelitian revolusioner ini, yang akan disajikan dalam International Conference for Machine Learning, memiliki potensi besar untuk merevolusi bidang kimia, ilmu material, dan penemuan obat. Dengan menyederhanakan dan mempercepat proses penemuan sifat-sifat molekuler dan menciptakan molekul-molekul baru, pendekatan inovatif ini memiliki potensi untuk membuka jalan bagi penemuan obat dan bahan baru yang tak terbatas, menghemat waktu dan sumber daya, sekaligus mendorong batas-batas penemuan ilmiah yang selama ini terhambat waktu dan biaya.
Reference:Phys.org