Nach0: Dil Modelleme Yoluyla İlaç Keşfini İlerletmek

Nach0: Dil Modelleme Yoluyla İlaç Keşfini İlerletmek

Nach0: Advancing Drug Discovery through Language Modeling

İnsilico Medicine ve NVIDIA araştırmacıları, ilaç keşfini devrimleştirmek için potansiyele sahip yeni bir büyük dil modeli (LLM) dönüştürücüsü olan nach0’ı geliştirdiler. Mevcut LLM’lerin aksine, nach0, doğal dil anlama, sentetik yol tahmini, moleküler üretim ve diğer görevler de dahil olmak üzere çeşitli görevlerde eğitilmiştir. Bu çığır açan araştırmanın bulguları son zamanlarda Chemical Science Dergisi’nde yayımlanmıştır.

Biomedikal keşifler için LLM’ler genellikle ilaçlar ve genler gibi biyomedikal metinlere odaklanmıştır, ancak kimyasal yapı açıklamalarını eksikliği vardır. Hem metin hem de kimyasal yapı açıklamalarını içeren mevcut modeller, geniş bir kimyasal görev yelpazesi için eğitilmemiştir. Nach0, PubMed’den alınan özet metinleri, U.S. Patent and Trademark Office’den patent açıklamalarını ve basitleştirilmiş moleküler giriş çizgisi sistemi (SMILES) kullanarak moleküler yapıları içeren bir veri seti kullanan bir boşluğu doldurmaya yöneliktir.

Nach0’u eğitmek için araştırmacılar kimyasal bilgileri belirtme işaretlerine dönüştürerek 4,7 milyar belirteç veri setine ulaştılar. Daha sonra model, doğal dil işleme, kimya ile ilgili görevler ve çapraz alan görevleri gerçekleştirmeye yardımcı olacak özel sembollerle anotlandı. Bu görevler belge sınıflandırma, soru cevaplama, moleküler özellik tahmini, moleküler oluşturma, reaktif tahmini, tanım yönlü molekül tasarımı ve moleküler tanım oluşturmayı kapsamaktadır.

Nach0, doğal dil yönergeleri kullanarak ilaç keşfini otomatize etmede büyük bir ilerleme represent eder. Gelecekte modelin protein dizilerini dahil etmesi ve yeni modaliteleri uyumlu hale getirmesi beklenmektedir. Ek olarak, metin ve bilgi grafiklerinden elde edilen bilgilerin birleştirilerek daha fazla artırılması araştırılacaktır.

Nach0’un geliştirilmesi, NVIDIA BioNeMo jeneratif AI platformunun kullanımıyla mümkün oldu, özellikle NVIDIA NeMo’nun NLP yeteneklerini kullanan. Ayrıca, NVIDIA’nın bellek eşlemeli veri yükleme modülleri büyük veri kümelerinin optimal okuma hızıyla yönetilmesine olanak sağladı.

NVIDIA’nın Tıbbi Bilimler Küresel İş Geliştirme Müdürü Rory Kelleher, jeneratif AI ve LLM’lerin biyoloji ve kimya alanındaki bilimsel keşfi dönüştürme potansiyeline sahip olduğuna inanmaktadır. Biyomedikal anlayış için kullanılan diğer LLM’lere kıyasla, nach0 moleküler görevleri gerçekleştirmede belirgin avantajlar göstermiş ve ChatGPT’yi birçok açıdan geride bırakmıştır.

Nach0’un yetenekleri iki vaka çalışmasında test edildi. Bir çalışmada, model Diyabetes mellitus’a karşı potansiyel terapötik aktivite gösteren molekülleri başarılı bir şekilde üretti. Başka bir çalışmada nach0, Insilico’nun Chemistry42 AI ilaç tasarım platformunda üretim için sadece 15 dakika ve puanlama için 30 dakika içinde bir prompt’i karşılayan sekiz molekül üretti.

Nach0’un gelişmesi sürecinde daha az süpervizyon gerektirmesi ve ilaç kimyacıları için umut vadeden terapötik seçenekleri üretme ve doğrulama yetisine sahip hale gelmesi beklenmektedir. İlaç keşfi ve geliştirme için jeneratif AI kullanımında öncü olan Insilico Medicine, çeşitli hastalıklar için yeni terapötik varlıkların peşinde AI teknolojisinin sınırlarını zorlamaya devam etmektedir.

Referans:
Livne, M., et al. (2024). nach0: Multimodal Natural and Chemical Languages Foundation Model. Chemical Science. doi.org/10.1039/d4sc00966e.