"기존 데이터 없이 신약 개발" 혁신적 생성형AI 개발
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
신규 약물을 발굴하려면 질병의 원인이 되는 타겟 단백질에 특이적으로 결합하는 분자를 찾는 것이 핵심이다.
기존 약물설계 생성형AI는 이미 알려진 특정 단백질의 활성데이터를 학습에 활용하기 때문에 기존 약물과 유사하게 설계하는 경향이 있어 신약 개발에 약점이 됐다.
KAIST는 화학과 김우연 교수팀이 활성데이터 없이 단백질과 분자의 상호작용을 고려해 타겟 단백질에 적합한 약물을 설계하는 생성형AI를 개발했다고 18일 밝혔다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
신규 약물을 발굴하려면 질병의 원인이 되는 타겟 단백질에 특이적으로 결합하는 분자를 찾는 것이 핵심이다.
기존 약물설계 생성형AI는 이미 알려진 특정 단백질의 활성데이터를 학습에 활용하기 때문에 기존 약물과 유사하게 설계하는 경향이 있어 신약 개발에 약점이 됐다.
특히 사업성이 높은 계열 최초 타켓 단백질은 기존 데이터가 거의 없어 생성형AI 활용이 사실상 불가능하다.
KAIST는 화학과 김우연 교수팀이 활성데이터 없이 단백질과 분자의 상호작용을 고려해 타겟 단백질에 적합한 약물을 설계하는 생성형AI를 개발했다고 18일 밝혔다.
연구팀은 생성형AI가 기존 데이터에 의존하는 것을 극복하고 단백질 구조 정보로만 분자를 설계할 수 있도록 했다.
이를 위해 타겟 단백질 약물 결합부위의 3차원 구조정보를 주형처럼 활용해 여기에 맞는 분자를 주조하듯 설계하는 방식을 활용했다.
특히 기존 단백질구조 기반 3차원 생성형AI 모델이 설계한 신규 단백질 대응 분자의 안정성과 결합력이 떨어지는 현상을 개선하는데 초점을 맞췄다.
이에 따라 연구팀은 설계한 분자가 단백질과 안정적으로 결합하기 위한 핵심 역할인 단백질-분자 상호작용에 주목, 생성형AI가 상호작용 패턴을 학습하고 분자 설계에 활용할 수 있게 설계하고 학습시켰다.
그 결과 연구팀이 개발한 생성형AI 모델은 실제 실험 구조를 수천 개만 학습해도 기존 모델보다 월등한 성능을 발휘했다.
기존 모델은 부족한 학습 데이터를 보완하기 위해 10만~1,000만 개 수준의 가상 데이터를 활용했었다.
이번 연구 제1저자인 정원호 KAIST 화학과 박사과정은 “사전 지식을 인공지능 모델에 사용하는 전략은 상대적으로 데이터가 적은 과학분야에서 적극 사용됐다”며 “사용한 분자 간 상호작용 정보는 약물분자뿐 아니라 다양한 생체분자를 다루는 바이오분야에서 유용하게 적용될 수 있을 것”이라고 말했다.
한편 이번 연구결과는 국제학술지 ‘네이처 커뮤니케이션즈’ 3월 15일자에 게재됐다.
대덕특구=이재형 기자 jh@kukinews.com
Copyright © 쿠키뉴스. 무단전재 및 재배포 금지.
- 도로 위로 건설 현장으로…험한 일 내몰리는 고령 노동자 [일할권리②]
- 우승 향방은 ‘중국 용병’ 손에…오더 싸움 주목 [바둑리그]
- 세계 최대 항공유 수출국 韓, 입지 위태로운 이유는
- 자립의지 북돋는 서울시 ‘희망의 인문학’…약자 1000명과 동행
- “사직 말고는 할 수 있는 게 없다”…서울대병원 교수 4명 병원 떠났다
- 여야 합의한 ‘이태원 특별법 수정안’, 국회 행안위 통과
- “사직 말고는 할 수 있는 게 없다”…서울대병원 교수 4명 병원 떠났다
- 하이브·민희진 여론전 계속…뉴진스 두고도 줄다리기
- ‘검찰총장 뇌물수수’ 방송한다던 유튜버…檢 계좌내역 공개하자 예고편 삭제해
- 전해철·김남국·양문석, 안산 텃밭서 ‘비리·의혹’ 잔혹사…“견제세력 있어야”