앞의 글에서 보았듯이 gloabal alignment는 전체 서열을 얼라이먼트 하는 것이다.
https://rosalind.info/problems/clus/
ROSALIND | Global Multiple Alignment
It appears that your browser has JavaScript disabled. Rosalind requires your browser to be JavaScript enabled. Global Multiple Alignment solved by 515 The Odd One Out Figure 1. Fish samples waiting for analysis in the lab of US Customs and Border Protectio
rosalind.info
이 문제는 여러 개의 서열을 global alignment를 돌린 이후에 그 중 다른 서열들과 가장 다른 서열을 출력하는 문제이다. 이 문제는 https://www.ebi.ac.uk/jdispatcher/msa/clustalo 이 사이트의 ClusterOmega를 이용하여 쉽게 풀 수 있다.
ClusterOmega는 pairwise alignment를 각각 실행하여 서로의 distanse matrix를 만들어낸다. 그리고 이 distanse가 가장 적은 두 개의 alignment를 쌍으로 정해두고 matrix를 기준으로 가장 가까운 서열들을 tree에 추가해 나가는 식으로 guide tree를 만든다. 그리고 이 guide tree에서 가장 먼저 떨어져 나오는 서열이 다른 서열들과 가장 다른 서열이다.
필자의 test case는 위와 같이 나와 가장 먼저 떨어져 나온 서열을 답으로 적어내 맞았다.
'생물정보학 > 바이오파이썬' 카테고리의 다른 글
Suboptimal local alignment (2) | 2024.12.07 |
---|---|
Seq 객체 다루기 (0) | 2024.12.01 |
FASTQ 파일 다루기 (1) | 2024.11.30 |
단백질 번역하기 (2) | 2024.11.29 |
FASTQ 형식 소개 (0) | 2024.11.24 |