생물정보학/바이오파이썬

MEME으로 protein motif 찾기

곰탱이장 2024. 11. 24. 13:33

https://rosalind.info/problems/meme/

 

ROSALIND | New Motif Discovery

It appears that your browser has JavaScript disabled. Rosalind requires your browser to be JavaScript enabled. New Motif Discovery solved by 1020 Know Your Meme Figure 1. A sample GLAM2 gapped motif. In “Finding a Protein Motif”, we used the ProSite da

rosalind.info

이 문제에서는 id와 서열만 있는 여러 개의 펩타이드가 담긴 fasta 파일이 주어지고 이 중 가장 점수가 높은 공통 모티프를 정규식으로 표현하는 문제이다. 

https://meme-suite.org/meme/tools/meme

 

MEME - Submission form

If your sequences are not in a standard alphabet (DNA, RNA or protein), you must input a custom alphabet file. Specify a file to upload containing sequence coordinates in BED format. The file must be based on the exact genome version you specified in the m

meme-suite.org

공통 모티프를 찾는 방법은 위의 사이트에서 구한다

이러한 제출 양식에 파일 선택만 fasta 파일을 하고 그 다음 저 사이트에서 자동으로 모티프를 찾아주고 GLAM2 형식으로 제출해준다. 

이러한 형식으로 가장 점수가 높은 모티프와 그 위치를 알려주는데 저 GLAM2 그림을 그저 정규식으로 좀 바꿔서 쳐서 제출하면 된다.

 

 이 문제는 코드를 이용하는게 아니라 사이트를 이용하는 것이라 조금 신선했다. 

'생물정보학 > 바이오파이썬' 카테고리의 다른 글

FASTQ 파일 다루기  (1) 2024.11.30
단백질 번역하기  (2) 2024.11.29
FASTQ 형식 소개  (0) 2024.11.24
ID를 이용하여 global pairwise alignment 하기  (0) 2024.11.24
Entrez 모듈로 GenBank에 접근하기  (1) 2024.11.24