https://rosalind.info/problems/meme/
ROSALIND | New Motif Discovery
It appears that your browser has JavaScript disabled. Rosalind requires your browser to be JavaScript enabled. New Motif Discovery solved by 1020 Know Your Meme Figure 1. A sample GLAM2 gapped motif. In “Finding a Protein Motif”, we used the ProSite da
rosalind.info
이 문제에서는 id와 서열만 있는 여러 개의 펩타이드가 담긴 fasta 파일이 주어지고 이 중 가장 점수가 높은 공통 모티프를 정규식으로 표현하는 문제이다.
https://meme-suite.org/meme/tools/meme
MEME - Submission form
If your sequences are not in a standard alphabet (DNA, RNA or protein), you must input a custom alphabet file. Specify a file to upload containing sequence coordinates in BED format. The file must be based on the exact genome version you specified in the m
meme-suite.org
공통 모티프를 찾는 방법은 위의 사이트에서 구한다
이러한 제출 양식에 파일 선택만 fasta 파일을 하고 그 다음 저 사이트에서 자동으로 모티프를 찾아주고 GLAM2 형식으로 제출해준다.
이러한 형식으로 가장 점수가 높은 모티프와 그 위치를 알려주는데 저 GLAM2 그림을 그저 정규식으로 좀 바꿔서 쳐서 제출하면 된다.
이 문제는 코드를 이용하는게 아니라 사이트를 이용하는 것이라 조금 신선했다.
'생물정보학 > 바이오파이썬' 카테고리의 다른 글
FASTQ 파일 다루기 (1) | 2024.11.30 |
---|---|
단백질 번역하기 (2) | 2024.11.29 |
FASTQ 형식 소개 (0) | 2024.11.24 |
ID를 이용하여 global pairwise alignment 하기 (0) | 2024.11.24 |
Entrez 모듈로 GenBank에 접근하기 (1) | 2024.11.24 |