복잡성이 낮은 서열들

0(0명)
문서 역사

복잡성이 낮은 서열들 (Low complexity sequences)

생정보 서열은 크게 복잡성이 높은 서열과 낮은 서열(저복잡성서열)로 생정보학에서 분류를 한다. 이것은 첫째, 복잡성에따라 생물학적 기능에 차이를 가져오고, 둘째, 생물학을 연구할때, 그 복잡성에 유무에 따라, 기술적인 문제를 일으키기 때문이다. 복잡성이 낮으면, 유전체 서열 해석에도 많은 문제를 일으켜서, 유전체의 완전한 서열해석에 장애가 된다.

서열의 복잡성이 낮으면, 그것의 entropy도 낮다. 예를 들면, 폴리 에이(A)라고 불리는 A 문자의 연속은 다음과 같다: AAAAAAAAAAAAAAA. 이 서열은 단순한 A의 반복이라서, 그 정보량이 낮다. 그러나, 이 폴리 A는 생물학적으로 중요한 역할을 한다. 마찬가지로, 많은 반복서열이 존재하고, 그 분류결과는 매우 다양하고 복잡한 양상을 띈다. 저복잡성서열의 총체를 repeatome이라고도 불을 수 있는데, 이것은 반복문자를 가진 서열들이 낮은 복합성서열들이기 때문이다. 위의 폴리 A는 A의 반복서열(repeat)이다.

댓글 0