본문 바로가기

Algorithm

[알고리즘/파이썬] 자료구조 - 슬라이딩 윈도우(Sliding window) | 백준 12891번: DNA 비밀번호

반응형

두슬

 

 

 

슬라이딩 윈도우(Sliding window)

- 연속된 구간에서 일정 크기의 윈도우(슬라이딩)를 이동하면서 문제를 해결하는 것
- 배열 또는 리스트 등 순차적으로 접근할 수 있는 데이터에서 사용

 


접근방법

1. 데이터에서 일정 크기의 구간(윈도우)을 선택
2. 구간의 초기합을 계산
3. 구간을 우측으로 이동시키며, 구간의 값을 추가하거나 제거
4. 이동되면서 구간 속 값들을 계속 합산하며, 반복되는 계산으로 결과를 도출
5. 이동범위가 오른쪽으로 끝에 닿으면 알고리즘 종료
 

 

 


 

 

 

12891번: DNA 비밀번호

 

12891번: DNA 비밀번호

평소에 문자열을 가지고 노는 것을 좋아하는 민호는 DNA 문자열을 알게 되었다. DNA 문자열은 모든 문자열에 등장하는 문자가 {‘A’, ‘C’, ‘G’, ‘T’} 인 문자열을 말한다. 예를 들어 “ACKA”

www.acmicpc.net

문제

평소에 문자열을 가지고 노는 것을 좋아하는 민호는 DNA 문자열을 알게 되었다. DNA 문자열은 모든 문자열에 등장하는 문자가 {‘A’, ‘C’, ‘G’, ‘T’} 인 문자열을 말한다. 예를 들어 “ACKA”는 DNA 문자열이 아니지만 “ACCA”는 DNA 문자열이다. 이런 신비한 문자열에 완전히 매료된 민호는 임의의 DNA 문자열을 만들고 만들어진 DNA 문자열의 부분문자열을 비밀번호로 사용하기로 마음먹었다.

하지만 민호는 이러한 방법에는 큰 문제가 있다는 것을 발견했다. 임의의 DNA 문자열의 부분문자열을 뽑았을 때 “AAAA”와 같이 보안에 취약한 비밀번호가 만들어 질 수 있기 때문이다. 그래서 민호는 부분문자열에서 등장하는 문자의 개수가 특정 개수 이상이여야 비밀번호로 사용할 수 있다는 규칙을 만들었다.

임의의 DNA문자열이 “AAACCTGCCAA” 이고 민호가 뽑을 부분문자열의 길이를 4라고 하자. 그리고 부분문자열에 ‘A’ 는 1개 이상, ‘C’는 1개 이상, ‘G’는 1개 이상, ‘T’는 0개 이상이 등장해야 비밀번호로 사용할 수 있다고 하자. 이때 “ACCT” 는 ‘G’ 가 1 개 이상 등장해야 한다는 조건을 만족하지 못해 비밀번호로 사용하지 못한다. 하지만 “GCCA” 은 모든 조건을 만족하기 때문에 비밀번호로 사용할 수 있다.

민호가 만든 임의의 DNA 문자열과 비밀번호로 사용할 부분분자열의 길이, 그리고 {‘A’, ‘C’, ‘G’, ‘T’} 가 각각 몇번 이상 등장해야 비밀번호로 사용할 수 있는지 순서대로 주어졌을 때 민호가 만들 수 있는 비밀번호의 종류의 수를 구하는 프로그램을 작성하자. 단 부분문자열이 등장하는 위치가 다르다면 부분문자열이 같다고 하더라도 다른 문자열로 취급한다.

 

입력

첫 번째 줄에 민호가 임의로 만든 DNA 문자열 길이 |S|와 비밀번호로 사용할 부분문자열의 길이 |P| 가 주어진다. (1 ≤ |P| ≤ |S| ≤ 1,000,000)

두번 째 줄에는 민호가 임의로 만든 DNA 문자열이 주어진다.

세번 째 줄에는 부분문자열에 포함되어야 할 {‘A’, ‘C’, ‘G’, ‘T’} 의 최소 개수가 공백을 구분으로 주어진다. 각각의 수는 |S| 보다 작거나 같은 음이 아닌 정수이며 총 합은 |S| 보다 작거나 같음이 보장된다.

출력

첫 번째 줄에 민호가 만들 수 있는 비밀번호의 종류의 수를 출력해라.

반응형
checkList = [0] * 4
myList = [0] * 4
checkNum = 0

def myadd(new): # 추가된 문자를 처리하는 함수
    global checkList, myList, checkNum
    if new == 'A':
        myList[0] += 1
        if myList[0] == checkList[0]:
            checkNum += 1
    elif new == 'C':
        myList[1] += 1
        if myList[1] == checkList[1]:
            checkNum += 1
    elif new == 'G':
        myList[2] += 1
        if myList[2] == checkList[2]:
            checkNum += 1
    elif new == 'T':
        myList[3] += 1
        if myList[3] == checkList[3]:
            checkNum += 1

def myremove(new): # 제거되는 문자를 처리하는 함수
    global checkList, myList, checkNum
    if new == 'A':
        if myList[0] == checkList[0]:
            checkNum -= 1
        myList[0] -= 1
    elif new == 'C':
        if myList[1] == checkList[1]:
            checkNum -= 1
        myList[1] -= 1
    elif new == 'G':
        if myList[2] == checkList[2]:
            checkNum -= 1
        myList[2] -= 1
    elif new == 'T':
        if myList[3] == checkList[3]:
            checkNum -= 1
        myList[3] -= 1

S, P = map(int, input().split()) # S(문자열 길이), P(부분문자열 길이)
Result = 0
A = list(input())
checkList = list(map(int, input().split()))

for i in range(4):
    if checkList[i] == 0:
        checkNum += 1
        
for i in range(P):
    myadd(A[i])

if checkNum == 4:
    Result += 1
    
for i in range(P, S):
    j = i - P
    myadd(A[i])
    myremove(A[j])
    if checkNum == 4:
        Result += 1

print(Result)

 

 

 

전역변수

checkList : 각 문자 'A', 'C', 'G', 'T'의 최소 개수

 - 입력으로 주어지는 문자열에 따라 checkList가 업데이트되고, 이후에는 더 이상 변경되지 않는다


myList : 현재 부분문자열에서 각 문자의 개수

 - myList[0]은 'A'의 개수, myList[1]은 'C'의 개수, myList[2]는 'G'의 개수, myList[3]은 'T'의 개수

 

checkNum : checkList의 개수가 0인 경우를 카운트

 

 


함수 설명

myadd() : 새로 추가된 문자를 처리

- 해당 문자가 'A'인 경우 myList[0] 값을 1 증가시키고, 'C', 'G', 'T'인 경우에도 각각의 인덱스에 해당하는 값을 증가시킨다.

- 해당 문자의 개수가 checkList에 저장된 개수와 같으면 checkNum을 1 증가시킨다.


myremove() : 제거되는 문자를 처리

- myadd 함수와 반대로 동작 / 해당 문자의 개수를 1 감소시킨다.

- 개수가 checkList에 저장된 개수와 같으면 checkNum을 1 감소시킨다.

 

 


알고리즘 설명

1. checkList의 개수가 0인 경우 (checkList[i] == 0) checkNum을 1 증가시킨다

   (비밀번호 개수가 이미 만족되었다는 뜻)
2. 문자열의 첫 P개 문자에 대해 myadd 함수를 호출하여 초기 상태를 설정한다

   (P까지 돌림)
3. 만약 checkNum이 4인 경우 (모든 문자의 개수가 checkList의 개수와 같은 경우) Result를 1 증가시킨다
4. P부터 S까지 반복하면서 다음 작업을 수행한다

  (이제 P까지를 제외하고 P부터 끝까지 돌리는겨)
5. j = i - P로 설정한다 

  (j = 현재위치 - 문자열)
6. myadd(A[i]) 함수를 호출하여 새로운 문자를 추가한다

7. myremove(A[j]) 함수를 호출하여 제거되는 문자를 처리한다

  (왼쪽에 빠져나오는 애들을 제거해)
8. 만약 checkNum이 4인 경우 Result를 1 증가시킨다
9. 최종적으로 Result를 출력한다.

 

 

 

 

 

 

정말 간단한 알고리즘인데... 완벽하게 이해하는데 3시간이나 걸렸다. 흐앙....

공부하자 ....!!!!!

반응형