Algorithm/문제풀이

[프로그래머스] 튜플

목차 (클릭시 해당 목차로 이동)


     

     

     

     

    문제 설명

    셀수있는 수량의 순서있는 열거 또는 어떤 순서를 따르는 요소들의 모음을 튜플(tuple)이라고 합니다. n개의 요소를 가진 튜플을 n-튜플(n-tuple)이라고 하며, 다음과 같이 표현할 수 있습니다.

    • (a1, a2, a3, ..., an)

    튜플은 다음과 같은 성질을 가지고 있습니다.

    1. 중복된 원소가 있을 수 있습니다. ex : (2, 3, 1, 2)
    2. 원소에 정해진 순서가 있으며, 원소의 순서가 다르면 서로 다른 튜플입니다. ex : (1, 2, 3) ≠ (1, 3, 2)
    3. 튜플의 원소 개수는 유한합니다.

    원소의 개수가 n개이고, 중복되는 원소가 없는 튜플 (a1, a2, a3, ..., an)이 주어질 때(단, a1, a2, ..., an은 자연수), 이는 다음과 같이 집합 기호 '{', '}'를 이용해 표현할 수 있습니다.

    • {{a1}, {a1, a2}, {a1, a2, a3}, {a1, a2, a3, a4}, ... {a1, a2, a3, a4, ..., an}}

    예를 들어 튜플이 (2, 1, 3, 4)인 경우 이는

    • {{2}, {2, 1}, {2, 1, 3}, {2, 1, 3, 4}}

    와 같이 표현할 수 있습니다. 이때, 집합은 원소의 순서가 바뀌어도 상관없으므로

    • {{2}, {2, 1}, {2, 1, 3}, {2, 1, 3, 4}}
    • {{2, 1, 3, 4}, {2}, {2, 1, 3}, {2, 1}}
    • {{1, 2, 3}, {2, 1}, {1, 2, 4, 3}, {2}}

    는 모두 같은 튜플 (2, 1, 3, 4)를 나타냅니다.

    특정 튜플을 표현하는 집합이 담긴 문자열 s가 매개변수로 주어질 때, s가 표현하는 튜플을 배열에 담아 return 하도록 solution 함수를 완성해주세요.

    [제한사항]

    • s의 길이는 5 이상 1,000,000 이하입니다.
    • s는 숫자와 '{', '}', ',' 로만 이루어져 있습니다.
    • 숫자가 0으로 시작하는 경우는 없습니다.
    • s는 항상 중복되는 원소가 없는 튜플을 올바르게 표현하고 있습니다.
    • s가 표현하는 튜플의 원소는 1 이상 100,000 이하인 자연수입니다.
    • return 하는 배열의 길이가 1 이상 500 이하인 경우만 입력으로 주어집니다.

    [입출력 예]

     

    s result
    "{{2},{2,1},{2,1,3},{2,1,3,4}}" [2, 1, 3, 4]
    "{{1,2,3},{2,1},{1,2,4,3},{2}}" [2, 1, 3, 4]
    "{{20,111},{111}}" [111, 20]
    "{{123}}" [123]
    "{{4,2,3},{3},{2,3,4,1},{2,3}}" [3, 2, 4, 1]

    입출력 예에 대한 설명입출력 예 #1

    문제 예시와 같습니다.

    입출력 예 #2

    문제 예시와 같습니다.

    입출력 예 #3

    (111, 20)을 집합 기호를 이용해 표현하면 {{111}, {111,20}}이 되며, 이는 {{20,111},{111}}과 같습니다.

    입출력 예 #4

    (123)을 집합 기호를 이용해 표현하면 {{123}} 입니다.

    입출력 예 #5

    (3, 2, 4, 1)을 집합 기호를 이용해 표현하면 {{3},{3,2},{3,2,4},{3,2,4,1}}이 되며, 이는 {{4,2,3},{3},{2,3,4,1},{2,3}}과 같습니다.

     

     

     


    초기접근

     

    문자열 파싱을 파이썬의 문법을 이용해서 쉽게 할 수 있습니다.

     

    하지만 여기서는 스택을 이용하여 파싱해보겠습니다.

     

    해결 아이디어

    1. 문자열을 파싱해서 data list에 차례로 넣습니다.
    2. data list를 각 원소(data : 리스트)의 길이 순으로 정렬합니다.
    3. 앞에서부터(data) answer에 하나씩 추가합니다. (단 answer에 이미 있는 원소가 아닐 경우에만 answer를 추가합니다.)

     

     

    문자열 파싱

    "{{2},{2,1},{2,1,3},{2,1,3,4}}"  -> [[2], [2,1], [2,1,3], [2,1,3,4]]

     

    "{{20,111},{111}}" -> [[20], [111]]

     

    이렇게 되도록 파싱하려고 합니다. 알고리즘 순서는 아래와 같습니다.

     

    1. 문자열을 list로 변환합니다.
    2. stack (list)를 선언합니다.
    3. 먼저 첫번째 원소 '{'를 넣습니다.
    4. '}'를 만날때까지 모두 스택에 넣습니다.
    5. '}'를 만났을때
      1. 현재 스택에 '{' 밖에 없는 경우 반복을 끝냅니다.
      2. '{'를 만날때까지 들어있던 숫자들을 pop해서 data에 넣습니다.
        1. ','를 만날때까지 number에 숫자들을 append합니다.
        2. ','를 만나면 모아뒀던 number를 순서를 뒤집어 data에 append합니다.
      3. data를 data_list에 넣어줍니다.
      4. 스택에서 '{'를 pop해주고, 스택에 '{'만 남도록 ','가 있을 경우에도 pop해줍니다.

     

     

    여기서 중요한 점은

    스택에서 숫자를 꺼낼때 순서가 뒤집어져서 꺼내지게 됩니다.

    그래서 data에 append해줄때 number를 reverse 해주며 넣는 것 입니다.

     

     

     

     

    파싱후 진행

    사실 이 문제는 문자열을 제대로 파싱하고 나면 그 다음은 쉽습니다.

     

    1. data_list 에 있는 data(리스트)들을 길이 순으로 정렬합니다.

    문제를 보면 알겠지만 result를 제대로된 순서로 구하기 위해서 길이가 작은 순으로 정렬해야 하는 것을 알 수 있습니다.

     

    2. 정렬된 data_list 에서 data를 한개씩 꺼내고, answer에 포함되지 않은 data안의 원소들만 answer에 추가시켜줍니다.

     

     

     

     

    해결코드

    def solution(s):
        answer = []
    
        s = list(s)
    
        stack = []
        stack.append(s[0])
    
        i = 1
        data_list = []
        while True:
            if s[i] == '}':
                # 끝내기
                if stack == ['{']:
                    stack.pop()
                    break
    
                # 들어있던 숫자들 빼기
                data = []
                number = []
                j = len(stack)-1
                while stack[j] != '{':
    
                    if stack[j] == ',':
                        data.append(int(''.join(reversed(number))))
                        stack.pop()
                        number = []
                    else:
                        number.append(stack.pop())
                    j -= 1
                data.append(int(''.join(reversed(number))))
                stack.pop()
                if stack[-1] == ',':
                    stack.pop()
    
                data_list.append(data)
            else:
                stack.append(s[i])
    
            i += 1
    
    
        data_list.sort(key=lambda x:len(x))
    
        for i in range(len(data_list)):
    
            for j in range(len(answer)):
                data_list[i].remove(answer[j])
    
            answer.append(data_list[i][0])
    
        return answer

     

     

     

     

     

     

     

    문자열 파싱 스택 이용하지 않고 해결

     

    해결방법

    파이썬을 이용하면 문자열 파싱을 스택으로 하지 않고 해결할 수 있습니다.

     

    {{2},{2,1},{2,1,3},{2,1,3,4}}

     

    왼쪽 {,{ 와 오른쪽 },}를 지워줍니다. -> "2},{2,1},{2,1,3},{2,1,3,4"
    },{ 기준으로 데이터를 나눕니다. -> ['2', '2,1', '2,1,3', '2,1,3,4']

    문자열로된 원소를 int로 바꾸며 리스트로 변환합니다. -> [[2], [2,1], [2,1,3], [2,1,3,4]]

     

    이것을 코드로 옮기면

    s = s.lstrip('{').rstrip('}').split('},{')
    
    data_list = []
    for ss in s:
        data = []
        for sss in ss.split(','):
            data.append(int(sss))
        data_list.append(data)

     

     

     

    전체 코드

    def solution(s):
        answer = []
    
        s = s.lstrip('{').rstrip('}').split('},{')
    
        data_list = []
        for ss in s:
            data = []
            for sss in ss.split(','):
                data.append(int(sss))
            data_list.append(data)
    
        data_list.sort(key=lambda x:len(x))
    
        for i in range(len(data_list)):
    
            for j in range(len(answer)):
                data_list[i].remove(answer[j])
    
            answer.append(data_list[i][0])
    
        return answer