[algorithm] 프로그래머스 추석 트래픽 #17676

2 분 소요

문제 풀러가기

코드 보기
    def convert_sec(lines): # 문자열 -> 초로 변경
	    lines = [line.split() for line in lines]
	    lines = [line[1].split(":") + [line[2][0:len(line[2]) - 1]] for line in lines]
	    lines = [[1000*(3600 * int(line[0]) + 60 * int(line[1]) + float(line[2])), int(float(line[3]) * 1000)] for line in lines]
    return [[int(line[0]), int(line[0] - line[1] + 1)] for line in lines]
    
def solution(lines):
    # 날짜를 초로 변환
    lines = convert_sec(lines)
    # 종료순으로 나열
    lines.sort()
    # 정답
    answer = 0
    for i, val, in enumerate(lines):
        # 자기 자신은 포함이기 때문에 1로 시작
        cnt = 1
        # 기준이 되는 초보다 앞에 존재하는 값들만 확인한다.
        for j in range(i + 1, len(lines)):
            if val[0] + 1000 > lines[j][1]:
               cnt += 1
        answer = max(answer, cnt)
    return answer

문제 설명

이번 추석에도 시스템 장애가 없는 명절을 보내고 싶은 어피치는 서버를 증설해야 할지 고민이다. 장애 대비용 서버 증설 여부를 결정하기 위해 작년 추석 기간인 9월 15일 로그 데이터를 분석한 후 초당 최대 처리량을 계산해보기로 했다. 초당 최대 처리량은 요청의 응답 완료 여부에 관계없이 임의 시간부터 1초(=1,000밀리초)간 처리하는 요청의 최대 개수를 의미한다.

입력 형식

  • solution 함수에 전달되는 lines 배열은 N(1 ≦ N ≦ 2,000)개의 로그 문자열로 되어 있으며, 각 로그 문자열마다 요청에 대한 응답완료시간 S와 처리시간 T가 공백으로 구분되어 있다.
  • 응답완료시간 S는 작년 추석인 2016년 9월 15일만 포함하여 고정 길이 2016-09-15 hh:mm:ss.sss 형식으로 되어 있다.
  • 처리시간 T0.1s, 0.312s, 2s 와 같이 최대 소수점 셋째 자리까지 기록하며 뒤에는 초 단위를 의미하는 s로 끝난다.
  • 예를 들어, 로그 문자열 2016-09-15 03:10:33.020 0.011s은 2016년 9월 15일 오전 3시 10분 33.010초부터 2016년 9월 15일 오전 3시 10분 33.020초까지 0.011초 동안 처리된 요청을 의미한다. (처리시간은 시작시간과 끝시간을 포함)
  • 서버에는 타임아웃이 3초로 적용되어 있기 때문에 처리시간은 0.001 ≦ T ≦ 3.000이다.
  • lines 배열은 응답완료시간 S를 기준으로 오름차순 정렬되어 있다.

출력 형식

  • solution 함수에서는 로그 데이터 lines 배열에 대해 초당 최대 처리량을 리턴한다

설명 & 구현 방법

두 가지의 어려움이 있었다.

  1. 날짜를 좀 더 편하게 계산할 수 없을까?
    • 문자열 인 날짜를 초(int)를 통해 표현해버리면 날짜, 시간, 분, 초가 변하는 것을 신경쓸 필요가 없어진다.
    • 초로 바꾼 다음 해당 배열을 정렬하게 되면 종료 시간을 기준으로 정렬된다.
    • 이 문제를 통해 모든 시간, 날짜 관련된 문제하나의 기준(시간, 분, 초 etc)으로 변환하여 풀면 정말 간단하다는 것을 배울 수 있었다.
  2. 한 시점도 아니고, 트래픽이 몰리는 1초 구간을 어떻게 찾지?
    • 1초 안에서 가장 많이 존재하는 트래픽들을 구해야 하기 때문에 생각을 잘 해야했다. 또, 0.001초 차이로 return 값이 달라지기 때문이다.
    • 정렬된 배열을 돌면서 종료 시간 ~ 종료시간 + 1초 사이에 포함되는(자기 자신을 포함하여) 시작 시간을 센 뒤 가장 높은 값을 반환한다.

댓글남기기