반응형

동시 요청 - 멀티 쓰레드

클라이언트가 요청을 하면 WAS에서 응답을 할 것이다.

요청을 하면, TCP/IP 커넥션이 연결되고, servelet이라는 것을 호출한다.

그런데 서블릿 객체를 누가 호출하는 것일까?

바로 쓰레드가 호출한다.

쓰레드

  • 애플리케이션 코드를 하나하나 순차적으로 실행하는 것은 쓰레드
  • 자바 메인 메서드를 처음 실행하면 main이라는 이름의 쓰레드가 실행
  • 쓰레드가 없다면 자바 애플리케이션 실행이 불가능
  • 쓰레드는 한번에 하나의 코드 라인만 수행
  • 동시 처리가 필요하다면 쓰레드를 추가로 생성

 

쓰레드가 하나가 있다고 가정하자.

요청이 1개오면 쓰레드를 할당한다.
그리고 이 쓰레드를 가지고 서블릿을 호출해주는 것이다.

그리고나서  쓰레드를 가지고 응답까지 다 하고,


응답이 되고나면 쓰레드가 휴식을 한다.

 

이번에도 쓰레드가 1개이지만, 다중요청인 경우를 살펴보자.

 

요청이 들어와서 쓰레드를 써서 서블릿을 요청을 했다.
그런데 만약에 이 요청을 했는데, 처리가 지연되고 있다.

이상태에서 요청2가 들어오면,
쓰레드는 1개밖에 없기 때문에 쓰레드 대기를 하게 된다.

이러면 무슨 문제가 발생이되냐면,

둘다 처리가 안되고 있다.

그러면, 둘다 기다리다가 Time-out 하거나 오류가 발생할 수 있다.

이것을 해결하는 단순한 방법은,
요청 마다 쓰레드를 생성하는 것이다.

그러면 새로 쓰레드를 만들었기 때문에, 서블릿을 호출하면, 응답하고 나가고, 종료하면 해당 쓰레드를 날리면 될 것이다.

요청 마다 쓰레드 생성의 장단점

  • 장점
    • 동시 요청을 처리할 수 있다.
    • 리소스(CPU, 메모리)가 허용할 때 까지 처리가능
    • 하나의 쓰레드가 지연 되어도, 나머지 쓰레드는 정상 동작한다.
  • 단점
    • 쓰레드는 생성 비용은 매우 비싸다.
      • 고객의 요청이 올 때 마다 쓰레드를 생성하면, 응답 속도가 늦어진다.
    • 쓰레드는 컨텍스트 스위칭 비용이 발생한다.
    • 쓰레드 생성에 제한이 없다.
      • 고객 요청이 너무 많이 오면, CPU, 메모리 임계점을 넘어서 서버가 죽을 수 있다.

 

이러한 이유 때문에 보통 WAS들은 이렇게 구현이 되어있다.

내부에 쓰레드 풀이라는 것이 있는데,
풀안에 미리 쓰레드들이 만들어져서 쓰레드들이 놀고있다가, (200개라고 가정)
요청1과 요청2가 오면, 쓰레드 풀에 "놀고있는 쓰레드 주세요"요청을 해서 쓰레드를 가져다 쓰는 것이다.
그러면 요청 1과 요청2에 1개씩 할당되고 쓰레드풀에는 198개의 쓰레드가 남게된다.

그리고 요청1과 요청2가 쓰레드를 다 사용하면, 쓰레드를 날리는게 아니라,
쓰레드풀에 쓰레드를 반납한다.

그럼 쓰레드풀의 쓰레드는 다시 200개가 된다.

이렇게 쓰레드 풀을 사용하면 어떤 장점이 있냐면,

"우리는 서버에서 200개의 쓰레드가 한계야" 라고 세팅을 해놓으면,
200개보다 더 많은 요청이 오면, 나머지 요청들은 쓰레드 풀에 쓰레드를 요청했을 때 쓰레드가 없으므로
쓰레드 대기(최대 대기인원도 설정할 수 있음) or 거절(설정에따라) 될 수 있다.

쓰레드 풀 (요청 마다 쓰레드 생성의 단점을 보완한 것)

  • 특징
    • 필요한 쓰레드를 쓰레드 풀에 보관하고 관리한다.
    • 쓰레드 풀에 생성 가능한 쓰레드의 최대치를 관리한다. 톰캣은 최대 200개 기본 설정(변경 가능)
  • 사용
    • 쓰레드가 필요하면, 이미 생성되어 있는 쓰레드를 쓰레드 풀에서 꺼내서 사용한다.
    • 사용을 종료하면 쓰레드 풀에 해당 쓰레드를 반납한다.
    • 최대 쓰레드가 모두 사용중이어서 쓰레드 풀에 쓰레드가 없으면?
      • 기다리는 요청은 거절하거나 특정 숫자만큼만 대기하도록 설정할 수 있다.
  • 장점
    • 쓰레드가 미리 생성되어 있으므로, 쓰레드를 생성하고 종료하는 비용(CPU)이 절약되고, 응답 시간이 빠르다.
    • 생성 가능한 쓰레드의 최대치가 있으므로 너무 많은 요청이 들어와도 기존 요청은 안전하게 처리할 수 있다.

 

쓰레드풀 실무 팁 (성능 튜닝)

  • WAS의 주요 튜닝 포인트는 최대 쓰레드(max thread) 수이다.
  • 이 값을 너무 낮게 설정하면?
    • 동시 요청이 많으면, 서버 리소스는 여유롭지만, 클라이언트는 금방 응답 지연
  • 이 값을 너무 높게 설정하면?
    • 동시 요청이 많으면, CPU, 메모리 리소스 임계점 초과로 서버 다운
  • 장애 발생시?
    • 클라우드면 일단 서버부터 늘리고, 이후에 튜닝
    • 클라우드가 아니면 열심히 튜닝

 

예를 들어서 쓰레드 풀을 너무 낮게 설정하면, 예를 들어 10개로 설정했다고 가정해보자.

그러면 요청이 100개가 들어오면, 최대쓰레드가 10개이므로 동시에 10개의 요청만 처리된다.
나머지 90개의 요청은 쓰레드 대기 또는 거절일 것이다.

그러면, 요청이 계속 올 수록 요청은 계속 쌓이고, 계속 밀리면서 장애가 날 것이다.

이떄 CPU 사용률을 확인해봤더니 5%라고 가정해보자.
이것은 개발자가 세팅을 잘못한 것이라고 볼 수 있다.
이러한 경우에 못해도 50%정도는 써줘야하는데,
같은 서버로 10배는 처리할 수 있음에도, aws서버를 증설하거나한다면 부끄러운 일일 것이다. 돈만 10배로 나갈 것이다.

 

쓰레드 풀의 적정 숫자

  • 적정 숫자는 어떻게 찾나요?
  • 애플리케이션 로직의 복잡도, CPU, 메모리, IO 리소스 상황에 따라 모두 다름
  • 성능 테스트
    • 최대한 실제 서비스와 유사하게 성능 테스트 시도
    • 툴: 아파치 ab, 제이미터, nGrinder

 

어쨋든, 핵심은!! WAS의 멀티 쓰레드 지원!!

  • 멀티 쓰레드에 대한 부분은 WAS가 처리
  • 개발자가 멀티 쓰레드 관련 코드를 신경쓰지 않아도 됨
  • 개발자는 마치 싱글 쓰레드 프로그래밍을 하듯이 편리하게 소스 코드를 개발
  • 멀티 쓰레드 환경이므로 싱글톤 객체(서블릿, 스프링 빈)는 주의해서 사용
반응형