logo

무신사

Site Reliability Engineer
Type
무신사
Job group
Engineering
Job
SRE
Experience Level
Experienced 8 years or more
Job Types
Full-time
Locations
무신사 오피스 성수대한민국 서울특별시 성동구 성수동2가 277-47, 무신사 성수

[무신사 테크 ​소개]

팀 ​무신사 ​테크 조직은 ​혁신의 원동력이자 변화를 선도하는 ​핵심 ​기술 조직입니다. ​고객과 입점 브랜드가 ​각자의 고유한 ​개성을 ​자유롭게 표현할 ​수 ​있도록, ​데이터와 기술을 기반으로 ​한 ​개인화된 경험을 제공합니다. ​무신사 ​테크는 ​새로운 도전을 두려워하지 ​않으며, 항상 ​새로운 ​영역에서의 성공을 ​꿈꿉니다.

무신사는 ​한국을 ​넘어 글로벌 시장에서도 ​경쟁력 있는 ​서비스를 선보이고자 OCMP(One Core Multi Platform)를 구축하고 있습니다. 이를 통해 전체 비즈니스의 폭발적 성장을 지원하며 무신사 테크는 끊임없는 도전과 혁신으로 고객에게 더 나은 가치를 제공하고자 합니다.



[팀 소개]

저희 팀은 무신사의 각 서비스와 연관된 모든 인프라 시스템을 설계하고 안정적으로 운영하며, 고객이 언제 어디서든 빠르고 안정적으로 온라인 쇼핑을 즐길 수 있도록 지원하는 핵심 기술 조직입니다. 저희는 단순히 인프라를 운영하는 데 머무르지 않고, 엔지니어링적 접근을 통해 시스템을 개선하고 발전시키는 것을 목표로 합니다.

무신사의 인프라는 AWS 기반으로 운영되며, 퍼블릭 클라우드 환경에 최적화된 아키텍처를 지속적으로 탐구하고 적용합니다. Kubernetes(EKS)를 중심으로 한 클라우드 네이티브 기술을 적극 활용하고 있으며, Immutable 인프라와 선언형 인프라 방식을 선호하여 안정성과 재현성을 확보합니다. 반복적이고 단순한 운영 업무를 줄이기 위해 자동화를 적극적으로 추진합니다. 직접 개발한 인프라 플랫폼을 통해 개발팀은 즉시 활용 가능한 인프라 환경을 얻을 수 있으며, 이를 기반으로 빠르게 서비스를 확장하거나 대규모 트래픽을 안정적으로 처리할 수 있습니다. IaC(Infrastructure as Code)와 CI/CD 파이프라인을 통해 인프라를 코드로 정의하고, 안정적이면서도 민첩한 변경이 가능하도록 체계를 갖추고 있습니다.

무신사 서비스는 블랙프라이데이와 같은 대규모 이벤트를 통해 순간적으로 평소 대비 20배 이상의 트래픽이 발생하기도 합니다. SRE 팀은 이러한 상황에서도 안정적인 서비스를 제공하기 위해 자동화된 프로비저닝 플랫폼을 구축했습니다. 이 플랫폼은 마케팅 이벤트 일정과 연계되어 사전에 필요한 인프라 리소스를 자동으로 확장하며, 예측 불가능한 대규모 트래픽 상황에서도 무중단 운영을 가능하게 합니다.


[담당 업무]

  • Cloud 환경 운영에 필요한 업무를 담당합니다.
  • AWS 기반 인프라를 전사 서비스의 핵심 플랫폼으로 운영합니다.
  • EC2, IAM 권한 관리, 방화벽 설정 등 주요 AWS 서비스 활용 및 최적화를 위해 노력합니ㅏㄷ.
  • Kubernetes 기반 서비스 운영에 필요한 업무를 담당합니다.
  • 모든 애플리케이션을 EKS 기반으로 컨테이너화합니다.
  • ArgoCD를 통한 배포 및 GitOps 방식을 도입합니다.
  • IaC(Infrastructure as Code) 지향합니다.
  • Terraform, Terragrunt를 활용하여 모든 인프라를 코드로 관리합니다.
  • 표준화된 모듈 설계 및 재사용 가능한 인프라 구성을 제공합니다.
  • 코드 리뷰 및 Git 기반 워크플로우를 통한 변경 및 관리합니다.
  • 자동화 및 효율화를 통한 업무를 추진합니다.
  • 반복적이고 단순한 운영 업무를 자동화하여 운영 부담을 최소화합니다.
  • CI/CD 파이프라인 최적화 및 배포 자동화를 추진합니다.
  • 모니터링, 알림, 장애 대응 프로세스의 자동화를 추진합니다.
  • 대규모 트래픽 대응에 필요한 업무를 수행합니다.
  • 대형 이벤트 및 시즌성 트래픽 급증에 대비한 사전 프로비저닝 자동화를 추진합니다.
  • Karpenter, keda 기반의 자원 관리 체계를 구축합니다.
  • 운영 안정성 확보를 위한 업무를 수행합니다.
  • SLA/SLO 기반의 서비스 신뢰성을 위해 관리 및 노력합니다.
  • 장애 후 Postmortem을 통한 근본 원인을 제게하며 개선을 위해 노력합니다.


[자격 요건]

  • 개발 및 인프라 운영 경력 포함 8년 이상 혹은 그에 준하는 역량을 보유하신 분
  • 클라우드 및 Kubernetes 운영 경험이 있으신 분
  • Terraform, Terragrunt 등 IaC 기반의 인프라 운영 경험이 있으신 분
  • 트래픽 급증 환경에서의 안정적 운영 경험이 있으신 분


[우대 사항]

  • 기술 과제를 주도적으로 수행한 경험이 있으신 분 (Cloud Native 기반 아키텍처 설계 및 기술 표준 수립, SLA/SLO 달성을 위한 안정성 강화 등)
  • Java, Go, Python, Node.js 등 최소 한 가지 이상의 개발 언어 사용이 가능하신 분
  • e-commerce 서비스의 특성을 잘 이해하고 있으신 분
  • SLA/SLO/SLI 설계 및 운영 경험이 있으신 분
  • CI/CD, 배포 자동화, GitOps 도입 경험이 있으신 분


[지원 서류]

  • 이력서 또는 경력 기술서(필수) / 포트폴리오(선택)
  • (참고) 제출 서류 작성 팁
  • 이력서와 포트폴리오에는 왜 그 문제를 해결해야 했는지, 어떤 전략으로 접근했는지, 그리고 어떤 수치적 성과를 냈는지가 잘 드러나도록 작성해 주세요. 가능하다면 생산성 향상 등 정량적인 결과를 포함해 주시고, 프로젝트별 기여도도 함께 표기해 주세요. 프로젝트의 성공 여부와 관계없이, 1차 인터뷰에서 깊이 있는 대화를 나눌 수 있도록 본인이 충분히 이해하고 설명할 수 있는 내용 중심으로 구성해 주시면 더욱 좋습니다.


[근무조건]

  • 정규직


[전형절차]

  • 접수 기간 : 상시지원
  • 전형 절차 : 서류 전형 - 1차 인터뷰 - 2차 인터뷰 - 처우 협의 - 최종합격
  • 문의사항 : [email protected]


[기타사항]

  • 본 채용은 수시 진행으로 우수 인재 채용 시 마감될 수 있습니다.
  • 최종 합격자는 3개월간의 수습기간이 적용되며, 해당 기간 중 급여는 100% 지급됩니다.
  • 입사지원 서류에 허위사실이 발견될 경우, 채용확정 이후라도 채용이 취소될 수 있습니다.


Share
Site Reliability Engineer

[무신사 테크 ​소개]

팀 ​무신사 ​테크 조직은 ​혁신의 원동력이자 변화를 선도하는 ​핵심 ​기술 조직입니다. ​고객과 입점 브랜드가 ​각자의 고유한 ​개성을 ​자유롭게 표현할 ​수 ​있도록, ​데이터와 기술을 기반으로 ​한 ​개인화된 경험을 제공합니다. ​무신사 ​테크는 ​새로운 도전을 두려워하지 ​않으며, 항상 ​새로운 ​영역에서의 성공을 ​꿈꿉니다.

무신사는 ​한국을 ​넘어 글로벌 시장에서도 ​경쟁력 있는 ​서비스를 선보이고자 OCMP(One Core Multi Platform)를 구축하고 있습니다. 이를 통해 전체 비즈니스의 폭발적 성장을 지원하며 무신사 테크는 끊임없는 도전과 혁신으로 고객에게 더 나은 가치를 제공하고자 합니다.



[팀 소개]

저희 팀은 무신사의 각 서비스와 연관된 모든 인프라 시스템을 설계하고 안정적으로 운영하며, 고객이 언제 어디서든 빠르고 안정적으로 온라인 쇼핑을 즐길 수 있도록 지원하는 핵심 기술 조직입니다. 저희는 단순히 인프라를 운영하는 데 머무르지 않고, 엔지니어링적 접근을 통해 시스템을 개선하고 발전시키는 것을 목표로 합니다.

무신사의 인프라는 AWS 기반으로 운영되며, 퍼블릭 클라우드 환경에 최적화된 아키텍처를 지속적으로 탐구하고 적용합니다. Kubernetes(EKS)를 중심으로 한 클라우드 네이티브 기술을 적극 활용하고 있으며, Immutable 인프라와 선언형 인프라 방식을 선호하여 안정성과 재현성을 확보합니다. 반복적이고 단순한 운영 업무를 줄이기 위해 자동화를 적극적으로 추진합니다. 직접 개발한 인프라 플랫폼을 통해 개발팀은 즉시 활용 가능한 인프라 환경을 얻을 수 있으며, 이를 기반으로 빠르게 서비스를 확장하거나 대규모 트래픽을 안정적으로 처리할 수 있습니다. IaC(Infrastructure as Code)와 CI/CD 파이프라인을 통해 인프라를 코드로 정의하고, 안정적이면서도 민첩한 변경이 가능하도록 체계를 갖추고 있습니다.

무신사 서비스는 블랙프라이데이와 같은 대규모 이벤트를 통해 순간적으로 평소 대비 20배 이상의 트래픽이 발생하기도 합니다. SRE 팀은 이러한 상황에서도 안정적인 서비스를 제공하기 위해 자동화된 프로비저닝 플랫폼을 구축했습니다. 이 플랫폼은 마케팅 이벤트 일정과 연계되어 사전에 필요한 인프라 리소스를 자동으로 확장하며, 예측 불가능한 대규모 트래픽 상황에서도 무중단 운영을 가능하게 합니다.


[담당 업무]

  • Cloud 환경 운영에 필요한 업무를 담당합니다.
  • AWS 기반 인프라를 전사 서비스의 핵심 플랫폼으로 운영합니다.
  • EC2, IAM 권한 관리, 방화벽 설정 등 주요 AWS 서비스 활용 및 최적화를 위해 노력합니ㅏㄷ.
  • Kubernetes 기반 서비스 운영에 필요한 업무를 담당합니다.
  • 모든 애플리케이션을 EKS 기반으로 컨테이너화합니다.
  • ArgoCD를 통한 배포 및 GitOps 방식을 도입합니다.
  • IaC(Infrastructure as Code) 지향합니다.
  • Terraform, Terragrunt를 활용하여 모든 인프라를 코드로 관리합니다.
  • 표준화된 모듈 설계 및 재사용 가능한 인프라 구성을 제공합니다.
  • 코드 리뷰 및 Git 기반 워크플로우를 통한 변경 및 관리합니다.
  • 자동화 및 효율화를 통한 업무를 추진합니다.
  • 반복적이고 단순한 운영 업무를 자동화하여 운영 부담을 최소화합니다.
  • CI/CD 파이프라인 최적화 및 배포 자동화를 추진합니다.
  • 모니터링, 알림, 장애 대응 프로세스의 자동화를 추진합니다.
  • 대규모 트래픽 대응에 필요한 업무를 수행합니다.
  • 대형 이벤트 및 시즌성 트래픽 급증에 대비한 사전 프로비저닝 자동화를 추진합니다.
  • Karpenter, keda 기반의 자원 관리 체계를 구축합니다.
  • 운영 안정성 확보를 위한 업무를 수행합니다.
  • SLA/SLO 기반의 서비스 신뢰성을 위해 관리 및 노력합니다.
  • 장애 후 Postmortem을 통한 근본 원인을 제게하며 개선을 위해 노력합니다.


[자격 요건]

  • 개발 및 인프라 운영 경력 포함 8년 이상 혹은 그에 준하는 역량을 보유하신 분
  • 클라우드 및 Kubernetes 운영 경험이 있으신 분
  • Terraform, Terragrunt 등 IaC 기반의 인프라 운영 경험이 있으신 분
  • 트래픽 급증 환경에서의 안정적 운영 경험이 있으신 분


[우대 사항]

  • 기술 과제를 주도적으로 수행한 경험이 있으신 분 (Cloud Native 기반 아키텍처 설계 및 기술 표준 수립, SLA/SLO 달성을 위한 안정성 강화 등)
  • Java, Go, Python, Node.js 등 최소 한 가지 이상의 개발 언어 사용이 가능하신 분
  • e-commerce 서비스의 특성을 잘 이해하고 있으신 분
  • SLA/SLO/SLI 설계 및 운영 경험이 있으신 분
  • CI/CD, 배포 자동화, GitOps 도입 경험이 있으신 분


[지원 서류]

  • 이력서 또는 경력 기술서(필수) / 포트폴리오(선택)
  • (참고) 제출 서류 작성 팁
  • 이력서와 포트폴리오에는 왜 그 문제를 해결해야 했는지, 어떤 전략으로 접근했는지, 그리고 어떤 수치적 성과를 냈는지가 잘 드러나도록 작성해 주세요. 가능하다면 생산성 향상 등 정량적인 결과를 포함해 주시고, 프로젝트별 기여도도 함께 표기해 주세요. 프로젝트의 성공 여부와 관계없이, 1차 인터뷰에서 깊이 있는 대화를 나눌 수 있도록 본인이 충분히 이해하고 설명할 수 있는 내용 중심으로 구성해 주시면 더욱 좋습니다.


[근무조건]

  • 정규직


[전형절차]

  • 접수 기간 : 상시지원
  • 전형 절차 : 서류 전형 - 1차 인터뷰 - 2차 인터뷰 - 처우 협의 - 최종합격
  • 문의사항 : [email protected]


[기타사항]

  • 본 채용은 수시 진행으로 우수 인재 채용 시 마감될 수 있습니다.
  • 최종 합격자는 3개월간의 수습기간이 적용되며, 해당 기간 중 급여는 100% 지급됩니다.
  • 입사지원 서류에 허위사실이 발견될 경우, 채용확정 이후라도 채용이 취소될 수 있습니다.