지리 가중 회귀와 머신러닝을 활용한 데이터 센터 최적 입지 선정

Author

이우진, 김민영, 윤선영, 김수현

1 연구 질문

수도권에 집중된 데이터 센터로 인해 발생하는 전력 수급 불균형과 지역 불균형 문제를 해결하기 위해, 대한민국 내에서 데이터 센터의 최적 입지를 어떻게 선정할 것인가?

2 주요 변수

  • 종속 변수: 지역별 현재 데이터 센터 수
  • 독립 변수:
    • 자연재해 위험: 침수 위험, 지진 위험, 산사태
    • 인프라 조건: 인구 밀도, 전력 공급 안정성, 주유소, LPG 충전소, 화재 위험 구역
    • 기타 요인: 면적, 풍력 발전, 댐
    • 총 16개 변수 사용

3 연구 방법론

  1. 특성 중요도 분석:
    • 랜덤 포레스트(Random Forest), 의사결정나무(Decision Tree), XGBoost 모델을 사용하여 데이터 센터 입지 선정에 영향을 미치는 주요 변수들의 중요도를 분석.
    • 최종적으로 랜덤 포레스트 모델을 채택.
  2. 지리 가중 회귀 (GWR):
    • GWR 모델을 사용하여 변수들의 공간적 이질성을 분석하고 지역별 회귀 계수를 추정.
  3. 입지 적합성 점수 산출:
    • 랜덤 포레스트 모델에서 얻은 변수 중요도와 GWR 모델의 회귀 계수를 결합하여 각 지역의 최종 입지 적합성 점수를 계산.

4 16개 변수 상세 설명

아래는 연구에 사용된 16개 변수에 대한 상세 설명입니다. (출처: 논문 Table 1, 3)

4.1 종속 변수 (Target Variable)

  1. 지역별 현재 데이터 센터 수 (Current Number of Data Centers by Region):
    • 설명: 각 행정구역(시/군/구)에 위치한 공공 기관 데이터 센터의 수. 데이터 센터의 현재 분포를 나타내는 핵심 지표.
    • 출처 기관: 행정안전부 (Ministry of Public Administration and Security) - https://www.mois.go.kr

4.2 독립 변수 (Independent Variables / Features)

4.2.1 재해 위험 관련 변수

  1. 고립위험 (Isolation Risk):
    • 설명: 재난 발생 시 고립될 위험이 있는 지역에 대한 데이터.
    • 출처 기관: 국토교통부 (Ministry of Land, Infrastructure and Transport) - https://www.molit.go.kr - 재해위험지구 데이터
  2. 붕괴위험시설 (Collapse-Prone Facilities):
    • 설명: 재난 발생 시 붕괴 위험이 있는 시설물(노후 건축물 등) 관련 데이터.
    • 출처 기관: 행정안전부 (Ministry of Public Administration and Security) - https://www.mois.go.kr - 재해위험지구 표준 데이터
  3. 유실위험 (Loss Risk):
    • 설명: 홍수나 해일 등으로 인해 유실될 위험이 있는 지역에 대한 데이터.
    • 출처 기관: 국토교통부 (Ministry of Land, Infrastructure and Transport) - https://www.molit.go.kr - 재해위험지구 데이터
  4. 취약방재 (Vulnerable Disaster Prevention):
    • 설명: 방재 시스템이나 시설이 취약한 지역에 대한 데이터.
    • 출처 기관: 행정안전부 (Ministry of Public Administration and Security) - https://www.mois.go.kr - 재해위험지구 표준 데이터
  5. 침수위험 (Flood Risk):
    • 설명: 홍수 발생 시 침수될 가능성이 있는 지역에 대한 위험도 데이터.
    • 출처 기관: 행정안전부 (Ministry of Public Administration and Security) - https://www.mois.go.kr - 재해위험지구 표준 데이터
  6. 쓰나미위험 (Tsunami Risk):
    • 설명: 해안 지역의 쓰나미 발생 시 예상되는 위험도 데이터.
    • 출처 기관: 행정안전부 (Ministry of Public Administration and Security) - https://www.mois.go.kr - 재해위험지구 표준 데이터
  7. 지진 이력 (Earthquake History):
    • 설명: 과거에 발생한 지진의 진도 및 빈도에 대한 기록.
    • 출처 기관: 행정안전부 (Ministry of Public Administration and Security) - https://www.mois.go.kr, 기상청 (Korea Meteorological Administration) - https://www.kma.go.kr
  8. 산사태 (Landslide):
    • 설명: 최근 5년간 발생한 산사태 이력 및 산사태 위험 지역에 대한 정보.
    • 출처 기관: 산림청 (Korea Forest Service) - https://www.forest.go.kr

4.2.2 인프라 및 사회적 요인 관련 변수

  1. 주유소 (Gas Stations):
    • 설명: 지역 내 등록된 주유소의 현황. 잠재적 위험 시설물로 간주.
    • 출처 기관: 산업통상자원부 (Ministry of Trade, Industry and Energy) - https://www.motie.go.kr
  2. LPG 충전소 (LPG Facilities):
    • 설명: 지역 내 등록된 LPG 충전소 현황. 주유소와 마찬가지로 잠재적 위험 시설물.
    • 출처 기관: (논문에 명시되지 않았으나, 주유소와 유사한 출처로 추정)
  3. 화재위험지구 (Fire Hazard Zones):
    • 설명: 화재 발생 위험이 높게 지정된 구역.
    • 출처 기관: 행정안전부 (Ministry of Public Administration and Security) - https://www.mois.go.kr
  4. 면적 (Area):
    • 설명: 지역의 토지 또는 건축물 면적 통계.
    • 출처 기관: 국토교통부 (Ministry of Land, Infrastructure and Transport) - https://www.molit.go.kr
  5. 풍력 발전 (Wind Power Generation):
    • 설명: 지역별/시간별 태양광 및 풍력 발전량. 재생 가능 에너지 접근성을 나타냄.
    • 출처 기관: 한국전력거래소 (Korea Electric Power Exchange) - https://www.kpx.or.kr
  6. 댐 (Dams):
    • 설명: 다목적댐 운영 정보. 안정적인 수자원 및 전력 공급과 관련.
    • 출처 기관: 한국수자원공사 (Korea Water Resources Corporation) - https://www.kwater.or.kr
  7. 인구 (Population):
    • 설명: 국토지리정보원에서 제공하는 총인구 통계. 인프라 수요 및 노동력과 관련.
    • 출처 기관: 국토교통부 (Ministry of Land, Infrastructure and Transport) - https://www.molit.go.kr