Post

Data-driven radiative hydrodynamics simulations of the solar photosphere using physics-informed neural networks: proof of concept (Christoph U. Keller, 2025)

태양 광구의 데이터 기반 복사 유체 역학 시뮬레이션: 물리 정보 신경망(PINN)을 활용한 개념 증명 논문 분석

Christoph U. Keller의 논문 “물리 정보 신경망을 이용한 태양 광구의 데이터 기반 복사 유체 역학 시뮬레이션: 개념 증명”은 태양 대기의 복잡한 물리 현상을 이해하고 관측 데이터와 일치하는 모델을 구축하기 위한 새로운 접근 방식을 제안합니다. 이 논문은 전통적인 수치 시뮬레이션과 관측 데이터 역산(inversion) 방법의 한계를 극복하고자 물리 정보 신경망 (Physics-Informed Neural Networks, PINNs)을 활용하고 있습니다.

서론: 기존 연구의 한계와 PINN의 가능성

현재 태양 대기를 연구하는 주된 두 가지 방법론은 수치 시뮬레이션관측 데이터 역산입니다.

  • 수치 시뮬레이션: 복사 유체 역학 방정식을 풀어 시간에 따른 3차원 모델을 생성하지만, 관측 데이터를 경계 조건으로 직접 통합하기 어려워 주로 통계적 비교에 국한됩니다.
  • 관측 데이터 역산: 관측 결과를 잘 재현하도록 설계되지만, 물리적으로 자기 일관성(self-consistency)이 부족한 모델을 생성하는 경향이 있으며, 주로 1차원 모델 대기를 제공합니다.

이러한 한계를 극복하기 위해, 본 논문은 PINN을 사용하여 시간 의존적인 복사 유체 역학 방정식을 풀고 관측 데이터를 경계 조건으로 통합하는 새로운 방법을 제안합니다. PINN심층 신경망 (Deep Neural Network, DNN)을 사용하여 편미분 방정식 (PDEs)의 해를 근사하며, 물리 방정식과 관측 데이터에 대한 잔차를 최소화하여 네트워크 매개변수를 결정합니다. 결과 모델은 모든 차원에서 연속적이며, 공간 및 시간적으로 관심 영역을 확대할 수 있고, 직접 관측되지 않는 물리 매개변수(예: 수평 속도)에 대한 정보도 제공할 수 있다는 장점이 있습니다. 이 논문은 이러한 새로운 접근 방식의 첫 번째 개념 증명을 제시하고, 기본 방법론을 상세히 설명하며, PINN이 가능하게 하는 다양한 응용 분야에 대한 전망을 제공합니다.

방법론: PINN을 활용한 태양 광구 모델링

본 연구에서는 PINN을 사용하여 태양 광구의 시간 의존적, 3차원 모델을 생성합니다. 이 모델은 단일 파장에서의 연속체 이미지 시퀀스만을 사용하여 물리적으로 일관된 결과를 도출하는 것을 목표로 합니다. 개발 및 검증은 기존 수치 시뮬레이션(Bifrost)에서 파생된 합성 이미지를 사용하여 수행했습니다.

1. 수치 모델 (Bifrost 시뮬레이션)

개발 및 검증을 위해 Bifrost 수치 시뮬레이션 (Gudiksen et al. 2011) 결과를 사용했습니다. 특히, 최소 자기장을 가진 조용한 태양(quiet sun) 시뮬레이션 데이터(qs024048_by3363)를 활용하여 수평으로 96x96 그리드 포인트, 수직으로 -800km에서 +500km까지 64 그리드 포인트, 그리고 50초 간격의 20개 스냅샷을 선택하여 사용했습니다. 이는 수평으로 4600km x 4600km, 수직으로 1300km, 시간적으로 1000초에 걸친 4차원 모델 큐브를 구성했습니다.

2. 물리 정보 신경망 (PINNs)

PINN심층 신경망을 사용하여 미지의 해를 근사하고, 시간 및 3차원 공간 영역($\Omega$)에서 PDE를 만족하도록 학습됩니다. PDE는 제약 조건으로 재구성되어 최소화됩니다. 예를 들어, 연속 방정식

\[\frac{\partial\rho}{\partial t} = -\nabla \cdot (\rho\vec{v})\]

\[\sum_{\Omega}|\frac{\partial\rho}{\partial t}+\nabla\cdot(\rho\vec{v})|^{2}\]

를 최소화하는 형태로 표현됩니다. 여기서 밀도와 세 가지 속도 벡터 구성 요소는 공간과 시간의 함수로 심층 신경망에 의해 설명됩니다. 심층 신경망의 가중치는 PDE 제약 조건관측 제약 조건을 최소화하여 결정됩니다.

3. 물리 매개변수 선택

PINN심층 신경망이 공간과 시간의 함수로 표현해야 할 물리 매개변수를 선택할 수 있다는 장점이 있습니다. 본 연구에서는 속도 벡터 성분($v_x, v_y, v_z$), 밀도의 로그($log_{10} \rho$), 온도의 로그($log_{10} T$)를 심층 신경망이 결정하도록 설계했습니다. 밀도와 온도는 높이에 따라 지수적으로 감소하므로 로그 값을 사용하는 것이 유리한 접근 방식입니다. 이는 신경망이 큰 동적 범위를 가진 양을 잘 표현하지 못하는 점을 보완하고, 대기 중 다른 높이에서 밀도와 온도에 대한 (상대적) 잔차가 비슷한 크기를 갖도록 하며, 밀도와 온도 자체가 항상 양수가 되도록 보장하는 효과가 있습니다.

4. 상태 방정식 (Equation of State)

운동량 및 에너지 PDE는 압력에 대한 지식을 필요로 합니다. 압력은 상태 방정식을 통해 밀도와 온도의 함수로 계산합니다. 본 연구에서는 수소의 이온화만 고려하여, 사하 방정식(Saha equation)을 사용하여 수소의 이온화 분율(X)을 계산했습니다. 이를 통해 이상 기체 법칙을 사용하여 총 압력의 자연로그($ln~p$)를 계산했습니다.

5. 불투명도 및 광학적 깊이

복사는 태양 미세 구조(granulation)를 이해하는 데 근본적으로 중요하므로 불투명도와 광학적 깊이를 계산할 수 있어야 합니다. 이를 위해 온도와 압력의 함수로 불투명도를 반환하는 신경망을 학습시켰습니다. 이 불투명도 신경망은 입력값(압력의 로그 및 온도의 로그)을 $\pm1$ 범위로 정규화하는 스케일링 계층, 각각 4, 8, 8개의 노드를 가진 3개의 완전 연결 은닉 계층(쌍곡탄젠트 활성화 함수 사용), 단일 노드의 완전 연결 계층(선형 활성화 함수 사용), 그리고 출력을 불투명도의 물리적 단위(질량당, 로그 스케일)로 변환하는 스케일링 계층으로 구성했습니다. 로슬랜드 평균 불투명도와 500nm에서의 연속체 불투명도를 위한 두 가지 버전의 신경망이 학습되었습니다. 수직 방향의 광학적 깊이는 불투명도를 위에서 아래로 수치 적분(사다리꼴 공식)하여 계산했습니다.

6. 복사 손실 (Radiative Loss)

복사 손실 계산은 계산 비용이 많이 듭니다. 본 개념 증명 연구에서는 Abbett & Fisher (2012)의 근사법에서 영감을 받은 매우 단순화된 접근 방식을 사용했습니다. 여기서 각도와 광학적 깊이에 대한 적분은 해석적으로 수행됩니다. 이 근사법은 3개의 자유 매개변수를 Bifrost 시뮬레이션에 맞춰 조정함으로써 질량당 복사 손실($q_{rad}$)을 계산했습니다:

\[q_{rad} = 0.3366811\kappa_{R}\sigma T^4 - 0.0178391\sigma T^4/(1.0+4.440909\tau_{R})\]

여기서 $\kappa_R$은 국소 로슬랜드 평균 불투명도, $\sigma$는 슈테판-볼츠만 상수, $\tau_R$은 해당 수직 방향 광학적 깊이입니다. 이 근사법은 항상 양수 값을 반환하므로 Bifrost 시뮬레이션에서 보이는 복사 가열(음의 복사 손실)은 포착하는 데에는 한계가 있습니다.

7. 연속 방정식, 운동량 방정식, 내부 에너지 방정식

이러한 기본적인 유체 역학 방정식들은 PINN이 만족해야 할 제약 조건으로 공식화됩니다.

  • 연속 방정식: 질량 보존을 나타내며,

    \[\frac{1}{\sigma_{v_z}^2}\sum_{\Omega}[\frac{\partial ln~\rho}{\partial t}+v_{x}\frac{\partial ln~\rho}{\partial x}+v_{y}\frac{\partial ln~\rho}{\partial y}+v_{z}\frac{\partial ln~\rho}{\partial z}+\frac{\partial v_{x}}{\partial x}+\frac{\partial v_{y}}{\partial y}+\frac{\partial v_{z}}{\partial z}]^{2}\]

    를 최소화하도록 합니다. 여기서 $\sigma_{v_z}^2$는 수직 속도의 분산입니다. 자명한 해(정적 해)를 피하기 위해 수직 속도의 분산으로 나누어 정규화했습니다.

  • 운동량 방정식: x, y, z 축에 대한 운동량 PDE는 제약 조건으로 공식화됩니다. z 방향 운동량 방정식은 수직 속도의 분산으로 정규화하여, $v_z=0$인 자명하고 부정확한 해를 피하도록 했습니다. 수평 운동량 방정식은 정규화되지 않아 비현실적으로 큰 수평 속도를 억제하도록 했습니다.
  • 내부 에너지 방정식: 질량당 내부 에너지($e$)로 표현되며,

    \[e=\frac{3p}{2\rho}+\frac{0.934X\cdot13.6eV}{1.29AMU}\]

    로 주어집니다. 내부 에너지 PDE 제약 조건은

    \[\sum_{\Omega}[\frac{\partial e}{\partial t}+v_{x}\frac{\partial e}{\partial x}+v_{y}\frac{\partial e}{\partial y}+v_{z}\frac{\partial e}{\partial z}+\frac{p}{\rho}(\frac{\partial v_{x}}{\partial x}+\frac{\partial v_{y}}{\partial y}+\frac{\partial v_{z}}{\partial z})+q_{rad}]^{2}\]

    입니다.

8. 추가 제약 조건

지역적 제약 조건 외에도 전체 부피에 작용하는 전역 제약 조건을 추가하여 관측 정보가 없는 깊이와 높이에서 현실적인 결과를 얻도록 기여합니다.

  • 평균 밀도 및 온도 층화: 각 시간 단계에서 평균 밀도($log~\rho_{sun}$)와 온도($log~T_{sun}$) 층화를 고정하여 $z$ 방향으로의 임의적인 이동을 억제하는 역할을 합니다.
  • 순 질량 흐름 최소화: 임의의 (x,y) 평면을 통과하는 순 질량 흐름을 모든 시간과 높이에서 최소화하도록 했습니다.
  • 총 에너지 플럭스 일정: 모든 높이와 시간에서 총 에너지 플럭스가 동일하도록 요구했습니다($6.3 \cdot 10^7 W/m^2$).

9. 관측 제약 조건

본 개념 증명에서는 500nm에서의 단색 연속체 이미지를 관측 제약 조건으로 사용합니다. 강도는 PINN 출력으로부터 국소 열 평형 상태에서 수직 방향으로 복사 전달 방정식을 수치 적분하여 얻습니다. 관측 제약 조건은 관측된 이미지와 계산된 연속체 강도 간의 차이의 제곱합으로 구현됩니다:

\(\sum_{x,y,t}[I_{obs}(t)-\frac{2hc^{2}}{\lambda^{5}}\int\frac{e^{-\tau}}{e^{\frac{hc}{\lambda kT}}-1}d\tau]^{2}\).

10. 심층 신경망(DNN) 설계

DNN은 물리적 좌표 $x, y, z, t$를 $\pm1$ 범위로 재조정하는 계층, 각각 $32, 64, 128, 128, 128$개의 노드를 가진 5개의 은닉 완전 연결 계층(쌍곡탄젠트 활성화 함수), 5개의 노드와 선형 활성화 함수를 가진 출력 계층으로 구성하였으며, 마지막 계층은 신경망 출력을 속도 벡터와 밀도 및 온도의 로그에 대한 물리적 단위로 다시 조정하는 역할을 합니다. 네트워크에는 총 44,261개의 자유 매개변수를 포함합니다. 이 DNN 구조가 Bifrost 시뮬레이션을 충분히 정확하게 표현할 수 있는지 확인하기 위해, Bifrost 시뮬레이션에 직접 학습시킨 결과, 공간 해상도에서 약간의 손실을 제외하고는 수치 시뮬레이션을 높은 수준으로 재현함을 확인할 수 있었습니다.

11. 시작 값 (Starting Values)

효율적인 최적화를 위해 좋은 시작점이 중요합니다. 이를 위해 정규화된 연속체 강도로부터 밀도, 온도, 수직 속도의 수직 층화를 추정할 수 있는 int2mod라는 신경망을 개발하여 활용했습니다. int2mod 신경망은 정규화된 강도와 z 좌표를 입력으로 받아 수직 속도와 밀도 및 온도의 로그를 출력하도록 했습니다. 이 int2mod 신경망의 출력을 사용하여 PINN을 초기 학습에 사용했습니다. 또한, 연속 방정식의 비탄성 근사를 사용하여 초기 수평 속도를 추정하도록 했습니다.

검증 (Validation)

PINN 접근 방식의 검증은 Bifrost 시뮬레이션에서 생성된 20개의 500nm 연속체 이미지 시퀀스를 사용하여 수행했습니다. PINN 모델에서 계산된 이미지와 입력 이미지는 매우 높은 수준의 일치를 보였습니다. 더 중요한 검증은 물리 매개변수 자체를 비교하는 데 중점을 두었습니다. 복사선이 대부분 발생하는 높이에서의 수평 단면을 비교한 결과, Bifrost 시뮬레이션과 PINN 모델 간에 전반적으로 좋은 일치를 나타냈습니다. 수직 단면 비교에서도 광학적 깊이가 1이 되는 지점($\tau=1$) 근처에서 물리 매개변수가 상대적으로 잘 재현되었으나, 그 위쪽과 아래쪽에서는 불일치가 더 크게 관찰되었습니다. 이는 특히 상부 광구에서 복사 손실 근사의 한계와 가시 표면 아래 흐름을 제한할 정보 부족 때문인 것으로 분석됩니다. 또한, PINN은 밀도와 온도의 급격한 경계를 충분히 재현하지 못하는 한계를 보였습니다.

Bifrost 모델과 PINN 출력 간의 5가지 물리 매개변수에 대한 피어슨 상관 계수는 대부분의 연속체 복사선이 발생하는 $\tau=1$ 근처에서 가장 높게 나타나는 것을 확인했습니다. 속도는 이 수준 위아래에서도 상당한 상관관계를 유지했지만, 밀도와 온도의 상관 계수는 $\tau=1$ 수준 위에서 훨씬 급격히 감소하는 경향을 보였습니다. 이는 PINN이 $\tau=1$ 표면 바로 아래의 날카로운 전이를 재현하지 못하고, 매우 단순화된 복사 손실 계산(복사 가열 제외, 상층의 강한 스펙트럼선으로 인한 복사 손실 재현 불가)에 기인하는 것으로 판단됩니다.

논의 (Discussion)

PINN 접근 방식의 장점

  • 내재적 단순성: 물리학이 편미분 방정식으로 직접 구현되어 코드 한 줄로 각 방정식을 처리할 수 있고, 합성 관측 계산은 기존 코드에서 가져올 수 있다는 점에서 추가 물리 현상이나 관측 데이터 통합이 용이합니다.
  • 최적 압축: 기존 그리드 기반 PDE 해결 방식에 비해 거의 최대로 압축된 정보를 사용합니다 (단, 손실 압축이며 PDE는 근사적으로만 만족됨). 본 연구에서는 정보량이 약 2~3 자릿수(orders of magnitude)만큼 감소하여 GPU 사용 및 소규모 문제의 경우 강력한 노트북에서도 계산이 가능해졌습니다.
  • 정확도와 정밀도의 균형: 최적화 진행에 따라 정밀도가 증가하므로, 관측 데이터나 물리 근사의 한계를 고려하여 정밀도와 정확도의 균형을 맞출 수 있다는 장점이 있습니다.
  • 그리드 불필요: 모델이 시공간적으로 연속적이어서 보간 없이 임의 위치에서 평가 가능하고, 관심 영역을 확대(zoom-in)하거나 특정 대기층을 더욱 상세하게 표현하는 등의 분석이 용이합니다. 기울기(gradient) 계산 또한 자동 미분(automatic differentiation)을 통해 효율적으로 수행할 수 있습니다.
  • 관측 데이터의 간단한 통합: PDE 해와 관측 데이터 일치를 모두 신경망 매개변수 최적화로 수행하기 때문에, 서로 다른 관측소/기기의 비동기적, 불균일한 시공간 데이터도 용이하게 통합할 수 있습니다. 향후 점 확산 함수(PSF)를 포함하여 관측의 제한된 공간 해상도를 시뮬레이션하거나 PSF 자체를 추론하는 것도 가능할 것입니다.
  • 점진적 복잡성 증가: 코드 한 줄 변경으로 비탄성 근사에서 전체 연속 방정식으로 전환하는 등 물리적 복잡성을 점진적으로 높이는 것이 용이하며, 이전 단계의 PINN을 다음 단계의 시작점으로 활용할 수 있다는 장점이 있습니다.

현재 개념 증명의 한계

  • 시간적 물리 샘플링: 공간 샘플링은 Bifrost 데이터와 동등하나, 시간 간격은 Bifrost보다 약 100배 상대적으로 깁니다. 이로 인해 물리적으로 일관된 스냅샷을 제공할 수 있지만, 이 스냅샷들이 PDE 해의 서로 다른 궤적에 해당할 가능성이 있습니다.
  • 고유성: PINN 모델 해의 고유성이나 최적화기가 전역 최소값을 찾았다는 것을 보장하기 어렵습니다.
  • 알 수 없는 오류: 신경망 학습에 사용되는 최적화기는 수백만에서 수십억 개의 자유 매개변수를 다룰 수 있지만, 모델 매개변수의 사후 분포에 대한 정보는 일반적으로 제공하지 않는다는 한계가 있습니다.
  • 알 수 없는 신경망 점성: 심층 신경망은 고주파 변화보다 저주파 변화를 더 잘 재현하는 경향(스펙트럼 편향)이 있어, 대기 매개변수의 작은 규모(small-scale) 변화를 약화시키는 경향이 있습니다.
  • 확장성: 현재 개념 증명은 비교적 작은 시뮬레이션 영역에서 수행되었습니다. 더 큰 영역으로 확장하려는 시도는 메모리 요구 사항이나 스펙트럼 편향 문제로 기술적인 어려움에 직면했습니다.
  • 경계 조건 부재: 현재 구현은 어떤 유형의 경계 조건도 명시적으로 강제하지 않고 있습니다. 이는 대류 운동을 시간적으로 현실적으로 외삽하는 실험이 성공하지 못한 주요 원인 중 하나일 수 있습니다.

전망 및 향후 연구 (Outlook)

본 개념 증명은 많은 중요한 물리 과정을 무시하고 지나치게 단순화된 근사 및 가정을 사용하고 있습니다. 상태 방정식과 복사 전달 계산은 개선의 여지가 있습니다. 특히, 광학적 깊이를 PINN의 추가 출력량으로 처리하고 관련 제약 조건을 추가하여 학습시키는 방안도 고려해볼 수 있으나, 초기 시도는 최적화 과정에서 불안정성을 나타냈습니다.

일반적으로 유용하기 위해서는 자기장을 추가하고, (편광된) 스펙트럼선 정보를 관측 제약 조건으로 활용하는 것이 필수적입니다. 또한 상층에서의 복사 손실, 파동진동도 포괄적으로 고려해야 합니다. 여기서 도출된 물리 매개변수의 불확실성을 추정하기 위해 베이즈 신경망을 사용하는 방안도 고려할 수 있지만, 이는 비현실적으로 높은 컴퓨팅 성능을 요구할 수 있습니다. 심층 신경망에 내재된 인공 점성신경 접선 커널(Neural Tangent Kernel)로 이해하는 한편, 위치 인코딩(positional encoding)과 같은 기법으로 제어할 수 있을 가능성이 있지만, 초기 시도에서는 만족스러운 결과를 얻지 못했습니다.

더 넓은 시야각에 PINN 접근 방식을 적용하는 경우, 영역을 더 작은 필드로 세분화하고 개별 PINN이 해당 하위 필드에서만 개별적으로 작동하도록 설계하는 유한 기저 물리 정보 신경망(Finite Basis Physics-Informed Neural Networks)이 효과적인 해결책을 제공할 수 있을 것으로 기대됩니다. 또한, PDE 제약 조건이 적용되는 지점을 최적화하는 한편, 이러한 위치가 특정 PDE나 물리학에 따라 유동적으로 설정하는 방안도 고려할 수 있습니다.

결론

본 연구는 PINN이 태양 대기의 데이터 기반 모델링을 위한 실행 가능한 접근 방식이 될 수 있음을 보여주고 있습니다. 이는 태양 관측을 해석하고, 기본 물리학을 이해하며, 소규모 태양 과정을 근사하여 훨씬 큰 규모의 시뮬레이션에 효율적으로 포함하는 방식을 혁신할 잠재력을 가진 흥미로운 방향의 중요한 첫걸음이라고 할 수 있습니다.

참고 문헌

This post is licensed under CC BY 4.0 by the author.

© Donghui Son. Some rights reserved.