BeeTheory – 기초 – 기술 노트 XI
누락된 매개변수 식별하기:
1단계 – 체계적인 상관관계 분석
이 노트에서는 모델을 수정하기 전에 어떤 관측 가능한 매개변수가 잔여 오차를 가장 잘 예측하는지 진단합니다. 노트 VIII의 22개 은하계 보정 세트에서 작업하면서 물리적으로 의미 있는 모든 변수와 예측 오차의 상관관계를 테스트한 다음 모든 이변량 조합으로 현재 모델에서 누락된 부분을 엄격하게 식별합니다.
1. 결과 먼저
누락된 매개 변수는 중심 표면 밀도입니다.
중심 바이리오닉 표면 밀도 $\Sigma_d$는 예측 오차와 가장 강력한 상관 관계가 있습니다: $r = +0.62$, $R^2 = 0.39$ 그 자체로.
시그마_d$를 이변량 모델에서 디스크 크기 $R_d$와 결합하면 $R_d$만으로는 $R^2 = 0.07$인 것에 비해 잔차 분산이 $R^2 = 0.43$로 설명됩니다. RMS 잔차는 $19.5\%$에서 $14.9\%$로 떨어집니다.
R_d$와 $\Sigma_d$를 모두 흡수한 후에는 잔차에 대한 정보를 전달하는 추가적인 물리적 관측이 불가능합니다.
2. 방법
22개 은하 보정 세트(참고 VIII)에서 작업하면 각 은하에 대해 예측 오차 $text{err} = (V_text{tot} – V_f)/V_f$와 측정 가능한 물리적 파라미터 목록이 있습니다. 오차와 각 후보 변수 사이의 피어슨 및 스피어만 상관관계를 계산한 다음 이변량 회귀를 테스트합니다:
$$\text{err}(\%) \;=\; a \cdot R_d \;+\; b \cdot X \;+\; c$$
여기서 $X$는 각 후보 변수입니다. 가장 좋은 $X$는 22개 은하에서 설명된 분산 $R^2$를 최대화하는 변수입니다. 자체 참조 변수(예: $V_\text{wave}$ 또는 $V_\text{tot}$와 같이 모델 출력에서 파생된 변수)는 오차와의 상관관계가 팽팽하므로 검색에서 제외됩니다.
3. 단변량 상관관계
테스트한 24개의 후보 변수는 오차와의 절대 피어슨 상관관계에 따라 순위가 매겨집니다. 금색 음영으로 표시된 행은 모델 자체에서 파생된 변수이며(팽팽한), 빨간색 음영으로 표시된 행은 $|r| > 0.5$인 실제 물리적 관측 변수입니다.
| 변수 | 설명 | 피어슨 $r$ | p$-값 | 중요성 |
|---|---|---|---|---|
| Vw_over_Vf | Vw/Vf 비율 | +0.974 | 0.0000 | ★★★ |
| V_dynamic | V_dyn = √(GM_bar/Rd) | +0.632 | 0.0021 | ★★★ |
| 로그_시그마_d | log₁₀(Σ_d) | +0.622 | 0.0026 | ★★★ |
| M_gas | 기체 질량(M_sun) | +0.609 | 0.0034 | ★★★ |
| M_HI | HI 질량(M_sun) | +0.609 | 0.0034 | ★★★ |
| T | 허블 유형 | -0.585 | 0.0053 | ★★ |
| Vbar | 바리오닉 Vbar(km/s) | +0.582 | 0.0057 | ★★ |
| M_bar_over_Rd2 | M_bar / Rd² | +0.559 | 0.0084 | ★★ |
| Vtot | 예상 Vtot(km/s) | +0.555 | 0.0090 | ★★ |
| Vw | 파동 속도(km/s) | +0.550 | 0.0098 | ★★ |
| Vbar_over_Vf | Vbar/Vf 비율 | +0.519 | 0.0158 | ★★ |
| log_M_gas | log₁₀(M_gas) | +0.506 | 0.0193 | ★★ |
| log_M_bar | log₁₀(M_bar) | +0.505 | 0.0196 | ★★ |
| M_bar | 바리오닉 질량(M_sun) | +0.498 | 0.0214 | ★★ |
| log_M_star | log₁₀(M_star) | +0.449 | 0.0414 | ★★ |
| 시그마_d | 표면 밀도(L/pc²) | +0.426 | 0.0544 | ★★ |
| M_star_over_Rd2 | M_star / Rd² | +0.426 | 0.0544 | ★★ |
| M_star | 항성 질량(M_sun) | +0.389 | 0.0815 | ★ |
표 읽기
가장 높은 단일 상관관계는 $V_\text{wave}/V_f = +0.974$입니다. 이는 구조상 오차는 $V_\text{wave}$에 직접적으로 비례하므로 이 변수는 외부의 물리적 동인이 아니라 예측 공식의 구조를 반영할 뿐입니다.
실제 물리적 관측 변수 중 상관관계가 가장 높은 것은 $\log(\Sigma_d) = +0.622$, $V_\text{역학적} = +0.632$, $M_\text{가스} = +0.609$, 허블 유형 $T = -0.585$입니다. 이 네 가지 신호는 물리적으로 연결되어 있습니다. 밀도가 높은 원반은 더 거대하고, 초기 유형이며, 더 높은 바이리오닉 동역학 속도를 갖는 경향이 있습니다. 문제는 어떤 것이 근본적인 동인인지입니다.
4. 중복 변수 필터링하기
상관관계가 가장 높은 변수 중 일부는 이미 오류를 유발하는 것으로 알려진 변수인 $R_d$와 강한 상관관계가 있습니다. 문제는 어떤 변수가 독립적인 정보를 전달하느냐는 것입니다.
| 변수 | R_d$와의 상관관계 | 상태 |
|---|---|---|
| $\log(M_\star)$ | $r = +0.88$ | R_d$와 중복 |
| $\log(M_\text{bar})$ | $r = +0.87$ | R_d$와 중복 |
| $\log(M_\text{gas})$ | $r = +0.86$ | R_d$와 중복 |
| 허블 유형 $T$ | $r = -0.66$ | 부분적으로 중복 |
| $V_\text{동적}$ | $r = +0.50$ | 부분적으로 독립적 |
| $M_\text{bar}/R_d^2$ | $r = -0.19$ | 독립 |
| $\log(\Sigma_d)$ | $r = +0.10$ | 독립 |
질량은 $R_d$와 거의 완벽하게 상관관계가 있습니다. 디스크가 클수록 더 많은 바이론 물질을 포함하고 있을 뿐입니다. 따라서 이러한 변수는 $R_d$ 자체와 본질적으로 동일한 정보를 전달합니다. 반면, $\Sigma_d$(중심 표면 밀도)와 $M_\text{bar}/R_d^2$(평균 바이리오닉 표면 밀도)는 이 샘플에서 $R_d$와 거의 직교하여, “원반이 얼마나 확장되었는가”와는 무관하게 “물질이 얼마나 조밀한가”라는 구조적 특성을 포착할 수 있습니다.
5. 오차 대 표면 밀도 – 시각화
허블 유형에 따라 색을 입힌 $\log_{10}(\Sigma_d)$에 대한 오류를 단독으로 플롯합니다:
중심 표면 밀도가 높은 은하는 BeeTheory에 의해 체계적으로 과대 예측되는 반면, 확산 저밀도 디스크는 과소 예측되는 경향이 분명하고 단조롭습니다. 시그마_d$의 10년당 $33$ 퍼센트 포인트의 적합 기울기는 15에서 605 $L_\odot/\text{pc}^2$의 전체 범위에 걸쳐 데이터와 견고하게 일치합니다.
6. 이변량 모델 – 비교
각 후보 변수에 $R_d$를 더하면 순위가 더 명확해집니다. 아래 표는 $R_d$가 각 두 번째 변수와 짝을 이룰 때 설명된 분산 $R^2$를 보여줍니다(팽팽한 조합은 제외):
| 이변량 모델 | $R^2$ | RMS 잔여 | 참고 |
|---|---|---|---|
| text{err} = a R_d + c$(단변량 기준선) | 0.074 | $19.5\%$ | 참조, 두 번째 변수 없음 |
| text{err} = a R_d + b f_\text{gas} + c$ | 0.101 | $19.3\%$ | 미미한 개선 |
| $\text{err} = a R_d + b \log M_\star + c$ | 0.272 | $17.3\%$ | – |
| text{err} = a R_d + b V_\text{bar} + c$ | 0.345 | $16.4\%$ | – |
| text{err} = a R_d + b \log M_\text{gas} + c$ | 0.359 | $16.3\%$ | – |
| $\text{err} = a R_d + b T + c$ | 0.367 | $16.2\%$ | – |
| $\text{err} = a R_d + b \log M_\text{bar} + c$ | 0.373 | $16.1\%$ | – |
| $\text{err} = a R_d + b\,V_\text{역학} + c$. | 0.402 | $15.7\%$ | Strong |
| $\text{err} = a R_d + b \log\Sigma_d + c$ | 0.430 | $15.3\%$ | R_d$와 무관 |
| $\text{err} = a R_d + b (M_\text{bar}/R_d^2) + c$. | 0.459 | $14.9\%$ | 최고의 비긴장성 모델 |
최상의 이변량 모델
$$\text{err}(\%) \;=\; a\,R_d \;+\; b\,\frac{M_\text{bar}}{R_d^2} \;+\; c, \qquad R^2 = 0.46$$
변수 $M_\text{bar}/R_d^2$ 는 디스크의 평균 바이리오닉 표면 밀도, $\langle \Sigma_\text{bar}입니다. \각도 = M_\text{bar}/(\pi R_d^2)$입니다. 이것은 디스크의 크기와 무관하게 눈에 보이는 물질이 얼마나 작은지에 대한 정보를 전달합니다. 이것은 현재 BeeTheory가 설명하지 못하는 변수입니다.
7. 결산 확인 – $R_d$ 및 $\Sigma_d$가 설명된 후 남은 항목
R_d$와 $\log \Sigma_d$가 함께 구조적 결함을 포착하는 경우, 이변량 적합도의 잔차는 모든 물리적 관찰 가능성과 상관관계가 없어야 합니다. 이를 테스트하는 것이 공식적인 종결 검사입니다:
| 변수 | 잔류와의 상관관계 | 상태 |
|---|---|---|
| $R_d$ | $+0.00$ | 구성별 |
| 로그 \Sigma_d$ | $+0.00$ | 구성별 |
| $\log M_\star$ | $-0.05$ | 흡수됨 |
| $\log M_\text{bar}$ | $+0.07$ | 흡수됨 |
| $\log M_\text{gas}$ | $+0.14$ | 흡수됨 |
| 허블 유형 $T$ | $-0.04$ | 흡수됨 |
| $V_\text{동적}$ | $+0.08$ | 흡수됨 |
| $V_\text{bar}$ | $+0.05$ | 흡수됨 |
| $f_\text{gas}$ | $+0.28$ | 한계, 중요도 미만 |
R_d$와 $\log \Sigma_d$를 고려한 후에도 잔여 오류와 유의미한 상관관계를 유지하는 물리적 관측값은 없습니다. 오차의 구조적 정보는 이 두 변수에 의해 완전히 포착되었습니다. 나머지 $15%$의 RMS 산란은 SPARC 입력 매개변수에 대한 관측 불확실성 및 이러한 집계 설명자 중 어느 것도 포착하지 못한 은하 간 고유 변동성과 일치합니다.
8. 물리적 해석
현재 BeeTheory 모델은 디스크 스케일 길이 $R_d$를 두 곳에서 사용합니다: 바이리오닉 분포의 공간 스케일(지수 프로파일 $Sigma propto e^{-R/R_d}$)과 파동 커널의 일관성 길이($ell = c_text{disk},R_d$)로서 말이죠. 바이리오닉 프로파일 $\Sigma_0$의 진폭은 암시적이며, 일단 통합되면 정확한 항성 질량을 제공하도록 스케일링됩니다.
표면 밀도가 물리적으로 나타내는 것
평균 바이리오닉 표면 밀도 $langle 시그마_텍스트{바} 각도 = M_text{바}/(파이 R_d^2)$는 원반의 단위 면적당 질량입니다. R_d$는 같지만 $\Sigma_d$가 다른 두 은하는 기하학적 범위는 같지만 물질의 양은 다릅니다. 현재 모델은 물질이 얼마나 농축되어 있는지는 무시한 채 기하학적 범위($R_d$)만을 파동 일관성 길이와 관련 있는 것으로 취급합니다. 이것이 바로 잔류 분석에서 누락된 것으로 식별되는 매개변수입니다.
효과의 방향
상관관계는 양수입니다. 오차는 표면 밀도에 따라 증가합니다. 즉, 고정된 $R_d$의 경우 밀도가 높은 디스크는 회전 곡선에 비해 파장이 너무 강해 모델에서 과대 예측된다는 의미입니다. 반대로, 주어진 $R_d$의 경우 모델은 확산 저밀도 디스크를 과소 예측합니다. 그럴듯한 물리적 해석: 파동 일관성 길이는 소스의 기하학적 범위뿐만 아니라 밀도가 높은 물질이 더 국소화된 파동 응답을 생성하는 농도에 따라 달라져야 합니다. 이렇게 하면 높은 $\시그마$ 디스크에서는 자연스럽게 파장 진폭이 억제되고 낮은 $\시그마$ 디스크에서는 진폭이 강화됩니다.
9. 1단계 요약
1. 22은하 보정 세트에서 예측 오차는 실제 물리적 관측값 중 중심 표면 밀도 $\Sigma_d$($r = +0.62$)와 가장 강한 상관 관계가 있습니다.
2. 처음에 강한 상관관계를 보이는 다른 변수들(항성 질량, 가스 질량, 바이론 질량)은 $R_d$와 매우 중복되는 것으로 밝혀져($R_d$와 상관관계 $\geq 0.86$) 새로운 정보를 거의 전달하지 못합니다.
3. 가장 좋은 비인장 이변량 모델은 $\text{err} = a\,R_d + b\,(M_\text{bar}/R_d^2) + c$이며, $R^2 = 0.46$이고 RMS 잔차는 $14.9\%$입니다. 두 번째 변수는 디스크의 평균 바이리오닉 표면 밀도입니다.
4. R_d$ 및 $\Sigma_d$를 고려한 후, 다른 관측값은 잔여값과 유의미한 상관관계를 유지하지 않습니다. 진단이 종료됩니다.
5. 누락된 매개변수가 확인되었습니다: 현재 BeeTheory 모델은 이색성 분포의 기하학적 범위($\R_d$)는 설명하지만 표면 밀도($\Sigma_d$)는 설명하지 못합니다. 다음 단계는 파동 일관성 길이에 대한 두 번째 입력으로 $\Sigma_d$를 통합한 다음 22은하 세트에 모델을 다시 맞추는 것입니다.
참고 문헌. Lelli, F., McGaugh, S. S., Schombert, J. M. – SPARC: 스피처 광도계와 정확한 회전 곡선을 이용한 175개 원반 은하의 질량 모델, AJ 152, 157 (2016). – 피어슨, K. – 진화론에 대한 수학적 기여 III, Phil. Trans. R. Soc. A 187, 253 (1896). 상관 계수. – 두테르트르, X. – 꿀벌 이론™: 중력의 파동 기반 모델링, v2, BeeTheory.com (2023).
BeeTheory.com – 파동 기반 양자 중력 – 진단 1 단계 – © Technoplane S.A.S. 2026