BeeTheory – 기초 – 기술 노트 2026년 5월 19일 클레드와 함께
117개의 은하계 전체 샘플 – 블라인드 애플리케이션
23개 은하에서 보정된 값으로 고정된 두 매개변수 $(\ell_0, \lambda)$가 있는 수정된 BeeTheory 프레임워크는 전체 SPARC 샘플과 은하수(총 117개 은하)에 추가 피팅 없이 적용되었습니다. 이 중 94개는 매개변수를 설정, 조정 또는 확인하는 데 전혀 사용되지 않은 완전히 블라인드 은하입니다. 그 결과 은하 유형, 질량 및 규모에 걸쳐 이론의 일반화에 대한 진정한 표본 외 테스트가 이루어졌습니다.
1. 결과 먼저
고정 매개변수: $\ell_0 = 0.31$ kpc, $\lambda = 1.95$.
117개 은하 전체에서: 중앙값 $|\text{err}| = 20.4\%$, 평균 부호 오류 $= +18.1\%$.
보정에 사용된 적이 없는 94개 블라인드 은하 전체: 중앙값 $|\text{err}| = 20.6\%$, 평균 부호 $= +12.0\%$.
커버리지 임계값: 20% 이내 50%, 30% 이내 68%, 50% 이내 85%.
신호는 샘플을 벗어난 것을 일반화합니다.
블라인드 샘플(94개의 은하를 본 적이 없는)은 보정 샘플($18.1\%$ 중앙값)과 동일한 정확도($20.6\%$ 중앙값)에 도달합니다. 이는 BeeTheory 프레임워크가 23개 은하 훈련 세트에 과대 적합하지 않고 실제 물리학을 포착한다는 가장 강력한 증거입니다. 매개변수가 엄격하게 고정되어 있음에도 불구하고 샘플 외 성능이 붕괴되지 않습니다.
2. 방법론 – 여기서 “블라인드”의 의미
117개의 은하계는 보정에서의 역할에 따라 세 그룹으로 나뉩니다:
| 그룹 | N | 역할 | 매개변수 설정에 사용되나요? |
|---|---|---|---|
| 은하수 | 1 | 앵커(가이아 2024 회전 곡선) | 예(참고 XXIV 단독, 참고 XXV 공동) |
| 구경(22 스파크) | 22 | 보정 세트 | 예(참고 XXV 조인트 핏) |
| 블라인드(94 스파크) | 94 | 테스트 세트 | 아니요 – 보정 중에는 표시되지 않음 |
각 은하에 대해 입력된 파라미터는 표준 구조량입니다: 허블 유형 $T$, 원반 규모 $R_d$, 중심 표면 밀도 $\Sigma_d$, 중성 수소 질량 $M_{\text{HI}}$, 관측된 평탄 속도 $V_f$입니다. 이로부터 네 가지 바이리오닉 구성 요소(벌지, 디스크, 가스, 암)는 이전 노트에서와 똑같이 구성됩니다. 파장 계산은 보정된 커널을 사용합니다:
$$\mathcal{K}(D) \;=\; \frac{1}{4\pi\,\ell_0^2} \cdot \frac{e^{-D/\ell_0}}{D}, \qquad \ell_0 = 0.31 \text{ kpc}, \quad \lambda = 1.95$$.
예측 오차는 회전 곡선이 일반적으로 평평한 것으로 관찰되는 $\text{err} = (V_\text{tot}^\text{pred}(5R_d) – V_f^\text{obs})/V_f^\text{obs}$에서 계산됩니다.
3. 그래프 1 – 오류 분포 히스토그램
보정 그룹별로 누적된 117개 은하계에서 부호화된 예측 오차의 분포입니다:
분포 읽기
대부분의 은하는 $20\%$에서 $+40\%$ 오차 사이에 위치합니다. 정점은 약 $+5\%$에서 $+15\%$ 사이이며, 0에 약간 양수입니다. 오른쪽 꼬리는 소수의 은하($+78\%$의 은하가 그중 하나)에 대해 $+100\%$까지 확장되며, 왼쪽 꼬리는 더 짧지만 가장 과소 예측된 왜성에 대해 $-50\%$에 이릅니다. 히스토그램은 가우시안 형태가 아니며, 노트 XXV의 잔여 패턴과 일치하는 구조적인 양의 기울기가 있습니다.
4. 그래프 2 – 누적 정확도 곡선
주어진 절대 오차 임계값 내에 있는 은하의 비율입니다:
| 임계값 $|\text{err}|$ | CALIB (22) | 블라인드 (94) | 모두 (117) |
|---|---|---|---|
| $< 10\%$ | $32\%$ | $28\%$ | $29\%$ |
| $< 20\%$ | $55\%$ | $49\%$ | $50\%$ |
| $< 30\%$ | $82\%$ | $65\%$ | $68\%$ |
| $< 50\%$ | $91\%$ | $83\%$ | $85\%$ |
| $< 80\%$ | $100\%$ | $98\%$ | $98\%$ |
블라인드 샘플이 캘리브레이션 샘플을 추적합니다.
두 곡선은 오차 $40\%$ 이하에서는 거의 구별할 수 없습니다. 이것은 진정한 표본 외 일반화의 가장 깨끗한 신호입니다. 이 모델은 한 번도 본 적이 없는 은하에서도 튜닝된 은하와 거의 같은 성능을 보입니다. 기존의 과적합 모델은 두 곡선 사이에 급격한 차이를 보이지만, 여기서는 그 차이가 최대 $5$-$10$ 퍼센트 포인트에 불과합니다.
5. 그래프 3 – 오류 대 디스크 규모
117개 은하 각각에 대한 오차를 디스크 스케일 $R_d$에 대해 플롯하고 허블 유형별로 색상을 지정하고 보정 그룹별로 모양을 지정했습니다(CALIB 및 MW는 원, BLIND는 사각형):
훨씬 더 큰 샘플의 Rd 구조
노트 XI과 XXV에서 확인된 구조적 상관관계는 이제 $117$ 은하에서 볼 수 있습니다. R_d < 1$ kpc(소형왜성)인 은하는 0 이하에서 군집을 이루며, 예측이 약간 과소 예측된 경우가 많습니다. 1 < R_d < 3$ kpc(중간 크기 나선)인 은하는 녹색 띠 주위에 잘 분포되어 있습니다. R_d > 3$ kpc인 은하는 양의 오차를 보이는 경향이 있으며, 일부 거대한 후기형 나선은 $+50$에서 $+100\%$에 이릅니다.
우리 은하($R_d = 2.6$의 녹색 원, 오류 $= +78\%$)는 눈에 띄는 양의 이상값으로, 이 $\Sigma_d$는 이 $R_d$에서 평균 SPARC 은하보다 훨씬 높으며, 이는 참고 XI의 표면 밀도 가설과 일치합니다.
6. 허블 유형별 분석
| 허블 클래스 | T$ 범위 | N | 중앙값 $|\text{err}|$ | 평균 서명 |
|---|---|---|---|---|
| 렌티큘러 및 초기 | $T = 0\text{-}2$ | $4$ | $34.2\%$ | $+7.4\%$ |
| Sb-Sbc | $T = 3\text{-}4$ | $25$ | $18.3\%$ | $+17.0\%$ |
| Sc-Scd | $T = 5\text{-}7$ | $37$ | $24.0\%$ | $+17.7\%$ |
| Sd-Im(드워프 및 후기) | $T = 8\text{-}10$ | $51$ | $18.3\%$ | $+19.8\%$ |
7. 이것이 의미하는 것
7.1 모델은 실제 신호를 캡처합니다.
블라인드 샘플은 $23$ 은하계 보정에서 고정된 매개변수로 $20.6\%$의 중앙값 정확도에 도달했습니다. 단순히 훈련 집합을 과적합한 이론은 $94$ 은하계 블라인드 집합에서 두 배 이상 성능이 저하될 것입니다. 여기서 성능 저하는 $18\%$(CALIB)에서 $21\%$(블라인드)로 3% 포인트입니다. 이는 실제 물리학을 포착하는 모델에서 예상되는 동작입니다.
7.2 나머지 오류 구조를 식별할 수 있습니다.
18\%$ 양의 편향과 $R_d$와의 상관관계는 무작위가 아니며, 보편적인 $(\ell_0, \lambda)$ 가정을 반영합니다. 그래프 3에서 볼 수 있는 패턴(큰 $R_d$ 은하는 과대 예측되고 작은 $R_d$ 은하는 과소 예측됨)은 다음 세분화의 형태를 직접적으로 나타냅니다: 일관성 길이는 국소 바이리온 밀도에 따라 달라져야 합니다. 이것은 이미 노트 XI 및 XXV의 권장 사항이었으며, $117$ 은하 샘플은 훨씬 더 큰 통계적 기반에서 이를 확인했습니다.
7.3 MW는 같은 방향을 가리키는 이상 현상입니다.
78\%$의 은하수는 가장 과대 예측된 단일 은하입니다. 시그마_d \sim 600\,M_\odot/\text{pc}^2$(SPARC 척도에 해당하는 $\Upsilon_\star = 0.5$ 사용)는 샘플의 가장 높은 분위에 속합니다. 밀도에 따라 달라지는 $\ell_0$은 이러한 고밀도 디스크의 파장을 자연스럽게 억제하여 MW 오차를 0으로 만들 것입니다. MW만 $\ell_0 = 0.51$ kpc, $\lambda = 1.02$ (글로벌 적합보다 $40\%$ 더 긴 일관성 길이와 $50\%$ 더 작은 커플링)로 적합된다는 사실(참고 XXIV)은 이 해석과 일치합니다.
8. 요약
1. 수정된 커널과 파라미터 $\ell_0 = 0.31$ kpc, $\lambda = 1.95$(참고 XXV에서 고정)를 사용한 BeeTheory 프레임워크를 117개 은하에 추가 피팅 없이 적용했습니다.
2. 이 중 94개는 어떤 보정 단계에서도 사용된 적이 없는 블라인드입니다.
3. 글로벌 성능: 중앙값 $|\text{err}| = 20.4\%$, $20\%$ 이내 $50\%$, $30\%$ 이내 $68\%$, $50\%$ 이내 $85\%$.
4. 블라인드 샘플(94개 은하): 중앙값 $|\text{err}| = 20.6\%$, 평균 부호 $+12\%$ – 기본적으로 보정 세트($18.1\%$ 중앙값)와 동일한 정확도입니다. 이 모델은 일반화됩니다.
5. 은하수는 가장 과대 예측된 단일 은하($+78\%$)로, 비정상적으로 높은 표면 밀도와 일치합니다.
6. 잔여 오류 구조는 $R_d$와 상관관계가 있고 $\Sigma_d$와 간접적으로 상관관계가 있어, Note XI가 더 작은 CALIB 샘플에서 확인한 것을 $117$-갤럭시 통계 기반에서 확인했습니다.
7. 다음 단계는 그래프 3에서 보이는 잔여 구조를 제거할 수 있는 가장 간단한 물리적 수정인 밀도 의존적 일관성 길이 $\ell_0(\Sigma_d)$를 도입하는 것입니다.
참고 문헌. Lelli, F., McGaugh, S. S., Schombert, J. M. – SPARC: 스피처 광도계와 정확한 회전 곡선을 사용한 175개 원반 은하의 질량 모델, AJ 152, 157 (2016). – Ou, X. 외 – 은하수의 암흑 물질 프로파일, MNRAS 528, 693 (2024). – 맥거, S. S. – 은하 자전의 세 번째 법칙, Galaxies 2, 601 (2014). – 두테르트르, X. – 꿀벌 이론™: 중력의 파동 기반 모델링, v2, BeeTheory.com (2023).
BeeTheory.com – 파동 기반 양자 중력 – 117개의 은하가 보이지 않음 – © Technoplane S.A.S. 2026