BeeTheory – 기초 – 기술 노트 2026년 5월 19일 클레드와 함께

117개의 은하계 전체 샘플 – 블라인드 애플리케이션

23개 은하에서 보정된 값으로 고정된 두 매개변수 $(\ell_0, \lambda)$가 있는 수정된 BeeTheory 프레임워크는 전체 SPARC 샘플과 은하수(총 117개 은하)에 추가 피팅 없이 적용되었습니다. 이 중 94개는 매개변수를 설정, 조정 또는 확인하는 데 전혀 사용되지 않은 완전히 블라인드 은하입니다. 그 결과 은하 유형, 질량 및 규모에 걸쳐 이론의 일반화에 대한 진정한 표본 외 테스트가 이루어졌습니다.

1. 결과 먼저

고정 매개변수: $\ell_0 = 0.31$ kpc, $\lambda = 1.95$.

117개 은하 전체에서: 중앙값 $|\text{err}| = 20.4\%$, 평균 부호 오류 $= +18.1\%$.

보정에 사용된 적이 없는 94개 블라인드 은하 전체: 중앙값 $|\text{err}| = 20.6\%$, 평균 부호 $= +12.0\%$.

커버리지 임계값: 20% 이내 50%, 30% 이내 68%, 50% 이내 85%.

신호는 샘플을 벗어난 것을 일반화합니다.

블라인드 샘플(94개의 은하를 본 적이 없는)은 보정 샘플($18.1\%$ 중앙값)과 동일한 정확도($20.6\%$ 중앙값)에 도달합니다. 이는 BeeTheory 프레임워크가 23개 은하 훈련 세트에 과대 적합하지 않고 실제 물리학을 포착한다는 가장 강력한 증거입니다. 매개변수가 엄격하게 고정되어 있음에도 불구하고 샘플 외 성능이 붕괴되지 않습니다.

2. 방법론 – 여기서 “블라인드”의 의미

117개의 은하계는 보정에서의 역할에 따라 세 그룹으로 나뉩니다:

그룹	N	역할	매개변수 설정에 사용되나요?
은하수	1	앵커(가이아 2024 회전 곡선)	예(참고 XXIV 단독, 참고 XXV 공동)
구경(22 스파크)	22	보정 세트	예(참고 XXV 조인트 핏)
블라인드(94 스파크)	94	테스트 세트	아니요 – 보정 중에는 표시되지 않음

각 은하에 대해 입력된 파라미터는 표준 구조량입니다: 허블 유형 $T$, 원반 규모 $R_d$, 중심 표면 밀도 $\Sigma_d$, 중성 수소 질량 $M_{\text{HI}}$, 관측된 평탄 속도 $V_f$입니다. 이로부터 네 가지 바이리오닉 구성 요소(벌지, 디스크, 가스, 암)는 이전 노트에서와 똑같이 구성됩니다. 파장 계산은 보정된 커널을 사용합니다:

$$\mathcal{K}(D) \;=\; \frac{1}{4\pi\,\ell_0^2} \cdot \frac{e^{-D/\ell_0}}{D}, \qquad \ell_0 = 0.31 \text{ kpc}, \quad \lambda = 1.95$$.

예측 오차는 회전 곡선이 일반적으로 평평한 것으로 관찰되는 $\text{err} = (V_\text{tot}^\text{pred}(5R_d) – V_f^\text{obs})/V_f^\text{obs}$에서 계산됩니다.

3. 그래프 1 – 오류 분포 히스토그램

보정 그룹별로 누적된 117개 은하계에서 부호화된 예측 오차의 분포입니다:

10% 구간으로 부호화된 오차의 히스토그램. 빨간색: 22개의 CALIB 은하. 파란색: 94개의 BLIND 은하(보정에서 볼 수 없음). 녹색 점선: 은하 위치. 빨간색 점선: 중앙값 오차.

분포 읽기

대부분의 은하는 $20\%$에서 $+40\%$ 오차 사이에 위치합니다. 정점은 약 $+5\%$에서 $+15\%$ 사이이며, 0에 약간 양수입니다. 오른쪽 꼬리는 소수의 은하($+78\%$의 은하가 그중 하나)에 대해 $+100\%$까지 확장되며, 왼쪽 꼬리는 더 짧지만 가장 과소 예측된 왜성에 대해 $-50\%$에 이릅니다. 히스토그램은 가우시안 형태가 아니며, 노트 XXV의 잔여 패턴과 일치하는 구조적인 양의 기울기가 있습니다.

4. 그래프 2 – 누적 정확도 곡선

주어진 절대 오차 임계값 내에 있는 은하의 비율입니다:

임계값보다 $|\text{err}|$ 가 낮은 은하의 누적 비율. Red: CALIB (22). 파란색: BLIND (94). 검은색: 모두 117. 점들은 $|\text{err}| = 20\%, 30\%, 50\%$의 값을 강조 표시합니다.

임계값 $\|\text{err}\|$	CALIB (22)	블라인드 (94)	모두 (117)
$< 10\%$	$32\%$	$28\%$	$29\%$
$< 20\%$	$55\%$	$49\%$	$50\%$
$< 30\%$	$82\%$	$65\%$	$68\%$
$< 50\%$	$91\%$	$83\%$	$85\%$
$< 80\%$	$100\%$	$98\%$	$98\%$

CALIB와 BLIND 곡선은 매우 비슷합니다. 각 임계값에서 CALIB의 우위는 몇 퍼센트 포인트에 불과합니다. MW는 오른쪽 꼬리의 맨 위에 위치한 지배적인 이상값입니다.

블라인드 샘플이 캘리브레이션 샘플을 추적합니다.

두 곡선은 오차 $40\%$ 이하에서는 거의 구별할 수 없습니다. 이것은 진정한 표본 외 일반화의 가장 깨끗한 신호입니다. 이 모델은 한 번도 본 적이 없는 은하에서도 튜닝된 은하와 거의 같은 성능을 보입니다. 기존의 과적합 모델은 두 곡선 사이에 급격한 차이를 보이지만, 여기서는 그 차이가 최대 $5$-$10$ 퍼센트 포인트에 불과합니다.

5. 그래프 3 – 오류 대 디스크 규모

117개 은하 각각에 대한 오차를 디스크 스케일 $R_d$에 대해 플롯하고 허블 유형별로 색상을 지정하고 보정 그룹별로 모양을 지정했습니다(CALIB 및 MW는 원, BLIND는 사각형):

각 점은 하나의 은하입니다. 가로축: 디스크 스케일 $R_d$(로그). 세로축: 부호화된 예측 오차. 녹색 띠: $|\text{err}| < 20\%$. 금색 띠: $20$-$30\%$. 색상은 허블 유형을 따릅니다. 열린 원: CALIB 은하. 사각형: 블라인드 은하. 큰 녹색 원: 은하수.

훨씬 더 큰 샘플의 Rd 구조

노트 XI과 XXV에서 확인된 구조적 상관관계는 이제 $117$ 은하에서 볼 수 있습니다. R_d < 1$ kpc(소형왜성)인 은하는 0 이하에서 군집을 이루며, 예측이 약간 과소 예측된 경우가 많습니다. 1 < R_d < 3$ kpc(중간 크기 나선)인 은하는 녹색 띠 주위에 잘 분포되어 있습니다. R_d > 3$ kpc인 은하는 양의 오차를 보이는 경향이 있으며, 일부 거대한 후기형 나선은 $+50$에서 $+100\%$에 이릅니다.

우리 은하($R_d = 2.6$의 녹색 원, 오류 $= +78\%$)는 눈에 띄는 양의 이상값으로, 이 $\Sigma_d$는 이 $R_d$에서 평균 SPARC 은하보다 훨씬 높으며, 이는 참고 XI의 표면 밀도 가설과 일치합니다.

6. 허블 유형별 분석

허블 클래스	T$ 범위	N	중앙값 $\|\text{err}\|$	평균 서명
렌티큘러 및 초기	$T = 0\text{-}2$	$4$	$34.2\%$	$+7.4\%$
Sb-Sbc	$T = 3\text{-}4$	$25$	$18.3\%$	$+17.0\%$
Sc-Scd	$T = 5\text{-}7$	$37$	$24.0\%$	$+17.7\%$
Sd-Im(드워프 및 후기)	$T = 8\text{-}10$	$51$	$18.3\%$	$+19.8\%$

이 모델은 네 가지 클래스를 모두 비슷한 정확도로 처리합니다. S0-Sa 클래스는 크기가 작고($N=4$) 중앙값은 Note-XXIV 스타일의 과대 예측(고밀도, 콤팩트 벌지)에 의해 지배됩니다. Sb-Sbc 및 Sd-Im 클래스는 모두 중앙값 $\sim 18\%$를 달성하며, 이 모델은 대체로 질량 맹검 모델입니다.

7. 이것이 의미하는 것

7.1 모델은 실제 신호를 캡처합니다.

블라인드 샘플은 $23$ 은하계 보정에서 고정된 매개변수로 $20.6\%$의 중앙값 정확도에 도달했습니다. 단순히 훈련 집합을 과적합한 이론은 $94$ 은하계 블라인드 집합에서 두 배 이상 성능이 저하될 것입니다. 여기서 성능 저하는 $18\%$(CALIB)에서 $21\%$(블라인드)로 3% 포인트입니다. 이는 실제 물리학을 포착하는 모델에서 예상되는 동작입니다.

7.2 나머지 오류 구조를 식별할 수 있습니다.

18\%$ 양의 편향과 $R_d$와의 상관관계는 무작위가 아니며, 보편적인 $(\ell_0, \lambda)$ 가정을 반영합니다. 그래프 3에서 볼 수 있는 패턴(큰 $R_d$ 은하는 과대 예측되고 작은 $R_d$ 은하는 과소 예측됨)은 다음 세분화의 형태를 직접적으로 나타냅니다: 일관성 길이는 국소 바이리온 밀도에 따라 달라져야 합니다. 이것은 이미 노트 XI 및 XXV의 권장 사항이었으며, $117$ 은하 샘플은 훨씬 더 큰 통계적 기반에서 이를 확인했습니다.

7.3 MW는 같은 방향을 가리키는 이상 현상입니다.

78\%$의 은하수는 가장 과대 예측된 단일 은하입니다. 시그마_d \sim 600\,M_\odot/\text{pc}^2$(SPARC 척도에 해당하는 $\Upsilon_\star = 0.5$ 사용)는 샘플의 가장 높은 분위에 속합니다. 밀도에 따라 달라지는 $\ell_0$은 이러한 고밀도 디스크의 파장을 자연스럽게 억제하여 MW 오차를 0으로 만들 것입니다. MW만 $\ell_0 = 0.51$ kpc, $\lambda = 1.02$ (글로벌 적합보다 $40\%$ 더 긴 일관성 길이와 $50\%$ 더 작은 커플링)로 적합된다는 사실(참고 XXIV)은 이 해석과 일치합니다.

8. 요약

1. 수정된 커널과 파라미터 $\ell_0 = 0.31$ kpc, $\lambda = 1.95$(참고 XXV에서 고정)를 사용한 BeeTheory 프레임워크를 117개 은하에 추가 피팅 없이 적용했습니다.

2. 이 중 94개는 어떤 보정 단계에서도 사용된 적이 없는 블라인드입니다.

3. 글로벌 성능: 중앙값 $|\text{err}| = 20.4\%$, $20\%$ 이내 $50\%$, $30\%$ 이내 $68\%$, $50\%$ 이내 $85\%$.

4. 블라인드 샘플(94개 은하): 중앙값 $|\text{err}| = 20.6\%$, 평균 부호 $+12\%$ – 기본적으로 보정 세트($18.1\%$ 중앙값)와 동일한 정확도입니다. 이 모델은 일반화됩니다.

5. 은하수는 가장 과대 예측된 단일 은하($+78\%$)로, 비정상적으로 높은 표면 밀도와 일치합니다.

6. 잔여 오류 구조는 $R_d$와 상관관계가 있고 $\Sigma_d$와 간접적으로 상관관계가 있어, Note XI가 더 작은 CALIB 샘플에서 확인한 것을 $117$-갤럭시 통계 기반에서 확인했습니다.

7. 다음 단계는 그래프 3에서 보이는 잔여 구조를 제거할 수 있는 가장 간단한 물리적 수정인 밀도 의존적 일관성 길이 $\ell_0(\Sigma_d)$를 도입하는 것입니다.

참고 문헌. Lelli, F., McGaugh, S. S., Schombert, J. M. – SPARC: 스피처 광도계와 정확한 회전 곡선을 사용한 175개 원반 은하의 질량 모델, AJ 152, 157 (2016). – Ou, X. 외 – 은하수의 암흑 물질 프로파일, MNRAS 528, 693 (2024). – 맥거, S. S. – 은하 자전의 세 번째 법칙, Galaxies 2, 601 (2014). – 두테르트르, X. – 꿀벌 이론™: 중력의 파동 기반 모델링, v2, BeeTheory.com (2023).