BeeTheory – 기초 – 기술 노트 2026년 5월 19일 클레드와 함께

117개의 은하계 전체 샘플 – 블라인드 애플리케이션

23개 은하에서 보정된 값으로 고정된 두 매개변수 $(\ell_0, \lambda)$가 있는 수정된 BeeTheory 프레임워크는 전체 SPARC 샘플과 은하수(총 117개 은하)에 추가 피팅 없이 적용되었습니다. 이 중 94개는 매개변수를 설정, 조정 또는 확인하는 데 전혀 사용되지 않은 완전히 블라인드 은하입니다. 그 결과 은하 유형, 질량 및 규모에 걸쳐 이론의 일반화에 대한 진정한 표본 외 테스트가 이루어졌습니다.

1. 결과 먼저

고정 매개변수: $\ell_0 = 0.31$ kpc, $\lambda = 1.95$.

117개 은하 전체에서: 중앙값 $|\text{err}| = 20.4\%$, 평균 부호 오류 $= +18.1\%$.

보정에 사용된 적이 없는 94개 블라인드 은하 전체: 중앙값 $|\text{err}| = 20.6\%$, 평균 부호 $= +12.0\%$.

커버리지 임계값: 20% 이내 50%, 30% 이내 68%, 50% 이내 85%.

신호는 샘플을 벗어난 것을 일반화합니다.

블라인드 샘플(94개의 은하를 본 적이 없는)은 보정 샘플($18.1\%$ 중앙값)과 동일한 정확도($20.6\%$ 중앙값)에 도달합니다. 이는 BeeTheory 프레임워크가 23개 은하 훈련 세트에 과대 적합하지 않고 실제 물리학을 포착한다는 가장 강력한 증거입니다. 매개변수가 엄격하게 고정되어 있음에도 불구하고 샘플 외 성능이 붕괴되지 않습니다.

2. 방법론 – 여기서 “블라인드”의 의미

117개의 은하계는 보정에서의 역할에 따라 세 그룹으로 나뉩니다:

그룹N역할매개변수 설정에 사용되나요?
은하수1앵커(가이아 2024 회전 곡선)예(참고 XXIV 단독, 참고 XXV 공동)
구경(22 스파크)22보정 세트예(참고 XXV 조인트 핏)
블라인드(94 스파크)94테스트 세트아니요 – 보정 중에는 표시되지 않음

각 은하에 대해 입력된 파라미터는 표준 구조량입니다: 허블 유형 $T$, 원반 규모 $R_d$, 중심 표면 밀도 $\Sigma_d$, 중성 수소 질량 $M_{\text{HI}}$, 관측된 평탄 속도 $V_f$입니다. 이로부터 네 가지 바이리오닉 구성 요소(벌지, 디스크, 가스, 암)는 이전 노트에서와 똑같이 구성됩니다. 파장 계산은 보정된 커널을 사용합니다:

$$\mathcal{K}(D) \;=\; \frac{1}{4\pi\,\ell_0^2} \cdot \frac{e^{-D/\ell_0}}{D}, \qquad \ell_0 = 0.31 \text{ kpc}, \quad \lambda = 1.95$$.

예측 오차는 회전 곡선이 일반적으로 평평한 것으로 관찰되는 $\text{err} = (V_\text{tot}^\text{pred}(5R_d) – V_f^\text{obs})/V_f^\text{obs}$에서 계산됩니다.

3. 그래프 1 – 오류 분포 히스토그램

보정 그룹별로 누적된 117개 은하계에서 부호화된 예측 오차의 분포입니다:

예측 오류 분포 – 은하계 117개(블라인드 적용) -80%-60%-40%-20%+0%+20%+40%+60%+80%+100%05101520중앙값 +10.4%MW 예측 오차(V_pred – V_obs)/V_obs(%) 은하 수 CALIB (22개 은하)블라인드(94개 은하, 한 번도 관측되지 않음)MW
10% 구간으로 부호화된 오차의 히스토그램. 빨간색: 22개의 CALIB 은하. 파란색: 94개의 BLIND 은하(보정에서 볼 수 없음). 녹색 점선: 은하 위치. 빨간색 점선: 중앙값 오차.

분포 읽기

대부분의 은하는 $20\%$에서 $+40\%$ 오차 사이에 위치합니다. 정점은 약 $+5\%$에서 $+15\%$ 사이이며, 0에 약간 양수입니다. 오른쪽 꼬리는 소수의 은하($+78\%$의 은하가 그중 하나)에 대해 $+100\%$까지 확장되며, 왼쪽 꼬리는 더 짧지만 가장 과소 예측된 왜성에 대해 $-50\%$에 이릅니다. 히스토그램은 가우시안 형태가 아니며, 노트 XXV의 잔여 패턴과 일치하는 구조적인 양의 기울기가 있습니다.

4. 그래프 2 – 누적 정확도 곡선

주어진 절대 오차 임계값 내에 있는 은하의 비율입니다:

예측 오차 X% 이내의 은하 누적 비율 0%10%20%30%40%50%60%70%80%0%25%50%75%100%20%30% 50%68%85% |예측 오차| (%) 샘플의 누적 비율 CALIB (22)블라인드 (94)모두 117
임계값보다 $|\text{err}|$ 가 낮은 은하의 누적 비율. Red: CALIB (22). 파란색: BLIND (94). 검은색: 모두 117. 점들은 $|\text{err}| = 20\%, 30\%, 50\%$의 값을 강조 표시합니다.
임계값 $|\text{err}|$CALIB (22)블라인드 (94)모두 (117)
$< 10\%$$32\%$$28\%$$29\%$
$< 20\%$$55\%$$49\%$$50\%$
$< 30\%$$82\%$$65\%$$68\%$
$< 50\%$$91\%$$83\%$$85\%$
$< 80\%$$100\%$$98\%$$98\%$
CALIB와 BLIND 곡선은 매우 비슷합니다. 각 임계값에서 CALIB의 우위는 몇 퍼센트 포인트에 불과합니다. MW는 오른쪽 꼬리의 맨 위에 위치한 지배적인 이상값입니다.

블라인드 샘플이 캘리브레이션 샘플을 추적합니다.

두 곡선은 오차 $40\%$ 이하에서는 거의 구별할 수 없습니다. 이것은 진정한 표본 외 일반화의 가장 깨끗한 신호입니다. 이 모델은 한 번도 본 적이 없는 은하에서도 튜닝된 은하와 거의 같은 성능을 보입니다. 기존의 과적합 모델은 두 곡선 사이에 급격한 차이를 보이지만, 여기서는 그 차이가 최대 $5$-$10$ 퍼센트 포인트에 불과합니다.

5. 그래프 3 – 오류 대 디스크 규모

117개 은하 각각에 대한 오차를 디스크 스케일 $R_d$에 대해 플롯하고 허블 유형별로 색상을 지정하고 보정 그룹별로 모양을 지정했습니다(CALIB 및 MW는 원, BLIND는 사각형):

오차 대 디스크 스케일 Rd – 117은하, ℓ₀=0.31 kpc, λ=1.95 0.31310-80%-40%+0%+40%+80%+120%MilkyWay Rd=2.6 err=+78%D631-7 Rd=0.7 err=-0%DDO064 Rd=0.33 err=+27%DDO154 Rd=0.6 err=+21%DDO161 Rd=1.1 err=+31%DDO168 Rd=0.69 err=-13%DDO170 Rd=1.1 err=+34%ESO116-G012 Rd=2.1 err=+18%ESO444-G084 Rd=0.55 err=+18%F561-1 Rd=2.5 err=-6%F563-1 Rd=2.7 err=-5%F563-V1 Rd=1.2 err=-28%F563-V2 Rd=1.1 err=-15%F565-V2 Rd=1.0 err=-28%F567-2 Rd=1.8 err=-11%F568-1 Rd=3.2 err=+3%F568-3 Rd=3.0 err=-2%F568-V1 Rd=2.1 err=-14%F571-8 Rd=4.5 err=+23%F574-1 Rd=3.6 err=+12%NGC2841 Rd=3.5 err=+26%NGC3198 Rd=3.14 err=+64%F579-V1 Rd=3.2 err=-0%F583-1 Rd=1.8 err=-20%F583-4 Rd=1.4 err=-18%IC2574 Rd=2.8 err=+63%KK98-251 Rd=0.3 err=-14%M33 Rd=1.4 err=+3%NGC0055 Rd=1.8 err=+7%NGC0100 Rd=2.3 err=+12%NGC0247 Rd=2.4 err=+27%NGC0289 Rd=3.5 err=+38%NGC0300 Rd=1.5 err=+5%NGC0801 Rd=5.8 err=+65%NGC0891 Rd=4.1 err=+15%NGC0925 Rd=3.1 err=+71%NGC1003 Rd=2.8 err=+28%NGC1090 Rd=3.8 err=+27%NGC1705 Rd=0.6 err=-13%NGC2366 Rd=1.3 err=+33%NGC2403 Rd=1.8 err=+2%NGC2683 Rd=2.9 err=+16%NGC2903 Rd=2.6 err=+6%NGC2915 Rd=0.5 err=-30%NGC2955 Rd=5.5 err=+64%NGC2976 Rd=0.75 err=-36%NGC3109 Rd=1.4 err=-16%NGC3521 Rd=2.8 err=+18%NGC3621 Rd=2.1 err=+47%NGC3726 Rd=3.0 err=+32%NGC3741 Rd=0.68 err=+41%NGC3769 Rd=2.8 err=+41%NGC3877 Rd=2.7 err=+14%NGC3893 Rd=2.8 err=+24%NGC3949 Rd=1.4 err=-13%NGC3953 Rd=3.5 err=+2%NGC3972 Rd=1.6 err=-23%NGC3992 Rd=3.8 err=-8%NGC4010 Rd=1.8 err=-2%NGC4013 Rd=2.2 err=+10%NGC4051 Rd=1.9 err=+7%NGC4085 Rd=1.2 err=-39%NGC4088 Rd=1.9 err=-19%NGC4100 Rd=1.8 err=-21%NGC4138 Rd=1.3 err=-40%NGC4157 Rd=2.6 err=+9%NGC4183 Rd=1.6 err=-28%NGC4214 Rd=0.5 err=-18%NGC4217 Rd=2.8 err=+10%NGC4389 Rd=1.2 err=-39%NGC4559 Rd=3.2 err=+46%NGC5005 Rd=3.0 err=-6%NGC5033 Rd=4.5 err=+55%NGC5055 Rd=3.5 err=+48%NGC5371 Rd=3.8 err=+24%NGC5585 Rd=1.5 err=+5%NGC5907 Rd=4.2 err=+36%NGC5985 Rd=4.5 err=+12%NGC6015 Rd=2.4 err=+16%NGC6195 Rd=5.2 err=+58%NGC6503 Rd=2.4 err=+48%NGC6674 Rd=5.5 err=+60%NGC6789 Rd=0.3 err=-59%NGC6946 Rd=2.6 err=+19%NGC7331 Rd=3.2 err=+15%NGC7793 Rd=1.8 err=+3%UGC00128 Rd=7.5 err=+97%UGC02259 Rd=1.6 err=+12%UGC02487 Rd=7.5 err=+55%UGC02885 Rd=8.5 err=+70%UGC05716 Rd=2.0 err=+7%UGC05721 Rd=1.2 err=+16%UGC05750 Rd=4.5 err=+65%UGC05764 Rd=0.4 err=-39%UGC05829 Rd=1.6 err=+2%UGC06399 Rd=2.5 err=+28%UGC06446 Rd=1.8 err=+23%UGC06614 Rd=4.5 err=+28%UGC06628 Rd=2.5 err=+21%UGC06667 Rd=2.5 err=+36%UGC06917 Rd=2.5 err=+2%UGC06983 Rd=2.5 err=+21%UGC07125 Rd=4.5 err=+68%UGC07151 Rd=1.3 err=-29%UGC07261 Rd=1.1 err=-18%UGC07399 Rd=1.4 err=-7%UGC07690 Rd=0.7 err=-19%UGC08286 Rd=1.3 err=-2%UGC08490 Rd=0.65 err=-18%UGC08550 Rd=1.5 err=-9%UGC09037 Rd=3.5 err=+10%UGC11455 Rd=5.5 err=-13%UGC11557 Rd=3.0 err=+15%UGC11820 Rd=4.5 err=+54%UGCA281 Rd=0.5 err=-31%UGCA442 Rd=1.0 err=-34% Rd(kpc) – 로그 스케일 예측 오차(%) S0-SaSb-SbcSc-ScdSd-ImMW○ 구경 – □ 블라인드
점은 하나의 은하입니다. 가로축: 디스크 스케일 $R_d$(로그). 세로축: 부호화된 예측 오차. 녹색 띠: $|\text{err}| < 20\%$. 금색 띠: $20$-$30\%$. 색상은 허블 유형을 따릅니다. 열린 원: CALIB 은하. 사각형: 블라인드 은하. 큰 녹색 원: 은하수.

훨씬 더 큰 샘플의 Rd 구조

노트 XI과 XXV에서 확인된 구조적 상관관계는 이제 $117$ 은하에서 볼 수 있습니다. R_d < 1$ kpc(소형왜성)인 은하는 0 이하에서 군집을 이루며, 예측이 약간 과소 예측된 경우가 많습니다. 1 < R_d < 3$ kpc(중간 크기 나선)인 은하는 녹색 띠 주위에 잘 분포되어 있습니다. R_d > 3$ kpc인 은하는 양의 오차를 보이는 경향이 있으며, 일부 거대한 후기형 나선은 $+50$에서 $+100\%$에 이릅니다.

우리 은하($R_d = 2.6$의 녹색 원, 오류 $= +78\%$)는 눈에 띄는 양의 이상값으로, 이 $\Sigma_d$는 이 $R_d$에서 평균 SPARC 은하보다 훨씬 높으며, 이는 참고 XI의 표면 밀도 가설과 일치합니다.

6. 허블 유형별 분석

허블 클래스T$ 범위N중앙값 $|\text{err}|$평균 서명
렌티큘러 및 초기$T = 0\text{-}2$$4$$34.2\%$$+7.4\%$
Sb-Sbc$T = 3\text{-}4$$25$$18.3\%$$+17.0\%$
Sc-Scd$T = 5\text{-}7$$37$$24.0\%$$+17.7\%$
Sd-Im(드워프 및 후기)$T = 8\text{-}10$$51$$18.3\%$$+19.8\%$
이 모델은 네 가지 클래스를 모두 비슷한 정확도로 처리합니다. S0-Sa 클래스는 크기가 작고($N=4$) 중앙값은 Note-XXIV 스타일의 과대 예측(고밀도, 콤팩트 벌지)에 의해 지배됩니다. Sb-Sbc 및 Sd-Im 클래스는 모두 중앙값 $\sim 18\%$를 달성하며, 이 모델은 대체로 질량 맹검 모델입니다.

7. 이것이 의미하는 것

7.1 모델은 실제 신호를 캡처합니다.

블라인드 샘플은 $23$ 은하계 보정에서 고정된 매개변수로 $20.6\%$의 중앙값 정확도에 도달했습니다. 단순히 훈련 집합을 과적합한 이론은 $94$ 은하계 블라인드 집합에서 두 배 이상 성능이 저하될 것입니다. 여기서 성능 저하는 $18\%$(CALIB)에서 $21\%$(블라인드)로 3% 포인트입니다. 이는 실제 물리학을 포착하는 모델에서 예상되는 동작입니다.

7.2 나머지 오류 구조를 식별할 수 있습니다.

18\%$ 양의 편향과 $R_d$와의 상관관계는 무작위가 아니며, 보편적인 $(\ell_0, \lambda)$ 가정을 반영합니다. 그래프 3에서 볼 수 있는 패턴(큰 $R_d$ 은하는 과대 예측되고 작은 $R_d$ 은하는 과소 예측됨)은 다음 세분화의 형태를 직접적으로 나타냅니다: 일관성 길이는 국소 바이리온 밀도에 따라 달라져야 합니다. 이것은 이미 노트 XI 및 XXV의 권장 사항이었으며, $117$ 은하 샘플은 훨씬 더 큰 통계적 기반에서 이를 확인했습니다.

7.3 MW는 같은 방향을 가리키는 이상 현상입니다.

78\%$의 은하수는 가장 과대 예측된 단일 은하입니다. 시그마_d \sim 600\,M_\odot/\text{pc}^2$(SPARC 척도에 해당하는 $\Upsilon_\star = 0.5$ 사용)는 샘플의 가장 높은 분위에 속합니다. 밀도에 따라 달라지는 $\ell_0$은 이러한 고밀도 디스크의 파장을 자연스럽게 억제하여 MW 오차를 0으로 만들 것입니다. MW만 $\ell_0 = 0.51$ kpc, $\lambda = 1.02$ (글로벌 적합보다 $40\%$ 더 긴 일관성 길이와 $50\%$ 더 작은 커플링)로 적합된다는 사실(참고 XXIV)은 이 해석과 일치합니다.

8. 요약

1. 수정된 커널과 파라미터 $\ell_0 = 0.31$ kpc, $\lambda = 1.95$(참고 XXV에서 고정)를 사용한 BeeTheory 프레임워크를 117개 은하에 추가 피팅 없이 적용했습니다.

2. 이 중 94개는 어떤 보정 단계에서도 사용된 적이 없는 블라인드입니다.

3. 글로벌 성능: 중앙값 $|\text{err}| = 20.4\%$, $20\%$ 이내 $50\%$, $30\%$ 이내 $68\%$, $50\%$ 이내 $85\%$.

4. 블라인드 샘플(94개 은하): 중앙값 $|\text{err}| = 20.6\%$, 평균 부호 $+12\%$ – 기본적으로 보정 세트($18.1\%$ 중앙값)와 동일한 정확도입니다. 이 모델은 일반화됩니다.

5. 은하수는 가장 과대 예측된 단일 은하($+78\%$)로, 비정상적으로 높은 표면 밀도와 일치합니다.

6. 잔여 오류 구조는 $R_d$와 상관관계가 있고 $\Sigma_d$와 간접적으로 상관관계가 있어, Note XI가 더 작은 CALIB 샘플에서 확인한 것을 $117$-갤럭시 통계 기반에서 확인했습니다.

7. 다음 단계는 그래프 3에서 보이는 잔여 구조를 제거할 수 있는 가장 간단한 물리적 수정인 밀도 의존적 일관성 길이 $\ell_0(\Sigma_d)$를 도입하는 것입니다.


참고 문헌. Lelli, F., McGaugh, S. S., Schombert, J. M. – SPARC: 스피처 광도계와 정확한 회전 곡선을 사용한 175개 원반 은하의 질량 모델, AJ 152, 157 (2016). – Ou, X. 외 – 은하수의 암흑 물질 프로파일, MNRAS 528, 693 (2024). – 맥거, S. S. – 은하 자전의 세 번째 법칙, Galaxies 2, 601 (2014). – 두테르트르, X. – 꿀벌 이론™: 중력의 파동 기반 모델링, v2, BeeTheory.com (2023).

BeeTheory.com – 파동 기반 양자 중력 – 117개의 은하가 보이지 않음 – © Technoplane S.A.S. 2026