BeeTheory – Foundations – Technical Note XXVI 19 mai 2026 with Claude

Pełna próbka 117 galaktyk – ślepe zastosowanie

Poprawiona struktura BeeTheory, z dwoma parametrami $(\ell_0, \lambda)$ zamrożonymi na wartościach skalibrowanych dla 23 galaktyk (Uwaga XXV), jest stosowana bez dalszego dopasowywania do pełnej próbki SPARC plus Droga Mleczna – łącznie 117 galaktyk. Spośród nich 94 są całkowicie ślepe: nigdy nie zostały użyte do ustawienia, dostrojenia lub sprawdzenia jakiegokolwiek parametru. Rezultatem jest prawdziwy pozapróbkowy test uogólnienia teorii na różne typy, masy i skale galaktyk.

1. Wynik pierwszy

Parametry zamrożone: $\ell_0 = 0,31$ kpc, $\lambda = 1,95$.

Dla wszystkich 117 galaktyk: mediana $|\text{err}| = 20.4\%$, średni podpisany błąd $= +18.1\%$.

Dla 94 ślepych galaktyk nigdy nie użytych w kalibracji: mediana $|\text{err}| = 20.6\%$, średnia podpisana $= +12.0\%$.

Progi pokrycia: 50% w granicach 20%, 68% w granicach 30%, 85% w granicach 50%.

Sygnał uogólnia się poza próbką

Ślepa próba (94 nigdy nie widziane galaktyki) osiąga taką samą dokładność (mediana 20,6\%$) jak próba kalibracyjna (mediana 18,1\%$). Jest to jak dotąd najsilniejsza wskazówka, że struktura BeeTheory oddaje rzeczywistą fizykę, a nie nadmierne dopasowanie do zestawu treningowego 23 galaktyk: wydajność poza próbką nie spada, mimo że parametry są ściśle ustalone.

2. Metodologia – co oznacza tutaj „ślepy”

117 galaktyk podzielono na trzy grupy ze względu na ich rolę w kalibracji:

GrupaNRolaSłuży do ustawiania parametrów?
Droga Mleczna1Kotwica (krzywa obrotu Gaia 2024)Tak (Uwaga XXIV samodzielnie, Uwaga XXV wspólnie)
CALIB (22 SPARC)22Zestaw kalibracyjnyTak (Uwaga XXV dopasowanie złącza)
ŚLEPY (94 SPARC)94Zestaw testowyNie – nigdy nie widziany podczas kalibracji

Dla każdej galaktyki parametrami wejściowymi są standardowe wielkości strukturalne: Typ Hubble’a $T$, skala dysku $R_d$, centralna gęstość powierzchniowa $\Sigma_d$, masa neutralnego wodoru $M_{\text{HI}}$ oraz obserwowana prędkość płaska $V_f$. Na tej podstawie cztery składniki barionowe (wybrzuszenie, dysk, gaz, ramiona) są konstruowane dokładnie tak, jak w poprzednich notatkach. Obliczenia pola falowego wykorzystują skorygowane jądro:

$$\mathcal{K}(D) \;=\; \frac{1}{4\pi\,\ell_0^2} \cdot \frac{e^{-D/\ell_0}}{D}, \qquad \ell_0 = 0.31 \text{ kpc}, \quad \lambda = 1.95$$.

Błąd predykcji jest obliczany przy $R = 5\,R_d$, gdzie krzywe rotacji są zwykle obserwowane jako płaskie: $\text{err} = (V_\text{tot}^\text{pred}(5R_d) – V_f^\text{obs})/V_f^\text{obs}$.

3. Wykres 1 – Histogram rozkładu błędów

Rozkład podpisanych błędów przewidywania dla 117 galaktyk, ułożonych według grupy kalibracyjnej:

Rozkład błędów predykcji – 117 galaktyk (ślepa aplikacja) -80%-60%-40%-20%+0%+20%+40%+60%+80%+100%05101520mediana +10,4%MW Błąd przewidywania (V_pred – V_obs)/V_obs (%) Liczba galaktyk CALIB (22 galaktyki)BLIND (94 galaktyki, nigdy nie widziane)MW
Histogram podpisanych błędów w przedziałach 10%. Czerwony: 22 galaktyki CALIB. Niebieski: 94 galaktyki BLIND (nigdy nie widziane w kalibracji). Zielona kreska: Pozycja Drogi Mlecznej. Czerwona kreska: mediana błędu.

Odczytywanie rozkładu

Większość galaktyk znajduje się w przedziale od $20\%$ do $+40\%$ błędu. Szczyt wynosi około $+5\%$ do $+15\%$, nieco powyżej zera. Prawy ogon rozciąga się do $+100\%$ dla garstki galaktyk (Droga Mleczna z $+78\%$ jest jedną z nich); lewy ogon jest krótszy, ale osiąga $-50\%$ dla najbardziej niedoszacowanych karłów. Histogram nie jest gaussowski – występuje ustrukturyzowane dodatnie nachylenie, zgodne z resztkowym wzorem z Notatki XXV.

4. Wykres 2 – Krzywa skumulowanej dokładności

Ułamek galaktyk w obrębie danego progu błędu bezwzględnego:

Skumulowany odsetek galaktyk w granicach X% błędu przewidywania 0%10%20%30%40%50%60%70%80%0%25%50%75%100%20%30% 50%68%85% |błąd przewidywania| (%) Skumulowana część próbki CALIB (22)BLIND (94)Wszystkie 117
Skumulowany ułamek galaktyk z $|\text{err}|$ poniżej progu. Czerwony: CALIB (22). Niebieski: BLIND (94). Czarny: Wszystkie 117. Kropkami zaznaczono wartości $|\text{err}| = 20\%, 30\%, 50\%$.
Próg $|\text{err}|$CALIB (22)BLIND (94)Wszystkie (117)
$< 10\%$$32\%$$28\%$$29\%$
$< 20\%$$55\%$$49\%$$50\%$
$< 30\%$$82\%$$65\%$$68\%$
$< 50\%$$91\%$$83\%$$85\%$
$< 80\%$$100\%$$98\%$$98\%$
Krzywe CALIB i BLIND są niezwykle zbliżone: przewaga CALIB wynosi zaledwie kilka punktów procentowych przy każdym progu. MW jest dominującą wartością odstającą, znajdującą się w pobliżu górnej części prawego ogona.

Próbka ślepa śledzi próbkę kalibracyjną

Obie krzywe są prawie nierozróżnialne poniżej błędu 40\%$. Jest to najczystsza oznaka prawdziwego uogólnienia poza próbą: model działa prawie tak dobrze na galaktykach, których nigdy nie widział, jak na galaktykach, do których został dostrojony. Tradycyjny model z nadmiernym dopasowaniem wykazałby ostrą lukę między dwiema krzywymi; tutaj różnica wynosi co najwyżej 5-10 punktów procentowych.

5. Wykres 3 – Błąd a skala dysku

Błąd dla każdej ze 117 galaktyk, wykreślony względem skali dysku $R_d$, pokolorowany według typu Hubble’a i ukształtowany według grupy kalibracyjnej (kółka dla CALIB i MW, kwadraty dla BLIND):

Błąd a skala dysku Rd – 117 galaktyk, ℓ₀=0.31 kpc, λ=1.95 0.31310-80%-40%+0%+40%+80%+120%MilkyWay Rd=2.6 err=+78%D631-7 Rd=0.7 err=-0%DDO064 Rd=0.33 err=+27%DDO154 Rd=0.6 err=+21%DDO161 Rd=1.1 err=+31%DDO168 Rd=0.69 err=-13%DDO170 Rd=1.1 err=+34%ESO116-G012 Rd=2.1 err=+18%ESO444-G084 Rd=0.55 err=+18%F561-1 Rd=2,5 err=-6%F563-1 Rd=2.7 err=-5%F563-V1 Rd=1.2 err=-28%F563-V2 Rd=1.1 err=-15%F565-V2 Rd=1.0 err=-28%F567-2 Rd=1.8 err=-11%F568-1 Rd=3.2 err=+3%F568-3 Rd=3.0 err=-2%F568-V1 Rd=2.1 err=-14%F571-8 Rd=4.5 err=+23%F574-1 Rd=3.6 err=+12%NGC2841 Rd=3.5 err=+26%NGC3198 Rd=3.14 err=+64%F579-V1 Rd=3.2 err=-0%F583-1 Rd=1.8 err=-20%F583-4 Rd=1.4 err=-18%IC2574 Rd=2.8 err=+63%KK98-251 Rd=0.3 err=-14%M33 Rd=1.4 err=+3%NGC0055 Rd=1.8 err=+7%NGC0100 Rd=2.3 err=+12%NGC0247 Rd=2.4 err=+27%NGC0289 Rd=3.5 err=+38%NGC0300 Rd=1.5 err=+5%NGC0801 Rd=5.8 err=+65%NGC0891 Rd=4.1 err=+15%NGC0925 Rd=3.1 err=+71%NGC1003 Rd=2.8 err=+28%NGC1090 Rd=3.8 err=+27%NGC1705 Rd=0.6 err=-13%NGC2366 Rd=1.3 err=+33%NGC2403 Rd=1.8 err=+2%NGC2683 Rd=2.9 err=+16%NGC2903 Rd=2.6 err=+6%NGC2915 Rd=0.5 err=-30%NGC2955 Rd=5.5 err=+64%NGC2976 Rd=0.75 err=-36%NGC3109 Rd=1.4 err=-16%NGC3521 Rd=2.8 err=+18%NGC3621 Rd=2.1 err=+47%NGC3726 Rd=3.0 err=+32%NGC3741 Rd=0.68 err=+41%NGC3769 Rd=2.8 err=+41%NGC3877 Rd=2.7 err=+14%NGC3893 Rd=2.8 err=+24%NGC3949 Rd=1.4 err=-13%NGC3953 Rd=3.5 err=+2%NGC3972 Rd=1.6 err=-23%NGC3992 Rd=3.8 err=-8%NGC4010 Rd=1.8 err=-2%NGC4013 Rd=2.2 err=+10%NGC4051 Rd=1.9 err=+7%NGC4085 Rd=1.2 err=-39%NGC4088 Rd=1.9 err=-19%NGC4100 Rd=1.8 err=-21%NGC4138 Rd=1.3 err=-40%NGC4157 Rd=2.6 err=+9%NGC4183 Rd=1.6 err=-28%NGC4214 Rd=0.5 err=-18%NGC4217 Rd=2.8 err=+10%NGC4389 Rd=1.2 err=-39%NGC4559 Rd=3.2 err=+46%NGC5005 Rd=3.0 err=-6%NGC5033 Rd=4.5 err=+55%NGC5055 Rd=3.5 err=+48%NGC5371 Rd=3.8 err=+24%NGC5585 Rd=1.5 err=+5%NGC5907 Rd=4.2 err=+36%NGC5985 Rd=4.5 err=+12%NGC6015 Rd=2.4 err=+16%NGC6195 Rd=5.2 err=+58%NGC6503 Rd=2.4 err=+48%NGC6674 Rd=5.5 err=+60%NGC6789 Rd=0.3 err=-59%NGC6946 Rd=2.6 err=+19%NGC7331 Rd=3.2 err=+15%NGC7793 Rd=1.8 err=+3%UGC00128 Rd=7.5 err=+97%UGC02259 Rd=1.6 err=+12%UGC02487 Rd=7.5 err=+55%UGC02885 Rd=8.5 err=+70%UGC05716 Rd=2.0 err=+7%UGC05721 Rd=1.2 err=+16%UGC05750 Rd=4.5 err=+65%UGC05764 Rd=0.4 err=-39%UGC05829 Rd=1.6 err=+2%UGC06399 Rd=2.5 err=+28%UGC06446 Rd=1.8 err=+23%UGC06614 Rd=4.5 err=+28%UGC06628 Rd=2.5 err=+21%UGC06667 Rd=2.5 err=+36%UGC06917 Rd=2.5 err=+2%UGC06983 Rd=2.5 err=+21%UGC07125 Rd=4.5 err=+68%UGC07151 Rd=1.3 err=-29%UGC07261 Rd=1.1 err=-18%UGC07399 Rd=1.4 err=-7%UGC07690 Rd=0.7 err=-19%UGC08286 Rd=1.3 err=-2%UGC08490 Rd=0.65 err=-18%UGC08550 Rd=1.5 err=-9%UGC09037 Rd=3.5 err=+10%UGC11455 Rd=5.5 err=-13%UGC11557 Rd=3.0 err=+15%UGC11820 Rd=4.5 err=+54%UGCA281 Rd=0.5 err=-31%UGCA442 Rd=1.0 err=-34% Rd (kpc) – skala logarytmiczna Błąd przewidywania (%) S0-SaSb-SbcSc-ScdSd-ImMW○ CALIB – □ BLIND
Każdy punkt oznacza jedną galaktykę. Oś pozioma: skala dysku $R_d$ (log). Oś pionowa: podpisany błąd predykcji. Zielone pasmo: $|\text{err}| < 20\%$. Złote pasy: $20$-$30\%$. Kolory zgodne z typem Hubble’a. Otwarte okręgi: Galaktyki CALIB. Kwadraty: galaktyki BLIND. Duże zielone koło: Droga Mleczna.

Struktura Rd na znacznie większej próbce

Korelacja strukturalna zidentyfikowana w Notatkach XI i XXV jest teraz widoczna na 117$ galaktykach. Galaktyki z $R_d < 1$ kpc (zwarte karły) skupiają się wokół zera i poniżej – wiele z nich jest nieznacznie niedoszacowanych. Galaktyki z $1 < R_d < 3$ kpc (średniej wielkości spirale) są dobrze rozmieszczone wokół zielonego pasma. Galaktyki z $R_d > 3$ kpc mają tendencję do dodatnich błędów; niektóre masywne spirale późnego typu osiągają od $+50$ do $+100\%$.

Droga Mleczna (zielony okrąg przy $R_d = 2.6$, err $= +78\%$) jest wyraźnym dodatnim punktem odstającym – jej $\Sigma_d$ jest znacznie wyższa niż przeciętna galaktyka SPARC przy tym $R_d$, co jest zgodne z hipotezą gęstości powierzchniowej z Uwagi XI.

6. Podział według typu Hubble’a

Klasa Hubble’aZakres $T$NMediana $|\text{err}|$Średnia podpisana
Soczewkowe i wczesne$T = 0\text{-}2$.$4$$34.2\%$$+7.4\%$
Sb-Sbc$T = 3\text{-}4$.$25$$18.3\%$$+17.0\%$
Sc-Scd$T = 5\text{-}7$.$37$$24.0\%$$+17.7\%$
Sd-Im (karły i późne)$T = 8\text{-}10$.$51$$18.3\%$$+19.8\%$
Model radzi sobie ze wszystkimi czterema klasami z porównywalną dokładnością. Klasa S0-Sa jest niewielka ($N=4$), a jej mediana jest zdominowana przez nadmierne przewidywania w stylu Note-XXIV (wysoka gęstość, zwarta wypukłość). Klasy Sb-Sbc i Sd-Im osiągają medianę $\sim 18\%$ – model jest zasadniczo ślepy na masę.

7. Co to oznacza?

7.1 Model oddaje rzeczywisty sygnał

Ślepa próba osiąga medianę dokładności na poziomie 20,6\%$ z parametrami zamrożonymi z kalibracji galaktyk o wartości 23$. Teoria, która była po prostu nadmiernie dopasowana do zestawu treningowego, pogorszyłaby się o współczynnik dwa lub więcej na ślepym zestawie 94 $ galaktyk. W tym przypadku degradacja wynosi od $18\%$ (CALIB) do $21\%$ (BLIND) – trzy punkty procentowe. Jest to oczekiwane zachowanie modelu, który odzwierciedla prawdziwą fizykę.

7.2 Pozostała struktura błędu jest możliwa do zidentyfikowania

Dodatnie odchylenie $+18\%$ i korelacja z $R_d$ nie są przypadkowe; odzwierciedlają one założenie uniwersalnego $(\ell_0, \lambda)$. Wzorzec widoczny na wykresie 3 – duże galaktyki $R_d$ przewidywane z nadmiarem, małe galaktyki $R_d$ przewidywane z niedomiarem – bezpośrednio wskazuje na formę kolejnego udoskonalenia: długość koherencji musi zależeć od lokalnej gęstości barionowej. Było to już zaleceniem Notatek XI i XXV; próbka galaktyk o wartości 117$ potwierdza to na znacznie większej bazie statystycznej.

7.3 MW jest anomalią, która wskazuje ten sam kierunek

Droga Mleczna o wartości $+78\%$ jest najbardziej przeszacowaną pojedynczą galaktyką. Jej $\Sigma_d \sim 600\,M_\odot/\text{pc}^2$ (przy $\Upsilon_\star = 0,5$, odpowiednik dla skali SPARC) znajduje się w najwyższym decylu próbki. Zależny od gęstości $\ell_0$ naturalnie tłumiłby pole falowe w dysku o tak dużej gęstości, sprowadzając błąd MW do zera. Fakt, że sama MW (Uwaga XXIV) dopasowana do $\ell_0 = 0.51$ kpc, $\lambda = 1.02$ – 40\%$ dłuższa długość koherencji i 50\%$ mniejsze sprzężenie niż dopasowanie globalne – jest zgodna z tą interpretacją.

8. Podsumowanie

1. Struktura BeeTheory ze skorygowanym jądrem i parametrami $\ell_0 = 0,31$ kpc, $\lambda = 1,95$ (zamrożone z Uwagi XXV) jest stosowana bez dalszego dopasowywania do 117 galaktyk.

2. Spośród nich 94 są ślepe: nigdy nie były używane w żadnym etapie kalibracji.

3. Globalna wydajność: mediana $|\text{err}| = 20.4\%$, $50\%$ w granicach $20\%$, $68\%$ w granicach $30\%$, $85\%$ w granicach $50\%$.

4. Ślepa próba (94 galaktyki): mediana $|\text{err}| = 20.6\%$, średnia podpisana $+12\%$ – zasadniczo taka sama dokładność jak w przypadku zestawu kalibracyjnego (mediana $18.1\%$). Model uogólnia się.

5. Droga Mleczna jest najbardziej zawyżoną pojedynczą galaktyką ($+78\%$), co jest zgodne z jej anomalnie wysoką gęstością powierzchniową.

6. Struktura błędu resztkowego koreluje z $R_d$ i pośrednio z $\Sigma_d$, potwierdzając na bazie statystycznej $117$-galaktyk to, co Uwaga XI zidentyfikowała na mniejszej próbce CALIB.

7. Oczywistym kolejnym krokiem jest wprowadzenie zależnej od gęstości długości koherencji $\ell_0(\Sigma_d)$ – najprostszej fizycznej modyfikacji zdolnej do usunięcia szczątkowej struktury widocznej na wykresie 3.


Referencje. Lelli, F., McGaugh, S. S., Schombert, J. M. – SPARC: Modele masy dla 175 galaktyk dyskowych z fotometrią Spitzera i dokładnymi krzywymi rotacji, AJ 152, 157 (2016). – Ou, X. et al. – The dark matter profile of the Milky Way, MNRAS 528, 693 (2024). – McGaugh, S. S. – The third law of galactic rotation, Galaxies 2, 601 (2014). – Dutertre, X. – Bee Theory™: Wave-Based Modeling of Gravity, v2, BeeTheory.com (2023).

BeeTheory.com – Kwantowa grawitacja oparta na falach – 117 galaktyk ślepych – © Technoplane S.A.S. 2026