BeeTheory – Grondslagen – Technische notitie XI
De ontbrekende parameter identificeren:
Stap 1 – Systematische correlatieanalyse
Alvorens het model te wijzigen, wordt in deze noot gediagnosticeerd welke waarneembare parameter de restfout het beste voorspelt. Op basis van de kalibratieset van 22 sterrenstelsels van Notitie VIII testen we de correlatie van de voorspellingsfout met elke fysisch betekenisvolle variabele en vervolgens met elke bivariate combinatie, om nauwkeurig vast te stellen wat het huidige model heeft weggelaten.
1. Het resultaat eerst
De ontbrekende parameter is de centrale oppervlaktedichtheid
De centrale baryonische oppervlaktedichtheid $\Sigma_d$ heeft de sterkste niet-triviale correlatie met de voorspellingsfout: $r = +0,62$, $R^2 = 0,39$ op zichzelf.
Het combineren van $\Sigma_d$ met de schijfgrootte $R_d$ in een bivariaat model verklaart $R^2 = 0,43$ van de restvariantie, vergeleken met $R^2 = 0,07$ met $R_d$ alleen. De RMS-rest daalt van $19,5%$ naar $14,9%$.
Nadat zowel $R_d$ als $\Sigma_d$ geabsorbeerd zijn, bevat geen enkele extra fysische waarneembaar informatie over het residu.
2. Methode
Op basis van de kalibratieset van 22 melkwegstelsels (Noot VIII) hebben we voor elk melkwegstelsel de voorspellingsfout $text{err} = (V_text{tot} – V_f)/V_f$ en een lijst van meetbare fysische parameters. We berekenen de Pearson- en Spearman-correlaties tussen de fout en elke kandidaat-variabele en testen vervolgens bivariate regressies van de vorm:
$$tekst{err}(\%) a \dot R_d \;+; b \dot X \;+; c$$
waarbij $X$ elke kandidaatvariabele is. De beste $X$ is degene die de verklaarde variantie $R^2$ voor de 22 sterrenstelsels maximaliseert. Zelfverwijzende variabelen – variabelen die zijn afgeleid van de modeluitvoer, zoals $V_text{wave}$ of $V_text{tot}$ – worden uitgesloten van de zoekopdracht, omdat hun correlatie met de fout tautologisch is.
3. Univariate correlaties
De 24 geteste kandidaat-variabelen, gerangschikt volgens absolute Pearson correlatie met de fout. Goud gearceerde rijen zijn variabelen die van het model zelf zijn afgeleid (tautologisch); rood gearceerde rijen zijn echte fysische waarneembaarheden met $|r| > 0,5$.
| Variabel | Beschrijving | Peer $r$ | $p$-waarde | Betekenis |
|---|---|---|---|---|
| Vw_over_Vf | Verhouding Vw / Vf | +0.974 | 0.0000 | ★★★ |
| V_dynamisch | V_dyn = √(GM_bar/Rd) | +0.632 | 0.0021 | ★★★ |
| log_Sigma_d | log₁₀(Σ_d) | +0.622 | 0.0026 | ★★★ |
| M_gas | Gasmassa (M_zon) | +0.609 | 0.0034 | ★★★ |
| M_HI | HI-massa (M_zon) | +0.609 | 0.0034 | ★★★ |
| T | Hubble-type | -0.585 | 0.0053 | ★★ |
| Vbar | Baryonische Vbar (km/s) | +0.582 | 0.0057 | ★★ |
| M_balk_over_Rd2 | M_bar / Rd² | +0.559 | 0.0084 | ★★ |
| Vtot | Voorspelde Vtot (km/s) | +0.555 | 0.0090 | ★★ |
| Vw | Golf Vw (km/s) | +0.550 | 0.0098 | ★★ |
| Vbar_over_Vf | Verhouding Vbar / Vf | +0.519 | 0.0158 | ★★ |
| log_M_gas | log₁₀(M_gas) | +0.506 | 0.0193 | ★★ |
| log_M_balk | log₁₀(M_bar) | +0.505 | 0.0196 | ★★ |
| M_balk | Baryonische massa (M_zon) | +0.498 | 0.0214 | ★★ |
| log_M_ster | log₁₀(M_star) | +0.449 | 0.0414 | ★★ |
| Sigma_d | Oppervlaktedichtheid (L/pc²) | +0.426 | 0.0544 | ★★ |
| M_ster_over_Rd2 | M_ster / Rd² | +0.426 | 0.0544 | ★★ |
| M_ster | Stellaire massa (M_zon) | +0.389 | 0.0815 | ★ |
De tabel lezen
De hoogste correlatie is $V_text{wave}/V_f = +0,974$. Dit is tautologisch: door de constructie schaalt de fout direct met $V_text{wave}$, dus deze variabele geeft gewoon de structuur van de voorspellingsformule weer, niet een externe fysische driver.
Onder de echte fysische waarneembaarheden zijn de hoogste correlaties $log(\Sigma_d) = +0.622$, $V_text{dynamisch} = +0.632$, $M_text{gas} = +0.609$, en Hubble-type $T = -0.585$. Deze vier signalen zijn fysisch met elkaar verbonden: dichte schijven hebben de neiging massiever te zijn, van een eerder type, en een hogere baryonische dynamische snelheid te hebben. De vraag is welke de fundamentele drijfveer is.
4. De overbodige variabelen eruit filteren
Verscheidene van de hoogst gecorreleerde variabelen zijn zelf sterk gecorreleerd met $R_d$, de variabele waarvan al bekend is dat deze de fout veroorzaakt. De vraag is welke onafhankelijke informatie bevat.
| Variabel | Correlatie met $R_d$ | Status |
|---|---|---|
| $log(M_star)$ | $r = +0.88$ | Overbodig met $R_d$ |
| $log(M_text{bar})$ | $r = +0.87$ | Overbodig met $R_d$ |
| $log(M_text{gas})$ | $r = +0.86$ | Overbodig met $R_d$ |
| Hubble-type $T$ | $r = -0.66$ | Gedeeltelijk overbodig |
| $V_text{dynamisch}$ | $r = +0.50$ | Gedeeltelijk onafhankelijk |
| $M_text{bar}/R_d^2$ | $r = -0.19$ | Onafhankelijk |
| $log(\Sigma_d)$ | $r = +0.10$ | Onafhankelijk |
De massa’s correleren bijna perfect met $R_d$: een grotere schijf bevat gewoon meer baryonisch materiaal. Deze variabelen bevatten daarom in wezen dezelfde informatie als $R_d$ zelf. Daarentegen zijn $Sigma_d$ (centrale oppervlaktedichtheid) en $M_text{bar}/R_d^2$ (gemiddelde baryonische oppervlaktedichtheid) bijna orthogonaal ten opzichte van $R_d$ in deze steekproef: ze leggen de structurele eigenschap vast van “hoe compact de materie is”, onafhankelijk van “hoe uitgestrekt de schijf is”.
5. Fout versus oppervlaktedichtheid – visualisatie
De fout uitgezet tegen alleen $\log_{10}(\Sigma_d)$, gekleurd door Hubble-type:
De trend is duidelijk en monotoon: sterrenstelsels met een hogere centrale oppervlaktedichtheid worden systematisch overvoorspeld door BeeTheory, terwijl diffuse schijven met een lage dichtheid ondervoorspeld worden. De hellingshoek van $33$ procentpunten per decennium van $\Sigma_d$ komt goed overeen met de gegevens over het hele bereik van 15 tot 605 $L_\odot/{pc}^2$.
6. Bivariate modellen – vergelijking
Het toevoegen van $R_d$ aan elke kandidaatvariabele geeft een duidelijkere rangschikking. De tabel hieronder toont de verklaarde variantie $R^2$ wanneer $R_d$ aan elke tweede variabele wordt gekoppeld (tautologische combinaties uitgesloten):
| Bivariaat model | $R^2$ | RMS rest | Opmerkingen |
|---|---|---|---|
| ${err} = a R_d + c$ (univariate basislijn) | 0.074 | $19.5\%$ | Referentie, geen tweede variabele |
| $_text{err} = a R_d + b f_text{gas} + c$ | 0.101 | $19.3\%$ | Verwaarloosbare verbetering |
| $text{err} = a R_d + b \log M_star + c$ | 0.272 | $17.3\%$ | – |
| $_text{err} = a R_d + b V_text{bar} + c$ | 0.345 | $16.4\%$ | – |
| $XT{err} = a R_d + b Łlog M_text{gas} + c$ | 0.359 | $16.3\%$ | – |
| $tekst{err} = a R_d + b T + c$ | 0.367 | $16.2\%$ | – |
| $ Tekst{err} = a R_d + b ¼ log M_text{bar} + c$ | 0.373 | $16.1\%$ | – |
| $$ Tekst{err} = a R_d + b,V_text{dynamisch} + c | 0.402 | $15.7\%$ | Sterk |
| $tekst{err} = a R_d + b \logSigma_d + c$ | 0.430 | $15.3\%$ | Onafhankelijk van $R_d$ |
| $_text{err} = a R_d + b (M_\text{bar}/R_d^2) + c$ | 0.459 | $14.9\%$ | Beste niet-tautologische model |
Het beste bivariate model
$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$${M_text{bar}{R_d^2} \;+; c, \quad R^2 = 0.46$$.
De variabele $M_text{bar}/R_d^2$ is de gemiddelde baryonische oppervlaktedichtheid van de schijf, $Sigma_text{bar} \rangle = M_text{bar}/(\pi R_d^2)$. Het geeft informatie over hoe compact de zichtbare materie is, onafhankelijk van hoe groot de schijf is. Dit is de variabele waar BeeTheory momenteel geen rekening mee houdt.
7. Controle op sluiting – wat blijft er over nadat $R_d$ en $\Sigma_d$ zijn meegerekend?
Als $R_d$ en $\log \Sigma_d$ samen het structurele defect vastleggen, moet het residu van de bivariate fit ongecorreleerd zijn met elke fysische waarneembaar. Dit testen is de formele afsluitingscontrole:
| Variabel | Correlatie met rest | Status |
|---|---|---|
| $R_d$ | $+0.00$ | Door constructie |
| log \Sigma_d$ | $+0.00$ | Door constructie |
| $log M_star$ | $-0.05$ | Geabsorbeerd |
| log M_text{bar}$ | $+0.07$ | Geabsorbeerd |
| $log M_text{gas}$ | $+0.14$ | Geabsorbeerd |
| Hubble-type $T$ | $-0.04$ | Geabsorbeerd |
| $V_text{dynamisch}$ | $+0.08$ | Geabsorbeerd |
| $V_text{bar}$ | $+0.05$ | Geabsorbeerd |
| $f_text{gas}$ | $+0.28$ | Marginaal; onder significantie |
Na verrekening van $R_d$ en $log \Sigma_d$ blijft geen enkele fysische waarneembare variabele significant gecorreleerd met de restfout. De structurele informatie in de fout wordt volledig opgevangen door deze twee variabelen. De resterende $15%$ RMS-spreiding komt overeen met de waarnemingsonzekerheid van de SPARC-invoerparameters en met de intrinsieke variabiliteit van melkwegstelsel tot melkwegstelsel die niet door een van deze geaggregeerde descriptoren wordt weergegeven.
8. Fysieke interpretatie
Het huidige BeeTheory model gebruikt de schijfschaallengte $R_d$ op twee plaatsen: als de ruimtelijke schaal van de baryonische verdeling (het exponentiële profiel $Sigma propto e^{-R/R_d}$) en als de coherentielengte van de golfkernel ($ell = c_text{disk},R_d$). De amplitude van het baryonische profiel $Sigma_0$ is impliciet, geschaald om na integratie de juiste stellaire massa te geven.
Wat vertegenwoordigt de oppervlaktedichtheid fysisch
De gemiddelde baryonische oppervlaktedichtheid $langle Sigma_text{bar} rangle = M_text{bar}/(pi R_d^2)$ is de massa per oppervlakte-eenheid van de schijf. Twee sterrenstelsels met dezelfde $R_d$ maar verschillende $Sigma_d$ hebben dezelfde geometrische omvang maar verschillende hoeveelheden ingepakte materie. Het huidige model behandelt alleen de geometrische omvang ($R_d$) als relevant voor de golfsamenhangslengte, en negeert hoe geconcentreerd de materie is. Dit is precies de parameter die volgens de restanalyse ontbreekt.
De richting van het effect
De correlatie is positief: de fout neemt toe met de oppervlaktedichtheid. Dit betekent dat voor een vaste $R_d$, dichtere schijven door het model over-voorspeld worden – het golfveld is te sterk ten opzichte van de rotatiecurve. Omgekeerd voorspelt het model voor een gegeven $R_d$ te weinig diffuse schijven met een lage dichtheid. Een plausibele fysische interpretatie: de golfcoherentielengte moet niet alleen afhangen van de geometrische omvang van de bron, maar ook van de concentratie, waarbij dichtere materie een meer gelokaliseerde golfrespons produceert. Dit zou de golfveldamplitude natuurlijk onderdrukken in schijven met een hoog sigma en versterken in schijven met een laag sigma.
9. Samenvatting van stap 1
1. Op de kalibratieset van 22 melkwegstelsels correleert de voorspellingsfout het sterkst met de centrale oppervlaktedichtheid $Sigma_d$ ($r = +0,62$) van de echte fysische waarneembaarheden.
2. Andere variabelen die aanvankelijk sterk gecorreleerd lijken (stellaire massa, gasmassa, baryonische massa) blijken zeer redundant te zijn met $R_d$ (correlaties $geq 0,86$ met $R_d$) en bevatten daarom weinig nieuwe informatie.
3. Het beste niet-tautologische bivariate model is $\text{err} = a\,R_d + b\,(M_\text{bar}/R_d^2) + c$, met $R^2 = 0.46$ en RMS residu $14.9%$. De tweede variabele is de gemiddelde baryonische oppervlaktedichtheid van de schijf.
4. Na verrekening van $R_d$ en $Sigma_d$ blijft geen enkele andere waarneembare variabele significant gecorreleerd met het residu. De diagnose is gesloten.
5. De ontbrekende parameter is geïdentificeerd: het huidige BeeTheory-model houdt rekening met de geometrische omvang van de baryonische verdeling ($R_d$), maar niet met de oppervlaktedichtheid ($\Sigma_d$). De volgende stap is om $Sigma_d$ op te nemen als een tweede invoer voor de golfcoherentielengte, om vervolgens het model opnieuw te testen op de 22-melkwegstelsels.
Referenties. Lelli, F., McGaugh, S. S., Schombert, J. M. – SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves, AJ 152, 157 (2016). – Pearson, K. – Wiskundige bijdragen aan de evolutietheorie III, Phil. Trans. R. Soc. A 187, 253 (1896). Correlatiecoëfficiënt. – Dutertre, X. – Bee Theory™: Wave-Based Modeling of Gravity, v2, BeeTheory.com (2023).
BeeTheory.com – Op golven gebaseerde kwantumzwaartekracht – Diagnostische stap 1 – © Technoplane S.A.S. 2026