BeeTheory – Fundamentos – Nota técnica XI

Identificando o parâmetro ausente:
Etapa 1 – Análise de correlação sistemática

Antes de modificar o modelo, esta nota diagnostica qual parâmetro observável prevê melhor o erro residual. Trabalhando com o conjunto de calibração de 22 galáxias da Nota VIII, testamos a correlação do erro de previsão com cada variável fisicamente significativa e, em seguida, com cada combinação bivariada, para identificar rigorosamente o que o modelo atual omitiu.

1. O resultado primeiro

O parâmetro que falta é a densidade da superfície central

A densidade da superfície bariônica central $\Sigma_d$ tem a correlação não trivial mais forte com o erro de previsão: $r = +0,62$, $R^2 = 0,39$ por si só.

A combinação de $\Sigma_d$ com o tamanho do disco $R_d$ em um modelo bivariado explica $R^2 = 0,43$ da variação residual, em comparação com $R^2 = 0,07$ apenas com $R_d$. O resíduo RMS cai de $19,5\%$ para $14,9\%$.

Depois de absorver $R_d$ e $\Sigma_d$, nenhum observável físico adicional traz informações sobre o resíduo.

2. Método

Trabalhando no conjunto de calibração de 22 galáxias (Nota VIII), para cada galáxia temos o erro de previsão $text{err} = (V_text{tot} – V_f)/V_f$ e uma lista de parâmetros físicos mensuráveis. Calculamos as correlações de Pearson e Spearman entre o erro e cada variável candidata e, em seguida, testamos regressões bivariadas da forma:

$$\text{err}(\%) \;=\; a \cdot R_d \;+\; b \cdot X \;+\; c$$

onde $X$ é cada variável candidata. O melhor $X$ é aquele que maximiza a variância explicada $R^2$ nas 22 galáxias. As variáveis autorreferenciais – aquelas derivadas da saída do modelo, como $V_\text{wave}$ ou $V_\text{tot}$ – são excluídas da pesquisa, pois sua correlação com o erro é tautológica.

3. Correlações univariadas

As 24 variáveis candidatas testadas, classificadas pela correlação absoluta de Pearson com o erro. As linhas sombreadas em dourado são variáveis derivadas do próprio modelo (tautológico); as linhas sombreadas em vermelho são observáveis físicos genuínos com $|r| > 0,5$.

Variável Descrição Pearson $r$ Valor de $p Importância
Vw_over_VfRelação Vw / Vf+0.9740.0000★★★
V_dinâmicoV_dyn = √(GM_bar/Rd)+0.6320.0021★★★
log_Sigma_dlog₁₀(Σ_d)+0.6220.0026★★★
M_gasMassa de gás (M_sun)+0.6090.0034★★★
M_HIMassa HI (M_sun)+0.6090.0034★★★
TTipo Hubble-0.5850.0053★★
VbarVbar bariônico (km/s)+0.5820.0057★★
M_bar_over_Rd2M_bar / Rd²+0.5590.0084★★
VtotVtot previsto (km/s)+0.5550.0090★★
VwOnda Vw (km/s)+0.5500.0098★★
Vbar_over_VfRelação Vbar / Vf+0.5190.0158★★
log_M_gaslog₁₀(M_gas)+0.5060.0193★★
log_M_barlog₁₀(M_bar)+0.5050.0196★★
M_barMassa bariônica (M_sun)+0.4980.0214★★
log_M_starlog₁₀(M_star)+0.4490.0414★★
Sigma_dDensidade da superfície (L/pc²)+0.4260.0544★★
M_star_over_Rd2M_star / Rd²+0.4260.0544★★
M_starMassa estelar (M_sun)+0.3890.0815

Leitura da tabela

A correlação única mais alta é $V_\text{wave}/V_f = +0,974$. Isso é tautológico: por construção, o erro é escalonado diretamente com $V_\text{wave}$, portanto, essa variável simplesmente reflete a estrutura da fórmula de previsão, e não um fator físico externo.

Entre os observáveis físicos genuínos, as correlações mais altas são $\log(\Sigma_d) = +0,622$, $V_\text{dynamical} = +0,632$, $M_\text{gas} = +0,609$ e tipo Hubble $T = -0,585$. Esses quatro sinais estão fisicamente conectados: os discos densos tendem a ser mais maciços, de tipo anterior, e têm maior velocidade dinâmica bariônica. A questão é saber qual é o fator fundamental.

4. Filtragem das variáveis redundantes

Várias das variáveis mais correlacionadas são, elas próprias, fortemente correlacionadas com $R_d$, a variável que já se sabe que gera o erro. A questão é saber qual delas contém informações independentes.

Variável Correlação com $R_d$ Status
$\log(M_\star)$$r = +0.88$Redundante com $R_d$
$\log(M_\text{bar})$$r = +0.87$Redundante com $R_d$
$\log(M_\text{gas})$$r = +0.86$Redundante com $R_d$
Tipo de Hubble $T$$r = -0.66$Parcialmente redundante
$V_\text{dynamical}$$r = +0.50$Parcialmente independente
$M_\text{bar}/R_d^2$$r = -0.19$Independente
$\log(\Sigma_d)$$r = +0.10$Independente

As massas se correlacionam com $R_d$ quase perfeitamente: um disco maior simplesmente contém mais material bariônico. Portanto, essas variáveis carregam essencialmente as mesmas informações que o próprio $R_d$. Em contraste, $\Sigma_d$ (densidade da superfície central) e $M_\text{bar}/R_d^2$ (densidade média da superfície bariônica) são quase ortogonais a $R_d$ nessa amostra: elas capturam a propriedade estrutural de “quão compacta é a matéria”, independentemente de “quão extenso é o disco”.

5. Erro versus densidade da superfície – visualização

Plotagem do erro em relação a $\log_{10}(\Sigma_d)$ sozinho, colorido pelo tipo de Hubble:

Erro de previsão versus densidade da superfície central $Sigma_d$ – 22 galáxias de calibração 101001000 -50%-25%+0%+25%+50% Densidade da superfície central $\Sigma_d$ ($L_\odot/$pc$^2$) – escala logarítmica Erro de previsão (%) err = 33,0-log(Σd) – 60Pearson r = 0,622, R² = 0,387 D631-7 Σd=115 err=-12%DDO064 Σd=120 err=+13%DDO154 Σd=45 err=+4%DDO161 Σd=35 err=+11%DDO168 Σd=100 err=-21%DDO170 Σd=25 err=+15%ESO116-G012 Σd=115 err=+14%ESO444-G084 Σd=60 err=+6%F561-1 Σd=30 err=-15%F563-1 Σd=20 err=-18%F563-V1 Σd=25 err=-36%F563-V2 Σd=30 err=-27%F565-V2 Σd=18 err=-39%F567-2 Σd=15 err=-23%F568-1 Σd=40 err=-8%F568-3 Σd=35 err=-12%F568-V1 Σd=20 err=-24%F571-8 Σd=50 err=+14%F574-1 Σd=30 err=-2%NGC2841 Σd=605 err=+18%NGC3198 Σd=153 err=+43% S0-SaSb-SbcSc-ScdSd-Im
Erro de ajuste univariado$(\%) = 33\log(\Sigma_d) – 60$, Pearson $r = 0,62$, $R^2 = 0,39$.

A tendência é clara e monotônica: as galáxias com maior densidade de superfície central são sistematicamente superprevistas pela BeeTheory, enquanto os discos difusos de baixa densidade são subprevistos. A inclinação do ajuste de $33$ pontos percentuais por década de $\Sigma_d$ corresponde aos dados de forma robusta em toda a faixa de 15 a 605 $L_\odot/\text{pc}^2$.

6. Modelos bivariados – comparação

A adição de $R_d$ a cada variável candidata proporciona uma classificação mais clara. A tabela abaixo mostra a variância explicada $R^2$ quando $R_d$ é emparelhado com cada segunda variável (combinações tautológicas excluídas):

Modelo bivariado $R^2$ RMS residual Notas
$\text{err} = a R_d + c$ (linha de base univariada)0.074$19.5\%$Referência, sem segunda variável
$\text{err} = a R_d + b f_\text{gas} + c$0.101$19.3\%$Melhoria insignificante
$\text{err} = a R_d + b \log M_\star + c$0.272$17.3\%$
$\text{err} = a R_d + b V_\text{bar} + c$0.345$16.4\%$
$\text{err} = a R_d + b \log M_\text{gas} + c$0.359$16.3\%$
$\text{err} = a R_d + b T + c$0.367$16.2\%$
$\text{err} = a R_d + b \log M_\text{bar} + c$0.373$16.1\%$
$\text{err} = a R_d + b\,V_\text{dynamical} + c$0.402$15.7\%$Forte
$\text{err} = a R_d + b \log\Sigma_d + c$0.430$15.3\%$Independente de $R_d$
$\text{err} = a R_d + b (M_\text{bar}/R_d^2) + c$0.459$14.9\%$Melhor modelo não tautológico

O melhor modelo bivariado

$$\text{err}(\%) \;=\; a\,R_d \;+\; b\,\frac{M_\text{bar}}{R_d^2} \;+\; c, \qquad R^2 = 0,46$$

A variável $M_\text{bar}/R_d^2$ é a densidade média da superfície bariônica do disco, $\langle \Sigma_\text{bar} \rangle = M_\text{bar}/(\pi R_d^2)$. Ele contém informações sobre o quão compacta é a matéria visível, independentemente do tamanho do disco. Essa é a variável que a BeeTheory atualmente não leva em conta.

7. Verificação do fechamento – o que resta depois que $R_d$ e $\Sigma_d$ são contabilizados

Se $R_d$ e $\log \Sigma_d$ juntos capturam o defeito estrutural, o resíduo do ajuste bivariado deve ser não correlacionado com cada observável físico. Testar isso é a verificação formal de fechamento:

Variável Correlação com resíduos Status
$R_d$$+0.00$Por construção
$\log \Sigma_d$$+0.00$Por construção
$\log M_\star$$-0.05$Absorvido
$\log M_\text{bar}$$+0.07$Absorvido
$\log M_\text{gas}$$+0.14$Absorvido
Tipo de Hubble $T$$-0.04$Absorvido
$V_\text{dynamical}$$+0.08$Absorvido
$V_\text{bar}$$+0.05$Absorvido
$f_\text{gas}$$+0.28$Marginal; abaixo da significância

Após a contabilização de $R_d$ e $\log \Sigma_d$, nenhum observável físico mantém correlação significativa com o erro residual. As informações estruturais no erro foram totalmente capturadas por essas duas variáveis. A dispersão RMS restante de $15%$ é consistente com a incerteza observacional nos parâmetros de entrada do SPARC e com a variabilidade intrínseca de galáxia para galáxia não capturada por nenhum desses descritores agregados.

8. Interpretação física

O atual modelo BeeTheory usa o comprimento da escala do disco $R_d$ em dois lugares: como a escala espacial da distribuição bariônica (o perfil exponencial $Sigma propto e^{-R/R_d}$) e como o comprimento de coerência do núcleo da onda ($ell = c_text{disk},R_d$). A amplitude do perfil bariônico $\Sigma_0$ está implícita, dimensionada para fornecer a massa estelar correta depois de integrada.

O que a densidade da superfície representa fisicamente

A densidade média da superfície bariônica $langle Sigma_text{bar} rangle = M_text{bar}/(pi R_d^2)$ é a massa por unidade de área do disco. Duas galáxias com o mesmo $R_d$, mas com $\Sigma_d$ diferentes, têm a mesma extensão geométrica, mas quantidades diferentes de matéria empacotada. O modelo atual trata apenas a extensão geométrica ($R_d$) como relevante para o comprimento de coerência da onda, ignorando a concentração da matéria. Esse é exatamente o parâmetro que a análise residual identifica como ausente.

A direção do efeito

A correlação é positiva: o erro aumenta com a densidade da superfície. Isso significa que, para $R_d$ fixo, os discos mais densos são superprevistos pelo modelo – o campo de ondas é muito forte em relação à curva de rotação. Por outro lado, para um determinado $R_d$, o modelo prevê discos difusos de baixa densidade de forma insuficiente. Uma interpretação física plausível: o comprimento de coerência da onda deve depender não apenas da extensão geométrica da fonte, mas também de sua concentração, com a matéria mais densa produzindo uma resposta de onda mais localizada. Isso naturalmente suprimiria a amplitude do campo de ondas em discos de alto$\Sigma$ e a aumentaria em discos de baixo$\Sigma$.

9. Resumo da Etapa 1

1. No conjunto de calibração de 22 galáxias, o erro de previsão se correlaciona mais fortemente com a densidade da superfície central $\Sigma_d$ ($r = +0,62$) entre os observáveis físicos genuínos.

2. Outras variáveis que inicialmente parecem fortemente correlacionadas (massa estelar, massa de gás, massa bariônica) acabam sendo altamente redundantes com $R_d$ (correlações $\geq 0,86$ com $R_d$) e, portanto, trazem poucas informações novas.

3. O melhor modelo bivariado não tautológico é $\text{err} = a\,R_d + b\,(M_\text{bar}/R_d^2) + c$, com $R^2 = 0,46$ e resíduo RMS de $14,9\%$. A segunda variável é a densidade média da superfície bariônica do disco.

4. Após a contabilização de $R_d$ e $\Sigma_d$, nenhum outro observável mantém correlação significativa com o resíduo. O diagnóstico está fechado.

5. O parâmetro que faltava foi identificado: o modelo BeeTheory atual considera a extensão geométrica da distribuição bariônica ($R_d$), mas não sua densidade de superfície ($\Sigma_d$). A próxima etapa é incorporar $\Sigma_d$ como uma segunda entrada para o comprimento de coerência de onda e, em seguida, reajustar o modelo no conjunto de 22 galáxias.


Referências. Lelli, F., McGaugh, S. S., Schombert, J. M. – SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves, AJ 152, 157 (2016). – Pearson, K. – Mathematical contributions to the theory of evolution III (Contribuições matemáticas para a teoria da evolução III), Phil. Trans. R. Soc. A 187, 253 (1896). Coeficiente de correlação. – Dutertre, X. – Bee Theory™: Wave-Based Modeling of Gravity, v2, BeeTheory.com (2023).

BeeTheory.com – Gravidade quântica baseada em ondas – Etapa 1 do diagnóstico – © Technoplane S.A.S. 2026