BeeTheory – Fundamentos – Nota técnica XXVI 19 mai 2026 com Claude

A amostra completa de 117 galáxias – Aplicação cega

A estrutura BeeTheory corrigida, com seus dois parâmetros $(\ell_0, \lambda)$ congelados nos valores calibrados em 23 galáxias (Nota XXV), é aplicada sem ajustes adicionais à amostra completa do SPARC mais a Via Láctea – 117 galáxias no total. Dessas, 94 são totalmente cegas: elas nunca foram usadas para definir, ajustar ou verificar qualquer parâmetro. O resultado é um teste genuíno fora da amostra da generalização da teoria em todos os tipos, massas e escalas de galáxias.

1. O resultado primeiro

Parâmetros congelados: $\ell_0 = 0,31$ kpc, $\lambda = 1,95$

Em todas as 117 galáxias: mediana $|\text{err}| = 20,4\%$, erro médio assinado $= +18,1\%$.

Nas 94 galáxias cegas nunca usadas na calibração: mediana $|\text{err}| = 20,6\%$, média assinada $= +12,0\%$.

Limites de cobertura: 50% dentro de 20%, 68% dentro de 30%, 85% dentro de 50%.

O sinal é generalizado fora da amostra

A amostra cega (94 galáxias nunca vistas) atinge a mesma precisão (mediana de US$ 20,6\%$) que a amostra de calibração (mediana de US$ 18,1\%$). Essa é a indicação mais forte até o momento de que a estrutura BeeTheory captura a física real em vez de se ajustar demais ao conjunto de treinamento de 23 galáxias: o desempenho fora da amostra não entra em colapso, apesar de os parâmetros serem mantidos estritamente fixos.

2. Metodologia – o que significa “cego” aqui

As 117 galáxias são divididas em três grupos de acordo com seu papel na calibração:

Grupo	N	Função	Usado para definir parâmetros?
Via Láctea	1	Âncora (curva de rotação do Gaia 2024)	Sim (Nota XXIV isolada, Nota XXV conjunta)
CALIBRE (22 SPARC)	22	Conjunto de calibração	Sim (Nota XXV: ajuste da junta)
CEGO (94 SPARC)	94	Conjunto de teste	Não – nunca visto durante a calibração

Para cada galáxia, os parâmetros de entrada são as quantidades estruturais padrão: Tipo de Hubble $T$, escala do disco $R_d$, densidade da superfície central $\Sigma_d$, massa de hidrogênio neutro $M_{\text{HI}}$ e velocidade plana observada $V_f$. A partir deles, os quatro componentes bariônicos (bojo, disco, gás, braços) são construídos exatamente como nas notas anteriores. O cálculo do campo de onda usa o kernel corrigido:

$$\mathcal{K}(D) \;=\; \frac{1}{4\pi\,\ell_0^2} \cdot \frac{e^{-D/\ell_0}}{D}, \qquad \ell_0 = 0,31 \text{ kpc}, \quad \lambda = 1,95$$

O erro de previsão é calculado em $R = 5\,R_d$, onde se observa que as curvas de rotação são normalmente planas: $\text{err} = (V_\text{tot}^\text{pred}(5R_d) – V_f^\text{obs})/V_f^\text{obs}$.

3. Gráfico 1 – Histograma de distribuição de erros

A distribuição dos erros de previsão assinados nas 117 galáxias, empilhados por grupo de calibração:

Histograma de erros assinados em compartimentos de 10%. Vermelho: 22 galáxias CALIB. Azul: 94 galáxias BLIND (nunca vistas na calibração). Verde tracejado: Posição da Via Láctea. Vermelho tracejado: erro mediano.

Lendo a distribuição

A maior parte das galáxias fica entre um erro de $20\%$ e $+40\%$. O pico está em torno de $+5\%$ a $+15\%$, ligeiramente positivo de zero. A cauda direita se estende até $+100\%$ para um punhado de galáxias (a Via Láctea com $+78\%$ é uma delas); a cauda esquerda é mais curta, mas chega a $-50\%$ para as anãs mais imprevistas. O histograma não é gaussiano – há uma inclinação positiva estruturada, consistente com o padrão residual da Nota XXV.

4. Gráfico 2 – Curva de precisão cumulativa

A fração de galáxias dentro de um determinado limite de erro absoluto:

Fração cumulativa de galáxias com $|\text{err}|$ abaixo do limite. Vermelho: CALIB (22). Azul: BLIND (94). Preto: Todos os 117. Os pontos destacam os valores em $|\text{err}| = 20\%, 30\%, 50\%$.

Limite $\|\text{err}\|$	CALIB (22)	BLIND (94)	Todos (117)
$< 10\%$	$32\%$	$28\%$	$29\%$
$< 20\%$	$55\%$	$49\%$	$50\%$
$< 30\%$	$82\%$	$65\%$	$68\%$
$< 50\%$	$91\%$	$83\%$	$85\%$
$< 80\%$	$100\%$	$98\%$	$98\%$

As curvas CALIB e BLIND são notavelmente próximas: a vantagem do CALIB é de apenas alguns pontos percentuais em cada limite. O MW é o outlier dominante, situado próximo ao topo da cauda direita.

A amostra cega rastreia a amostra de calibração

As duas curvas são quase indistinguíveis abaixo do erro de $40\%$. Esse é o sinal mais claro de generalização genuína fora da amostra: o modelo tem um desempenho quase tão bom em galáxias que nunca viu quanto em galáxias com as quais foi ajustado. Um modelo tradicional com ajuste excessivo mostraria uma grande diferença entre as duas curvas; aqui, a diferença é de no máximo US$ 5 a US$ 10 pontos percentuais.

5. Gráfico 3 – Erro versus escala do disco

O erro de cada uma das 117 galáxias, plotado em relação à escala do disco $R_d$, colorido pelo tipo de Hubble e modelado pelo grupo de calibração (círculos para CALIB e MW, quadrados para BLIND):

Cada ponto corresponde a uma galáxia. Eixo horizontal: escala do disco $R_d$ (log). Eixo vertical: erro de previsão assinado. Faixa verde: $|\text{err}| < 20\%$. Faixas douradas: $20$-$30\%$. As cores seguem o tipo de Hubble. Círculos abertos: Galáxias CALIB. Quadrados: Galáxias BLIND. Grande círculo verde: Via Láctea.

A estrutura Rd em uma amostra muito maior

A correlação estrutural identificada nas Notas XI e XXV agora é visível em $117$ galáxias. As galáxias com $R_d < 1$ kpc (anãs compactas) se agrupam em torno de zero e abaixo – muitas ligeiramente abaixo das previsões. As galáxias com $1 < R_d < 3$ kpc (espirais de tamanho médio) estão bem distribuídas em torno da faixa verde. As galáxias com $R_d > 3$ kpc tendem a erros positivos; algumas espirais maciças de tipo tardio atingem de $+50$ a $+100\%$.

A Via Láctea (círculo verde em $R_d = 2,6$, err $= +78\%$) é o outlier positivo proeminente – seu $\Sigma_d$ é muito mais alto do que a galáxia SPARC média nesse $R_d$, consistente com a hipótese de densidade superficial da Nota XI.

6. Distribuição por tipo de Hubble

Classe Hubble	Faixa de $T	N	Mediana $\|\text{err}\|$	Média assinada
Lenticular e precoce	$T = 0\text{-}2$	$4$	$34.2\%$	$+7.4\%$
Sb-Sbc	$T = 3\text{-}4$	$25$	$18.3\%$	$+17.0\%$
Sc-Scd	$T = 5\text{-}7$	$37$	$24.0\%$	$+17.7\%$
Sd-Im (anões e tardios)	$T = 8\text{-}10$	$51$	$18.3\%$	$+19.8\%$

O modelo lida com todas as quatro classes com precisão comparável. A classe S0-Sa é pequena ($N=4$) e sua mediana é dominada por previsões exageradas no estilo Note-XXIV (alta densidade, bojo compacto). As classes Sb-Sbc e Sd-Im atingem medianas de $\sim 18\%$ – o modelo é amplamente cego em relação à massa.

7. O que isso significa

7.1 O modelo capta o sinal real

A amostra cega alcança uma precisão mediana de $20,6\%$ com parâmetros congelados de uma calibração de $23$-galáxias. Uma teoria que estivesse simplesmente ajustando demais o conjunto de treinamento sofreria uma degradação por um fator de dois ou mais em um conjunto cego de $94$ galáxias. Aqui, a degradação é de $18\%$ (CALIB) para $21\%$ (BLIND) – três pontos percentuais. Esse é o comportamento esperado de um modelo que captura a física genuína.

7.2 A estrutura de erro restante é identificável

O viés positivo de $+18\%$ e a correlação com $R_d$ não são aleatórios; eles refletem a suposição de $(\ell_0, \lambda)$ universal. O padrão visível no Graph 3 – galáxias grandes de $R_d$ superprevistas, galáxias pequenas de $R_d$ subprevistas – indica diretamente a forma do próximo refinamento: o comprimento da coerência deve depender da densidade bariônica local. Essa já era a recomendação das Notas XI e XXV; a amostra de galáxias de $117$ confirma isso em uma base estatística muito maior.

7.3 O MW é uma anomalia que aponta para a mesma direção

A Via Láctea em $+78\%$ é a galáxia única mais superprevista. Seu $\Sigma_d \sim 600\,M_\odot/\text{pc}^2$ (com $\Upsilon_\star = 0,5$, o equivalente para a escala SPARC) está no decil mais alto da amostra. Um $\ell_0$ dependente da densidade naturalmente suprimiria o campo de ondas em um disco de alta densidade, levando o erro MW a zero. O fato de que o MW sozinho (Nota XXIV) ajustado com $\ell_0 = 0,51$ kpc, $\lambda = 1,02$ – um comprimento de coerência $40\%$ maior e um acoplamento $50\%$ menor do que o ajuste global – é consistente com essa interpretação.

8. Resumo

1. A estrutura BeeTheory com o kernel corrigido e os parâmetros $\ell_0 = 0,31$ kpc, $\lambda = 1,95$ (congelados na Nota XXV) é aplicada sem nenhum ajuste adicional a 117 galáxias.

2. Desses, 94 são cegos: eles nunca foram usados em nenhuma etapa de calibração.

3. Desempenho global: mediana $|\text{err}| = 20,4\%$, $50\%$ dentro de $20\%$, $68\%$ dentro de $30\%$, $85\%$ dentro de $50\%$.

4. Amostra cega (94 galáxias): mediana $|\text{err}| = 20,6\%$, média assinada $+12\%$ – essencialmente a mesma precisão do conjunto de calibração (mediana $18,1\%$). O modelo é generalizado.

5. A Via Láctea é a galáxia única mais superprevista ($+78\%$), o que é consistente com sua densidade de superfície anormalmente alta.

6. A estrutura de erro residual está correlacionada com $R_d$ e indiretamente com $\Sigma_d$, confirmando em uma base estatística de $117$ galáxias o que a Nota XI identificou na amostra menor do CALIB.

7. A próxima etapa clara é introduzir um comprimento de coerência dependente da densidade $\ell_0(\Sigma_d)$ – a modificação física mais simples capaz de remover a estrutura residual visível no Graph 3.

Referências. Lelli, F., McGaugh, S. S., Schombert, J. M. – SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves, AJ 152, 157 (2016). – Ou, X. et al. – The dark matter profile of the Milky Way, MNRAS 528, 693 (2024). – McGaugh, S. S. – The third law of galactic rotation (A terceira lei da rotação galáctica), Galaxies 2, 601 (2014). – Dutertre, X. – Bee Theory™: Wave-Based Modeling of Gravity, v2, BeeTheory.com (2023).