蜜蜂理论 – 基础 – 技术说明 XXVI2026 年 3 月 19 日与克劳德

117 个星系的完整样本 – 盲法应用

修正后的蜜蜂理论(BeeTheory)框架,其两个参数$(\ell_0, \lambda)$被冻结在23个星系的校准值上(注释二十五),无需进一步拟合,就被应用于全部SPARC样本加上银河系–总共117个星系。其中有 94 个完全是盲区:它们从未被用来设置、调整或检查任何参数。结果是对该理论在不同星系类型、质量和尺度上的普遍性进行了一次真正的样本外检验。

1.第一项结果

冻结参数:$ell_0 = 0.31$ kpc,$\lambda = 1.95$

所有117个星系:中位数 $|\text{err}| = 20.4\%$, 平均符号误差 $= +18.1/%$。

从未用于校准的94个盲星系:中位数 $|text{err}| = 20.6\%$, 平均符号误差 $= +12.0/%$。

覆盖阈值50%在20%以内,68%在30%以内,85%在50%以内

样本外的信号泛化

盲样本(94 个从未见过的星系)达到了与校准样本(中位数为 18.1 美元)相同的精度(中位数为 20.6 美元)。这是迄今为止最有力的证据,表明蜜蜂理论框架捕捉到了真实的物理现象,而不是过度拟合 23 个星系的训练集:尽管参数被严格固定,样本外的性能并没有崩溃。

2.方法–“盲目 “在这里的含义

这 117 个星系按其在校准中的作用分为三组:

组别N角色用于设置参数?
银河1锚(盖亚 2024 旋转曲线)有(单独注 XXIV、联合注 XXV)
口径22校准装置是(注 XXV 接头配合)
盲点(94 SPARC)94测试装置否 – 校准过程中从未见过

每个星系的输入参数都是标准结构量:哈勃类型 $T$,盘尺度 $R_d$,中心表面密度 $\Sigma_d$,中性氢质量 $M_{text/{HI}}$,以及观测到的平速度 $V_f$。根据这些数据,可以构建出四个重子成分(凸起、圆盘、气体、臂),与之前的注释完全相同。波场计算使用的是修正后的内核:

$$\mathcal{K}(D) \;=\; \frac{1}{4\pi\,\ell_0^2}\cdot \frac{e^{-D/\ell_0}}{D}, \qquad \ell_0 = 0.31 \text{ kpc}, \quad \lambda = 1.95$$

预测误差是在 $R = 5\,R_d$ 时计算的,在这里通常观测到的旋转曲线是平坦的:$\text{err} = (V_\text{tot}^\text{pred}(5R_d) – V_f^text{obs})/V_f^\text{obs}$ 。

3.图 1 – 误差分布柱状图

按校准组叠加的 117 个星系的符号预测误差分布:

预测误差分布 – 117 个星系(盲应用) -80%-60%-40%-20%+0%+20%+40%+60%+80%+100%05101520中位数 +10.4MW 预测误差 (V_pred – V_obs)/V_obs (%) 星系数量 CALIB(22 个星系)BLIND(94 个星系,从未见过)MW
以 10%为单位的符号误差柱状图。红色:22 个 CALIB 星系。蓝色:94 个 BLIND 星系(在校准中从未见过)。绿色虚线:银河系位置。红色虚线:中值误差。

读取分布

大部分星系的误差在 $-20\%$ 和 $+40\%$ 之间。峰值大约在 $+5\%$ 到 $+15/%$之间,略微大于零。少数星系的右侧尾部延伸到了+100%$(银河系就是其中之一,为+78%$);左侧尾部较短,但对于预测最不足的矮星系来说,达到了50%$。直方图不是高斯分布的–有一个结构性的正偏斜,与注释 XXV 中的残差模式一致。

4.图 2 – 累积精度曲线

在给定绝对误差阈值内的星系比例:

预测误差在 X% 以内的星系累计比例 0%10%20%30%40%50%60%70%80%0%25%50%75%100%20%30% 50%68%85% |预测误差 (%) 样本累积分数 CALIB (22)BLIND (94)全部 117
$|\{err}|$低于阈值的星系累计比例。红色:CALIB (22).蓝色BLIND (94).黑色全部 117 个。点突出显示了 $|\text{err}| = 20\%, 30\%, 50\%$ 时的值。
阈值 $|\text{err}|$CALIB (22)盲人 (94)全部 (117)
$< 10\%$$32\%$$28\%$$29\%$
$< 20\%$$55\%$$49\%$$50\%$
$< 30\%$$82\%$$65\%$$68\%$
$< 50\%$$91\%$$83\%$$85\%$
$< 80\%$$100\%$$98\%$$98\%$
CALIB 和 BLIND 曲线非常接近:在每个临界值上,CALIB 的优势只有几个百分点。MW 是主要的离群值,位于右尾部顶端附近。

盲样跟踪校准样

这两条曲线在低于 40%$ 误差的情况下几乎没有区别。这是真正的样本外泛化的最明显的标志:模型在它从未见过的星系上的表现,几乎与在它被校准过的星系上的表现一样好。传统的过拟合模型会在两条曲线之间显示出明显的差距;而在这里,差距最多只有 5 美元-10 美元的百分点。

5.图 3 – 误差与磁盘刻度

117 个星系中每个星系的误差,与圆盘尺度 $R_d$ 的关系图,按哈勃类型着色,按校准组排列(CALIB 和 MW 为圆形,BLIND 为方形):

误差与星盘尺度 Rd – 117 个星系, ℓ₀=0.31 kpc, λ=1.95 0.31310-80%-40%+0%+40%+80%+120%MilkyWay Rd=2.6 err=+78%D631-7 Rd=0.7 err=-0DDO064 Rd=0.33 错误=+27DDO154 Rd=0.6 err=+21DDO161 Rd=1.1 err=+31DDO168 Rd=0.69 错误=-13%。DDO170 Rd=1.1 err=+34ESO116-G012 Rd=2.1 err=+18% 厄立特里亚ESO444-G084 Rd=0.55 err=+18F561-1 Rd=2.5 err=-6F563-1 Rd=2.7 err=-5F563-V1 Rd=1.2 err=-28F563-V2 Rd=1.1 err=-15F565-V2 Rd=1.0 err=-28F567-2 Rd=1.8 err=-11F568-1 Rd=3.2 err=+3F568-3 Rd=3.0 err=-2F568-V1 Rd=2.1 err=-14F571-8 Rd=4.5 err=+23F574-1 Rd=3.6 err=+12NGC2841 Rd=3.5 err=+26% NGC3198 Rd=3.5 err=+25NGC3198 Rd=3.14 err=+64F579-V1 Rd=3.2 err=-0F583-1 Rd=1.8 err=-20F583-4 Rd=1.4 err=-18IC2574 Rd=2.8 err=+63KK98-251 Rd=0.3 err=-14M33 Rd=1.4 err=+3NGC0055 Rd=1.8 err=+7NGC0100 Rd=2.3 err=+12NGC0247 Rd=2.4 err=+27NGC0289 Rd=3.5 err=+38NGC0300 Rd=1.5 误差=+5%。NGC0801 Rd=5.8 err=+65NGC0891 Rd=4.1 err=+15NGC0925 Rd=3.1 err=+71NGC1003 Rd=2.8 err=+28NGC1090 Rd=3.8 err=+27NGC1705 Rd=0.6 err=-13NGC2366 Rd=1.3 err=+33NGC2403 Rd=1.8 误差=+2%。NGC2683 Rd=2.9 err=+16% NGC2903 Rd=2.9 err=+15NGC2903 Rd=2.6 err=+6NGC2915 Rd=0.5 err=-30NGC2955 Rd=5.5 err=+64NGC2976 Rd=0.75 err=-36NGC3109 Rd=1.4 err=-16NGC3521 Rd=2.8 err=+18NGC3621 Rd=2.1 err=+47NGC3726 Rd=3.0 err=+32NGC3741 Rd=0.68 错误=+41NGC3769 Rd=2.8 err=+41NGC3877 Rd=2.7 err=+14NGC3893 Rd=2.8 err=+24NGC3949 Rd=1.4 err=-13NGC3953 Rd=3.5 err=+2NGC3972 Rd=1.6 err=-23NGC3992 Rd=3.8 err=-8NGC4010 Rd=1.8 err=-2NGC4013 Rd=2.2 err=+10NGC4051 Rd=1.9 err=+7NGC4085 Rd=1.2 err=-39NGC4088 Rd=1.9 err=-19NGC4100 Rd=1.8 err=-21NGC4138 Rd=1.3 err=-40NGC4157 Rd=2.6 err=+9NGC4183 Rd=1.6 err=-28NGC4214 Rd=0.5 err=-18NGC4217 Rd=2.8 err=+10NGC4389 Rd=1.2 err=-39NGC4559 Rd=3.2 err=+46% NGC5005 Rd=3.2 err=+45NGC5005 Rd=3.0 err=-6NGC5033 Rd=4.5 err=+55NGC5055 Rd=3.5 err=+48NGC5371 Rd=3.8 err=+24NGC5585 Rd=1.5 err=+5%.NGC5907 Rd=4.2 err=+36NGC5985 Rd=4.5 err=+12NGC6015 Rd=2.4 err=+16NGC6195 Rd=5.2 err=+58NGC6503 Rd=2.4 err=+48NGC6674 Rd=5.5 err=+60NGC6789 Rd=0.3 err=-59 percentNGC6946 Rd=2.6 err=+19NGC7331 Rd=3.2 err=+15NGC7793 Rd=1.8 err=+3UGC00128 Rd=7.5 误差=+97%。UGC02259 Rd=1.6 err=+12UGC02487 Rd=7.5 err=+55UGC02885 Rd=8.5 err=+70UGC05716 Rd=2.0 err=+7UGC05721 Rd=1.2 err=+16UGC05750 Rd=4.5 错误=+65UGC05764 Rd=0.4 误差=-39%。UGC05829 Rd=1.6 err=+2UGC06399 Rd=2.5 误差=+28%。UGC06446 Rd=1.8 误差=+23%。UGC06614 Rd=4.5 误差=+28%。UGC06628 Rd=2.5 误差=+21UGC06667 Rd=2.5 误差=+36%。UGC06917 Rd=2.5 err=+2UGC06983 Rd=2.5 误差=+21%。UGC07125 Rd=4.5 误差=+68%。UGC07151 Rd=1.3 err=-29UGC07261 Rd=1.1 err=-18UGC07399 Rd=1.4 err=-7UGC07690 Rd=0.7 err=-19UGC08286 Rd=1.3 err=-2UGC08490 Rd=0.65 错误率=-18UGC08550 Rd=1.5 错误率=-9UGC09037 Rd=3.5 err=+10UGC11455 Rd=5.5 err=-13UGC11557 Rd=3.0 err=+15UGC11820 Rd=4.5 错误=+54%。UGCA281 Rd=0.5 误差=-31%。UGCA442 Rd=1.0 误差=-34%。 Rd (kpc) – 对数刻度 预测误差 (%) S0-SaSb-SbcSc-ScdSd-ImMW○ calib – □ blind
每个点代表一个星系。横轴:磁盘刻度 $R_d$(对数)。纵轴:符号预测误差。绿带:$|text{err}| < 20/%$。金色带:$20$-$30/%$。颜色遵循哈勃类型。开圆:CALIB星系。正方形:盲星系。绿色大圆银河系。

更大样本上的 Rd 结构

注释 XI 和 XXV 中确定的结构相关性现在可以在 117$ 个星系上看到。R_d < 1$ kpc的星系(紧凑矮星系)聚集在零点及零点以下–许多预测值略低。1 < R_d < 3$ kpc的星系(中等大小的螺旋星系)在绿色带附近分布均匀。R_d > 3$ kpc的星系倾向于正误差;一些大质量晚期螺旋星系的误差达到了+50$到+100%$。

银河系($R_d = 2.6$时的绿色圆圈,err $= +78\%$)是一个突出的正离群值–它的$\Sigma_d$远远高于这个$R_d$的SPARC星系的平均值,这与注释XI中的表面密度假说是一致的。

6.按哈勃类型分列

哈勃级$T$ 范围N中位数 $|\text{err}|$平均签名
透镜和早期$T = 0\text{-}2$$4$$34.2\%$$+7.4\%$
Sb-Sbc$T = 3\text{-}4$$25$$18.3\%$$+17.0\%$
Sc-Scd$T = 5\text{-}7$$37$$24.0\%$$+17.7\%$
Sd-Im(矮星和晚星)$T = 8\text{-}10$$51$$18.3\%$$+19.8\%$
该模型处理所有四个类别的精确度相当。S0-Sa类很小($N=4$),其中位数主要是Note-XXIV式的过度预测(高密度、紧凑隆起)。Sb-Sbc类和Sd-Im类的中值都达到了$\sim 18\%$–模型大体上是质量盲的。

7.这意味着什么

7.1 模型捕捉真实信号

在 23 美元星系校准参数冻结的情况下,盲样本的中位精度达到了 20.6% 美元。如果一个理论仅仅是过度拟合训练集,那么它在 94 美元星系盲样本集上的准确度就会下降 2 倍或更多。这里的退化是从 18 美元(CALIB)到 21 美元(BLIND)–三个百分点。这是一个捕捉到真正物理的模型的预期行为。

7.2 其余误差结构可识别

$+18\%$正偏差以及与$R_d$的相关性并不是随机的;它们反映了普遍的$(\ell_0, \lambda)$假设。图3中可见的模式–大$R_d$星系预测过高,小$R_d$星系预测过低–直接表明了下一步改进的形式:相干长度必须取决于当地重子密度。这已经是注释 XI 和注释 XXV 提出的建议;117 美元星系样本在更大的统计基础上证实了这一点。

7.3 MW 是指向同一方向的异常现象

银河系的预测值为 $+78\%$,是被高估最多的单个星系。它的$\Sigma_d \sim 600\,M_\odot/\text{pc}^2$ ($\Upsilon_\star = 0.5$,相当于SPARC尺度)是样本中最高的十分之一。与密度相关的 $\ell_0$ 会自然而然地抑制这样一个高密度磁盘中的波场,从而使 MW 误差趋于零。事实上,单独的 MW(注 XXIV)拟合值为 $\ell_0 = 0.51$ kpc,$\lambda = 1.02$–相干长度比全局拟合值长 40%$,耦合度比全局拟合值小 50%$–与这一解释是一致的。

8.摘要

1.蜜蜂理论(BeeTheory)框架的校正核和参数$\ell_0 = 0.31$ kpc,$\lambda = 1.95$(从注释 XXV 中冻结)被应用到 117 个星系上,没有做任何进一步的拟合。

2.其中 94 个是盲点:它们从未用于任何校准步骤。

3.全球绩效:中位数 $|\text{err}| = 20.4\%$, $50\%$ within $20\%$, $68\%$ within $30\%$, $85\%$ within $50\%$.

4.盲样本(94 个星系):中位数 $|\text{err}| = 20.6\%$ ,平均符号为 $+12\%$ – 与校准集(中位数 $18.1/%$)的精度基本相同。该模型具有普适性。

5.银河系是被高估最多的单个星系(+78\%$),这与其异常高的表面密度是一致的。

6.残余误差结构与 $R_d$ 相关,并间接与 $\Sigma_d$ 相关,在 117$ 银河系统计基础上证实了注 XI 在较小的 CALIB 样本上所确定的结果。

7.显然,下一步是引入与密度相关的相干长度 $\ell_0(\Sigma_d)$ – 这是能够消除图 3 中可见的残余结构的最简单的物理修改。


参考文献Lelli,F.、McGaugh,S.S.、Schombert,J.M. –SPARC:利用斯皮策测光和精确旋转曲线建立的175个盘状星系质量模型,AJ 152,157 (2016)。- Ou, X. et al. –The dark matter profile of the Milky Way, MNRAS 528, 693 (2024).- McGaugh, S. S. – 银河旋转第三定律,《星系》2, 601 (2014).- Dutertre, X. –Bee Theory™:基于波的引力建模,v2,BeeTheory.com (2023).

BeeTheory.com – 波基量子引力 – 117 个星系失明 – © Technoplane S.A.S. 2026