蜜蜂理论 – 统计分析 – 2025 年

阅读适合

χ²/dof = 0.475

一个介于 0 和 ∞ 之间的数字,它告诉你你的模型与数据的拟合程度是很好、太好,还是完全不符合。下面是它在BeeTheory星系模拟中的含义以及我们需要什么来获得真正可靠的结果。

什么是 χ²/dof?

当模型预测值为Vmodel(Ri),而数据提供的观测值为Vobs(Ri),且测量不确定度为σi,则缩小的奇平方为:

\(\frac{\chi^2}{\mathrm{dof}}=\frac{1}{N-p}\sum_{i=1}^{N}\left(\frac{V_{\mathrm{model}}(R_i)-V_{\mathrm{obs}}(R_i)}{\sigma_i}\right)^2\)

其中,N 是数据点的数量,p 是自由参数的数量。

此处N = 16 个 Gaia 2024 点,p = 2 个拟合参数 K 和 α,因此 dof = 14。

总和中的每个项都是一个拉数:以测量不确定度单位表示的残差。

0.5 的拉力意味着模型偏离了半个西格玛–非常好。2.0 的拉力意味着两个西格玛的偏差–值得研究。

[/latex](frac{chi^2}){mathrm{dof}}(ll1 (quad/rightarrow){model fits the data at the level of their uncertainties}[/latex] (模型在其不确定性水平上与数据拟合)[/latex] 。 \(\frac{\chi^2}\mathrm{dof}}\ll1\quad\Rightarrow\quad/text{模型拟合得太好:不确定性可能被高估了,或者说是过拟合}\) 。 \(\frac{chi^2}{mathrm{dof}}\gg1\quad\Rightarrow\quad\text{model is wrong, or uncertainties are underestimated}\)[/latex]

我们的编号:0.475

0.475

χ² / dof – N = 16 – p = 2 – dof = 14

χ²/dof 标度

0.475 ← us
1.0 理想
00.511.522.53+
< 0.3
过拟合
0.3-0.7
优秀
0.7-1.3
良好
1.3-2.0
合格
> 2.0

0.475 的值位于优秀区域。模型没有出错–所有 16 个数据点的平均残差仅为 0.69σ。

从物理上讲,这意味着 “蜜蜂理论 “对几乎所有观测半径的圆周速度的预测都小于一个测量不确定度。

但 “优秀 “并不等于 “经过验证”

χ²/dof = 0.475 也可能意味着测量不确定度σi被略微高估了。如果真实误差小 30%,同样的模型将得出 χ²/dof ≈ 1.0。

仅凭 χ² 我们无法区分 “模型非常好 “和 “误差稍大”。这是标准的统计模糊性。

The Residuals – Point by Point

原始数字 0.475 隐藏了一些信息。通过观察单个拉数,我们可以发现拟合的结构:模型在哪些点上钉住了钉子,在哪些地方陷入了困境。

拉动图:\((V_{\mathrm{model}}-V_{\mathrm{obs}})/\sigma_i\)盖亚 2024 的每个数据点

R (kpc)VobsσV 模型剩余
加载残差…

15 / 16 分在 1σ 以内

除 R = 27.3 kpc 外,每个数据点的|pull|都小于 1.0。在一个高斯误差校准良好的模型中,我们预计大约有 68% 的点的误差在 1σ 以内,而这里的误差为 94%。

这表明模型非常出色,或者内点的误差条略微过大。

R = 27.3 kpc处的离群点–拉力 = +1.53σ

模型预测Vc= 195.3 km/s,而盖亚测量的结果是 173 ± 17 km/s。

差异为 22.3 km/s,即 1.53σ。这在统计上并不惊人,但在物理上却很重要:模型在最大半径处的下降速度太慢。

最佳拟合参数 K = 0.01349

耦合常数 K = 0.01349 kpc-¹ 是每单位可见质量产生的《蜜蜂理论》暗质量场的振幅。

它是通过最小化 16 个 Gaia 数据点上的 χ² 确定的,α = 0.0744 kpc-¹ 是由 Newby + Gaia 组合拟合固定的。

\(K=0.01349\,\mathrm{kpc}^{-1}\) \(\lambda=K\ell^2=\frac{K}{\alpha^2}=\frac{0.01349}{(0.0744)^2}=2.44\) \(\rho_{\mathrm{dark}}(R_\odot=8\,\mathrm{kpc})=0.37\,\mathrm{GeV/cm^3}\)

观测到的本地暗物质密度为

\(\rho_{\mathrm{obs}}(R_\odot)=0.39\pm0.03\,\mathrm{GeV/cm^3}\)

无量纲耦合度 λ = 2.44 位于 BeeTheory 拟合(包括单组分、多组分和原子 H₂ 比较)所观测到的 λ∈ [2, 7] 范围内。

这种普遍性–从飞米尺度到千帕斯卡尺度的数量级相同–是蜜蜂理论框架最有力的内部一致性检验。

为什么这里的 K 比单磁盘拟合中的 K 要小

之前仅使用薄圆盘作为源的拟合结果为Ksingle= 0.038 kpc-¹。由于所有六个银河系成分都对暗场做出了贡献,重子源的总量要大 2.8 倍。

因此,要产生相同的暗质量,K 必须按比例变小。

\(K_{\mathrm{multi}}\approx\frac{K_{\mathrm{single}}}{2.8}=\frac{0.038}{2.8}=0.0136\,\mathrm{kpc}^{-1}\)

这正是拟合给出的结果。这是一致性检查,而不是巧合。

为什么 27.3 kpc 对每个模型来说都很困难?

盖亚 2024 最外层的数据点,Vc(27.3 kpc) = 173 ± 17 km/s,不仅仅是 “蜜蜂理论 “的难点。对于每一个应用于银河旋转曲线的暗物质模型来说,这都是最难的一点。

模型Vc(27.3 kpc) 预测值剩余χ²/dof
蜜蜂理论195.3 公里/秒+22.3+1.53σ0.475
全国妇联简介~198 km/s+25+1.5σ0.44
Einasto α = 0.91~191 公里/秒+18+1.1σ0.38
等温光环~218 公里/秒+45+2.6σ2.6

没有一个标准的双参数模型能在 1σ 以内重现Vc(27.3 kpc) = 173 km/s。

有三种貌似合理的解释。

  • 测量本身:R = 27.3 kpc 是最遥远的点,具有最少的运动追踪器和最大的系统不确定性。盖亚 DR4 可能会移动该值。
  • 气体盘的贡献:HI 盘延伸到大约 25 kpc,在大半径范围内对重子质量有贡献。将其作为一个单独的组成部分,可能会使下降趋势变得更陡峭。
  • 较小的相干长度:α = 0.12 kpc-¹,或 ℓ = 8.3 kpc,更适合最外侧的点,但会使内侧的高原更加恶化。

真正可靠的结果是什么样的

目前的拟合在统计学上是良好的。但在一个有 2 个自由参数和 16 个数据点的模型中,”良好 “并不等于 “经过验证”。

扎实验证的要求

  • ✓ 训练数据集上的χ²/dof 良好:达到。Gaia 2024 上的χ²/dof=0.475。
  • ✓ 正确的本地暗物质密度:实现。0.37 GeV/cm³ 预测值 vs 0.39 ± 0.03 观测值。
  • ✓ 一致的无量纲耦合:λ = 2.44,而 H₂校准的 λ ≈ 3.5。
  • !在 1σ 以内复制最外层的盖亚点:未完全达到。R = 27.3 kpc处的残差为+1.53σ。
  • ✗ 对其他星系的盲目预测:尚未完成。SPARC 星系目录提供了自然测试。
  • ✗ 从第一原理推导出 ℓ:尚未完成。ℓ 目前是拟合,而非推导。
  • ✗ 集群规模验证:尚未完成。子弹星团透镜是一项关键测试。
  • → 30 kpc 以外的扩展旋转曲线:Gaia DR4 将提供关键的近期测试。

诚实的科学地位

蜜蜂理论(BeeTheory)目前的形式是一个以物理为动机的现象学框架,它符合银河旋转曲线以及最佳的暗物质经验曲线,其优点是具有物理机制。

它还不是严格意义上的理论,因为 K 和 ℓ 是拟合而不是推导出来的。

通往完整理论的道路很清晰:从波质公设中推导出ℓ = f(Lsource),在SPARC上进行普遍测试,并对盖亚DR4进行盲预测。

数据:Ou, X. et al.,MNRAS 528, 2024.模型:BeeTheory v2, Dutertre 2023, multi-component fit.SPARC 参考文献Lelli、McGaugh、Schombert,AJ 152,2016。Bullet Cluster:克洛等人,ApJL 648,2006。

BeeTheory.com – 波基量子引力 – © Technoplane S.A.S. 2025