蜜蜂理论 – 统计分析 – 2025 年

阅读适合

χ²/dof = 0.475

一个介于 0 和 ∞ 之间的数字，它告诉你你的模型与数据的拟合程度是很好、太好，还是完全不符合。下面是它在BeeTheory星系模拟中的含义—以及我们需要什么来获得真正可靠的结果。

什么是 χ²/dof？

当模型预测值为_Vmodel(_Ri)，而数据提供的观测值为_Vobs(_Ri)，且测量不确定度为_σi，则缩小的奇平方为：

\(\frac{\chi^2}{\mathrm{dof}}=\frac{1}{N-p}\sum_{i=1}^{N}\left(\frac{V_{\mathrm{model}}(R_i)-V_{\mathrm{obs}}(R_i)}{\sigma_i}\right)^2\)

其中，N 是数据点的数量，p 是自由参数的数量。

此处N = 16 个 Gaia 2024 点，p = 2 个拟合参数 K 和 α，因此 dof = 14。

总和中的每个项都是一个拉数：以测量不确定度单位表示的残差。

0.5 的拉力意味着模型偏离了半个西格玛–非常好。2.0 的拉力意味着两个西格玛的偏差–值得研究。

[/latex]（frac{chi^2}）{mathrm{dof}}（ll1 （quad/rightarrow）{model fits the data at the level of their uncertainties}[/latex] （模型在其不确定性水平上与数据拟合）[/latex] 。 \(\frac{\chi^2}\mathrm{dof}}\ll1\quad\Rightarrow\quad/text{模型拟合得太好：不确定性可能被高估了，或者说是过拟合}\) 。 \(\frac{chi^2}{mathrm{dof}}\gg1\quad\Rightarrow\quad\text{model is wrong, or uncertainties are underestimated}\)[/latex]

我们的编号：0.475

0.475

χ² / dof – N = 16 – p = 2 – dof = 14

统计优异

模型没有错

不确定性可能稍大

χ²/dof 标度

0.475 ← us

1.0 理想

00.511.522.53+

< 0.3
过拟合

0.3-0.7
优秀

0.7-1.3
良好

1.3-2.0
合格

> 2.0
差

0.475 的值位于优秀区域。模型没有出错–所有 16 个数据点的平均残差仅为 0.69σ。

从物理上讲，这意味着 “蜜蜂理论 “对几乎所有观测半径的圆周速度的预测都小于一个测量不确定度。

但 “优秀 “并不等于 “经过验证”

χ²/dof = 0.475 也可能意味着测量不确定度_σi被略微高估了。如果真实误差小 30%，同样的模型将得出 χ²/dof ≈ 1.0。

仅凭 χ² 我们无法区分 “模型非常好 “和 “误差稍大”。这是标准的统计模糊性。

The Residuals – Point by Point

原始数字 0.475 隐藏了一些信息。通过观察单个拉数，我们可以发现拟合的结构：模型在哪些点上钉住了钉子，在哪些地方陷入了困境。

拉动图：\((V_{\mathrm{model}}-V_{\mathrm{obs}})/\sigma_i\)盖亚 2024 的每个数据点

R (kpc)	Vobs	σ	V 模型	剩余	拉
加载残差…

15 / 16 分在 1σ 以内

除 R = 27.3 kpc 外，每个数据点的|pull|都小于 1.0。在一个高斯误差校准良好的模型中，我们预计大约有 68% 的点的误差在 1σ 以内，而这里的误差为 94%。

这表明模型非常出色，或者内点的误差条略微过大。

R = 27.3 kpc处的离群点–拉力 = +1.53σ

模型预测_Vc= 195.3 km/s，而盖亚测量的结果是 173 ± 17 km/s。

差异为 22.3 km/s，即 1.53σ。这在统计上并不惊人，但在物理上却很重要：模型在最大半径处的下降速度太慢。

最佳拟合参数 K = 0.01349

耦合常数 K = 0.01349 kpc-¹ 是每单位可见质量产生的《蜜蜂理论》暗质量场的振幅。

它是通过最小化 16 个 Gaia 数据点上的 χ² 确定的，α = 0.0744 kpc-¹ 是由 Newby + Gaia 组合拟合固定的。

\(K=0.01349\,\mathrm{kpc}^{-1}\) \(\lambda=K\ell^2=\frac{K}{\alpha^2}=\frac{0.01349}{(0.0744)^2}=2.44\) \(\rho_{\mathrm{dark}}(R_\odot=8\,\mathrm{kpc})=0.37\,\mathrm{GeV/cm^3}\)

观测到的本地暗物质密度为

\(\rho_{\mathrm{obs}}(R_\odot)=0.39\pm0.03\,\mathrm{GeV/cm^3}\)

无量纲耦合度 λ = 2.44 位于 BeeTheory 拟合（包括单组分、多组分和原子 H₂ 比较）所观测到的 λ∈ [2, 7] 范围内。

这种普遍性–从飞米尺度到千帕斯卡尺度的数量级相同–是蜜蜂理论框架最有力的内部一致性检验。

为什么这里的 K 比单磁盘拟合中的 K 要小

之前仅使用薄圆盘作为源的拟合结果为_Ksingle= 0.038 kpc-¹。由于所有六个银河系成分都对暗场做出了贡献，重子源的总量要大 2.8 倍。

因此，要产生相同的暗质量，K 必须按比例变小。

\(K_{\mathrm{multi}}\approx\frac{K_{\mathrm{single}}}{2.8}=\frac{0.038}{2.8}=0.0136\,\mathrm{kpc}^{-1}\)

这正是拟合给出的结果。这是一致性检查，而不是巧合。

为什么 27.3 kpc 对每个模型来说都很困难？

盖亚 2024 最外层的数据点，_Vc(27.3 kpc) = 173 ± 17 km/s，不仅仅是 “蜜蜂理论 “的难点。对于每一个应用于银河旋转曲线的暗物质模型来说，这都是最难的一点。

模型	Vc(27.3 kpc) 预测值	剩余	拉	χ²/dof
蜜蜂理论	195.3 公里/秒	+22.3	+1.53σ	0.475
全国妇联简介	~198 km/s	+25	+1.5σ	0.44
Einasto α = 0.91	~191 公里/秒	+18	+1.1σ	0.38
等温光环	~218 公里/秒	+45	+2.6σ	2.6

没有一个标准的双参数模型能在 1σ 以内重现_Vc(27.3 kpc) = 173 km/s。

有三种貌似合理的解释。

测量本身：R = 27.3 kpc 是最遥远的点，具有最少的运动追踪器和最大的系统不确定性。盖亚 DR4 可能会移动该值。
气体盘的贡献：HI 盘延伸到大约 25 kpc，在大半径范围内对重子质量有贡献。将其作为一个单独的组成部分，可能会使下降趋势变得更陡峭。
较小的相干长度：α = 0.12 kpc-¹，或 ℓ = 8.3 kpc，更适合最外侧的点，但会使内侧的高原更加恶化。

真正可靠的结果是什么样的

目前的拟合在统计学上是良好的。但在一个有 2 个自由参数和 16 个数据点的模型中，”良好 “并不等于 “经过验证”。

0.475

电流 χ²/dof，16 点，2 个参数

< 0.8

目标：在扩展数据集上拟合良好

~1.0

理想：在星系样本中进行校准

扎实验证的要求

✓ 训练数据集上的χ²/dof 良好：达到。Gaia 2024 上的χ²/dof=0.475。
✓ 正确的本地暗物质密度：实现。0.37 GeV/cm³ 预测值 vs 0.39 ± 0.03 观测值。
✓ 一致的无量纲耦合：λ = 2.44，而 H₂校准的 λ ≈ 3.5。
!在 1σ 以内复制最外层的盖亚点：未完全达到。R = 27.3 kpc处的残差为+1.53σ。
✗ 对其他星系的盲目预测：尚未完成。SPARC 星系目录提供了自然测试。
✗ 从第一原理推导出 ℓ：尚未完成。ℓ 目前是拟合，而非推导。
✗ 集群规模验证：尚未完成。子弹星团透镜是一项关键测试。
→ 30 kpc 以外的扩展旋转曲线：Gaia DR4 将提供关键的近期测试。

诚实的科学地位

蜜蜂理论（BeeTheory）目前的形式是一个以物理为动机的现象学框架，它符合银河旋转曲线以及最佳的暗物质经验曲线，其优点是具有物理机制。

它还不是严格意义上的理论，因为 K 和 ℓ 是拟合而不是推导出来的。

通往完整理论的道路很清晰：从波质公设中推导出ℓ = f(_Lsource)，在SPARC上进行普遍测试，并对盖亚DR4进行盲预测。

数据：Ou, X. et al.,MNRAS 528, 2024.模型：BeeTheory v2, Dutertre 2023, multi-component fit.SPARC 参考文献Lelli、McGaugh、Schombert，AJ 152，2016。Bullet Cluster：克洛等人，ApJL 648，2006。