蜜蜂理论 – 统计分析 – 2025 年
阅读适合
χ²/dof = 0.475
一个介于 0 和 ∞ 之间的数字,它告诉你你的模型与数据的拟合程度是很好、太好,还是完全不符合。下面是它在BeeTheory星系模拟中的含义—以及我们需要什么来获得真正可靠的结果。
什么是 χ²/dof?
当模型预测值为Vmodel(Ri),而数据提供的观测值为Vobs(Ri),且测量不确定度为σi,则缩小的奇平方为:
\(\frac{\chi^2}{\mathrm{dof}}=\frac{1}{N-p}\sum_{i=1}^{N}\left(\frac{V_{\mathrm{model}}(R_i)-V_{\mathrm{obs}}(R_i)}{\sigma_i}\right)^2\)其中,N 是数据点的数量,p 是自由参数的数量。
此处N = 16 个 Gaia 2024 点,p = 2 个拟合参数 K 和 α,因此 dof = 14。
总和中的每个项都是一个拉数:以测量不确定度单位表示的残差。
0.5 的拉力意味着模型偏离了半个西格玛–非常好。2.0 的拉力意味着两个西格玛的偏差–值得研究。
[/latex](frac{chi^2}){mathrm{dof}}(ll1 (quad/rightarrow){model fits the data at the level of their uncertainties}[/latex] (模型在其不确定性水平上与数据拟合)[/latex] 。 \(\frac{\chi^2}\mathrm{dof}}\ll1\quad\Rightarrow\quad/text{模型拟合得太好:不确定性可能被高估了,或者说是过拟合}\) 。 \(\frac{chi^2}{mathrm{dof}}\gg1\quad\Rightarrow\quad\text{model is wrong, or uncertainties are underestimated}\)[/latex]我们的编号:0.475
0.475
χ² / dof – N = 16 – p = 2 – dof = 14
统计优异
模型没有错
不确定性可能稍大
χ²/dof 标度
过拟合
优秀
良好
合格
差
0.475 的值位于优秀区域。模型没有出错–所有 16 个数据点的平均残差仅为 0.69σ。
从物理上讲,这意味着 “蜜蜂理论 “对几乎所有观测半径的圆周速度的预测都小于一个测量不确定度。
但 “优秀 “并不等于 “经过验证”
χ²/dof = 0.475 也可能意味着测量不确定度σi被略微高估了。如果真实误差小 30%,同样的模型将得出 χ²/dof ≈ 1.0。
仅凭 χ² 我们无法区分 “模型非常好 “和 “误差稍大”。这是标准的统计模糊性。
The Residuals – Point by Point
原始数字 0.475 隐藏了一些信息。通过观察单个拉数,我们可以发现拟合的结构:模型在哪些点上钉住了钉子,在哪些地方陷入了困境。
拉动图:\((V_{\mathrm{model}}-V_{\mathrm{obs}})/\sigma_i\)盖亚 2024 的每个数据点
| R (kpc) | Vobs | σ | V 模型 | 剩余 | 拉 |
|---|---|---|---|---|---|
| 加载残差… | |||||
15 / 16 分在 1σ 以内
除 R = 27.3 kpc 外,每个数据点的|pull|都小于 1.0。在一个高斯误差校准良好的模型中,我们预计大约有 68% 的点的误差在 1σ 以内,而这里的误差为 94%。
这表明模型非常出色,或者内点的误差条略微过大。
R = 27.3 kpc处的离群点–拉力 = +1.53σ
模型预测Vc= 195.3 km/s,而盖亚测量的结果是 173 ± 17 km/s。
差异为 22.3 km/s,即 1.53σ。这在统计上并不惊人,但在物理上却很重要:模型在最大半径处的下降速度太慢。
最佳拟合参数 K = 0.01349
耦合常数 K = 0.01349 kpc-¹ 是每单位可见质量产生的《蜜蜂理论》暗质量场的振幅。
它是通过最小化 16 个 Gaia 数据点上的 χ² 确定的,α = 0.0744 kpc-¹ 是由 Newby + Gaia 组合拟合固定的。
\(K=0.01349\,\mathrm{kpc}^{-1}\) \(\lambda=K\ell^2=\frac{K}{\alpha^2}=\frac{0.01349}{(0.0744)^2}=2.44\) \(\rho_{\mathrm{dark}}(R_\odot=8\,\mathrm{kpc})=0.37\,\mathrm{GeV/cm^3}\)观测到的本地暗物质密度为
\(\rho_{\mathrm{obs}}(R_\odot)=0.39\pm0.03\,\mathrm{GeV/cm^3}\)无量纲耦合度 λ = 2.44 位于 BeeTheory 拟合(包括单组分、多组分和原子 H₂ 比较)所观测到的 λ∈ [2, 7] 范围内。
这种普遍性–从飞米尺度到千帕斯卡尺度的数量级相同–是蜜蜂理论框架最有力的内部一致性检验。
为什么这里的 K 比单磁盘拟合中的 K 要小
之前仅使用薄圆盘作为源的拟合结果为Ksingle= 0.038 kpc-¹。由于所有六个银河系成分都对暗场做出了贡献,重子源的总量要大 2.8 倍。
因此,要产生相同的暗质量,K 必须按比例变小。
\(K_{\mathrm{multi}}\approx\frac{K_{\mathrm{single}}}{2.8}=\frac{0.038}{2.8}=0.0136\,\mathrm{kpc}^{-1}\)这正是拟合给出的结果。这是一致性检查,而不是巧合。
为什么 27.3 kpc 对每个模型来说都很困难?
盖亚 2024 最外层的数据点,Vc(27.3 kpc) = 173 ± 17 km/s,不仅仅是 “蜜蜂理论 “的难点。对于每一个应用于银河旋转曲线的暗物质模型来说,这都是最难的一点。
| 模型 | Vc(27.3 kpc) 预测值 | 剩余 | 拉 | χ²/dof |
|---|---|---|---|---|
| 蜜蜂理论 | 195.3 公里/秒 | +22.3 | +1.53σ | 0.475 |
| 全国妇联简介 | ~198 km/s | +25 | +1.5σ | 0.44 |
| Einasto α = 0.91 | ~191 公里/秒 | +18 | +1.1σ | 0.38 |
| 等温光环 | ~218 公里/秒 | +45 | +2.6σ | 2.6 |
没有一个标准的双参数模型能在 1σ 以内重现Vc(27.3 kpc) = 173 km/s。
有三种貌似合理的解释。
- 测量本身:R = 27.3 kpc 是最遥远的点,具有最少的运动追踪器和最大的系统不确定性。盖亚 DR4 可能会移动该值。
- 气体盘的贡献:HI 盘延伸到大约 25 kpc,在大半径范围内对重子质量有贡献。将其作为一个单独的组成部分,可能会使下降趋势变得更陡峭。
- 较小的相干长度:α = 0.12 kpc-¹,或 ℓ = 8.3 kpc,更适合最外侧的点,但会使内侧的高原更加恶化。
真正可靠的结果是什么样的
目前的拟合在统计学上是良好的。但在一个有 2 个自由参数和 16 个数据点的模型中,”良好 “并不等于 “经过验证”。
0.475
电流 χ²/dof,16 点,2 个参数
< 0.8
目标:在扩展数据集上拟合良好
~1.0
理想:在星系样本中进行校准
扎实验证的要求
- ✓ 训练数据集上的χ²/dof 良好:达到。Gaia 2024 上的χ²/dof=0.475。
- ✓ 正确的本地暗物质密度:实现。0.37 GeV/cm³ 预测值 vs 0.39 ± 0.03 观测值。
- ✓ 一致的无量纲耦合:λ = 2.44,而 H₂校准的 λ ≈ 3.5。
- !在 1σ 以内复制最外层的盖亚点:未完全达到。R = 27.3 kpc处的残差为+1.53σ。
- ✗ 对其他星系的盲目预测:尚未完成。SPARC 星系目录提供了自然测试。
- ✗ 从第一原理推导出 ℓ:尚未完成。ℓ 目前是拟合,而非推导。
- ✗ 集群规模验证:尚未完成。子弹星团透镜是一项关键测试。
- → 30 kpc 以外的扩展旋转曲线:Gaia DR4 将提供关键的近期测试。
诚实的科学地位
蜜蜂理论(BeeTheory)目前的形式是一个以物理为动机的现象学框架,它符合银河旋转曲线以及最佳的暗物质经验曲线,其优点是具有物理机制。
它还不是严格意义上的理论,因为 K 和 ℓ 是拟合而不是推导出来的。
通往完整理论的道路很清晰:从波质公设中推导出ℓ = f(Lsource),在SPARC上进行普遍测试,并对盖亚DR4进行盲预测。
数据:Ou, X. et al.,MNRAS 528, 2024.模型:BeeTheory v2, Dutertre 2023, multi-component fit.SPARC 参考文献Lelli、McGaugh、Schombert,AJ 152,2016。Bullet Cluster:克洛等人,ApJL 648,2006。
BeeTheory.com – 波基量子引力 – © Technoplane S.A.S. 2025