← 実験

P1報告解説:回転曲線から弱重力レンズへ――EFTの平均重力応答をどう検証するか

『P1_RC_GGL:銀河ダイナミクスと弱重力レンズの厳密な閉合検定(v1.1)』に基づく一般向け解説版

原報告著者:Guanglin Tu|バージョン基礎:P1 v1.1|解説位置づけ:一般向け説明稿 / 査読済み論文ではない
関連アーカイブ:報告 DOI 10.5281/zenodo.18526334|再現パッケージ DOI 10.5281/zenodo.18526286

読み方メモ

これは「解説版」であり、別の学術報告ではありません。元のP1報告に基づき、主要な図表を保持しながら、各重要段階に「これは何を意味するのか」という一般向け説明を補っています。

本稿が解説するのは、P1がその所定のデータセット、パラメータ台帳、統計プロトコルの下で得た結論だけです。銀河回転曲線(RC)と銀河–銀河弱重力レンズ(GGL)の共同検定において、EFTの平均重力応答モデルは、本稿で検定された最小DM_RAZORベースラインを明確に上回っています。

本稿はP1を「暗黒物質を覆す」結論として解説するものではありません。P1はPシリーズ実験の第一歩にすぎず、EFTにおける「平均重力フロア」という一つの観測可能な層を検定するものであり、EFT全体の内容を検定するものではありません。

0|まず5分でP1を理解する:これは何をする検定なのか?

P1は、「プローブをまたいだ相互検証」の実験だと考えることができます。これは、あるモデルが一つのデータセットをフィットできるかだけを問うものではありません。まったく異なる二つの重力読み出しを同じ監査台に載せます。回転曲線(RC)は銀河円盤内のダイナミクスを読み、銀河–銀河弱重力レンズ(GGL)はより大きなスケールでの投影重力応答を読みます。

P1の最も重要な一文

P1は比較の基準を「単独でうまくフィットできるか」から「プローブ間で閉合できるか」へ引き上げます。正しい写像の下でよく表現し、写像を打ち乱すと信号が崩壊するなら、そのモデルはRCとGGLのあいだで共有される重力構造を捉えている可能性が高くなります。

表0|P1の中心的な数値と一般読者向けの読み方

指標

P1 / P1Aでの読み方

一般読者向けの意味

共同フィット ΔlogL_total

本文の主比較では、EFTはDM_RAZORに対して1155–1337上回る

二つのデータを合わせた総スコア差。大きいほど全体説明が優れていることを示す。

閉合強度 ΔlogL_closure

本文の主比較ではEFTが172–281、DM_RAZORが127

RCだけで推定した後にGGLを予測する能力。大きいほど「クロスプローブ自己整合性」が強い。

負対照 shuffle

RC-bin→GGL-binを打ち乱すと、EFTの閉合信号は6–23まで低下

正しい対応関係が破壊されれば、優位は消えるはずである。消え方が明確なほど、偽信号を排除しやすい。

P1Aの複数DMストレステスト

DM 7+1 + DM_STD、かつEFT_BIN対照を保持

P1Aは最小DM_RAZORだけを見ているのではなく、複数の低次元で監査可能なDM強化分岐を同じ閉合プロトコルに入れている。


1|なぜP1を行うのか:銀河スケールの宇宙論はどこで行き詰まっているのか?

銀河スケールの問題が長く難問であり続けているのは、「追加の重力/質量要求」が回転曲線だけの現象ではないからです。多くの観測は、銀河中の可視バリオン物質と、実際のダイナミクス/レンズ読み出しとのあいだに非常に緊密な関係があることを示しています。暗黒物質の路線では、これは暗黒物質ハロー、バリオンフィードバック、銀河形成史、観測系統誤差が非常に精密に調整されなければならないことを意味します。一方、非暗黒物質重力の路線では、モデルはRCで見栄えがよいだけでは足りず、弱重力レンズ、集団スケーリング則、負の対照でも成り立たなければなりません。

これこそがP1の動機です。P1は「暗黒物質が間違っている」あるいは「EFTが必ず正しい」から出発するのではありません。一つの検証可能な命題を監査にかけます。すなわち、EFTにおける平均重力応答は、RC→GGLのクロスプローブ閉合に、再現可能で転移可能な信号を残せるのか、という問いです。

外部文献背景:なぜRC+GGLという窓が重要なのか?

McGaugh、Lelli、Schombertが2016年に提案した径方向加速度関係(RAR)は、回転曲線が追跡する観測加速度と、バリオン物質から予測される加速度とのあいだに、散布の小さい緊密な相関があることを示しました。これにより、「バリオン—重力応答結合」は銀河スケール理論が避けて通れない問題になりました。

Brouwerらは2021年、KiDS-1000弱重力レンズを用いてRARをより低い加速度・より大きな半径領域へ拡張し、MOND、Verlinde emergent gravity、LambdaCDMモデルを比較しました。同時に、早型/晩型銀河の差、ガスハロー、銀河—ハロー接続が依然として重要な説明課題であることも指摘しています。

Misteleらは2024年、さらに弱重力レンズから孤立銀河の円速度曲線を逆推定し、それが数百kpc、さらには約1Mpcのスケールでも明確には低下せず、BTFRとも一致すると報告しました。これは、弱重力レンズが銀河スケールの重力応答を検証する重要な外部読み出しになりつつあることを示しています。

したがって、P1の価値は「RCとGGLを一緒に論じた最初の試み」である点にはありません。むしろ価値は、それらを固定写像、パラメータ台帳、RC-only→GGL閉合、shuffle負対照、P1Aの複数DMストレステストからなる、監査可能なプロトコルの中に置いた点にあります。


2|P1におけるEFTとは何か? Effective Field Theory ではない

ここでのEFTは、物理学でよく使われる Effective Field Theory(有効場理論)ではなく、エネルギー・フィラメント理論(Energy Filament Theory, EFT)を指します。P1技術報告では、EFTは非常に抑制的に使われています。完全な最終理論として比較に参加するのではなく、まず観測可能で、フィット可能で、反証可能な「平均重力応答」のパラメータ化へ圧縮されています。

平易に言えば、P1は追加重力のあらゆる微視的起源を最初から論じるものではなく、EFT全体を一度に証明しようとするものでもありません。より狭く、より硬い問いだけを扱います。すなわち、銀河スケールに何らかの平均的な追加重力応答が存在するなら、それはまずRCを説明し、さらにGGLを転移予測できるのか、という問いです。

P1はEFTのどの部分を捉えているのか?

P1が捉えるのは「平均重力フロア」(mean gravity floor)です。これは統計的に安定し、サンプルをまたいで転移可能な平均寄与です。

P1は「ノイズフロア」(stochastic / noise floor)をまだ扱いません。つまり、より微視的な揺らぎ過程がもたらしうるランダム項、個体差、追加散布はここでは扱いません。

P1はまた、完全な微視的機構、存在量、寿命、宇宙論的全体制約も議論しません。これはPシリーズ実験の第一歩であり、最終判決ではありません。


3|P1シリーズ計画:なぜ第一歩を「平均フロア」から始めるのか?

Pシリーズは、EFTの観測探索プログラムとして理解できます。すべての命題を一度に広げるのではなく、公共データで最も検証しやすい部分を先に切り出します。P1の戦略は、まず平均項を検定することです。平均重力応答がRC→GGLでさえ閉合できないなら、より複雑なノイズ項や微視的機構を続けて議論する入口がなくなるからです。

表1|Pシリーズの階層的位置づけ

階層

問うべき問題

P1での位置づけ

P1

平均重力応答はRC→GGLで閉合できるのか?

現在の報告の主問題

P1A

DM側を少し強くしたとき、結論はなお安定するのか?

付録B:DM 7+1 + DM_STDストレステスト

後続Pシリーズ

より多くのデータ、より多くのプローブ、より複雑な系統誤差へ拡張できるか?

後続研究の方向

より深い問題

平均項、ノイズ項、微視的機構はどのようにつながるのか?

P1の結論範囲には属さない


4|データとは何か? RCとGGLはそれぞれ何を教えるのか?


4.1 回転曲線 RC:銀河円盤内の「速度ゲージ」

回転曲線が記録するのは、銀河中心から異なる半径にあるガスや恒星がどれほど速く中心を回っているかです。回転が速いほど、その半径で必要な向心力は強く、したがって有効重力も強いことになります。P1はSPARCデータベースを用い、前処理後に104個の銀河、2295個の速度データ点を採用し、20個のRC-binに分割しています。


4.2 弱重力レンズ GGL:より大きなスケールの「重力体重計」

銀河–銀河弱重力レンズは、前景銀河が背景銀河の光をどのようにわずかに曲げるかを測定します。これは、より大きなハロー・スケールにおける投影重力応答に対応し、銀河内のガスダイナミクスの細部には依存しません。P1はKiDS-1000 / Brouwerら(2021)の公開GGLデータを用いています。4つの恒星質量binがあり、各binに15個の半径点、合計60個のデータ点が含まれ、完全共分散が使用されます。


4.3 固定写像:なぜ20個のRC-bin → 4個のGGL-binが重要なのか?

P1は固定規則により、20個のRC-binと4個のGGL-binを接続します。各GGL-binは5個のRC-binに対応し、銀河数で重み付けした平均としてまとめられます。この写像はすべてのモデルで不変に保たれ、閉合検定と公平比較の硬い制約となります。

なぜ事後的に写像を調整してはいけないのか?

もし事後的に「どのRC-binがどのGGL-binに対応するか」を選べるなら、モデルは対応関係を調整して閉合を作り出せてしまいます。P1が20→4写像を事前に固定し、shuffle負対照であえてそれを破壊するのは、閉合信号が物理的に妥当な対応関係に本当に依存しているかを判断するためです。


5|モデルと方法:P1は結局「何を比べている」のか?


5.1 EFT側:低次元の平均重力応答

EFT側では、低次元の追加速度項を用いて平均重力応答を記述します。追加項の形状は無次元カーネル関数 f(r/ℓ) によって制御され、ℓはグローバルな尺度、振幅はRC-binごとに与えられます。異なるカーネル関数は、異なる初期勾配、遷移の速さ、長距離尾部を表し、頑健性ストレステストに用いられます。


5.2 DM側:本文の主比較と付録P1Aは分けて読む必要がある

本文の主比較におけるDM_RAZORは、最小化された監査可能なNFWベースラインです。固定されたc–M関係を用い、halo-to-halo scatter、断熱収縮、feedback core、非球対称性、環境項は含みません。この設計の長所は、自由度が制御され、再現しやすい点です。短所は、すべてのLambdaCDMやすべての暗黒物質ハローモデルを代表するものではない点です。

したがって付録B(P1A)では、DM側を一連の「標準化ストレステスト」にしています。共有写像と閉合プロトコルを変えずに、SCAT、AC、FB、HIER_CMSCAT、CORE1P、lensing m、組み合わせベースラインDM_STDなどの低次元強化分岐を段階的に追加し、EFT_BINを対照として残します。P1Aは、最小DMベースラインだけを相手にするのではなく、よく使われる監査可能なDM機構を同じ「閉合のものさし」に載せて測り直すものだと理解できます。

本稿で採用する正確な結論の表現枠組み

本文:EFT系列は主比較において、最小DM_RAZORを明確に上回る。

付録B / P1A:複数の低次元で監査可能なDM強化分岐とDM_STDストレステストの下で、DMの一部の共同フィットは改善しうるが、閉合強度はEFT_BINの優位を消していない。

したがって最も慎重な表現は次のとおりです。P1/P1Aのデータ、写像、パラメータ台帳、閉合プロトコルの範囲内では、EFTの平均重力応答はより強いクロスデータ整合性を示している。ただし、これはすべての暗黒物質モデルを排除することと同義ではない。


5.3 閉合検定:P1で最も重要な実験構文

1. RCだけでフィットし、一組のRC-only事後サンプルを得る。

2. GGLで再調整せず、RC事後分布をそのまま使ってGGLを予測する。

3. 完全共分散を用いて、正しい写像の下でのGGL予測スコア logL_true を計算する。

4. RC-bin→GGL-binの対応関係をランダムに置換し、負対照スコア logL_perm を計算する。

5. 両者を差し引いて閉合強度を得る:ΔlogL_closure = <logL_true> − <logL_perm>。

平易な比喩

閉合検定は、試験会場をまたぐ再試験のようなものです。モデルはまずRC会場で規則を学び、次にGGL会場で答案を書く。本当に共有規則を学んでいて、局所的な技巧だけではないなら、会場を変えても良く答えられるはずです。一方、会場の対応関係を意図的に打ち乱せば、優位は消えるはずです。


5.4 技術表を読む前に:まず四つの入口をつかむ

表5.4|次の横向き技術表群の読み方

入口

何を見るか

なぜ重要か

表S1a

RC+GGL共同フィット総スコア

「二つのデータを合わせて見ると、全体説明がより強いのはどちらか」に答える。

表S1b

閉合強度、shuffle、頑健性スキャン

「RCで学んだものをGGLへ移せるか」に答える。

表B0

P1Aにおける複数のDM強化分岐の定義

P1を「最小DM_RAZORとだけ比べた」と単純化することを避ける。

表B1

P1Aの閉合と共同のscoreboard

DMを強化した後、閉合優位が消えるかを確認する。

レイアウト説明

次ページから横向きページを使うのは、原報告の幅広い表を完全に保持し、列を削ったり読めないほど圧縮したりしないためです。本文解説ではすでに一般読者向けの読み方を示しています。横向きの技術表は、数値やモデル分岐を照合したい読者向けです。

図0.1|一枚の図で読むP1の閉合検定フロー

説明:上側の連鎖は「閉合検定」(RCだけでフィット → RC事後分布でGGLを予測)、下側の連鎖は「共同フィット」(RC+GGLを一緒に採点)です。右側では真の写像とシャッフルされた写像を比較し、閉合強度 ΔlogL を得ます。


6|主要な技術表:原報告の主表とP1A表

表S1a|共同フィット主比較指標(RC+GGL、Strict;原報告から保持)

モデル(workspace)

Wカーネル

k

共同logL_total(best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

表S1b|閉合と頑健性指標(Strict;原報告から保持)

モデル(workspace)

閉合ΔlogL(true-perm)

負対照shuffle後ΔlogL

σ_intスキャンΔlogL範囲

R_minスキャンΔlogL範囲

cov-shrinkスキャンΔlogL範囲

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308

表B0|P1AにおけるDM強化分岐の定義(原報告付録Bから保持)

Workspace

dm_model

追加パラメータ(≤1)

物理的動機(核心)

実装原則(監査しやすい)

DM_RAZOR

NFW (fixed c–M, no scatter)

最小化された監査可能なLambdaCDMハロー・ベースライン。EFTとの厳密対照に用いる。

共有写像は固定。パラメータ台帳は厳格。baselineとして相対比較にのみ用いる。

DM_RAZOR_SCAT

NFW + c–M scatter(legacy)

σ_logc

c–M関係には散布がある。1パラメータのlog-normal scatterで近似する。

≤1の新パラメータ。共有写像は維持。閉合増益を受け入れ基準とする。

DM_RAZOR_AC

NFW + Adiabatic Contraction(legacy)

α_AC

バリオンの落ち込みがハローの断熱収縮を引き起こしうる。1パラメータの強度で近似する。

≤1の新パラメータ。写像は変えない。AICc/BICの変化と閉合増益を報告する。

DM_RAZOR_FB

NFW + feedback core(legacy)

log r_core

フィードバックにより内側領域にcoreが形成されうる。1パラメータのcore尺度で近似する。

≤1の新パラメータ。閉合/負対照は同じ基準。RC-only改善だけを唯一の目標にしない。

DM_HIER_CMSCAT

Hierarchical c–M scatter + prior

σ_logc(hier)

より標準的な階層化 c_i∼logN(c(M_i),σ_logc)。RCとGGLの共同事後分布にも同時に影響する。

明示的な事前分布。latent c_iを周辺化。なお低次元で監査可能に保つ。

DM_CORE1P

1‑parameter core proxy (coreNFW/DC14‑inspired)

log r_core

1パラメータcore代理でbaryonic feedbackの主効果を代理し、高次元の星形成細部を避ける。

標準文献を引用。≤1の新パラメータ。閉合検定と結び付ける。

DM_RAZOR_M

NFW + lensing shear‑calibration nuisance

m_shear(GGL)

弱重力レンズ側の主要な系統誤差を有効パラメータとして吸収し、「系統誤差を物理として読んでしまう」リスクを下げる。

nuisanceを明確に記帳。RCへ逆向きに影響させない。結果は閉合の頑健性を主とする。

DM_STD

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

最もよくある三種類の疑義を、なお低次元の標準ベースラインに同時に組み込む。

パラメータ台帳と情報量規準を合わせて報告。閉合を主指標とする。最強のDM防御対照として用いる。

表B1|P1A scoreboard(大きいほどよい;原報告付録Bから保持)

モデル分岐(workspace)

Δk

RC-only best logL_RC (Δ)

閉合強度 ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

表B1(P1A scoreboard)の読み方

• Δk:追加自由度(大きいほどモデルは複雑。複雑であることは、より良いことと同義ではない)。

• 重点は二つの列:閉合強度 ΔlogL_closure(Δ)(大きいほど「転移自己整合的」)と Joint best logL_total(Δ)(共同フィット総スコア)。

• 括弧内の (Δ) はDM_RAZORに対する差を示し、直接比較しやすくしている。

• この表が最も答えたい問いは、DMベースラインを「合理的に強化」したとき、閉合優位が消えるのか、という点である。

• 読み方のヒント:DM_STDの共同スコア改善は明確だが、閉合強度はむしろ低下する。EFT_BINは閉合強度でなお高い値を保つ。

一文でまとめれば、この低次元で監査可能なDM強化の範囲では、共同フィットの改善が自動的により強い閉合をもたらすわけではない。閉合(転移可能性)こそが依然として重要な判定基準である。


7|主要結果をどう読むか?


7.1 共同フィット:二つのデータを合わせて見ると、EFTの主比較スコアはより高い

表S1aと図S4は、同じデータ、同じ共有写像、ほぼ同じパラメータ規模の下で、EFT系列のDM_RAZORに対する共同 ΔlogL_total が1155–1337であることを示しています。一般読者向けには、RCとGGLという二つのデータを合わせた同じ採点規則の下で、EFT主比較モデルの総合得点がより高い、と理解できます。


7.2 閉合検定:P1が最も強調したいのは「転移可能性」

閉合強度が高いということは、RCだけから推定したパラメータが、GGLを見直さなくてもGGLをよりよく予測できることを意味します。P1報告では、EFTの ΔlogL_closure は172–281、DM_RAZORは127です。この結果は、「それぞれ自分のデータにはよくフィットしている」と言うより重要です。なぜなら、第二のデータセットにおけるモデルの自由度を制限しているからです。


7.3 負対照:なぜ「信号の崩壊」はむしろ良いことなのか?

P1がRC-bin→GGL-binの分組対応をランダムに打ち乱すと、EFTの閉合信号は6–23程度まで低下します。一般読者にとって、このステップは「不正検出」に相当します。もし閉合上の優位がコード、単位、共分散処理、あるいはフィットの偶然だけで生じたものなら、対応関係を打ち乱しても同じような優位が出る可能性があります。しかし実際には優位が崩壊したため、それが正しい写像に依存していることが分かります。

図S3|閉合強度(大きいほどよい):RC-only → GGL予測における平均対数尤度の優位。

この図の読み方

この図はP1の核心です。柱が高いほど、モデルがRCから学んだ情報をGGLへ移せることを示します。

EFT系列は全体としてDM_RAZORより高く、「まずRCを学び、次にGGLを予測する」実験において、EFTのクロスプローブ閉合がより強いことを示します。

図S4|共同フィットの優位(大きいほどよい):RC+GGLの best logL_total のDM_RAZORに対する差。

この図の読み方

この図はRCとGGLを合わせた総スコアを見ています。

EFT系列はすべて0を大きく上回っており、主比較におけるEFTの優位が単一の局所現象ではなく、共同分析全体の表現であることを示しています。

図R1|負対照:shuffle分組後、閉合信号が大きく低下。

この図の読み方

この図は、正しいRC↔GGL分箱関係を打ち乱すと、閉合信号が大きく低下することを示しています。

これにより、P1の結果は任意の写像でも得られる数値的偶然ではなく、クロスデータ写像における実際の整合性に近いものになります。


8|頑健性と対照:P1は「ただパラメータ調整で見栄えがよいだけ」をどう避けるのか?

技術報告で最も疑われやすい点は、優位が特定のノイズ設定、中心領域のデータ、共分散処理、あるいは過学習から来ているのではないかということです。P1は複数のストレステストでこの問いに答えています。

表2|P1の頑健性と負対照の読み方

テスト

どの疑問を排除したいのか

読み方

σ_intスキャン

RC内に追加の未知散布がある場合でも、結論は安定しているか?

RC誤差を緩めても、EFTの順位と優位の規模は安定している。

R_minスキャン

銀河中心領域を完全には信頼しない場合でも、結論は安定しているか?

中心領域を切り落としても、EFTは正の優位を保つ。

cov-shrinkスキャン

GGL共分散推定に不確かさがある場合でも、結論は安定しているか?

共分散を対角行列へ収縮しても、優位は敏感に変わらない。

アブレーション階段

EFTは不要な複雑度で無理にフィットしているのか?

完全なEFT_BINには、情報量規準上の必要性がある。

LOO留出予測

モデルは見たことのあるデータだけを説明しているのか?

GGL binを留出しても、比較的強い汎化表現を示す。

RC-bin shuffle

閉合は真の写像から来ているのか?

分組を打ち乱すと閉合が低下し、写像依存性を支持する。

図R2|σ_intスキャン下の ΔlogL_total の範囲(大きいほどよい)。

この図の読み方

RC内禀散布の設定を変えても、EFTのリードが残るかを検査する。

図R3|R_minスキャン下の ΔlogL_total の範囲(大きいほどよい)。

この図の読み方

複雑な中心領域を裁断しても、EFTの優位が安定しているかを検査する。

図R4|cov-shrinkスキャン下の ΔlogL_total の範囲(大きいほどよい)。

この図の読み方

弱重力レンズ共分散処理を変えたとき、順位が敏感に変わるかを検査する。

図R5|EFT_BINのアブレーション階段(AICc、小さいほどよい)。

この図の読み方

完全なEFT_BINが、データ説明において必要性を持つかを検査する。単にパラメータを足しただけではないかを確かめる。

図R6|LOO:留出binの対数尤度分布。

この図の読み方

モデルが未見のGGL binでも予測表現を持つかを検査する。

図R7|負対照:shuffle写像により、閉合 mean logL_true が明確に低下。

この図の読み方

mean logL_trueの角度からさらに、閉合が正しいクロスデータ写像に依存することを示す。


9|P1A:なぜ「付録に複数のDMモデルがある」ことが重要な修正なのか?

この節が答えたいのは、「EFTは最小DM_RAZORにだけ勝ったのか?」ではありません。低次元で、再現可能で、パラメータ台帳が明確な範囲でDMベースラインを強化したとき(P1A)、閉合検定と共同フィットの結論が書き換わるのか、という問いです。言い換えれば、P1Aの目的は「弱すぎるDMベースラインを選んだだけではないか」という疑義を下げ、議論を「監査可能な一群のDM強化の下でも、閉合表現に差が残るのか」へ進めることです。

P1Aの設計は、あらゆるLambdaCDMハローモデリングの可能性を尽くすものではなく、DM側を高次元で監査不能なフィッターに変えるものでもありません。選んでいるのは、低次元で、再現可能で、パラメータ台帳が明確な強化です。濃度散布、断熱収縮、feedback core、階層的c–M scatter prior、単一パラメータcore代理、弱重力レンズのshear-calibration nuisance、そして組み合わせDM_STDです。

P1Aの主な読み方

legacy三分岐のうち、feedback/coreだけが閉合強度に小幅の純改善をもたらす。SCATとACは純閉合改善をもたらしていない。

DM_HIER_CMSCAT、DM_RAZOR_M、DM_CORE1Pは、閉合強度への影響が小さいか、有意な純改善を示していない。

DM_STDはjoint logLを大きく改善できるが、閉合強度は低下する。これは、主に共同フィットの柔軟性を高めているのであって、RC→GGLの転移予測力を高めているわけではないことを示唆する。

EFT_BINはP1A表B1において、より高い閉合強度と共同フィット優位をなお保っている。したがってP1の核心主張を「最小DM_RAZORにだけ勝った」と単純化すべきではない。

図B1|P1A scoreboard:閉合と共同の ΔlogL のbaselineに対する差(大きいほどよい)。

この図の読み方

この図は、複数のDM強化分岐がベースラインに対してどう表現するかを示しています。

その意味は「すべてのDMを排除する」ことではありません。P1Aが選んだ低次元で監査可能なDM強化の範囲内では、DMを強化してもEFT_BINの閉合優位は消えていない、ということを示しています。


10|P1実験の意義:なぜこれは行う価値があるのか?


10.1 方法論上の意義:「クロスプローブ閉合」を「単一プローブフィット」より高い位置に置く

銀河スケール理論は、あるモデルが一組の回転曲線をフィットできるかどうかという論争に陥りがちです。P1は問いのレベルを一段上げます。RCから学んだパラメータで、GGLを再調整せずに弱重力レンズを予測できるのか。これによりP1は「フィット競争」から「転移予測検定」へ変わります。


10.2 透明性の意義:再検証可能な連鎖を結果の一部として扱う

P1の重要な貢献の一つは、データ、表図、実行タグ、負対照、再現パッケージ、監査連鎖を一緒に公開したことです。支持者にとっても反対者にとっても、これは重要です。議論を同じ公開データ、同じ写像、同じスクリプト、同じ指標へ戻せるからであり、単なるスローガン比較にとどまらないからです。


10.3 物理的意義:「非暗黒物質重力」の方向に強いストレステストを与える

非暗黒物質重力の方向では、多くのモデルが回転曲線やRARの一部を説明できます。しかしより難しいのは、同時に弱重力レンズの読み出しを通過し、負対照下で信号が正しい写像に依存することを示すことです。P1の意義は、EFTの平均重力応答を「外部試験」に近いプロトコルへ入れた点にあります。RCは訓練場、GGLは転移先、shuffleは不正検出の場です。


10.4 これは「非暗黒物質重力分野」の重要な実験なのか?

慎重に言えば、P1のデータ処理、再現パッケージ、閉合プロトコルが外部再検証後も成り立つなら、それは非暗黒物質重力 / 修正重力の方向において、真剣に扱う価値のあるRC+GGL閉合実験と見なせます。その重要性は「暗黒物質を覆した」という一言にはなく、複製でき、挑戦でき、拡張できるクロスプローブ判定基準を与えた点にあります。

同じ水準のRC+GGL予測閉合フレームワークはすでにあるのか?

関連する枠組みや観測の伝統はすでにあります。MOND/RARは大量の回転曲線現象をよく整理できますし、KiDS-1000弱重力レンズRAR研究もMOND、Verlinde emergent gravity、LambdaCDMモデルを比較しています。LambdaCDMも、銀河—ハロー接続、ガスハロー、フィードバックモデリングを通じて、弱重力レンズ/ダイナミクス現象の一部を説明できます。

しかしP1の正確な主張は、「世界にはRC+GGLを説明できる他の枠組みがない」というものではありません。P1自身が公開した固定写像、RC-only→GGL閉合、shuffle負対照、パラメータ台帳、P1Aの複数DMストレステストプロトコルの下で、EFTがより強い閉合表現を報告している、というものです。

言い換えれば、P1で外部から最も検証されるべき点は、具体的で再現可能な比較プロトコルを提示したことです。今後、MOND/RAR、LambdaCDM/HOD、hydrodynamical simulation、あるいは他の修正重力フレームワークが同じプロトコルの下で同等またはより高い閉合スコアに達するかどうかは、続けて行う価値の高い次の作業です。


11|P1から何が言えるのか? 何は言えないのか?

表3|P1の結論境界

言えること

P1のRC+GGLデータ、固定写像、主比較プロトコルの下で、EFT系列は最小DM_RAZORに対してより高い共同フィットと閉合強度を持つ。

言えること

P1Aの低次元で監査可能なDM強化の範囲内で、複数のDM強化はEFT_BINの閉合優位を消していない。

言えること

shuffle負対照は、閉合信号が正しいクロスデータ写像に依存しており、任意の写像で得られるものではないことを示している。

言えないこと

P1がすべての暗黒物質モデルをすでに覆したとは言えない。P1Aはなお、非球対称、環境依存、複雑な銀河—ハロー接続、高次元フィードバック、完全な宇宙論シミュレーションを尽くしていない。

言えないこと

EFTの完全理論が第一原理から証明されたとは言えない。P1は平均重力応答という現象論的層だけを検定している。

言えないこと

すべての系統誤差が排除されたとは言えない。P1は列挙されたストレステストと監査範囲内でのみ、頑健性の証拠を与えている。


12|よくある質問:一般読者が最も問いやすい点

Q1:これは「暗黒物質は存在しない」と言っているのか?

いいえ。P1の結論は、本文のデータ、プロトコル、対照モデルの範囲内に限定されなければなりません。P1Aは最小DM_RAZORより一歩進んでいますが、それでも可能なすべての暗黒物質モデルを代表するものではありません。

Q2:これは「EFTはすでに証明された」と言っているのか?

それも違います。P1はEFTを平均重力応答のパラメータ化として検定し、RC→GGL閉合でより強い表現を示したものです。微視的機構や完全理論はP1の結論ではありません。

Q3:なぜ有意性のσ値を直接語らないのか?

P1が用いるのは、統一された尤度スコア、情報量規準、閉合差です。ΔlogLは同じ採点規則の下での相対的な優位であり、単一のσ値とは同じではありません。

Q4:なぜRC-bin→GGL-binを打ち乱す必要があるのか?

これは負対照です。真のクロスプローブ信号は正しい写像に依存するはずです。打ち乱しても同じように強いなら、むしろ実装上の偏りや統計的な偽信号がある可能性を示します。

Q5:P1の次の一歩として最も行うべきことは?

同じプロトコルを、より多くのデータ、より多くのDM対照、より複雑な系統誤差、より多くの修正重力フレームワークへ広げることです。とくに外部チームが同じ閉合指標の下で再検証できるようにする必要があります。


13|用語ミニ辞典

表4|用語ミニ辞典

用語

一文説明

回転曲線(RC)

銀河円盤における半径—回転速度の関係。円盤面内の有効重力を逆推定するために使う。

弱重力レンズ(GGL)

背景銀河形状の統計的な歪みを通じて、前景銀河周辺の平均重力/質量分布を測る。

閉合検定

RC事後分布でGGLを予測し、打ち乱した写像の負対照と比較する。

負対照

重要な構造を意図的に壊し、信号が消えるかを見る。偽信号を排除するために用いる。

NFWハロー

冷暗黒物質モデルでよく使われる暗黒物質ハロー密度プロファイル。

c–M関係

暗黒物質ハローの濃度cと質量Mの関係。散布を許すかどうかは、モデルの柔軟性に影響する。

DM_STD

P1Aにおいて、複数の低次元DM強化とレンズnuisanceを組み合わせた標準化DMストレステスト分岐。

ΔlogL

二つのモデルを同じ採点規則で比べた対数尤度差。正の値は前者が優れていることを示す。

共分散

データ点同士の相関を記述する行列。弱重力レンズデータでは通常、完全共分散を使う必要がある。


14|推奨読書ルートと引用入口

1. まず本文の第0–2節を読み、P1の問題意識と、P1におけるEFTの抑制的な位置づけを把握する。

2. 次に図S3、図S4、表S1a/S1bを見て、閉合強度、共同フィット、負対照を理解する。

3. 「DMベースラインが弱すぎるのではないか」が気になる場合は、第9節と表B1 / 図B1を直接見る。

4. 技術的に再検証する場合は、P1技術報告 v1.1、Tables & Figures Supplement、full_fit_runpackに戻る。

主要アーカイブ入口

P1技術報告(公開級、Concept DOI):10.5281/zenodo.18526334

P1全量再現パッケージ(Concept DOI):10.5281/zenodo.18526286

EFT構造化知識ベース(任意、Concept DOI):10.5281/zenodo.18853200

ライセンス注記:技術報告は CC BY-NC-ND 4.0、全量再現パッケージは CC BY 4.0 を採用(技術報告とZenodoアーカイブを基準とする)。


15|参考文献と外部背景

McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.