P1 レポート解説：回転曲線から弱重力レンズへ：エネルギー・フィラメント理論 (Energy Filament Theory, EFT) の平均重力応答をどう検証するか

『P1_RC_GGL：銀河力学と弱重力レンズの厳密な閉合検定（v1.1）』に基づく一般向け解説版

原レポートの著者：Guanglin Tu｜基準版：P1 v1.1｜位置づけ：一般向け解説稿 / 査読済み論文ではない
関連アーカイブ：レポート DOI 10.5281/zenodo.18526334｜再現パッケージ DOI 10.5281/zenodo.18526286

読書メモ

これは「解説版」であり、別の学術レポートではない。元の P1 報告に基づき、重要な図表を保持しながら、各重要箇所に「それは何を意味するのか」という一般向け説明を加えている。

本稿が解説するのは、P1 が既定のデータセット、パラメータ台帳、統計プロトコルの下で得た結論だけである。銀河回転曲線（RC）と銀河—銀河弱重力レンズ（GGL）の同時検定において、EFT の平均重力応答モデルは、本稿で検定した最小 DM_RAZOR ベースラインを明確に上回る。

本稿は P1 を「暗黒物質を覆す」という結論として読まない。P1 は P シリーズ実験の第一歩にすぎず、EFT の中の「平均重力基盤」という一つの観測可能層を検定するものであり、EFT 全体理論のすべてではない。

0｜まず 5 分で P1 を理解する：これは何をしているのか？

P1 は「複数のプローブを相互に照合する」実験だと考えると分かりやすい。あるモデルが一つのデータセットに合うかだけを問うのではなく、まったく性質の異なる二種類の重力読出しを同じ監査台に載せる。回転曲線（RC）は銀河円盤内の力学を読み、銀河—銀河弱重力レンズ（GGL）はより大きなスケールで投影された重力応答を読む。

RC は「速度計」のようなものだ。銀河円盤内のガスと恒星が、半径ごとにどれほど速く回っているかを教えてくれる。
GGL はむしろ「体重計」に近い。背景光が前景銀河によってわずかに曲げられる度合いから、銀河周辺のより大きなスケールにおける平均的な重力 / 質量分布を逆算する。
P1 の中心的な問いはこうである。同じモデルが、まず RC から規則性を学び、その規則性を GGL に移してもなお筋が通るのか。

P1 の中核をなす一文

P1 は比較のハードルを「単独でよくフィットするか」から「プローブをまたいで閉合するか」へ引き上げる。正しい対応付けでは性能が良く、対応付けを崩すと信号が崩壊する。この二つが揃って初めて、モデルが RC と GGL の間に共有された重力構造を捉えている可能性が高まる。

表 0｜P1 の中核数値と一般読者向けの読み方

指標	P1 / P1A における読み方	一般読者向けの意味
同時フィット ΔlogL_total	本文の主比較では、EFT は DM_RAZOR に対して 1155–1337 上回る	二つのデータセットを合わせた総得点差。大きいほど全体説明がよい。
閉合強度 ΔlogL_closure	本文の主比較では EFT が 172–281、DM_RAZOR が 127	RC だけから推定した後に GGL を予測する能力。大きいほど「プローブ横断で自己整合的」である。
負の対照 shuffle	RC-bin→GGL-bin を打ち乱すと、EFT の閉合信号は 6–23 に低下する	正しい対応関係が壊されれば、優位は消えるはずである。消え方が明確なほど、偽信号を排除しやすい。
P1A 複数 DM 圧力テスト	DM 7+1 + DM_STD、さらに EFT_BIN を対照として保持	P1A は最小 DM_RAZOR だけを見るのではなく、複数の低次元で監査可能な DM 拡張分岐を同じ閉合プロトコルに入れる。

1｜なぜ P1 を行うのか：銀河スケール宇宙論はどこで詰まっているのか？

銀河スケールの問題が長く難問であり続けているのは、「追加の重力 / 質量が必要だ」という問題が、回転曲線だけの現象ではないからである。多くの観測は、銀河内で見えるバリオン物質と、実際の力学的読出しやレンズ読出しとの間に強い結びつきがあることを示している。暗黒物質の路線では、これは暗黒ハロー、バリオン・フィードバック、銀河形成史、観測上の系統誤差をきわめて精密に整合させる必要があることを意味する。非暗黒物質型の重力路線では、モデルは RC 上で見栄えがよいだけでは足りず、弱重力レンズ、集団スケーリング関係、負の対照でも成立しなければならない。

これこそが P1 の動機である。P1 は「暗黒物質が間違っている」や「EFT が必ず正しい」から出発しない。検証可能な一つの命題を監査台に載せる。すなわち、EFT の平均重力応答が、RC→GGL のプローブ横断的な閉合の中に、再現可能で移行可能な信号を残すかどうかである。

外部文献の背景：なぜ RC+GGL という窓が重要なのか？

McGaugh、Lelli、Schombert が 2016 年に提案した半径方向加速度関係（RAR）は、回転曲線が追跡する観測加速度と、バリオン物質から予測される加速度の間に、散布の小さい緊密な相関があることを示した。これにより、「バリオン—重力応答の結合」は銀河スケール理論が避けて通れない問題になった。

Brouwer ら（2021）は KiDS-1000 の弱重力レンズを用いて RAR をより低い加速度・より大きな半径まで拡張し、MOND、Verlinde の創発重力、LambdaCDM モデルを比較した。同時に、早期型 / 晩期型銀河の差、ガス・ハロー、銀河—ハロー接続がなお重要な説明課題であることも指摘している。

Mistele ら（2024）はさらに、弱重力レンズから孤立銀河の円速度曲線を逆算し、数百 kpc からおよそ 1 Mpc のスケールまで明確な低下が見られず、BTFR と整合することを報告した。これは、弱重力レンズが銀河スケールの重力応答を検証する重要な外部読出しになりつつあることを示している。

したがって、P1 の価値は「RC と GGL を一緒に論じた最初の試み」である点にはない。その価値は、固定された対応付け、パラメータ台帳、RC-only→GGL 閉合、shuffle 負対照、P1A の複数 DM 圧力テストから成る、監査可能なプロトコルの中に両者を置いた点にある。

2｜P1 における EFT とは何か？Effective Field Theory ではない

ここでいう EFT はエネルギー・フィラメント理論（Energy Filament Theory）を指し、物理学で一般にいう Effective Field Theory（有効場理論）ではない。P1 技術報告では、EFT はきわめて抑制的に使われている。完成した究極理論として競争に参加するのではなく、まず観測可能で、フィット可能で、反証可能な「平均重力応答」のパラメータ化へ圧縮されている。

普通の言葉で言えば、P1 は追加重力の微視的起源をすべて論じるわけでも、EFT 全体を一度に証明しようとするわけでもない。より狭く、より厳しい問いだけを立てる。銀河スケールに何らかの平均的な追加重力応答が存在するなら、それはまず RC を説明し、その後 GGL を予測できるのか、という問いである。

P1 は EFT のどの部分を捉えているのか？

P1 が捉えているのは「平均重力基盤」（mean gravity floor）である。統計的に安定し、標本をまたいで移転できる平均的寄与を指す。

P1 はまだ「ノイズ基盤」（stochastic / noise floor）を扱わない。つまり、より微視的な揺らぎ過程から生じうるランダム項、個体差、追加散布はまだ対象外である。

P1 は完全な微視的機構、存在量、寿命、あるいは宇宙論的な全体制約も論じない。これは P シリーズ実験の第一歩であり、終局判決ではない。

3｜P1 シリーズ計画：なぜ第一歩を「平均基盤」から始めるのか？

P シリーズは、EFT の観測検索計画と理解できる。すべての命題を一度に広げるのではなく、公開データで最も直接検証しやすい部分をまず単独で取り出す。P1 の戦略は平均項を先に検定することにある。平均重力応答が RC→GGL で閉合しないなら、より複雑なノイズ項や微視的機構を論じる入口は固まらない。

表 1｜P シリーズの階層的位置づけ

階層	問うべきこと	P1 における位置
P1	平均重力応答は RC→GGL で閉合するか？	本報告の主問題
P1A	DM 側を少し強くしても、結論はなお安定するか？	付録 B：DM 7+1 + DM_STD 圧力テスト
後続の P シリーズ	より多くのデータ、より多くのプローブ、より複雑な系統誤差へ拡張できるか？	今後の作業方向
より深い問題	平均項、ノイズ項、微視的機構はどのようにつながるのか？	P1 の結論範囲には含まれない

4｜データとは何か？RC と GGL はそれぞれ何を教えるのか？

4.1 回転曲線 RC：銀河円盤の「速度計」

回転曲線が記録するのは、銀河中心から異なる半径の位置で、ガスと恒星が中心のまわりをどれほど速く回っているかである。回転が速いほど、その半径で必要な向心力は強くなり、したがって有効重力も強いことを意味する。P1 は SPARC データベースを用い、前処理後に 104 個の銀河、2,295 個の速度データ点を含め、20 個の RC-bin に分けている。

4.2 弱重力レンズ GGL：より大きなスケールの「重力体重計」

銀河—銀河弱重力レンズは、前景銀河が背景銀河の光をどの程度わずかに曲げるかを測定する。これはより大きな、ハロー・スケールの投影重力応答に対応し、銀河円盤内のガス力学の詳細には依存しない。P1 は KiDS-1000 / Brouwer ら 2021 の公開 GGL データを使用する。恒星質量 bin が 4 個、それぞれに半径点が 15 個、合計 60 データ点で、完全な共分散を用いる。

4.3 固定対応付け：なぜ 20 個の RC-bin → 4 個の GGL-bin が重要なのか？

P1 は 20 個の RC-bin と 4 個の GGL-bin を固定規則で結ぶ。各 GGL-bin は 5 個の RC-bin に対応し、銀河数による重み付き平均を取る。この対応付けはすべてのモデルで不変であり、閉合検定と公正比較のための硬い制約である。

なぜ事後的に対応付けを調整してはいけないのか？

「どの RC-bin がどの GGL-bin に対応するか」を後から選べるなら、モデルは対応関係を調整して閉合を作り出せるかもしれない。P1 は 20→4 の対応付けを事前に固定し、さらに shuffle 負対照で意図的にそれを壊す。これは、閉合信号が物理的に妥当な対応関係に本当に依存しているかを判断するためである。

5｜モデルと方法：P1 は結局「何を比べている」のか？

5.1 EFT 側：低次元の平均重力応答

EFT 側では、低次元の追加速度項によって平均重力応答を記述する。追加項の形は無次元核関数 f(r/ℓ) で制御され、ℓ は大域的スケールであり、振幅は RC-bin ごとに与えられる。異なる核関数は、初期勾配、遷移の速さ、長距離尾部の違いを表し、頑健性の圧力テストに用いられる。

5.2 DM 側：本文の主比較と付録 P1A は分けて読む必要がある

本文の主比較における DM_RAZOR は、最小化され、監査可能な NFW ベースラインである。固定された c–M 関係を用い、halo-to-halo scatter、断熱収縮、feedback core、非球対称性、環境項は含めない。この設計の利点は自由度が制御され、再現しやすいことにある。限界は、すべての LambdaCDM モデルやすべての暗黒物質ハロー・モデルを代表できないことにある。

そのため付録 B（P1A）では、DM 側を一組の「標準化された圧力テスト」として構成する。共有対応付けと閉合プロトコルを変えずに、SCAT、AC、FB、HIER_CMSCAT、CORE1P、lensing m、組合せベースライン DM_STD などの低次元拡張分岐を段階的に加え、EFT_BIN を対照として残す。P1A は、最小 DM ベースライン一つだけと比べるのではなく、よくある監査可能な DM 機構を同じ閉合基準で測るもの、と読めばよい。

本稿で採用する正確な結論の言い方

本文：EFT 系列は主比較において、最小 DM_RAZOR を有意に上回る。

付録 B / P1A：複数の低次元で監査可能な DM 拡張分岐と DM_STD 圧力テストの下で、DM の一部の同時フィットは改善しうる。しかし閉合強度は EFT_BIN の優位を消していない。

したがって最も堅実な表現はこうである。P1/P1A のデータ、対応付け、パラメータ台帳、閉合プロトコルの範囲内では、EFT の平均重力応答はより強いデータ横断的一貫性を示す。ただし、これはすべての暗黒物質モデルを排除することと同義ではない。

5.3 閉合検定：P1 で最も重要な実験上の論理

1. RC だけを用いてフィットし、一組の RC-only 事後サンプルを得る。

2. GGL で再調整することは許さず、RC 事後分布をそのまま用いて GGL を予測する。

3. 完全な共分散を用いて、正しい対応付けの下での GGL 予測得点 logL_true を計算する。

4. RC-bin→GGL-bin の対応関係をランダムに置換し、負の対照得点 logL_perm を計算する。

5. 両者を差し引いて閉合強度を得る：ΔlogL_closure = <logL_true> − <logL_perm>。

分かりやすい比喩

閉合検定は、試験会場をまたいだ再試験のようなものだ。モデルはまず RC の試験会場で規則を学び、次に GGL の試験会場で解答する。もし学んだものが局所的な小技ではなく共有規則なら、会場を移してもなおよく答えられるはずだ。試験会場の対応関係を意図的にかき混ぜれば、優位は消えるはずである。

5.4 技術表を読む前に：四つの入口を先につかむ

表 5.4｜次の横向き技術表群の読み方

入口	何を見るか	なぜ重要か
表 S1a	RC+GGL 同時フィット総得点	「二つのデータを合わせて見ると、誰の全体説明がより強いか」に答える。
表 S1b	閉合強度、shuffle、頑健性スキャン	「RC で学んだことは GGL へ移せるか」に答える。
表 B0	P1A における複数の DM 拡張分岐の定義	P1 を「最小 DM_RAZOR とだけ比べた」に単純化することを避ける。
表 B1	P1A の閉合と共同の scoreboard	DM を拡張した後、閉合上の優位が消えるかを確認する。

レイアウト注記

次ページから横向きページを用いるのは、原レポートの幅広い表を完全に保ち、列を削除したり読めないほど圧縮したりしないためである。本文解説ではすでに一般読者向けの読み方を示した。横向きの技術表は、数値やモデル分岐を照合する必要がある読者のためのものである。

図 0.1｜一枚で分かる P1 の閉合検定フロー

説明：上段の鎖は「閉合検定」（RC だけでフィット → RC 事後分布で GGL を予測）であり、下段の鎖は「同時フィット」（RC+GGL をまとめて採点）である。右側では真の対応付けとシャッフルした対応付けを比較し、閉合強度 ΔlogL を得る。

6｜主要な技術表：原レポートの主表と P1A 表

表 S1a｜同時フィット主比較指標（RC+GGL，Strict；原レポートから保持）

モデル（workspace）	Wカーネル	k	同時 logL_total（best）	ΔlogL_total vs DM	AICc	BIC
DM_RAZOR	none	20	-16927.763	0.0	33895.885	34010.811
EFT_BIN	none	21	-15590.552	1337.21	31223.501	31344.155
EFT_WEXP	exponential	21	-15668.83	1258.932	31380.057	31500.711
EFT_WYUK	yukawa	21	-15772.936	1154.827	31588.268	31708.922
EFT_WPOW	powerlaw_tail	21	-15633.321	1294.442	31309.038	31429.692

表 S1b｜閉合と頑健性の指標（Strict；原レポートから保持）

モデル（workspace）	閉合 ΔlogL（true-perm）	負の対照 shuffle 後の ΔlogL	σ_int スキャン ΔlogL 範囲	R_min スキャン ΔlogL 範囲	cov-shrink スキャン ΔlogL 範囲
DM_RAZOR	126.678	22.725	—	—	—
EFT_BIN	231.611	14.984	459–1548	1243–1289	1337–1351
EFT_WEXP	171.977	6.04	408–1471	1169–1207	1259–1277
EFT_WYUK	179.808	14.688	380–1341	1065–1099	1155–1166
EFT_WPOW	280.513	6.672	457–1500	1203–1247	1294–1308

表 B0｜P1A における DM 拡張分岐の定義（原レポート付録 B から保持）

Workspace	DMモデル	新規パラメータ（≤1）	物理的動機（中核）	実装原則（監査しやすい）
DM_RAZOR	NFW (fixed c–M, no scatter)	—	最小で監査可能な LambdaCDM ハロー・ベースライン。EFT との厳密対照に用いる。	共有対応付けを固定。パラメータ台帳を厳格化。baseline として相対比較にのみ用いる。
DM_RAZOR_SCAT	NFW + c–M scatter（legacy）	σ_logc	c–M 関係に散乱があることを許す。一つの log-normal scatter パラメータで近似する。	≤1 の新規パラメータ。共有対応付けは維持。閉合ゲインを合格基準とする。
DM_RAZOR_AC	NFW + Adiabatic Contraction（legacy）	α_AC	バリオンの落ち込みがハローの断熱収縮を引き起こす可能性がある。一つの強度パラメータで近似する。	≤1 の新規パラメータ。対応付けは変更しない。AICc/BIC の変化と閉合ゲインを報告する。
DM_RAZOR_FB	NFW + feedback core（legacy）	log r_core	フィードバックは内側領域に core を形成しうる。一つの core スケール・パラメータで近似する。	≤1 の新規パラメータ。閉合 / 負の対照は同一口径。RC-only 改善だけを唯一の目標にしない。
DM_HIER_CMSCAT	Hierarchical c–M scatter + prior	σ_logc（hier）	より標準的な階層化 c_i∼logN(c(M_i), σ_logc)。RC と GGL の共同事後分布に同時に影響する。	明示的な事前分布。潜在 c_i を周辺化。なお低次元で監査可能に保つ。
DM_CORE1P	1‑parameter core proxy (coreNFW/DC14‑inspired)	log r_core	一つの core 代理で baryonic feedback の主効果を表し、高次元の星形成詳細を避ける。	標準文献を参照。≤1 の新規パラメータ。閉合検定と結びつける。
DM_RAZOR_M	NFW + lensing shear‑calibration nuisance	m_shear（GGL）	弱重力レンズ側の主要な系統誤差を有効パラメータで吸収し、「系統誤差を物理として扱う」リスクを下げる。	nuisance は明確に台帳化する。RC へ逆向きに影響することは許さない。結果は主に閉合頑健性で判断する。
DM_STD	Standardized DM baseline (HIER_CMSCAT + CORE1P + m)	σ_logc + log r_core (+ m_shear)	最も一般的な三種類の疑問を、なお低次元の標準化ベースラインに同時に入れる。	パラメータ台帳と情報量規準をともに報告。閉合を主指標とする。最も強い DM 防御対照として用いる。

表 B1｜P1A scoreboard（大きいほどよい；原レポート付録 B から保持）

モデル分岐（workspace）	Δk	RC-only best logL_RC (Δ)	閉合強度 ΔlogL_closure (Δ)	Joint best logL_total (Δ)
DM_RAZOR	0	-15702.654 (+0.000)	122.205 (+0.000)	-27347.068 (+0.000)
DM_RAZOR_SCAT	1	-15702.294 (+0.361)	121.236 (-0.969)	-23153.311 (+4193.758)
DM_RAZOR_AC	1	-15703.689 (-1.035)	121.531 (-0.674)	-23982.557 (+3364.511)
DM_RAZOR_FB	1	-15496.046 (+206.609)	129.454 (+7.249)	-27478.531 (-131.463)
DM_HIER_CMSCAT	1	-15702.644 (+0.010)	121.978 (-0.227)	-23153.160 (+4193.908)
DM_CORE1P	1	-15723.158 (-20.504)	122.056 (-0.149)	-27336.258 (+10.810)
DM_RAZOR_M	0 (+m)	-15702.654 (+0.000)	122.205 (+0.000)	-27340.451 (+6.617)
DM_STD	2 (+m)	-15832.203 (-129.549)	105.690 (-16.515)	-22984.445 (+4362.623)
EFT_BIN	1	-14631.537 (+1071.117)	204.620 (+82.415)	-19001.142 (+8345.926)

表 B1（P1A scoreboard）の読み方

• Δk：新しい自由度。大きいほどモデルは複雑だが、複雑なことは自動的に良いことを意味しない。

• 重点は二つの列である。閉合強度 ΔlogL_closure(Δ)（大きいほど「移行自己整合性」が高い）と Joint best logL_total(Δ)（同時フィット総得点）。

• 括弧内の (Δ) は DM_RAZOR に対する差であり、直接比較しやすくするためのものである。

• この表が主に答えたいのは、DM ベースラインを「合理的に拡張」したとき、閉合上の優位が消えるかどうかである。

• 読み方のヒント：DM_STD の同時得点は大きく改善するが、閉合強度はむしろ下がる。EFT_BIN は閉合強度でなお高い。

一文要約：この低次元で監査可能な DM 拡張群の範囲では、同時フィットの改善は自動的により強い閉合を生まない。閉合、つまり移行可能性がなお重要な判定基準である。

7｜主要結果をどう読むか？

7.1 同時フィット：二つのデータセットを合わせて見ると、主比較で EFT の得点が高い

表 S1a と図 S4 は、同じデータ、同じ共有対応付け、ほぼ同じパラメータ規模の下で、EFT 系列の DM_RAZOR に対する同時 ΔlogL_total が 1155–1337 であることを示している。一般読者向けには、RC と GGL の二つのデータを合わせた同一の採点規則の下で、主比較の EFT モデルは総得点が高い、と理解すればよい。

7.2 閉合検定：P1 が最も強調したいのは「移行可能性」

閉合強度が高いということは、RC だけから推定したパラメータが、GGL を再び見ることなく、GGL をよりよく予測できることを意味する。P1 報告では EFT の ΔlogL_closure は 172–281、DM_RAZOR は 127 である。この結果は「それぞれのフィットが良い」という話より重要である。第二のデータセット上でモデルの自由度を制限しているからである。

7.3 負の対照：なぜ「信号の崩壊」はむしろ良いことなのか？

P1 が RC-bin→GGL-bin のグループ分けの対応関係をランダムに崩すと、EFT の閉合信号は 6–23 程度まで低下する。一般読者にとって、このステップは「不正検出」検査に相当する。閉合上の優位がコード、単位、共分散処理、あるいはフィットの偶然から生じただけなら、対応関係を崩しても同じように優位が出る可能性がある。実際には優位が崩壊するため、それが正しい対応付けに依存していることが示される。

図 S3｜閉合強度（大きいほどよい）：RC-only → GGL 予測における平均対数尤度の優位。

この図の読み方

この図は P1 の中核である。棒が高いほど、RC から学んだ情報が GGL へよく移ることを示す。

EFT 系列は全体として DM_RAZOR より高く、「先に RC を学び、次に GGL を予測する」実験で EFT のプローブ横断閉合が強いことを示している。

図 S4｜同時フィット優位（大きいほどよい）：RC+GGL の best logL_total の DM_RAZOR に対する差。

この図の読み方

この図は RC と GGL を同時に合わせた総得点を見ている。

EFT 系列はすべて 0 を大きく上回り、主比較における EFT の優位が一つの局所的な点の現象ではなく、同時分析全体の振る舞いであることを示している。

図 R1｜負の対照：shuffle グループ化後に閉合信号が大きく低下する。

この図の読み方

この図は、正しい RC↔GGL 分箱関係を打ち乱すと、閉合信号が大きく下がることを示している。

そのため P1 の結果は、どんな対応付けでも得られる数値上の偶然ではなく、データ対応付けをまたいだ実在の一貫性に近いものに見える。

8｜頑健性と対照：P1 は「単なるパラメータ調整で見栄えがよい」ことをどう避けているか？

技術報告で最も自然に問われるのは、優位が一つのノイズ設定、一部の中心領域データ、一つの共分散処理、あるいは過剰フィットから来ていないかという点である。P1 は複数の圧力テストでこの問いに答える。

表 2｜P1 の頑健性テストと負の対照の読み方

テスト	排除したい疑問	読み方
σ_int スキャン	RC に追加の未知散布があるとしても、結論は安定しているか？	RC 誤差を緩めた後も、EFT の順位と優位の規模は安定している。
R_min スキャン	銀河中心領域を完全には信頼しない場合でも、結論は安定しているか？	中心領域を切り落としても、EFT はなお正の優位を保つ。
cov-shrink スキャン	GGL 共分散推定に不確実性があっても、結論は安定しているか？	共分散を対角行列へ収縮させても、優位は敏感に変わらない。
アブレーション階段	EFT は不要な複雑さで無理にフィットしているのか？	完全な EFT_BIN は情報量規準上、必要性を持つ。
LOO 留保予測	モデルは見たことのあるデータだけを説明しているのか？	留保した GGL bin でも比較的強い汎化性能を示す。
RC-bin shuffle	閉合は真の対応付けから来ているのか？	グループ分けを打ち乱すと閉合が低下し、対応付け依存性を支持する。

図 R2｜σ_int スキャン下の ΔlogL_total の範囲（大きいほどよい）。

この図の読み方

RC の内在散布設定を変えても、EFT のリードが残るかを検証する。

図 R3｜R_min スキャン下の ΔlogL_total の範囲（大きいほどよい）。

この図の読み方

複雑な中心領域を切り落としても、EFT の優位が安定しているかを検証する。

図 R4｜cov-shrink スキャン下の ΔlogL_total の範囲（大きいほどよい）。

この図の読み方

弱重力レンズ共分散の処理を変えても、順位が敏感かどうかを検証する。

図 R5｜EFT_BIN のアブレーション階段（AICc；小さいほどよい）。

この図の読み方

完全な EFT_BIN がデータ説明に必要か、それとも単にパラメータを余計に足しただけかを検証する。

図 R6｜LOO：留保 bin の対数尤度分布。

この図の読み方

モデルが未見の GGL bin に対しても予測性能を持つかを検証する。

図 R7｜負の対照：shuffle 対応付けにより閉合 mean logL_true が明確に低下する。

この図の読み方

mean logL_true の観点からも、閉合が正しいデータ横断対応付けに依存することをさらに示す。

9｜P1A：なぜ「付録に複数の DM モデルがある」ことが重要な修正なのか？

この節が答えるのは、「EFT は最小の DM_RAZOR 一つに勝っただけなのか」という問いではない。低次元で、再現可能で、パラメータ台帳が明確な範囲で DM ベースラインを強化した場合（P1A）、閉合検定と同時フィットの結論が書き換わるのかを問う。言い換えれば、P1A の目標は「過度に弱い DM ベースラインを選んだだけではないか」という疑問を下げ、議論を「監査可能な DM 拡張群の下でも閉合性能に差は残るのか」へ進めることにある。

P1A の設計は、LambdaCDM ハロー・モデリングのすべての可能性を尽くそうとするものではなく、DM 側を高次元で監査不能なフィッターに変えるものでもない。選んでいるのは、低次元で、再現可能で、パラメータ台帳が明確な強化である。濃度散乱、断熱収縮、feedback core、階層的 c–M scatter prior、単一パラメータ core 代理、弱重力レンズの shear-calibration nuisance、そして組合せ DM_STD である。

P1A の主な読み方

legacy の三分岐のうち、feedback/core だけが閉合強度に小さな純増をもたらす。SCAT と AC は純粋な閉合増加をもたらしていない。

DM_HIER_CMSCAT、DM_RAZOR_M、DM_CORE1P は閉合強度への影響が小さいか、有意な純増を示していない。

DM_STD は joint logL を大きく改善できるが、閉合強度は下がる。これは主に同時フィットの柔軟性を高めているのであって、RC→GGL の移行予測力を高めているわけではないことを示唆する。

P1A の表 B1 でも、EFT_BIN はより高い閉合強度と同時フィット上の優位を保っている。したがって、P1 の中核主張を「最小 DM_RAZOR にだけ勝った」と単純化すべきではない。

図 B1｜P1A scoreboard：閉合と同時フィットの ΔlogL の baseline に対する差（大きいほどよい）。

この図の読み方

この図は、複数の DM 拡張分岐がベースラインに対してどう振る舞うかを示している。

その意味は「すべての DM を排除する」ことではない。P1A が選んだ低次元で監査可能な DM 拡張の範囲内では、DM を拡張しても EFT_BIN の閉合上の優位は消えていない、ということを示している。

10｜P1 実験の意味：なぜこれを行う価値があるのか？

10.1 方法論上の意味：「単一プローブフィット」より上に「プローブ横断閉合」を置く

銀河スケール理論は、あるモデルが一組の回転曲線にフィットできるかという議論に陥りやすい。P1 は問題を一段引き上げる。RC から学んだパラメータが、GGL で再調整せずに弱重力レンズを予測できるのか。これにより P1 は「フィット競争」から「移行予測検定」へ変わる。

10.2 透明性の意味：再検証可能な鎖を結果の一部として扱う

P1 の重要な貢献の一つは、データ、表と図、実行ラベル、負の対照、再現パッケージ、監査鎖をまとめて公開したことである。支持者にとっても批判者にとっても、これは重要である。議論はスローガンの比較ではなく、同じ公開データ、同じ対応付け、同じスクリプト、同じ指標へ戻ることができる。

10.3 物理的意味：「非暗黒物質型重力」の方向に強い圧力テストを与える

非暗黒物質型重力の方向では、多くのモデルが回転曲線や RAR 現象の一部を説明できる。しかしより難しいのは、弱重力レンズ読出しにも同時に通り、負の対照の下で信号が正しい対応付けに依存することを示す点である。P1 の意味は、EFT の平均重力応答を、いわば「外部試験」のようなプロトコルに入れたことにある。RC は訓練場、GGL は移行先の試験場、shuffle は不正検出場である。

10.4 これは「非暗黒物質型重力分野」における重要な実験なのか？

慎重に言えば、P1 のデータ処理、再現パッケージ、閉合プロトコルが外部レビュー後も成立するなら、非暗黒物質型重力 / 修正重力の研究において、真剣に検討すべき RC+GGL 閉合実験と見なせる。その重要性は「暗黒物質を覆した」という一言ではなく、再現でき、挑戦でき、拡張できるプローブ横断的な判定基準を提示している点にある。

同じくらい高い RC+GGL 予測閉合フレームワークは既にあるのか？

関連する枠組みと観測の伝統はすでに存在する。MOND/RAR は多くの回転曲線現象をよく整理する。KiDS-1000 の弱重力レンズ RAR 研究も、MOND、Verlinde 創発重力、LambdaCDM モデルを比較している。LambdaCDM も、銀河—ハロー接続、ガス・ハロー、フィードバック・モデリングを通じて、弱重力レンズ / 力学現象の一部を説明できる。

ただし P1 の正確な主張は、「世界には RC+GGL を説明できる他の枠組みが存在しない」ではない。P1 が公開している固定対応付け、RC-only→GGL 閉合、shuffle 負対照、パラメータ台帳、P1A 複数 DM 圧力テストのプロトコルの下で、EFT がより強い閉合性能を報告している、という主張である。

言い換えれば、P1 の中で外部検証に最も値するのは、具体的で再現可能な比較プロトコルを提示した点である。MOND/RAR、LambdaCDM/HOD、流体力学シミュレーション、あるいは他の修正重力フレームワークが同じプロトコルの下で同等またはより高い閉合得点に達するかどうかを検定することは、非常に価値のある次の一歩である。

11｜P1 から何が言えるか？何は言えないか？

表 3｜P1 の結論の境界

言えること	P1 の RC+GGL データ、固定対応付け、主比較プロトコルの下では、EFT 系列は最小 DM_RAZOR より高い同時フィットと閉合強度を持つ。
言えること	P1A の低次元で監査可能な DM 拡張範囲内では、複数の DM 拡張は EFT_BIN の閉合上の優位を消していない。
言えること	shuffle 負対照は、閉合信号が正しいデータ横断対応付けに依存し、任意の対応付けからは得られないことを示している。
言えないこと	P1 がすべての暗黒物質モデルを覆したとは言えない。P1A はなお、非球対称性、環境依存性、複雑な銀河—ハロー接続、高次元フィードバック、完全な宇宙論シミュレーションを尽くしていない。
言えないこと	EFT の完全理論が第一原理から証明されたとは言えない。P1 が検定するのは、平均重力応答という現象論的層だけである。
言えないこと	すべての系統誤差が排除されたとは言えない。P1 は列挙された圧力テストと監査範囲の中でのみ頑健性の証拠を与える。

12｜よくある質問：一般読者が最も尋ねやすい問い

Q1：これは「暗黒物質は存在しない」と言っているのか？

違う。P1 の結論は、本稿のデータ、プロトコル、対照モデルの範囲に限定される必要がある。P1A は最小 DM_RAZOR より一歩進んでいるが、それでも可能なすべての暗黒物質モデルを代表してはいない。

Q2：これは「EFT がすでに証明された」と言っているのか？

それも違う。P1 は EFT を平均重力応答のパラメータ化として検定し、RC→GGL 閉合でより強い性能を示す。微視的機構と完全な理論は P1 の結論ではない。

Q3：なぜ有意性を σ 値で直接言わないのか？

P1 が用いるのは、統一された尤度得点、情報量規準、閉合差分である。ΔlogL は同じ採点規則の下での相対的優位であり、単一の σ 値と同じではない。

Q4：なぜ RC-bin→GGL-bin をシャッフルするのか？

これは負の対照である。本物のプローブ横断信号は、正しい対応付けに依存するはずだ。シャッフル後も同じ強さが残るなら、むしろ実装バイアスや統計的な偽信号の可能性を示す。

Q5：P1 の次の一歩として最も重要なことは何か？

同じプロトコルを、より多くのデータ、より多くの DM 対照、より複雑な系統誤差、より多くの修正重力フレームワークへ拡張すること。とくに、外部チームが同じ閉合指標の下で再検定できる形にすることが重要である。

13｜用語ミニ辞典

表 4｜用語ミニ辞典

用語	一文での説明
回転曲線（RC）	銀河円盤における半径—速度関係。円盤面内の有効重力を逆算するために用いる。
弱重力レンズ（GGL）	背景銀河形状の統計的な歪みを通じて、前景銀河周辺の平均重力 / 質量分布を測る。
閉合検定	RC 事後分布で GGL を予測し、シャッフル対応付けの負対照と比較する。
負の対照	重要な構造を意図的に壊し、信号が消えるかを見る。偽信号を排除するために用いる。
NFW ハロー	冷暗黒物質モデルでよく使われる暗黒物質ハロー密度プロファイル。
c–M 関係	暗黒物質ハローの濃度 c と質量 M の関係。散乱を許すかどうかはモデルの柔軟性に影響する。
DM_STD	P1A において、複数の低次元 DM 拡張とレンズ nuisance を組み合わせた標準化 DM 圧力テスト分岐。
ΔlogL	同じ採点規則の下での二つのモデルの対数尤度差。正の値は前者がより優れていることを意味する。
共分散	データ点間の相関を表す行列表現。弱重力レンズ・データでは通常、完全な共分散を用いる必要がある。

14｜推奨される読み方と引用入口

1. まず本稿の第 0–2 節を読み、P1 の問題意識と、P1 内での EFT の抑制された位置づけをつかむ。

2. 次に図 S3、図 S4、表 S1a/S1b を見て、閉合強度、同時フィット、負の対照を理解する。

3. 「DM ベースラインが弱すぎるのではないか」が気になる場合は、第 9 節と表 B1 / 図 B1 を直接読む。

4. 技術的に再検証する場合は、P1 技術報告 v1.1、Tables & Figures Supplement、full_fit_runpack に戻る。

主要アーカイブ入口

P1 技術報告（公開版、Concept DOI）：10.5281/zenodo.18526334

P1 完全再現パッケージ（Concept DOI）：10.5281/zenodo.18526286

EFT 構造化知識ベース（任意、Concept DOI）：10.5281/zenodo.18853200

ライセンス注記：技術報告は CC BY-NC-ND 4.0、完全再現パッケージは CC BY 4.0 を採用する（技術報告と Zenodo アーカイブ記録に準拠）。

15｜参考文献と外部背景

McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.

0｜まず 5 分で P1 を理解する：これは何をしているのか？

1｜なぜ P1 を行うのか：銀河スケール宇宙論はどこで詰まっているのか？

2｜P1 における EFT とは何か？Effective Field Theory ではない

3｜P1 シリーズ計画：なぜ第一歩を「平均基盤」から始めるのか？

4｜データとは何か？RC と GGL はそれぞれ何を教えるのか？

4.1 回転曲線 RC：銀河円盤の「速度計」

4.2 弱重力レンズ GGL：より大きなスケールの「重力体重計」

4.3 固定対応付け：なぜ 20 個の RC-bin → 4 個の GGL-bin が重要なのか？

5｜モデルと方法：P1 は結局「何を比べている」のか？

5.1 EFT 側：低次元の平均重力応答

5.2 DM 側：本文の主比較と付録 P1A は分けて読む必要がある

5.3 閉合検定：P1 で最も重要な実験上の論理

5.4 技術表を読む前に：四つの入口を先につかむ

6｜主要な技術表：原レポートの主表と P1A 表

122.205 (+0.000)

121.236 (-0.969)

121.531 (-0.674)

129.454 (+7.249)

121.978 (-0.227)

122.056 (-0.149)

122.205 (+0.000)

105.690 (-16.515)

204.620 (+82.415)

7｜主要結果をどう読むか？

7.1 同時フィット：二つのデータセットを合わせて見ると、主比較で EFT の得点が高い

7.2 閉合検定：P1 が最も強調したいのは「移行可能性」

7.3 負の対照：なぜ「信号の崩壊」はむしろ良いことなのか？

8｜頑健性と対照：P1 は「単なるパラメータ調整で見栄えがよい」ことをどう避けているか？

9｜P1A：なぜ「付録に複数の DM モデルがある」ことが重要な修正なのか？

10｜P1 実験の意味：なぜこれを行う価値があるのか？

10.1 方法論上の意味：「単一プローブフィット」より上に「プローブ横断閉合」を置く

10.2 透明性の意味：再検証可能な鎖を結果の一部として扱う

10.3 物理的意味：「非暗黒物質型重力」の方向に強い圧力テストを与える

10.4 これは「非暗黒物質型重力分野」における重要な実験なのか？

11｜P1 から何が言えるか？何は言えないか？

12｜よくある質問：一般読者が最も尋ねやすい問い

13｜用語ミニ辞典

14｜推奨される読み方と引用入口

15｜参考文献と外部背景