エネルギー・フィラメント理論 (Energy Filament Theory, EFT) の平均重力フレームワークと、冷たい暗黒物質（DM）の最小 NFW ベースラインとの比較

著者：Guanglin Tu
メール：riniky@energyfilament.org ｜ ORCID：0009-0003-7659-6138
所属：EFT ワーキンググループ、Shenzhen Energy Filament Science Research Co., Ltd.（中国）
版：v1.1 ｜日付：2026-02-14

プレプリント（査読前）｜本版は公開共有と再検証のためのものであり、学術誌で最終公表された版を代表するものではない。

ライセンス：レポート（CC BY-NC-ND 4.0）；完全再現パッケージ（CC BY 4.0）。

出版レベル報告書（Concept DOI）：https://doi.org/10.5281/zenodo.18526334
完全再現パッケージ（Concept DOI）：https://doi.org/10.5281/zenodo.18526286

0 エグゼクティブ・サマリー（Executive Summary）

本報告書は、Zenodo にアーカイブされた出版レベルの完全報告書（アーカイブ版）であり、データ、モデル台帳、公平比較、クロージャ検定、再現資料までを一体化した監査可能なチェーンとして提示する。付録 B（P1A）は頑健性の補足として、「より標準的な DM ベースライン + 主要な系統誤差」に対するストレステストを集中的に示し、本文の主要結論が、より現実的な DM モデリングとレンズ効果の系統誤差処理に対してどれほど敏感かを検証する。

主要結論（四文、直接引用可。詳細は第2.4節を参照）：

（1）回転曲線（RC）フィッティングでは、EFT 系列はすべてのカーネル関数 / 事前分布の組み合わせで DM_RAZOR を有意に上回る。典型的な改善は Δlog𝓛_RC ≈ 10^3 である（表 S1a を参照）。
（2）RC→GGL のクロージャ検定では、EFT はより強いプローブ横断の移行可能性を示す。クロージャ強度 Δlog𝓛_closure（True−Perm）は DM_RAZOR より有意に高く、その差は共分散 shrinkage、R_min、σ_int のスキャンに対して頑健である（図 S3、表 S1b を参照）。
（3）共同フィッティング（RC+GGL）でも EFT は安定した優位を保ち、共有マッピングを壊す負の対照ではその優位が崩れる。これは、「平均重力効果」が偶然のフィッティングではなく共有マッピングに由来することを支持する（図 S4 を参照）。
（4）付録 B（P1A）は、次元を有意に増やさないまま、より標準的な DM ベースライン・モジュールと、レンズ効果に関する主要な nuisance 系統誤差を用いて DM 側をストレステストする。これらの強化は EFT のクロージャ優位を消していない（表 B1、図 B1 を参照）。

データとコードの入手性：報告書 Concept DOI 10.5281/zenodo.18526334；完全再現パッケージ Concept DOI 10.5281/zenodo.18526286。付録 B（P1A）に対応するタグは run_tag=20260213_151233、closure_tag=20260213_161731、joint_tag=20260213_195428 である。

1 要旨

本研究では、同一データと同一統計プロトコルの下で、二つの理論フレームワークを再現可能な形で定量比較する。一つはエネルギー・フィラメント理論（Energy Filament Theory, EFT；一般的な略称 Effective Field Theory とは意味が異なる）が提案する「平均重力修正」モデルであり、もう一つは冷たい暗黒物質（DM）NFW ハローのベースラインモデル（DM_RAZOR）である。DM_RAZOR は意図的に「最小 DM ベースライン」として選ばれている。すなわち、NFW ハロー + 固定 c–M 関係（halo-to-halo scatter なし）であり、監査可能・再検証可能な対照を与えるためのものである。同時に強調しておくべき点として、本稿では EFT を、統一された統計プロトコルの下で検定される、現象論的で MOND 類似の有効場 / 有効応答パラメータ化として扱うのであって、ここでその微視的第一原理を導出するわけではない。

データは、統一的な前処理とビン分けを経た SPARC 回転曲線（RC）の 2295 個の速度データ点（104 銀河、20 個の RC-bin）と、KiDS-1000 の銀河-銀河弱レンズ効果（GGL）における等価面密度 ΔΣ(R)（4 個の恒星質量 bin × 各 bin 15 個の R 点、計 60 点、完全共分散を使用）からなる。

本研究では、RC-only 推論、RC→GGL クロージャ検定（closure）、GGL-only 推論、RC+GGL 共同推論を順に実行し、一貫性監査によって、引用されるすべての数値が追跡可能であることを保証する。厳密なパラメータ台帳と共有マッピング制約の下で（DM：20 個の log M200_bin；EFT：20 個の log V0_bin + 1 個の global log ℓ）、EFT 系列は共同フィッティングで DM_RAZOR を有意に上回る：ΔlogL_total = 1155–1337（DM_RAZOR に対して）。さらに重要なのは、クロージャ検定が、RC 事後分布に GGL への非自明な予測力があることを示している点である。EFT のクロージャ強度 ΔlogL_closure = 172–281 は DM_RAZOR の 127 より高い。一方、RC-bin→GGL-bin のグルーピングをランダムにシャッフルすると、クロージャ信号は 6–23 まで崩れ、この信号が統計的偶然や実装バイアスではないことが確認される。σ_int、R_min、共分散 shrinkage の系統的スキャンでも、EFT の相対優位は正のまま、かつ桁として安定している。「DM ベースラインが弱すぎる / 系統誤差を物理と見誤っている」という一般的な疑義に応えるため、付録 B（P1A）では、より標準的でありながら低次元かつ監査可能な DM ベースライン・ストレステスト（階層 c–M scatter + prior、単一パラメータ core 代理、lensing m、および組み合わせ DM_STD を含む）を提示する。同一のクロージャプロトコルの下で、これらの強化は EFT のクロージャ優位を消していない（表 B1 / 図 B1 を参照）。

キーワード：回転曲線；銀河-銀河弱レンズ効果；クロージャ検定；EFT；冷たい暗黒物質；ベイズ推論

2 導入と結果概観

回転曲線（RC）と銀河-銀河弱レンズ効果（GGL）は、相補的な二種類の重力プローブである。RC は円盤面内の力学ポテンシャルと半径方向加速度関係（RAR）を制約し、GGL は投影質量分布とハロー尺度の重力応答を測定する。任意の候補理論にとって重要なのは、二つのデータセットを別々にフィットできるかどうかではなく、同一のデータ横断マッピングと共有制約の下で一貫した説明を実現できるかどうかである。

したがって、本稿では「クロージャ検定（closure test）」を中核的な統計プロトコルとする。まず RC-only 事後分布から GGL を前向き予測し、次に RC-bin→GGL-bin マッピングを置換した負の対照（permutation / shuffle）と比較する。これにより、データ横断の予測移行性（predictive transferability）を評価し、実装バイアスや偶然のフィッティングによる偽信号を排除する。

理論上の位置づけと範囲：本稿は、EFT（エネルギー・フィラメント理論）の微視的第一原理導出や相対論的に完備した形式を提示しようとするものではない。むしろ EFT を、低次元で MOND 類似の有効場 / 有効応答パラメータ化（カーネル関数 f(x) と大域尺度 ℓ によって記述されるもの）として扱い、厳密なパラメータ台帳制約の下で、RC→GGL のクロージャ検定を用いてデータ横断の一貫性と予測移行能力を検定する。

研究計画と範囲声明：本稿は、継続中の P 系列観測検索計画の一部である。われわれは既存の銀河尺度データの中で、二種類の有効な背景寄与を探す：（i）粗視化後の平均重力応答によって記述し得る「平均重力フロア」（mean gravity floor）と、（ii）微視的過程の揺らぎに関連する「確率的 / ノイズ・フロア」（stochastic/noise floor）である。本稿（P1）では前者のみに焦点を当てる。すなわち、微視的な生成機構を仮定せず、RC→GGL のクロージャ検定を通して平均重力フロアの観測的兆候を検索し、統一対照プロトコルの下で監査可能な DM ベースラインと比較する。発見的な物理像としては、短寿命の自由度が存在するなら、その崩壊 / 消滅は静止質量を他の自由度が担うエネルギー運動量へ変換し、有効レベルでは自然に「平均寄与 + 揺らぎ寄与」という分解に対応し得る。ただし、本稿ではこの微視的描像の定量モデル化は行わない。

過剰解釈を避けるため、本稿の範囲境界は次のとおりである：
• 本稿が行うこと：厳密なパラメータ台帳と共有マッピング制約の下で、クロージャ検定によりデータ横断の予測移行性を測定し、EFT の平均重力応答と DM ベースラインを再現可能に比較する。
• 本稿が行わないこと：いかなる微視的生成機構、存在量 / 寿命、宇宙論的制約についても論じない。「ノイズ・フロア」に対応する確率項もモデル化しない。
• 本稿が主張しないこと：暗黒物質を否定することを目的としない。P1 は「フロアが存在するかどうか」について終局判決を下すものではなく、本文で選んだ頑健な測定領域において、データが平均重力応答を含むモデルをより好むという段階的証拠を報告する。

同時に、DM_RAZOR は、最小化され監査可能な NFW ベースライン（固定 c–M、scatter なし；断熱収縮 Adiabatic Contraction、feedback core、非球対称性、環境項を含まない）の代表にすぎないことを明記する。したがって本文の主要結論は、厳密には、この最小ベースラインと厳格なパラメータ台帳 / マッピング制約の下で、EFT のデータ横断一貫性がより強い、という点に限定される。よくある問い、すなわち、より標準的な ΛCDM ベースラインと主要なレンズ系統誤差モデリングを入れると結論が大きく変わるのか、に答えるため、われわれは、より標準的でありながら低次元で監査可能な DM 強化とレンズ側 nuisance を付録 B（P1A：DM ベースライン標準化ストレステスト）に統合し、本文と完全に同一の共有マッピングおよびクロージャ検定口径を保つ（表 B1 / 図 B1 を参照）。

2.1 Tab S1a–S1b：主要指標の要約（Strict）

表 S1a は共同フィッティング（RC+GGL）の主比較指標（logL、ΔlogL、AICc、BIC）を示す。表 S1b はクロージャ検定と頑健性スキャンの指標（closure、shuffle 負の対照、σ_int / R_min / cov-shrink のスキャン範囲）を示す。すべての数値は厳密集計主表 Tab_Z1_master_summary に由来し、公開アーカイブ・パッケージ内で項目ごとに追跡できる。

表 S1a｜共同フィッティング主比較指標（RC+GGL，Strict）。

モデル（workspace）	W カーネル	k	共同 logL_total（best）	ΔlogL_total vs DM	AICc	BIC
DM_RAZOR	none	20	-16927.763	0.0	33895.885	34010.811
EFT_BIN	none	21	-15590.552	1337.21	31223.501	31344.155
EFT_WEXP	exponential	21	-15668.83	1258.932	31380.057	31500.711
EFT_WYUK	yukawa	21	-15772.936	1154.827	31588.268	31708.922
EFT_WPOW	powerlaw_tail	21	-15633.321	1294.442	31309.038	31429.692

表 S1b｜クロージャと頑健性の指標（Strict）。

モデル（workspace）	クロージャ ΔlogL（true-perm）	負の対照 shuffle 後 ΔlogL	σ_int スキャン ΔlogL 範囲	R_min スキャン ΔlogL 範囲	cov-shrink スキャン ΔlogL 範囲
DM_RAZOR	126.678	22.725	—	—	—
EFT_BIN	231.611	14.984	459–1548	1243–1289	1337–1351
EFT_WEXP	171.977	6.04	408–1471	1169–1207	1259–1277
EFT_WYUK	179.808	14.688	380–1341	1065–1099	1155–1166
EFT_WPOW	280.513	6.672	457–1500	1203–1247	1294–1308

2.2 Fig S3：クロージャ強度（RC-only → GGL 予測）

クロージャ強度は ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ と定義される。RC-only 事後サンプル上で GGL を前向き予測し、「RC-bin→GGL-bin マッピングの置換」という負の対照と比較する。

図 S3｜クロージャ強度（大きいほどよい）：RC-only → GGL 予測における平均対数尤度の優位。

2.3 Fig S4：共同フィッティング主比較（RC+GGL）

共同フィッティングの優位は ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR) と定義される。同一データ、同一マッピング、ほぼ同一のパラメータ規模の下で、EFT 系列は有意に高い共同対数尤度を達成する。

図 S4｜共同フィッティング優位（大きいほどよい）：RC+GGL の best logL_total の、DM_RAZOR に対する相対値。

2.4 四文結論（直接引用可）

（1）SPARC 回転曲線 + KiDS-1000 弱レンズ効果の統一共同解析において、EFT 平均重力フレームワーク・モデルは厳密な対照プロトコルの下で DM_RAZOR を系統的に上回る：ΔlogL_total = 1155–1337（DM_RAZOR に対して）。

（2）RC→GGL クロージャ検定は、EFT の予測一貫性がより強いことを示す。ΔlogL_closure = 172–281 であるのに対し、DM_RAZOR は 127 である。さらに RC-bin→GGL-bin のグルーピングをランダムに打ち崩すと、クロージャ信号は 6–23 まで崩れ、この信号が偶然のフィッティングではなく正しいデータ横断マッピングに依存していることを示す。

（3）σ_int、R_min、共分散 shrinkage の系統的スキャンはいずれも、「EFT が DM_RAZOR を上回る」という符号と桁を変えておらず、この結論が一般的な系統的摂動に対して頑健であることを示している。

（4）付録 B（P1A）は、同一のクロージャプロトコルの下で DM ベースラインに「標準化され、かつ監査可能な」強化を施す。三つの単一パラメータ強化（SCAT/AC/FB）を保持し、さらに階層 c–M scatter + prior、単一パラメータ core 代理、レンズ側せん断較正 m（およびその組み合わせ DM_STD）を追加する。結果として、feedback/core 分岐のみがクロージャ強度に小幅な正味改善（122.21→129.45，ΔΔlogL_closure≈+7.25）をもたらし、その他の強化はクロージャ強度への寄与が有意でないか負であった。したがって、本文の主要結論は DM_RAZOR が弱すぎるという仮定に依存していない。

3 データと前処理

本研究では二種類の公開データを使用し、プロジェクト内の追跡可能なスクリプトによって、ダウンロード、検証（sha256）、前処理を完了した。モデル横断の公平比較を保証するため、すべてのワークスペース（EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR）は、完全に同一のデータ産物とビン分けマッピングを共有する。

3.1 回転曲線（RC，SPARC）

RC データは SPARC データベースの Rotmod_LTG（175 個の rotmod ファイル）に由来する。前処理後、本プロジェクトのモデリングに含めたサンプルは 104 銀河、計 2295 個の (r, V_obs) データ点であり、恒星質量などの規則に従って 20 個の RC-bin に分けた。各データ点は、半径 r（kpc）、観測速度 V_obs（km/s）、誤差 σ_obs、およびガス / 円盤 / バルジ成分速度（V_gas, V_disk, V_bul）を含む。

3.2 弱レンズ効果（GGL，KiDS-1000 / Brouwer+2021）

GGL データには、Brouwer ら（2021）が KiDS-1000 で提示した Fig.3 の等価面密度 ΔΣ(R)（4 個の恒星質量 bin、各 bin 15 個の R 点）を用い、同論文が提供する完全共分散を使用した。実装では、元の long-form 共分散を各 bin の 15×15 行列に再構成し、Stage-B 監査で次元と数値の妥当性を検証した。

3.3 RC-bin → GGL-bin マッピングと総サンプル数

GGL の 4 個の質量 bin と RC の 20 個の bin は固定マッピングで接続される。各 GGL-bin は 5 個の RC-bin に対応し、銀河数の重みによって RC-bin の寄与を加重平均する。このマッピングはすべてのモデルで不変であり、クロージャ検定と共同フィッティングの公平比較における中核制約である。最終的な共同データ点数は n_total = 2355（RC=2295，GGL=60）である。

4 モデルと統計手法

4.1 EFT と DM の最小数学仕様（監査可能 / 検定可能）

本節では、実装に直接対応する最小数学仕様を示す。

（a）回転曲線（RC）モデル

各 RC データ点 (r, V_obs, σ_obs) に対し、成分重ね合わせを用いる：V_mod²(r) = V_bar²(r) + V_extra²(r)。ここで V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r) である。本稿の主結果では Υ_d = Υ_b = 0.5 を採用する（SPARC の経験的推奨と一致し、不要な自由度を減らすうえでも有用である）。

（b）EFT 平均重力修正（EFT）

EFT の追加項は「平均速度二乗」の形でパラメータ化する：V_extra²(r) = V0_bin² · f(r/ℓ)。ここで V0_bin は各 RC-bin の振幅パラメータ（20 個）、ℓ は大域尺度（1 個）、f(x) は無次元カーネル形状関数である。本稿で比較するカーネル形状（いずれも追加の連続自由度を導入しない）は次のとおりである：

none: f(x)=x/(1+x)
exponential: f(x)=1−exp(−x)
yukawa: f(x)=1−exp(−x)·(1+0.5x)
powerlaw_tail: f(x)=1−(1+x)^(−1/2)
（任意対照）gaussian: f(x)=erf(x/√2)（主結論集合には含めない）

物理的動機（拡張）：EFT は、銀河尺度上の追加的な重力応答を、より微視的な作用が有限尺度で粗視化 / 尺度平均された後の有効応答として理解する。本稿では特定の微視的機構をあらかじめ仮定せず、最小で監査可能なパラメータ化を採用し、統一された統計プロトコルの下で制御された比較と検定を行う。

直感的理解のため、追加項は加速度形式で書くこともできる：a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ)。r≫ℓ では f→1、V_extra→V0_bin となり、外側領域で近似的に平坦な追加速度寄与を与える。r≪ℓ かつ f(x)≈x では、特徴的加速度尺度 a0,bin≈V0_bin²/ℓ（カーネル因子で O(1) 程度異なる）を導入でき、MOND 類似の内側-外側遷移スケールの直感を与える。

本稿で採用する離散カーネル族（none/exponential/yukawa/powerlaw_tail）は、異なる「立ち上がり勾配 / 遷移の速さ / 長距離尾部」に対する低次元 proxy と見なせる（例えば Yukawa-like な遮蔽 vs より長い尾部を持つ応答）。これは頑健性ストレステストのためであり、モデル空間を網羅するためではない。弱レンズ部分では、V_avg(r) から等価包絡質量と密度を構成し、それを投影して ΔΣ(R) を得る。この等価密度は、球対称・弱場マッピング仮定の下で、レンズポテンシャルに対する有効記述として理解すべきである（完全な詳細は付録 A に移した）。

上記のカーネル形状はいずれも x→∞ で f(x)→1（すなわち V_extra²→V0² の飽和）を満たし、x≪1 では線形または劣線形の増加を与える。例えば exponential: f≈x、yukawa: f≈0.5x、powerlaw_tail: f≈0.5x である。したがって、異なるカーネル形状は小半径での「立ち上がり勾配」、遷移の速さ、外側尾部に観測可能な差を生み、RC+GGL の共同解析とクロージャ検定で識別できる。

弱レンズ ΔΣ(R) の EFT 予測は、V_avg(r) から包絡質量と密度を逆算し、さらに投影積分によって得る：M_enc(r)=r·V_avg²(r)/G，ρ(r)=(1/4πr²)·dM_enc/dr，Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr，ΔΣ(R)=Σ̄(<R)−Σ(R)。数値実装には対数グリッドを用い、異常時には自適応的に細分化して、安定性と再現性を保証する。

（c）DM_RAZOR：NFW 冷たい暗黒物質ハロー・ベースライン

同時に、DM_RAZOR は、最小化され監査可能な NFW ベースライン（固定 c–M、scatter なし；断熱収縮 Adiabatic Contraction、feedback core、非球対称性、環境項を含まない）の代表にすぎないことを明記する。「strawman baseline」リスクを下げるため、本稿はこれらの効果が存在しないとは主張しない。むしろ、それらを低次元で監査可能な形で付録 B（P1A）のストレステストに取り込む。そこには c–M scatter の階層的処理、core 代理、レンズ側せん断較正 nuisance などが含まれる。

4.2 モデル台帳と公平比較（共有パラメータ = クロージャの定義）

主比較集合のパラメータ数は、DM_RAZOR が k=20、EFT 系列が k=21（追加の 1 個は global log ℓ）である。すべてのモデルは、同一 RC データ、同一 GGL データと共分散、同一 RC-bin→GGL-bin マッピング、同一重子項と単位変換を共有する。さらに、カーネル形状（none / exponential / yukawa / powerlaw_tail）は離散的選択であり、追加の連続パラメータを導入しない。これにより、「自由度が一つ多い」ことで優位を得ることを避けている。

4.3 Likelihood、事前分布、サンプラー

RC 尤度には対角ガウスを用いる：σ_eff² = σ_obs² + σ_int²。主結果では σ_int=5 km/s に固定し、Run-5 で σ_int をスキャンする。GGL 尤度には bin ごとの完全共分散ガウスを用いる：logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b)。共同目標は logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ) である。事前分布は主に物理的に実行可能な境界（log ℓ、log V0、log M200 の区間制約）として入る。自由 Υ と σ_int を有効にする場合は弱情報事前分布を用いる（実装と release 包設定を参照）。

サンプラーには適応的 block Metropolis ランダムウォークを用いる。各ステップではパラメータ空間のランダムな部分ブロックのみを更新し、高次元での受理率を高める。さらに、窓ごとの受理率に基づいてステップ幅を軽く適応させる（目標受理率は約 0.25）。主結果には quick モード（n_steps=800 などの設定）を採用し、各ワークスペースについて trace、残差、PPC 図を出力して、人手およびスクリプト監査に用いる。

4.4 クロージャ検定と負の対照（定義）

クロージャ検定（Run-2）は、GGL を再フィットせずに「RC-only 事後分布が GGL を予測できるか」を検査する。具体的には、RC-only 事後サンプル上で 4 個の GGL-bin の ΔΣ(R) を前向き生成し、完全共分散で logL_true を計算する。次に、RC-bin→GGL-bin のグループ・マッピングをランダム置換（permutation）して logL_perm を得る。クロージャ強度は ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩ と定義する。さらに Run-10 では、20 個の RC-bin をランダムに 4×5 へ再グループ化（shuffle）してクロージャを再計算し、クロージャ信号が正しいマッピングに依存しているかを検査する。

5 主要結果と解釈

5.1 共同フィッティング主結果（RC+GGL）

共同フィッティングの best logL_total と相対優位 ΔlogL_total（DM_RAZOR に対して）は、表 S1a と図 S4 に示す。主比較集合では EFT_BIN の共同優位が最大（ΔlogL_total=1337.210）であり、その他の EFT カーネル形状も有意な優位（1154.827–1294.442）を保つ。情報量規準（AICc/BIC）でも EFT 系列は DM_RAZOR を有意に上回っており、優位がパラメータ数の偏りによるものではないことを示している。

注：ΔlogL_total≈1337 の主な寄与は RC 項に由来する（joint 分解では ΔlogL_RC≈1065、約 80%）。これは N=2295 個の RC データ点に対して、各点あたり Δχ²≈0.90 程度の穏やかな改善が、対角ガウス尤度の下で自然に 10^3 桁の優位へ累積したものと理解できる。同時に、GGL とクロージャ検定は独立したデータセット横断の制約を与え、σ_int、R_min、cov‑shrink のストレステストでも順位は安定している（第 6 節と表 S1b を参照）。

5.2 クロージャ検定結果（RC-only → GGL）

クロージャ検定の主要量 ΔlogL_closure は表 S1b と図 S3 に示す。EFT 系列のクロージャ強度は 171.977–280.513 であり、DM_RAZOR の 126.678 を上回る。これは、追加のデータ横断自由度を一切認めない条件下で、EFT が RC データから得た事後サンプルが GGL データに対してより強い移行可能な予測能力を持つことを意味する。

負の対照は、クロージャ信号の物理的関連性をさらに支持する。RC-bin→GGL-bin のグルーピングをランダムに打ち崩すと、EFT のクロージャ強度は 6–15 まで低下する（カーネルによりわずかな差がある）のに対し、元のクロージャ強度は 172–281 に達していた。この「信号の崩壊」は、数値実装、単位エラー、共分散処理の不備による偽の優位を排除する。

図 R1｜負の対照：shuffle グルーピング後、クロージャ信号は有意に低下する（Tab_Z1 指標に基づく作図）。

5.3 結果の意味と限界

本研究の結論は、「本データセットと本プロトコルの下では、EFT 平均重力修正が検査対象の DM_RAZOR ベースラインを上回る」というものである。強調すべき点として、DM 側には最小 NFW ベースラインと固定 c(M) 関係のみを採用しており、core 化、非球対称性、環境項、より複雑な銀河-ハロー接続モデルなどは導入していない。したがって本稿はすべての DM モデル族を排除すると主張するものではない。むしろ、クロージャ検定を中心とする再現可能な対照ベースラインを提供し、「RC と GGL が同一のデータ横断パラメータとマッピングで一貫して説明できるか」を評価するためのものである。

この一般的な疑問に応えるため、われわれは独立した拡張工程 P1A（付録 B を参照）を完了した。RC-bin→GGL-bin の共有マッピングと監査フレームワークを変えずに、DM ベースラインに「標準化され、かつ監査可能な」強化を施すものである。三つの単一パラメータ強化（SCAT/AC/FB）に加えて、（i）階層 c–M scatter + mass–concentration prior（DM_HIER_CMSCAT）、（ii）単一パラメータ baryonic-feedback core 代理（DM_CORE1P）、（iii）弱レンズ側せん断較正 nuisance m（DM_RAZOR_M）を追加し、組み合わせモデル DM_STD も提示する。同時に EFT_BIN を対照参照として保持する。

• DM_RAZOR_SCAT（c–M scatter）—— halo-to-halo の濃度散らばりパラメータ σ_logc を導入し、「固定 c(M)」が DM の説明力を系統的に過小評価していないかを検査する。
• DM_RAZOR_AC（Adiabatic Contraction）—— 単一パラメータ α_AC により、「収縮なし ↔ 標準収縮」の間を連続的に補間し、重子による内側領域収縮傾向を最小コストで捉える。
• DM_RAZOR_FB（Feedback / core）—— core 尺度（例えば log r_core）で内側領域の core 化が回転曲線に与える抑制効果を記述し、弱レンズ尺度では NFW 近似を保つ。

P1A の定量 scoreboard は付録 B の表 B1 / 図 B1 に示す（Tab_S1_P1A_scoreboard から自動生成）。クロージャ指標では、DM_RAZOR_FB が小幅な正味改善（122.21→129.45，+7.25）を与える一方、その他の強化はクロージャ強度への寄与が有意でないか負である。共同フィッティング側では、階層 c–M scatter prior（DM_HIER_CMSCAT）または組み合わせモデル（DM_STD）を加えると joint logL は有意に改善し得るが、クロージャ強度の改善は伴わない。これは、主に増えているのが共同フィッティングの柔軟性であって、プローブ横断の移行可能性ではないことを示唆する。したがって本文の中核結論は、厳密な共有マッピングとクロージャ検定制約の下では、EFT のデータ横断一貫性の優位が、DM 側に「過度に弱いベースライン」を選んだことに由来するものではない、と理解すべきである。付録 B に対応する P1A 公開パッケージ（補足表図と full_fit_runpack）は、本文 full_fit_runpack と同一の Zenodo Concept DOI に追加ファイルとして統合される：https://doi.org/10.5281/zenodo.18526286。

6 頑健性と対照実験

6.1 σ_int スキャン（Run-5）

RC の内在散らばり σ_int について系統的スキャンを行い、各 σ_int の下で共同推論を繰り返し、DM_RAZOR に対する ΔlogL_total を計算した。各モデルのスキャン範囲内での ΔlogL_total の最小値 / 最大値は表 S1b に示す。

図 R2｜σ_int スキャン下での ΔlogL_total の範囲（大きいほどよい）。

6.2 R_min スキャン（Run-6）

中心領域データの系統誤差（例えば非円運動、分解能、重子モデリングの不十分さ）の影響を検査するため、RC に R_min 閾値の切り落としを適用し、共同推論を繰り返した。EFT 系列の優位は R_min スキャン下でも正のままで、かつ桁として安定している。

図 R3｜R_min スキャン下での ΔlogL_total の範囲（大きいほどよい）。

6.3 cov-shrink スキャン（Run-7）

GGL 共分散の不確実性を検査するため、各質量 bin の共分散行列に shrinkage：C_α=(1−α)C+α·diag(C) を適用し、α をスキャンした。結果は、EFT 系列の優位がこの処理に鈍感であることを示す。

図 R4｜cov-shrink スキャン下での ΔlogL_total の範囲（大きいほどよい）。

6.4 アブレーション階段（Run-8）

EFT_BIN 内部で入れ子型アブレーションを行った。極簡モデル（自由パラメータなし）から、少数の自由度だけを残すモデル、さらに完全な 20-bin 振幅 + 大域尺度へと進めた。AICc/BIC は、完全な EFT_BIN がデータ説明において有意に必要であることを示している。

図 R5｜EFT_BIN のアブレーション階段（AICc，小さいほどよい）。

6.5 留出予測（Run-9）

さらに leave-one-bin-out（LOO）検査を実行した。GGL の 4 個の質量 bin のうち毎回 1 個の bin を留出し、残りの bin（および全 RC）で再推論し、留出 bin 上でテスト対数尤度を評価する。集計指標は補足表 Tab_R3_leave_one_bin_out（Run-9 産物；第 8.2 節の主要産物リストにファイルパス・パターンを示す）に示す。EFT 系列は最悪の留出条件でも DM_RAZOR を明確に上回る。

図 R6｜LOO：留出 bin の対数尤度分布（Run-9 産物に由来）。

6.6 負の対照：RC-bin shuffle（Run-10）

Run-10 では 20 個の RC-bin をランダムに 4×5 へ再グループ化し、RC-only 事後分布を不変に保ったままクロージャを再計算した。結果として、元のマッピングと比べ、shuffle はクロージャの mean logL_true と ΔlogL_closure を有意に低下させる（表 S1b と図 R1 を参照）。これはクロージャ信号の解釈可能性をさらに支持する。

図 R7｜負の対照：shuffle マッピングによりクロージャ mean logL_true が明確に低下する（Run-10 産物に由来）。

7 追跡可能性と一貫性監査（Provenance）

本文で引用されるすべての数値は、公開アーカイブ内の厳密集計表と監査記録で項目ごとに追跡できる。本文の読みやすさを保つため、完全な追跡チェーン（tag リスト、監査表、checksum リスト、確認方法）は付録 A に移した。

8 再現性と Zenodo アーカイブ（Reproducibility & Archive）

データとコードの利用可能性声明：本稿で使用した SPARC 回転曲線データと KiDS-1000 弱レンズデータはいずれも公開データである。出版レベル報告書は Zenodo にアーカイブ済みであり（Concept DOI：https://doi.org/10.5281/zenodo.18526334）、完全再現パッケージも Zenodo にアーカイブ済みである（Concept DOI：https://doi.org/10.5281/zenodo.18526286）。詳細な実行手順、依存環境、アーカイブ一覧、ハッシュ検証情報は付録 A を参照。DM ベースライン標準化ストレステスト（P1A）の設計、実行タグ、出力は付録 B を参照。

同一の完全再現パッケージ Concept DOI（https://doi.org/10.5281/zenodo.18526286）の下で、用途に応じて二つの再現入口を提供する：
• P1（本文）full_fit_runpack：EFT vs DM_RAZOR の RC-only / closure / joint および頑健性スキャンを再現し、本文表 S1a/S1b と図 S3/S4 などの資産を生成する。
• P1A（付録 B）full_fit_runpack：DM ベースライン標準化ストレステスト（SCAT/AC/FB + 階層 c–M scatter prior + core1p + lensing m + DM_STD；EFT_BIN 対照を含む）を再現し、付録表 B1 と図 B1 を生成する。
P1A の補足表図と full_fit_runpack は追加ファイルとして同一 Concept DOI に統合し、アーカイブ入口を一つに保つ。

9 謝辞と声明

9.1 謝辞

公開データと文書を提供した SPARC チームおよび KiDS-1000 チームに感謝する。また、本プロジェクトの再構築と監査プロセスに参加した関係者に感謝する。

9.2 著者貢献

Guanglin Tuは、本研究の概念提案、方案設計、エンジニアリング実装、データ整理、形式解析、再現フロー実装と監査、ならびに論文執筆を担当した。

9.3 資金源

著者Guanglin Tuの自己資金による（外部助成なし / 基金番号なし）。

9.4 競合利益

著者Guanglin Tuは「EFT ワーキンググループ、深圳市エネルギー・フィラメント科学研究有限公司（中国）」と関係を有する。その他の競合利益はない。

9.5 AI 支援

OpenAI GPT-5.2 Pro と Gemini 3 Pro を、言語の推敲、構造化編集、再現フローの整理に使用した。データ、結果、図表、コードの生成または改変には使用していない。引用の生成にも使用していない。著者は全文の内容と引用の正確性について全責任を負う。

10 参考文献

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
Wright, C. O., & Brainerd, T. G. (2000). Gravitational Lensing by Navarro–Frenk–White Halos. The Astrophysical Journal, 534, 34–40.
Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493. DOI: https://doi.org/10.1086/304888
Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374. DOI: https://doi.org/10.1093/mnras/stu742
Blumenthal, G. R., Faber, S. M., Flores, R., & Primack, J. R. (1986). Contraction of dark matter galactic halos due to baryonic infall. Astrophysical Journal, 301, 27. DOI: https://doi.org/10.1086/163867
Di Cintio, A., Brook, C. B., Dutton, A. A., et al. (2014). A mass-dependent density profile for dark matter haloes including the influence of galaxy formation. Monthly Notices of the Royal Astronomical Society, 441, 2986–2995. DOI: https://doi.org/10.1093/mnras/stu729
Read, J. I., Agertz, O., & Collins, M. L. M. (2016). Dark matter cores all the way down. Monthly Notices of the Royal Astronomical Society, 459, 2573–2590. DOI: https://doi.org/10.1093/mnras/stw713
エネルギー・フィラメント理論. Zenodo（オープンサイエンス・リポジトリ）DOI: https://doi.org/10.5281/zenodo.18517411

付録 A：追跡可能性と再現性の詳細

本付録は、長期アーカイブのための追跡可能性と再現性に関する情報（実行タグ、監査結果、アーカイブ一覧、照合要点など）をまとめ、読者が必要に応じて確認・再現できるようにする。

A.1 追跡可能性と監査の詳細

長期的な追跡可能性を保証するため、本プロジェクトでは各実行と出力にタイムスタンプ tag を付け、過去の産物を上書きせず保持した。本稿で引用する中核数値は厳密集計（compile_tag=20260205_035929）に由来し、次の一貫性監査を通過している：

• すべての段階表には run_tag と stage tag が付いている。厳密集計スクリプトは report/tables から「完全で一貫した」canonical 表ソースを選ぶ。

• Tab_Z1_master_summary と Tab_Z2_conclusion_highlights の数値を、選択された canonical 表と項目ごとに照合した。

• PDF 生成時に「引用される表 / 図の tag」に対してラベル監査を行い、古い産物の混用がないことを保証した。

主要タグ（すべての中間産物の位置特定に使用）：run_tag=20260204_122515；closure_tag=20260204_124721；joint_tag=20260204_152714；sigma_sweep_tag=20260204_161852；rmin_sweep_tag=20260204_195247；covshrink_tag=20260204_203219；ablation_tag=20260204_214642；LOO_tag=20260204_224827；negctrl_tag=20260204_234528；strict_compile_tag=20260205_035929；release_tag=20260205_112442。

一貫性監査結果：Tab_AUDIT_checks_strict は pass=9, fail=0, skip=0 を示す（詳細は release 包を参照）。

A.2 再現性の実行手順とアーカイブ一覧

本研究は、「出版レベル報告書 + 表図補足資料 + 完全に再実行可能な runpack」という再現体系を採用している。読者は Tables & Figures Supplement を直接参照して、本文で引用されるすべての表 / 図資産を照合できる。数値と監査チェーンをゼロから再現する必要がある場合は、full_fit_runpack を用いてデータをダウンロードし、全フローを再実行できる。実行完了後、パッケージ内の reference 表との照合スクリプトで表の数値一貫性を検証できる。

A.2.1 再現 Quickstart（RUN_FULL，Windows PowerShell）

本節では、より短い再現経路（Windows PowerShell）を示す。迅速な確認には、Tables & Figures Supplement を直接参照し、本文で引用される表と図を項目ごとに照合することを推奨する。端から端まで再現し、すべての表 / 図と監査産物を生成する必要がある場合は、full_fit_runpack を使用し、パッケージ内 README/ONE_PAGE_REPRO_CHECKLIST に従って verify_checksums.ps1 と RUN_FULL.ps1 を実行する（Mode=full を推奨）。

Zenodo アーカイブ入口（Concept DOI）：https://doi.org/10.5281/zenodo.18526286。
本文主チェーンタグ：run_tag=20260204_122515，strict compile_tag=20260205_035929, release_tag：20260205_112442。

A.2.2 アーカイブ資料と主要照合点（Packages & checks）

Zenodo アーカイブは、次の 3 種類の相補的資料を提供する：（1）出版レベル報告書（本文，v1.1；付録 B：P1A DM ベースライン標準化ストレステストを含む）；（2）Tables & Figures Supplement（表と図の補足資料：本文で引用されるすべての表 / 図資産を網羅し、P1 と P1A にそれぞれ対応）；（3）full_fit_runpack（完全再現パッケージ：データをゼロからダウンロードし、全フローを再実行。P1 と P1A にそれぞれ対応）。このうち（1）–（2）は迅速な読解と独立確認を支援し、（3）は端から端までの完全再現能力を提供する。

資料カテゴリ	ファイル名（例）	用途と位置づけ（読者にはこの順序での使用を推奨）
出版レベル報告書（中国語・英語）	P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf	Zenodo にアーカイブされた完全報告書。本文は主結論と頑健性監査を示し、付録 B は P1A（DM ベースライン標準化ストレステスト）を示す。
Tables & Figures Supplement（P1）	P1_RC_GGL_supplement_figs_tables_V1_1.zip	本文で引用されるすべての表（CSV）と図（PNG）。生成スクリプトとタグファイルを含む。
Tables & Figures Supplement（P1A）	P1A_supplement_figs_tables_v1.zip	付録 B（P1A）で引用されるすべての表と図。Tab_S1_P1A_scoreboard と Fig_S1_P1A_scoreboard を含む。
full_fit_runpack（P1）	P1_RC_GGL_full_fit_runpack_v1_1.zip	エンドツーエンドの完全再現：データをゼロからダウンロードし、RC-only / closure / joint と頑健性スキャンを再実行する。
full_fit_runpack（P1A）	P1A_RC_GGL_full_fit_runpack_v1.zip	エンドツーエンドの完全再現（付録 B）：DM 7+1 + DM_STD（EFT_BIN 対照を含む）を再実行し、付録資産を生成する。パッケージには表値一貫性を検証する reference 表照合スクリプトを含む。

引用推奨：本文または付属再現資料を引用する際は、Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334) を明記すること。

再現後に出現し、照合可能であるべき主要産物は次のとおり：

report/tables/Tab_D_closure_summary__20260204_122515__*.csv（クロージャサマリー）
report/tables/Tab_F_joint_summary__20260204_122515__*.csv（共同フィッティング・サマリー）
report/tables/Tab_G_joint_sigma_sweep__20260204_122515__*.csv（σ_int スキャン）
report/tables/Tab_H_joint_rmin_sweep__20260204_122515__*.csv（R_min スキャン）
report/tables/Tab_I_joint_covshrink_sweep__20260204_122515__*.csv（cov-shrink スキャン）
report/tables/Tab_R2_ablation_ladder__20260204_122515__*.csv（アブレーション）
report/tables/Tab_R3_leave_one_bin_out__20260204_122515__*.csv（LOO）
report/tables/Tab_R4_negctrl_rcbin_shuffle__20260204_122515__*.csv（負の対照）
report/final/Tab_Z1_master_summary__20260204_122515__20260205_035929.csv（Strict 主表；表 S1a/S1b および本文数値に対応）
report/final/P1_RC_GGL_final_bundle__20260204_122515__20260205_035929.pdf（公開レベル PDF バンドル；迅速な閲覧と引用に使用可能）

付録 B：P1A—DM ベースライン標準化ストレステスト（DM 7+1 + DM_STD；EFT 対照を含む）

本付録は、本文のクロージャプロトコルと一致した「DM ベースライン標準化ストレステスト」拡張工程（P1A）を記録する。その位置づけは、大量の自由度を導入せず、RC-bin→GGL-bin 共有マッピングと監査フレームワークを変えない前提で、本文で用いた最小 DM_RAZOR（NFW + 固定 c–M、scatter なし / contraction なし / core なし）を、天体物理の実務により近く、一般的な疑義にも耐えやすい DM ベースライン集合へ引き上げることである。P1A は、以前の三分岐ストレステストを覆い、かつその上位集合となる。すなわち SCAT/AC/FB を保持しつつ、階層 c–M scatter + prior、単一パラメータ core 代理、レンズ側せん断較正 nuisance m を追加し、組み合わせモデル DM_STD を提供する。同時に EFT_BIN を対照参照として保持する。

補足説明：付録 B（P1A）におけるクロージャ強度などの数値は、より高い Monte Carlo 予算（例えば ndraw=400, nperm=24）を用いている。これは、完全な EFT カーネル族をカバーするために本文で用いた quick 予算（例えば ndraw=60, nperm=12）とは異なる。そのため絶対値には O(10) 程度のサンプリングドリフトがあり得る。ただし、同一予算 / 同一表内のモデル間比較は公平であり、優位の符号と桁は異なる予算でも安定している。

B.1 目的と位置づけ（Why P1A, and why as an Appendix）

P1A は、すべての ΛCDM ハローモデリング可能性（例えば非球対称性、環境依存性、複雑な銀河-ハロー接続、高次元 baryon physics）を尽くすことを目指していない。むしろ P1A は「低次元、監査可能、再現可能」という原則を採用する。各強化モジュールは ≤1 個の主要な有効パラメータだけを導入し、本稿の三つのハード制約を引き続き受ける：
（i）パラメータ台帳：新規パラメータは明示的に記帳し、情報量規準（AICc/BIC）とともに報告しなければならない。
（ii）共有マッピング：同一の RC-bin→GGL-bin グループ・マッピングを引き続き使用し、単一データセットのためだけに「マッピングを調整」することは認めない。
（iii）クロージャ検定：いかなる強化も、単に RC-only フィッティングを良くするだけでなく、RC→GGL の移行予測に実質的な利得を示さなければならない。

B.2 DM 7+1 + DM_STD：モジュール定義、パラメータ、共同事後への入り方

P1A は独立した runpack として、8 個の DM ワークスペース（DM 7+1）と 1 個の EFT 対照を提供する。DM_RAZOR をベースラインとして、三つの legacy 単一パラメータ強化（DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB）を構成し、さらに三つのより標準的な防御的モジュール（DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M）を追加したうえで、組み合わせモデル DM_STD を与える。これらのモジュールの共通目的は、次元をできるだけ増やさずに、最も一般的な三種類の疑義をカバーすることである：（a）c–M 関係の散らばりと事前分布が階層モデルにどう入るか、（b）baryonic feedback の主効果を一つの core 代理パラメータで表せるか、（c）レンズ側の主要な系統誤差が物理信号と誤認される可能性があるか。

Workspace	dm_model	追加パラメータ（≤1）	物理的動機（中核）	実装原則（監査フレンドリー）
DM_RAZOR	NFW (fixed c–M, no scatter)	—	最小化され監査可能な ΛCDM ハロー・ベースライン。EFT との厳密対照に用いる。	共有マッピングを固定。パラメータ台帳は厳格。baseline として相対比較のみに用いる。
DM_RAZOR_SCAT	NFW + c–M scatter（legacy）	σ_logc	c–M 関係には散らばりがある。一つのパラメータの log-normal scatter で近似する。	新規パラメータ ≤1。共有マッピングを維持し、クロージャ利得を受け入れ基準とする。
DM_RAZOR_AC	NFW + Adiabatic Contraction（legacy）	α_AC	重子の落ち込みはハローの断熱収縮を引き起こし得る。一つの強度パラメータで近似する。	新規パラメータ ≤1。マッピングは変更せず、AICc/BIC の変化とクロージャ利得を報告する。
DM_RAZOR_FB	NFW + feedback core（legacy）	log r_core	フィードバックは内側領域に core を形成し得る。一つの core 尺度パラメータで近似する。	新規パラメータ ≤1。クロージャ / 負の対照は同一口径。RC-only の改善だけを唯一目標としない。
DM_HIER_CMSCAT	Hierarchical c–M scatter + prior	σ_logc（hier）	より標準的な階層化 c_i∼logN(c(M_i),σ_logc)。RC と GGL の共同事後に同時に影響する。	明示的事前分布。latent c_i を周辺化。低次元で監査可能なまま保つ。
DM_CORE1P	1‑parameter core proxy (coreNFW/DC14‑inspired)	log r_core	一つの core 代理パラメータで baryonic feedback の主効果を表し、高次元の星形成詳細を避ける。	標準文献を参照。新規パラメータ ≤1。クロージャ検定と結びつける。
DM_RAZOR_M	NFW + lensing shear‑calibration nuisance	m_shear（GGL）	弱レンズ側の主要な系統誤差を有効パラメータとして吸収し、「系統誤差を物理と見誤る」リスクを下げる。	nuisance を明確に記帳。RC への逆方向の影響は認めない。結果はクロージャの頑健性を主とする。
DM_STD	Standardized DM baseline (HIER_CMSCAT + CORE1P + m)	σ_logc + log r_core (+ m_shear)	最も一般的な三種類の疑義を、なお低次元の標準ベースラインへ同時に取り込む。	パラメータ台帳と情報量規準を併記。クロージャを主指標とし、最強の DM 防御対照として用いる。

説明：上記のパラメータ名はエンジニアリング実装に従う（例えば σ_logc、α_AC、log r_core、m_shear）。P1A の設計重点は「DM ベースラインを少し強くしつつ、それでも監査可能に保つ」ことであり、DM 側を制御不能な高次元フィッターへ変えることではない。特に DM_HIER_CMSCAT は c–M scatter を階層的に導入する。各 halo の濃度 c_i に、c(M_i) の周りの log-normal 散らばりを設定し、大域 σ_logc と c(M) prior によって制約する。この階層構造は、RC と GGL の共同事後に同時に影響する。

B.3 本文と一致した統計プロトコルと産物口径

P1A は本文のすべてのデータ産物、共有マッピング、監査フレームワークを再利用し、実行順序と産物口径を一致させている：
（1）Run‑1：RC-only 推論（posterior_samples.npz と metrics.json を出力）。
（2）Run‑2：RC→GGL クロージャ検定（closure_summary.json と permuted baseline を出力）。
（3）Run‑3：RC+GGL 共同フィッティング（joint_summary.json を出力）。
引用されるすべての数値は自動集計表（Tab_S1_P1A_scoreboard）に由来し、P1A full_fit_runpack を全フローで再実行した後、内蔵の reference 表照合スクリプトで検証できる。

B.4 主要結果、表図入口、アーカイブ計画（同 DOI）

本節では P1A の中核的な定量結論を示す。表 B1 は RC-only、RC→GGL クロージャ、RC+GGL 共同フィッティングの主要指標を要約する（括弧内は DM_RAZOR baseline に対する差）。クロージャ強度は ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ と定義される（大きいほどよい）。図 B1 は同じ scoreboard を可視化したものである。結論の要点は次のとおりである：
• legacy 三分岐のうち、DM_RAZOR_FB（feedback/core）のみがクロージャ強度に小幅な正味改善をもたらす：122.21→129.45（+7.25）。SCAT と AC には正味改善がない。
• 追加された DM_HIER_CMSCAT と DM_RAZOR_M はクロージャ強度への影響がごく小さく（~0）、DM_CORE1P も有意な正味改善を示さない。
• 組み合わせモデル DM_STD は joint logL を有意に改善し得る（共同フィッティング最適により近づく）が、クロージャ強度はむしろ低下する。これは、その主な改善がプローブ横断の移行可能性ではなく、共同フィッティングの柔軟性に由来することを示唆する。
• EFT_BIN は対照として、クロージャ強度と共同フィッティングの双方で明確な優位を保つ。したがって、本文の主要結論は「より強い DM ベースライン + レンズ nuisance」の導入に対しても頑健である。

本文の主比較と直接照合しやすいよう、本文 Tab S1a–S1b は EFT 系列と DM_RAZOR の厳密対照結果を要約している。EFT モデルは共同フィッティングで DM_RAZOR に対して ΔlogL_total≈1155–1337 の改善を示し、クロージャ検定では ΔlogL_closure=172–281 に達する。P1A は DM 側を「より難しい対照」にするだけであり、その役割は「strawman baseline / systematics-as-physics」という疑義点を弱めることであって、本文の主比較を置き換えることではない。

表 B1｜P1A scoreboard（大きいほどよい；括弧内は DM_RAZOR baseline に対する差）。

モデル分岐（workspace）	Δk	RC-only best logL_RC (Δ)	クロージャ強度 ΔlogL_closure (Δ)	Joint best logL_total (Δ)
DM_RAZOR	0	-15702.654 (+0.000)	122.205 (+0.000)	-27347.068 (+0.000)
DM_RAZOR_SCAT	1	-15702.294 (+0.361)	121.236 (-0.969)	-23153.311 (+4193.758)
DM_RAZOR_AC	1	-15703.689 (-1.035)	121.531 (-0.674)	-23982.557 (+3364.511)
DM_RAZOR_FB	1	-15496.046 (+206.609)	129.454 (+7.249)	-27478.531 (-131.463)
DM_HIER_CMSCAT	1	-15702.644 (+0.010)	121.978 (-0.227)	-23153.160 (+4193.908)
DM_CORE1P	1	-15723.158 (-20.504)	122.056 (-0.149)	-27336.258 (+10.810)
DM_RAZOR_M	0 (+m)	-15702.654 (+0.000)	122.205 (+0.000)	-27340.451 (+6.617)
DM_STD	2 (+m)	-15832.203 (-129.549)	105.690 (-16.515)	-22984.445 (+4362.623)
EFT_BIN	1	-14631.537 (+1071.117)	204.620 (+82.415)	-19001.142 (+8345.926)

図 B1｜P1A scoreboard：baseline に対する closure と joint の ΔlogL（大きいほどよい）。

本付録に対応する完了済み実行タグの一例は次のとおりである（P1A の中間産物と表図の位置特定に使用）：
P1A run_tag = 20260213_151233；P1A closure_tag = 20260213_161731；P1A joint_tag = 20260213_195428。

B.5 推奨引用方式（Appendix citation note）

読者が本文の主要結論とは別に「DM ベースライン標準化ストレステスト」を引用する必要がある場合は、本文の主要結論を引用するとともに、次の注記を添えることを推奨する：‘See Appendix B (P1A) for standardized DM baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.’