← 実験

P1_RC_GGL:銀河力学と弱重力レンズ効果の厳密なクロージャ検定(回転曲線 + GGL)

EFT 平均重力フレームワーク vs. 冷たい暗黒物質(DM)の最小 NFW ベースライン

著者:Guanglin Tu
メール:riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
所属:EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd.(中国)
バージョン:v1.1 | 日付:2026-02-14

プレプリント(査読前)|本版は公開配布と再現可能性のためのものであり、学術誌に最終掲載された版を表すものではない。

ライセンス:報告書(CC BY-NC-ND 4.0);完全再現パッケージ(CC BY 4.0)。

出版品質報告書(Concept DOI):https://doi.org/10.5281/zenodo.18526334 完全再現パッケージ(Concept DOI):https://doi.org/10.5281/zenodo.18526286

0 エグゼクティブ・サマリー

本報告書は、Zenodo に寄託された出版品質のアーカイブ版である。データ、モデル台帳、公平比較、クロージャ検定、再現可能性資料を一体化した、監査可能なチェーンを提供する。付録 B(P1A)はロバスト性補足として位置づけられ、「より標準的な DM ベースライン + 1 つの主要なレンズ系統誤差」を用いたストレステストに焦点を当て、より現実的な DM モデリングとレンズ系統誤差処理に対して本文の主要結論がどれだけ敏感かを評価する。

主要結論(そのまま引用可能な 4 文;第 2.4 節参照):

(1) 回転曲線(RC)フィッティングでは、EFT ファミリーはすべてのカーネル/事前分布の組合せで DM_RAZOR を大きく上回る。典型的な改善は Δlog𝓛_RC ≈ 10^3 である(表 S1a 参照)。
(2) RC→GGL クロージャ検定では、EFT はより強いクロスプローブ移行可能性を示す。クロージャ強度 Δlog𝓛_closure(True−Perm)は DM_RAZOR より有意に高く、その差は共分散 shrinkage、R_min、σ_int の各スキャンに対して頑健である(図 S3 および表 S1b 参照)。
(3) 結合フィット(RC+GGL)でも、EFT は安定した優位を保つ。共有マッピングを破壊する負の対照ではこの優位が崩れるため、「平均重力効果」は偶然のフィットではなく共有マッピングに由来する、という解釈を支持する(図 S4 参照)。
(4) 付録 B(P1A)は、次元数を大幅に増やすことなく、より標準的な DM ベースライン・モジュールと主要なレンズ系統誤差 nuisance によって DM 側をストレステストする。これらの拡張は EFT のクロージャ優位を消さない(表 B1 および図 B1 参照)。

データおよびコードの入手先:報告書 Concept DOI 10.5281/zenodo.18526334;完全再現パッケージ Concept DOI 10.5281/zenodo.18526286。付録 B(P1A)に対応するタグは run_tag=20260213_151233、closure_tag=20260213_161731、joint_tag=20260213_195428 である。

1 要旨

本研究では、同一データと同一統計プロトコルの下で、2 つの理論的枠組みを再現可能な形で定量比較する。すなわち、エネルギー・フィラメント理論(Energy Filament Theory, EFT;通常の effective field theory の略称とは異なる)が提案する「平均重力補正」モデルと、冷たい暗黒物質(DM)の NFW ハロー・ベースラインモデル(DM_RAZOR)である。DM_RAZOR は、固定 c–M 関係をもつ NFW ハロー(halo-to-halo scatter なし)として意図的に「最小 DM ベースライン」に選ばれ、監査可能かつ再現可能な対照として機能する。また、本稿では EFT を、微視的第一原理から導出するのではなく、統一された統計プロトコルの下で検定するための現象論的・MOND 類似の有効場/有効応答パラメータ化として扱う点も強調しておく。

データは、均一に前処理・ビニングされた SPARC 回転曲線(RC)由来の 2,295 個の速度データ点(104 銀河、20 RC bin)と、KiDS-1000 の銀河—銀河弱レンズ(GGL)における過剰表面密度 ΔΣ(R)(4 つの恒星質量 bin × 各 bin 15 個の R 点、合計 60 点、完全共分散を使用)から構成される。

我々は順に、RC-only 推論、RC→GGL クロージャ検定、GGL-only 推論、結合 RC+GGL 推論を実行し、一貫性監査によって引用されるすべての数値が追跡可能であることを確認する。厳密なパラメータ台帳と共有マッピング制約(DM:20 個の log M200_bin パラメータ;EFT:20 個の log V0_bin パラメータ + 1 個のグローバル log ℓ)の下で、EFT ファミリーは結合フィットにおいて DM_RAZOR を大きく上回る:DM_RAZOR に対する ΔlogL_total = 1155–1337。より重要なのは、クロージャ検定が、RC posterior が GGL に対して非自明な予測力をもつことを示す点である。EFT のクロージャ強度は ΔlogL_closure = 172–281 で、DM_RAZOR の 127 より高い。RC-bin→GGL-bin のグループ化をランダムにシャッフルすると、クロージャ信号は 6–23 へ崩れ、この信号が統計的偶然や実装アーティファクトではないことを確認する。σ_int、R_min、共分散 shrinkage の系統的スキャン全体で、EFT の相対的優位は正であり、規模も安定している。「DM ベースラインが弱すぎる」あるいは「系統誤差を物理と取り違えている」という一般的懸念に対応するため、付録 B(P1A)は、階層的 c–M scatter + prior、1 パラメータ core proxy、レンズ m、結合 DM_STD モデルを含む、より標準的でありながら低次元かつ監査可能な DM ベースライン・ストレステストを提供する。同じクロージャ・プロトコルの下で、これらの拡張は EFT のクロージャ優位を消さない(表 B1/図 B1 参照)。

キーワード:回転曲線;銀河—銀河弱レンズ;クロージャ検定;EFT;冷たい暗黒物質;ベイズ推論

2 序論と結果概観

回転曲線(RC)と銀河—銀河弱レンズ(GGL)は、相補的な 2 種類の重力プローブである。RC は円盤面内の力学ポテンシャルと半径方向加速度関係(RAR)を制約し、GGL は射影質量分布とハロー・スケールの重力応答を測定する。どの候補理論にとっても重要なのは、2 つのデータセットを別々にフィットできるかどうかではなく、同一のクロスデータ・マッピングと共有制約の下で一貫して説明できるかどうかである。

したがって本稿は、「クロージャ検定」を中核的な統計プロトコルとする。まず RC-only posterior を用いて GGL を前向きに予測し、次に RC-bin→GGL-bin マッピングを置換/シャッフルした負の対照と比較する。これにより、クロスデータ予測の移行可能性を評価し、実装バイアスや偶然のフィッティングによる偽信号を排除する。

理論的位置づけと範囲:本稿は、EFT(Energy Filament Theory)の微視的第一原理からの導出や、相対論的に完全な定式化を提示しようとするものではない。その代わり、EFT を、カーネル f(x) とグローバル尺度 ℓ によって記述される低次元・MOND 類似の有効場/有効応答パラメータ化として扱い、厳密なパラメータ台帳の下で RC→GGL クロージャ検定を通じて、クロスデータ一貫性と移行予測力を検定する。

研究計画と範囲声明:本稿は、継続中の P シリーズ観測検索プログラムの一部である。既存の銀河スケール・データにおいて、我々は 2 種類の可能な有効背景寄与を探す:(i)粗視化された平均重力応答で記述できる「平均重力 floor」、および(ii)微視的過程の揺らぎに関連する「確率的/ノイズ floor」である。本稿(P1)では前者のみに焦点を当てる。微視的生成機構についていかなる仮説も導入せず、RC→GGL クロージャ検定によって平均重力 floor の観測的兆候を検索し、統一された対照プロトコルの下で監査可能な DM ベースラインと比較する。ヒューリスティックな物理像として、短寿命の自由度が存在するなら、その崩壊/対消滅は静止質量を他の自由度が運ぶエネルギー運動量へ変換し、有効レベルでは「平均寄与 + 揺らぎ寄与」という分解に自然に対応しうる。ただし本稿は、この微視的像を定量的にモデル化しない。

過剰解釈を避けるため、本稿の範囲境界は次のとおりである:
• 本稿が行うこと:厳密なパラメータ台帳と共有マッピング制約の下で、クロージャ検定によりクロスデータ予測移行可能性を測定し、EFT 平均重力応答と DM ベースラインを再現可能に比較する。
• 本稿が行わないこと:微視的生成機構、存在量/寿命、宇宙論的制約について議論しない。「ノイズ floor」に対応する確率項をモデル化しない。
• 本稿が主張しないこと:暗黒物質を覆すことを目的としない。P1 は「floor」が存在するかどうかについて最終判決を下すものではなく、ここで選んだ頑健な測定領域内では、平均重力応答を含むモデルをデータが支持する、という段階的証拠を報告する。

同時に、DM_RAZOR は最小かつ監査可能な NFW ベースライン(固定 c–M、scatter なし;断熱収縮、feedback core、非球対称性、環境項なし)を表すにすぎないことを明確にする。したがって本文の主要結論は、厳密には次の主張に限定される:最小ベースラインと厳密なパラメータ台帳/マッピング制約の下で、EFT はより強いクロスデータ一貫性を示す。より標準的な ΛCDM ベースラインと主要なレンズ系統誤差モデリングが結論を大きく変えるのではないか、という一般的な問いに答えるため、我々は、より標準的でありながら低次元かつ監査可能な DM 拡張と、レンズ側 nuisance を付録 B(P1A:DM ベースライン標準化ストレステスト)にまとめ、本文とまったく同じ共有マッピングおよびクロージャ検定プロトコルを保持する(表 B1/図 B1 参照)。

2.1 Tab S1a–S1b:主要指標サマリー(Strict)

表 S1a は、結合フィット(RC+GGL)の主要比較指標、すなわち logL、ΔlogL、AICc、BIC を示す。表 S1b は、クロージャ検定とロバスト性スキャンの指標、すなわち closure、shuffle 負の対照、σ_int / R_min / cov-shrink スキャン範囲を示す。すべての値は厳密なマスター・サマリー表 Tab_Z1_master_summary に由来し、リリース・アーカイブ・パッケージ内で項目ごとに追跡できる。

表 S1a|結合フィット主要比較指標(RC+GGL,Strict)。

モデル(workspace)

W カーネル

k

結合 logL_total(best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

表 S1b|クロージャとロバスト性指標(Strict)。

モデル(workspace)

クロージャ ΔlogL(true-perm)

負の対照 shuffle 後 ΔlogL

σ_int スキャン ΔlogL 範囲

R_min スキャン ΔlogL 範囲

cov-shrink スキャン ΔlogL 範囲

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308


2.2 Fig. S3:クロージャ強度(RC-only → 予測 GGL)

クロージャ強度は ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ と定義される。RC-only posterior サンプル上で GGL を前向き予測し、RC-bin→GGL-bin マッピングを置換した負の対照と比較する。

図 S3|クロージャ強度(大きいほど良い):RC-only → GGL 予測の平均対数尤度優位。


2.3 Fig. S4:結合フィットの主要比較(RC+GGL)

結合フィット優位は ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR) と定義される。同じデータ、同じマッピング、ほぼ同じパラメータ規模の下で、EFT ファミリーは有意に高い結合対数尤度を達成する。

図 S4|結合フィット優位(大きいほど良い):DM_RAZOR に対する RC+GGL の best logL_total。


2.4 4 つの結論(直接引用可能)

(1) SPARC 回転曲線 + KiDS-1000 弱レンズの統一結合解析において、EFT 平均重力フレームワーク・モデルは、厳密な対照プロトコルの下で DM_RAZOR を体系的に上回る:DM_RAZOR に対する ΔlogL_total = 1155–1337。

(2) RC→GGL クロージャ検定は、EFT の予測一貫性がより強いことを示す:ΔlogL_closure = 172–281 であり、DM_RAZOR は 127 である。RC-bin→GGL-bin グループ化をランダムにシャッフルすると、クロージャ信号は 6–23 に崩れるため、この信号は偶然のフィットではなく、正しいクロスデータ・マッピングに依存していることが示される。

(3) σ_int、R_min、共分散 shrinkage の系統的スキャンは、「EFT が DM_RAZOR を上回る」という符号と規模を変えない。したがって、この結論は一般的な系統的摂動に対して頑健である。

(4) 同じクロージャ・プロトコルの下で、付録 B(P1A)は DM ベースラインを「標準化され、監査可能」な形で強化する。3 つの 1 パラメータ拡張(SCAT/AC/FB)を保持し、階層的 c–M scatter + prior、1 パラメータ core proxy、レンズ側 shear-calibration m(および結合 DM_STD モデル)を追加する。結果は、feedback/core 分岐のみがクロージャ強度に小さな純改善(122.21→129.45, ΔΔlogL_closure≈+7.25)をもたらし、他の拡張はクロージャ強度に対して無視できるか負の寄与であることを示す。したがって主要結論は、DM_RAZOR が過度に弱いベースラインであることに依存しない。

3 データと前処理

本研究は 2 種類の公開データセットを用いる。エンジニアリング・ワークフロー内で、ダウンロード、チェックサム検証(sha256)、前処理は追跡可能なスクリプトによって完了される。モデル間の公平比較を保証するため、すべてのワークスペース(EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR)は、まったく同じデータ産物と bin マッピングを共有する。


3.1 回転曲線(RC,SPARC)

RC データは、SPARC データベースの Rotmod_LTG ファイル(175 個の rotmod ファイル)に由来する。前処理後、本プロジェクトでモデル化するサンプルは 104 銀河、2,295 個の (r, V_obs) データ点からなり、恒星質量などの基準に従って 20 個の RC bin に分割される。各データ点には、半径 r(kpc)、観測速度 V_obs(km/s)、観測誤差 σ_obs、およびガス/円盤/バルジ成分速度(V_gas, V_disk, V_bul)が含まれる。


3.2 弱レンズ(GGL,KiDS-1000 / Brouwer+2021)

GGL データは、KiDS-1000 に基づく Brouwer ら(2021)の Fig. 3 の過剰表面密度 ΔΣ(R)(4 つの恒星質量 bin、各 bin 15 個の R 点)と、提供された完全共分散を用いる。エンジニアリング・ワークフローでは、元の long-form 共分散を各 bin の 15×15 行列として再構成し、Stage-B 監査で次元と数値の妥当性を確認する。


3.3 RC-bin → GGL-bin マッピングと総サンプル数

4 つの GGL 質量 bin と 20 個の RC bin は固定マッピングによって接続される。各 GGL bin は 5 個の RC bin に対応し、RC-bin の寄与は銀河数で重み付け平均される。このマッピングはすべてのモデルで固定され、クロージャ検定と結合フィットにおける公平比較の中核制約である。最終的な結合データ点数は n_total = 2355(RC=2295, GGL=60)である。

4 モデルと統計手法


4.1 EFT と DM の最小数学仕様(監査可能/検定可能)

本節では、実装に直接対応する最小数学仕様を示す。

(a) 回転曲線(RC)モデル

各 RC データ点 (r, V_obs, σ_obs) に対して、成分重ね合わせ V_mod²(r) = V_bar²(r) + V_extra²(r) を用いる。ここで V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r) である。本稿の主結果では Υ_d = Υ_b = 0.5 を採用する。これは SPARC の経験的推奨と整合し、不要な自由度を減らすうえでも有用である。

(b) EFT 平均重力補正(EFT)

EFT の追加項は、「平均速度二乗」の形でパラメータ化される:V_extra²(r) = V0_bin² · f(r/ℓ)。ここで V0_bin は各 RC bin の振幅パラメータ(20 個)、ℓ はグローバル尺度(1 個)、f(x) は無次元のカーネル形状関数である。本稿で比較するカーネル形状(いずれも追加の連続自由度を導入しない)は次のとおりである。

物理的動機(拡張):EFT は、銀河スケールにおける追加の重力応答を、より微視的な作用を有限尺度で粗視化/尺度平均した有効応答として解釈する。本稿では特定の微視的機構を仮定せず、統一統計プロトコルの下で制御された比較と検定を行うため、最小で監査可能なパラメータ化を用いる。

直観のため、追加項は加速度形式 a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ) と書ける。r≫ℓ では f→1、V_extra→V0_bin となり、外側領域でほぼ平坦な追加速度寄与を与える。r≪ℓ かつ f(x)≈x のとき、特徴的加速度尺度 a0,bin≈V0_bin²/ℓ(O(1) のカーネル関数因子の差を除く)を導入でき、内側から外側への遷移尺度に MOND 類似の直観を与える。

ここで用いる離散カーネル族(none/exponential/yukawa/powerlaw_tail)は、異なる「初期傾き/遷移速度/長距離尾部」に対する低次元 proxy と見なせる(例:Yukawa 型の遮蔽と、より長い尾をもつ応答)。これはモデル空間を尽くすためではなく、ロバスト性ストレステストのために用いられる。弱レンズ成分では、V_avg(r) から有効包絡質量と密度を構成し、それらを射影して ΔΣ(R) を得る。この有効密度は、球対称性と弱場マッピングの仮定の下でレンズポテンシャルを有効記述したものとして理解すべきである(詳細は付録 A に移す)。

上記すべてのカーネル形状は x→∞ で f(x)→1(すなわち V_extra²→V0² の飽和)を満たし、x≪1 では線形または亜線形の成長を与える。例えば exponential: f≈x;yukawa: f≈0.5x;powerlaw_tail: f≈0.5x である。したがって、異なるカーネル形状は小半径での「初期傾き」、遷移速度、外側尾部に観測可能な差をもち、RC+GGL の結合検定およびクロージャ検定によって識別できる。

弱レンズ ΔΣ(R) の EFT 予測は、V_avg(r) から包絡質量と密度を推定し、次の射影積分を行うことで得られる:M_enc(r)=r·V_avg²(r)/G、ρ(r)=(1/4πr²)·dM_enc/dr、Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr、ΔΣ(R)=Σ̄(<R)−Σ(R)。数値実装では対数グリッドを用い、例外的な場合には適応的に細分化して、安定性と再現性を保証する。

(c) DM_RAZOR:NFW 冷たい暗黒物質ハロー・ベースライン

同時に、DM_RAZOR は最小で監査可能な NFW ベースライン(固定 c–M、scatter なし;断熱収縮、feedback core、非球対称性、環境項なし)を表すにすぎないことを明確にする。「strawman baseline」のリスクを下げるため、本稿はこれらの効果が存在しないとは主張しない。むしろ、c–M scatter の階層的処理、core proxy、レンズ側 shear-calibration nuisance などを含め、低次元で監査可能なストレステストとして付録 B(P1A)に取り込む。


4.2 モデル台帳と公平比較(共有パラメータ = クロージャの定義)

主要比較セットのパラメータ数は、DM_RAZOR が k=20、EFT ファミリーが k=21(追加の 1 個はグローバル log ℓ)である。すべてのモデルは、同じ RC データ、同じ GGL データと共分散、同じ RC-bin→GGL-bin マッピング、同じバリオン項、同じ単位変換を共有する。さらに、カーネル形状(none / exponential / yukawa / powerlaw_tail)は離散選択であり、追加の連続パラメータを導入しないため、「自由度が 1 つ多い」ことによる優位を避けている。


4.3 尤度、事前分布、サンプラー

RC 尤度は対角ガウスである:σ_eff² = σ_obs² + σ_int²。主結果では σ_int=5 km/s に固定し、Run-5 で σ_int をスキャンする。GGL 尤度は各 bin について完全共分散ガウスを用いる:logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b)。結合目的関数は logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ) である。事前分布は主として物理的に可能な境界(log ℓ、log V0、log M200 の区間制約)を符号化する。Υ と σ_int を自由にした場合には、弱情報事前分布を用いる(詳細は実装とリリース・パッケージ設定を参照)。

サンプラーは適応的 block Metropolis ランダムウォークを用いる。各ステップでは高次元での受理率を改善するため、パラメータ空間のランダムな部分ブロックのみを更新し、窓付き受理率によってステップ幅を軽く適応させる(目標受理率は約 0.25)。主結果では quick モード(n_steps=800 などの設定)を用い、各ワークスペースは trace、残差、PPC 図を出力し、手動およびスクリプト監査に用いる。


4.4 クロージャ検定と負の対照(定義)

クロージャ検定(Run-2)は、GGL を再フィットせずに RC-only posterior が GGL を予測できるかを検定する。具体的には、RC-only posterior サンプルから 4 つの GGL bin の ΔΣ(R) を前向き生成し、完全共分散で logL_true を計算する。次に、RC-bin→GGL-bin のグループ・マッピングをランダムに置換して logL_perm を得る。クロージャ強度は ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩ と定義される。さらに Run-10 では、20 個の RC bin を 4×5 にランダム再編成(shuffle)してクロージャを再計算し、クロージャ信号が正しいマッピングにどの程度依存するかを検定する。

5 主な結果と解釈


5.1 結合フィットの主結果(RC+GGL)

結合フィットの best logL_total と、DM_RAZOR に対する相対優位 ΔlogL_total は表 S1a および図 S4 に示す。主要比較セットでは、EFT_BIN が最大の結合優位(ΔlogL_total=1337.210)をもち、他の EFT カーネル形状も有意な優位(1154.827–1294.442)を保持する。情報量規準(AICc/BIC)でも、EFT ファミリーは DM_RAZOR を大きく上回り、優位がパラメータ数の偏りによるものではないことを示す。

注:ΔlogL_total≈1337 の主要寄与は RC 項から来ている(joint 分解では ΔlogL_RC≈1065、約 80%)。これは N=2295 個の RC データ点にわたって 1 点あたり Δχ²≈0.90 程度の穏やかな改善が、対角ガウス尤度の下で自然に 10^3 オーダーの優位へ累積したものと理解できる。同時に、GGL とクロージャ検定は独立したクロスデータセット制約を与え、σ_int、R_min、cov-shrink の各ストレステストでも順位は安定している(第 6 節および表 S1b 参照)。


5.2 クロージャ検定結果(RC-only → GGL)

クロージャ検定の主要量 ΔlogL_closure は表 S1b および図 S3 に示す。EFT ファミリーのクロージャ強度は 171.977–280.513 で、DM_RAZOR の 126.678 より高い。これは、追加のクロスデータ自由度を一切許さない条件で、EFT が RC データから得た posterior サンプルが GGL データに対してより強い移行可能な予測力をもつことを意味する。

負の対照は、クロージャ信号の物理的関連性をさらに支持する。RC-bin→GGL-bin グループ化をランダムにシャッフルすると、EFT のクロージャ強度は 6–15(カーネル間で小差あり)へ低下する一方、基準のクロージャ強度は 172–281 に達する。この「信号崩壊」は、数値実装、単位エラー、共分散処理の不備による偽の優位を排除する。

図 R1|負の対照:shuffle グループ化後、クロージャ信号は有意に低下する(Tab_Z1 指標に基づくプロット)。


5.3 結果の意味と限界

本研究の結論は、「このデータセットとこのプロトコルの下で、EFT 平均重力補正は、検定された DM_RAZOR ベースラインを上回る」というものである。DM 側は、固定 c(M) 関係をもつ最小 NFW ベースラインのみを用いており、core 形成、非球対称性、環境項、より複雑な銀河—ハロー接続モデルを含まない点を強調しなければならない。したがって本稿は、すべての DM モデル族を排除すると主張しない。その代わり、RC と GGL が同じクロスデータ・パラメータとマッピングで一貫して説明できるかを評価するための、再現可能でクロージャ検定を中心とした対照ベースラインを提供する。

この一般的懸念に対応するため、我々は独立の拡張プロジェクト P1A(付録 B 参照)を完了した。RC-bin→GGL-bin の共有マッピングや監査フレームワークを変更せず、DM ベースラインを「標準化され、監査可能」な形で強化する。3 つの 1 パラメータ拡張(SCAT/AC/FB)に加え、さらに (i) 階層的 c–M scatter + mass–concentration prior(DM_HIER_CMSCAT)、(ii) 1 パラメータのバリオン feedback core proxy(DM_CORE1P)、(iii) 弱レンズ側 shear-calibration nuisance m(DM_RAZOR_M)を追加し、結合モデル DM_STD を報告する。EFT_BIN は対照参照として保持される。

• DM_RAZOR_SCAT(c–M scatter)— halo-to-halo の concentration-scatter パラメータ σ_logc を導入し、固定 c(M) が DM の説明力を体系的に過小評価しているかを検定する。
• DM_RAZOR_AC(Adiabatic Contraction)— 単一パラメータ α_AC により、「収縮なし」と「標準収縮」の間を連続的に補間し、バリオンが内側ハローを収縮させる傾向を最小コストで捉える。
• DM_RAZOR_FB(Feedback/core)— core 尺度(例:log r_core)を用いて、内側 core 形成が回転曲線をどのように抑制するかを記述しつつ、弱レンズ・スケールでは NFW 近似を保つ。

P1A の定量的 scoreboard は付録 B の表 B1/図 B1 に示される(Tab_S1_P1A_scoreboard から自動生成)。クロージャ指標では、DM_RAZOR_FB が小さな純改善(122.21→129.45, +7.25)を与える一方、他の拡張はクロージャ強度に対して無視できるか負の寄与をもつ。結合フィット側では、階層的 c–M scatter prior(DM_HIER_CMSCAT)または結合モデル(DM_STD)の追加により joint logL は大きく改善しうるが、クロージャ強度は改善しない。これは、主としてクロスプローブ移行可能性ではなく、結合フィット柔軟性を追加していることを示唆する。したがって本文の中核結論は次のように読むべきである:厳密な共有マッピングとクロージャ検定制約の下で、EFT のクロスデータ一貫性の優位は、DM 側に「過度に弱いベースライン」を選んだことから生じていない。付録 B に対応する P1A リリース・パッケージ(補足表/図および full_fit_runpack)は、本稿 full_fit_runpack と同じ Zenodo Concept DOI の追加ファイルとして含まれる予定である:https://doi.org/10.5281/zenodo.18526286

6 ロバスト性と対照実験


6.1 σ_int スキャン(Run-5)

内在的 RC scatter σ_int を系統的にスキャンし、各 σ_int で結合推論を繰り返し、DM_RAZOR に対する ΔlogL_total を計算する。スキャン範囲内で各モデルがとる ΔlogL_total の最小/最大値は表 S1b に報告されている。

図 R2|σ_int スキャン下の ΔlogL_total 範囲(大きいほど良い)。


6.2 R_min スキャン(Run-6)

中心領域データの系統誤差(非円運動、分解能、不十分なバリオン・モデリングなど)の影響を検定するため、RC に R_min 閾値カットを適用し、結合推論を繰り返す。R_min スキャン下でも、EFT ファミリーの優位は正であり、規模も安定している。

図 R3|R_min スキャン下の ΔlogL_total 範囲(大きいほど良い)。


6.3 cov-shrink スキャン(Run-7)

GGL 共分散の不確実性を検定するため、各質量 bin の共分散行列に shrinkage を適用する:C_α=(1−α)C+α·diag(C) とし、α をスキャンする。結果は、EFT ファミリーの優位がこの処理に鈍感であることを示す。

図 R4|cov-shrink スキャン下の ΔlogL_total 範囲(大きいほど良い)。


6.4 アブレーション・ラダー(Run-8)

EFT_BIN 内で、ネストしたアブレーションを行う。自由パラメータなしの最小モデルから、少数の自由度だけを保持する版、そして完全な 20-bin 振幅 + グローバル尺度モデルへ進む。AICc/BIC は、完全な EFT_BIN モデルがデータによって強く必要とされることを示す。

図 R5|EFT_BIN アブレーション・ラダー(AICc;小さいほど良い)。


6.5 ホールドアウト予測(Run-9)

さらに leave-one-bin-out(LOO)検定を実行する。4 つの GGL 質量 bin のうち、毎回 1 つの bin を保留し、残りの bin(および全 RC)を用いて推論をやり直し、保留 bin 上でテスト対数尤度を評価する。サマリー指標は補足表 Tab_R3_leave_one_bin_out(Run-9 産物;ファイルパス・パターンは第 8.2 節の主要産物リストに示す)に与えられる。最悪の保留ケースでも、EFT ファミリーは DM_RAZOR より明確に優れる。

図 R6|LOO:保留 bin の対数尤度分布(Run-9 産物より)。


6.6 負の対照:RC-bin Shuffle(Run-10)

Run-10 では、20 個の RC bin を 4×5 にランダム再編成し、RC-only posterior は変えずにクロージャを再計算する。結果は、元のマッピングと比べて、シャッフルが closure mean logL_true と ΔlogL_closure の双方を有意に下げることを示し(表 S1b および図 R1 参照)、クロージャ信号の解釈可能性をさらに支持する。

図 R7|負の対照:shuffle マッピングは closure mean logL_true を明確に低下させる(Run-10 産物より)。

7 追跡可能性と一貫性監査(Provenance)

本稿で引用されるすべての数値は、リリース・アーカイブの厳密サマリー表と監査記録内で項目ごとに追跡できる。本文の可読性を保つため、完全な provenance chain(タグ一覧、監査表、チェックサム一覧、検証方法)は付録 A に移した。

8 再現可能性と Zenodo アーカイブ

データおよびコードの入手可能性声明:本稿で用いた SPARC 回転曲線データと KiDS-1000 弱レンズデータは公開データセットである。出版品質報告書は Zenodo にアーカイブされている(Concept DOI: https://doi.org/10.5281/zenodo.18526334)。完全再現パッケージも Zenodo にアーカイブされている(Concept DOI: https://doi.org/10.5281/zenodo.18526286)。詳細な実行手順、依存環境、アーカイブ目録、ハッシュ検証情報は付録 A に示す。DM ベースライン標準化ストレステスト(P1A)の設計、run tag、出力は付録 B に示す。

同じ完全再現パッケージ Concept DOI(https://doi.org/10.5281/zenodo.18526286)の下で、利用目的別に 2 つの再現可能な入口を提供する: • P1(本文)full_fit_runpack:EFT vs DM_RAZOR の RC-only / closure / joint 解析およびロバスト性スキャンを再現し、表 S1a/S1b と図 S3/S4 を含む本文資産を生成する。 • P1A(付録 B)full_fit_runpack:DM ベースライン標準化ストレステスト(SCAT/AC/FB + hierarchical c–M scatter prior + core1p + lensing m + DM_STD、EFT_BIN 対照を含む)を再現し、付録表 B1 と図 B1 を生成する。 P1A の補足表/図および full_fit_runpack は、単一のアーカイブ入口を維持するため、同じ Concept DOI の追加ファイルとして含まれる。

9 謝辞と宣言


9.1 謝辞

公開データとドキュメントを提供した SPARC チームおよび KiDS-1000 チーム、ならびに本プロジェクトの再構成・監査ワークフローに参加した方々に感謝する。


9.2 著者貢献

Guanglin Tu は、概念提案、研究設計、エンジニアリング実装、データキュレーション、形式解析、再現可能性ワークフローの実装と監査、ならびに原稿執筆を担当した。


9.3 資金

著者 Guanglin Tu による自己資金(外部資金なし/助成番号なし)。


9.4 利益相反

著者 Guanglin Tu は「EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd.(中国)」に所属する。それ以外の利益相反は申告されていない。


9.5 AI 支援

OpenAI GPT-5.2 Pro と Gemini 3 Pro は、言語の磨き上げ、構造編集、再現可能性ワークフローの整理に使用された。これらは、データ、結果、図、表、コードの生成または変更、および引用の生成には使用されていない。著者は原稿全体の内容と引用の正確性について全責任を負う。

10 参考文献

付録 A:追跡可能性と再現可能性の詳細

本付録は、run tag、監査結果、アーカイブ目録、主要検証点を含む追跡可能性と再現可能性の長期アーカイブ情報を要約し、読者が必要に応じて本研究を確認・再現できるようにする。


A.1 追跡可能性と監査の詳細

長期的な追跡可能性を確保するため、本プロジェクトでは各 run と出力にタイムスタンプ付きタグを用い、過去の産物を上書きせず保持する。本稿で引用される中核値は厳密コンパイル(compile_tag=20260205_035929)から来ており、次の一貫性監査を通過している。

• すべての stage-level 表は run_tag と stage tag を持ち、厳密コンパイル・スクリプトは report/tables から「完全かつ一貫した」canonical 表ソースを選択する。

• Tab_Z1_master_summary と Tab_Z2_conclusion_highlights の値は、選択された canonical 表と項目ごとに比較される。

• PDF 生成時には、「参照された表/図タグ」に対してタグ監査を行い、古い産物が混入しないことを保証する。

主要タグ(すべての中間産物を特定するため):run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442。

一貫性監査結果:Tab_AUDIT_checks_strict は pass=9, fail=0, skip=0 を報告する(詳細はリリース・パッケージ参照)。


A.2 再現実行手順とアーカイブ目録

本研究は、「出版品質報告書 + 表/図補足 + 完全に再実行可能な run package」からなる再現性システムを採用する。読者は Tables & Figures Supplement を直接参照し、論文で引用されたすべての表/図資産を検証できる。数値と監査チェーンを一から再現するには、full_fit_runpack を用いてデータをダウンロードし、完全なワークフローを再実行できる。完了後、パッケージ内蔵の reference-table comparison script により表値の一貫性を検証できる。


A.2.1 再現クイックスタート(RUN_FULL, Windows PowerShell)

本節は、より短い再現手順(Windows PowerShell)を示す。クイックチェックでは、読者は Tables & Figures Supplement を直接参照し、引用された表と図を項目ごとに検証することを推奨する。エンドツーエンドの再現と、すべての表、図、監査産物の生成には full_fit_runpack を用いる。パッケージの README/ONE_PAGE_REPRO_CHECKLIST に従い、verify_checksums.ps1 と RUN_FULL.ps1 を実行する(Mode=full 推奨)。

Zenodo archive entry(Concept DOI):https://doi.org/10.5281/zenodo.18526286
本稿の main-chain tags:run_tag=20260204_122515; strict compile_tag=20260205_035929; release_tag=20260205_112442。


A.2.2 アーカイブ資料と主要検証点(Packages & checks)

Zenodo アーカイブは 3 種類の相補的資料を提供する:(1) 出版品質報告書(本稿 v1.1;付録 B:P1A DM ベースライン標準化ストレステストを含む);(2) Tables & Figures Supplement(本稿で引用されるすべての表/図資産をカバーする補足表および図で、P1 と P1A に別々に対応);(3) full_fit_runpack(完全再現パッケージ:データを一からダウンロードし、完全ワークフローを再実行するもので、P1 と P1A に別々に対応)。項目 (1)–(2) は迅速な読解と独立検証を支援し、項目 (3) はエンドツーエンドの完全再現性を提供する。

資料カテゴリ

ファイル名(例)

用途と位置づけ(推奨利用順)

出版品質報告書(中国語および英語)

P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf
P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf

Zenodo にアーカイブされた完全報告書。本文は主要結論とロバスト性監査を示し、付録 B は P1A(DM ベースライン標準化ストレステスト)を示す。

Tables & Figures Supplement(P1)

P1_RC_GGL_supplement_figs_tables_V1_1.zip

本文で引用されるすべての表(CSV)と図(PNG)。生成スクリプトとタグファイルを含む。

Tables & Figures Supplement(P1A)

P1A_supplement_figs_tables_v1.zip

付録 B(P1A)で引用されるすべての表と図。Tab_S1_P1A_scoreboard および Fig_S1_P1A_scoreboard を含む。

full_fit_runpack(P1)

P1_RC_GGL_full_fit_runpack_v1_1.zip

エンドツーエンド完全再現。データを一からダウンロードし、RC-only / closure / joint とロバスト性スキャンを再実行する。

full_fit_runpack(P1A)

P1A_RC_GGL_full_fit_runpack_v1.zip

エンドツーエンド完全再現(付録 B)。DM 7+1 + DM_STD(EFT_BIN 対照を含む)を再実行し、付録資産を生成する。パッケージには表値一貫性を検証する reference-table comparison script が含まれる。

引用推奨:本稿または付随する再現可能性資料を引用する場合は、Zenodo Concept DOI(https://doi.org/10.5281/zenodo.18526334)を引用すること。

再現後に出現し、比較可能であるべき主要産物には次が含まれる。

付録 B:P1A—DM ベースライン標準化ストレステスト(DM 7+1 + DM_STD;EFT Control 付き)

本付録は、本文のクロージャ・プロトコルと整合する「DM ベースライン標準化ストレステスト」の拡張プロジェクト(P1A)を記録する。その役割は、本文で用いた最小 DM_RAZOR ベースライン(NFW + 固定 c–M、no scatter / no contraction / no core)を、天体物理実務により近く、一般的批判に対してより抵抗力をもつ DM ベースライン・セットへアップグレードすることである。ただし、大量の自由度を導入せず、RC-bin→GGL-bin 共有マッピングや監査フレームワークは変更しない。P1A は、以前の 3 分岐ストレステストを含み、かつその上位集合である。すなわち SCAT/AC/FB を保持しつつ、階層的 c–M scatter + prior、1 パラメータ core proxy、レンズ側 shear-calibration nuisance m を追加し、結合モデル DM_STD も提供する。EFT_BIN は対照参照として保持される。

補足注:付録 B(P1A)のクロージャ強度と関連値は、EFT カーネル・ファミリー全体をカバーするため、本文で用いた quick budget(例:ndraw=60, nperm=12)より大きな Monte Carlo budget(例:ndraw=400, nperm=24)を用いる。したがって絶対値には O(10) レベルのサンプリング・ドリフトが見られる可能性がある。しかし、同じ budget/表内でのモデル間比較は公平であり、優位の符号と規模は budget をまたいでも安定している。


B.1 目的と位置づけ(なぜ P1A か、なぜ付録か)

P1A は、非球対称性、環境依存、複雑な銀河—ハロー接続、高次元バリオン物理など、ありうるすべての ΛCDM ハロー・モデリング選択肢を尽くそうとするものではない。その代わり、P1A は「低次元・監査可能・再現可能」という原則に従う。各拡張モジュールは ≤1 個の主要有効パラメータのみを導入し、本稿の 3 つの硬い制約に従う:
(i) パラメータ台帳:すべての新パラメータを明示的に記録し、情報量規準(AICc/BIC)とともに報告しなければならない。
(ii) 共有マッピング:同じ RC-bin→GGL-bin グループ化マップを引き続き用いる。単一データセットだけに対して「マッピングを調整」することは許されない。
(iii) クロージャ検定:いかなる拡張も、単に RC-only フィットを良くするだけでなく、RC→GGL 移行予測において genuine gain を示さなければならない。


B.2 DM 7+1 + DM_STD:モジュール定義、パラメータ、結合 posterior への入り方

独立 runpack として、P1A は 8 つの DM ワークスペース(DM 7+1)と 1 つの EFT 対照を提供する。ベースライン DM_RAZOR から出発し、3 つの legacy 1 パラメータ拡張(DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB)を構築し、さらに 3 つの標準的な防御的モジュール(DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M)を追加し、結合モデル DM_STD を提供する。これらのモジュールの共通目標は、次元数の増加をできるだけ小さく抑えつつ、最も一般的な 3 種類の批判をカバーすることである:(a) c–M scatter と prior が階層モデルにどのように入るか、(b) バリオン feedback の主要効果を 1 パラメータ core proxy で捉えられるか、(c) 主要なレンズ側系統誤差が物理信号と取り違えられうるか。

Workspace

dm_model

新規パラメータ(≤1)

物理的動機(中核)

実装原則(監査しやすさ)

DM_RAZOR

NFW (fixed c–M, no scatter)

最小で監査可能な ΛCDM ハロー・ベースライン。EFT との厳密比較に用いる。

共有マッピング固定;厳密なパラメータ台帳;相対比較の baseline としてのみ使用

DM_RAZOR_SCAT

NFW + c–M scatter(legacy)

σ_logc

c–M 関係には scatter がある。1 パラメータ log-normal scatter で近似する。

≤1 新規パラメータ;共有マッピングを保持;クロージャ利得を受け入れ基準にする

DM_RAZOR_AC

NFW + Adiabatic Contraction(legacy)

α_AC

バリオン流入はハローの断熱収縮を誘起しうる。1 パラメータ強度で近似する。

≤1 新規パラメータ;マッピング不変;AICc/BIC 変化とクロージャ利得を報告

DM_RAZOR_FB

NFW + feedback core(legacy)

log r_core

feedback は内側領域に core を形成しうる。1 パラメータ core 尺度で近似する。

≤1 新規パラメータ;同じ closure/negative-control protocol;RC-only 改善だけを目的にしない

DM_HIER_CMSCAT

Hierarchical c–M scatter + prior

σ_logc (hier)

より標準的な階層構造 c_i∼logN(c(M_i),σ_logc)。RC と GGL の双方の joint posterior に影響する。

明示的 prior;latent c_i を周辺化;低次元かつ監査可能性を保持

DM_CORE1P

1-parameter core proxy(coreNFW/DC14-inspired)

log r_core

バリオン feedback の主要効果に対する 1 パラメータ core proxy。高次元の星形成詳細を避ける。

標準文献を引用;≤1 新規パラメータ;closure test によって制約

DM_RAZOR_M

NFW + lensing shear-calibration nuisance

m_shear (GGL)

主要な弱レンズ系統誤差を有効パラメータとして吸収し、系統誤差を物理信号と誤認するリスクを減らす。

nuisance を明示記録;RC へ逆向き影響不可;結果は主に closure robustness で判断

DM_STD

Standardized DM baseline(HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

最も一般的な 3 種類の批判を、なお低次元の standard baseline に含める。

パラメータ台帳 + 情報量規準を報告;closure を主要指標とする;最強の DM 防御的対照として使用

注:上記のパラメータ名はエンジニアリング実装に従う(例:σ_logc、α_AC、log r_core、m_shear)。P1A の設計焦点は「DM ベースラインをいくらか強くしつつ監査可能に保つ」ことであり、DM 側を制御不能な高次元フィッターへ変えることではない。特に、DM_HIER_CMSCAT は c–M scatter を階層的に導入する。各ハローの concentration c_i は c(M_i) の周りの log-normal scatter を割り当てられ、グローバル σ_logc と c(M) prior によって制約される。この階層構造は RC と GGL の双方の結合 posterior に影響する。


B.3 本文と整合する統計プロトコルおよび産物規約

P1A は、本文のすべてのデータ産物、共有マッピング、監査フレームワークを再利用する。実行順序と産物規約は一貫している:
(1) Run‑1:RC-only 推論(posterior_samples.npz と metrics.json を出力)。
(2) Run‑2:RC→GGL クロージャ検定(closure_summary.json と permuted baseline を出力)。
(3) Run‑3:RC+GGL 結合フィット(joint_summary.json を出力)。
引用されるすべての数値は、自動コンパイル表(Tab_S1_P1A_scoreboard)から来ており、P1A full_fit_runpack に内蔵された reference-table comparison script を用いて、完全な P1A ワークフロー再実行後に確認できる。


B.4 主結果、表/図の入口、およびアーカイブ計画(同一 DOI)

本節は P1A の中核的な定量結論を示す。表 B1 は、RC-only、RC→GGL クロージャ、RC+GGL 結合フィットの主要指標を要約する(括弧内は DM_RAZOR ベースラインに対する差)。クロージャ強度は ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩(大きいほど良い)として定義される。図 B1 は同じ scoreboard を可視化する。主な点は次のとおりである:
• 3 つの legacy 分岐のうち、DM_RAZOR_FB(feedback/core)のみがクロージャ強度に小さな純改善を与える:122.21→129.45(+7.25)。SCAT と AC は純改善を与えない。
• 新たに追加した DM_HIER_CMSCAT と DM_RAZOR_M は、クロージャ強度への効果が非常に小さく(~0)、DM_CORE1P も有意な純改善を示さない。
• 結合モデル DM_STD は joint logL を大きく改善しうる(結合フィット最適値に近づく)が、クロージャ強度は低下する。これは、その利得が主にクロスプローブ移行可能性ではなく、結合フィット柔軟性から来ていることを示唆する。
• 対照として、EFT_BIN はクロージャ強度と結合フィットの双方で明確な優位を保つ。したがって主要結論は、「より強い DM ベースライン + レンズ nuisance」の導入に対しても頑健である。

本文結果との直接比較のため、表 S1a–S1b は EFT ファミリーと DM_RAZOR の厳密比較を要約する。EFT モデルは DM_RAZOR に対して結合フィットを ΔlogL_total≈1155–1337 改善し、クロージャ検定では ΔlogL_closure=172–281 に達する。P1A は DM 側に「より厳しい対照」を作るだけであり、その目的は「strawman baseline」や「systematics-as-physics」といった懸念を減らすことであって、主要比較を置き換えることではない。

表 B1|P1A scoreboard(大きいほど良い;括弧内は DM_RAZOR ベースラインに対する差)。

モデル分岐(workspace)

Δk

RC-only best logL_RC (Δ)

クロージャ強度 ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

図 B1|P1A scoreboard:ベースラインに対する closure と joint ΔlogL(大きいほど良い)。

本付録に対応する完了 run set の例示タグは次のとおりである(P1A の中間産物と表/図を特定するために使用):
P1A run_tag = 20260213_151233;P1A closure_tag = 20260213_161731;P1A joint_tag = 20260213_195428。


B.5 推奨引用(付録引用注記)

読者が本文の主要結論に加えて「DM ベースライン標準化ストレステスト」を引用する必要がある場合、主要結論とともに次の注記を引用することを推奨する:“See Appendix B (P1A) for standardized DM-baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.”