最終更新:2025-09-25
概要
本記事では、自作ライブラリ(MultiOptPy)で、BH9データセット 1. Radical rearrangement and addition No. 4の素過程の遷移状態構造を算出してみる。計算レベルは、Meta社のFAIR Chemistryが開発したニューラルネットワークポテンシャル(NNP)であるUMA(Meta’s Universal Model for Atoms)とした。
MultiOptPyは電子状態計算ソフトウェアを用いた分子構造最適化手法の勉強を目的として作成したpythonライブラリである。
MultiOptPyのレポジトリ:https://github.com/ss0832/MultiOptPy
BH9のデータセットについて:
- J. Chem. Theory Comput. 2022, 18, 1, 151–166 https://doi.org/10.1021/acs.jctc.1c00694
今回使用したニューラルネットワークポテンシャルについて:
- https://ai.meta.com/blog/meta-fair-science-new-open-source-releases/ (UMAの公開に関する記事)
- https://github.com/facebookresearch/fairchem (FAIR Chemistryの提供するGitHubのレポジトリ)
- https://fair-chem.github.io/ (同上のレポジトリの内容に関して説明したサイト)
- https://huggingface.co/facebook/UMA (NNPの配布サイト, Hugging Faceへのアカウント登録と配布元の使用許諾が必要である。)
- arXiv preprint arXiv:2505.08762 (2025). (プレプリント)
使用した自作ライブラリMultiOptPyのバージョン
v1.16
環境
Windows 11
※Windows 11環境下でAnaconda PowerShell Promptを使用した。
Source codeのダウンロード
wget https://github.com/ss0832/MultiOptPy/archive/refs/tags/v1.16.zip
unzip v1.16.zip
cd MultiOptPy-v1.16
環境構築手順
今回は、Windows 11のPower Shellを使用した。初めに、NNPを使用できる環境が整ったAnaconda PowerShell Promptを用意する手順を説明する。
1, https://repo.anaconda.com/archive/ より、Anaconda3-2025.06-1-Windows-x86_64.exe
でAnacondaをインストールする。
2, 検索機能を使い、スタートからAnaconda PowerShell Prompt
を開く。
3, 以下のコマンドを実行し、仮想環境を作成する。
conda create -n (任意の仮想環境名) python=3.12.7
4, 先ほど作成した仮想環境をconda activate (仮想環境名)
で起動させる。
5, 以下のコマンドを実行し、必要なライブラリを導入する。
pip install fairchem-core==2.2.0 ase==3.25.0 torch==2.6.0
- fairchem-coreは、FAIR Chemistryが管理しているNNPを動作させるために必要なライブラリである。
- aseはNNPに電子エネルギーを算出したい分子構造を渡すために必要なインターフェイスの役割を果たすために必要なライブラリである。
- torchはPyTorchライブラリを指す。これはニューラルネットワークなどの機械学習を行ったり、学習結果を扱ったりするために必須なライブラリである。
これで、Anaconda PowerShell Prompt
から仮想環境を立ち上げることで、NNPを使用する準備が整えることが出来る。
次に、NNPを使用するために必要なModelの情報が保存されている.pt
ファイルのダウンロードおよびNNPの自作ライブラリへの導入方法について説明する。
1, 以下のサイトにアクセスして、uma-s-1.pt
をダウンロードする。(使用許諾が下りていれば可能である。)
https://huggingface.co/facebook/UMA
2, ダウンロード後、MultiOptPy-v1.16
ディレクトリ内に存在するsoftware_path.conf
に対して、uma-s-1.pt
の絶対パスを用いて以下を追記する。
uma-s-1::(uma-s-1.ptの絶対パス)
これで、MultiOptPy-v1.16
がNNPuma-s-1
を使用できるようになる。
使用するNNPに関する具体的な説明
今回使用するNNPについて具体的に説明する。
- UMAのModel Checkpointは
uma-s-1
を使用した。 - 小分子系のトレーニングセットである
Omol25
(omol
)を使用して学習したニューラルネットワークポテンシャルを使用する。
※自作ライブラリでの具体的な使用の仕方に関しては、ase_calculation_tools.py
を参照
手順
1. 初期構造の準備
モデル反応系として、以下の構造を用意した。今回はファイルの名前をbh9_1_4.xyz
とした。 初期構造は以下のものを使用した。
14
OptimizedStructure
C -0.552474844899 -1.055521547051 -1.309963622815
H -0.292272812068 -2.009658310813 -1.742900052807
H -1.590355468380 -0.872158787197 -1.069068208955
C 0.457030204307 0.024069670568 -1.177125802112
H 0.488078406804 0.621629600267 -2.101440014711
H 1.459622090599 -0.405531431822 -1.081737218056
C 0.205091772826 0.989430624353 -0.017945866762
H 0.917964642855 1.813351844764 -0.077863430261
H -0.792628278759 1.425489812523 -0.105108980061
C 0.358895838725 0.346970513220 1.366971519472
H 0.407005736892 1.117973688812 2.137418202066
H 1.291598198496 -0.218787881814 1.418683596440
C -0.740854809304 -0.550571896119 1.727316998156
N -1.616700678093 -1.226685899691 2.032762880406
2. 遷移状態構造最適化のための初期構造の算出
a. 初期構造をカレントディレクトリにbh9_1_4.xyz
として保存し、以下を実行する。
python optmain.py .\bh9_1_4.xyz -ma 200 1 13 -os uma-s-1 -fc 50 -opt rsirfo_fsb -spin 2 -elec 0
-opt rsirfo_fsb
は準ニュートン法であるRS-I-RFO法を構造最適化に使用することを示す。初期のへシアンに関しては、特にオプションで指定しない限り、単位行列が使われる。-spin
はスピン多重度の指定である。PySCFを使用するときは目的とするスピン多重度に1を引いた値を指定する。(デフォルトでは1が指定される。)今回はUMAモデルのNNPを使用し、ラジカル反応を扱うためスピンだ重度を2とした。-elec M
は形式電荷をMとすることを示す。(デフォルトでは0が指定される。)-ma yyy a b
はyyykJ/molの活性化障壁を超えうるペア同士を近づける力を原子のラベル番号aとbのペアに構造最適化時に加えることを示す。-os uma-s-1
は今回使用するNNPを指定している。これを使用する際にASEライブラリが必要である。-fc X
はX回の反復計算ごとに正確なHessianを計算することを指定する。Hessianの計算コストは勾配の場合と比べると大きいが、構造最適化の収束までの時間を短縮できる。
これを実行すると、omol
のデータセットを使用したuma-s-1
モデルのNNPで得たエネルギーに対して、指定した人工力ポテンシャルを加えた上で初期構造を構造最適化することができる。
結果はyyyy_mm_dd
(今日の年月日)ディレクトリの中に存在するディレクトリを開いて確認できる。
正常終了していれば、このディレクトリ中に、bh9_1_4_traj.xyz
が存在するので、これをコピーして、MultiOptPy-v1.16
ディレクトリに置く。
bh9_1_4_traj.xyz
は構造最適化の過程をAvogadro(公式ページ:https://avogadro.cc/ )等で可視化して確認できるようにしている。このbh9_1_4_traj.xyz
は次のNEB計算に使用する。
※bh9_1_4_traj.xyz
をアニメーションとして表示したい場合は、[https://github.com/ss0832/molecule_movie] を使うと良い。
(この人工力ポテンシャルを加えて行った構造最適化の結果はbh9_1_4_optimized.xyz
で確認できる。構造を可視化して、生成系になっているか確認する。反応系のままであれば、-ma
の設定を見直してb.をやり直す。今回の場合以下の構造が得られた。生成系の安定構造に近いものが得られていると判断できるため、次のNEB計算を行うことが可能である。)
b. bh9_1_4_traj.xyz
を初期パスとして、NEB法で経路の緩和を行う。
NEB法を用いることで、先ほど得られたbh9_1_4_traj.xyz
全体のエネルギーを下げることができる。これにより、パスのエネルギー極大値を持つ構造を遷移状態構造に近づける。(この時点ではまだ正確な遷移状態構造は求められていない。)
python nebmain.py bh9_1_4_traj.xyz -os uma-s-1 -ns 15 -aneb 3 5 -modelhess -spng -ndb 0.3 -spin 2 -elec 0 -notsopt
-ndb N
はノード間の距離をN Åとして初期経路を作成することを示す。経路作成時に元のノードをベルンシュタイン多項式を用いてがたついた経路を滑らかにする。-ns n
はn回分NEB法による経路の緩和を行うことを示す。-fc M
はM回あたりの経路緩和回数に対して1回だけ正確なHessianを計算し、経路緩和に使用する。これを使用すると、Hessianを使用しない場合の経路緩和アルゴリズムとは別のものを使用して、経路緩和を行う。-spng
は緩和中のパスのエネルギープロファイルや各ノードの勾配のRMS値をmatplotlibで可視化するオプションである。-os uma-s-1
は今回使用するNNPを指定している。これを使用する際にASEライブラリが必要である。-aneb A B
これを指定すると、(B+1)回の緩和ごとに、エネルギー極大値を示すノードと前後のノードの間に線形補間でA個の新規ノードを内挿するようにできる。デフォルトではこのような操作は行われない。このオプションを使用するとノードの数が徐々に増えるため、計算コストが使用しない場合と比べて増加する。一方で、エネルギー極大値を示すノード周辺にノードを増加させるため、緩和している経路中のノードが遷移状態構造付近に存在する可能性が高くすることが出来る。-notsopt
このオプションを使うと遷移状態構造を求めるようにステップを計算せずに、他のノードと同じように、勾配とは垂直方向にステップを計算するように指定できる。デフォルトではHessianを使った経路の緩和アルゴリズムが使用されているときに、経路のエネルギー極大値に対して遷移状態構造を求めるようにステップを計算するようにしている。
c. 初期構造の決定及び遷移状態構造の計算
MultiOptPy-v1.16
と同じディレクトリ内に、NEBという名前を含むディレクトリが生成されている。 そのディレクトリ内のenergy_plot.csv
を確認し、緩和後のパスのエネルギー極大値を示す構造を確認する。
パスの緩和後の各ノードのエネルギー一覧(単位
※bias_force_rms.csv
にて、各Iterationごとのすべてのノードの勾配のRMS値を確認できる。
経路緩和の結果、経路のエネルギー極大値を示す構造の中から目視で、緩和後に得られた経路の11番(グラフ上では12番)の構造を遷移状態構造を求める初期構造として採用した。
※こちら[https://ss0832.github.io/molecule_viewer/] を使うことでも可視化は可能である。
bh9_1_4_traj_11.xyz
14
0 2
C -0.581273714191 -1.004537701924 -0.917850992290
H -0.314793821602 -2.024949183941 -1.179672116086
H -1.628143369842 -0.765496778056 -1.061181024417
C 0.434998775228 0.069771229014 -1.149589583429
H 0.324772409041 0.540436521907 -2.133735184372
H 1.439292575387 -0.358864498044 -1.116896977914
C 0.287986335338 1.101078798518 -0.034430920690
H 1.048546763291 1.878768405257 -0.077553306867
H -0.692107179498 1.579912757568 -0.108977190640
C 0.358047740852 0.320572495238 1.272451018134
H 0.217828019614 0.945677241460 2.153610280322
H 1.323776798464 -0.180296136030 1.364891788259
C -0.687625583642 -0.741698778804 1.237533149848
N -1.531305748441 -1.360374372161 1.751401060142
構造が壊れていないので、これを遷移状態を求めるための初期構造とする。
遷移状態構造を求めるための初期構造を含むxyzファイルをMultiOptPy-v1.16
と同じディレクトリ内にコピーする。
そして、以下を実行する。
python optmain.py .\bh9_1_4_traj_11.xyz -spin 2 -elec 0 -os uma-s-1 -fc 5 -tcc -freq -opt rsirfo_bofill -order 1
-opt rsirfo_bofill
は遷移状態構造の最適化向けのoptimizerを指定することを意味する。準ニュートン法であるRS-I-RFO法を使用する。今回は-fc
で正確なへシアンを計算するようにしているので、初期へシアンは正確なへシアンを使用するようになっている。-order 1
は一次の鞍点を求めることを指定する。(デフォルトだと極小値を求めるようになっている。)-fc 5
は5回の反復回数当たり1回正確なへシアンを計算することを指定する。-freq
は収束条件を満たした後に基準振動解析を行うことを示す。(自前で実装しているため、あくまで目安として使用することを推奨する。各振動モードをvibration_animation
内のxyzファイルで可視化できる。)UMAモデルから算出されるHessianは数値微分により求めているため、原子数Zが多いとZの二乗オーダーで計算コストが急増する。-tcc
は収束条件を厳しくすることを示す。(Gaussianのtightと同等)
実行して得られた正確な遷移状態構造と思われる構造を以下に示す。
(実行して得られた正確な遷移状態構造は計算開始時に、yyyy_mm_dd
ディレクトリ内に生成された新規ディレクトリ内のYYY_optimized.xyz
として保存されている。)
14
OptimizedStructure
C -0.621491755600 -0.975414221756 -0.911169310836
H -0.386718673139 -2.022440646649 -1.036099806417
H -1.656866956264 -0.711564114322 -1.087596690853
C 0.421056098380 0.066179098769 -1.159269465193
H 0.283088032093 0.542887568041 -2.135428584440
H 1.415546444390 -0.385268381355 -1.155525019150
C 0.327265969217 1.111474012742 -0.044025822484
H 1.150997723410 1.824402357129 -0.080975613050
H -0.604222403075 1.673822399357 -0.142577818704
C 0.325188314447 0.344769354765 1.272131655641
H 0.071879410449 0.965596385007 2.130649159143
H 1.308464702149 -0.095041472009 1.454014509382
C -0.650233386353 -0.782016020833 1.209629599022
N -1.383953520105 -1.557386318886 1.686243207939
停留点に収束した分子構造が得られた。-freq
オプションにより生成されたnormal_modes.txt
やvibration_animation
ディレクトリ内の振動モードのアニメーションを確認した。
以下に-freq
オプションで生成されたnormal_modes.txt
の一部を示す。
Mode 0 1 2
Freq [cm^-1] -598.0483 91.7146 265.4745
Reduced mass [au] 10.5430 2.4410 1.7886
Force const [Dyne/A] -2.2217 0.0121 0.0743
Char temp [K] 0.0000 131.9568 381.9585
Normal mode x y z x y z x y z
C 0.00688 -0.00814 -0.17854 0.09545 -0.07471 0.01726 0.02316 -0.04165 0.02343
H 0.01297 -0.02016 -0.02341 0.25302 -0.04684 0.07536 0.15008 -0.02622 0.13415
H -0.01713 0.00606 0.01336 0.06042 -0.24083 -0.01868 -0.00737 -0.18767 -0.00715
C 0.00565 0.00119 -0.02163 -0.04720 0.06200 -0.02849 -0.07014 0.03454 -0.05948
H 0.05852 0.05351 -0.00777 -0.19754 0.09190 0.00852 -0.26780 0.10467 0.00353
H 0.00640 0.00157 -0.00386 0.00488 0.17669 -0.14459 -0.05421 0.07011 -0.28323
C -0.01359 -0.01531 -0.00463 -0.04488 0.00510 0.02921 0.12141 -0.00025 0.00374
H -0.01194 -0.01615 0.00175 -0.08585 0.05154 0.01298 0.27154 -0.17191 0.01918
H -0.01119 -0.01284 -0.00153 -0.08251 -0.04211 0.11728 0.24919 0.20915 0.00103
C 0.00755 0.00247 0.00170 0.07425 -0.06482 -0.01265 -0.05313 0.03202 0.02616
H 0.04880 0.03567 -0.00846 0.19158 -0.10543 0.05134 -0.12487 0.09289 -0.03806
H 0.00823 -0.00012 -0.01209 0.07666 -0.11729 -0.15138 -0.08902 0.01155 0.17168
C 0.00142 0.03609 0.21748 0.01119 -0.00730 0.00382 -0.05148 0.02976 0.02108
N -0.01360 -0.01739 -0.00930 -0.09200 0.08505 -0.00430 0.01669 -0.05402 -0.01288
(...snip...)
その結果、虚振動が1つであることが確認できた。つまりこの構造は遷移状態構造である。
次に、vibration_animation
内の虚振動を示す分子振動が示されたxyzファイル(mode_1_XXXi_wave_number.xyz
)をAvogadroで確認すると、想定される反応系と生成系をつなぐ方向に振動していることを確認できた。
終わりに
自作ライブラリで、UMAモデルのニューラルネットワークポテンシャル(NNP)を用いて、BH9データセット 1. Radical rearrangement and addition No. 4の素過程のある1つの遷移状態構造を算出する手順を説明した。
(追記) BH9データセットとは異なる分子構造となっていた。とは言いつつもメチル基の有無くらいである。
参考
- https://github.com/ss0832/MultiOptPy (自作ライブラリMultiOptPyのレポジトリ)
- https://avogadro.cc/ (Avogadro、分子構造可視化ツール)
- https://ai.meta.com/blog/meta-fair-science-new-open-source-releases/ (UMAの公開に関する記事)
- https://github.com/facebookresearch/fairchem (FAIR Chemistryの提供するGitHubのレポジトリ)
- https://fair-chem.github.io/ (同上のレポジトリの内容に関して説明したサイト)
- https://huggingface.co/facebook/UMA (NNPの配布サイト, Hugging Faceへのアカウント登録と配布元の使用許諾が必要である。)
- arXiv preprint arXiv:2505.08762 (2025). (プレプリント)
- The Journal of Chemical Physics 2010, 132, 241102.
- The Journal of Chemical Physics 1991, 94, 751–760.
- In Classical and Quantum Dynamics in Condensed Phase Simulations; WORLD SCIENTIFIC: LERICI, Villa Marigola, 1998; pp 385–404.
- The Journal of Chemical Physics, 2020, 153, 024109.
- The Journal of Chemical Physics, 2022, 144, 214108.
- J. Chem. Theory Comput. 2022, 18, 1, 151–166 https://doi.org/10.1021/acs.jctc.1c00694 (BH9のデータセットについて)