最終更新:2025-08-19
概要
本記事では、自作モジュール(MultiOptPy)で、SN2反応(基質-methyl trifluoromethanesulfonate, 求核剤-chloride ion)の遷移状態構造を算出してみる。使用する計算レベルは、Meta社のFAIR Chemistryが開発したニューラルネットワークポテンシャル(NNP)であるUMA(Meta’s Universal Model for Atoms)を使用する。
MultiOptPyは電子状態計算ソフトウェアを用いた分子構造最適化手法の勉強を目的として作成したpythonモジュールである。
MultiOptPyのレポジトリ:https://github.com/ss0832/MultiOptPy
SN2反応について:
今回使用したニューラルネットワークポテンシャルについて:
- https://ai.meta.com/blog/meta-fair-science-new-open-source-releases/ (UMAの公開に関する記事)
- https://github.com/facebookresearch/fairchem (FAIR Chemistryの提供するGitHubのレポジトリ)
- https://fair-chem.github.io/ (同上のレポジトリの内容に関して説明したサイト)
- https://huggingface.co/facebook/UMA (NNPの配布サイト, Hugging Faceへのアカウント登録と配布元の使用許諾が必要である。)
使用した自作モジュールMultiOptPyのバージョン
v1.12c
環境
Windows 11
※Windows 11環境下でAnaconda PowerShell Promptを使用した。
Source codeのダウンロード
wget https://github.com/ss0832/MultiOptPy/archive/refs/tags/v1.12c.zip
unzip v1.12c.zip
cd MultiOptPy-v1.12c
環境構築手順
今回は、Windows 11のPower Shellを使用した。初めに、NNPを使用できる環境が整ったAnaconda PowerShell Promptを用意する手順を説明する。
1, https://repo.anaconda.com/archive/ より、Anaconda3-2025.06-1-Windows-x86_64.exe
でAnacondaをインストールする。
2, 検索機能を使い、スタートからAnaconda PowerShell Prompt
を開く。
3, 以下のコマンドを実行し、仮想環境を作成する。
conda create -n (任意の仮想環境名) python=3.12.7
4, 先ほど作成した仮想環境をconda activate (仮想環境名)
で起動させる。
5, 以下のコマンドを実行し、必要なライブラリを導入する。
pip install fairchem-core==2.2.0 ase==3.25.0 torch==2.6.0
- fairchem-coreは、FAIR Chemistryが管理しているNNPを動作させるために必要なライブラリである。
- aseはNNPに電子エネルギーを算出したい分子構造を渡すために必要なインターフェイスの役割を果たすために必要なライブラリである。
- torchはPyTorchライブラリを指す。これはニューラルネットワークなどの機械学習を行ったり、学習結果を扱ったりするために必須なライブラリである。
これで、Anaconda PowerShell Prompt
から仮想環境を立ち上げることで、NNPを使用する準備が整えることが出来る。
次に、NNPを使用するために必要なModelの情報が保存されている.pt
ファイルのダウンロードおよびNNPの自作モジュールへの導入方法について説明する。
1, 以下のサイトにアクセスして、uma-s-1.pt
をダウンロードする。(使用許諾が下りていれば可能である。)
https://huggingface.co/facebook/UMA
2, ダウンロード後、MultiOptPy-v1.12c
ディレクトリ内に存在するsoftware_path.conf
に対して、uma-s-1.pt
の絶対パスを用いて以下を追記する。
uma-s-1::(uma-s-1.ptの絶対パス)
これで、MultiOptPy-v1.12c
がNNPuma-s-1
を使用できるようになる。
使用するNNPに関する具体的な説明
今回使用するNNPについて具体的に説明する。
- UMAのModel Checkpointは
uma-s-1
を使用した。 - 小分子系のトレーニングセットである
Omol25
(omol
)を使用して学習したニューラルネットワークポテンシャルを使用する。
※自作モジュールでの具体的な使用の仕方に関しては、ase_calculation_tools.py
を参照
手順
1. 初期構造の準備
モデル反応系として、以下の構造を用意した。今回はファイルの名前をsn2_TfO_Cl.xyz
とした。 初期構造は以下のものを使用した。
13
OptimizedStructure
C -1.386405763052 -0.476809559055 0.777877172765
H -1.266242703990 -1.546680269650 0.638931549262
H -1.063580915401 -0.163522664054 1.766567230658
H -2.416915653058 -0.186275101518 0.618447972144
O -0.625887514364 0.228317623288 -0.233799043365
Cl -2.385053235407 -2.195060142464 3.667492356187
S 0.933222249251 0.140573419270 -0.083637251830
O 1.393818018757 1.004099167575 0.949302845804
O 1.374009468672 -1.211237752427 -0.162703700931
C 1.285914716198 0.954950593025 -1.695478786435
F 2.593815575804 1.170382815869 -1.753004542795
F 0.641969594379 2.109874756592 -1.789760074859
F 0.921336162208 0.171387113549 -2.700235726604
2. 遷移状態構造最適化のための初期構造の算出
a. 初期構造をカレントディレクトリにsn2_TfO_Cl.xyz
として保存し、以下を実行する。
python .\optmain.py sn2_TfO_Cl.xyz -opt rsirfo_fsb -os uma-s-1 -ma 300 1 6 -elec -1
-opt rsirfo_fsb
は準ニュートン法であるRS-I-RFO法を構造最適化に使用することを示す。初期のへシアンに関しては、特にオプションで指定しない限り、単位行列が使われる。-spin
はスピン多重度の指定である。PySCFを使用するときは目的とするスピン多重度に1を引いた値を指定する。(デフォルトでは1が指定される。)-elec M
は形式電荷をMとすることを示す。(デフォルトでは0が指定される。)-ma yyy a b
はyyykJ/molの活性化障壁を超えうるペア同士を近づける力を原子のラベル番号aとbのペアに構造最適化時に加えることを示す。-os uma-s-1
は今回使用するNNPを指定している。これを使用する際にASEライブラリが必要である。
これを実行すると、omol
のデータセットを使用したuma-s-1
モデルのNNPで得たエネルギーに対して、指定した人工力ポテンシャルを加えた上で初期構造を構造最適化することができる。
結果はyyyy_mm_dd
(今日の年月日)ディレクトリの中に存在するディレクトリを開いて確認できる。
正常終了していれば、このディレクトリ中に、sn2_TfO_Cl_traj.xyz
が存在するので、これをコピーして、MultiOptPy-v1.12c
ディレクトリに置く。
sn2_TfO_Cl_traj.xyz
は構造最適化の過程をAvogadro(公式ページ:https://avogadro.cc/ )等で可視化して確認できるようにしている。このsn2_TfO_Cl_traj.xyz
は次のNEB計算に使用する。
※sn2_TfO_Cl_traj.xyz
をアニメーションとして表示したい場合は、[https://github.com/ss0832/molecule_movie] を使うと良い。
(この人工力ポテンシャルを加えて行った構造最適化の結果はsn2_TfO_Cl_optimized.xyz
で確認できる。構造を可視化して、生成系になっているか確認する。反応系のままであれば、-ma
の設定を見直してb.をやり直す。今回の場合以下の構造が得られた。生成系の安定構造に近いものが得られていると判断できるため、次のNEB計算を行うことが可能である。)
b. sn2_TfO_Cl_traj.xyz
を初期パスとして、NEB法で経路の緩和を行う。
NEB法を用いることで、先ほど得られたsn2_TfO_Cl_traj.xyz
全体のエネルギーを下げることができる。これにより、パスのエネルギー極大値を持つ構造を遷移状態構造に近づける。(この時点ではまだ正確な遷移状態構造は求められていない。)
python .\nebmain.py sn2_TfO_Cl_traj.xyz -os uma-s-1 -ns 20 -modelhess -spng -nd 0.12 -elec -1
-nd N
はノード間の距離をN Åとして初期パスを作成することを示す。-ns n
はn回分NEB法による経路の緩和を行うことを示す。-fc M
はM回あたりの経路緩和回数に対して1回だけ正確なHessianを計算し、経路緩和に使用する。これを使用すると、Hessianを使用しない場合の経路緩和アルゴリズムとは別のものを使用して、経路緩和を行う。-spng
は緩和中のパスのエネルギープロファイルや各ノードの勾配のRMS値をmatplotlibで可視化するオプションである。-os uma-s-1
は今回使用するNNPを指定している。これを使用する際にASEライブラリが必要である。
c. 初期構造の決定及び遷移状態構造の計算
MultiOptPy-v1.12c
と同じディレクトリ内に、NEBという名前を含むディレクトリが生成されている。 そのディレクトリ内のenergy_plot.csv
を確認し、緩和後のパスのエネルギー極大値を示す構造を確認する。
パスの緩和後の各ノードのエネルギー一覧(単位
※bias_force_rms.csv
にて、各Iterationごとのすべてのノードの勾配のRMS値を確認できる。
経路緩和の結果、経路のエネルギー極大値を示す構造付近の勾配のRMS値の極小値を示す構造の中から目視で、ITR. 5の経路の8番(グラフ上では9番)の構造を遷移状態構造を求める初期構造として採用した。
※こちら[https://ss0832.github.io/molecule_viewer/] を使うことでも可視化は可能である。
sn2_TfO_Cl_traj_8_itr5.xyz
13
-1 1
C -1.567636541704 -0.697198665422 1.138885544663
H -1.263424767633 -1.643586556941 0.730662230225
H -1.024343335673 -0.177197134510 1.905872109127
H -2.465043340792 -0.248319586299 0.721934804033
O -0.606854761944 0.225552224060 -0.234600858531
Cl -2.273385930188 -1.855654275037 3.060904364374
S 0.869925960231 0.144910715834 -0.088243336141
O 1.409961797325 1.009144789254 0.923727788193
O 1.393259847776 -1.189523000047 -0.180982650606
C 1.297637326371 0.949488238073 -1.681159891467
F 2.615097395317 1.172420466741 -1.774438192801
F 0.675583342293 2.127747841474 -1.805396959874
F 0.939223008623 0.182214942819 -2.717164951194
構造が壊れていないので、これを遷移状態を求めるための初期構造とする。
sn2_TfO_Cl_traj_8_itr5.xyz
をMultiOptPy-v1.12c
と同じディレクトリ内にコピーする。
そして、以下を実行する。
python .\optmain.py sn2_TfO_Cl_traj_8_itr5.xyz -freq -tcc -opt rsirfo_bofill -fc 5 -order 1 -os uma-s-1 -elec -1
-opt rsirfo_bofill
は遷移状態構造の最適化向けのoptimizerを指定することを意味する。準ニュートン法であるRS-I-RFO法を使用する。今回は-fc
で正確なへシアンを計算するようにしているので、初期へシアンは正確なへシアンを使用するようになっている。-order 1
は一次の鞍点を求めることを指定する。(デフォルトだと極小値を求めるようになっている。)-fc 5
は5回の反復回数当たり1回正確なへシアンを計算することを指定する。-freq
は収束条件を満たした後に基準振動解析を行うことを示す。(自前で実装しているため、あくまで目安として使用することを推奨する。各振動モードをvibration_animation
内のxyzファイルで可視化できる。)UMAモデルから算出されるHessianは数値微分により求めているため、原子数Zが多いとZの二乗オーダーで計算コストが急増する。-tcc
は収束条件を厳しくすることを示す。(Gaussianのtightと同等)
実行して得られた正確な遷移状態構造と思われる構造を以下に示す。
(実行して得られた正確な遷移状態構造は計算開始時に、yyyy_mm_dd
ディレクトリ内に生成された新規ディレクトリ内のYYY_optimized.xyz
として保存されている。)
13
OptimizedStructure
C -1.224984846859 -0.571003708440 1.075951296306
H -0.575595620499 -1.428287152591 1.093157326334
H -1.598618613919 -0.190940482580 2.007199797083
H -1.790334760963 -0.375330547581 0.184167857359
O -0.017357241766 0.718020529750 0.880483587292
Cl -3.052574784020 -2.264244031572 1.435473110459
S 1.290968648373 0.459076973715 0.202478923820
O 2.240494497013 1.492236275482 0.483808980086
O 1.699967248403 -0.912456273296 0.264619044376
C 0.843386015253 0.719804730333 -1.564144471486
F 1.899451106179 0.499757543437 -2.355109057435
F 0.419563630029 1.969976393393 -1.777618905050
F -0.134365277225 -0.116610250051 -1.930467489143
停留点に収束した分子構造が得られた。-freq
オプションにより生成されたnormal_modes.txt
やvibration_animation
ディレクトリ内の振動モードのアニメーションを確認した。
以下に-freq
オプションで生成されたnormal_modes.txt
の一部を示す。
Mode 0 1 2
Freq [cm^-1] -509.0995 24.9000 45.3342
Reduced mass [au] 12.4330 11.6975 18.3241
Force const [Dyne/A] -1.8986 0.0043 0.0222
Char temp [K] 0.0000 35.8256 65.2258
Normal mode x y z x y z x y z
C 0.18951 0.17982 -0.03651 -0.02950 -0.01962 -0.00623 -0.00285 -0.01245 -0.00097
H -0.00145 0.03158 0.00670 -0.00831 -0.00114 0.10025 -0.00870 -0.01631 0.03745
H 0.00613 -0.01462 -0.02569 -0.08395 0.05555 -0.05892 -0.01916 0.01898 -0.02061
H 0.02155 -0.00912 0.02266 0.00910 -0.11444 -0.05196 0.01792 -0.03485 -0.01932
O -0.04315 -0.04614 0.01240 -0.04978 -0.00648 -0.05398 0.00843 -0.02350 -0.00629
Cl -0.02989 -0.02706 0.00570 -0.00238 -0.03365 0.08579 -0.03703 0.03229 0.02880
S 0.00291 -0.01531 -0.01020 -0.02953 -0.01021 -0.01312 0.00847 -0.01546 -0.00802
O -0.03546 0.00457 0.01532 -0.02538 -0.02731 0.03570 0.00534 -0.01483 0.00085
O 0.00002 -0.00408 0.00216 -0.04926 -0.01656 -0.02294 0.01248 -0.01486 -0.01997
C -0.00694 -0.00058 -0.00780 0.03603 0.02947 -0.02398 0.00913 0.00157 -0.00534
F -0.00030 0.00028 0.00526 0.05695 0.01428 0.00821 0.03973 0.12317 0.00137
F 0.00016 0.00004 0.00368 0.07590 0.04372 -0.01912 -0.10044 -0.02931 0.03079
F -0.00029 0.00005 0.00036 0.02626 0.06046 -0.07057 0.08909 -0.07394 -0.04617
(...snip...)
その結果、虚振動が1つであることが確認できた。つまりこの構造は遷移状態構造である。
次に、vibration_animation
内の虚振動を示す分子振動が示されたxyzファイル(mode_1_XXXi_wave_number.xyz
)をAvogadroで確認すると、想定される反応系と生成系をつなぐ方向に振動していることを確認できた。
終わりに
自作モジュールで、UMAモデルのニューラルネットワークポテンシャル(NNP)を用いて、SN2反応(基質-methyl Trifluoromethanesulfonate, 求核剤-chloride ion)のある1つの遷移状態構造を算出する手順を説明した。
参考
- https://github.com/ss0832/MultiOptPy (自作モジュールMultiOptPyのレポジトリ)
- https://avogadro.cc/ (Avogadro、分子構造可視化ツール)
- https://ai.meta.com/blog/meta-fair-science-new-open-source-releases/ (UMAの公開に関する記事)
- https://github.com/facebookresearch/fairchem (FAIR Chemistryの提供するGitHubのレポジトリ)
- https://fair-chem.github.io/ (同上のレポジトリの内容に関して説明したサイト)
- https://huggingface.co/facebook/UMA (NNPの配布サイト, Hugging Faceへのアカウント登録と配布元の使用許諾が必要である。)
- The Journal of Chemical Physics 2010, 132, 241102.
- The Journal of Chemical Physics 1991, 94, 751–760.
- In Classical and Quantum Dynamics in Condensed Phase Simulations; WORLD SCIENTIFIC: LERICI, Villa Marigola, 1998; pp 385–404.
- The Journal of Chemical Physics, 2020, 153, 024109.
- The Journal of Chemical Physics, 2022, 144, 214108.
個人的な技術的補足
-modelhess
を使わない場合のアルゴリズムを用いたnebmain.py
による経路緩和の結果
コマンド
python .\nebmain.py sn2_TfO_Cl_traj.xyz -os uma-s-1 -ns 20 -spng -nd 0.12 -elec -1
結果
パスの緩和後の各ノードのエネルギー一覧(単位
※bias_force_rms.csv
にて、各Iterationごとのすべてのノードの勾配のRMS値を確認できる。
緩和後の経路のエネルギー極大値を示すノードの分子構造 sn2_TfO_Cl_traj_7.xyz
13
-1 1
C -1.549142260005 -0.653671115291 1.069180699228
H -1.279657746401 -1.625274176224 0.701858098940
H -1.052794322897 -0.194029897330 1.899075175020
H -2.446417855902 -0.200584199293 0.654080323175
O -0.600625035880 0.220068147006 -0.223447869217
Cl -2.280127118318 -1.920193405689 3.180663095528
S 0.885627547618 0.141437217985 -0.082433822444
O 1.415807236607 1.005987893084 0.930409801323
O 1.403468329770 -1.192309255890 -0.176883358271
C 1.294772767964 0.947472494490 -1.675652385172
F 2.611001219499 1.173083436504 -1.772686192712
F 0.665203793267 2.121271918954 -1.796760223513
F 0.932883444678 0.176740941694 -2.707403341884