最終更新:2025-08-28
概要
本記事では、自作モジュール(MultiOptPy)で、Prilezhaevエポキシ化 (過酸化物
MultiOptPyは電子状態計算ソフトウェアを用いた分子構造最適化手法の勉強を目的として作成したpythonモジュールである。
MultiOptPyのレポジトリ:https://github.com/ss0832/MultiOptPy
Prilezhaevエポキシ化反応について:
- https://www.chem-station.com/odos/2009/06/prilezhaev-prilezhaev-epoxidat.html
- https://en.wikipedia.org/wiki/Epoxide
今回使用したニューラルネットワークポテンシャルについて:
- https://ai.meta.com/blog/meta-fair-science-new-open-source-releases/ (UMAの公開に関する記事)
- https://github.com/facebookresearch/fairchem (FAIR Chemistryの提供するGitHubのレポジトリ)
- https://fair-chem.github.io/ (同上のレポジトリの内容に関して説明したサイト)
- https://huggingface.co/facebook/UMA (NNPの配布サイト, Hugging Faceへのアカウント登録と配布元の使用許諾が必要である。)
使用した自作モジュールMultiOptPyのバージョン
v1.15.1b
環境
Windows 11
※Windows 11環境下でAnaconda PowerShell Promptを使用した。
Source codeのダウンロード
wget https://github.com/ss0832/MultiOptPy/archive/refs/tags/v1.15.1b.zip
unzip v1.15.1b.zip
cd MultiOptPy-v1.15.1b
環境構築手順
今回は、Windows 11のPower Shellを使用した。初めに、NNPを使用できる環境が整ったAnaconda PowerShell Promptを用意する手順を説明する。
1, https://repo.anaconda.com/archive/ より、Anaconda3-2025.06-1-Windows-x86_64.exe
でAnacondaをインストールする。
2, 検索機能を使い、スタートからAnaconda PowerShell Prompt
を開く。
3, 以下のコマンドを実行し、仮想環境を作成する。
conda create -n (任意の仮想環境名) python=3.12.7
4, 先ほど作成した仮想環境をconda activate (仮想環境名)
で起動させる。
5, 以下のコマンドを実行し、必要なライブラリを導入する。
pip install fairchem-core==2.2.0 ase==3.25.0 torch==2.6.0
- fairchem-coreは、FAIR Chemistryが管理しているNNPを動作させるために必要なライブラリである。
- aseはNNPに電子エネルギーを算出したい分子構造を渡すために必要なインターフェイスの役割を果たすために必要なライブラリである。
- torchはPyTorchライブラリを指す。これはニューラルネットワークなどの機械学習を行ったり、学習結果を扱ったりするために必須なライブラリである。
これで、Anaconda PowerShell Prompt
から仮想環境を立ち上げることで、NNPを使用する準備が整えることが出来る。
次に、NNPを使用するために必要なModelの情報が保存されている.pt
ファイルのダウンロードおよびNNPの自作モジュールへの導入方法について説明する。
1, 以下のサイトにアクセスして、uma-s-1.pt
をダウンロードする。(使用許諾が下りていれば可能である。)
https://huggingface.co/facebook/UMA
2, ダウンロード後、MultiOptPy-v1.15.1b
ディレクトリ内に存在するsoftware_path.conf
に対して、uma-s-1.pt
の絶対パスを用いて以下を追記する。
uma-s-1::(uma-s-1.ptの絶対パス)
これで、MultiOptPy-v1.15.1b
がNNPuma-s-1
を使用できるようになる。
使用するNNPに関する具体的な説明
今回使用するNNPについて具体的に説明する。
- UMAのModel Checkpointは
uma-s-1
を使用した。 - 小分子系のトレーニングセットである
Omol25
(omol
)を使用して学習したニューラルネットワークポテンシャルを使用する。
※自作モジュールでの具体的な使用の仕方に関しては、ase_calculation_tools.py
を参照
手順
1. 初期構造の準備
モデル反応系として、以下の構造を用意した。今回はファイルの名前をepoxidation_CF3.xyz
とした。 初期構造は以下のものを使用した。
15
C -1.484862051135 -1.123428475752 1.674248663457
H -0.971213604719 -1.935093224243 1.173879203291
H -2.526178548552 -1.277600787685 1.930201182664
C -0.863065355059 0.010480994436 1.969220782378
H -1.370359943651 0.823431418687 2.473652960114
H 0.184631474330 0.159133915950 1.734020223308
C 0.652282295607 -0.031085500806 -1.259415330415
O -1.593031111860 0.372515378196 -1.215731399726
H -1.620984866758 0.062325322664 -0.286945715875
O -0.289236367706 0.923608507976 -1.305729369193
O 0.504974110440 -1.193238563350 -1.065049441611
C 2.033577938754 0.649319857146 -1.428687313413
F 2.329973669689 1.336363901969 -0.315956609649
F 2.968683850324 -0.270370635345 -1.617573776417
F 2.044808510295 1.493637890159 -2.460134058913
2. 遷移状態構造最適化のための初期構造の算出
a. 初期構造をカレントディレクトリにepoxidation_CF3.xyz
として保存し、以下を実行する。
python .\optmain.py .\epoxidation_CF3.xyz -opt rsirfo_fsb_gdiis -os uma-s-1 -modelhess -ma 200 1,4 8 200 9 11
-opt rsirfo_fsb_gdiis
は準ニュートン法であるRS-I-RFO法を構造最適化に使用することを示す。初期のへシアンに関しては、特にオプションで指定しない限り、単位行列が使われる。RS-I-RFO法で算出したステップとGDIIS法で算出したステップを混ぜて最適化する。-spin
はスピン多重度の指定である。PySCFを使用するときは目的とするスピン多重度に1を引いた値を指定する。(デフォルトでは1が指定される。)-elec M
は形式電荷をMとすることを示す。(デフォルトでは0が指定される。)-ma yyy a,b c
はyyykJ/molの活性化障壁を超えうるペア同士を近づける力を原子のラベル番号a,bのフラグメントとcのペアに構造最適化時に加えることを示す。-os uma-s-1
は今回使用するNNPを指定している。これを使用する際にASEライブラリが必要である。
これを実行すると、omol
のデータセットを使用したuma-s-1
モデルのNNPで得たエネルギーに対して、指定した人工力ポテンシャルを加えた上で初期構造を構造最適化することができる。
結果はyyyy_mm_dd
(今日の年月日)ディレクトリの中に存在するディレクトリを開いて確認できる。
正常終了していれば、このディレクトリ中に、epoxidation_CF3_traj.xyz
が存在するので、これをコピーして、MultiOptPy-v1.15.1b
ディレクトリに置く。
epoxidation_CF3_traj.xyz
は構造最適化の過程をAvogadro(公式ページ:https://avogadro.cc/ )等で可視化して確認できるようにしている。このepoxidation_CF3_traj.xyz
は次のNEB計算に使用する。
※epoxidation_CF3_traj.xyz
をアニメーションとして表示したい場合は、[https://github.com/ss0832/molecule_movie] を使うと良い。
(この人工力ポテンシャルを加えて行った構造最適化の結果はepoxidation_CF3_optimized.xyz
で確認できる。構造を可視化して、生成系になっているか確認する。反応系のままであれば、-ma
の設定を見直してb.をやり直す。今回の場合以下の構造が得られた。生成系の安定構造に近いものが得られていると判断できるため、次のNEB計算を行うことが可能である。)
b. epoxidation_CF3_traj.xyz
を初期パスとして、NEB法で経路の緩和を行う。
NEB法を用いることで、先ほど得られたepoxidation_CF3_traj.xyz
全体のエネルギーを下げることができる。これにより、パスのエネルギー極大値を持つ構造を遷移状態構造に近づける。(この時点ではまだ正確な遷移状態構造は求められていない。)
python .\nebmain.py epoxidation_CF3_traj.xyz -os uma-s-1 -modelhess -ns 10 -spng -nd 0.3
-nd N
はノード間の距離をN Åとして初期パスを作成することを示す。-ns n
はn回分NEB法による経路の緩和を行うことを示す。-fc M
はM回あたりの経路緩和回数に対して1回だけ正確なHessianを計算し、経路緩和に使用する。これを使用すると、Hessianを使用しない場合の経路緩和アルゴリズムとは別のものを使用して、経路緩和を行う。-spng
は緩和中のパスのエネルギープロファイルや各ノードの勾配のRMS値をmatplotlibで可視化するオプションである。-modelhess
は経路の緩和に計算コストの低いHessianを用いることを指定する。これに伴い、Hessianを使う経路緩和アルゴリズムに変更となる。-os uma-s-1
は今回使用するNNPを指定している。これを使用する際にASEライブラリが必要である。
c. 初期構造の決定及び遷移状態構造の計算
MultiOptPy-v1.15.1b
と同じディレクトリ内に、NEBという名前を含むディレクトリが生成されている。 そのディレクトリ内のenergy_plot.csv
を確認し、緩和後のパスのエネルギー極大値を示す構造を確認する。
パスの緩和後の各ノードのエネルギー一覧(単位
※bias_force_rms.csv
にて、各Iterationごとのすべてのノードの勾配のRMS値を確認できる。
経路緩和の結果得られた経路のエネルギー極大値を示す構造を遷移状態構造を求める初期構造とした。
※こちら[https://ss0832.github.io/molecule_viewer/] を使うことでも可視化は可能である。
epoxidation_CF3_traj_11.xyz
(グラフでは12番)
15
0 1
C -1.753685022200 -1.172774686220 1.685501073528
H -1.160193997189 -2.067309487744 1.520485469391
H -2.821484487138 -1.317577237434 1.786558378490
C -1.185342058204 0.053292531220 1.768413424938
H -1.742623435168 0.924047910246 2.032521354829
H -0.104532001801 0.128034371287 1.810447383438
C 0.679349836089 0.304564271055 -1.217158214231
O -1.296013789557 0.309150860662 -0.154407609638
H -0.505906637728 -0.641782357515 -0.325147142130
O -0.263874838182 1.127860411143 -1.212979660921
O 0.572443696529 -0.863592850554 -0.732327132689
C 2.077695527641 0.713188200790 -1.665156028857
F 2.682539479841 1.249701880855 -0.595356732187
F 2.769117514826 -0.351088694487 -2.056541679979
F 2.052510212241 1.604284876695 -2.644852883982
構造が壊れていないので、これを遷移状態を求めるための初期構造とする。
epoxidation_CF3_traj_11.xyz
をMultiOptPy-v1.15.1b
と同じディレクトリ内にコピーする。
そして、以下を実行する。
python .\optmain.py .\epoxidation_CF3_traj_11.xyz -freq -tcc -opt rsirfo_bofill -fc 5 -order 1 -os uma-s-1
-opt rsirfo_bofill
は遷移状態構造の最適化向けのoptimizerを指定することを意味する。準ニュートン法であるRS-I-RFO法を使用する。今回は-fc
で正確なへシアンを計算するようにしているので、初期へシアンは正確なへシアンを使用するようになっている。-order 1
は一次の鞍点を求めることを指定する。(デフォルトだと極小値を求めるようになっている。)-fc 5
は5回の反復回数当たり1回正確なへシアンを計算することを指定する。-freq
は収束条件を満たした後に基準振動解析を行うことを示す。(自前で実装しているため、あくまで目安として使用することを推奨する。各振動モードをvibration_animation
内のxyzファイルで可視化できる。)UMAモデルから算出されるHessianは数値微分により求めているため、原子数Zが多いとZの二乗オーダーで計算コストが急増する。-tcc
は収束条件を厳しくすることを示す。(Gaussianのtightと同等)
実行して得られた正確な遷移状態構造と思われる構造を以下に示す。
(実行して得られた正確な遷移状態構造は計算開始時に、yyyy_mm_dd
ディレクトリ内に生成された新規ディレクトリ内のYYY_optimized.xyz
として保存されている。)
15
OptimizedStructure
C -2.151763462411 -0.971629727200 1.319839174852
H -1.843883978414 -1.959111396883 1.003258846548
H -3.081172751537 -0.589916541534 0.926189440399
C -1.450372561728 -0.284561943982 2.254961538883
H -1.804067491586 0.662896843238 2.632359533820
H -0.564666007693 -0.703716513901 2.711870892482
C 1.107490627476 0.285411733989 -1.006658247759
O -0.855750268311 0.298430592186 0.404177529567
H -0.131785995211 -0.398920732687 0.388891287815
O 0.113195978874 1.075199213515 -0.887181908974
O 1.293668812950 -0.749203269765 -0.372607399805
C 2.116988203468 0.730519676615 -2.090370641074
F 2.481178428880 2.004572994450 -1.911275924328
F 3.212781860714 -0.023217263818 -2.069314543081
F 1.558158604528 0.623246335775 -3.304139579346
停留点に収束した分子構造が得られた。-freq
オプションにより生成されたnormal_modes.txt
やvibration_animation
ディレクトリ内の振動モードのアニメーションを確認した。
以下に-freq
オプションで生成されたnormal_modes.txt
の一部を示す。
Mode 0 1 2
Freq [cm^-1] -589.5854 11.4658 51.3694
Reduced mass [au] 13.8864 7.0393 5.8229
Force const [Dyne/A] -2.8440 0.0005 0.0091
Char temp [K] 0.0000 16.4967 73.9091
Normal mode x y z x y z x y z
C 0.03625 0.03146 -0.07509 0.03871 -0.03988 0.03715 -0.01664 0.05711 0.08491
H 0.01696 0.01378 -0.03306 0.10336 -0.04400 0.11286 -0.09752 0.03787 0.06670
H 0.00196 0.00563 -0.01477 0.02113 -0.12485 -0.00373 -0.02774 0.10631 0.15879
C 0.05481 0.04715 -0.04947 -0.01632 0.07044 -0.00262 0.09775 0.02436 0.02314
H 0.00913 0.00991 -0.00186 -0.07938 0.07617 -0.07610 0.18137 0.04635 0.04627
H 0.02449 0.01761 -0.02249 0.00260 0.15733 0.04040 0.11259 -0.02131 -0.04720
C -0.01540 0.02524 -0.00820 -0.00239 -0.00734 -0.00497 -0.03711 -0.03732 -0.04913
O -0.10180 -0.10544 0.15144 -0.02495 -0.02656 -0.03537 -0.02053 -0.01988 -0.02741
H 0.03807 0.01154 -0.02680 0.01592 0.01477 0.02291 -0.04342 -0.04287 -0.05727
O 0.03624 0.03052 -0.04981 -0.05257 -0.05958 -0.07619 -0.04856 -0.04927 -0.06505
O -0.01636 0.00335 0.01089 0.04823 0.04592 0.06678 -0.04659 -0.04724 -0.06246
C 0.00191 -0.00669 0.00436 -0.00016 -0.00157 -0.00077 0.00485 0.00531 0.00722
F 0.00380 -0.00124 -0.00229 0.05525 -0.02489 0.06611 -0.03136 0.00892 0.05711
F 0.00829 -0.00245 -0.00363 -0.03127 -0.04755 -0.05156 0.02016 0.02845 0.04698
F 0.00309 -0.00052 -0.00247 -0.01523 0.08843 -0.00014 0.07108 0.02269 -0.02430
(...snip...)
その結果、虚振動が1つであることが確認できた。つまりこの構造は遷移状態構造である。
次に、vibration_animation
内の虚振動を示す分子振動が示されたxyzファイル(mode_1_XXXi_wave_number.xyz
)をAvogadroで確認すると、想定される反応系と生成系をつなぐ方向に振動していることを確認できた。
終わりに
自作モジュールで、UMAモデルのニューラルネットワークポテンシャル(NNP)を用いて、Prilezhaevエポキシ化 (過酸化物
参考
- https://github.com/ss0832/MultiOptPy (自作モジュールMultiOptPyのレポジトリ)
- https://avogadro.cc/ (Avogadro、分子構造可視化ツール)
- https://ai.meta.com/blog/meta-fair-science-new-open-source-releases/ (UMAの公開に関する記事)
- https://github.com/facebookresearch/fairchem (FAIR Chemistryの提供するGitHubのレポジトリ)
- https://fair-chem.github.io/ (同上のレポジトリの内容に関して説明したサイト)
- https://huggingface.co/facebook/UMA (NNPの配布サイト, Hugging Faceへのアカウント登録と配布元の使用許諾が必要である。)
- The Journal of Chemical Physics 2010, 132, 241102.
- The Journal of Chemical Physics 1991, 94, 751–760.
- In Classical and Quantum Dynamics in Condensed Phase Simulations; WORLD SCIENTIFIC: LERICI, Villa Marigola, 1998; pp 385–404.
- The Journal of Chemical Physics, 2020, 153, 024109.
- The Journal of Chemical Physics, 2022, 144, 214108.