Home
3584 words
18 minutes
【計算化学】自作pythonモジュールで遷移状態構造を求めてみる(SN2反応(基質-methyl p-toluenesulfonate, 求核剤-fluoride ion), NNP使用)

最終更新:2025-08-19

概要#

本記事では、自作モジュール(MultiOptPy)で、SN2反応(基質-methyl p-toluenesulfonate, 求核剤-fluoride ion)の遷移状態構造を算出してみる。使用する計算レベルは、Meta社のFAIR Chemistryが開発したニューラルネットワークポテンシャル(NNP)であるUMA(Meta’s Universal Model for Atoms)を使用する。

MultiOptPyは電子状態計算ソフトウェアを用いた分子構造最適化手法の勉強を目的として作成したpythonモジュールである。

MultiOptPyのレポジトリ:https://github.com/ss0832/MultiOptPy

SN2反応について:

今回使用したニューラルネットワークポテンシャルについて:

使用した自作モジュールMultiOptPyのバージョン#

v1.12c

環境#

Windows 11

※Windows 11環境下でAnaconda PowerShell Promptを使用した。

Source codeのダウンロード#

wget https://github.com/ss0832/MultiOptPy/archive/refs/tags/v1.12c.zip
unzip v1.12c.zip
cd MultiOptPy-v1.12c

環境構築手順#

今回は、Windows 11のPower Shellを使用した。初めに、NNPを使用できる環境が整ったAnaconda PowerShell Promptを用意する手順を説明する。

1, https://repo.anaconda.com/archive/ より、Anaconda3-2025.06-1-Windows-x86_64.exeでAnacondaをインストールする。

2, 検索機能を使い、スタートからAnaconda PowerShell Promptを開く。

3, 以下のコマンドを実行し、仮想環境を作成する。

conda create -n (任意の仮想環境名) python=3.12.7

4, 先ほど作成した仮想環境をconda activate (仮想環境名)で起動させる。

5, 以下のコマンドを実行し、必要なライブラリを導入する。

pip install fairchem-core==2.2.0 ase==3.25.0 torch==2.6.0
  • fairchem-coreは、FAIR Chemistryが管理しているNNPを動作させるために必要なライブラリである。
  • aseはNNPに電子エネルギーを算出したい分子構造を渡すために必要なインターフェイスの役割を果たすために必要なライブラリである。
  • torchはPyTorchライブラリを指す。これはニューラルネットワークなどの機械学習を行ったり、学習結果を扱ったりするために必須なライブラリである。

これで、Anaconda PowerShell Promptから仮想環境を立ち上げることで、NNPを使用する準備が整えることが出来る。

次に、NNPを使用するために必要なModelの情報が保存されている.ptファイルのダウンロードおよびNNPの自作モジュールへの導入方法について説明する。

1, 以下のサイトにアクセスして、uma-s-1.ptをダウンロードする。(使用許諾が下りていれば可能である。)

https://huggingface.co/facebook/UMA

2, ダウンロード後、MultiOptPy-v1.12cディレクトリ内に存在するsoftware_path.confに対して、uma-s-1.ptの絶対パスを用いて以下を追記する。

uma-s-1::(uma-s-1.ptの絶対パス)

これで、MultiOptPy-v1.12cがNNPuma-s-1を使用できるようになる。

使用するNNPに関する具体的な説明#

今回使用するNNPについて具体的に説明する。

  • UMAのModel Checkpointはuma-s-1を使用した。
  • 小分子系のトレーニングセットであるOmol25(omol)を使用して学習したニューラルネットワークポテンシャルを使用する。

※自作モジュールでの具体的な使用の仕方に関しては、ase_calculation_tools.py を参照

手順#

1. 初期構造の準備#

モデル反応系として、以下の構造を用意した。今回はファイルの名前をsn2_TsO_F.xyzとした。 初期構造は以下のものを使用した。

23
OptimizedStructure
C     -2.367144806086     -1.435124556218      2.681308234558
H     -2.205878568814     -2.504579256788      2.563941234161
H     -1.996681683459     -1.108122539010      3.652296141891
H     -3.416430086435     -1.184749375474      2.571481403828
O     -1.693911917676     -0.722835044631      1.620286118887
F     -3.261827884161     -2.925791773035      5.148957274955
S     -0.108353625384     -0.793745813358      1.721680632785
O      0.307810725571      0.036745116285      2.810508660244
O      0.278468241412     -2.172789753032      1.706110783233
C      0.307856641328     -0.040758206107      0.194940145183
C      0.359797507726      1.342559652112      0.098311167829
C      0.644417405624     -0.851483873565     -0.878268367207
C      0.782503328112      1.914954067938     -1.089284344668
H      0.084802568919      1.955528312532      0.945623888973
C      1.071971517453     -0.261569492565     -2.055628074738
H      0.585686511474     -1.926415154011     -0.779253854588
C      1.160034341744      1.122760296698     -2.172044932688
H      0.838481951881      2.993897355013     -1.175643400190
H      1.357454338290     -0.883272347807     -2.896444372140
C      1.703795146591      1.742870581997     -3.426344132572
H      2.788175840476      1.833335289401     -3.355550724042
H      1.480620781805      1.130285854286     -4.296714460152
H      1.298351723607      2.738300659337     -3.590269023541
初期パスを求めるための初期構造

2. 遷移状態構造最適化のための初期構造の算出#

a. 初期構造をカレントディレクトリにsn2_TsO_F.xyzとして保存し、以下を実行する。#

python .\optmain.py sn2_TsO_F.xyz -opt rsirfo_fsb -os uma-s-1 -ma 300 1 6 -elec -1   
  • -opt rsirfo_fsbは準ニュートン法であるRS-I-RFO法を構造最適化に使用することを示す。初期のへシアンに関しては、特にオプションで指定しない限り、単位行列が使われる。
  • -spinはスピン多重度の指定である。PySCFを使用するときは目的とするスピン多重度に1を引いた値を指定する。(デフォルトでは1が指定される。)
  • -elec Mは形式電荷をMとすることを示す。(デフォルトでは0が指定される。)
  • -ma yyy a bはyyykJ/molの活性化障壁を超えうるペア同士を近づける力を原子のラベル番号aとbのペアに構造最適化時に加えることを示す。
  • -os uma-s-1は今回使用するNNPを指定している。これを使用する際にASEライブラリが必要である。

これを実行すると、omolのデータセットを使用したuma-s-1モデルのNNPで得たエネルギーに対して、指定した人工力ポテンシャルを加えた上で初期構造を構造最適化することができる。

結果はyyyy_mm_dd(今日の年月日)ディレクトリの中に存在するディレクトリを開いて確認できる。

正常終了していれば、このディレクトリ中に、sn2_TsO_F_traj.xyzが存在するので、これをコピーして、MultiOptPy-v1.12cディレクトリに置く。

sn2_TsO_F_traj.xyzは構造最適化の過程をAvogadro(公式ページ:https://avogadro.cc/ )等で可視化して確認できるようにしている。このsn2_TsO_F_traj.xyzは次のNEB計算に使用する。

sn2_TsO_F_traj.xyzをアニメーションとして表示したい場合は、[https://github.com/ss0832/molecule_movie] を使うと良い。

(この人工力ポテンシャルを加えて行った構造最適化の結果はsn2_TsO_F_optimized.xyzで確認できる。構造を可視化して、生成系になっているか確認する。反応系のままであれば、-maの設定を見直してb.をやり直す。今回の場合以下の構造が得られた。生成系の安定構造に近いものが得られていると判断できるため、次のNEB計算を行うことが可能である。)

b. sn2_TsO_F_traj.xyzを初期パスとして、NEB法で経路の緩和を行う。#

NEB法を用いることで、先ほど得られたsn2_TsO_F_traj.xyz全体のエネルギーを下げることができる。これにより、パスのエネルギー極大値を持つ構造を遷移状態構造に近づける。(この時点ではまだ正確な遷移状態構造は求められていない。)

python .\nebmain.py sn2_TsO_F_traj.xyz -os uma-s-1 -ns 20 -modelhess -spng -nd 0.12 -elec -1
  • -nd Nはノード間の距離をN Åとして初期パスを作成することを示す。
  • -ns nはn回分NEB法による経路の緩和を行うことを示す。
  • -fc MはM回あたりの経路緩和回数に対して1回だけ正確なHessianを計算し、経路緩和に使用する。これを使用すると、Hessianを使用しない場合の経路緩和アルゴリズムとは別のものを使用して、経路緩和を行う。
  • -spngは緩和中のパスのエネルギープロファイルや各ノードの勾配のRMS値をmatplotlibで可視化するオプションである。
  • -os uma-s-1は今回使用するNNPを指定している。これを使用する際にASEライブラリが必要である。

c. 初期構造の決定及び遷移状態構造の計算#

MultiOptPy-v1.12cと同じディレクトリ内に、NEBという名前を含むディレクトリが生成されている。 そのディレクトリ内のenergy_plot.csvを確認し、緩和後のパスのエネルギー極大値を示す構造を確認する。

パスの緩和後の各ノードのエネルギー一覧(単位) (energy_plot.csvに保存されている。)

NEB計算の結果の可視化
NEB計算の結果の可視化

bias_force_rms.csvにて、各Iterationごとのすべてのノードの勾配のRMS値を確認できる。

経路緩和の結果、経路のエネルギー極大値を示す構造の中から目視で、ITR. 5の経路の6番(グラフ上では7番)の構造を遷移状態構造を求める初期構造として採用した。

※こちら[https://ss0832.github.io/molecule_viewer/] を使うことでも可視化は可能である。

sn2_TsO_F_traj_6_itr5.xyz

23
-1 1
C      -2.468266205720     -1.580839119880      2.923581379995
H      -2.217120386217     -2.579904546931      2.639481874431
H      -1.990341270277     -1.126332807927      3.761336610437
H      -3.456580316879     -1.238730266029      2.665827429317
O      -1.684575379912     -0.731907145440      1.622097473372
F      -3.148500167960     -2.658366201859      4.706281462796
S      -0.177273688731     -0.799873525396      1.734419931484
O       0.326398810787      0.045748235969      2.785250257057
O       0.303000233411     -2.160469045570      1.685692491675
C       0.304253888818     -0.045677504523      0.199541383677
C       0.361225074400      1.335809553525      0.091640449290
C       0.644425903497     -0.844747677150     -0.880151077433
C       0.785360577049      1.914136636640     -1.094741631702
H       0.088250028924      1.946596049779      0.942187476405
C       1.073069632266     -0.257325760251     -2.060983152064
H       0.586799717360     -1.919735506266     -0.776855493528
C       1.163422522814      1.125054939853     -2.177558599043
H       0.841249829694      2.994341561486     -1.177924556908
H       1.357603830747     -0.882341373647     -2.900606894426
C       1.713500469630      1.747083890624     -3.431044428745
H       2.800942863524      1.838567990923     -3.360195153986
H       1.488333823765      1.133914421679     -4.304563108596
H       1.304820209011      2.744997200392     -3.592714123504
NEB法により緩和した経路から得られた遷移状態構造を求めるための初期構造

構造が壊れていないので、これを遷移状態を求めるための初期構造とする。

sn2_TsO_F_traj_6_itr5.xyzMultiOptPy-v1.12cと同じディレクトリ内にコピーする。

そして、以下を実行する。

python .\optmain.py sn2_TsO_F_traj_6_itr5.xyz -freq -tcc -opt rsirfo_bofill -fc 5 -order 1 -os uma-s-1 -elec -1
  • -opt rsirfo_bofillは遷移状態構造の最適化向けのoptimizerを指定することを意味する。準ニュートン法であるRS-I-RFO法を使用する。今回は-fcで正確なへシアンを計算するようにしているので、初期へシアンは正確なへシアンを使用するようになっている。
  • -order 1は一次の鞍点を求めることを指定する。(デフォルトだと極小値を求めるようになっている。)
  • -fc 5は5回の反復回数当たり1回正確なへシアンを計算することを指定する。
  • -freqは収束条件を満たした後に基準振動解析を行うことを示す。(自前で実装しているため、あくまで目安として使用することを推奨する。各振動モードをvibration_animation内のxyzファイルで可視化できる。)UMAモデルから算出されるHessianは数値微分により求めているため、原子数Zが多いとZの二乗オーダーで計算コストが急増する。
  • -tccは収束条件を厳しくすることを示す。(Gaussianのtightと同等)

実行して得られた正確な遷移状態構造と思われる構造を以下に示す。

(実行して得られた正確な遷移状態構造は計算開始時に、yyyy_mm_ddディレクトリ内に生成された新規ディレクトリ内のYYY_optimized.xyzとして保存されている。)

23
OptimizedStructure
C     -2.432917313467     -1.600963465346      2.852761069225
H     -2.010615752952     -2.588260792165      2.902159518701
H     -2.230821066212     -0.935456369894      3.672386659125
H     -3.380438391771     -1.497607442973      2.361136204828
O     -1.513545438687     -0.900936438735      1.617325277331
F     -3.750488409460     -2.450259596200      4.294691715023
S     -0.011358997645     -0.808013665573      1.811183148053
O      0.335291841992      0.118939447406      2.858141298416
O      0.601366195006     -2.111544784815      1.847357186144
C      0.447310414624     -0.055839121068      0.269269101913
C      0.552054458937      1.321983667852      0.177614107839
C      0.688282384890     -0.852918244722     -0.838778178959
C      0.893376917150      1.902577723664     -1.034790349985
H      0.369569881892      1.922998184492      1.058302122574
C      1.028130974020     -0.262138325412     -2.045121565453
H      0.611878928983     -1.927546648211     -0.740899645046
C      1.136031086477      1.121280334909     -2.159944475437
H      0.972214707442      2.981524904676     -1.108640622161
H      1.212713127966     -0.884427486457     -2.913800985558
C      1.537965861338      1.753675864860     -3.465501563268
H      2.625855515845      1.797549241573     -3.558020253509
H      1.159081114804      1.182472201779     -4.313549803531
H      1.159061958829      2.772910810360     -3.543279966268
遷移状態構造

停留点に収束した分子構造が得られた。-freqオプションにより生成されたnormal_modes.txtvibration_animationディレクトリ内の振動モードのアニメーションを確認した。

以下に-freqオプションで生成されたnormal_modes.txtの一部を示す。

Mode                                 0                   1                   2
Freq [cm^-1]                     -454.1207              6.4205             28.3788
Reduced mass [au]                  12.0173              3.8288              2.9325
Force const [Dyne/A]               -1.4602              0.0001              0.0014
Char temp [K]                       0.0000              9.2377             40.8308
Normal mode                   x         y         z            x         y         z            x         y         z     
       C                 0.15869    0.10234   -0.17370   -0.00346    0.02672    0.01239   -0.00251    0.02125    0.00754
       H                -0.00285    0.03511   -0.00283   -0.02388    0.01914    0.03592   -0.03172    0.00349   -0.10016
       H                 0.00455   -0.02019   -0.02828    0.01593    0.04438   -0.00675    0.03750   -0.06623    0.06885
       H                 0.02449   -0.01881    0.04810   -0.00440    0.03262    0.01546   -0.01137    0.10073    0.04132
       O                -0.03494   -0.01983    0.03337    0.00301   -0.02491   -0.01211   -0.01034    0.11208    0.05345
       F                -0.05518   -0.03418    0.05753   -0.01130    0.09077    0.04292    0.00452   -0.07993   -0.04508
       S                 0.01161   -0.00281    0.00810    0.00412   -0.03460   -0.01586    0.00080    0.02004    0.01097
       O                -0.00711    0.00185   -0.00100    0.00948   -0.04931   -0.00458    0.08670   -0.00773    0.00711
       O                -0.00525   -0.00193   -0.00225    0.00014   -0.03696   -0.03453   -0.07687   -0.01721   -0.01537
       C                -0.02352   -0.00174   -0.00150    0.00275   -0.01614   -0.00727    0.00149    0.00476    0.00375
       C                -0.00825   -0.00138    0.00286   -0.09035   -0.00837   -0.01221   -0.01498    0.00658   -0.01414
       C                -0.00798   -0.00269    0.00169    0.09331   -0.00531    0.00588    0.01571   -0.00590    0.01670
       C                -0.00005   -0.00228    0.00423   -0.09363    0.00810   -0.00400   -0.01894   -0.00584   -0.01910
       H                -0.00784    0.00043    0.00134   -0.15909   -0.01524   -0.02168   -0.02502    0.01658   -0.02298
       C                -0.00013   -0.00169    0.00374    0.09092    0.01194    0.01241    0.01522   -0.01688    0.00908
       H                -0.00710   -0.00275   -0.00129    0.16493   -0.00989    0.01065    0.02716   -0.00535    0.03103
       C                -0.00005   -0.00161    0.00329   -0.00278    0.01785    0.00761   -0.00266   -0.01880   -0.00884
       H                 0.00372   -0.00293    0.00710   -0.16720    0.01323   -0.00813   -0.03363   -0.00560   -0.03373
       H                 0.00374   -0.00276    0.00605    0.16239    0.01964    0.02213    0.02727   -0.02618    0.01852
       C                -0.00067   -0.00133    0.00303   -0.00453    0.04098    0.01827   -0.00107   -0.02397   -0.01085
       H                -0.00082   -0.00225    0.00474   -0.00446    0.19736    0.09275   -0.00055    0.24005    0.11902
       H                -0.00043   -0.00192    0.00382    0.13691   -0.03663    0.00763    0.24259   -0.18463   -0.01066
       H                -0.00037   -0.00158    0.00363   -0.14681   -0.01581   -0.03518   -0.24230   -0.12277   -0.13771

(...snip...)

その結果、虚振動が1つであることが確認できた。つまりこの構造は遷移状態構造である。

次に、vibration_animation内の虚振動を示す分子振動が示されたxyzファイル(mode_1_XXXi_wave_number.xyz)をAvogadroで確認すると、想定される反応系と生成系をつなぐ方向に振動していることを確認できた。

終わりに#

   自作モジュールで、UMAモデルのニューラルネットワークポテンシャル(NNP)を用いて、SN2反応(基質-methyl p-toluenesulfonate, 求核剤-fluoride ion)のある1つの遷移状態構造を算出する手順を説明した。

参考#

個人的な技術的補足#

-modelhessを使わない場合のアルゴリズムを用いたnebmain.pyによる経路緩和の結果

コマンド#

python .\nebmain.py sn2_TsO_F_traj.xyz -os uma-s-1 -ns 20 -spng -nd 0.12 -elec -1

結果#

パスの緩和後の各ノードのエネルギー一覧(単位) (energy_plot.csvに保存されている。)

NEB計算の結果の可視化
NEB計算の結果の可視化

bias_force_rms.csvにて、各Iterationごとのすべてのノードの勾配のRMS値を確認できる。

緩和後の経路のエネルギー極大値を示すノードの分子構造 sn2_TsO_F_traj_5.xyz

23
-1 1
C      -2.476489412528     -1.563301061582      2.887986639088
H      -2.208970367848     -2.551007150293      2.586871950324
H      -1.997447362053     -1.115339851564      3.723442939024
H      -3.444730977768     -1.198398098249      2.586775111563
O      -1.684507998183     -0.732558408050      1.638656381886
F      -3.185108289437     -2.736162273008      4.840645899439
S      -0.160616811697     -0.799587433049      1.734114647999
O       0.331385596843      0.047242176536      2.788095870216
O       0.304763354144     -2.160776648862      1.689848036926
C       0.314444740111     -0.044540952554      0.202769662559
C       0.368762232398      1.336950115800      0.097937587981
C       0.649317288080     -0.847626905384     -0.874890300572
C       0.789170310656      1.912468794762     -1.089899225577
H       0.097762287082      1.947651336386      0.948974830949
C       1.073372110341     -0.259684878116     -2.055896706698
H       0.590523045698     -1.922796043798     -0.771321293037
C       1.162549660557      1.122795268161     -2.173838976407
H       0.843243044225      2.992124392445     -1.175045439084
H       1.354023867591     -0.884062789180     -2.896629582010
C       1.706586468164      1.744828052149     -3.429968726112
H       2.793675453500      1.836966854813     -3.364264924004
H       1.480029391018      1.132439935869     -4.302906921151
H       1.298262369107      2.742375566768     -3.591457463301

【計算化学】自作pythonモジュールで遷移状態構造を求めてみる(SN2反応(基質-methyl p-toluenesulfonate, 求核剤-fluoride ion), NNP使用)
https://ss0832.github.io/posts/20250819_mop_usage_80/
Author
ss0832
Published at
2025-08-19