Home
3990 words
20 minutes
【計算化学】自作pythonライブラリで遷移状態構造を求めてみる(BH9データセット, 3. Halogen atom transferのNo. 3の素過程, NNP使用)

最終更新:2025-10-05

概要#

本記事では、自作ライブラリ(MultiOptPy)で、BH9データセット 3. Halogen atom transferのNo. 3の素過程の遷移状態構造を算出してみる。計算レベルは、Meta社のFAIR Chemistryが開発したニューラルネットワークポテンシャル(NNP)であるUMA(Meta’s Universal Model for Atoms)とした。

MultiOptPyは電子状態計算ソフトウェアを用いた分子構造最適化手法の勉強を目的として作成したpythonライブラリである。

MultiOptPyのレポジトリ:https://github.com/ss0832/MultiOptPy

BH9のデータセットについて:

この文献のSupporting Informationから、データセットの詳細を確認できる。

今回使用したニューラルネットワークポテンシャルについて:

使用した自作ライブラリMultiOptPyのバージョン#

v1.18c

環境#

Windows 11

※Windows 11環境下でAnaconda PowerShell Promptを使用した。

Source codeのダウンロード(Unixコマンド)#

wget https://github.com/ss0832/MultiOptPy/archive/refs/tags/v1.18c.zip
unzip v1.18c.zip
cd MultiOptPy-v1.18c

https://github.com/ss0832/MultiOptPy/releases/tag/v1.18c にアクセスしてzipファイルをダウンロードする。Unixコマンドの場合とはディレクトリ名が異なるので都度読み替えていただけると良い。

環境構築手順#

今回は、Windows 11のPower Shellを使用した。初めに、NNPを使用できる環境が整ったAnaconda PowerShell Promptを用意する手順を説明する。

1, https://repo.anaconda.com/archive/ より、Anaconda3-2025.06-1-Windows-x86_64.exeでAnacondaをインストールする。

2, 検索機能を使い、スタートからAnaconda PowerShell Promptを開く。

3, 以下のコマンドを実行し、仮想環境を作成する。

conda create -n (任意の仮想環境名) python=3.12.7

4, 先ほど作成した仮想環境をconda activate (仮想環境名)で起動させる。

5, 以下のコマンドを実行し、必要なライブラリを導入する。

pip install ase==3.26.0 fairchem-core==2.7.1 torch==2.6.0
  • fairchem-coreは、FAIR Chemistryが管理しているNNPを動作させるために必要なライブラリである。
  • aseはNNPに電子エネルギーを算出したい分子構造を渡すために必要なインターフェイスの役割を果たすために必要なライブラリである。
  • torchはPyTorchライブラリを指す。これはニューラルネットワークなどの機械学習を行ったり、学習結果を扱ったりするために必須なライブラリである。

これで、Anaconda PowerShell Promptから仮想環境を立ち上げることで、NNPを使用する準備が整えることが出来る。

次に、NNPを使用するために必要なModelの情報が保存されている.ptファイルのダウンロードおよびNNPの自作ライブラリへの導入方法について説明する。

1, 以下のサイトにアクセスして、uma-s-1p1.ptをダウンロードする。(使用許諾が下りていれば可能である。)

https://huggingface.co/facebook/UMA

2, ダウンロード後、MultiOptPy-v1.18cディレクトリ内に存在するsoftware_path.confに対して、uma-s-1p1.ptの絶対パスを用いて以下を追記する。

uma-s-1p1::(uma-s-1p1.ptの絶対パス)

これで、MultiOptPy-v1.18cがNNPuma-s-1p1を使用できるようになる。

使用するNNPに関する具体的な説明#

今回使用するNNPについて具体的に説明する。

  • UMAのModel Checkpointはuma-s-1p1を使用した。
  • 小分子系のトレーニングセットであるOmol25(omol)を使用して学習したニューラルネットワークポテンシャルを使用する。

※自作ライブラリでの具体的な使用の仕方に関しては、ase_calculation_tools.py を参照

手順#

1. 初期構造の準備#

モデル反応系として、以下の構造を用意した。今回はファイルの名前をbh9_3_3.xyzとした。 初期構造は以下のものを使用した。

20
OptimizedStructure
C     -0.341100332150      2.650868014930     -1.990117471434
H      0.308672673883      2.915428629055     -2.822836053293
H     -1.365097315270      2.858598189146     -2.296847294375
C      0.050993953945      3.321604129045     -0.673199014762
H      0.921819606634      3.970007684532     -0.756723126104
H     -0.751255211520      3.908824180968     -0.229125463399
C     -0.212270503557      1.158916053174     -1.745233152451
C      0.390270875208      2.189889454862      0.278895627865
N      0.203440248297      1.004456171008     -0.426021585179
O      0.748789654795      2.268193746522      1.419864044655
O     -0.419210726136      0.264281008075     -2.515458854350
Cl     0.477768453569     -0.533319096851      0.276732512462
C     -1.094007776965     -3.794353469814      1.351381373946
H     -1.053241298971     -4.154233095647      0.331422169339
H     -1.986495741749     -3.999778633236      1.923985882229
C     -0.047182345548     -3.088904312450      1.891337225321
H     -0.135320026770     -2.733989875259      2.912953692975
C      1.107626009234     -2.775980430262      1.195104675986
H      1.261867956858     -3.150011448582      0.191736598257
H      1.933931846213     -2.280496899217      1.682148212314
初期パスを求めるための初期構造

2. 遷移状態構造最適化のための初期構造の算出#

a. 初期構造をカレントディレクトリにbh9_3_3.xyzとして保存し、以下を実行する。#

python optmain.py .\bh9_3_3.xyz -ma 200 12 18 -os uma-s-1p1 -modelhess -opt rsirfo_block_fsb -spin 2 -elec 0 -ns 25
  • -opt rsirfo_block_fsbは準ニュートン法であるRS-I-RFO法を構造最適化に使用することを示す。初期のへシアンに関しては、特にオプションで指定しない限り、単位行列が使われる。(以前のHessian更新法とは細かな点で異なる方法を使用している。具体的には、複数の座標変位や勾配変位を用いてHessianの更新を行う。)
  • -spinはスピン多重度の指定である。PySCFを使用するときは目的とするスピン多重度に1を引いた値を指定する。(デフォルトでは1が指定される。)今回はUMAモデルのNNPを使用し、ラジカル反応を扱うためスピンだ重度を2とした。
  • -elec Mは形式電荷をMとすることを示す。(デフォルトでは0が指定される。)
  • -ma yyy a bはyyykJ/molの活性化障壁を超えうるペア同士を近づける力を原子のラベル番号aとbのペアに構造最適化時に加えることを示す。
  • -os uma-s-1p1は今回使用するNNPを指定している。これを使用する際にASEライブラリが必要である。
  • -fc XはX回の反復計算ごとに正確なHessianを計算することを指定する。Hessianの計算コストは勾配の場合と比べると大きいが、構造最適化の収束までの時間を短縮できる。
  • -ns Xは最大反復回数をX回に変更するオプションである。分子間相互作用が関わると収束に時間がかかるので少ない回数に設定している。

これを実行すると、omolのデータセットを使用したuma-s-1p1モデルのNNPで得たエネルギーに対して、指定した人工力ポテンシャルを加えた上で初期構造を構造最適化することができる。

結果はyyyy_mm_dd(今日の年月日)ディレクトリの中に存在するディレクトリを開いて確認できる。

正常終了していれば、このディレクトリ中に、bh9_3_3_traj.xyzが存在するので、これをコピーして、MultiOptPy-v1.18cディレクトリに置く。

bh9_3_3_traj.xyzは構造最適化の過程をAvogadro(公式ページ:https://avogadro.cc/ )等で可視化して確認できるようにしている。このbh9_3_3_traj.xyzは次のNEB計算に使用する。

bh9_3_3_traj.xyzをアニメーションとして表示したい場合は、[https://github.com/ss0832/molecule_movie] を使うと良い。

(この人工力ポテンシャルを加えて行った構造最適化の結果はbh9_3_3_optimized.xyzで確認できる。構造を可視化して、生成系になっているか確認する。反応系のままであれば、-maの設定を見直してb.をやり直す。今回の場合以下の構造が得られた。生成系の安定構造に近いものが得られていると判断できるため、次のNEB計算を行うことが可能である。)

b. bh9_3_3_traj.xyzを初期パスとして、NEB法で経路の緩和を行う。#

NEB法を用いることで、先ほど得られたbh9_3_3_traj.xyz全体のエネルギーを下げることができる。これにより、パスのエネルギー極大値を持つ構造を遷移状態構造に近づける。(この時点ではまだ正確な遷移状態構造は求められていない。)

python nebmain.py bh9_3_3_traj.xyz -os uma-s-1p1 -ns 15 -aneb 3 5 -modelhess -spng -ndb 0.75 -ad 9999 -spin 2 -elec 0
  • -ad Xは線形補間で、各ノード間の距離を全て等しくするための処理である。X回の反復計算ごとに本処理を行う。Xを-nsよりも大きな数値を指定することで、初期経路に対してのみ処理を行うことが出来る。
  • -ndb Nはノード間の距離をN Åとして初期経路を作成することを示す。経路作成時に元のノードをベルンシュタイン多項式を用いてがたついた経路を滑らかにする。

→プログラムの仕様上-adの処理を行った後に、-ndbの処理を行うようになっている。

  • -ns nはn回分NEB法による経路の緩和を行うことを示す。
  • -fc MはM回あたりの経路緩和回数に対して1回だけ正確なHessianを計算し、経路緩和に使用する。これを使用すると、Hessianを使用しない場合の経路緩和アルゴリズムとは別のものを使用して、経路緩和を行う。
  • -spngは緩和中のパスのエネルギープロファイルや各ノードの勾配のRMS値をmatplotlibで可視化するオプションである。
  • -os uma-s-1p1は今回使用するNNPを指定している。これを使用する際にASEライブラリが必要である。
  • -aneb A Bこれを指定すると、(B+1)回の緩和ごとに、エネルギー極大値を示すノードと前後のノードの間に線形補間でA個の新規ノードを内挿するようにできる。デフォルトではこのような操作は行われない。このオプションを使用するとノードの数が徐々に増えるため、計算コストが使用しない場合と比べて増加する。一方で、エネルギー極大値を示すノード周辺にノードを増加させるため、緩和している経路中のノードが遷移状態構造付近に存在する可能性が高くすることが出来る。

c. 初期構造の決定及び遷移状態構造の計算#

MultiOptPy-v1.18cと同じディレクトリ内に、NEBという名前を含むディレクトリが生成されている。 そのディレクトリ内のenergy_plot.csvを確認し、緩和後のパスのエネルギー極大値を示す構造を確認する。

パスの緩和後の各ノードのエネルギー一覧(単位) (energy_plot.csvに保存されている。)

NEB計算の結果の可視化
NEB計算の結果の可視化

bias_force_rms.csvにて、各Iterationごとのすべてのノードの勾配のRMS値を確認できる。

経路緩和の結果、経路のエネルギー極大値を示す構造の中から目視で、緩和後に得られた経路の8番(グラフ上では9番)の構造を遷移状態構造を求める初期構造として採用した。

※こちら[https://ss0832.github.io/molecule_viewer/] を使うことでも可視化は可能である。

bh9_3_3_traj_8.xyz

20
0 2
C      -0.358066664070      2.605209474883     -1.967332113480
H       0.272661193331      2.857581393477     -2.817750735832
H      -1.391370196531      2.800018379475     -2.251926034896
C       0.061330796355      3.290560467844     -0.664307852010
H       0.932216654950      3.935005326227     -0.768553411323
H      -0.732262861790      3.877621699139     -0.204514616470
C      -0.215231655158      1.111017265539     -1.701398518337
C       0.425886342403      2.159261890499      0.289018074427
N       0.202971599756      0.984599390323     -0.395273016684
O       0.826896060501      2.263006854392      1.418116923277
O      -0.423554367350      0.212080591684     -2.472887984924
Cl      0.464256125916     -0.766499667745      0.437832148409
C      -1.056021207530     -3.751029948902      1.306196889356
H      -0.988744656891     -4.080065026379      0.275164710600
H      -1.928544605635     -4.052128617744      1.868471474678
C      -0.110724306827     -2.985770243412      1.848691672406
H      -0.211921872258     -2.619473049112      2.863384735772
C       1.048968475110     -2.524980513959      1.096483497992
H       1.250663819939     -3.056717320734      0.177707000213
H       1.930591325780     -2.259298345495      1.662877156826
NEB法により緩和した経路から得られた遷移状態構造を求めるための初期構造

構造が壊れていないので、これを遷移状態を求めるための初期構造とする。

遷移状態構造を求めるための初期構造を含むxyzファイルをMultiOptPy-v1.18cと同じディレクトリ内にコピーする。

そして、以下を実行する。

python optmain.py .\bh9_3_3_traj_8.xyz -spin 2 -elec 0 -os uma-s-1p1  -tcc -freq -opt rsirfo_block_bofill -order 1 -fc 5 -tr 0.2
  • -opt rsirfo_block_bofillは遷移状態構造の最適化向けのoptimizerを指定することを意味する。準ニュートン法であるRS-I-RFO法を使用する。今回は-fcで正確なHessianを計算するようにしているので、初期Hessianは正確なHessianを使用するようになっている。(Bofill法によるHessianの更新法を細かい点で変更している。具体的には、複数の座標変位や勾配変位を用いてHessianの更新を行う。)
  • -order 1は一次の鞍点を求めることを指定する。(デフォルトだと極小値を求めるようになっている。)
  • -fc 5は5回の反復回数当たり1回正確なHessianを計算することを指定する。
  • -freqは収束条件を満たした後に基準振動解析を行うことを示す。(自前で実装しているため、あくまで目安として使用することを推奨する。各振動モードをvibration_animation内のxyzファイルで可視化できる。)UMAモデルから算出されるHessianは数値微分により求めているため、原子数Zが多いとZの二乗オーダーで計算コストが急増する。
  • -tccは収束条件を厳しくすることを示す。(Gaussianのtightと同等)
  • -tr Dは一回の反復計算ごとの計算されるステップ幅の最大値をDÅ以下にすることを示す。

実行して得られた正確な遷移状態構造と思われる構造を以下に示す。

(実行して得られた正確な遷移状態構造は計算開始時に、yyyy_mm_ddディレクトリ内に生成された新規ディレクトリ内のYYY_optimized.xyzとして保存されている。)

20
OptimizedStructure
C     -0.295913603892      2.666726841429     -2.012133466652
H      0.373916447589      2.746664769685     -2.866959514053
H     -1.272666976423      3.030310235969     -2.328458014238
C      0.235818485858      3.348339605552     -0.749896848666
H      1.210984438859      3.814783014292     -0.882530602501
H     -0.435176576949      4.105200331357     -0.345986227162
C     -0.428845417209      1.191989642268     -1.642535940457
C      0.376386080655      2.230768876535      0.279553410352
N     -0.142242439061      1.080839269838     -0.291891343494
O      0.846853926507      2.321009798169      1.382366580140
O     -0.730479019157      0.287848381792     -2.375228851408
Cl     0.110299303423     -0.656292060123      0.533890880520
C     -0.900365007527     -4.038447005734      1.315976479399
H     -0.768566076848     -4.335284371593      0.281867106340
H     -1.675243471827     -4.538206655625      1.880718554853
C     -0.130126588059     -3.097968813859      1.867982502724
H     -0.291686269665     -2.799576214784      2.897667966966
C      0.935474613194     -2.432672762364      1.142227704475
H      1.214730686183     -2.872503757845      0.192607866338
H      1.766847464348     -2.053529124957      1.720761756525
遷移状態構造

停留点に収束した分子構造が得られた。-freqオプションにより生成されたnormal_modes.txtvibration_animationディレクトリ内の振動モードのアニメーションを確認した。

以下に-freqオプションで生成されたnormal_modes.txtの一部を示す。

Mode                                 0                   1                   2
Freq [cm^-1]                     -668.9368             13.0277             39.2124
Reduced mass [au]                  14.6381              3.5470              5.0229
Force const [Dyne/A]               -3.8593              0.0004              0.0046
Char temp [K]                       0.0000             18.7439             56.4179
Normal mode                   x         y         z            x         y         z            x         y         z     
       C                -0.00028    0.01375   -0.01025   -0.01353   -0.02736   -0.01455    0.06515    0.02613   -0.00433
       H                 0.00242    0.01398   -0.00790   -0.02919   -0.05312   -0.02923    0.08792   -0.00263    0.01075
       H                -0.00098    0.01193   -0.00982   -0.01566   -0.02343   -0.00345    0.09142    0.08054   -0.02274
       C                 0.00159    0.01568   -0.00636    0.01846   -0.00617   -0.03948    0.07518   -0.01200    0.01203
       H                 0.00237    0.01352   -0.00840    0.02089   -0.01949   -0.06842    0.09923   -0.05602    0.03443
       H                 0.00167    0.01507   -0.00539    0.03447    0.00966   -0.04253    0.10315    0.01496    0.00810
       C                 0.00207    0.01321   -0.01086   -0.02261   -0.01799    0.01963   -0.01922    0.02998   -0.01893
       C                 0.00350    0.01565   -0.00620    0.02656    0.01422   -0.01839    0.00450   -0.03014    0.00089
       N                -0.00637    0.05087   -0.02417    0.00239    0.00785    0.01652   -0.06213    0.00452   -0.01009
       O                 0.00177    0.00485   -0.00303    0.04996    0.03256   -0.02986    0.00857   -0.07010    0.00267
       O                 0.00177    0.00445   -0.00165   -0.04687   -0.03034    0.04491   -0.04409    0.05085   -0.03393
      Cl                 0.02074   -0.10442    0.04704   -0.00085    0.02162    0.04742   -0.06884   -0.00329   -0.02769
       C                 0.01629    0.00179    0.00615    0.03954   -0.03854   -0.14511    0.10500   -0.05613    0.03684
       H                -0.01091    0.02803   -0.00626    0.15803   -0.00767   -0.13885    0.16519   -0.08541    0.05293
       H                 0.05387   -0.04677    0.01725   -0.00084   -0.08145   -0.23849    0.11505   -0.08541    0.02468
       C                -0.02295    0.00288   -0.00324   -0.05322   -0.02353   -0.04141    0.02342    0.01346    0.03284
       H                 0.00177   -0.00751    0.00344   -0.17156   -0.05513   -0.05084   -0.03510    0.03932    0.01617
       C                -0.06216    0.16849   -0.06855   -0.00235    0.03378    0.08581    0.01072    0.05277    0.05225
       H                -0.01533    0.03681    0.00097    0.11254    0.06613    0.10470    0.06923    0.04490    0.07309
       H                 0.01533   -0.05231   -0.02304   -0.07644    0.05111    0.18100   -0.03292    0.11996    0.07073
       
(...snip...)

その結果、虚振動が1つであることが確認できた。つまりこの構造は遷移状態構造である。

次に、vibration_animation内の虚振動を示す分子振動が示されたxyzファイル(mode_1_XXXi_wave_number.xyz)をAvogadroで確認すると、想定される反応系と生成系をつなぐ方向に振動していることを確認できた。

終わりに#

   自作ライブラリで、UMAモデルのニューラルネットワークポテンシャル(NNP)を用いて、BH9データセット 3. Halogen atom transfer, No. 3の反応のある1つの遷移状態構造を算出する手順を説明した。

参考#

【計算化学】自作pythonライブラリで遷移状態構造を求めてみる(BH9データセット, 3. Halogen atom transferのNo. 3の素過程, NNP使用)
https://ss0832.github.io/posts/20251005_mop_usage_184/
Author
ss0832
Published at
2025-10-05