小康文章阅读笔记

小康文章阅读笔记

dl_binder_design学习笔记

2024-11-19

dl_binder_design

 由于文章我已经看过几次了,这里只是简单进行记录dl_binder_desgin的计算

247760923-4c5d6a05-d2fb-4c7b-b1e0-0c743b2114eb.png

快速安装

1.准备工作

假设已经安装好CUDA 12.1MiniConda ,具体方法可以查看网络上的相关教程,非常简单。
克隆最新代码

git clone https://github.com/nrbennet/dl_binder_design.git

需要设置~/.condarc,添加pyrosetta源,以下内容需要添加帐号密码

channels: 
- https://USERNAME:PASSWORD@conda.graylab.jhu.edu
- conda-forge
- defaults

2.安装ProteinMPNN-FastRelax环境

进入安装的根目录中的 /include目录
执行ProteinMPNN-FastRelax的安装,由于已经测试过GPU不会有提升,所以只需要安装CPU版本即可。

截至发表日期,mkl已经进行了更新,需要对yml文件进行修改。

在dependecies内增加一行- mkl==2024.0,以及修改numpy版本,完整的yml文件应该如下:

name: proteinmpnn_binder_design
channels:
  - pytorch
  - nvidia
  - conda-forge
  - defaults
dependencies:
  - python=3.11
  - mkl==2024.0
  - pytorch=2.0
  - biopython
  - ml-collections
  - pyrosetta
  - numpy==1.26.4
conda env create -f proteinmpnn_fastrelax.yml

!!!如果已经加载了镜像源记得把代理给关闭,或者也可以最后pyrosetta的时候再打开代理。
测试是否成功:

python importtests/proteinmpnn_importtest.py

错误附加选项
安装遇到的错误,提示

undefined symbol: iJIT_NotifyEvent

需要在proteinmpnn_fastrelax.yml文件中修改依赖,增加一行

conda install mkl=2024.0

3. 安装AlphaFold2环境

还是在include环境下:

# 针对CUDA为12.1的版本
conda env create -f af2_binder_design.yml
# 针对CUDA版本为11.X的版本af2_binder_design需要修改为dl_binder_design
# conda env create -f dl_binder_design.yml

由于现在的版本变化,需要修改af2_binder_design内的内容:

  - biopython==1.79

随后进行测试:

python importtests/af2_importtest.py

4. 克隆ProteinMPNN

#进入安装目录下面的/mpnn_fr目录
cd ..
cd mpnn_fr
git clone https://github.com/dauparas/ProteinMPNN.git

5. 安装Silent Tools

已经集成

Silent Tools和教程中相比已经有一些改动了,Silent Tools的具体使用方法后面开一个帖子进行介绍。

6. 下载AlphaFold2模型权重

cd <base_dir>/af2_initial_guess
mkdir -p model_weights/params && cd model_weights/params
wget https://storage.googleapis.com/alphafold/alphafold_params_2022-12-06.tar
tar --extract --verbose --file=alphafold_params_2022-12-06.tar 

由于谷歌被墙,所以可以通过其他渠道下载权重,之后进行倒入。

7. 安装视频演示

备注:我在使用的时候include文件夹下的silent_tools无法使用,若出现此问题可以重新安装这部分

pwd
#输出:/home/kangsgo/install/binder/dl_binder_design/include

#备份原本内容
mv silent_tools silent_tools-bak
git clone https://github.com/bcov77/silent_tools
mv silent_tools silent_tools2
mv silent_tools-bak silent_tools

silent_tools学习资料如下:https://github.com/bcov77/silent_tools ,后续再学习
若需要使用并行工具可以如下安装【注 ubuntu,centos可以网上搜索】

sudo apt-get install parallel

使用学习

我们一般先用RFdiffusion生成系列骨架,我们再通过骨架来进行工作。

1.PDB压缩

可以通过如下将上一步pdb文件进行压缩为silent文件,** $dl_dir为安装目录,下同。**

# $dl_dir为安装目录
$dl_dir/include/silent_tools/silentfrompdbsparallel -j 14 *.pdb > ../rf.silent

2.ProteinMPNN-FastRelax

$dl_dir/mpnn_fr/dl_interface_design.py  -silent rf.silent -relax_cycles 0 -seqs_per_struct 2 -outpdbdir out

可以使用-checkpoint_path参数修改ProteinMPNN的参数,例如改为可溶性更高的

$dl_dir/mpnn_fr/dl_interface_design.py  -silent rf.silent -relax_cycles 0 -seqs_per_struct 2 -outpdbdir out -checkpoint_path ${dl_dir}/mpnn_fr/ProteinMPNN/soluble_model_weights/v_48_020.pt