dl_binder_design学习笔记
编辑dl_binder_design
由于文章我已经看过几次了,这里只是简单进行记录dl_binder_desgin的计算
快速安装
1.准备工作
假设已经安装好CUDA 12.1
和MiniConda
,具体方法可以查看网络上的相关教程,非常简单。
克隆最新代码
git clone https://github.com/nrbennet/dl_binder_design.git
需要设置~/.condarc,添加pyrosetta源,以下内容需要添加帐号密码
channels:
- https://USERNAME:PASSWORD@conda.graylab.jhu.edu
- conda-forge
- defaults
2.安装ProteinMPNN-FastRelax环境
进入安装的根目录中的 /include
目录
执行ProteinMPNN-FastRelax的安装,由于已经测试过GPU不会有提升,所以只需要安装CPU版本即可。
截至发表日期,mkl已经进行了更新,需要对yml文件进行修改。
在dependecies内增加一行- mkl==2024.0
,以及修改numpy版本,完整的yml文件应该如下:
name: proteinmpnn_binder_design
channels:
- pytorch
- nvidia
- conda-forge
- defaults
dependencies:
- python=3.11
- mkl==2024.0
- pytorch=2.0
- biopython
- ml-collections
- pyrosetta
- numpy==1.26.4
conda env create -f proteinmpnn_fastrelax.yml
!!!如果已经加载了镜像源记得把代理给关闭,或者也可以最后pyrosetta的时候再打开代理。
测试是否成功:
python importtests/proteinmpnn_importtest.py
错误附加选项
安装遇到的错误,提示
undefined symbol: iJIT_NotifyEvent
需要在proteinmpnn_fastrelax.yml
文件中修改依赖,增加一行
conda install mkl=2024.0
3. 安装AlphaFold2环境
还是在include环境下:
# 针对CUDA为12.1的版本
conda env create -f af2_binder_design.yml
# 针对CUDA版本为11.X的版本af2_binder_design需要修改为dl_binder_design
# conda env create -f dl_binder_design.yml
由于现在的版本变化,需要修改af2_binder_design内的内容:
- biopython==1.79
随后进行测试:
python importtests/af2_importtest.py
4. 克隆ProteinMPNN
#进入安装目录下面的/mpnn_fr目录
cd ..
cd mpnn_fr
git clone https://github.com/dauparas/ProteinMPNN.git
5. 安装Silent Tools
已经集成
Silent Tools和教程中相比已经有一些改动了,Silent Tools的具体使用方法后面开一个帖子进行介绍。
6. 下载AlphaFold2模型权重
cd <base_dir>/af2_initial_guess
mkdir -p model_weights/params && cd model_weights/params
wget https://storage.googleapis.com/alphafold/alphafold_params_2022-12-06.tar
tar --extract --verbose --file=alphafold_params_2022-12-06.tar
由于谷歌被墙,所以可以通过其他渠道下载权重,之后进行倒入。
7. 安装视频演示
备注:我在使用的时候include文件夹下的silent_tools无法使用,若出现此问题可以重新安装这部分
pwd
#输出:/home/kangsgo/install/binder/dl_binder_design/include
#备份原本内容
mv silent_tools silent_tools-bak
git clone https://github.com/bcov77/silent_tools
mv silent_tools silent_tools2
mv silent_tools-bak silent_tools
silent_tools学习资料如下:https://github.com/bcov77/silent_tools ,后续再学习
若需要使用并行工具可以如下安装【注 ubuntu,centos可以网上搜索】
sudo apt-get install parallel
使用学习
我们一般先用RFdiffusion生成系列骨架,我们再通过骨架来进行工作。
1.PDB压缩
可以通过如下将上一步pdb文件进行压缩为silent文件,** $dl_dir为安装目录,下同。**
# $dl_dir为安装目录
$dl_dir/include/silent_tools/silentfrompdbsparallel -j 14 *.pdb > ../rf.silent
2.ProteinMPNN-FastRelax
$dl_dir/mpnn_fr/dl_interface_design.py -silent rf.silent -relax_cycles 0 -seqs_per_struct 2 -outpdbdir out
可以使用-checkpoint_path
参数修改ProteinMPNN的参数,例如改为可溶性更高的
$dl_dir/mpnn_fr/dl_interface_design.py -silent rf.silent -relax_cycles 0 -seqs_per_struct 2 -outpdbdir out -checkpoint_path ${dl_dir}/mpnn_fr/ProteinMPNN/soluble_model_weights/v_48_020.pt
- 3
- 0
-
分享