小康文章阅读笔记

小康文章阅读笔记

boltzgen学习笔记

2026-04-30

Boltzgen 安装

安装有许多方法,个人比较喜欢使用anconda版本或者docker版本,当然docker版本我更加喜欢

# Build
docker build -t boltzgen .

# Run an example
mkdir -p workdir  # output
mkdir -p cache    # where models will be downloaded to
docker run --rm --gpus all -v "$(realpath workdir)":/workdir -v "$(realpath cache)":/cache -v "$(realpath example)":/example boltzgen \
    boltzgen run /example/vanilla_protein/1g13prot.yaml --output /workdir/test \
 	--protocol protein-anything \
  	--num_designs 2

Pipeline output 信息

管道输出包含如下信息:

  1. config/, steps.yaml:配置文件。

  2. ntermediate_designs/: output of design step:设计阶段的输出信息
    /*.cif/*.npz:所设计的蛋白质及靶标在反向折叠之前的CIF格式和NPZ格式的元数据文件。

  3. intermediate_designs_inverse_folded/ 逆向折叠、常规折叠及分析步骤的处理结果
    /*.cif/*.npz:分别表示经过反向折叠后,所设计蛋白质及其靶标分子的CIF和NPZ坐标。注意:对于那些被设计的残基来说,只有其骨架原子的坐标会有值;而侧链原子的坐标则均为0,0,0。
    /refold_cif: 经过重新折叠后的复合物结构(包括target和binder)。这是进行分析和筛选步骤时的重要输入数据。
    /refold_design_cif: 重新折叠后的binder结构,无target。
    /aggregate_metrics_analyze.csv/per_target_metrics_analyze.csv——分析步骤的输出结果。

  4. final_ranked_designs/ 过滤步骤的输出结果
    /intermediate_ranked_<N>_designs/ 设计出的评分优秀数据。其相关信息均源自上面的refold_cif。
    /final_<budget>_designs/: 高品质且具有多样性的结构。CIF文件来自于refold_cif/中的数据。
    /all_designs_metrics.csv/: 通过筛选得到的所有设计方案的各项指标。
    /final_designs_metrics_<budget>.csv/ : 所选最终数据集的相关指标。
    /results_overview.pdf/: 图表/曲线图