引言

对于有意义的文本挖掘,开源的科学文献包含着非常丰富有价值的信息。然而,这些信息并未总是非常容易被检索到。这项技术提供了一个柔性的方法,通过整合到一个工作流中来进行文献的检索,文本挖掘和大规模预测物理化学和生物学参数。这些结果可以可视化为质谱图谱,色谱图或者其他文本挖掘中的新图像(但在分析化学领域为熟悉的图像)。该方法可用于分析化学技术的比较和蛋白质及其活性的语义富集搜索,也可用于实验设计、药物发现、化学合成、人工智能和历史研究。 该方法仅使用免费提供的数据,服务和软件在可共享的科学工作流程中实现,其可以扩充到百万计的出版物或者化学文献中。

- 阅读剩余部分 -

引言

药物和材料设计的目标是发现具有理想特性的新分子,寻找具有理想特性的新分子是药物设计与材料设计十分关注的问题,然而优化分子空间包含着巨大的挑战,搜寻空间是巨大的,离散的,无结构的。因为潜在候选分子过于庞大,合成和测试分子是一项十分耗时废力的工程。如今大约含有10^8次方化合物被合成,但大约10^23到10^60次方潜在成药分子需要验证。

- 阅读剩余部分 -

引言

药物发现是一个花费成本非常高并且漫长的过程,许多治疗项目都在临床试验过程中夭折。后期失败花费尤其高,而缺乏有效的先导化合物是主要原因之一。主要的问题可能是可使用的靶标的原因,因为并非所有的靶点是治疗可用的(“可成药性”),变构区缺乏明显结合位点的靶点长时间被认为是无法作为成药靶点的。

然而这种观点现在发生了转变,一些之前被认为棘手的靶点成功被小分子所识别,极大的增加了可成药性靶点的范围。许多棘手的靶点具有配体可结合的口袋,但从未结合配体蛋白中并未观察到或者只有当配体结合以后才会显现。例如原癌基因K-RAS一度认为无可成药性(undruggable),然而,最近,通过结合化合物发现了一个新的隐秘口袋并成功靶向,隐秘口袋形成的机制并不清楚。由于这些不确定性及其隐藏性质,通过实验和计算方法难以识别隐藏的口袋。

- 阅读剩余部分 -

引言

长时间的分子动力学(MD)模拟在研究蛋白构象变化中非常成功。原则上,MD模拟对于研究RNA分子的构象变化同样应该是一个强大的工具。然而,RNA的物理模型精确性相比蛋白模型精确度较低,甚至在简单的RNA体系中都需要人工矫正来提升RNA力场的精确性,这限制了其应用。提高RNA力场的精确性将极大地促进MD模拟用于研究具有生物意义的RNA分子相关的动力学。

- 阅读剩余部分 -

只是粗略翻译,未校正

此篇文章以RNA MD为舟,主要参考《RNA Structural Dynamics As Captured by Molecular Simulations: A Comprehensive Overview》一文3.2.3: Markov State Models一节。

近年来,马尔科夫状态模型(Markov State Model,MSM)方法在增强采样中得到了广泛的运用,成为热门的增强采样方法之一。马尔科夫模型的方法优势在于它能够从很多短的模拟中获取长时间的动力学特征,可以不需要事先定义反应坐标,从而避免了对整个动力学性质的简化或者是偏差。特别是最近几年大规模的平行计算资源的发展,更加促进了这一方法的应用。

- 阅读剩余部分 -