2019年5月

引言

对于有意义的文本挖掘,开源的科学文献包含着非常丰富有价值的信息。然而,这些信息并未总是非常容易被检索到。这项技术提供了一个柔性的方法,通过整合到一个工作流中来进行文献的检索,文本挖掘和大规模预测物理化学和生物学参数。这些结果可以可视化为质谱图谱,色谱图或者其他文本挖掘中的新图像(但在分析化学领域为熟悉的图像)。该方法可用于分析化学技术的比较和蛋白质及其活性的语义富集搜索,也可用于实验设计、药物发现、化学合成、人工智能和历史研究。 该方法仅使用免费提供的数据,服务和软件在可共享的科学工作流程中实现,其可以扩充到百万计的出版物或者化学文献中。

- 阅读剩余部分 -

引言

药物和材料设计的目标是发现具有理想特性的新分子,寻找具有理想特性的新分子是药物设计与材料设计十分关注的问题,然而优化分子空间包含着巨大的挑战,搜寻空间是巨大的,离散的,无结构的。因为潜在候选分子过于庞大,合成和测试分子是一项十分耗时废力的工程。如今大约含有10^8次方化合物被合成,但大约10^23到10^60次方潜在成药分子需要验证。

- 阅读剩余部分 -