结合文本挖掘和计算化学对分析化学文献进行检索可视化和语义富集
引言
对于有意义的文本挖掘,开源的科学文献包含着非常丰富有价值的信息。然而,这些信息并未总是非常容易被检索到。这项技术提供了一个柔性的方法,通过整合到一个工作流中来进行文献的检索,文本挖掘和大规模预测物理化学和生物学参数。这些结果可以可视化为质谱图谱,色谱图或者其他文本挖掘中的新图像(但在分析化学领域为熟悉的图像)。该方法可用于分析化学技术的比较和蛋白质及其活性的语义富集搜索,也可用于实验设计、药物发现、化学合成、人工智能和历史研究。 该方法仅使用免费提供的数据,服务和软件在可共享的科学工作流程中实现,其可以扩充到百万计的出版物或者化学文献中。