DUD-E数据集是DUD-E数据集中活性化合物。
数据集,又称为资料集,数据集合或资料集合,是一种由数据所组成的集合,Dataset是一个数据的集合,通常以表格形式出现,每一列代表一个特定变量,每一行都对应于某一成员的数据集的问题。
数据集是进行数据预处理,预处理后的数据相比于原始数据增加了分词结果,并且在每篇文档中增加了与问题最相关的段落,文档最优段落的选择是使用一篇文档中的所有段落分别与答案集求recall值,得到最高的查全率的段落为最优段落,如果出现recall值相等的情况,取段落短的为最优段落。