如何高效地完成数据标注?发表时间:2019-04-24 11:55 成功的机器学习模型建立在大量高质量训练数据的基础之上。但是,创建构建这些模型所需的培训数据的过程通常十分昂贵、复杂和耗时。今天创建的大多数模型都需要人工以手动方式标注数据,从而使模型学习如何做出正确决策。为了应对这种挑战,可以利用机器学习模型自动标注数据,以使标注更加高效。 在此流程中,先在由人类标注的原始数据子集上训练用于标注数据的机器学习模型。如果标注模型基于其迄今所学的内容认为其结果的置信度较高,则它将自动将标签应用于原始数据。如果标注模型认为其结果置信度较低,它会将数据传递给人工标识器进行标注。然后,将人类生成的标签反馈给标注模型供其从中学习,并提高其自动标注下一组原始数据的能力。随着时间的推移,该模型可以自动标注越来越多的数据,并大大加快创建培训数据集的速度。 上一篇数据标注的工作原理
|