An interdisciplinary comparison of sequence modeling methods for next-element prediction
一、文章速览
论文信息
题目-作者-时间-出版社-引用
Tax, Niek, et al. “An Interdisciplinary Comparison of Sequence Modeling Methods for Next-Element Prediction.” Software and Systems Modeling, Springer, 2020, doi:10.1007/s10270-020-00789-3. IF: 2.66
背景
不同的研究领域都发展了从数据集中学习序列模型的方法。
-
机器学习(序列建模子领域)——不注重可理解性
(隐)马尔科夫模型、递归(循环)神经网络、n元语法模型
-
过程挖掘
旨在生成可为人类理解的描述性模型,专注于对并发行为进行显式建模
-
文法推断
表示为自动机(如果语言是规则的)或上下文无关的语法,重点是寻找正规语法形式的描述性模型
每个领域都有系统的比较方法和精确度度量基准,但是几乎没有比较这些不同领域之间的精确度的方法。
共同目标:学习到一个能够准确捕获底层数据中的序列行为的模型。这些序列模型是可生成的。他们能够预测在一个给定的不完整序列之后,哪些元素可能会出现。
方法
提出了一个跨学科的实验评价方法,比较了序列建模方法在四个真实序列数据集上的下一个元素预测任务。
概述
各个领域都在想办法衡量和比较模型的精确性,但是很少有跨学科进行比较的。为了比较来自不同研究领域的序列模型,我们将重点放在可以应用这些模型的单一任务上:预测未完成/不完整序列的下一个元素。更具体地说,我们关注于生成序列中下一个可能元素的整个概率分布,而不是预测下一个最有可能的元素。
本文在之前方法(概率序列分类,能够与其他的概率序列模型对比)的基础上,进行拓展:
-
新增比较文法推断
-
拓展实验设置
-
增加可确定的细节来完成实验
实验结论:
-
对可理解性要求不高时,机器学习的方法可能更好。其中,AKOM和递归神经网络的性能最好。
-
优先考虑可理解性时,基于自动的预测更好。
-
考虑并发时,最好的选择是分割挖掘(Split Miner)和IMf20%。