Inductive Miner
一、文章速览
1.论文信息
题目-作者-时间-出版社-引用
Leemans, S.J., Fahland, D., & Aalst, W.M. (2013). Discovering Block-Structured Process Models from Event Logs - A Constructive Approach. Petri Nets.
2.背景
现有的流程发现技术不能同时保证可靠性、适应性、重新发现能力和有限的运行时间。
3.方法
提供了一个可扩展的框架,可以从任何给定的日志中发现一组可靠的、符合所观察到的行为的块结构流程模型。采用***分而治之***的方法,根据切将日志分割,得到的n个子日志的n个子过程。
4.概述
B '的工作原理是将日志中的活动划分为多个集合,然后在这些集合上分割日志。selectB '粘附于B,这保证了对任何输入日志的可靠性、适应度和框架的终止性。
基于流程树,具有正确性和健壮性
为了使框架更具可扩展性,使用了一个待给定的首选项功能select来选择首选的日志划分。
此外,还描述了在日志中重新发现一个 ...
Neural Approach to the Discovery Problem in Process Mining
备注
算法没完全理解
日志到向量?
一、文章速览
1.论文信息
时间-题目-作者-出版社-影响因子
(2018). Neural Approach to the Discovery Problem in Process Mining.Shunin, T., Zubkova, N., & Shershakov, S. AIST. https://doi.org/10.1007/978-3-030-11027-7_25
2.背景
过程挖掘处理各种形式模型。其中一些用于合成和分析的中间阶段,而另一些则是预期目标本身。变迁系统(TS)在这两种场景中被广泛使用。
3.方法
本文提出了一种基于循环神经网络RNN的新方法。使用事件日志作为训练集,提取RNN的中间状态作为TS来描述日志中的行为。
特点:
模型适合度高。包含了日志中的所有行为、简洁、精确。
神经方法的主要优点之一是能够检测和合并分散在日志中的常见行为部分。
4.概述
我们研究的主要目标之一是分析所提方法的效率,即,看看不同的质量度量如何依赖于输入数据和用户指定的参数。
主要贡献如下:
(1) 描述和实 ...
An interdisciplinary comparison of sequence modeling methods for next-element prediction
一、文章速览
论文信息
题目-作者-时间-出版社-引用
Tax, Niek, et al. “An Interdisciplinary Comparison of Sequence Modeling Methods for Next-Element Prediction.” Software and Systems Modeling, Springer, 2020, doi:10.1007/s10270-020-00789-3. IF: 2.66
背景
不同的研究领域都发展了从数据集中学习序列模型的方法。
机器学习(序列建模子领域)——不注重可理解性
(隐)马尔科夫模型、递归(循环)神经网络、n元语法模型
过程挖掘
旨在生成可为人类理解的描述性模型,专注于对并发行为进行显式建模
文法推断
表示为自动机(如果语言是规则的)或上下文无关的语法,重点是寻找正规语法形式的描述性模型
每个领域都有系统的比较方法和精确度度量基准,但是几乎没有比较这些不同领域之间的精确度的方法。
共同目标:学习到一个能够准确捕获底层数据中的序列行为的模型。这些序列模型是可生成的。他们能 ...
论文应该怎么写(1)-论文的三段式结构
如何撰写论文,这实在不是一件容易的事情,但是总归是有套路可循的。接下来一系列文章都是关于视频的笔记加上我自己的理解。
论文的三段式结构
引言和结论的相同点和区别
引言和结论部分可以看做是一篇小议论文。引言的论点是这篇论文的研究目标是合理的,它在研究领域中有合理的位置,论据是文献中的相关资料。结论部分的论据是研究的结果和文献中的相关资料。引言要证明研究目标的合理,结论要证明研究结果的价值。引言是从普遍到特定,结论是从特定到普遍。
换电脑后如何更新博客
一、上传到远程仓库
待续
二、首次在新电脑上写博客
1. 安装nodejs和npm
先安装nodejs
sudo apt install nodejs
然后安装npm
sudo apt install npm
然后升级npm
sudo npm i -g npm
安装n
sudo npm i -g n
最后用n模块升级node
sudo n stable
关闭终端,重新打开运行
2. 重新安装hexo
(1) 新建hexo文件夹(文件夹名可以随便取),进入文件夹后,使用淘宝源安装hexo。
npm install -g cnpm --registry=https://registry.npm.taobao.org
cnpm install hexo-cli -g
cnpm install hexo --save
(2) 初始化hexo。 注意:从现在开始,所有命令都是在hexo文件夹中运行
hexo init
(3) 安装依赖和插件
cnpm install hexo-generator-index --save
cnpm install hexo-generato ...
Detection and Removal of Infrequent Behaviour from Event Streams of Business Processes
论文信息
题目-作者-时间-出版社-引用
van Zelst, S. J., Fani Sani, M., Ostovar, A., Conforti, R., & La Rosa, M. (2020). Detection and removal of infrequent behavior from event streams of business processes. Information Systems, 90(October), 101451. https://doi.org/10.1016/j.is.2019.101451
背景
大量过程挖掘算法使用离线静态数据进行挖掘。而实时数据流可以帮助更好的理解历程。但是在线处理技术大多假设输入数据完全没噪音和异常行为。因此这些算法在应对实际场景时效果不行。
方法
提出了一种事件处理器,能够从实时数据流中过滤低频行为。
如何界定低频?
如何过滤?
如何实时处理?
概述
提出的方法依赖于总事件流的行为的时间演变子集,从中可以推断出代表该行为的增量更新模型
概率自动机,动态更新过滤异常
使用相应 ...
hexo+github pages走过的弯路
文档插入图片
使用的主题是hexo-theme-matery。
先打开hexo目录下的_config.yml文件,搜索并设置如下:
post_asset_folder: true #创建一个与文章同名的文件夹,里面的东西会和文章一起上传到同一级目录下
将图片放进该同名文件夹中
在文中引用格式,如图一的引用路径为。不得不承认,还是官方文档更可靠。
同步Ubuntu文件夹同步到百度云
原文地址:https://pdf.us/2018/01/17/579.html
onedrive不如windows下方便,所以干脆还是用百度云吧。
安装百度云盘同步工具bypy
bypy是用python写的一个工具,可以上传和同步文件到百度云盘。这里主要使用的是他的同步功能。bypy可以使用pip进行安装,但是默认ubuntu里并没有安装pip,所以先安装pip
安装pip
curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py
python get-pip.py
安装bypy
pip install bypy
同步
切换到想备份的文件夹下
cd ~/文档/博客/hexo
进行应用授权
bypy info
** 此时会显示一个网址,复制该网址到浏览器,登录百度云盘的帐号,会生成一个授权码,再将该授权码粘贴回命令行中 **
开始同步文件,-v可以显示进度,建议加上
bypy syncup -v
这是简化的写法,这种方式是将本地文件同步到远端,如果远端存在同名但内容不相同的文件时,会自动替换远端文件为本地的版本,但是,如 ...
Ubuntu全盘备份与恢复
备份系统
使用TAR。和Windows不同,Linux不会限制root访问任何东西,你可以把分区上的所有东西都扔到一个TAR文件里去
打开一个终端,并运行 sudo su(回车后要求输入密码);
继续在终端中输入以下指令,进入系统根目录:
cd /
开始备份系统,在终端中输入:
tar cvpzf backup.tgz --exclude=/proc --exclude=/lost+found --exclude=/backup.tgz --exclude=/mnt --exclude=/sys --exclude=/media /
注意
tar’ 是用来备份的程序
c - 新建一个备份文档
v - 详细模式, tar程序将在屏幕上实时输出所有信息。
p - 保存许可,并应用到所有文件。
z - 采用‘gzip’压缩备份文件,以减小备份文件体积。
f - 说明备份文件存放的路径, Ubuntu.tgz 是本例子中备份文件名。
“/”是我们要备份的目录,在这里是整个文件系统。
在档案文件名“backup.tgz”和要备份的目录名“/”之间给出了备份时必须排除 ...