深度学习路线
目录
1. A Neural Algorithm of Artistic Style [中英文摘要]
2. A Neural Conversational Model [中英文摘要]
3. A character-level decoder without explicit segmentation for neural machine translation [中英文摘要]
4. A learned representation for artistic style [中英文摘要]
5. Actor-mimic deep multitask and transfer reinforcement learning [中英文摘要]
6. Adam: A method for stochastic optimization [中英文摘要]
7. Addressing the rare word problem in neural machine translation [中英文摘要]
8. Ask me anything: Dynamic memory networks for natu ...
预测类过程挖掘
目录
1. A Data Mining Approach to Predict E-Commerce Customer Behaviour [中英文摘要]
2. A Hybrid Classification Method Based on Machine Learning Classifiers to Predict Performance in Educational Data Mining [中英文摘要]
3. A Process Mining Approach for Supporting IoT Predictive Security [中英文摘要]
4. A Review on Predicting Cardiovascular Diseases Using Data Mining Techniques [中英文摘要]
5. A data mining approach to predict academic performance of students using ensemble techniques [中英文摘要]
6. A data mining approac ...
常用网站
在线学习数据科学
Towards Data Science
PyData (conference + videos)
PyData是NumFOCUS的教育项目——一个促进研究、数据和科学计算开放实践的非营利慈善机构。
Machine Learning Mastery
Distill的目的是为机器学习的概念提供一个清晰直观的解释。
Papers With Code
Kaggle
对于那些想要参加机器/深度学习比赛的人来说,Kaggle成为了他们的首选平台。成千上万的人参加训练最佳模型(通常是大型且复杂的模型组合)的竞赛,以获得最佳分数并获得认可(和奖金)。
Arxiv
GitHub Awesome Machine Learning
包含了一个按语言分组的机器学习框架、库和软件的列表。此外还包含博客、免费书籍、在线课程、会议、聚会等等。
Matplotlib的50个常用图表
Matplotlib 必须掌握的 50 个可视化图表(附完整 Python 源代码)
本文总结了 Matplotlib 以及 Seaborn 用的最多的50个图形,掌握这些图形的绘制,对于数据分析的可视化有莫大的作用。
Tips:
(1)本文原文部分代码有不准确的地方,已进行修改;
(2)所有正确的源代码,我已整合到 jupyter notebook 文件中,可以在公众号『Python数据之道』后台回复 “code”,可获得本文源代码;
(3)运行本文代码,除了安装 matplotlib 和 seaborn 可视化库外,还需要安装其他的一些辅助可视化库,已在代码部分作标注,具体内容请查看下面文章内容。
(4)本文完整的翻译文章来自 http://liyangbit.com/
在数据分析和可视化中最有用的 50 个 Matplotlib 图表。 这些图表列表允许您使用 python 的 matplotlib 和 seaborn 库选择要显示的可视化对象。
介绍
这些图表根据可视化目标的7个不同情景进行分组。 例如,如果要想象两个变量之间的关系,请查看“相关”部分下的图表。 或者,如果 ...
书籍
function doDecrypt (pwd, onError) {
console.log('in doDecrypt');
const txt = document.getElementById('enc_content').innerHTML;
let plantext;
try {
const bytes = CryptoJS.AES.decrypt(txt, pwd);
var plaintext = bytes.toString(CryptoJS.enc.Utf8);
} catch(err) {
if(onError) {
onError(err);
}
return;
}
document.getElementById('enc_content').innerHTML = plaintext;
document.getElementById('enc_content').style.display = 'block';
document.getElementById('enc_passwd').style.display ...
prom相关
function doDecrypt (pwd, onError) {
console.log('in doDecrypt');
const txt = document.getElementById('enc_content').innerHTML;
let plantext;
try {
const bytes = CryptoJS.AES.decrypt(txt, pwd);
var plaintext = bytes.toString(CryptoJS.enc.Utf8);
} catch(err) {
if(onError) {
onError(err);
}
return;
}
document.getElementById('enc_content').innerHTML = plaintext;
document.getElementById('enc_content').style.display = 'block';
document.getElementById('enc_passwd').style.display ...
TensorFlow笔记3-0-TensorFlow的层次结构
文章内容源于https://github.com/lyhue1991/eat_tensorflow2_in_30_days。
本章我们介绍TensorFlow中5个不同的层次结构:
硬件层
最底层为硬件层,TensorFlow支持CPU、GPU或TPU加入计算资源池。
内核层
第二层为C++实现的内核,kernel可以跨平台分布运行。
低阶API
第三层为Python实现的操作符,提供了封装C++内核的低级API指令,主要包括各种张量操作算子、计算图、自动微分。如tf.Variable, tf.constant, tf.function, tf.GradientTape, tf.nn.softmax … 如果把模型比作一个房子,那么第三层API就是【模型之砖】。
中阶API
第四层为Python实现的模型组件,对低级API进行了函数封装,主要包括各种模型层,损失函数,优化器,数据管道,特征列等等。如tf.keras.layers,tf.keras.losses,tf.keras.metrics,tf.keras.optimizers,tf.data.DataS ...
TensorFlow笔记2-3-自动微分机制
文章内容源于https://github.com/lyhue1991/eat_tensorflow2_in_30_days。
神经网络通常依赖反向传播求梯度来更新网络参数,求梯度过程通常是一件非常复杂而容易出错的事情。
而深度学习框架可以帮助我们自动地完成这种求梯度运算。
Tensorflow一般使用梯度磁带tf.GradientTape来记录正向运算过程,然后反播磁带自动得到梯度值。
这种利用tf.GradientTape求微分的方法叫做Tensorflow的自动微分机制。
一、利用梯度磁带求导数
1. 对变量张量求导
import tensorflow as tf
import numpy as np
# f(x) = a*x**2 + b*x + c的导数
x = tf.Variable(0.0,name = "x",dtype = tf.float32)
a = tf.constant(1.0)
b = tf.constant(-2.0)
c = tf.constant(1.0)
with tf.GradientTape() as tape:
y = a*t ...
TensorFlow笔记2-2-三种计算图
文章内容源于https://github.com/lyhue1991/eat_tensorflow2_in_30_days。
有三种计算图的构建方式:
静态计算图
动态计算图
Autograph
在TensorFlow1.0时代,采用的是静态计算图,需要先使用TensorFlow的各种算子创建计算图,然后再开启一个会话Session,显式执行计算图。
而在TensorFlow2.0时代,采用的是动态计算图,即每使用一个算子后,该算子会被动态加入到隐含的默认计算图中立即执行得到结果,而无需开启Session。
使用动态计算图即Eager Excution的好处是方便调试程序,它会让TensorFlow代码的表现和Python原生代码的表现一样,写起来就像写numpy一样,各种日志打印,控制流全部都是可以使用的。
使用动态计算图的缺点是运行效率相对会低一些。因为使用动态图会有许多次Python进程和TensorFlow的C进程之间的通信。而静态计算图构建完成之后几乎全部在TensorFlow内核上使用C代码执行,效率更高。此外静态图会对计算步骤进行一定的优化,剪去和结果无关的计算步骤 ...
TensorFlow笔记2-1-张量数据结构
文章内容源于https://github.com/lyhue1991/eat_tensorflow2_in_30_days。
程序 = 数据结构+算法。
TensorFlow程序 = 张量数据结构 + 计算图算法语言
张量和计算图是 TensorFlow的核心概念。
Tensorflow的基本数据结构是张量Tensor。张量即多维数组。Tensorflow的张量和numpy中的array很类似。
从行为特性来看,有两种类型的张量
常量constant
变量Variable
常量的值在计算图中不可以被重新赋值,变量可以在计算图中用assign等算子重新赋值。
一、常量张量
张量的数据类型和numpy.array基本一一对应。
import numpy as np
import tensorflow as tf
i = tf.constant(1) # tf.int32 类型常量
l = tf.constant(1,dtype = tf.int64) # tf.int64 类型常量
f = tf.constant(1.23) #tf.float32 类型常量
d = tf.con ...