Apache 常见算法-强化学习

Posted on 2022-02-10 Edited on 2023-09-14 In 强化学习

Q-Learning

Q-Learning 是一个强化学习中一个很经典的算法，其出发点很简单，就是用一张表存储在各个状态下执行各种动作能够带来的 reward，如下表表示了有两个状态 s1,s2s1,s2，每个状态下有两个动作 a1,a2a1,a2, 表格里面的值表示 reward

这个表示实际上就叫做 Q-Table，里面的每个值定义为 Q(s,a)Q(s,a), 表示在状态 ss 下执行动作 aa 所获取的reward，那么选择的时候可以采用一个贪婪的做法，即选择价值最大的那个动作去执行。 Q-Table 要如何获取？答案是随机初始化，然后通过不断执行动作获取环境的反馈并通过算法更新 Q-Table。

Deep Q Network

DQN与Q-leanring类似都是基于值迭代的算法，但是在普通的Q-learning中，当状态和动作空间是离散且维数不高时可使用Q-Table储存每个状态动作对的Q值，而当状态和动作空间是高维连续时，使用Q-Table不动作空间和状态太大十分困难。

所以可以把Q-table更新转化为一函数拟合问题，通过拟合一个函数function来代替Q-table产生Q值，使得相近的状态得到相近的输出动作。因此我们可以想到深度神经网络对复杂特征的提取有很好效果，所以可以将DeepLearning与Reinforcement Learning结合。这就成为了DQN。

通过 NN 预测出Q(s2, a1) 和 Q(s2,a2) 的值, 这就是 Q 估计. 然后我们选取 Q 估计中最大值的动作来换取环境中的奖励 reward. 而 Q 现实中也包含从神经网络分析出来的两个 Q 估计值, 不过这个 Q 估计是针对于下一步在 s’ 的估计。

DQN 的实现会遇到许多困难，其中最显著的就是：

Apache 常见算法-NLP篇

Posted on 2022-02-10 Edited on 2023-09-14 In NLP

常见算法-CV

Posted on 2022-02-10 Edited on 2023-09-14 In 图像处理

LeNet‑5

LeNet‑5的复杂度远远无法和今天的深度网络模型相比，性能也相差悬殊，但在当时取得了和支持向量机相媲美的效果，并被广泛应用于识别手写数字，受到了广泛的关注。

在LeNet提出后，很长一段时间卷积神经网络并不是计算机视觉领域的主流方法，因为LeNet只在小数据集上表现良好，在规模更大、更真实的数据集上表现一般

AlexNet

2012年的冠军AlexNet［13］首次将深度学习技术应用到大规模图像分类领域，证明了深度学习技术学习到的特征可以超越手工设计的特征，开启了计算机视觉领域中的深度学习热潮。AlexNet和LeNet结构理念相似，采用5层卷积层和3层全连接层，激活函数用ReLU取代了sigmoid，用dropout方法取代了权重衰减缓解过拟合。

VGG

VGG 最大的特点就是通过比较彻底地采用 3x3 尺寸的卷积核来堆叠神经网络，这样也加深整个神经网络的深度。这两个重要的改变对于人们重新定义卷积神经网络模型架构也有不小的帮助，至少证明**使用更小的卷积核并且增加卷积神经网络的深度，可以更有效地提升模型的性能。**VGG有两种结构，分别是VGG16和VGG19，两者并没有本质上的区别，只是网络深度不一样。

该网络中的亮点：通过堆叠多个3x3的卷积层来替代大尺度卷积层（在拥有相同感受野的前提下能够减少所需参数）。

基于用户投票的排名算法-牛顿冷却定律

Posted on 2021-08-25 Edited on 2023-09-14 In 推荐算法

牛顿冷却场景

需求场景：根据用户的投票，决定最近一段时间内的”热文排名”，如电商热榜排名，贴吧热贴排名。社区体系中，与一篇内容相关的指标如下：

我们可以把”热文排名”想象成一个”自然冷却”的过程：

1、任一时刻，网站中所有的文章，都有一个”当前温度”，温度最高的文章就排在第一位

2、如果一个用户对某篇文章投了赞成票，该文章的温度就上升一度

3、随着时间流逝，所有文章的温度都逐渐”冷却”

这样假设的意义，在于我们可以照搬物理学的冷却定律，使用现成的公式，建立”温度”与”时间”之间的函数关系，轻松构建一个”指数式衰减”（Exponential decay）的过程。

物理学家牛顿，早在17世纪就提出了温度冷却的数学公式，被后人称作”牛顿冷却定律”（Newton’s Law of Cooling）。

“牛顿冷却定律”非常简单，用一句话就可以概况：

本期温度 = 上一期温度 x exp(-(冷却系数) x 间隔的小时数)

TensorFlow 2之开源Tensorflow-Recommenders组件

Posted on 2021-08-24 Edited on 2023-09-14 In 推荐算法

TensorFlow 是一个端到端开源机器学习平台。它拥有一个全面而灵活的生态系统，其中包含各种工具、库和社区资源，可助力研究人员推动先进机器学习技术的发展，并使开发者能够轻松地构建和部署由机器学习提供支持的应用。

常见机器学习问题的解决方案：

新手：图像分类

中级：推荐系统，预测用户行为

高级：生成对抗网络，如使用Keras Subclassing API训练生成对抗网络生成手写数字图像

Google开源了基于Tensorflow的推荐器，一个新的开源Tensorflow包。它的特点可以总结为下面四个：

它有助于开发和评估灵活的候选nomination模型；

它可以很容易地将商品、用户和上下文信息合并到推荐模型中；

它可以训练多任务模型，帮助优化多个推荐目标；

它使用TensorFlow Serving为最终模型提供服务。

TensorFlow Recommenders是使用TensorFlow构建推荐系统模型的库。它有助于构建推荐系统的完整工作流程，包括：数据准备、模型制定、模型训练、模型评估和部署等。

该模型是建立在Keras之上的，更加便于构建复杂模型。

Tensorflow Recommenders

TensorFlow Recommenders支持：

建立并评估灵活的推荐检索模型

自由地将item、user和上下文信息合并到推荐模型中

联合训练多目标推荐的多任务模型

自然语言处理之中文分词算法

Posted on 2021-04-30 Edited on 2023-09-14 In 自然语言处理

　　中文分词算法是指将一个汉字序列切分成一个一个单独的词，与英文以空格作为天然的分隔符不同，中文字符在语义识别时，需要把数个字符组合成词，才能表达出真正的含义。分词算法是文本挖掘的基础，通常应用于自然语言处理、搜索引擎、智能推荐等领域。

分词算法分类

　　中文分词算法大概分为三大类，第一类是基于字符串匹配，即扫描字符串，如果发现字符串的子串和词典中的词相同，就算匹配，比如机械分词方法。这类分词通常会加入一些启发式规则，比如“正向/反向最大匹配”，“长词优先”等。第二类是基于统计以及机器学习的分词方法，它们基于人工标注的词性和统计特征，对中文进行建模，即根据观测到的数据(标注好的语料)对模型参数进行训练，在分词阶段再通过模型计算各种分词出现的概率，将概率最大的分词结果作为最终结果。常见的序列标注模型有HMM和CRF。这类分词算法能很好处理歧义和未登录词问题，效果比前一类效果好，但是需要大量的人工标注数据，以及较慢的分词速度。第三类是通过让计算机模拟人对句子的理解，达到识别词的效果，由于汉语语义的复杂性，难以将各种语言信息组织成机器能够识别的形式，目前这种分词系统还处于试验阶段。

机械分词算法

　　机械分词方法又叫基于字符串匹配的分词方法，它是按照一定的策略将待分析的字符串与一个“充分大的”机器词典中的词条进行匹配，若在词典中找到某个字符串，则匹配成功(识别出一个词)。这是最简单的分词方法，但非常高效和常见。

　　机械分词方法按照扫描方向的不同，可以分为正向匹配和逆向匹配;按照不同长度优先匹配的情况，可以分为最大(最长)匹配和最小(最短)匹配;常用的几种机械分词方法如下：

正向最大匹配法(由左到右的方向);如以例句“达观数据是一家大数据公司”，使用正向最大匹配法分词的结果为“达观/数据/是一/家/大数据/公司”

　　逆向最大匹配法(由右到左的方向);同样以例句“达观数据是一家大数据公司”，使用逆向最大匹配法分词的结果为“达观/数据/是/一家/大数据/公司”

基于统计的分词方法

二进制安装mysql -centos

Posted on 2021-04-23 Edited on 2023-09-14 In 大数据技术

1、下载二进制版本安装包。这里以 5.7.11 版本为例。

2、我装在/usr/local目录下面，把下载的mysql包放在这个文件夹下面，执行以下命令，期间建立一个mysql的软连接。

1
2
3

# tar -zxvf mysql-5.7.12-linux-glibc2.5-x86_64.tar.gz
# ln -s mysql-5.7.12-linux-glibc2.5-x86_64 mysql 
# cd mysql

3、在mysql创建一个data目录，用于存放数据文件。执行以下命令: 需要修改路径避免磁盘爆满

# groupadd mysql
# useradd -r -g mysql -s /bin/false mysql
# mkdir data
# chown -R root:root .
# bin/mysqld --initialize --user=mysql --basedir=/usr/local/mysql --datadir=/usr/local/mysql/data
# bin/mysql_ssl_rsa_setup --datadir=/usr/local/mysql/data

软链接至数据分区：

mkdir -p /data/mysql/{data,binlogs,log,etc,run}
ln -s /data/mysql/data    /usr/local/mysql/data
ln -s /data/mysql/binlogs  /usr/local/mysql/binlogs
ln -s /data/mysql/log    /usr/local/mysql/log
ln -s /data/mysql/etc    /usr/local/mysql/etc
ln -s /data/mysql/run    /usr/local/mysql/run
chown -R mysql.mysql     /data/mysql/
chown -R mysql.mysql     /usr/local/mysql/{data,binlogs,log,etc,run}

记住密码：

4、完成上述工作，配置my.cnf。修改 /etc/my.cnf。（也可从 /usr/local/mysql/support-files 子目录下找到一个叫 my-default.cnf 的配置样例文件,复制到/etc）执行命令。

复制命令：
# cp /usr/local/mysql/support-files/my-default.cnf /etc/my.cnf
修改命令：
# vi /etc/my.cnf

Kubernetes

Posted on 2021-03-12 Edited on 2023-09-14 In 大数据技术

简介

Kubernetes，又称为 k8s（首字母为 k、首字母与尾字母之间有 8 个字符、尾字母为 s，所以简称 k8s）或者简称为 “kube” ，是一种可自动实施 Linux 容器操作的开源平台。它可以帮助用户省去应用容器化过程的许多手动部署和扩展操作。可以将运行 Linux 容器的多组主机聚集在一起，由 Kubernetes 帮助您轻松高效地管理这些集群。这些集群可跨公共云、私有云或混合云部署主机。对于要求快速扩展的云原生应用而言（例如借助 Apache Kafka 进行的实时数据流处理），Kubernetes 是理想的托管平台。

Kubernetes 最初由 Google 的工程师开发和设计。Google 是最早研发 Linux 容器技术的企业之一（组建了cgroups），曾公开分享介绍 Google 如何将一切都运行于容器之中（这是 Google 云服务背后的技术）。Google 每周会启用超过 20 亿个容器——全都由内部平台 Borg 支撑。Borg 是 Kubernetes 的前身，多年来开发 Borg 的经验教训成了影响 Kubernetes 中许多技术的主要因素。