├── _posts
    ├── database
    │   └── mysql.md
    ├── machine_learning
    │   ├── 2019-03-03-titanic.md
    │   ├── 2019-10-01-linear-regression.md
    │   ├── 2019-10-03-classification.md
    │   ├── 2019-10-02-logistics-regression.md
    │   ├── 2019-09-11-cat-in-the-dat.md
    │   ├── 2019-03-20-cnns.md
    │   ├── 2019-03-10-RNN.md
    │   ├── 2019-03-04-train-dl.md
    │   ├── 2019-09-30-what-is-machine-learning.md
    │   └── 2019-10-04-pca.md
    ├── python
    │   ├── 2018-11-02-pandas.html
    │   ├── 2019-09-21-sparse-matrix.md
    │   ├── 2018-10-06-python-snippets.md
    │   ├── 2018-07-04-format.md
    │   └── 2018-06-02-python-re.md
    ├── rec
    │   ├── 2019-09-10-ncf-code.md
    │   ├── 2019-09-12-fm-family-code.md
    │   ├── 2019-08-31-amazon-item-to-item.md
    │   ├── 2019-09-06-deep-FM.md
    │   ├── 2019-09-04-wide-deep.md
    │   ├── 2019-09-05-FM.md
    │   ├── 2019-09-17-item-sim-models.md
    │   ├── 2019-09-10-ncf.md
    │   └── 2019-09-24-crt-models.md
    ├── network
    │   ├── 2015-08-31-http-headers.md
    │   ├── 2016-08-25-arp.md
    │   ├── log.md
    │   ├── 2015-08-31-http-semantic.md
    │   ├── 2015-09-01-http-cache.md
    │   ├── 2020-02-20-https.md
    │   ├── 2020-07-23-计算机网络.md
    │   ├── 2015-09-03-http-cookit.md
    │   └── 2020-06-10-http-body-encoding.md
    ├── unix
    │   ├── time.md
    │   ├── open.md
    │   ├── 2020-01-10-dynamic-memory.md
    │   ├── 2019-12-18-client-server-pattern.md
    │   └── signal.md
    ├── cs
    │   ├── 2016-05-19-use-summator-do-subtraction.md
    │   ├── 2020-06-02-codec.md
    │   ├── 2015-05-01-computer-storage-systemter.md
    │   └── 2015-02-10-data-representation.md
    ├── algorithm
    │   ├── 2015-03-01-pow-no-recurtion.md
    │   ├── 2017-06-09-newtons-method.md
    │   ├── 2017-01-05-sort.md
    │   ├── 2018-01-10-maximum-contiguous-subsequence.md
    │   ├── 2019-08-11-binary-search.md
    │   ├── 2019-10-13-sample.md
    │   └── 2017-04-10-link-list.md
    ├── cpp
    │   ├── 2015-04-29-cpp-inherit-type.md
    │   ├── 2020-02-08-c-vararg.md
    │   ├── 2015-11-03-effective-cpp-46.md
    │   ├── 2015-03-15-c-pre-processing.md
    │   └── 2020-05-20-chrono.md
    ├── web
    │   ├── 2016-11-11-avoid-forced-synchonous-layout.md
    │   ├── 2016-11-01-how-gpu-speed-up-page-render.md
    │   ├── 2016-05-18-web-security.md
    │   ├── css
    │   │   ├── 2015-09-10-css-flex.md
    │   │   ├── 2015-08-20-css-selector.md
    │   │   └── 2015-10-10-css-animation.md
    │   ├── 2016-09-08-css-center.md
    │   ├── 2016-07-21-fetch-API.md
    │   └── 2016-04-02-high-performace-web.md
    └── tools
    │   └── 2018-11-30-jupyterlab.md
├── README.md
├── site
    ├── assets
    │   ├── images
    │   │   ├── favicon.ico
    │   │   └── loading.gif
    │   ├── css
    │   │   ├── text.scss
    │   │   ├── style.scss
    │   │   └── scss
    │   │   │   ├── m-enhance.scss
    │   │   │   ├── print.scss
    │   │   │   ├── var.scss
    │   │   │   ├── m-tools.scss
    │   │   │   ├── m-site.scss
    │   │   │   ├── m-footer.scss
    │   │   │   ├── m-home.scss
    │   │   │   ├── m-header.scss
    │   │   │   ├── m-list.scss
    │   │   │   ├── notebook.scss
    │   │   │   ├── common.scss
    │   │   │   ├── highlight.scss
    │   │   │   ├── m-post.scss
    │   │   │   └── m-icon.scss
    │   └── js
    │   │   └── lib
    │   │       └── ansi_up.min.js
    ├── pages
    │   ├── 404.md
    │   ├── about.md
    │   ├── list.html
    │   ├── tags.html
    │   ├── categories.html
    │   └── index.html
    ├── _layouts
    │   ├── page.html
    │   ├── notebook.html
    │   ├── post.html
    │   ├── blank.html
    │   └── default.html
    └── _includes
    │   ├── tongji.js
    │   ├── init.html
    │   ├── footer.html
    │   └── echo.js
└── _config.yml


/_posts/database/mysql.md:
--------------------------------------------------------------------------------
1 | lqcG,H-w1_d;


--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
1 | ## Notebook
2 | 
3 | 我的编程笔记本，记录平时所学编程相关的知识，便于随时查阅。
4 | 


--------------------------------------------------------------------------------
/site/assets/images/favicon.ico:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/w4096/notebook/HEAD/site/assets/images/favicon.ico


--------------------------------------------------------------------------------
/site/assets/images/loading.gif:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/w4096/notebook/HEAD/site/assets/images/loading.gif


--------------------------------------------------------------------------------
/site/pages/404.md:
--------------------------------------------------------------------------------
1 | ---
2 | layout: page
3 | title: 出错啦！
4 | permalink: /404.html
5 | ---
6 | 
7 | 此页面还没开发出来，看看别的页面吧先... :)
8 | 


--------------------------------------------------------------------------------
/site/assets/css/text.scss:
--------------------------------------------------------------------------------
1 | ---
2 | ---
3 | 
4 | @charset "utf-8";
5 | 
6 | @import 'var';
7 | @import 'typo';
8 | @import "m-site";
9 | @import "print";


--------------------------------------------------------------------------------
/_posts/machine_learning/2019-03-03-titanic.md:
--------------------------------------------------------------------------------
1 | ---
2 | layout: notebook
3 | title: Kaggle - 泰坦尼克号
4 | category: 机器学习
5 | file: "notebook/titanic.ipynb"
6 | ---


--------------------------------------------------------------------------------
/_posts/python/2018-11-02-pandas.html:
--------------------------------------------------------------------------------
1 | ---
2 | layout: notebook
3 | title: Pandas 操作指南
4 | category: Python
5 | tags: ['编程']
6 | file: notebook/pandas.ipynb
7 | ---


--------------------------------------------------------------------------------
/_posts/python/2019-09-21-sparse-matrix.md:
--------------------------------------------------------------------------------
1 | ---
2 | layout: notebook
3 | title: 稀疏矩阵 - COO, CSR, CSC
4 | category: Python
5 | file: notebook/sparse-matrix.ipynb
6 | ---


--------------------------------------------------------------------------------
/_posts/machine_learning/2019-10-01-linear-regression.md:
--------------------------------------------------------------------------------
1 | ---
2 | layout: notebook
3 | title: 机器学习 - 线性回归
4 | category: 机器学习
5 | file: notebook/002-linear-regression.ipynb
6 | ---


--------------------------------------------------------------------------------
/_posts/machine_learning/2019-10-03-classification.md:
--------------------------------------------------------------------------------
1 | ---
2 | layout: notebook
3 | title: 机器学习 - 分类问题
4 | category: 机器学习
5 | file: notebook/004-classification.ipynb
6 | ---
7 | 


--------------------------------------------------------------------------------
/_posts/rec/2019-09-10-ncf-code.md:
--------------------------------------------------------------------------------
1 | ---
2 | layout: notebook
3 | title: Neural Collaborative Filtering 实现
4 | category: 推荐系统
5 | tags: ['推荐系统']
6 | file: notebook/NCF.ipynb
7 | ---


--------------------------------------------------------------------------------
/_posts/rec/2019-09-12-fm-family-code.md:
--------------------------------------------------------------------------------
1 | ---
2 | layout: notebook
3 | title: FM, FFM, DFM, NFM, Wide & Deep 实现
4 | category: 推荐系统
5 | tags: ['推荐系统']
6 | file: notebook/FM.ipynb
7 | ---


--------------------------------------------------------------------------------
/_posts/machine_learning/2019-10-02-logistics-regression.md:
--------------------------------------------------------------------------------
1 | ---
2 | layout: notebook
3 | title: 机器学习 - 逻辑回归
4 | category: 机器学习
5 | file: "notebook/003-logistics-regression.ipynb"
6 | ---


--------------------------------------------------------------------------------
/_posts/python/2018-10-06-python-snippets.md:
--------------------------------------------------------------------------------
1 | ---
2 | layout: notebook
3 | title: Python 代码片段
4 | category: Python
5 | tags: ['Python','编程']
6 | file: notebook/python_snippets.ipynb
7 | ---


--------------------------------------------------------------------------------
/_posts/machine_learning/2019-09-11-cat-in-the-dat.md:
--------------------------------------------------------------------------------
1 | ---
2 | layout: notebook
3 | title: Kaggle - Categorical Feature Encoding Challenge
4 | category: 机器学习
5 | file: "notebook/cat-in-the-dat.ipynb"
6 | ---


--------------------------------------------------------------------------------
/site/_layouts/page.html:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: default
 3 | ---
 4 | 
 5 | <div class="page__header">
 6 | {% if page.title %}
 7 | <h4 class="page__title">{{page.title}}</h4>
 8 | {% endif %}    
 9 | </div>
10 | {{ content }}
11 | 


--------------------------------------------------------------------------------
/site/_includes/tongji.js:
--------------------------------------------------------------------------------
 1 | var _hmt = _hmt || [];
 2 | (function() {
 3 |   if(location.hostname == 'wangyu.name'){
 4 |     var hm = document.createElement("script");
 5 |     hm.src = "https://hm.baidu.com/hm.js?4f64d9d3a91e47b8d7e045083769fe7f";
 6 |     var s = document.getElementsByTagName("script")[0]; 
 7 |     s.parentNode.insertBefore(hm, s);
 8 |   }
 9 | })();
10 | 


--------------------------------------------------------------------------------
/site/assets/css/style.scss:
--------------------------------------------------------------------------------
 1 | ---
 2 | ---
 3 | 
 4 | @charset "utf-8";
 5 | 
 6 | @import 'var';
 7 | @import 'common';
 8 | @import 'typo';
 9 | @import 'm-header';
10 | @import 'm-footer';
11 | @import 'm-list';
12 | @import "m-post";
13 | @import "m-home";
14 | @import "m-icon";
15 | @import "highlight";
16 | @import "m-site";
17 | @import "print";
18 | @import "m-enhance";
19 | @import "notebook";


--------------------------------------------------------------------------------
/site/_includes/init.html:
--------------------------------------------------------------------------------
 1 | <script>
 2 | window.WY = {
 3 |     url_map: {},
 4 |     queue: [],
 5 |     run: function(func){
 6 |         this.queue.push(func);
 7 |     },
 8 |     message: function(text){
 9 |         let box = document.querySelector('.message-box');
10 |         box.innerHTML = text;
11 |     }
12 | };
13 | 
14 | {%if page.math %}
15 | window.__math__ = true;
16 | {% endif %}
17 | </script>


--------------------------------------------------------------------------------
/site/assets/css/scss/m-enhance.scss:
--------------------------------------------------------------------------------
 1 | @charset "utf-8";
 2 | 
 3 | .language-chart{
 4 |     display: none;    
 5 | }
 6 | 
 7 | .chart{
 8 |     max-width: 800px;
 9 |     margin: 2em auto;
10 | }
11 | 
12 | 
13 | .task-list-item{
14 |     list-style: none;
15 | }
16 | .task-list-item-checkbox{
17 |     margin: 0 .5em 0 -1.4em;
18 |     vertical-align: middle;
19 |     width: 1em;
20 |     height: 1em;
21 | }


--------------------------------------------------------------------------------
/site/_includes/footer.html:
--------------------------------------------------------------------------------
 1 | <span class="m-to-top"><i class="iconfont icon-up"></i></span>
 2 | 
 3 | <footer class="m-footer">
 4 |     <div class="wrap">
 5 |         <div class="copyright">
 6 |             <p>&copy; 2015-2020 {{ site.title }}</p>
 7 |         </div>
 8 |     </div>
 9 | </footer>
10 | 
11 | {%if page.issue %}
12 | <script src="/assets/js/lib/marked.min.js"></script>
13 | {% endif %}
14 | <script>
15 | {% include tongji.js %}
16 | </script>


--------------------------------------------------------------------------------
/site/pages/about.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: 关于
 4 | nav: about
 5 | permalink: /about/
 6 | ---
 7 | 
 8 | <style>
 9 |     .post ul{
10 |         margin: 0;
11 |         list-style: none;
12 |     }
13 | </style>
14 | 
15 | <br>
16 | 
17 | 这是我的编程笔记，主要方便自己随时查阅。
18 | 
19 | 
20 | 通过下面链接可以找到我：
21 | 
22 | - => GitHub：[WangYu](https://github.com/wy-ei)
23 | - => 豆瓣：[wy](https://www.douban.com/people/wy_ei) 
24 | - => 邮箱：[wangyu_it@yeah.net](mailto:wangyu_it@yeah.net)


--------------------------------------------------------------------------------
/site/assets/css/scss/print.scss:
--------------------------------------------------------------------------------
 1 | @media print {
 2 |     .m-header,
 3 |     .m-footer,
 4 |     .m-tools,
 5 |     .m-to-top{
 6 |         display: none;
 7 |     }
 8 |     .m-main{
 9 |         padding: .2rem;
10 |     }
11 |     .m-post .typo{
12 |         a{
13 |             color: #444;
14 |             border-bottom: 1px solid #555;
15 |         }
16 |         color: #444;
17 |         h3 {
18 |             border-bottom: 0.25pt dashed #999!important;
19 |         }
20 |     }
21 | }
22 | 


--------------------------------------------------------------------------------
/site/pages/list.html:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: page
 3 | title: 随笔
 4 | description: 文章列表
 5 | permalink: /list/
 6 | nav: list
 7 | ---
 8 | 
 9 | 
10 | <div class="home">
11 |     <ul class="m-list">
12 |     {% for post in site.posts %}
13 |     <li class="list-item">        
14 |         <a href="{{site.base_path}}{{ post.url }}">
15 |             <p class="post-title">{{ post.title }}</p><span class="post-date">{{ post.date|date:"%Y/%m/%d" }}</span>
16 |         </a>
17 |     </li>
18 |     {% endfor %}
19 |     </ul>
20 | </div>
21 | 


--------------------------------------------------------------------------------
/site/assets/css/scss/var.scss:
--------------------------------------------------------------------------------
 1 | @charset "utf-8";
 2 | 
 3 | $active-color: #e50053;
 4 | $font-family: "PingFang SC", "Helvetica Neue", Helvetica, Arial, "Hiragino Sans GB", "Microsoft Yahei", 微软雅黑, STHeiti, 华文细黑, sans-serif;
 5 | $code-font-family: "SF Mono", Menlo, Consolas, "Ubuntu Mono", "Liberation Mono", "DejaVu Sans Mono", "Courier New", monospace;
 6 | $border-color: #ccc;
 7 | 
 8 | $title-color: #000;
 9 | $content-color: #000;
10 | $secondary-color: #555;
11 | $gray-background-color: #f3f3f3;
12 | 
13 | $content-font-size: .14rem;


--------------------------------------------------------------------------------
/site/_layouts/notebook.html:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | notebook: true
 4 | ---
 5 | 
 6 | <div id="app"></div>
 7 | {% if page.file %}
 8 | <script>
 9 |     var __notebook__ = {% include_relative {{page.file}} %}
10 | </script>
11 | {% else %}
12 | <div>一定要提供 file 参数</div>
13 | {% endif %}
14 | 
15 | <script src="https://cdn.jsdelivr.net/npm/marked@1.2.2/lib/marked.min.js"></script>
16 | <script src="{{site.assets_path}}/js/lib/notebook.min.js"></script>
17 | 
18 | <script>
19 |     window.WY.run(function() {
20 |         var app = document.getElementById("app");
21 |         this.render_notebook(__notebook__, app);
22 |     });
23 | </script>


--------------------------------------------------------------------------------
/site/assets/css/scss/m-tools.scss:
--------------------------------------------------------------------------------
 1 | .m-tools{
 2 |     position: fixed;
 3 |     bottom: .4rem;
 4 |     right: .1rem;    
 5 |     transform: translateZ(0);    
 6 | }
 7 | 
 8 | .m-tools .btn{
 9 |     display: block;
10 |     width: .3rem;
11 |     text-align: center;
12 |     height: .3rem;
13 |     border-radius: .05rem;
14 |     background-color: rgba(170, 170, 170 , 0.5);
15 |     line-height: .3rem;    
16 |     cursor: pointer;    
17 | }
18 | 
19 | .m-tools .btn:first-of-type{
20 |     margin-bottom: 1em;
21 |     font-weight: 900;
22 | }
23 | 
24 | @media screen and (max-width: 400px) {
25 |     .m-tools{
26 |         display: none;
27 |     }
28 | }


--------------------------------------------------------------------------------
/_posts/network/2015-08-31-http-headers.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: HTTP 常见头部字段
 4 | category: 网络
 5 | ---
 6 | 
 7 | * toc
 8 | {:toc}
 9 | 
10 | 
11 | ## 持久连接
12 | 
13 | HTTP 协议需要采用 TCP 做数据传输，在 HTTP 的早期版本中，每次 HTTP 通信都要建立一次 TCP 连接。而 TCP 连接需要三次握手，这大大降低了 HTTP 传输的性能。
14 | 
15 | 在 Web 发展的早期，网页中的资源比较少，常常只有一个 html 页面，所以这一矛盾体现的不明显。后来，一个网页中包含几十个图片那是常有的事情，每个资源都需要建立一次 TCP 连接，就相当浪费。
16 | 
17 | 解决方法也能直观，多个 HTTP 请求可以用单个 TCP 连接进行传输。这要求服务器在传输完资源之后，不要断开，而是保持 TCP 连接，因为客户端会利用此 TCP 连接发送第二个 HTTP 请求。
18 | 
19 | 在 `HTTP/1.0` 和 `HTTP/1.1` 中开始支持这种持久连接。其中 `HTTP/1.0` 中需要显式地指定头部：
20 | 
21 | ```
22 | Connection: Keep-Alive
23 | ```
24 | 
25 | 才能开启持久连接，在 `HTTP/1.1` 中默认开启持久连接。持久连接需要服务器提供支持，客户端在请求中要求持久连接，即设置 `Keep-Alive`，如果服务器支持持久连接，服务器也就会设定持久连接。


--------------------------------------------------------------------------------
/site/assets/css/scss/m-site.scss:
--------------------------------------------------------------------------------
 1 | @charset "utf-8";
 2 | 
 3 | 
 4 | // 默认为手机屏幕，手机上不需要很大的字
 5 | html {
 6 |     font-size: 100px;
 7 |     background: #fff;
 8 | }
 9 | 
10 | body{
11 |     font-size: $content-font-size;
12 |     position: relative;
13 |     color: $content-color;
14 |     min-height: 100vh;
15 | }
16 | 
17 | .wrap {
18 |     margin: auto;
19 |     width: 900px;
20 | }
21 | 
22 | @each $max-width, $width in (1400px: 900px, 1023px: 80%, 768px: 95%) {
23 |   @media screen and (max-width: $max-width) {
24 |       .wrap {
25 |           width: $width;
26 |       }
27 |   }
28 | }
29 | 
30 | @media screen and (max-width: 600px) {
31 |     body {
32 |         font-size: .14rem;
33 |     }
34 | }
35 | 
36 | /* container layout */
37 | .m-main {
38 |     padding-bottom: 2rem;
39 | }


--------------------------------------------------------------------------------
/site/pages/tags.html:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: page
 3 | title: 标签
 4 | description: 文章标签
 5 | permalink: /tags/
 6 | ---
 7 | 
 8 | 
 9 | 
10 | 
11 | <div class="tag-list">
12 |   {% for tag in site.tags reversed %}
13 |   <a href="#{{ tag[0] }}">{{ tag[0] }}</a>
14 |   {% endfor %}
15 | </div>
16 | 
17 | 
18 | <div class="category-list">
19 |   {% for tag in site.tags reversed %}
20 | <div class="">
21 |     <h3 id="{{ tag | first }}" class="m-list__title"><i class="icon iconfont icon-folder"></i>{{ tag | first }}</h3>
22 |     <ul class="m-list">
23 |     {% for post in tag.last %}
24 |       <li class="list-item">
25 |         <a href="{{site.base_path}}{{ post.url }}">
26 |           <p class="post-title">{{ post.title }}</p><span class="post-date">{{ post.date|date:"%Y/%m/%d" }}</span>
27 |         </a>
28 |       </li>
29 |     {% endfor %}
30 |     </ul>
31 |   </div>
32 | {% endfor %}
33 | </ul>
34 | 


--------------------------------------------------------------------------------
/site/_layouts/post.html:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: default
 3 | ---
 4 | 
 5 | <div class="post">
 6 |     <div class="page__header">
 7 |         {% if page.title %}
 8 |         <h1 class="page__title ">{{page.title}}</h1>
 9 |         {% endif %}
10 |         {% if page.date %}
11 |         <div class="post-info">
12 |             {% if page.categories.size > 0 %}
13 |             <span class="category">分类于：<a href="{{ site.categories_path }}/#{{ page.categories[0] }}">{{ page.categories[0] }}</a></span>
14 |             {% endif %}
15 |             <span>发布于：{{ page.date|date:"%Y-%m-%d" }}</span>    
16 |         </div>
17 |         {% endif %}
18 |     </div>
19 |     <div class="typo content code-light">
20 |         {% if page.cover %}
21 |         <div class="article__picture">
22 |             <img src="{{page.cover}}" alt="">
23 |         </div>
24 |         {% endif %}
25 |         {{ content }}
26 |     </div>
27 | </div>


--------------------------------------------------------------------------------
/_config.yml:
--------------------------------------------------------------------------------
 1 | encoding: utf-8
 2 | markdown: kramdown
 3 | kramdown:
 4 |   input: GFM
 5 |   syntax_highlighter: rouge
 6 |   syntax_highlighter_opts:
 7 |     disable: true
 8 |   toc_levels: 2..3
 9 | 
10 | permalink: /:year/:slug/
11 | 
12 | layouts_dir: site/_layouts
13 | includes_dir: site/_includes
14 | 
15 | future: true
16 | 
17 | sass:
18 |   sass_dir: /site/assets/css/scss
19 |   style: compressed
20 | 
21 | 
22 | title: WangYu's Notebook
23 | slogan: 好记性不如烂笔头
24 | 
25 | images: https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/
26 | 
27 | base_path: "/notebook"
28 | home_path: "/notebook/"
29 | categories_path: /notebook/categories/
30 | list_path: /notebook/list/
31 | tags_path: /notebook/tags/
32 | about_path: /notebook/about/
33 | 
34 | assets_path: /notebook/site/assets
35 | 
36 | base_url: "https://wy-ei.github.io/notebook/"
37 | excerpt_separator: "<!--more-->"
38 | author :
39 |   name : wy-ei
40 |   email : wangyu_it@yeah.net
41 |   github : wy-ei
42 | 
43 | 


--------------------------------------------------------------------------------
/site/pages/categories.html:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: page
 3 | title: 分类
 4 | nav: category
 5 | description: 文章分类
 6 | permalink: /categories/
 7 | ---
 8 | 
 9 | 
10 | 
11 | <div class="tag-list">
12 |     {% for category in site.categories %}
13 |       <a href="#{{ category | first }}">{{ category | first }} ({{ category | last | size }})</a>
14 |     {% endfor %}
15 | </div>
16 | 
17 | 
18 | <div class="category-list">
19 | {% for category in site.categories reversed %}
20 |   <div id="{{ category | first }}">
21 |       <h3  class="m-list__title"><i class="icon iconfont icon-category"></i>{{ category | first }}</h3>
22 |       <ul class="m-list">
23 |       {% for post in category.last %}
24 |         <li class="list-item">
25 |             <a href="{{site.base_path}}{{ post.url }}">
26 |               <p class="post-title">{{ post.title }}</p><span class="post-date">{{ post.date|date:"%Y/%m/%d" }}</span>
27 |             </a>
28 |         </li>
29 |       {% endfor %}
30 |       </ul>
31 |     </div>
32 | {% endfor %}
33 | </ul>


--------------------------------------------------------------------------------
/_posts/network/2016-08-25-arp.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: ARP 协议工作原理
 4 | category: 网络
 5 | ---
 6 | 
 7 | 
 8 | ARP (Address Resolution Protocol) 协议用于完成网络地址到硬件地址的转换，网络地址通常指 IP 地址，硬件地址通常为 MAC 地址。
 9 | 
10 | 当 IP 分组要发向下一跳时，需要借助于链路层，IP 分组需要加上链路层的头部，比如以太网头部，这其中就包含 MAC 地址，因此网络层需要知道目的 IP 对应的 MAC 地址是多少。
11 | 
12 | 一种直观的想法是，直接向当前链路上的设备询问，比如查询 192.169.1.100 的 MAC 地址，那就在链路层上发送广播，问谁的 IP 地址是 192.168.1.100，请把你的 MAC 地址告诉我。
13 | 
14 | ARP 请求就是这么做的，要在链路上广播，目的 MAC 地址是 ff:ff:ff:ff:ff:ff，这样链路上所有机器都能接收到，这些机器拿自己的 IP 地址和 ARP 请求报文中的 IP 地址比较，如果匹配那就发送应答。
15 | 
16 | 下面考虑一个例子：
17 | 
18 | 下图中有三台计算机，A 和 B 处于同一网络，C 处于另一个网络。
19 | 
20 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2020/04/21/5e9e76f1c2a9a83be5449c86.jpg)
21 | 
22 | 当 A 要向 B 发送 IP 分组时，需要知道 B 的 MAC 地址，此时 A 使用 B 的 IP 地址发送 ARP 请求，该请求以广播形式发送，B 收到后，发现有人在查询自己的 MAC 地址，此时会发送 ARP 响应，目的地址为 A 的 MAC 地址。
23 | 
24 | 如果 A 要向 C 发送 IP 分组呢？因为 A 知道 C 的 IP 地址，且知道它处于另一个网络中，因此需要把 IP 分组发到路由器上，因此查询的 MAC 地址就是路由器的地址了。而 A 的路由表中是有路由器的 IP 地址的，因此使用路由器的 IP 地址查询 MAC 地址就可以了。
25 | 
26 | 通常计算机上都有 ARP 缓存，缓存着最近查询过的 IP-MAC 对，这样就不需要每次都发送 ARP 请求来查询了。


--------------------------------------------------------------------------------
/_posts/network/log.md:
--------------------------------------------------------------------------------
 1 | ## syslog
 2 | 
 3 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2020/04/23/5ea10854c2a9a83be587be01.jpg)
 4 | 
 5 | 配置文件：
 6 | 
 7 | ```
 8 | /etc/rsyslog.d/
 9 | 
10 | 
11 | /var/log/
12 | ```
13 | 
14 | 配置文件格式：
15 | 
16 | ```
17 | facility.level  action
18 | 
19 | *.=debug;\
20 |         auth,authpriv.none;\
21 |         news.none;mail.none     -/var/log/debug
22 | *.=info;*.=notice;*.=warn;\
23 |         auth,authpriv.none;\
24 |         cron,daemon.none;\
25 |         mail,news.none          -/var/log/messages
26 | ```
27 | 
28 | 
29 | 
30 | ```c++
31 | openlog(argv[0], 0, LOG_DEBUG);
32 | 
33 | // 用于设置哪些级别的日志会被记录
34 | // 多个级别可以使用与操作一次传入
35 | setlogmask(LOG_INFO | LOG_ERR);
36 | 
37 | syslog(LOG_ERR, "hello %s\n", "syslog");
38 | ```
39 | 
40 | ## 用户信息
41 | 
42 | 用户 ID（UID）和有效用户 ID(EUID) 都是什么？一个进程拥有两个用户 ID，UID 就是运行该进程的用户 ID，有效用户 ID 则是用于方便控制资源的访问。当一个可执行程序设置了 `set-user-id` 标志时，运行该程序时，该进程的有效用户 ID 就是程序拥有者的 ID。
43 | 
44 | 比如 `su` 程序，他的文件拥有是 root，其他用户执行该程序的时候，进程里的用户 ID 就是执行该程序的用户的 ID，由于该程序设置了  `set-user-id` 标志，因此在执行该程序的时候，有效用户 ID 就是 root。
45 | 
46 | ## 守护进程
47 | 
48 | 


--------------------------------------------------------------------------------
/_posts/unix/time.md:
--------------------------------------------------------------------------------
 1 | ## 时间处理
 2 | 
 3 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2020/04/10/5e903930504f4bcb0483380d.jpg)
 4 | 
 5 | 
 6 | ## 定时器
 7 | 
 8 | ### 间隔定时器
 9 | 
10 | 
11 | ### 给阻塞操作设置超时
12 | 
13 | 为了避免某些阻塞操作长时间阻塞，我们希望能够给他添加一个超时时间。但超时时间并不是所有接口都有的，比如 `select` 就可以设置超时时间，但是 `read` 就不行。不过我们可以人为地加入对超时的支持。
14 | 
15 | 由于阻塞的系统调用会被信号处理程序中断，因此在调用某阻塞操作之前，可以设置一个定时器，当定时器超时后，阻塞的函数调用就会返回，通常为 `-1`，且设置错误码 `errno` 为 `EINTR`。因为定时器超时的默认动作是终止进程，因此需要修改默认的信号处理程序。
16 | 
17 | ```c++
18 | static void do_nothing(int signum){
19 | }
20 | 
21 | void example(){
22 |     struct sigaction sa{};
23 |     sa.sa_flags = 0;
24 |     sigemptyset(&sa.sa_mask);
25 |     sa.sa_handler = do_nothing;
26 |     sigaction(SIGALRM, &sa, nullptr);
27 | 
28 |     char buf[BUFSIZ];
29 | 
30 |     alarm(10); // timeout after 10s
31 |     int n = read(STDIN_FILENO, buf, BUFSIZ-1);
32 |     alarm(0); // turn off timer
33 | 
34 |     if(n == -1){
35 |         if(errno == EINTR){
36 |             fprintf(stderr, "timeout for read\n");
37 |         }else{
38 |             fprintf(stderr, "read fail: %s\n", strerror(errno));
39 |         }
40 |     }else{
41 |         buf[n] = '\0';
42 |         printf("read success. %s\n", buf);
43 |     }
44 | }
45 | ```


--------------------------------------------------------------------------------
/_posts/cs/2016-05-19-use-summator-do-subtraction.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: 使用加法器完成减法
 4 | category: 理解计算机
 5 | published: false
 6 | ---
 7 | 
 8 | 在大学的数字电路课程中，学习过一种叫做加法器的东西，它可以用来完成加法运算。其本质上是采用了与非门来实现的。
 9 | 
10 | 加法器可以用来做加法，那么减法是如何实现的呢？
11 | 
12 | 在减法运算中存在借位的问题，借位似乎不像进位那样容易实现，不过可以采用适当的方式让减法运算也不需要借位。看下面的推导：
13 | 
14 | ```
15 | 213 - 168 = 213 + 999 - 168 - 999
16 | ```
17 | 
18 | 以上式子可以转换为：
19 | 
20 | ```
21 | 213 - 168 = 213 + 999 - 168 + 1 - 1000
22 | ```
23 | 
24 | 进一步推导：
25 | 
26 | ```
27 | 213 - 168
28 | = 213 + 999 - 168 + 1 - 1000 
29 | = 213 + 831 + 1 - 1000
30 | = 1044 + 1 - 1000
31 | = 45
32 | ```
33 | 
34 | 给原式中加上 999 + 1 - 1000，这样 `999 - 168` 不存在借位，因为 `999` 中的各位都是最大的。最后 `-1000` 只有最高位上可能存在借位（差为负的时候）。
35 | 
36 | ## 二进制减法
37 | 
38 | 将上面的数转换为二进制：
39 | 
40 | 对于二进制，8 位二进制最大的数为 1111 1111。
41 | 
42 | ```
43 | 1101 0101 - 1010 1000 = 1101 0101 + 1111 1111 - 1010 1000 + 1 - 1 0000 0000
44 | ```
45 | 
46 | 其实 `1111 1111 - 1010 1000` 的结果就是将减数的 0 和 1 调换一下，因此得到结果 `0101 0111`,之后的步骤，如十进制中一样：
47 | 
48 | 将被减数与以上结果相加：
49 | 
50 | ```
51 | 1101 0101 + 0101 0111 = 1 0010 1100
52 | ```
53 | 
54 | 将结果加 1
55 | 
56 | ```
57 | 1 0010 1100 + 1 = 1 0010 1101
58 | ```
59 | 
60 | 将结果减去 `1 0000 0000`
61 | 
62 | ```
63 | 1 0010 1101 - 1 0000 0000 = 10 1101
64 | ```
65 | 


--------------------------------------------------------------------------------
/_posts/unix/open.md:
--------------------------------------------------------------------------------
 1 | ## 原子操作和竞争条件
 2 | 
 3 | 多个进程向文件尾部追加内容，如果使用下面的代码，就会出现 bug，因为在执行完 `lseek` 之后，有可能另一个进程执行了写操作，当前进程随后的 `write` 操作就会覆盖另一个进程写入的内容。
 4 | 
 5 | ```c++
 6 | if(lseek(fd, 0, SEEK_END) == -1){
 7 |     errExit("lseek");
 8 | }
 9 | if(write(fd, buf, len) != len){
10 |     fatal("Partial/failed write");
11 | }
12 | ```
13 | 
14 | 在打开文件的时候，使用 `O_APPEND` 标志，可以保证写入操作是以追加的形式进行的。
15 | 
16 | 
17 | ## `/dev/fd` 目录
18 | 
19 | 对于每个进程，内核都提供一个特殊的虚拟目录，其中包含 `/dev/fd/n` 形式的文件名，这里的文件 n，就是文件描述符 n 所指的文件。
20 | 
21 | ```c++
22 | fd = open("/dev/fd/1", O_WRONLY);
23 | fd = dup(1);
24 | ```
25 | 
26 | 以上两行代码是等价的。
27 | 
28 | ## 创建临时文件
29 | 
30 | 有些程序需要的运行时创建一些临时文件，在程序运行完毕后立刻删除。
31 | 
32 | ```c++
33 | #include <stdlib.h>
34 | 
35 | int mkstemp (char *__template)
36 | ```
37 | 
38 | 其用法如下：
39 | 
40 | ```c++
41 | char tmp[] = "/tmp/file_XXXXXX";
42 | int fd = mkstemp(tmp);
43 | printf("generated filename was: %s\n", tmp);
44 | unlink(tmp);
45 | 
46 | /* use file */
47 | 
48 | close(fd);
49 | ```
50 | 
51 | 传入的文件名是一个模板，最后 6 个字符一定是 `XXXXXX`，系统将会修改这 6 个字符，构造出一个唯一的文件名，并创建文件并打开，返回文件描述符。因为该函数会修改参数，因此参数不能是字符串常量。
52 | 
53 | 为了避免其他用户和进程看到此文件，在创建完成后可以立刻调用 `unlink`，该文件就会立刻被从文件系统中删除，但只有再 close 的时候，其引用的 inode 才会被删除。在 close 之前，内存中存有文件表，可以正常使用该文件。
54 | 
55 | 另一个函数是：
56 | 
57 | ```c++
58 | #include <stdio.h>
59 | FILE *tmpfile();
60 | ```
61 | 
62 | 该函数打开一个以读写方式打开的流，在关闭流的时候，文件会自动删除。


--------------------------------------------------------------------------------
/_posts/algorithm/2015-03-01-pow-no-recurtion.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: 非递归求幂
 4 | category: 算法
 5 | ---
 6 | 
 7 | 求解一个数的 N 次幂，通常使用 pow 函数。要求 `a^N`，最最显而易见的方法是用 N 个 a 连续做乘法，幸运的是，我们有更快的算法。
 8 | 
 9 | 最常见的一种方法是采用递归的求解方式，如下：
10 | 
11 | ### 递归解法：
12 | 
13 | ```c
14 | long int pow(int x, unsigned int N){
15 |     if (N == 0){
16 |         return 1;
17 |     }
18 |     if (N == 1){
19 |         return x;
20 |     }
21 |     if (N & 1 == 0){
22 |         return pow(x * x, N / 2);
23 |     } else {
24 |         return pow(x * x, N / 2) * x;
25 |     }
26 | }
27 | ```
28 | 
29 | 这个算法的复杂度无疑是 `O(logN)` 的。
30 | 
31 | 下面不采用递归来求解：
32 | 
33 | ### 非递归解法：
34 | 
35 | ```c
36 | long int pow(int x, unsigned int N){
37 |     int ans, n;
38 |     ans = 1;
39 |     n = x;
40 |     while (N != 0){
41 |         if (N & 1 == 1){
42 |             ans = ans * n;
43 |         }
44 |         n = n * n;
45 |         N >> 1;
46 |     }
47 |     return ans;
48 | }
49 | ```
50 | 
51 | 下面来分析一下以上算法的原理：
52 | 
53 | 
54 | 先举个例子，假如希望求 `5^62`，也就是 5 的 62 次方。为了算法高效，一个原则就是不做重复的计算。
55 | 
56 | ```
57 | 5^62 = 5^(32+16+8+4+2) = 5^32 * 5^16 * 5^8 * 5^4 * 5^2
58 | ```
59 | 
60 | 不管指数是多少，都可以将其分解为 2 的倍数的和，因为任何整数都能够写成 2 进制的形式，比如 `62 = 00111110B`。
61 | 
62 | 以上算法中，随着迭代 n 会变成 x, x^2, x^4, x^8,...，我们只需要在合适的时候让它和 ans 相乘即可。合适的时刻就是 N 的二进制表示的相应位上为 1 的时候，这里使用了右移，只需要判断最低位是不是 1 就好了。
63 | 
64 | 这个算法也是 `O(logN)` 的，但是没有使用递归。
65 | 


--------------------------------------------------------------------------------
/site/assets/css/scss/m-footer.scss:
--------------------------------------------------------------------------------
 1 | @charset "utf-8";
 2 | 
 3 | .m-footer {
 4 |     color: #333;
 5 |     background-color: #f3f3f3;
 6 |     font-size: 0.8em;
 7 |     border-top: 1px solid #dedede;
 8 |     position: absolute;
 9 |     bottom: 0;
10 |     left: 0;
11 |     right: 0;
12 |     .link{
13 |         line-height: 1.2em;
14 |         margin-bottom: 1.2em;
15 |         h2{
16 |             font-size: .18rem;
17 |             color: inherit;
18 |             padding-bottom: .04rem;
19 |             margin-bottom: .1rem;
20 |         }
21 |         a{
22 |             display: inline-block;
23 |             margin-right: .2rem;
24 |         }
25 |     }
26 |     a{
27 |         color: inherit;
28 |         border-bottom: 1px solid #999;
29 |         &:hover{
30 |             color: $active-color;
31 |         }
32 |     }
33 |     .copyright{
34 |         color: inherit;
35 |         padding: .15rem 0;
36 |         p{
37 |             height: .15rem;
38 |             line-height: .15rem;
39 |         }
40 |     }
41 | }
42 | 
43 | .m-to-top{
44 |     position: fixed;
45 |     bottom: 60px;
46 |     right: 20px;
47 |     cursor: pointer;
48 |     background: #eee;
49 |     border-radius: 3px;
50 |     width: 30px;
51 |     height: 30px;
52 |     line-height: 30px;
53 |     text-align: center;
54 |     z-index: 10000;
55 | }
56 | 
57 | .m-to-top:hover{
58 |     background: #999;
59 | }


--------------------------------------------------------------------------------
/site/assets/css/scss/m-home.scss:
--------------------------------------------------------------------------------
 1 | @charset "utf-8";
 2 | 
 3 | 
 4 | .home{
 5 |     padding-top: 20px;
 6 |     @at-root .article{
 7 |         padding-bottom: .25rem;
 8 |         margin-bottom: .70rem;
 9 |         &__title{
10 |             font-size: .20rem;
11 |             font-weight: 400;
12 |             margin-bottom: .1rem;
13 |         }
14 | 
15 |         &__info{
16 |             height: .15rem;
17 |             font-size: .12rem;
18 |             color: $secondary-color;
19 |         }
20 | 
21 |         &__picture{
22 |             margin: 16px 0;
23 |             img{
24 |                 width: 100%;
25 |             }
26 |         }
27 | 
28 |         &__excerpt{
29 |             margin: 16px 0 0;
30 |             line-height: 1.8em;
31 |             word-break: break-all;
32 |         }
33 | 
34 |         &__excerpt:empty{
35 |             display: none;
36 |         }
37 |         
38 |         &__more{
39 |             margin-top: .15rem;
40 |             display: inline-block;
41 |             border-bottom: 1px solid;
42 |         }
43 | 
44 |     }
45 | 
46 |     .more--article-list{
47 |         margin-top: .40rem;
48 |         display: inline-block;
49 |     }
50 | 
51 |     
52 | }
53 | 
54 | 
55 | .banner{
56 |     border-radius: 7px;
57 |     height: 460px;
58 |     margin: 18px auto;
59 |     box-shadow: rgba(0,0,0,.08) 0 1px 3px;
60 |     border: 1px solid rgba(0,0,0,.14);
61 | }


--------------------------------------------------------------------------------
/site/assets/css/scss/m-header.scss:
--------------------------------------------------------------------------------
 1 | @charset "utf-8";
 2 | 
 3 | /* header layout */
 4 | .m-header {
 5 |     position: relative;
 6 |     width: 100%;
 7 |     margin-bottom: 1rem;
 8 |     background-color: #f3f3f3;
 9 | 
10 | 
11 |     .site-title{
12 |         padding: .3rem 0 .4rem 0;
13 |     }
14 |     .site-name{
15 |         font-size: .22rem;
16 |         margin-bottom: .2rem;
17 |     }
18 |     .site-slogan{
19 |         font-size: .15rem;
20 |     }
21 |     a{
22 |         color: inherit;        
23 |         display: inline-block;
24 |         &:hover,&.active{
25 |             color: $active-color;
26 |         }
27 |     }
28 |     .site-nav{
29 |         padding-bottom: .1rem; 
30 |         ul{
31 |             list-style: none;
32 |         }
33 |         li {
34 |             display: inline;
35 |             margin-right: .2rem;
36 |         }
37 |         i {
38 |             padding-right: .5em;
39 |         }
40 |     }
41 | }
42 | 
43 | @media screen and (max-width: 768px) {
44 |     .m-header {
45 |         .site-nav{
46 |             li {
47 |                 a{
48 |                     padding: 5px;
49 |                 }
50 |                 margin-right: .2rem;
51 |             }
52 |         }
53 |     }
54 | }
55 | 
56 | @media screen and (max-width: 430px) {
57 |     .m-header {
58 |         .site-nav{
59 |             li {
60 |                 margin-right: .1rem;
61 |             }
62 |         }
63 |     }
64 | }
65 | 


--------------------------------------------------------------------------------
/_posts/algorithm/2017-06-09-newtons-method.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: 牛顿迭代法求解平方根
 4 | category: 算法
 5 | ---
 6 | 
 7 | ## 牛顿迭代法
 8 | 
 9 | 对于一元 N 次方程，当 N 大于 2 时没有固定的求根公式，为了求方程的根，可以使用牛顿迭代法。
10 | 
11 | 牛顿迭代法的思想是在曲线上任意取一个点，然后求这一点的切线，使用切线的解来逼近多项式的解。
12 | 
13 | 
14 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2020/12/03/5fc872aa394ac523781e5357.jpg)
15 | 
16 | 
17 | 然后在 $x_{n+1}$ 处继续做切线：
18 | 
19 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2020/12/03/5fc87308394ac523781e7e87.jpg)
20 | 
21 | 不断的逼近，可以看到上图中切线在 x 轴上的交点 $x_{n+1}$ 已与真实的解 $x_n$ 更近了一些。
22 | 
23 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/06/13/5d026c56451253d178402e69.jpg)
24 | 
25 | 这个过切点的直线的方程为：
26 | 
27 | $$y-f(x_n)=f^\prime(x_n)(x-x_n)$$
28 | 
29 | 令 $y=0$ 可以求得 $x$，这里 $x_{n+1}$ 与 $x_n$ 的关系如下：
30 | 
31 | $$x_{n+1}=x_{n}-\frac{f(x_n)}{f^\prime(x_n)}$$
32 | 
33 | 其中 $f^\prime(x_n)$ 表示 $f(x)$ 在 $x_n$ 处的斜率。
34 | 
35 | ## 使用牛顿迭代法求平方根
36 | 
37 | 求 $N$ 的平方根，可以理解为求如下函数的解：
38 | 
39 | $$f(x)=x^2-N$$
40 | 
41 | 其中 $f(x)$ 的导数为：
42 | 
43 | $$f^\prime(x)=2*x$$
44 | 
45 | 牛顿迭代式为：
46 | 
47 | $$x_{n+1}=x_n-\frac{x_{n}^2-N}{2*x_n}=\frac{1}{2}*(x_n+\frac{N}{x_n})$$
48 | 
49 | 利用以上原理可以写出下面代码：
50 | 
51 | ```python
52 | def sqrt(n):
53 |     if n < 0:
54 |         return float('nan')
55 |     
56 |     # 因为牛顿迭代法只是逼近真实值，所以需要设置一个误差范围
57 |     e = 1e-15
58 |     
59 |     x = n
60 |     x_next = (x + n / x) / 2
61 |     
62 |     # 两次迭代得到的解之间相差小于误差允许范围后跳出
63 |     while abs(x_next - x) > e:
64 |         x = x_next
65 |         # 计算下一个近似解
66 |         x_next = (x + n / x) / 2
67 |     
68 |     return x
69 | ```


--------------------------------------------------------------------------------
/site/pages/index.html:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: page
 3 | description: 博客首页
 4 | nav: home
 5 | permalink: /
 6 | ---
 7 | 
 8 | 
 9 | <p style="margin-bottom: 40px;">
10 | 我的编程笔记，记录平时学到的编程知识，便于自己随时查阅。
11 | </p>
12 | 
13 | <div class="tag-list">
14 |     <h3  class="m-list__title"><i class="icon iconfont icon-category"></i>分类</h3>
15 |     {% for category in site.categories %}
16 |     {% assign post = category | last | last %}
17 |         <a href="#{{ category | first }}">{{ category | first }} ({{ category | last | size }})</a>
18 |     {% endfor %}
19 | </div>
20 |     
21 |     
22 | <h3  class="m-list__title"><i class="icon iconfont icon-time"></i>最近发布</h3>
23 | <ul class="m-list">
24 | {% for i in (0..5) %}
25 | {% assign post = site.posts[i] %}
26 | <li class="list-item">
27 |     <a href="{{site.base_path}}{{ post.url }}">
28 |         <p class="post-title">{{ post.title }}</p><span class="post-date">{{ post.date|date:"%Y/%m/%d" }}</span>
29 |     </a>
30 | </li>
31 | {% endfor %}
32 | </ul>
33 | 
34 | 
35 | <div class="category-list">
36 | {% for category in site.categories reversed %}
37 | {% assign post = category | last | last %}
38 | 
39 | <div id="{{ category | first }}">
40 |     <h3  class="m-list__title"><i class="icon iconfont icon-category"></i>{{ category | first }}</h3>
41 |     <ul class="m-list">
42 |     {% for post in category.last %}
43 |     <li class="list-item">
44 |         <a href="{{site.base_path}}{{ post.url }}">
45 |             <p class="post-title">{{ post.title }}</p><span class="post-date">{{ post.date|date:"%Y/%m/%d" }}</span>
46 |         </a>
47 |     </li>
48 |     {% endfor %}
49 |     </ul>
50 | </div>
51 | {% endfor %}
52 | </ul>


--------------------------------------------------------------------------------
/_posts/machine_learning/2019-03-20-cnns.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: 多种多样的卷积
 4 | category: 机器学习
 5 | ---
 6 | 
 7 | 
 8 | - *
 9 | {:toc}
10 | 
11 | ## 多输入通道
12 | 
13 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/05/12/5cd7e1253a213b04175f126b.jpg)
14 | 
15 | 此图引用自 [动手学习深度学习](https://zh.gluon.ai/chapter_convolutional-neural-networks/channels.html)
16 | 
17 | 对一个二维张量做卷积操作，很容易理解。当输入是多通道时，比如 RGB 三通道的图片，卷积核作用在三个通道上就会产生三个输出。如果有 10 个卷积核，岂不是有 30 个输出了。这是我最初的想法，后来发现事实并非如此。对于三通道的输入，`5*5` 的卷积核，其实会含有 `5*5*3=75`  个参数，也就是说卷积核也是三个通道，三通道的卷积核在三通道的输入上上下左右移动着做 element-wise 的相乘并求和，最终的结果就是一个一通道的输出。最后再在这个输出上加一个 bias。这就是多输入通道时，卷积核工作方式。
18 | 
19 | 所以其实这里的卷积核仔细想来，应该是三维的。这样的卷积才能够捕捉到不同通道之间的关系。
20 | 
21 | ## 多输出通道
22 | 
23 | 如果输入是 3 通道，卷积核大小为 `5*5`，输出是 10 通道，这种情况该怎么办？根据前面对多输入通道卷积工作过程的描述，就不难理解，输出为 10 通道，上例中只要有 10 个核就可以了。
24 | 
25 | ## 1D 卷积
26 | 
27 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/05/12/5cd7d5893a213b04175e3e13.jpg)
28 | 
29 | 1D 卷积，输入数据是一维的，他可以有多个通道，但每个通道都是一维的。因此一维卷积的卷积核也是一维的，它在输入数据上做一维的移动，并做卷积。最终多个通道相加，得到一个一维的输出。
30 | 
31 | ## 1x1 卷积
32 | 
33 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/05/12/5cd7d8a63a213b04175e8e0d.jpg)
34 | 
35 | 1x1 卷积可以看做是对输入的不同通道做了线性加权求和。
36 | 
37 | ## 可分离卷积
38 | 
39 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/05/12/5cd7e0be3a213b04175f0e8a.jpg)
40 | 
41 | 在 keras 中看到 SeparableConv2D 这个类，直译过来就叫做可分离卷积，所以暂且就这么称呼它了。
42 | 
43 | 对常规的 Conv2D 而言，假设输入为 3 通道，卷积核为 `5*5`，输出为 10 通道，那么一共需要 `3*5*5*10+10=760` 个参数，但是对于 `SeparableConv2D` 而言，只需要 `3*5*5 + 10*3 + 10 = 115` 个参数。
44 | 
45 | 如上图所示，可分离卷积对输入的 3 个通道做了 layer-wise 的卷积，即一个卷积核对一个输入层对应着来做卷积，得到 3 个输出层。然后并不做加和，这是和通常的卷积核区别，这里使用 2 个 `1x1` 的卷积来对这 3 个中间的输出层做线性组合，最终得到 2 个输出层。可分离卷积输出的通道数是由 `1x1` 卷积核的个数来决定的。


--------------------------------------------------------------------------------
/_posts/unix/2020-01-10-dynamic-memory.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: 动态内存分配的实现原理
 4 | category: UNIX 编程
 5 | ---
 6 | 
 7 | 
 8 | 动态内存分配通常在堆上进行，堆其实就是一块连续的内存空间。为了实现内存的动态分配与回收，需要提供一组函数来管理这片内存。
 9 | 
10 | ### 隐式空闲链表
11 | 
12 | 为了记录分配的内存的大小，需要使用额外的空间来存储，一种方法是在分配的内存块的前面存放该块的大小。当用户释放了这块内存后，这块内存就可以得到复用，因此还需要记录当前块是否被使用。
13 | 
14 | 由于内存块的大小往往需要对齐到 4 字节或 8 字节，因此内存大小的低 2 bit 一定是 0。因此，可以使用这两个 bit 来记录当前块是否被使用。比如最低 bit 为 1，表示该块正在被使用。
15 | 
16 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2020/04/10/5e900a94504f4bcb0458900b.jpg)
17 | 
18 | 上图中的这种设计，将内存划分成了一个个块，通过第一块的地址，和块中存放的大小信息，可以得到第二块的地址。在内存分配的时候，可以从第一块开始，寻找一个合适的块，将其交给用户。如果没有已经分配的块可用，就可以在剩余的堆空间中再分配一个块。
19 | 
20 | 在选择合适的块时，可以采用多种策略，包括：
21 | 
22 | - first fit
23 | - next fit
24 | - best fit
25 | 
26 | 这些分配方式最终会将内存划分为一个个块，设想如果将内存全部划分成了 100 字节的块，最后虽然有很多空闲块，但是依然没办法分配一个 200 字节的块。
27 | 
28 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2020/04/10/5e900c3e504f4bcb045a447e.jpg)
29 | 
30 | 上图中，每次分配整个空间的一半，两次后，将空间划分为两块，随后需要整个空间那么大的块时，却无法满足。因此，合并空闲的块是非常必要的。
31 | 
32 | ### 合并空闲块
33 | 
34 | 合并可以发生在释放内存的时候，这叫做立即合并，也可以在下次分配的时候，这叫做推迟合并。在释放时合并，有可能出现合并-划分-再合并的情况。
35 | 
36 | 如果是立即合并，在隐式空闲链表的方法中，从前一块访问后一块很容易，但是无法从后一个块访问前一个块。如果当前释放的块的后面一块是空闲的，那么合并很容易进行。但是，如果当前释放的块的前一块时空闲的，而通过当前块是无法获得前一块的信息的，这就很麻烦。
37 | 
38 | 一种策略是，在块的尾部添加一个 footer，这和 header 内容一样。这样以来，当前块的 header 前面就是上一个块的 footer，可以通过 footer 信息得到上一块的大小。
39 | 
40 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2020/04/10/5e900f69504f4bcb045d0675.jpg)
41 | 
42 | 但问题是，每一个块都需要一个 header 和 footer，如果分配大量较小的块，那么单单 header 和 footer 就会占用很大比例的内存。 但其实只有空闲的块是需要 footer，因为如果一个块正在被使用，也用不着合并它。
43 | 
44 | 因此，对于使用中的块，不需要 footer 部分，对于未使用的块，可以利用未使用的空间的尾部来放置 footer。在块的 header 部分，可以利用一个未使用的 bit 来表示前一块是否被使用。如果没有被使用，那么 header 前面就是前一块的 footer。
45 | 
46 | 


--------------------------------------------------------------------------------
/_posts/network/2015-08-31-http-semantic.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: HTTP 语义
 4 | category: 网络
 5 | ---
 6 | 
 7 | * toc
 8 | {:toc}
 9 | 
10 | 
11 | 最近做 web 项目发现对 HTTP 的各种方法的语义把握的还是不到位，常见的 HTTP 方法有：GET，POST，PUT，DELETE，PATCH，HEAD，OPTIONS，另外还有一些不常见的 LINK，UNLINK 等，下面对一些常见的 HTTP 方法的语义进行总结如下：
12 | 
13 | 
14 | ## GET
15 | 
16 | 基于给定的信息或者条件来获取资源。GET 被定义为安全的 HTTP 方法，GET 请求是不应该修改服务器的状态的。
17 | 
18 | ## POST
19 | 
20 | 基于给定的信息来在当前资源的下一级创建一个新的资源。所以 POST 似乎应该作用于一个集合，但由于 HTML 的表单提交只支持 POST 和 GET 方法，所以 POST 方法的很多运用并不符合这一定义。但是 [HTTP 规范](http://tools.ietf.org/html/rfc2616#section-9.5)中 POST 方法可以具有以下功能：
21 | 
22 | + 对现有资源的标注
23 | + 向布告栏，新闻组，邮件列表或者类似的信息的集合发布信息
24 | + 向数据处理流程提供例如表单提交结果的数据块
25 | + 通过追加操作来扩充数据库
26 | 
27 | 所以在 form 表单中的提交中使用 POST 也是没有问题的。只是说明一点，POST 方法有时候并不完全符合 `用来创建资源` 这样一个定义。具体的语义要根据实际项目的场景来衡量。
28 | 
29 | 
30 | ## DELETE
31 | 
32 | 销毁一个资源。当客户端希望让一个资源消失的时候，可以发起一个 DELETE 请求来将服务器中的资源销毁。服务器可以决定是否允许删除。
33 | 
34 | ## PUT
35 | 
36 | 用给定的表述信息替换资源的当前状态。PUT 用于修改资源的状态，服务端会根据用户提供的信息来更新资源的状态，从而让资源的状态和用户描述的一致。同样的 PUT 方法也是幂等的。
37 | 
38 | PUT 方法，也可以用来创建资源，但是它与 POST 的区别在于 PUT 方法执行多次只会创建一个资源，后续的 PUT 会覆盖之前的资源，但是 POST 会生成多个副本。
39 | 
40 | ## HEAD
41 | 
42 | 获取服务器发送过来的报头信息。HEAD 方法的响应不需要发送任何响应实体，只需要发送 HTTP 报头。
43 | 
44 | ## OPTIONS
45 | 
46 | 获取服务器所能提供的 HTTP 方法列表。OPTIONS 方法用来探索某个资源所支持的所有 HTTP 方法。对于 OPTIONS 的响应的报头中存在一个 Allow 字段，其中列举了服务器支持的方法名。虽然 HTTP 定义了很多种方法，但是服务器可以根据需求支持部分方法。
47 | 
48 | ## PATCH
49 | 
50 | 根据给定的信息修改资源的部分信息，没有提供的关于资源的状态就保持不变。如果只想更新资源的部分信息，然后使用 PUT 发送全部信息就显得有些浪费，这个时候 PATCH 方法可以允许只提供那部分需要更新的内容。
51 | 
52 | ## 补充
53 | 
54 | ### 幂等性
55 | 
56 | 常常看到人们说幂等这个词语，那么幂等是什么意思呢？
57 | 
58 | 如果某个 HTTP 方法作用于一个资源一次或多次该资源的状态都是一致的，那么称该操作是幂等的。幂等这个概念出自数学，一个数乘以 0 一次或者多次，结果都是 0 ，同样的一个数乘以 1 一次或者多次，结果都是等于该数本身。对于 GET 方法，它是幂等的，相当于乘以 1 。而对于 DELETE 方法，它也是幂等的，相当于乘以 0。即对多个资源 GET 和 DELETE 多次效果都是一样的。
59 | 


--------------------------------------------------------------------------------
/_posts/cpp/2015-04-29-cpp-inherit-type.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: C++ 继承方式
 4 | category: C/C++
 5 | ---
 6 | 
 7 | 
 8 | 
 9 | ## C++类成员权限
10 | 
11 | C++ 中 `class` 和 `struct` 关键词都可以用来定义类，两者唯一的不同是，`class` 定义的类中，类成员访问权限默认是 `private` 的，而 `struct` 是 `public` 的。
12 | 
13 | 设置为 `private` 的成员仅能被当前类访问，设置为 `protected` 的成员，可以被子类访问，但是不能被用户访问。设置为 `public` 的成员可以被子类和用户访问。关于 C++ 的类成员的权限控制，就这么多内容。
14 | 
15 | ## C++类继承方式
16 | 
17 | C++ 在继承的时候，可以采用三种继承方式，`public`、`protected`、 `private`，这会对类成员的访问权限造成影响。
18 | 
19 | 首先需要明白，无论派生方式是什么样子的，派生类永远能够访问到基类的公有部分和受保护部分，而永远不能访问基类的私有部分。
20 | 
21 | 派生方式影响的是基类的 `public` 和 `protected` 在子类中的表现出来的权限。
22 | 
23 | => public 继承（class A: public B）
24 | 
25 | 基类中的 `public` 和 `protected` 部分分别成为子类的 `public` 和 `protected` 部分。
26 | 
27 | => private 继承（class A: private B）
28 | 
29 | 使用 `private` 继承，基类中的 `public` 和 `protected` 部分成为子类中的 `private` 部分。
30 | 
31 | => protected 继承（class A: protected B）
32 | 
33 | 基类中的 `public` 和 `protected` 部分成为派生类中的 `protected` 部分。
34 | 
35 | => 默认的继承保护级别
36 | 
37 | 当继承一个类或者结构体时，如果没有注明继承方式，那么默认是什么样的呢？
38 | 
39 | 对于 `struct` 和 `class` 我们知道，在定义的时其中的成员如果没有注明访问权限，那么在 `class` 默认是 `private` 的，`struct` 是 `public` 的。在继承的时候如出一辙。没有注明继承方式，如果子类是 `class`，那继承方式就是 `private`，子类是 `struct` 的话，默认方式是 `public`。
40 | 
41 | ### 总结
42 | 
43 | 继承方式的作用体现在子类的使用者（包括子类的用户（即，使用子类对象的函数）和子类的子类）身上。而对于直接继承自基类的子类而言，派生方式对其没有影响。
44 | 
45 | ### 改变个别成员的可访问性
46 | 
47 | 但我们使用私有继承的时候，所有继承而来的成员成为子类的私有成员，有时候我们希望其中的某个或者某几个成员能够被子类的用户访问到，此时可以使用 `using` 关键字来改变个别成员的权限。
48 | 
49 | ```cpp
50 | class Base{
51 | public：
52 | 	int n;
53 | protected：
54 | 	int size;
55 | }；
56 | 
57 | class Derived: private Base{
58 | public:
59 | 	using Base::n;
60 | protected:
61 | 	using Base::size;
62 | }
63 | ```
64 | 
65 | `private` 继承让 `Base` 中的所有成员成为了 `Derived` 的私有成员，但在 `Derived` 中可以明确地修改他们的访问权限。


--------------------------------------------------------------------------------
/_posts/unix/2019-12-18-client-server-pattern.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: 客户端/服务器程序设计模式
 4 | category: UNIX 编程
 5 | hide: T
 6 | ---
 7 | 
 8 | - *
 9 | {:toc}
10 | 
11 | 阅读 [UNP](https://book.douban.com/subject/1500149/) 的时候了解到了多种客户端/服务器程序设计的范式，这些模式很容易理解。由于本书写于20多年前，目前大部分模式都已经过时了。不过现在流行的模式自然是在此基础上演化而来的，因此有必要了解一下这些模式。
12 | 
13 | 所谓客户/服务器模式，就是我们常说的 C/S 模式，客户端和服务器基于网络进行通信，通常基于 TCP 协议。本文中总结了常见的客户端/服务器程序设计模式。
14 | 
15 | ## 0. 迭代服务器
16 | 
17 | 收到一个请求后就同步地处理它，在未处理完之前不能处理其他的请求。这就是最简单的迭代服务器，这种模式只适用于单个请求耗时很少的场景，比如下面的例子中，接收到请求后服务器返回当前的世界，而后立刻断开连接。
18 | 
19 | ## 1. 为每个连接创建子进程
20 | 
21 | 如果每个请求都需要消耗不少时间才能处理完，那么在处理一个请求的时候，其他客户的请求就被会阻塞。可以为每个请求创建一个进程，用该进程来处理该请求。为每个新的连接创建进程，连接完成后会销毁进程，这导致进程频繁地创建与销毁，存在不少系统开销。
22 | 
23 | ## 2. 创建多个子进程，在子进程中 `accept`
24 | 
25 | 在多个进程中进行 `accept` 操作，新来一个请求最终只会被单个进程成功 `accept`，这样就能够把多个请求分散到不同的进程中。
26 | 
27 | 在主进程中创建多个进程，各个进程都执行 `accept` 操作，新的连接到来后，所有子进程在同一个 `listen_fd` 上执行 `accept` 操作的子进程均被唤醒，但只有最快运行的那个子进程能够 `accept` 成功，该子进程就负责处理此次连接。
28 | 
29 | 缺点是单个连接会导致多个子进程被唤醒，如果子进程较多的时候，这种做法会导致性能受损。
30 | 
31 | ## 3. 预先派生子进程，accept 使用锁保护
32 | 
33 | 为了避免多个子进程同时阻塞在 `accept` 调用上，可以在 `accept` 前面那使用某种锁，让多个子进程阻塞在锁上，其中只有一个能够拿到锁，进而只有单个进程能够阻塞在 `accept` 调用上。
34 | 
35 | ## 4. 每个客户一个线程
36 | 
37 | `accept` 到新的客户连接后，就创建一个线程，在此线程中处理用户请求。由于处理请求过程中往往涉及到读取文件、数据库，这类 IO 操作都相当耗时，当执行这些 IO 操作的时候，操作系统可以调度其他线程。这样可以让计算资源得到更高效的利用。
38 | 
39 | ## 5. 预先创建线程
40 | 
41 | 尽管创建和销毁线程的代价较进程的创建与销毁要少，但是毕竟存在消耗。另外如果请求量很大，那么就会创建大量的进程，可能会耗尽内存。因此，可以使用线程池。同样可以在各个线程上做 `accept` 也可以又主线程来 `accept` 而后交给子线程。
42 | 
43 | 后者可以使用队列来实现。主线程 `accept` 之后，把文件描述符等信息放入队列，其他子线程从队列中取出文件描述符，并完成后续的服务。这是一个典型的生产者消费者的模型，在实现的时候使用一个互斥锁和条件变量即可轻松实现。
44 | 
45 | ## 6. IO 多路复用
46 | 
47 | 前面提到的方法中，任何时刻，进程和线程都是在为一个连接服务。如果该连接的处理需要做耗时的 IO 操作，则需要操作系统切换进程或者线程，以此保存不浪费系统资源。而基于 select、poll、epoll 这样的系统调用，可以订阅多个描述符上的事件，一个进程/线程可以同时处理多个连接。
48 | 
49 | 这种模式下，当监听的文件描述符上有事件发生时，根据发生的事件类型和对应的文件描述符，可以决定该如何采取行动。但是采取行动往往是在当前线程中进行的，即在处理某事件的时候，其他事件不能得到处理。
50 | 
51 | 因此，这种模式常常和多线程搭配使用，在工作线程来处理事件。


--------------------------------------------------------------------------------
/site/assets/css/scss/m-list.scss:
--------------------------------------------------------------------------------
 1 | @charset "utf-8";
 2 | 
 3 | 
 4 | 
 5 | .article-list{
 6 |     margin-top: .45rem;
 7 | }
 8 | 
 9 | 
10 | .m-list {
11 |     margin: .1rem 0 .2rem 0;
12 |     .list-item {
13 |         list-style: none;
14 |         text-indent: 0;
15 |         line-height: .5rem;
16 |         border-bottom: 1px dashed $border-color;
17 |     }
18 |     .list-item:hover{
19 |         background-color: #f8f8f8;
20 |         a{
21 |             padding: 0 0 0 .1rem;
22 |         }
23 |     }
24 | 
25 |     .post-title {
26 |         color: inherit;
27 |         display: inline;
28 |     }
29 |     .post-date {
30 |         float: left;
31 |         font-size: .12rem;
32 |         padding-right: .2rem;
33 |         color: $secondary-color;
34 |     }
35 |     a {
36 |         display: block;
37 |         text-decoration: none;
38 |         overflow: hidden;
39 |     }
40 |     
41 | }
42 | 
43 | 
44 | .m-list__title{
45 |     padding-top: .2rem;
46 |     margin-bottom: .1rem;
47 |     line-height: 1.5em;
48 |     font-size: .18rem;
49 | }
50 | 
51 | 
52 | @media screen and (max-width: 500px){
53 |     .list-item .post-title {
54 |         display: block;
55 |         white-space: nowrap;
56 |         overflow: hidden;
57 |         text-overflow: ellipsis;
58 |     }
59 |     .list-item .post-date {
60 |         display: none;
61 |     }
62 | }
63 | 
64 | /*--------------------------*/
65 | 
66 | .tag-list {
67 |     margin-bottom: .2rem;
68 |     a {
69 |         border: 1px solid #ddd;
70 |         box-sizing: border-box;
71 |         font-size: .12rem;
72 |         font-weight: normal;
73 |         padding: .04rem .1rem;
74 |         display: inline-block;
75 |         margin-right: 1em;
76 |         margin-bottom: 1em;
77 | 
78 |         &:hover,
79 |         &.active {
80 |             color: #fff;
81 |             background-color: #000;
82 |         }
83 |     }
84 |     .m-list__title{
85 |         margin-bottom: .2rem;
86 |     }
87 | }
88 | 


--------------------------------------------------------------------------------
/_posts/python/2018-07-04-format.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: format 的用法
 4 | category: Python
 5 | ---
 6 | 
 7 | 
 8 | 
 9 | ### => 基本语法
10 | 
11 | ```
12 | format_spec     ::=  [[fill]align][sign][#][0][width][grouping_option][.precision][type]
13 | fill            ::=  <any character>
14 | align           ::=  "<" | ">" | "=" | "^"
15 | sign            ::=  "+" | "-" | " "
16 | width           ::=  digit+
17 | grouping_option ::=  "_" | ","
18 | precision       ::=  digit+
19 | type            ::=  "b"|"c"|"d"|"e"|"E"|"f"|"F"|"g"|"G"|"n"|"o"|"s"|"x"|"X"|"%"
20 | ```
21 | 
22 | ### => 控制填充字符的转换方式
23 | 
24 | `!r` 和 `!s` 表示插入使用相应参数的 `__repe__` 和 `__str__` 函数得出的字符表示进行填充。
25 | 
26 | ```python
27 | <<< "repr() shows quotes: {!r}; str() doesn't: {!s}".format('test1', 'test2')
28 | >>> "repr() shows quotes: 'test1'; str() doesn't: test2"
29 | ```
30 | 
31 | ### => 对齐与填充
32 | 
33 | ```python
34 | <<< '{:<30}'.format('left aligned')
35 | 'left aligned                  '
36 | <<< '{:>30}'.format('right aligned')
37 | '                 right aligned'
38 | <<< '{:^30}'.format('centered')
39 | '           centered           '
40 | <<< '{:*^30}'.format('centered')  # use '*' as a fill char
41 | '***********centered***********'
42 | ```
43 | 
44 | ### => 进制转换
45 | 
46 | ```python
47 | <<< "int: {0:d};  hex: {0:x};  oct: {0:o};  bin: {0:b}".format(42)
48 | 'int: 42;  hex: 2a;  oct: 52;  bin: 101010'
49 | 
50 | # with 0x, 0o, or 0b as prefix:
51 | <<< "int: {0:d};  hex: {0:#x};  oct: {0:#o};  bin: {0:#b}".format(42)
52 | 'int: 42;  hex: 0x2a;  oct: 0o52;  bin: 0b101010'
53 | ```
54 | 
55 | ### => 数值表示
56 | 
57 | ```python
58 | <<< '{:,}'.format(1234567890)
59 | '1,234,567,890'
60 | ```
61 | 
62 | ### => 小数位数与百分比
63 | 
64 | 
65 | ```python
66 | >>> points = 19
67 | >>> total = 22
68 | >>> 'Correct answers: {:.2%}'.format(points/total)
69 | 'Correct answers: 86.36%'
70 | ```
71 | 
72 | ### => 格式化时间
73 | 
74 | ```python
75 | >>> import datetime
76 | >>> d = datetime.datetime(2010, 7, 4, 12, 15, 58)
77 | >>> '{:%Y-%m-%d %H:%M:%S}'.format(d)
78 | '2010-07-04 12:15:58'
79 | ```


--------------------------------------------------------------------------------
/_posts/algorithm/2017-01-05-sort.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: 排序
 4 | category: 算法
 5 | ---
 6 | 
 7 | ## 名词解释
 8 | 
 9 | **排序算法的稳定性**
10 | 
11 | ```python
12 | ['AI','Java','ML','NLP','CPP']
13 | ```
14 | 
15 | 对上面的数组中字符串按照长度进行排序，如果排序后相同长度的字符串的相对位置不变（即排序后 `"AI"` 依然排在 `"ML"` 的前面），则称排序算法是稳定的。
16 | 
17 | ## 选择排序
18 | 
19 | 找到最小的元素和第一位交换，从第二位开始在最小的元素和第二位交换，如此往复。
20 | 
21 | 特点：
22 | 
23 | - 运行时间和输入无关
24 | - 数据移动最少
25 | 
26 | ```java
27 | public static void sort(Comparable[] a) {
28 |     int len = a.length;
29 |     for (int i = 0; i < len; i++) {
30 |         int min = i;
31 |         for (int j = i + 1; j < len; j++) {
32 |             if (a[j].compareTo(a[min]) < 0) {
33 |                 min = j;
34 |             }
35 |         }
36 |         Utils.swap(a, i, min);
37 |     }
38 | }
39 | ```
40 | 
41 | ## 插入排序
42 | 
43 | 不断和前一个元素比较，如果前一个元素大于当前元素，则交换。就像整理扑克牌一样，第一张牌不动，第二张则插在第一张的左或右边，而第三张则插入在前两张的合适位置。
44 | 
45 | 特点：
46 | 
47 | - 插入排序对下列数组排序效果很好 ：
48 |   - 数组中只有几个元素的位置不正确
49 |   - 每个元素都离自己正确的位置不远
50 | - 当倒置数很少的时候，性能很好
51 | 
52 | ## 希尔排序
53 | 
54 | 对于大数组，插入排序工作的并不好，因为它只会交换相邻元素，元素只能一点一点地搬动到另一端。而希尔排序，通过调整跨度，可以将大数组快速地调整为局部有序的数组，而后再采用插入排序完成最终排序。
55 | 
56 | 
57 | ![shell](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2018-1-5/147756.jpg)
58 | 
59 | 
60 | 
61 | ## 归并排序
62 | 
63 | 归并排序的思路是将问题两个有序数组的合并，合并两个有序数组是线性复杂度的。
64 | 
65 | ### 自顶向下的归并排序
66 | 
67 | 自顶向下的归并排序采用递归的写法，可以想象不断将数组划分为原来的一半，递归到最深层有两个元素进行比较，这时候就相当于是两个有序数组了，可将他们归并为一个有序数组。而后递归退回一层将两个有序数组在归并。这样整个数组就进行排序。
68 | 
69 | 
70 | merge 算法，需要一个额外的空间来保存两个 a 数组中的内容。
71 | 
72 | 
73 | 自顶向下的归并排序需要递归，其本质是将两个有序子数组合并为一个有序数组。为了得到有序子数组，纯粹的递归归并，是通过递归深入到最底层，进行两个元素的比较。这才得到了一个有两个元素的有序子数组，而后有四个元素的有序子数组……。
74 | 
75 | 这样递归深度是 log2(N) 层，为了减少递归深度，可以在子数组长度较少时可以使用插入排序得到有序的子数组。这样可以减少递归的深度。
76 | 
77 | ### 自底向上的归并排序
78 | 
79 | 模仿递归的归并排序的效果，可采用迭代完成相同的效果。第一次迭代以 2 为跨度，将两个元素调整为有序，而后以 4 为跨度，将其中的两个有 2 个元素的有序数组合并，而后以 8 为跨度。
80 | 
81 | 
82 | ## 堆排序
83 | 
84 | 堆排序是利用二叉堆的特性，首先用待排序数组构成二叉堆，而后不断将堆中最大元素放到数组的后面，同时减小堆的大小，当堆为空时，排序完成。
85 | 
86 | 
87 | 堆排序的主要缺点是它不能有效地利用缓存，堆排序中的比较很少在相邻元素间进行，在对大数组排序的时候，缓存往往不会命中。这是为什么看起来堆排序具有和快速排序相同时间复杂度为 `O(NlogN)`，但却没有得到广泛使用的原因。


--------------------------------------------------------------------------------
/_posts/cpp/2020-02-08-c-vararg.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: C 语言中定义参数数量可变的函数
 4 | category: C/C++
 5 | ---
 6 | 
 7 | 在使用 C 语言时，常常会用到如 `printf` 这样的可变接受参数的函数。可变参数究竟是如何实现的呢？
 8 | 
 9 | ```c
10 | printf("%d %f %s", 1, 3.14, "hello");
11 | ```
12 | 
13 | 在 `stdarg.h` 头文件中提供了一组接口用来支持可变参数的函数。下面是一个例子，基于这个例子来讲解参数数量可变的函数的定义方法。这个函数的用来计算多个 `double` 型参数的和，其中第一个参数是数量，之后是对应的浮点数。
14 | 
15 | ```c
16 | double sum_of_doubles(int count, ...){
17 |     double sum = 0;
18 | 
19 |     va_list ap;
20 |     va_start(ap, count);
21 |     for(int i = 0;i<count;i++){
22 |         double num = va_arg(ap, double);
23 |         sum += num;
24 |     }
25 |     va_end(ap);
26 | 
27 |     return sum;
28 | }
29 | 
30 | sum_of_doubles(3, 1.1, 3.4, 4.5);
31 | ```
32 | 
33 | 定义参数数量可变的函数时，使用 `...` 来表示 1 个或多个参数。`...` 只能放在参数列表的最后面。
34 | 
35 | 考虑函数调用过程，在调用之前，先把参数从左至右压入栈中，然后调用函数。被调用函数从栈中取出各个参数。因此，我们可以想到 `...` 代表的参数在栈中的位置和它之前的参数的位置临近。用前面的例子说明，就是先把 `count` 压入栈中，然后把余下的浮点数以此入栈。如果是这样，那么得到参数 `count` 的地址后，做相应的偏移就能得到其后的浮点数了。
36 | 
37 | 因此，可以先把 `va_list` 看做指针类型，指向可变参数，`va_start` 用前一个参数的位置来初始化指针。`va_arg` 用来把指针指向的数据强制转换为某种类型，并移动指针。`va_end` 用来销毁指针。基于以上思路我们可以把这几个接口实现如下：
38 | 
39 | ```c
40 | typedef char *va_list;
41 | #define va_start(list, parm) (list = (va_list)&parm)
42 | #define va_arg(list, type)   *(type*)(list -= sizeof(type))
43 | #define va_end(list) (list=NULL)
44 | ```
45 | 
46 | 测试后，就会遇到错误，因为实际并不是这样。但是我们在常规的函数上面测试，确实符合预期，下面的测试函数把后面两个参数视为 `...`，基于前面的思路来读取这两个参数。
47 | 
48 | ```c
49 | void test(int first, int a, double b){
50 |     va_list ap;
51 |     va_start(ap, first);
52 |     printf("%d", va_arg(ap, int));
53 |     printf("%f", va_arg(ap, double));
54 |     va_end(ap);
55 | }
56 | ```
57 | 
58 | 但是为什么在可变参数数量的函数上测试就会错呢？因为，编译器可能会把部分参数放到寄存器里面，或者放到其他地方。实际上，各种编译器对这几个接口的实现细节可能都不一样，对应用户它们都是黑盒子。但是用上面这种思路有助于理解这几个接口。
59 | 
60 | 在使用 `va_arg` 来读取参数的时候，一定要给出正确的参数类型，因为在基于地址进行类型转换的时候，依赖于实际的参数类型。如果在对参数读取的时候指定的参数类型不正确，就会错误读取内存，往往会导致错误。因为 `va_start` 在实际的实现中可能需要做清理工作，因此在参数读完之后，一定要调用 `va_end`。
61 | 
62 | 在函数内部，如何知道调用者传递了多少个参数以及参数类型呢，答案是不知道。对于 `printf`，它使用格式化字符串来确定参数数量和参数类型。当用户在自己定义此类函数的时候，也必须通过某种方法把各个参数的类型告知函数，只有这样才能正确地读取参数。


--------------------------------------------------------------------------------
/site/_layouts/blank.html:
--------------------------------------------------------------------------------
 1 | <!DOCTYPE html>
 2 | <html>
 3 | <head>
 4 |     <meta charset="utf-8">
 5 |     <title>{{page.title}}</title>
 6 |     <meta name="author" content="wangyu" />
 7 |     <meta name="viewport" content="width=device-width, initial-scale=1.0, minimum-scale=1.0, maximum-scale=1.0">
 8 |     <link rel="stylesheet" href="{{site.assets_path}}/css/text.css" type="text/css" />
 9 |     <meta http-equiv="Cache-Control" content="no-transform" />
10 |     <meta name="robots" content="noarchive">
11 |     <meta http-equiv="Cache-Control" content="no-siteapp" />
12 |     <meta name="msapplication-navbutton-color" content="{{page.theme_color}}">
13 |     <meta name="theme-color" content="{{page.theme_color}}">
14 |     <style>
15 |         html{
16 |             font-size: 95px;
17 |         }
18 |         .wrap{
19 |             max-width: 700px;
20 |         }
21 |         .m-post{
22 |             position: relative;
23 |         }
24 |         .m-post ul{
25 |             margin: 0 0 0 1em;
26 |         }
27 |         .space{
28 |             margin: 0 10px;
29 |         }
30 |         .m-post a,
31 |         .m-post h3{
32 |             /* color: #aaa; */
33 |             border: none;
34 |         }
35 |         .m-post a{
36 |             /* color: #ddd; */
37 |             border-bottom: 1px solid;
38 |         }
39 | 
40 |         .m-post code{
41 |             margin: 0 5px;
42 |             /* color: #aaa; */
43 |         }
44 | 
45 |         @media screen and (max-width: 700px) {
46 |             html {
47 |                 font-size: 90px;
48 |             }
49 |             .m-post{
50 |                 margin: 50px 0 0 0;
51 |             }
52 |         }
53 |         @media print {
54 |             .m-post {
55 |                 margin: 0;
56 |             }
57 |             body{
58 |                 font-size: 12px!important;
59 |             }
60 |         }
61 |         body{
62 |             min-height: unset;
63 |         }
64 |     </style>
65 | </head>
66 | <body>
67 |     <div class="wrap">
68 |         <article class="m-post">
69 |             <div class="typo">
70 |                 {{ content }}
71 |             </div>
72 |         </article>
73 |     </div>
74 | </body>
75 | </html>
76 | 


--------------------------------------------------------------------------------
/_posts/network/2015-09-01-http-cache.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: HTTP 缓存
 4 | category: 网络
 5 | ---
 6 | 
 7 | 
 8 | 和计算机存储体系一样，web中也存在着缓存，这些缓存可以让人们不必每次都访问地域上很遥远的web服务器，缓存的存在大大地减缓了网络拥塞。
 9 | 
10 | HTTP 协议中就存在一些首部用于控制缓存，下面一一罗列并讲解：
11 | 
12 | ## 缓存控制
13 | 
14 | **Cache-Control:max-age=1000**
15 | 
16 | max-age 定义了文档的最大使用期，从第一次生成文档到文档不再新鲜最大合法存在时间，它是相对于文档的创建时间来说的，单位为秒。
17 | 
18 | **Expires:Fri,05 Jul 2002,05:00:00 GMT**
19 | 
20 | 指定一个具体的时间，这个时间之后文档就不再有效了。由于客户端设备上的系统时间可能有错误，所以有可能出现意外。
21 | 
22 | ## 再验证
23 | 
24 | 如果已经缓存的文档过期了，这个时候也不意味着它的内容已经发生了变化，这个时候缓存会向服务器发起再验证，缓存会获取一份这个文档新的副本，如果文档没有更新，那么缓存就将这个数据发回客户端，并更新相应的首部信息，包括新的过期时间。
25 | 
26 | 但是如果从原服务器获取文档失败了，那么就不能发送已经过期的缓存了，而是发送错误报文。
27 | 
28 | ### 用条件方法进行再验证
29 | 
30 | + If-Modified-Since:<date>
31 | 
32 | 如果从指定日期后文档被修改了，就执行请求。如果从指定日期后文档没有被修改过，那就会返回一个304 Not Modified 响应，这个时候缓存一般之后发送一些变更过的头部信息。否则就会返回一个200 OK 响应。
33 | 
34 | + `If-None-Match:<tags>`
35 | 
36 | 有些时候仅仅使用最后修改时间来验证是不够的，因为有时候经管文档被修改了，但是修改并不重要到需要全球范围内缓存进行重装，或者尽管修改了，但是内容并没有变化（重写了文档），还有的服务器不能得到文档最后修改时间。为了解决这些问题 HTTP 允许对被称为 **实体标签（ETag）** 的版本标识符来比较。实体标签是附加到文档上的任意的标签。他们可能包含的是文档的版本号或者是序列号等。当发布者修改了文档后，可以修改这些实体标签来说明这是一个新的版本。这样缓存就可以使用 If-None-Match 条件首部来获取文档的新副本了。
37 | 
38 | ```
39 | // request
40 | GET /about.html HTTP/1.0
41 | If-None-Match:"v2.6","v2.5","v2.4"
42 | 
43 | // response
44 | HTTP/1.0 304 Not Modified
45 | ETag:"v2.6"
46 | ```
47 | 
48 | ### 何时使用实体标签，何时该使用最后修改时间
49 | 
50 | 如果服务器回送了一个实体标签，那么客户端就必须使用实体标签进行验证。如果服务器只回送了 Last-Modified 客户端就可以使用 If-Not-Midified 来验证。
51 | 
52 | 如果服务器收到的请求既有If-Modified-Since 又有实体标签，那么只有两者都满足，才会回送 304 响应。
53 | 
54 | 
55 | ## 控制缓存的能力
56 | 
57 | `Cache-Control:no-store|no-cache|must-revalidate|max-age`
58 | 
59 | **no-store**
60 | 
61 | 标识为 no-store 的响应，是不会进行缓存的，缓存就像非缓存代理一样向客户端转发该相应，然后删除该对象。
62 | 
63 | **no-cache**
64 | 
65 | 标识为 no-cache 的响应，并非不会存储在缓存中，只是在与原服务器进行新鲜度验证之前，缓存是不能将其提供给客户端的。也就是说，每次访问该文档，都会进行新鲜度验证。
66 | 
67 | **max-age**
68 | 
69 | 表示从服务器将文档传来时起，具有多少秒的新鲜时间。
70 | 
71 | **must-revalidate**
72 | 
73 | ...
74 | 
75 | ## 试探性过期
76 | 
77 | 如果响应首部中没有 expires 和 Cache-Control:max-age 首部，那么缓存就会自己估计一个时间。可能会根据文档的最后修改时间来估计。最近修改的文档很有可能会再次修改，而很久以前修改过的文档很有可能是一份稳定的文档，因此缓存时间可能会较长。
78 | 
79 | ## 客户端的新鲜度限制
80 | 
81 | 对于用户点击 refresh 按钮这样的行为，是会无条件地从原始服务器中获取文档。当然在请求中头中也可以添加 Cache-Control 来限制文档的新鲜度。
82 | 
83 | ```
84 | Cache-Control:max-stale=<s>|min-fresh=<s>|no-cache|max-age|no-store|only-if-cached
85 | ```
86 | 


--------------------------------------------------------------------------------
/_posts/cs/2020-06-02-codec.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: 对称加密与非对称加密
 4 | category: 理解计算机
 5 | ---
 6 | 
 7 | ## 对称加密
 8 | 
 9 | 对称加密使用同一个密钥完成加密和解密操作，通信双方都需要拥有此密钥。
10 | 
11 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2020/07/10/2020-07-10-181319.png)
12 | 
13 | 举个最简单的对称加密的例子，现有密钥 `x`，需要发送的信息为 `m`，加密的方法是用密钥做异或操作，加密后的内容为 `m^x`。对方收到信息后，在次使用 `x` 进行异或，即 `m^x^x=m` 这样就收到了原始信息了。这种方法太过简单不够安全。比如在通信中常常开始和结束的消息是固定的，由此窃听者就能猜测出传输的消息 `m`，进而破获密钥。即使这个例子不够安全，但是已经体现出了对称解密的本质。使用同一个密钥来完成加解密。
14 | 
15 | 通常密钥的长度为几百字节，比如 256 字节，但是要发送的信息往往很长，加密过程是把原文分成和密钥等长的段来分别进行的。成熟的对称加密算法对数据做多轮加密，而且会做字节的移动等操作。解密时做逆操作即可。这样做的目的是为了防止绕开密钥破解出信息来。
16 | 
17 | 对称加密的难点在如何让通信双方都拥有密钥。一种方法是提前在通信双方的机器上部署密钥，这只适用于固定的某些机器之前进行通信。另外一种方法是使用非对称加密技术来传输密钥。非对称加密，是下一节的内容。
18 | 
19 | ## 非对称加密
20 | 
21 | 非对称加密算法的代表位 RSA 算法，RSA 是三个发明人的首字母缩写。非对称加密中用于加密和解密的密钥是不同的。
22 | 
23 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2020/07/10/2020-07-10-181332.png)
24 | 
25 | 在非对称解密中，存在两个密钥——公钥和私钥，其中公钥是公开的，它可以通过明文传输。但是使用公钥加密后的加密文档必须使用私钥进行解密。私钥必须要保密，如果私钥被窃取了，非对称解密的安全性就不能保证的。
26 | 
27 | 在 RSA 算法中，首先会挑选两个很大的素数 P 和 Q，两者相乘得到 N。取一个小于 `(P-1)(Q-1)` 且与之互质的数作为 `e`，公钥就由 `(e, N)` 两者组成。
28 | 
29 | - `N = P * Q`
30 | - `e` 为某与 `(P-1)(Q-1)` 互质的数，通常选择较小的质数，这样加密速度比较快。
31 | 
32 | 设需要加密的内容为 `M`，加密后的内容为 `C`，加密方法如下：
33 | 
34 | $$C = M^{e} \% N$$
35 | 
36 | 使用 `e` 和 `P`、`Q` 根据如下式子生成 `d`，私钥就由 `(d, N)` 组成。
37 | 
38 | $$d = e^{-1} \% (P-1)(Q-1)$$
39 | 
40 | 有了密钥之后，可以用如下运算解密：
41 | 
42 | $$M = C^d \% N$$
43 | 
44 | 关于解密的运算，可以参见补充说明。
45 | 
46 | **非对称加密的安全性**
47 | 
48 | 在非对称加密中，`N` 和 `e` 都是已知的，要想解密必须要知道 `d`，而要想计算出 `d`，必须知道 `P` 和 `Q`，但是目前对 `N` 进行质因数分解得到 `P` 和 `Q` 不存在有效的算法。因为 `N` 的长度通常达到几百位，想要暴力破解是不现实的，因此，非对称加密目前还很安全。
49 | 
50 | ## 补充说明
51 | 
52 | 其中 `$e^{-1}$` 是 `e` 的倒数，对一个分数进行取模，这还是挺少见的，在此之前我是不知道如何做。关于取模有如下性质：
53 | 
54 | ![<w,320px>](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2020/07/10/2020-07-10-182250.png)
55 | 
56 | 但是：
57 | 
58 | $$(a/b) \% p \ne (a\%p / b \% p) \% p$$
59 | 
60 | 
61 | 所以加减乘、指数都好处理，但是除法不好办。在运算中如果中间结果很大，那么可以进行取余。但是一旦运算中出现了除法，就不好办了。此时需要使用逆元，将除法转换为乘法运算。
62 | 
63 | 逆元的定义如下：
64 | 
65 | ![<w,600px>](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2020/07/10/2020-07-10-182433.png)
66 | 
67 | 
68 | 即如果 `$(a*c) \% n = 1$` 那么 `$(1/a) \% n$` 可以替换为 `$c \% n$`。
69 | 
70 | 其实分数在平常使用的数学范畴里，确实是不能取余的，有悖于常识。上面的定义是来自数论中的理论。在数论中，除法的取余就是乘以除数的逆元。
71 | 
72 | ## 对称解密和非对称解密的配合使用
73 | 
74 | 非对称解密的运算量较大，通常在通信中常常使用非对称解密算法来传输用于对称加密的密钥，因为非对称加密可以安全地传输密钥，传输完密钥之后，可以切换至对称加密。在 HTTPs 中就是这么做的。


--------------------------------------------------------------------------------
/_posts/web/2016-11-11-avoid-forced-synchonous-layout.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: 避免强制性同步布局
 4 | category: Web
 5 | ---
 6 | 
 7 | 
 8 | 
 9 | - *
10 | {:toc}
11 | 
12 | 强制性同步布局，发生在使用 JavaScript 改变了 DOM 元素的属性，而后又读取 DOM 元素的属性。比如改变了 DOM 元素的宽度，而后又使用 `clientWidth` 读取 DOM 元素的宽度。这个时候由于为了获取到 DOM 元素真实的宽度，需要重新计算样式。
13 | 
14 | ## 案例
15 | 
16 | 想象一下，如果有一组 DOM 元素，我们需要读取它们的宽度，并设置其高度与宽度一致。
17 | 
18 | ## 解决方案
19 | 
20 | ### 1. 新手解决方法
21 | 
22 | ```js
23 | for(var i = 0,len = divs.length; i<len; i++){
24 |     var width = divs[i].clientWidth;
25 |     divs[i].style.height = width + 'px';
26 | }
27 | ```
28 | 
29 | 执行这段代码就引起了强制性同步布局（forced synchonous layout），在每次迭代开始的时候都会进行重新计算布局，这是很昂贵的操作，千万要避免。
30 | 
31 | ### 2. 分离读和写
32 | 
33 | 以上场景下，我们可以使用两次循环，在第一次循环中只进行读取 DOM 元素宽度的操作，并将结果保存起来，在第二个循环中修改 DOM 元素的高度。
34 | 
35 | ```javascript
36 | var widthArray = [];
37 | for(var i = 0,len = divs.length; i<len; i++){
38 |     var width = divs[i].clientWidth;
39 |     widthArray.push(width);
40 | }
41 | for(var i = 0,len = divs.length; i<len; i++){
42 |     divs[i].style.height = widthArray[i] + 'px';
43 | }
44 | ```
45 | 
46 | ### 3. 使用 `requestAnimationFrame`
47 | 
48 | 在实际项目中往往没有上面提到的那样简单，有时尽管已经分离了读和写，但在写操作后面还是不可避免地存在读取操作，这个时候不妨使用 `requestAnimationFrame`，将写操作放在 `requestAnimationFrame` 中，浏览器会在新的一帧开始的时候立刻调用它们。
49 | 
50 | ```javascript
51 | for(let i = 0,len = divs.length; i<len; i++){
52 |     let width = divs[i].clientWidth;
53 |     requestAnimationFrame(()=>{
54 |         divs[i].style.height = width + 'px';
55 |     })
56 | }
57 | ```
58 | 
59 | ## 优化效果
60 | 
61 | 可以查看[这个例子](https://wy-ei.github.io/60fps/layout/layout-thrashing.html)来对比一下这几种方案的性能差异。打开 Chrome DevTools 在 Timeline 中录制重新布局的过程，可以看到下面三种情形：
62 | 
63 | **强制性同步布局：**
64 | 
65 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2016-11-11/319890.jpg)
66 | 
67 | 这个时候会看到浏览器进行了很多次的重新计算样式（Recalculate Style） 和 布局（Layout），也叫做 reflow 的操作，且这一帧用时很长。
68 | 
69 | **分离读写：**
70 | 
71 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2016-11-11/147743.jpg)
72 | 
73 | 这个时候，浏览器只进行了一次 reflow，用时很短。
74 | 
75 | **使用 requestAnimationFrame:**
76 | 
77 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2016-11-11/625120.jpg)
78 | 
79 | 这个方案也很快，只是因为调用了 `requestAnimationFrame` 很多次添加了很多回调，这个时候会有很多函数调用。建议对于将该方法用在回调较少的场景下。其实另外一个可行的方案是在 `requestAnimationFrame` 中批量来写 DOM
80 | 元素。
81 | 
82 | ## 总结
83 | 
84 | 在需要操作 DOM 的时候，一定要注意避免强制性同步布局，遇到交替读写 DOM 的操作的时候，可以通过分离读写，使用 `requestAnimationFrame` 来避免强制性同步布局的出现。
85 | 


--------------------------------------------------------------------------------
/site/_layouts/default.html:
--------------------------------------------------------------------------------
 1 | <!DOCTYPE html>
 2 | <html>
 3 | 
 4 | <head>
 5 |     <meta charset="utf-8">
 6 |     <title>{% if page.title %}{{ page.title }} - {% endif %}{{ site.title }}</title>
 7 |     <meta name="author" content="wangyu" />
 8 |     {% if page.description %}
 9 |     <meta name="description" content="{{ page.description }}">
10 |     {% else %}
11 |     <meta name="description" content="{{ page.content | strip_html |remove:'\n'|trim|truncate:80,'' }}">
12 |     {% endif %}
13 |     <meta name="viewport" content="width=device-width, initial-scale=1.0, minimum-scale=1.0, maximum-scale=1.0">
14 |     {% assign timestamp = site.time | date:"%m%d%H%M" %}
15 |     <link rel="stylesheet" href="{{site.assets_path}}/css/style.css?v={{timestamp}}" type="text/css" />
16 |     <link rel="shortcut icon" href="{{site.assets_path}}/images/favicon.ico" type="image/x-icon">
17 |     <meta http-equiv="Cache-Control" content="no-transform" />
18 |     <meta http-equiv="Cache-Control" content="no-siteapp" />
19 |     <meta name="theme-color" content="#f3f3f3">
20 |     {% include init.html %}
21 | </head>
22 | 
23 | <body>
24 |     <header class="m-header">
25 |         <div class="wrap">
26 |             <div class="site-title">
27 |                 <h1 class="site-name">{{ site.title }}</h1>
28 |                 <p class="site-slogan">{{ site.slogan }}</p>
29 |             </div>
30 |             <nav class="site-nav">
31 |                 <ul>
32 |                     <li><a {% if page.nav=='home' %}class="active" {% endif %} href="{{site.home_path}}"><i class="iconfont icon-home"></i>首页</a></li>
33 |                     <!-- <li><a {% if page.nav == 'list' %}class="active"{% endif %} href="{{ site.list_path }}"><i class="iconfont icon-blog"></i>随笔</a></li> -->
34 |                     <!-- <li><a {% if page.nav=='category' %}class="active" {% endif %} href="{{site.categories_path}}"><i class="iconfont icon-folder"></i>分类</a></li> -->
35 |                     <li><a {% if page.nav=='about' %}class="active" {% endif %} href="{{site.about_path}}"><i class="iconfont icon-plane"></i>关于</a></li>
36 | 
37 |                 </ul>
38 |             </nav>
39 |         </div>
40 |     </header>
41 |     <section class="m-main">
42 |         <div class="wrap">
43 |             <div class="message-box"></div>
44 |             {{ content }}
45 |         </div>
46 |     </section>
47 |     {% include footer.html %}
48 |     <script src="{{site.assets_path}}/js/app.js?v={{timestamp}}"></script>
49 | </body>
50 | 
51 | </html>


--------------------------------------------------------------------------------
/_posts/cs/2015-05-01-computer-storage-systemter.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: 计算机存储体系
 4 | category: 理解计算机
 5 | ---
 6 | 
 7 | 
 8 | 今天看到一个很好的比喻可以说明很形象地说明CPU、寄存器、高速缓存(cacha)、内存(RAM)、硬盘、网络之间的关系。现在把它描述如下，希望能给不懂计算机机的人一个轻松的方式来理解计算机的存储体系。
 9 | 
10 | ### 工人 & CPU
11 | 
12 | 我们知道CPU的工作需要依赖数据。而工人们工作需要工具。所以不妨想象CPU是一个工人，而这数据就是工人手里的工具。他用的工具有螺丝刀、锤子、锯子、钳子、切割机等等。
13 | 
14 | 
15 | ![tools](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2015-05-01/tools.jpg)
16 | 
17 | ### 工人的手 & 寄存器
18 | 
19 | 工人干活的时候一般手上只拿少数的一两件工具。工人的手就相当于CPU内部的寄存器，需要干什么事情，换用什么样的工具，不能拿太多的工具在手上，用完一个工具就要放回去，换另外的工具。
20 | 
21 | ![工人](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2015-05-01/worker.jpg)
22 | 
23 | ### 工具包 & 高速缓存
24 | 
25 | 前面说了工人的手上一般只拿少数一两件工具，用完了就要换一件工具。那么要去哪里更换工具呢？在实际工作中常出现的情况是一段时间要频繁使用螺丝刀和扳手，另一段时间频繁使用切割机和尺子。所以工人们随身携带一个工具包，装上常用的工具。对于CPU来说，这个工具包里面就是它常常要处理的数据。我们称之为高速缓存(cache)。当然工具包是带在工人身上的，所以里面装的工具不能太多。同样高速缓存位于CPU内部，容量也十分有限。从工具包换一个工具使用的时间可能就是使用工具一次所用时间的几倍或者数十倍。
26 | 
27 | ![工具包](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2015-05-01/toolsbox.jpg)
28 | 
29 | ### 工具箱 & 内存
30 | 
31 | 干一项工程，肯定不是一两件工具就能完成的。公司接到业务之后，工作人员一般会把需要的工具都放如工具箱里，然后去工作现场。当然在实际工作中从工具箱取工具也是比较快的，但是相对于随身携带的工具包就慢的多了。对CPU来说也是这样，当一个程序被打开时，程序数据将被加载到内存中，这就相当于将需要的工具放入了工具箱里面。而CPU中内存中获取数据所需时间是从内存中获取数据所需时间的几十至几百倍。
32 | 
33 | ![工具箱](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2015-05-01/toolsbox2.jpg)
34 | 
35 | ### 工具仓库 & 硬盘
36 | 
37 | 要干活的时候就会把工具从仓库里面拿出来，装进工具箱。当不干活的时候，就会把工具放到仓库里面。在实际工作中可能出现，工具实在太多或者太大装不进工具箱的情况，这个时候会从仓库中拿出一部分需要的工具放入工具箱，把不再需要的工具放回仓库。在计算机中也是这样，内存毕竟有限，当CPU需要某些数据的时候，它会从工作现场来到硬盘拿回需要的数据放入内存，把内存中不需要的数据放入硬盘中合适的位置。可以想象这个时间是相当长的。在计算机系统中CPU从硬盘获取数据所需时间可能是从内存获取数据的几十万倍。
38 | 
39 | ![仓库](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2015-05-01/cangku4.jpg)
40 | 
41 | 
42 | ### 五金市场 & 网络
43 | 
44 | 有时候在工作中，发现自己仓库里面没有某个工具，那就需要去市场上买需要的工具。这就像在计算机系统中一样，当本地硬盘上没有某个数据的时候，就要去网络上去获取。从市场上获取的工具不一定会在用完后放入仓库。在计算机系统中，获取的网页可能在我关闭了网页后就被销毁了，而有的时候我们下载的音乐可能会保存在本地。
45 | 
46 | ![五金市场](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2015-05-01/market.jpg)
47 | 
48 | 
49 | ### 整个体系
50 | 
51 | 至此，我们应该明白计算机存储器的体系结构了，对的他就是一个从高速到低速，从小容量到大容量的结构。如下图所示：
52 | 
53 | ![计算机存储体系](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2015-05-01/arc.jpg)
54 | 
55 | 其实计算机的存储体系中还有很多很多细节，比如在在下级取一个数据时，替换上级的哪一个存储单元。当然以上内容也能让人们对存储结构的分层结构一点概念，不至于说自己的内存有500G。其中有的比喻有一个位置不太合理，那就是高速缓存部分，现在的存储结构中有多级高速缓存，就好比工人随身携带了由小到大的多个工具包一样。将最最常用的工具放入一级工具包，较常用的放入二级工具包。
56 | 
57 | 我们知道，从硬盘读取数据是很慢的，每次开机的时候计算机就会从硬盘读取好多数据进入内存，之后常用的数据就在内存中了。而不太会读取硬盘，所以我们的计算机才会如此的快速。实际中，CPU处理的90%以上的数据都是直接从高速缓存中读取的，可以想象一下，如果所有数据都从硬盘读取，那么计算机的速度会是怎么样的？
58 | 
59 | 这篇介绍也就结束了，希望能给不明白计算机存储体系的朋友一点点关于它的概念。至于细节，可以查看相关书籍。


--------------------------------------------------------------------------------
/_posts/algorithm/2018-01-10-maximum-contiguous-subsequence.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: 最大子序列
  4 | category: 算法
  5 | ---
  6 | 
  7 | 在数据结构与算法分析一书中讲到了找最大子序列的几种算法，记录如下：
  8 | 
  9 | ## 方法一
 10 | 
 11 | 此方法最直观，当然也比较慢，复杂度 O(N^2)
 12 | 
 13 | ```c++
 14 | int max_sub_sum(const vector<int> &a) {
 15 | 	int max_sum = 0;
 16 | 	for (int i = 0; i < a.size(); i++) {
 17 | 		int this_sum = 0;
 18 | 		for	(int j = i; j < a.size(); j++) {
 19 | 			this_sum += a[j];
 20 | 			if (this_sum > max_sum) {
 21 | 				max_sum = this_sum;
 22 | 			}
 23 | 		}
 24 | 	}
 25 | 	return max_sum;
 26 | }
 27 | ```
 28 | 
 29 | 
 30 | ## 方法二
 31 | 
 32 | 采用分治方法，将整个序列不断切分成原来的一半，找到前半部分和后半部分的最大子序列之和，再从中间向两端找最大子序列之和，三者取最大值。复杂度 O(NlogN)
 33 | 
 34 | ```
 35 | [........................]
 36 | <--前半部分--><--后半部分-->
 37 |       <--中间部分-->
 38 | ```
 39 | 
 40 | 
 41 | ```cpp
 42 | int max_sum_rec(const vector<int> &a, int left, int right) {
 43 | 	if (left == right) {
 44 | 		if (left < 0) {
 45 | 			return 0;
 46 | 		}else {
 47 | 			return a[left];
 48 | 		}
 49 | 	}
 50 | 
 51 | 	int center = (left + right) / 2;
 52 | 	int max_left_sum = max_sum_rec(a, left, center);
 53 | 	int max_right_sum = max_sum_rec(a, center +1, right);
 54 | 
 55 | 	int max_left_border_sum = 0, left_border_sum = 0;
 56 | 	for (int i = center; i >= left; i--) {
 57 | 		left_border_sum += a[i];
 58 | 		if (left_border_sum > max_left_border_sum) {
 59 | 			max_left_border_sum = left_border_sum;
 60 | 		}
 61 | 	}
 62 | 
 63 | 	int max_right_border_sum = 0, right_border_sum = 0;
 64 | 	for (int i = center + 1; i <= right; i++) {
 65 | 		right_border_sum += a[i];
 66 | 		if (right_border_sum > max_right_border_sum) {
 67 | 			max_right_border_sum = right_border_sum;
 68 | 		}
 69 | 	}
 70 | 
 71 | 	int max_sum = max(max_left_sum, max_right_sum);
 72 | 	max_sum = max(max_sum, max_left_border_sum + max_right_border_sum);
 73 | 	return max_sum;
 74 | }
 75 | 
 76 | 
 77 | int max_sub_sum(const vector<int> &a) {
 78 | 	return max_sum_rec(a, 0, a.size() - 1);
 79 | 
 80 | }
 81 | ```
 82 | 
 83 | 注意：没有处理向量长度为奇数的情况。
 84 | 
 85 | ## 方法三
 86 | 
 87 | 此方法异常简洁，而且很好理解。从开头开始累加，一个为负的元素不可能是最大子序列的第一个元素，另外和为负的子序列不可能是最大子序列的前缀，所以当 `this_sum` 小于 0 时，将其置为 0。复杂度 O(N)。
 88 | 
 89 | 
 90 | ```c++
 91 | int max_sub_sum(const vector<int> &a) {
 92 | 	int max_sum = 0;
 93 | 	int this_sum = 0;
 94 | 
 95 | 	for (int i = 0; i < a.size(); i++) {
 96 | 		this_sum += a[i];
 97 | 		if (this_sum > max_sum) {
 98 | 			max_sum = this_sum;
 99 | 		} else if(this_sum < 0) {
100 | 			this_sum = 0;
101 | 		}
102 | 	}
103 | 	return max_sum;
104 | }
105 | ```
106 | 
107 | 


--------------------------------------------------------------------------------
/site/assets/css/scss/notebook.scss:
--------------------------------------------------------------------------------
  1 | .nb-notebook {
  2 |     line-height: 1.5;    
  3 | }
  4 | 
  5 | .nb-stdout,
  6 | .nb-stderr,
  7 | .nb-text-output,
  8 | .nb-html-output{
  9 |     margin-bottom: 0!important;
 10 |     font-family: $code-font-family;
 11 |     font-size: 0.9em;
 12 |     max-height: 300px;
 13 |     overflow: auto;
 14 | }
 15 | 
 16 | .nb-output pre{
 17 |     margin: 0px;
 18 |     overflow-x: auto;
 19 |     overflow-y: auto;
 20 |     word-break: break-all;
 21 |     word-wrap: break-word;
 22 |     white-space: pre-wrap;
 23 | }
 24 | 
 25 | // .nb-output .nb-stdout,
 26 | // .nb-output .nb-text-output{
 27 | //     background: none;
 28 | // }
 29 | 
 30 | .nb-output .nb-stderr,
 31 | .nb-output .nb-pyerr{
 32 |     background-color: #fdd!important;
 33 | }
 34 | 
 35 | 
 36 | .nb-html-output pre{
 37 |     font-family: $code-font-family;;
 38 | }
 39 | 
 40 | .nb-cell + .nb-cell {
 41 |     margin: 1em 0;
 42 | }
 43 | 
 44 | .nb-output table {
 45 |     border: 1px solid #000;
 46 |     border-collapse: collapse;
 47 | }
 48 | 
 49 | .nb-output th {
 50 |     font-weight: bold;
 51 | }
 52 | 
 53 | .nb-output th, .nb-output td {
 54 |     border: 1px solid #000;
 55 |     padding: 0.25em;    
 56 |     text-align: left;
 57 |     vertical-align: middle;
 58 |     border-collapse: collapse;
 59 | }
 60 | 
 61 | .nb-cell {
 62 |     position: relative;    
 63 | }
 64 | 
 65 | .nb-raw-cell {
 66 |     white-space: pre-wrap;
 67 |     background-color: #f5f2f0;
 68 |     font-family: $code-font-family;;
 69 |     padding: 1em;
 70 |     margin: .5em 0;
 71 | }
 72 | 
 73 | .nb-output {
 74 |     position: relative;
 75 |     min-height: 1em;
 76 |     width: 100%;
 77 | }
 78 | 
 79 | .nb-output img {
 80 |     max-width: 100%;    
 81 | }
 82 | 
 83 | .nb-output::before, .nb-input::before {
 84 |     position: absolute;
 85 |     font-size: 12px;
 86 |     color: #999;
 87 |     left: -7.5em;
 88 |     top: 7px;
 89 |     width: 7em;
 90 |     text-align: right;
 91 |     font-family: $code-font-family;;
 92 | }
 93 | 
 94 | .nb-input{
 95 |     position: relative;
 96 | }
 97 | 
 98 | .nb-input pre{
 99 |     margin-bottom: 0.5em;
100 |     overflow: auto;
101 | }
102 | 
103 | 
104 | .nb-input::before {
105 |     color: #303F9F;
106 |     content: "In:"
107 |     // content: "In[" attr(data-prompt-number) "]:";
108 | }
109 | .nb-input+.nb-output::before {
110 |     color: #D84315;
111 |     content: "Out:";
112 | }
113 | 
114 | div[style="max-height:1000px;max-width:1500px;overflow:auto;"] {
115 |     max-height: none !important;    
116 | }
117 | 
118 | 


--------------------------------------------------------------------------------
/site/assets/js/lib/ansi_up.min.js:
--------------------------------------------------------------------------------
1 | // ansi_up.js
2 | // version : 1.1.0
3 | // author : Dru Nelson
4 | // license : MIT
5 | // http://github.com/drudru/ansi_up
6 | (function(a,b){function g(){this.fg=this.bg=null,this.bright=0}var c,d="1.1.0",e=typeof module!="undefined",f=[[{color:"0, 0, 0","class":"ansi-black"},{color:"187, 0, 0","class":"ansi-red"},{color:"0, 187, 0","class":"ansi-green"},{color:"187, 187, 0","class":"ansi-yellow"},{color:"0, 0, 187","class":"ansi-blue"},{color:"187, 0, 187","class":"ansi-magenta"},{color:"0, 187, 187","class":"ansi-cyan"},{color:"255,255,255","class":"ansi-white"}],[{color:"85, 85, 85","class":"ansi-bright-black"},{color:"255, 85, 85","class":"ansi-bright-red"},{color:"0, 255, 0","class":"ansi-bright-green"},{color:"255, 255, 85","class":"ansi-bright-yellow"},{color:"85, 85, 255","class":"ansi-bright-blue"},{color:"255, 85, 255","class":"ansi-bright-magenta"},{color:"85, 255, 255","class":"ansi-bright-cyan"},{color:"255, 255, 255","class":"ansi-bright-white"}]];g.prototype.escape_for_html=function(a){return a.replace(/[&<>]/gm,function(a){if(a=="&")return"&amp;";if(a=="<")return"&lt;";if(a==">")return"&gt;"})},g.prototype.linkify=function(a){return a.replace(/(https?:\/\/[^\s]+)/gm,function(a){return'<a href="'+a+'">'+a+"</a>"})},g.prototype.ansi_to_html=function(a,b){var c=a.split(/\033\[/),d=c.shift(),e=this,f=c.map(function(a){return e.process_chunk(a,b)});f.unshift(d);var g=f.reduce(function(a,b){return Array.isArray(b)?a.concat(b):(a.push(b),a)},[]),h=g.join("");return h},g.prototype.process_chunk=function(a,b){b=typeof b=="undefined"?{}:b;var c=typeof b.use_classes!="undefined"&&b.use_classes,d=c?"class":"color",e=a.match(/([\d;]*)m([^]*)/m);if(!e)return a;var g=e[2],h=e[1].split(";"),i=this;h.map(function(a){var b=parseInt(a);isNaN(b)||b===0?(i.fg=i.bg=null,i.bright=0):b===1?i.bright=1:b>=30&&b<38?i.fg=f[i.bright][b%10][d]:b>=40&&b<48&&(i.bg=f[0][b%10][d])});if(i.fg===null&&i.bg===null)return g;var j=classes=[];return i.fg&&(c?classes.push(i.fg+"-fg"):j.push("color:rgb("+i.fg+")")),i.bg&&(c?classes.push(i.bg+"-bg"):j.push("background-color:rgb("+i.bg+")")),c?['<span class="'+classes.join(" ")+'">',g,"</span>"]:['<span style="'+j.join(";")+'">',g,"</span>"]},c={escape_for_html:function(a){var b=new g;return b.escape_for_html(a)},linkify:function(a){var b=new g;return b.linkify(a)},ansi_to_html:function(a,b){var c=new g;return c.ansi_to_html(a,b)},ansi_to_html_obj:function(){return new g}},e&&(module.exports=c),typeof window!="undefined"&&typeof ender=="undefined"&&(window.ansi_up=c),typeof define=="function"&&define.amd&&define("ansi_up",[],function(){return c})})(Date);


--------------------------------------------------------------------------------
/_posts/web/2016-11-01-how-gpu-speed-up-page-render.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: GPU 是如何加速网页渲染的
 4 | category: Web
 5 | ---
 6 | 
 7 | 
 8 | 
 9 | - *
10 | {:toc}
11 | 
12 | 前端工程师应该都听说过硬件加速，通常它是指利用 GPU 来加速页面的渲染。那么 GPU 目前在web页面的渲染过程中起到什么作用呢？
13 | 
14 | ##  GPU 的作用
15 | 
16 | 早期浏览器完全依赖 CPU 来进行页面渲染。现在随着 GPU 的能力增强和普及，且目前绝大多数运行浏览器的设备上都集成了 GPU。浏览器可以利用 GPU 来加速网页渲染。
17 | 
18 | GPU 包含几百上千个核心，但每个核心的结构都相对简单， GPU 的结构也决定了它适合用来进行大规模并行计算。进行图层合并需要操作大量的像素，这方面 GPU 能比 CPU 更高效的完成。这里有个[视频](http://v.youku.com/v_show/id_XNjY3MTY4NjAw.html)，很清楚地说明 CPU 与 GPU 的差别。
19 | 
20 | ## 页面渲染过程
21 | 
22 | 浏览器利用 HTML 构建出 DOM 树，利用 CSS 构建 CSSOM 树，最终得到 Render 树。
23 | 
24 | ![text=渲染树的构建过程](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/16-9-24/93321516.jpg)
25 | 
26 | 然而这只是很宏观的描述，浏览器为了将 DOM 元素高效地绘制且正确地出来，将多个元素安排在一个图层中，使用 PaintLayer 来描述，在每个 PaintLayer 中又存在 GraphicsLayers。当某个元素的样式改变后，不需要去重绘某个图层就好了。
27 | 
28 | 浏览器的每一帧都可能会经过以下几个步骤：
29 | 
30 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/16-9-24/92671229.jpg)
31 | 
32 | JavaScript 的执行可能修改 DOM 树和 CSSOM 树，随后浏览器需要重新计算样式，并根据新的样式计算出元素的实际属性（比如 CSS 中 width 是 50%，这里就要利用父元素的宽度得出自己真实的 width 值），重绘有变动的图层，随后将各图层传递给 GPU ，由 GPU 来进行图层的合并。
33 | 
34 | 上面 5 个步骤中，Layout 和 Paint 是可以省略的，当修改后的样式不会改变元素的尺寸、位置等涉及布局的属性时候，就没有必要进行 Layout（计算布局），比如修改了 color 属性，这个时候就只需要进行重绘（Paint）步骤。同样的道理，修改某些属性也不需要进行 Paint 步骤，只需要 Composite 就可以。
35 | 
36 | 因此，我们希望所做的操作能尽可能地避免  Layout 和 Paint 这两个步骤，这样一帧所需的时间也就会大大缩短，可以明显避免卡顿。
37 | 
38 | 目前有三个属性的改变只需要进行 Composite 过程，分别是：
39 | 
40 | - filter
41 | - transform
42 | - opacity
43 | 
44 | 这几个属性的改变，GPU 只需要在合并图层之前对图层进行一些变换，比如 `opacity` 属性的改变，GPU 只需要在合并之前改变图层的 alpha 通道。transform 和 filter 的改变 GPU 也可以很快地得到相应的图层。
45 | 
46 | ## 正确地利用 GPU
47 | 
48 | ### 使用 transform, filter 和 opacity 来完成动画
49 | 
50 | 使用以上 3 个属性来完成动画，可以避免在动画的每一帧进行重绘。如果在动画中改变了其他属性，那也不能避免重新绘制。
51 | 
52 | ### 避免不合理地强制开启硬件加速
53 | 
54 | 常常看到有文章指出使用  `transform:translateZ(0);`  这样的 hark 可以强制开启硬件加速来提高性能，这是错误的说法，要知道所谓的硬件加速就是利用 GPU 来将本就存在于 GPU 中的图层进行一些变换得到新的图层。如果改变的属性必须要要进行重绘，比如改变了 background 属性，那么图层还是要进行重绘然后重新加载至 GPU 中。这个时候就算强制开启硬件加速也没有什么用。
55 | 
56 | 使用  `transform:translateZ(0);` 这样的 CSS hark 写法会将元素提升至单独的图层。在这么做之前要考虑为什么要这样做，创建新的图层的目的应该是，避免某个元素的改变导致大面积重绘，比如某个小标签的颜色的改变，导致大面积重绘，因此将其提升至单独的图层中。这里有个[例子](https://wy-ei.github.io/60fps/paint/avoid-large-area-repaint.html)，小标签背景色的改变会导致大面积的重绘，但是如果将其提升至单独的图层后，改变它的背景色将只会重绘它自身。你可以代码 Chrome 调试工具，通过 Timeline 观察每次闪烁重绘的内容。
57 | 
58 | 而如果整个图层的都要被重绘，那么再将其中的部分元素提升至单独的图层，会导致重绘的时候会分多个图层来进行绘制，然后在进行多个图层的合并，这个时候不如将所有元素放置在单个图层中，重绘整个大的图层。
59 | 
60 | ## 总结
61 | 
62 | 所谓硬件加速，早起浏览器是使用纯软件来渲染页面的，如今现代浏览器利用了 GPU 来进行页面的渲染，在合适的时候浏览器就会自动去使用 GPU 而不是开发者自己去指定。GPU 的功能是在合并图层阶段，它可以在进行图层合并之前来对原图层进行一些变换，合理地使用这个变换可以避免页面重绘，使得每一帧消耗的时间最少，避免卡顿。
63 | 


--------------------------------------------------------------------------------
/_posts/rec/2019-08-31-amazon-item-to-item.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: 论文阅读 - Item-to-Item Collaborative Filtering
 4 | category: 推荐系统
 5 | tag: 推荐系统
 6 | ---
 7 | 
 8 | - *
 9 | {:toc}
10 | 
11 | 本文是我在阅读 Amazon 工程师 2003 年发表的论文 Item-to-Item Collaborative Filtering 时记录的笔记。
12 | 
13 | ## 介绍
14 | 
15 | Amazon.com 的推荐系统所面对的挑战：
16 | 
17 | - 海量商品+海量用户
18 | - 实时推荐，半秒内做出响应，且生成可靠的推荐结果
19 | - 新用户的信息很少，老用户有大量的信息
20 | - 用户的信息是易变的，用户在短时间内产生的交互信息，就能改变用户的特征，推荐系统需要快速地对用户特征的改变做出反应。
21 | 
22 | 传统的 CF 算法，不能满足实时性要求，这里提出 item-to-item collaborative filtering 算法，它的计算量独立于用户数量和商品数量，可以在海量数据的场景下，实时地产生高质量的推荐。
23 | 
24 | ## 推荐算法
25 | 
26 | ### 传统的协同过滤
27 | 
28 | 传统的协同过滤算法将用户表示为一个长度为 $n$ 的向量 $v$，N 是系统中物品的个数，$v_i$ 代表用户有没有购买过商品 $i$ 或者对商品 $i$ 的评分。
29 | 
30 | 根据用户向量，可以为每个用户找到一组相似的用户，相似用户购买过或评价高的物品，就可以推荐给该用户。用户的相似度可以通过用户向量间夹角的余弦值来度量：
31 | 
32 | $$
33 | \operatorname{similarity}(\vec{A}, \vec{B})=\cos (\vec{A}, \vec{B})=\frac{\vec{A} \bullet \vec{B}}{\|\vec{A}\| *\|\vec{B}\|}
34 | $$
35 | 
36 | 设系统中有 M 个用户，N 件物品，给目标用户寻找相似用户需要 $O(MN)$，遍历所有用户，计算用户向量的相似度。但是因为用户向量往往是非常稀疏的，所以实际复杂度为 $O(M)$。即便如此，在上亿用户的场景下，这个时间复杂度也是无法接受的。
37 | 
38 | 一种权衡的策略是，随机抽一部分用户以减小 M，抛弃掉冷门物品以减小 N。还可以使用聚类，降维等策略来减小计算量。但以上这些策略会引起推荐质量的降低。
39 | 
40 | ### Cluster Models
41 | 
42 | 聚类模式的策略是将用户先进行聚类，聚类操作可以离线进行。聚类后所有用户被分到了一些小的分组中，且彼此较为相似。对于目标用户，在组内寻找最相似用户，并生成推荐。
43 | 
44 | ### Search-Based Methods
45 | 
46 | 基于搜索（或基于内容）的策略通过 item 的属性，比如文本、类别等，来寻找相似的 item。用用户购买过的商品，构造一个 query 然后检索出匹配的 item。当用户只有少量的购买记录时，这种方法还勉强奏效。当用户购买记录很多的时候，就很难确定要搜什么东西了，得到的结果是很热门的那些 item，或者范围很窄，比如老是推荐某个作者的书或某一类物品。推荐系统应该帮助用户找到那些新鲜的、相关的、用户感兴趣的物品。
47 | 
48 | ## Item-to-Item Collaborative Filtering
49 | 
50 | item-to-item CF 寻找与用户购买过的物品相似的其他物品，组合这些相似物品，得到最终的推荐结果。
51 | 
52 | > Rather than matching the user to similar customers, item-to-item collaborative filtering matches each of the user’s purchased and rated items to similar items, then combines those similar items into a recommendation list.
53 | 
54 | ### 算法细节
55 | 
56 | 这里提出的算法依然需要计算 item 间的相似度，只不过 Amazon 的这篇论文提出了一种计算 item 间相似度的策略。
57 | 
58 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/08/31/5d6a503b451253d178065409.jpg)
59 | 
60 | 从某个用户同时购买过的多个 item 间开启计算，而不是拿某个 item 和其他所有 item 进行计算。因为很多 item 之间并没有某个人都购买过，这两个 item 间的相似度是没法算的。通过上面给出的算法，可以减少计算量。 
61 | 
62 | 计算完成之后，每个 item 都被关联了 k 个相似的物品。
63 | 
64 | ### 可扩展性
65 | 
66 | item-to-item collaborative filtering 能够应对大量数据场景，因为 item 之间的相似度具有持久性，可以预先离线进行计算。
67 | 
68 | ## 总结
69 | 
70 | 通过阅读论文，我感觉 collaborative filtering 在早期（2000年左右），专指 user-based CF，即通过找相似用户，用相似用户喜欢的物品作为推荐结果的方法。后来慢慢引入了 item-based（如本文所描述），然后才将 CF 算法分为 user-based 和 item-based。
71 | 
72 | 本文就讲了 item-based 的具体做法，关于相似度计算等方法，就和 user-based CF 一样，所以没有再提。另外 item 之间计算相似度的策略（即前面伪代码所描述）也值得学习。


--------------------------------------------------------------------------------
/_posts/rec/2019-09-06-deep-FM.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: 论文阅读 - DeepFM
 4 | category: 推荐系统
 5 | tag: 推荐系统
 6 | ---
 7 | 
 8 | - *
 9 | {:toc}
10 | 
11 | 
12 | 今天看了出自  IJCAI 2017 的论文 DeepFM: A Factorization-Machine based Neural Network for CTR Prediction，思想并不复杂，现将笔记大致记录于此。
13 | 
14 | ## 背景
15 | 
16 | CRT (click-through rate) 预测，是指预测用户对某个物品（广告）的点击率，以便于推送用户最有可能点击的物品。广告平台（比如微信）当然希望有一个模型能够准确预测出用户最可能点击的广告，这样可以增加平台收益。
17 | 
18 | 预测点击概率需要用到用户信息和物品信息，通常是将多种信息融合在一个向量中。离散的用户和物品的属性，就采用 one-hot 表示，连续的属性可以归一化后直接使用。训练样本为 $(x, y)$，其中 $x$ 是一个高维稀疏矩阵，其中包含 user 和 item 的信息，`$y \in\{0,1\}$` 表示用户是否点击了 item。
19 | 
20 | 特征间的组合常常很有用，比如从用户点击数据中发现在吃饭的时间用户常常下载点外卖的软件，这说明 time 和 app category 有很大关系。另外可能在数据中发现男孩子常常玩射击类游戏，这说明用户性别和年龄与游戏类别存在很大的联系。
21 | 
22 | 要从数据中捕获以上提到的特征，需要模型能够组合不同的特征。线性模型无法进行特征组合，仅能学习到不同特征的权重。为此人们做了特征工程，向线性模型中加入 `$x_ix_j$` 这样的组合特征，为了解决组合特征参数过多的问题，提出了 Factorization Machines。
23 | 
24 | 但是 FM 因为计算量的问题也常常只能引入二阶特征（两个特征的组合），为了能够引入更加强大的特征组合。Wide & Deep 模型被提出，结合线性模型和深度神经网络，试图让模型学习到更加复杂的特征。
25 | 
26 | 本文的 DeepFM 和 Wide & Deep 的动机，我感觉是差不多的，只是 DeepFM 提出了一种看起来更加简洁的模型。
27 | 
28 | ## DeepFM
29 | 
30 | DeepFM 的模型架构图如下：
31 | 
32 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/06/5d71d1e5451253d17890cf77.jpg)
33 | 
34 | 单看此图肯定时看不明白的，稍加解释如下：
35 | 
36 | 
37 | 模型架构图的左边是一个 FM 模型，FM 的输入就是高维的稀疏向量，这个向量是不同属性的 one-hot 向量拼接得来的。上图中输入向量下面的 Field i 就是一个属性对应的 one-hot 向量。如果熟悉 FM 就知道，FM 模型会对每一个特征学习到一个低维的稠密向量，可以视为特征的 Embedding。
38 | 
39 | 右面是一个深度神经网络模型，高维的稀疏向量中每一个 Filed 中只有一个维度有值，每一个 Filed 对应的 one-hot 向量，可以经过一个 Embedding 层转换为低维的稠密向量。Embedding 层中的各个特征的 Embedding 同时也用于 FM 模型。
40 | 
41 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/06/5d71d3a3451253d1789101d2.jpg)
42 | 
43 | 论文中视各个 Filed 都是离散的，都可以表示为 one-hot 向量，但如果某个属性是连续值，该怎么办？可以直接把连续值放入神经网络，也可以使用这个特征对应的 Embedding。
44 | 
45 | FM 模型可以表示为：
46 | 
47 | $$
48 | y_{F M}=\langle w, x\rangle+\sum_{j_{1}=1}^{d} \sum_{j_{2}=j_{1}+1}^{d}\left\langle V_{i}, V_{j}\right\rangle x_{j_{1}} \cdot x_{j_{2}}
49 | $$
50 | 
51 | 深度模型的输入为：
52 | 
53 | $$
54 | a^{(0)}=\left[e_{1}, e_{2}, \ldots, e_{m}\right]
55 | $$
56 | 
57 | 其中 $e_i$ 就是第 Field i 对应的 Embedding，不同 Field 的 Embedding 拼接起来得到一个稠密向量，输入到全连接的神经网络中。神经网络模型可以表示为：
58 | 
59 | $$
60 | a^{(l+1)}=\sigma\left(W^{(l)} a^{(l)}+b^{(l)}\right)
61 | $$
62 | 
63 | $$
64 | y_{D N N}=\sigma\left(W^{|H|+1} \cdot a^{H}+b^{|H|+1}\right)
65 | $$
66 | 
67 | 最终整个 DeepFM 模型可以表示为：
68 | 
69 | $$
70 | \hat{y}=\operatorname{sigmoid}\left(y_{F M}+y_{D N N}\right)
71 | $$
72 | 
73 | ## 总结
74 | 
75 | FM 解决的是输入比较稀疏时，组合特征不好学习的问题。DeepFM 提供了一种结合低阶和高阶特征的方法，联合训练 FM 和 神经网络，让模型抽取到更加丰富的特征。和 Wide & Deep 模型相比，DeepFM 中浅层网络和深层网络使用的输入是相同的。Wide & Deep 网络中 Wide 部分的的输入还是需要做特征工程，而在 DeepFM 中则不需要特征工程或需要的更少。


--------------------------------------------------------------------------------
/_posts/web/2016-05-18-web-security.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: Web 安全
  4 | category: Web
  5 | ---
  6 | 
  7 | 
  8 | 
  9 | - *
 10 | {:toc}
 11 | 
 12 | 
 13 | ## XSS
 14 | 
 15 | XSS （Cross Site Script）为了区别于 CSS ，缩写为 XSS。XSS 是指黑客通过 HTML 注入修改页面内容，插入恶意脚本，在用户访问页面的时候，对用户发起攻击的行为。
 16 | 
 17 | 对于下面这个例子，我直接将用户输入的内容添加在页面中，这就存在非常明显的 XSS 漏洞。
 18 | 
 19 | ```html
 20 | <body>
 21 |     <input type='text' id='name'>
 22 |     <button type="button" id="submit">ok</button>
 23 |     <div id='info'></div>
 24 |     <script>
 25 |         var $name = $('#name');
 26 |         var $info = $('#info');
 27 |         $('#submit').on('click',function(){
 28 |             var name = $name.val();
 29 |             $info.html(name);
 30 |         });
 31 |     </script>
 32 | </body>
 33 | ```
 34 | 
 35 | 如果攻击者在文本框中输入如下内容，页面中就会弹出对话框来，攻击者还可以通过此漏洞插入外部脚本在该网页中。
 36 | 
 37 | ```
 38 | <script>alert('xss')</script>
 39 | ```
 40 | 
 41 | 对于 XSS 按照其表现形式不同可以分为下面几种：
 42 | 
 43 | - 反射型 XSS
 44 | - 存储型 XSS
 45 | 
 46 | ### 反射型 XSS
 47 | 
 48 | 前面的例子就是一个反射型 XSS ，它只是简单地将输入内容反射给浏览器。很多活动现场，常常看到各种微博、微信留言墙，它允许用户通过微信输入内容，将内容展现在另外一个大屏幕上，如果在将传输过来的字符串插入到 Web 页面上之前，没有过滤 JavaScript 脚本，就出现了 XSS 漏洞。参与互动的人如果输入了恶意脚本改变了页面中的内容，这就会产生很不好的影响。
 49 | 
 50 | 因此对于需要插入到 Web 页面上的内容，在插入之前一定要小心 XSS 攻击，比较简单的方法是将要插入的字符串进行转译。
 51 | 
 52 | ### 存储型 XSS
 53 | 
 54 | 在一些论坛中，允许使用者发布一些帖子，恶意用户可能输入一些破坏性的脚本，然后这些内容被保存到了服务器上，下一个访问该网页的用户会下载这些恶意内容，其中就包含恶意脚本。这样造成的结果是每个访问该页面的用户都遭到了攻击。
 55 | 
 56 | 
 57 | ## XSS 的防御手段
 58 | 
 59 | ### 给关键的 cookie 设置 httpOnly 标记
 60 | 
 61 | 给关键的 cookie 设置了  httpOnly 标记后可以防止 javascript 读取这些 cookie ，这从一定程度上避免了 cookie 劫持的发生。
 62 | 
 63 | ### 输入检查
 64 | 
 65 | 对用户输入的内容，要进行敏感信息检查，过滤掉 javascript ，script 等字样，对 `" , ' , < , >`  等特殊的字符进行转义。
 66 | 
 67 | ### 输出检查
 68 | 
 69 | 当要把内容输出到 HTML 页面上的时候，可以通过字符编码或转义的方式防止 XSS 攻击。
 70 | 
 71 | 一般要对下面一些字符进行转换：
 72 | 
 73 | ```
 74 | & -> &amp;
 75 | < -> &lt;
 76 | > -> &gt;
 77 | " -> &quot;
 78 | ' -> &#x27;
 79 | / -> &#x2F;
 80 | ```
 81 | 
 82 | ## CSRF
 83 | 
 84 | CSRF (Cross Site Request Forgery)，跨站点请求伪造。
 85 | 
 86 | 当用户访问了网站 A 之后，该网站在用户的浏览器中留下了 cookie ，当该用户在之后访问到恶意网站后，这个网站可能向先前网站发起请求，而这些请求中会携带网站 A 的 cookie。
 87 | 
 88 | 为了防止 CSRF 可以采用以下措施：
 89 | 
 90 | - Referer Check：通过检查 HTTP 请求头部中的 referer 字段可以检查请求是否来自合法的“源”地址，但有的时候浏览器不会发送 referer 头信息。
 91 | 
 92 | ## 点击劫持
 93 | 
 94 | X-Frame-Options 这个字段是为了防止 ClickJacking 而生的。有以下几个可选值：
 95 | 
 96 | - DENY
 97 | - SAMEORIGIN
 98 | - ALLOW-FROM origin
 99 | 
100 | 当值为 DENY 的时候会拒绝当前页面被加载在任何 frame 中。为 SAMEORIGIN 则要求加载该页面的 frame 需要和该 frame 同源。当值为 ALLOW-FROM 的时候，则可以指出允许加载该页面的源地址。
101 | 
102 | ## HTML5 安全
103 | 
104 | 
105 | ### iframe
106 | 
107 | HTML5 中专门为 iframe 定义了一个新属性 - sandbox, 这个属性可以控制 iframe 中加载的资源可以执行的动作。
108 | 
109 | ### a 标签
110 | 
111 | 在 a 标签中指定了 noreferrer 之后，发起的请求中就不会携带 referer 这个头部信息，因为 referer 可能会泄漏一些信息。
112 | 


--------------------------------------------------------------------------------
/_posts/tools/2018-11-30-jupyterlab.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: Jupyter Lab
  4 | category: 工具
  5 | ---
  6 | 
  7 | 
  8 | 
  9 | 本文为我在用 Jupyter Lab 时的备忘笔记，会持续更新。
 10 | 
 11 | ## 简介
 12 | 
 13 | 做数据科学的同学对 jupyter notebook 应该很熟悉，但他的一个缺点是不能够同时打开多个文件。jupyter lab 可以算的上是一个简易的 IDE，你可以同时打开多个窗口，打开终端，对窗口进行分割，同时编辑不同类型的文件。 如果正在使用 jupyter notebook，那么没有理由不切换到 jupyter lab 上。
 14 | 
 15 | 其主界面如下：
 16 | 
 17 | ![jupyter lab 界面](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/05/14/5cda4759697df1fd0cc1e1e9.jpg)
 18 | 
 19 | jupyter lab 的文档在 [JupyterLab Documentation](https://jupyterlab.readthedocs.io/en/stable/)。
 20 | 
 21 | ## 安装与启动
 22 | 
 23 | ```sh
 24 | # 安装
 25 | pip install jupyterlab
 26 | 
 27 | # 启动 jupyter lab
 28 | jupyter lab
 29 | ```
 30 | 
 31 | 
 32 | ## 通过密码访问
 33 | 
 34 | 在启动 jupyter lab 之后，默认是通过在 url 后面跟上一个 token 来访问的。有时候关闭了页面之后，往往又需要去控制台复制这个带有 token 的 url，常常显得不够方便，为此可以设置一个密码，通过密码来访问。
 35 | 
 36 | 先生成配置文件，然后配置密码，命令如下：
 37 | 
 38 | ```sh
 39 | $ jupyter notebook --generate-config
 40 | $ jupyter notebook password
 41 | ```
 42 | 
 43 | 这会要求用户输入需要设置的密码。设置完成之后，就可以通过输入密码来访问 jupyter lab 了。
 44 | 
 45 | ## 在服务器上部署
 46 | 
 47 | 一种场景是，希望在服务器上运行 jupyter lab，然后可以在任何地方，使用任何设备访问到 jupyter lab 环境。默认情况下，只能通过 `http://localhost:8888` 这个地址访问，通过服务器的 IP 是访问不了的，需要做一些配置。
 48 | 
 49 | 初始阶段 jupyter lab 采用默认配置，如果需要对其个性化配置，需要先生成配置项：
 50 | 
 51 | ```sh
 52 | # 生成配置文件
 53 | $ jupyter notebook --generate-config
 54 | ```
 55 | 
 56 | 这个时候在用户根目录下的 `.jupyter` 目录下，就多出来了一个 `jupyter_notebook_config.py` 文件，在这个文件里，用户可以对 jupyter lab 进行个性化配置。
 57 | 
 58 | 需要修改的地方主要有下面几处：
 59 | 
 60 | ```python
 61 | # 当你使用服务器的 ip 访问的时候，可以不配置这一项
 62 | # 当时如果使用外网穿透技术，访问的 ip 不是部署 jupyter lab 的机器的 ip 的时候，
 63 | # 就需要配置这个了，否则部分功能无法正常工作
 64 | c.NotebookApp.allow_origin = '*'
 65 | 
 66 | # 修改可以通过本机的任意一个 ip 地址来访问 jupyter lab 环境
 67 | c.NotebookApp.ip = '0.0.0.0'
 68 | 
 69 | # 关闭自动打开浏览器的行为
 70 | c.NotebookApp.open_browser = False
 71 | 
 72 | # 修改端口，默认为 8888，根据自己的需要修改
 73 | c.NotebookApp.port = 8000
 74 | ```
 75 | 
 76 | ## Magic Command
 77 | 
 78 | 此命令可以查看函数的性能瓶颈，看到函数每一行的运行次数和时间。
 79 | 
 80 | ```python
 81 | %load_ext line_profiler
 82 | 
 83 | %lprun -f Quick.sort Quick.sort(nums)
 84 | ```
 85 | 
 86 | ## 快捷键
 87 | 
 88 | Notebook 存在两种模式，命名模式和编辑模式，可以使用 <kbd>Esc</kbd> 从编辑模式切换为命令模式，使用 <kbd>Enter</kbd> 进入编辑模式。
 89 | 
 90 | 在命令模式下，有下列快捷键可以使用：
 91 | 
 92 | <kbd>m</kbd>: 将 cell 切换为 markdown 模式
 93 | 
 94 | <kbd>y</kbd>: 将 cell 切换为代码模式
 95 | 
 96 | <kbd>D</kbd>+<kbd>D</kbd>: 删除 cell
 97 | 
 98 | <kbd>Shift</kbd>+<kbd>↑ / ↓</kbd>: 选中多个 cell，选中后可以进行删除、复制、粘贴、运行等操作。
 99 | 
100 | <kbd>Shift</kbd>+<kbd>M</kbd>: 合并选中的 cells
101 | 
102 | <kbd>Shift</kbd>+<kbd>Tab</kbd>: 代码提示，光标定位到某个函数、某个模块的时候，按这个组合键会得出提示
103 | 
104 | 在编辑模式，有下面一些技巧：
105 | 
106 | 输入 `?function-name` 可以得到对应函数的签名和文档，由此可以确定函数的输入和功能等信息，比如：
107 | 
108 | ```
109 | ?len
110 | ```
111 | 
112 | 输入 `??function-name` 可以得到函数更加详细的信息，包括源代码。


--------------------------------------------------------------------------------
/_posts/network/2020-02-20-https.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: HTTPs 详解
 4 | category: 网络
 5 | ---
 6 | 
 7 | * -
 8 | {:toc}
 9 | 
10 | ## HTTPs 简介
11 | 
12 | HTTP 基于明文进行传输，在传输过程中可能遭遇劫持，网络的中间节点可以更改 HTTP 传输内容。在 HTTPs 广泛应用之前，网页被篡改的情况时有发生。有不法分子在别人的网页中插入了广告，以此牟利。更糟糕的是，基于 HTTP 传输的隐私信息会被他人获取。
13 | 
14 | 为了让 HTTP 能够安全地传输 HTTPs 被提出来。HTTPs 并不是什么新的协议，它是在 HTTP 和 TCP 之间加入了一个安全层（Secure Sockets Layer），这个中间层，就负责加解密。通俗地讲，把 HTTP 报文加密后交给传输层，把传输层收到的报文解密后交给应用层。如此，在网络上传输的信息就是加密过的，对方没有办法篡改。
15 | 
16 | ## 加密方式
17 | 
18 | 在了解 HTTPs 之前，先简要了解一下两种在 HTTPs 中会用到的加密方式。
19 | 
20 | ### 对称密钥加密
21 | 
22 | 加密和解密采用同一个密钥，过程如图：
23 | 
24 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2020/07/01/2020-07-01-165952.png)
25 | 
26 | 至于加解密是具体如何操作，这里就不深究了。只需要了解，对称加密中，加密和解密都采用同一个密钥。
27 | 
28 | ### 非对称密钥加密
29 | 
30 | 也称为公开密钥加密，这种加密方式有两个密钥——公钥和私钥。其中公钥用于加密，私钥用于解密。公钥和私钥是成对的，而且公钥往往是公开的。通信双方，分别持有公钥和私钥，使用公钥加密后的内容，必须使用私钥才能解密。
31 | 
32 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2020/07/01/2020-07-01-170255.png)
33 | 
34 | ## HTTPs 中的加密过程
35 | 
36 | 在每个支持 HTTPs 的服务器上都存有一对公钥和私钥。客户端想要建立连接时，服务器会把公钥发送给客户端。客户端生成一个用于对称加密的密钥，使用服务器发来的公钥进行加密，然后发给服务器。这样客户端和服务器都有了客户端上生成的对称加密的密钥的。双方可以使用对称加密算法来实现加密传输了。
37 | 
38 | 可以看到，这里使用非对称加密来保证对称加密的密钥的安全传输。此后的加密都采用对称加密完成。
39 | 
40 | ![<w,600px>](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2020/07/01/2020-07-01-170959.png)
41 | 
42 | 上面的图中清晰地展现了这一过程，其中的 `session key` 就是对称加密的密钥。
43 | 
44 | ## 数字证书
45 | 
46 | ### 数字证书的作用
47 | 
48 | 采用上一节中描述的方法，传输内容就不会被他人截获了，就算被抓了包，得到的也是密文。但是假如 DNS 被劫持了，你登录银行的网站 `bank.com`，在解析域名的时候 DNS 服务的流量被劫持了，你连接到了骗子的服务器上。因为 `bank.com` 解析的 IP 并不是该银行的服务器的 IP 而是骗子的服务器。此时网址虽然显示的是 `bank.com`，此时你却连接到骗子的服务器上。之后你输入密码，都传到了骗子哪里。就算传输的内容是加密过的，那也无济于事，因为此时确实是和骗子在通信。
49 | 
50 | 为了保证与之通信的服务器是真实的，数字证书被引入 HTTPs。每个合规的 HTTPs 服务器都需要有一个数字证书，这个数字证书由某个第三方机构颁发，即数字证书认证机构（CA，Certificate Authority）。这是一个客户端和服务器都信赖的第三方机构。
51 | 
52 | 数字证书用于证明服务器的真实性，保障服务器和浏览器之间的通信安全，验证网站的真实身份，区别于钓鱼欺诈网站。
53 | 
54 | ### 数字证书的生成过程
55 | 
56 | ![<text,数字证书签名和验证过程>](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2020/07/01/2020-07-01-180829.png)
57 | 
58 | 
59 | 要想得到证书，需要去数字证书认证机构(CA)申请，CA 核实了用户身份之后，会给申请者颁发一个数字证书。同时 CA 会在该数字证书上签名，证明这个数字证书真的是自己颁发出去的。
60 | 
61 | 首先 CA 会产生一个公钥和密钥对，这是服务器后期用于非对称加密用的。CA 把其中的公钥作为上图中左侧中的 Data。CA 哪里有另外一个公钥和私钥对，这是是 CA 自己的密钥对。CA 把申请者的公钥做 hash 之后，使用自己的密钥进行加密，此加密内容为签名。然后把用户的公钥和签名拼接起来。
62 | 
63 | 最终申请者得到数字证书里面包含有效日期、对应的域名、CA 的信息等等，另外还包含公钥和公钥的签名。
64 | 
65 | ### 数字证书的验证方法
66 | 
67 | 在通信的时候，服务器把证书发给客户端，客户端收到以后需要检验此证书的真实性。如果证书是假的，说明对方不值得信赖。因为如果证书是假的，说明服务器的拥有者没有得到 CA 的认可，为什么没有得到认可？因为它是骗子。他没有办法提供有效的身份证明，以说明自己是该域名的拥有者。
68 | 
69 | ![<text,数字证书信息>](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2020/07/01/2020-07-01-174432.png)
70 | 
71 | 客户端收到数字证书之后，可以检查该数字证书对应的是不是该网站。如果是，可以进一步检查证书是不是真的。如果是真的，就可以从中取出公钥，基于上一节提到的方法来加密通信了。
72 | 
73 | 问题的关键是如何验证证书的真伪。
74 | 
75 | 请看上上幅图 _数字证书签名和验证过程_ 的右半部分。用户对公钥运行同样的 hash 算法得到左边的 hash 值。然后使用 CA 的公钥对数字证书的签名进行解密，而后比较两个 hash 值是否相同。如果相同，那说明此数字证书的签名确实是 CA 的签名。如果是旁人的签名，那么解密出来的两个 hash 一定不相同。
76 | 
77 | CA 的公钥从何而来呢？因为全球 CA 的数量时有限的，多数浏览器已经内置了 CA 的公钥。CA 的密钥只有 CA 知道，需要高度保密。


--------------------------------------------------------------------------------
/_posts/rec/2019-09-04-wide-deep.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: 论文阅读 - Wide & Deep Learning for Recommender Systems
 4 | category: 推荐系统
 5 | tag: 推荐系统
 6 | ---
 7 | 
 8 | 本文为阅读论文 Wide & Deep Learning for Recommender Systems 时记下的笔记。
 9 | 
10 | - *
11 | {:toc}
12 | 
13 | 
14 | ## 背景
15 | 
16 | 推荐系统给出的结果需要兼顾相关性和新颖性。推荐的内容和用户特征很匹配，就会推荐大量相关内容，时间一久，用户感到无新鲜感。推荐内容过于泛化，用户的兴趣无法满足。本文提出的算法用于 Google Play 的 APP 推荐系统。
17 | 
18 | ## 线性模型
19 | 
20 | 线性模型中各类特征常采用 one-hot 向量表示，比如“国家”属性，可取的值有 200 多个，要表示“国家”就采用一个 200 多个维度的向量，每一个国家占一个维度。类似地，其他属性也这样表示。如此以来，对某个事物的向量表示，就是拼接各个属性对应的 one-hot 向量，整个向量表示是非常稀疏的。
21 | 
22 | ```
23 | 国家：[0 0 0 1 0 0 ...]
24 | 性别: [1 0]
25 | ```
26 | 
27 | 用户安装过的 APP，可以有多个，采用 bag-of-word 表示，每个维度表示一个 APP 是否安装。
28 | 
29 | ```
30 | APP: [0 0 1 0 1 0 0 ...]
31 | ```
32 | 
33 | 不同的特征之间可以进行组合，比如将国家和性别属性组合，可以表示如“中国男性”这样的组合属性。特征的组合能够给线性模型增加非线性的特征。但是也会极大地增大特征维度。
34 | 
35 | 线性模型的使用的特征向量具有维度高、稀疏的特点。线性模型的形式如下：
36 | 
37 | $$
38 | y = \mathbf{w}^T\mathbf{x} + b
39 | $$
40 | 
41 | 由于特征维度很大，往往没有足够的数据来训练模型中的每个参数。因为有的特征组合在数据集中根本就没有出现，或是数量很少。因此对数据集中未出现的情况，模型无法进行泛化。
42 | 
43 | 论文中提到了 generalization 和 memorization 这两个词，我读的论文少，对这两个概念理解的还不够透彻。
44 | 
45 | 说线性模型有较好的 memorization，我想是指线性模型能够较好地学习到各个特征（包含组合特征）的权重，以及学习到特征之间的相关性。
46 | 
47 | ## 深度模型
48 | 
49 | 深度模型，常常将某一个属性表示为一个低维的稠密向量，比如“国家”这个属性，可能会将不同的国家表示为一个长度为 10 的向量，这也常被称为 Embedding。如此以来，对某事物的向量表示就是一个较低维度且稠密的向量。然后使用深度网络模型，可以对 Embedding 中各维进行组合。
50 | 
51 | 深度模型可以实现很好泛化，当训练数据较稀疏的时候，甚至不能反映训练集的特征。即，太过泛化。好处就是能够应对数据稀疏的场景，缺点常常会得出结果不够相关。
52 | 
53 | 泛化大致是指，基于属性相关性的传递，发现过去没有或很少发生的新的特征组合，有利于增加推荐的多样性。
54 | 
55 | ## Wide & Deep
56 | 
57 | Google 在 2016 年发布的 Wide & Deep 模型，组合了线性模型和深度模型。该模型结合了线性模型的记忆能力和深度模型的泛化能力。因为线性模型的输入是维度很高的向量，模型的输入很 Wide，Wide 出自于此。
58 | 
59 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/04/5d6f76ff451253d17822413b.jpg)
60 | 
61 | 
62 | ## 推荐系统框架
63 | 
64 | 工业推荐系统基本都是 Matching 和 Ranking 两部分，Matching 用于从数据库中先粗略地检索出相关内容，极大地减小 item 的数量。Ranking 则对检索出的 item 做更加细致的排序，最终生成推荐。
65 | 
66 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/04/5d6f77af451253d178227f50.jpg)
67 | 
68 | 这里 Google Play 采用的策略也是如此。
69 | 
70 | 
71 | ## Wide & Deep 模型架构
72 | 
73 | Wide 模型和 Deep 模型是联合起来训练的，如下图所示：
74 | 
75 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/04/5d6f79c0451253d178234980.jpg)
76 | 
77 | 图中左边是深度模型，将连续属性做归一化。离散属性做 Embedding 后，拼接起来，输入全连接网络。
78 | 
79 | $$
80 | a^{(l+1)}=f\left(W^{(l)} a^{(l)}+b^{(l)}\right)
81 | $$
82 | 
83 | 右边是线性模型，使用了用户安装的 APP 和曝光的 APP 以及两者的组合作为特征。
84 | 
85 | 将 Wide 和 Deep 的输出进行求和然后交给 sigmoid 函数求出概率。最终使用 Logistics 损失函数（就是 Logistics Regression 用的损失函数）来作为优化目标，使用 SGD 进行训练。 
86 | 
87 | $$
88 | P(Y=1 | \mathbf{x})=\sigma\left(\mathbf{w}_{\text {wide}}^{T}[\mathbf{x}, \phi(\mathbf{x})]+\mathbf{w}_{\text {deep}}^{T} a^{\left(l_{f}\right)}+b\right)
89 | $$
90 | 
91 | Wide & Deep 模型和模型的集成不是一回事。集成是训练多个模型然后将结果进行集成，每个模型都使用了全部的样本特征。集成学习训练的多个模型是独立存在的，并不知道其他模型的存在。而这里用到的 Wide & Deep 联合学习，能够有效地组合各类特征，两个模型协同地优化目标函数。
92 | 
93 | ## 总结
94 | 
95 | Wide & Deep 模型，在今天看来好像并不新颖，它提出了一种组合深层特征和浅层特征的方法。感觉和图像处理中用到的 ResNet 有相同的思想。


--------------------------------------------------------------------------------
/site/assets/css/scss/common.scss:
--------------------------------------------------------------------------------
  1 | @charset "utf-8";
  2 | .post-info {
  3 |     height: .15rem;
  4 |     font-size: .12rem;
  5 |     color: $secondary-color;
  6 |     padding: .1rem 0;
  7 |     list-style: none;
  8 |     margin-right: 1em;
  9 |     span {
 10 |         margin-right: 1em;
 11 |     }
 12 | }
 13 | 
 14 | .page {
 15 |     &__title {
 16 |         font-size: .22rem;
 17 |         color: $title-color;
 18 |         border-bottom: 1px solid $border-color;
 19 |         line-height: 1.8em;
 20 |     }
 21 | }
 22 | 
 23 | .page__header{
 24 |     margin-bottom: 40px;
 25 | }
 26 | 
 27 | @each $sel in ('.list-item', '.page__title') {
 28 |     @media screen and (max-width: 500px){
 29 |         #{$sel}{
 30 |             border-bottom: none!important;
 31 |             position: relative;
 32 |             &::after{
 33 |                 content: "";
 34 |                 display: block;
 35 |                 width: 100%;
 36 |                 height: 1px;
 37 |                 position: absolute;
 38 |                 bottom: 0;
 39 |                 left: 0;
 40 |                 transform-origin: left bottom;
 41 |                 transform: scaleY(0.5) translateZ(0);
 42 |                 box-shadow: inset 0 0 0 1px #ddd;
 43 |             }
 44 |         }
 45 |     }
 46 | 
 47 |     @media screen and (min-resolution: 2dppx) and (max-width: 500px){
 48 |         #{$sel}{
 49 |             &::after{
 50 |                 box-shadow: inset 0 0 0 0.5px #ddd;
 51 |             }
 52 |         }
 53 |     
 54 |     }
 55 |     
 56 |     @media screen and (min-resolution: 3dppx) and (max-width: 500px){
 57 |         #{$sel}{
 58 |             &::after{
 59 |                box-shadow: inset 0 0 0 0.333333px #ddd;
 60 |             }
 61 |         }
 62 |     }
 63 | }
 64 | 
 65 | 
 66 | 
 67 | 
 68 | 
 69 | 
 70 | @each $sel in ('#markdown-toc', '.typo pre', '.tag-list a', '#tweet .tweet-item') {
 71 |     @media screen and (max-width: 500px){
 72 |         #{$sel}{
 73 |             box-shadow: 0 0 0 1px $border-color;
 74 |             border: none!important;
 75 |         }
 76 |     }
 77 | 
 78 |     @media screen and (min-resolution: 2dppx) and (max-width: 500px){
 79 |         #{$sel}{
 80 |             box-shadow: 0 0 0 0.5px $border-color;
 81 |         }
 82 |     
 83 |     }
 84 |     
 85 |     @media screen and (min-resolution: 3dppx) and (max-width: 500px){
 86 |         #{$sel}{
 87 |             box-shadow: 0 0 0 0.333333px $border-color;
 88 |         }
 89 |     }
 90 |     
 91 | }
 92 | 
 93 | 
 94 | 
 95 | #vcomments {
 96 |     margin-top: 100px;
 97 | }
 98 | 
 99 | #vcomments .vempty {
100 |     font-size: .14rem;
101 | }
102 | 
103 | #vcomments .vinput {
104 |     font-size: .14rem!important;
105 | }
106 | 
107 | i.icon {
108 |     margin-right: .3em;
109 | }
110 | 
111 | .loading {
112 |     width: 100%;
113 |     background-image: url(/site/assets/images/loading.gif);
114 |     background-repeat: no-repeat;
115 |     background-position: center center;
116 |     height: 300px;
117 | }


--------------------------------------------------------------------------------
/_posts/web/css/2015-09-10-css-flex.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: CSS flex 布局
  4 | category: Web
  5 | pid: css 
  6 | ---
  7 | 
  8 | - toc
  9 | {:toc}
 10 | 
 11 | ```html
 12 | <div class="container">
 13 |     <div class="item"></div>
 14 |     <div class="item"></div>
 15 |     <div class="item"></div>
 16 | </div>
 17 | ```
 18 | 
 19 | <div align="center"><img src="https://mdn.mozillademos.org/files/3739/flex_terms.png"  /></div>
 20 | 
 21 | flex容器存在两根轴：水平的主轴（main axis）和垂直的交叉轴（cross axis）
 22 | 
 23 | ## 容器的属性
 24 | 
 25 | - flex-direction
 26 | - flex-wrap
 27 | - flex-flow
 28 | - justify-content
 29 | - align-items
 30 | - align-content
 31 | 
 32 | ### flex-direction
 33 | 
 34 | 决定了主轴的方向，可选值：
 35 | 
 36 | - row
 37 | - row-reverse
 38 | - column
 39 | - column-reverse
 40 | 
 41 | ### flex-wrap
 42 | 
 43 | 当容器内的元素的宽度或者高度之和大于容器的宽度或高度的时候，这个属性决定容器类元素是否折行，以及如何折行。
 44 | 
 45 | 有三个值可选：
 46 | 
 47 | - nowrap：不折行，容器内的弹性子元素的宽度或者高度会被压缩，以至于容器能够容纳所有子元素
 48 | - wrap：折行，放不下的元素折行在下面（flex-direction:row）或者右面（flex-direction:column）显示
 49 | - wrap-reverse：折行，放不下的元素折行在上面（flex-direction:row）或者左面（flex-direction:column）显示
 50 | 
 51 | ### flex-flow
 52 | 
 53 | 这个属性是 flex-direction 和 flex-flow 的简写形式。写法形如：`flex-flow:row wrap`
 54 | 
 55 | ### justify-content
 56 | 
 57 | 定义了子元素在主轴上的对齐方式，可选值为：
 58 | 
 59 | - flex-start
 60 | - flex-end
 61 | - center
 62 | - space-between：两端对其
 63 | - space-around：每个项目两侧具有同样的间隔
 64 | 
 65 | ### align-items
 66 | 
 67 | 定义了子元素在交叉轴上的对齐方式，可选值为：
 68 | - flex-start
 69 | - flex-end
 70 | - center
 71 | - baseline:以文字的基线对齐
 72 | - stretch:如果元素的高度或者宽度为 auto 将占满整个容器的高度（flex-direction:row）或者宽度（flex-direction:column）
 73 | 
 74 | ### align-content
 75 | 
 76 | 定义了多根轴线的对齐方式，可选值为：
 77 | 
 78 | - flex-start
 79 | - flex-end
 80 | - center
 81 | - space-between
 82 | - space-around
 83 | - stretch
 84 | 
 85 | 当存在多根轴线的时候，这个属性才生效，且设置了这个属性以后，align-items 将不起作用
 86 | 
 87 | ## 项目的属性
 88 | - order
 89 | - flex-grow
 90 | - flex-shrink
 91 | - flex-basis
 92 | - flex
 93 | - align-self
 94 | 
 95 | ### order
 96 | 
 97 | 定义项目的排列顺序。数值越小，排列越靠前，默认为0
 98 | 
 99 | ### flex-grow
100 | 
101 | 定义项目的放大比例，默认为0，即如果存在剩余空间，也不放大。如果所有项目的flex-grow属性都为1，则它们将等分剩余空间（如果有的话）。如果一个项目的flex-grow属性为2，其他项目都为1，则前者占据的剩余空间将比其他项多一倍。
102 | 
103 | 如果一个弹性元素其宽度为200px，其中包含两个元素，两个元素的宽度都是 50px 且 flex-grow 都是 1，那么这两个元素将平分余下的 100px ，所以结果是两个元素的实际宽度都是 100px。
104 | 
105 | ### flex-shrink
106 | 
107 | 属性定义了项目的缩小比例，默认为1，即如果空间不足，该项目将缩小。
108 | 
109 | 如果所有项目的flex-shrink属性都为1，当空间不足时，都将等比例缩小。如果一个项目的flex-shrink属性为0，其他项目都为1，则空间不足时，前者不缩小。
110 | 
111 | 如果一个弹性元素其宽度为200px，其中包含两个元素，两个元素的宽度都是 200px 且 flex-shrink 都是 1。因为两个元素一共超出了父元素 200px，所以这两个元素将缩小 100px ，所以结果是两个元素的实际宽度都是 100px。
112 | 
113 | 如果其中一个元素的  flex-shrink 是 0 另外一个是 1，那么  flex-shrink 为 1 的元素将独自减小 200px。
114 | 
115 | ### flex-basis
116 | 
117 | 取值同 width 属性，可以是具体的像素值，也可以是百分比，还可以是 auto ，默认是 auto。用于定义元素占据主轴的宽度。width 也可以描述元素的宽度，但如果同时设置了 width 和 flex-basis 那么 flex-basis 会覆盖 width 属性。
118 | 
119 | ### flex
120 | 
121 | flex-grow, flex-shrink 和 flex-basis 的简写形式，写法形如：`flex:1 1 auto`
122 | 
123 | ### align-self
124 | 
125 | 允许单个项目与其他项目有不同的对其方式，可以覆盖 align-items 属性。可选值如下：
126 | 
127 | - auto
128 | - flex-start
129 | - flex-end
130 | - center
131 | - baseline
132 | - stretch


--------------------------------------------------------------------------------
/_posts/unix/signal.md:
--------------------------------------------------------------------------------
  1 | ## 信号
  2 | 
  3 | ### signal
  4 | 
  5 | 
  6 | ### 信号集
  7 | 
  8 | ```
  9 | int sigemptyset (sigset_t *__set)
 10 | int sigfillset (sigset_t *__set)
 11 | int sigaddset (sigset_t *__set, int __signo)
 12 | int sigdelset (sigset_t *__set, int __signo)
 13 | ```
 14 | 
 15 | ### 信号掩码
 16 | 
 17 | 内核会为每一个进程维护一个信号掩码，即一组信号，并将阻塞这些信号向该进程进行传递，直到这些遭到阻塞的信号解除阻塞为止。
 18 | 
 19 | 有如下方式向信号掩码中添加信号：
 20 | 
 21 | 1. 当调用某信号处理程序时，可将引发调用的信号添加到信号掩码中。是否添加，取决于安装信号处理程序时的设置。
 22 | 2. 使用 `sigaction` 函数建立信号处理程序时，可以指定额外一组信号，在调用该处理程序的时候，将这些信号阻塞。目的就是为了避免该信号处理程序被其他信号打断。
 23 | 3. 使用 `sigprocmask` 系统调用，可以显式地向信号掩码中添加或移除信号。
 24 | 
 25 | ```c++
 26 | int sigprocmask (int __how, const sigset_t *__restrict __set, sigset_t *__restrict __oset);
 27 | ```
 28 | 
 29 | how 可以取3个常量，`SIG_BLOCK`，`SIG_UNBLOCK`，`SIG_SETMASK`，用于说明如何修改掩码。下面是一个例子，注释起来的部分，不会被 `SIGINT` 信号中断。
 30 | 
 31 | ```c++
 32 | sigset_t block_set, old_set;
 33 | 
 34 | sigemptyset(&block_set);
 35 | sigaddset(&block_set, SIGINT);
 36 | 
 37 | sigprocmask(SIG_BLOCK, &block_set, &old_set);
 38 | 
 39 | // code that should not be interrupted by SIGINT
 40 | 
 41 | sigprocmask(SIG_SETMASK, &old_set, nullptr);
 42 | ```
 43 | 
 44 | ### sigaction
 45 | 
 46 | ```c++
 47 | int sigaction (int __sig, const struct sigaction *__restrict __act,
 48 | 		      struct sigaction *__restrict __oact);
 49 | 
 50 | struct sigaction{
 51 |     __sighandler_t sa_handler;
 52 | 
 53 |     /* Additional set of signals to be blocked.  */
 54 |     __sigset_t sa_mask;
 55 | 
 56 |     /* Special flags.  */
 57 |     int sa_flags;
 58 | 
 59 |     /* Restore handler.  */
 60 |     void (*sa_restorer) (void);
 61 | };
 62 | ```
 63 | 
 64 | `sa_mask` 字段定义一组信号，在调用 `sa_handler` 所定义的处理程序时，阻塞该组信号。另外，引发中断的信号，也将自动加入信号掩码中。因此，同一个信号多次抵达，不会递归调用自己。
 65 | 
 66 | ### 等待信号
 67 | 
 68 | ```c++
 69 | int pause();
 70 | ```
 71 | 
 72 | 调用 `pause` 将暂停进程的执行，直到信号处理器中断该调用为止。
 73 | 
 74 | 
 75 | ### 信号处理函数的设计
 76 | 
 77 | 1. 在信号处理函数内设置某个全局变量，在主程序中周期性轮询此变量。
 78 | 2. 创建一个管道，信号处理函数中向管道中写入数据，在主函数中监听管道的文件描述符。
 79 | 
 80 | 
 81 | ### 实现 `abort`
 82 | 
 83 | ```c++
 84 | void abort(){
 85 |     sigset_t mask;
 86 |     struct sigaction action{};
 87 | 
 88 |     sigaction(SIGABRT, nullptr, &action);
 89 |     if(action.sa_handler == SIG_IGN){
 90 |         action.sa_handler = SIG_DFL;
 91 |         sigaction(SIGABRT, &action, nullptr);
 92 |     }
 93 |     if(action.sa_handler == SIG_DFL){
 94 |         fflush(nullptr);
 95 |     }
 96 | 
 97 |     // block other signal excepting SIGABRT
 98 |     sigfillset(&mask);
 99 |     sigdelset(&mask, SIGABRT);
100 |     sigprocmask(SIG_SETMASK, &mask, nullptr);
101 |     raise(SIGABRT);
102 | 
103 |     // process caught SIGABRT and returned
104 | 
105 |     fflush(nullptr);
106 |     action.sa_handler = SIG_DFL;
107 |     sigaction(SIGABRT, &action, nullptr);
108 |     sigprocmask(SIG_SETMASK, &mask, NULL);
109 |     raise(SIGABRT);
110 | }
111 | ```
112 | 
113 | 1. 如果当前 `SIGABRT` 信号被忽略，那就修改为默认处理函数
114 | 2. 如果是默认处理函数，那就刷新标准 IO 的缓冲区，因为 `SIGABRT` 信号的默认动作是退出进程，需要在此之前刷新标 IO 的缓冲区。
115 | 3. 阻塞除了 `SIGABRT` 之外的其他信号，防止其他信号打断 `SIGABRT` 的处理函数
116 | 4. 使用 `raise` 向当前进程发送 `SIGABRT` 信号
117 | 5. 如果还会返回回来，说明调用了用户自定义的处理函数。这期间可能还做了一些 IO 操作，因此需要刷新
118 | 6. 把处理函数设置为默认，然后再次发送信号。这一次，一定会调用默认处理函数。
119 | 
120 | 


--------------------------------------------------------------------------------
/_posts/rec/2019-09-05-FM.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: 论文阅读 - Factorization Machines
 4 | category: 推荐系统
 5 | tag: 推荐系统
 6 | ---
 7 | 
 8 | 本文为阅读论文 Factorization Machines 时记下的笔记。
 9 | 
10 | - *
11 | {:toc}
12 | 
13 | ## 线性模型
14 | 
15 | 线性模型，如 logistics regression 仅学习到输入特征的权重，无法利用组合特征。可以将特征彼此相乘，给线性模型引入非线性特征。如下式所示：
16 | 
17 | $$
18 | \hat{y}(x) := \underbrace {w_0 + \sum_{i=1}^{n} w_i x_i }_{\text{线性回归}} + \underbrace {\sum_{i=1}^{n} \sum_{j=i+1}^{n} w_{ij} x_i x_j}_{\text{交叉项（组合特征）}}
19 | $$
20 | 
21 | 如果输入特征 $x$ 的维度 $\vert x \vert = n$，整个模型的参数量为 $1 + n + n^2$。上式中交叉项 $x_ix_j$ 的系数 $w_{ij}$ 需要依赖特征 $x_i$ 和 $x_j$ 来训练得出。当输入向量 $x$ 很稀疏的时候。比如 $x$ 是使用 bag-of-word 表示的文档。当特征 $x_i$ 和 $x_j$ 没有同时出现时，$w_{ij}$ 就得不到训练。因此对于数据稀疏的场景，交叉项的参数矩阵 $\mathbf{w}$ 得不到充分训练。 
22 | 
23 | ## FM
24 | 
25 | FM (Factorization Machine) 的思想是将组合特征的参数 $\mathbf{w}$ 进行矩阵分解，即 $\mathbf{w} = \mathbf{v}^T \mathbf{v}$。如此以来 $\mathbf{w}$ 可以由一个较小的句子 $\mathbf{v}$ 来表示。其中 $\mathbf{w}_{ij}=\mathbf{v}_i·\mathbf{v}_j$，即组合特征 $x_ix_j$ 的系数由为特征对应的隐向量 $\mathbf{v}_i$ 和 $\mathbf{v}_j$ 的内积。
26 | 
27 | FM 模型就可以表示为：
28 | 
29 | $$
30 | \hat{y}(\mathbf{x}) := w_0 + \sum_{i=1}^{n} w_i x_i + \sum_{i=1}^{n} \sum_{j=i+1}^{n} \langle \mathbf{v}_i, \mathbf{v}_j \rangle x_i x_j
31 | $$
32 | 
33 | 其中尖括号表示两个向量内积：
34 | 
35 | $$
36 | \left\langle\mathbf{v}_{i}, \mathbf{v}_{j}\right\rangle :=\sum_{f=1}^{k} v_{i, f} \cdot v_{j, f}
37 | $$
38 | 
39 | 如果隐向量 $\mathbf{v}_i$ 的维度为 $k$，输入特征 $x$ 维度为 $n$，上面式子中第二项的时间复杂度是 $O(kn^2)$。不过这一项在计算的时候可以进行化简：
40 | 
41 | 
42 | $$
43 | \sum_{i=1}^n \sum_{j=i+1}^n \langle \mathbf{v}_i, \mathbf{v}_j \rangle x_i x_j = \frac{1}{2} \sum_{f=1}^k \left(\left( \sum_{i=1}^n v_{i, f} x_i \right)^2 - \sum_{i=1}^n v_{i, f}^2 x_i^2 \right)
44 | $$
45 | 
46 | 下面是证明过程：
47 | 
48 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/08/29/5d67ba5a451253d1784a9634.jpg)
49 | 
50 | 证明过程不难理解，注意下面几点：
51 | 
52 | - 第一步：注意第二个 $\sum$ 符号的起始值
53 | - 第二步: 把向量内积展开成相乘并求和
54 | - 第三步：提取公因式
55 | - 第四步：改变符号得到 $\sum$ 的平方项
56 | 
57 | ## FM 特点
58 | 
59 | 从参数量上来看，FM 模型将组合特征的参数量大幅下降，从 $n * (n-1) / 2$ 降到 $n * k$。
60 | 
61 | 另外，采用类似于矩阵分解的策略，交叉项系数 $\mathbf{w}_{ij}$ 原本只能通过 $x_i$ 和 $x_j$ 训练得出，如果这两个特征没有同时出现过，则得出的 $\mathbf{w}_{ij}$ 无意义。在 FM 模型中 $\mathbf{w}_{ij}$ 由 $\mathbf{v}_i$ 和 $\mathbf{v}_j$ 内积得来，而 $\mathbf{v}_i$ 可以通过任何包含特征 $x_i$ 的实例进行学习。对于样本中不存在的特征组合，FM 也能进行泛化。
62 | 
63 | ## FM 训练
64 | 
65 | 如果用 FM 做回归，可使用 MSE 作为损失函数。用于分类，就使用 logit loss，然后使用 SGD 训练即可。梯度计算如下：
66 | 
67 | $$
68 | \frac{\partial}{\partial \theta} \hat{y}(\mathbf{x})=\left\{\begin{array}{ll}{1,} & {\text { if } \theta \text { is } w_{0}} \\ {x_{i},} & {\text { if } \theta \text { is } w_{i}} \\ {x_{i} \sum_{j=1}^{n} v_{j, f} x_{j}-v_{i, f} x_{i}^{2},} & {\text { if } \theta \text { is } v_{i, f}}\end{array}\right.
69 | $$
70 | 
71 | ## FM 和 SVMs 的比较
72 | 
73 | 使用多项式核的 SVMs 的模型可以写成下面这样：
74 | 
75 | $$
76 | \begin{aligned} \hat{y}(\mathrm{x})=w_{0}+\sqrt{2} \sum_{i=1}^{n} w_{i} x_{i} &+\sum_{i=1}^{n} w_{i, i}^{(2)} x_{i}^{2} \\ &+\sqrt{2} \sum_{i=1}^{n} \sum_{j=i+1}^{n} w_{i, j}^{(2)} x_{i} x_{j} \end{aligned}
77 | $$
78 | 
79 | 这里 SVMs 和 FM 用到的特征完全一样，唯一的区别就是交叉项的系数。因为 SVMs 中交叉项系数 $\mathbf{w}_{ij}$ 依赖 $x_i$ 和 $x_j$ 学习出来，SVM 不能用在数据稀疏的场景下。而 FM 可以使用极度稀疏的数据来学习参数。
80 | 
81 | ## 总结
82 | 
83 | 当数据很稀疏时，组合特征的参数难以学习到，FM 使用基于矩阵分解的策略，组合特征的系数依然能够有效估计，而且可泛化到未观察到的组合特征。


--------------------------------------------------------------------------------
/_posts/rec/2019-09-17-item-sim-models.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: Item Similarity Model
 4 | category: 推荐系统
 5 | tag: 推荐系统
 6 | ---
 7 | 
 8 | - *
 9 | {:toc}
10 | 
11 | 
12 | 
13 | ## Item-based CF
14 | 
15 | 基于 user-item 评分矩阵，利用 cosine 或者 Pearson correlation 来计算 item 间的相似度。user $u$ 对 item $i$ 的评分估计值为：
16 | 
17 | $$
18 | \hat{y}_{u i}=\sum_{j \in \mathcal{R}_{u}} r_{u j} s_{i j}
19 | $$
20 | 
21 | 其中 `$\mathcal{R}_{u}$` 是 user $u$ 所有评分过的 item 集合，`$s_{i j}$` 是 item $i$ 和 item $j$ 的做了标准化后的相似度。
22 | 
23 | 这种方法直接、易行，但是在相似度的度量上，由于矩阵的稀疏性，相似度计算效果不是特别好，推荐质量不够高。
24 | 
25 | 
26 | ## 矩阵分解
27 | 
28 | 矩阵分解的策略是将 user-item 评分矩阵分解为两个低秩的稠密矩阵:
29 | 
30 | ![<w,600px>](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/02/5d6c8098451253d1786aa283.jpg)
31 | 
32 | 在推荐时，可以使用 user 的向量乘上 item 矩阵，得到该 user 对所有 item 的评分的估计值，然后得出推荐结果。
33 | 
34 | 但是当 user 与新的 item 产生交互时，user 和 item 的向量应该发生变化。尤其是对 user 而言，要想具有实时性，user 最近的交互信息就一定要能够影响 user 的向量。但是矩阵分解的方法没法做到这种实时性。
35 | 
36 | 利用分解得到的 item 矩阵，也可以计算 item 之间的相似度，而且比直接用 user-item 评分矩阵来计算相似度效果更好。因此矩阵分解也可以用在传统的 item-based CF 中，用于计算 item 间的相似度。
37 | 
38 | ## SLIM (Sparse LInear Method)
39 | 
40 | 论文 _SLIM: Sparse Linear Methods for Top-N Recommender Systems_ 中提出一种方法直接学习出 item-item 间的相似度矩阵。
41 | 
42 | 在约束条件下，最小化下式中的 $L$ :
43 | 
44 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/10/10/5d9ecc02451253d17814b363.jpg)
45 | 
46 | $$
47 | \hat{y}_{u i}=\sum_{j \in \mathcal{R}_{u}} r_{u j} s_{i j}
48 | $$
49 | 
50 | 其中 `$S \in \mathbb{R}^{I \times I}$` 是 item 间的相似度矩阵，加入 L2 正则是为了避免过拟合，加入 L1 正则化是希望相似度矩阵尽可能地稀疏，因为相似的 item 不应该很多。$S \ge 0$ 是因为相似度应该介于 0~1 之间。`$diag(\mathbf{S})$` 则是要求 item 和自己的相似度为 0。
51 | 
52 | 利用 user-item 评分矩阵中已有的评分数据来上上式最小化，可以学习得到一个相似度矩阵 $S$。
53 | 
54 | SLIM 模型的缺点很明显，矩阵 $S$ 的规模很大，训练起来很慢。另外只有 item $i$ 和 item j 同被一个 user 评分过，$S_{ij}$ 才能得到学习。
55 | 
56 | ## FISM (Factored Item Similarity Model)
57 | 
58 | 出自论文 _FISM: Factored Item Similarity Models for Top-N Recommender Systems_。
59 | 
60 | 如果将 item-item 相似度矩阵分解为两个低秩矩阵相乘，即 $S = PQ$。那么 item $i$ 和 item $j$ 之间的相似度表示为 $sim(i,j)=p_i · q_j^T$。
61 | 
62 | 如此以来 user $u$ 对 item $i$ 的评分可以表示为：
63 | 
64 | $$
65 | \hat{r}_{u i}=b_{u}+b_{i}+\sum_{j \in \mathcal{R}_{u}} \mathbf{p}_{j} \mathbf{q}_{i}^{T}
66 | $$
67 | 
68 | $b_u$ 和 $b_i$ 为 user 和 item 的 bias，其中 `$\mathcal{R}_{u}$` 是 user $u$ 所有评分过的 item 集合，这里采用的可能是隐式反馈，集合中的 item 的评分都是 1，这是为啥没有评分值 `$r_{ui}$` 的原因。
69 | 
70 | 优化目标为：
71 | 
72 | ![<w,450px>](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/10/10/5d9ed32e451253d1781c1095.jpg)
73 | 
74 | ## NAIS (Neural Attentive Item Similarity)
75 | 
76 | 论文 _NAIS: Neural Attentive Item Similarity Model for Recommendation_ 在 FISM 的基础做了改进，加入了 Attention 机制。
77 | 
78 | 这里作者将 $p$, $q$ 都视为 item 的 Embedding，作者认为用户评分过的 item 的 Embedding 的均值可以作为 user 的 Embedding。这样以来评分 `$\hat{y}_{u i}$` 的计算就很直接了，user embedding 乘上 item embedding 即可。
79 | 
80 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/10/10/5d9eda1c451253d1782357e1.jpg)
81 | 
82 | 想象一下，如果 item 是一个衣服，那么在表示用户时，用户购买的衣服的信息就更重要一些。所以这里给用户评分过的 item 加一个权重，加权得到用户的 embedding。
83 | 
84 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/10/10/5d9ed7b3451253d178205ee2.jpg)
85 | 
86 | 加入 Attention 之后对评分值得估计就变成了这样：
87 | 
88 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/10/10/5d9edbea451253d1782664ae.jpg)
89 | 


--------------------------------------------------------------------------------
/_posts/machine_learning/2019-03-10-RNN.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: 循环神经网络
 4 | category: 机器学习
 5 | math: true
 6 | ---
 7 | 
 8 | 本文是阅读 Hands-On Machine Learning with Scikit-Learn and TensorFlow 第 14 章记录的笔记，总结了常见基础 RNN，LSTM 和 GRU 的网络结构，并描述了它们为什么要那样设计。
 9 | 
10 | ## RNN
11 | 
12 | Recurrent neural networks (RNN) 一种号称能够预测未来的网络模型，其实质是输入一个序列，预测接下来的序列。基础的 RNN 的模型非常恨简单，他看起来像是一个全连接网络（下图左），它的输入由两部分构成，当前输入 $x_{(t)}$ 以及上一个时刻的输出 $y_{(t-1)}$。
13 | 
14 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/10/06/5d99a48e451253d1789e19fb.jpg)
15 | 
16 | 把序列中的各个元素 $x_{(i)}$ 连同上一时刻的输出 $y_{(i-1)}$ 一并输入给 RNN，得到新的输出 $y_{(i)}$。连同此输出再与序列中下一个元素一并输入 RNN，再次产生新的输出。整个过程就像编程语言中的 for 循环一样，在对一个序列进行处理是，每次循环都用到了前一次循环的状态，以及序列中下一个元素。
17 | 
18 | 
19 | RNN 的数学表达式如下：
20 | 
21 | ![<ml,0><width,500px>](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/10/06/5d99a6fb451253d1789e6141.jpg)
22 | 
23 | 虽然 RNN 的结构让它可以处理无限长的序列，看起来能够捕获跨度很长的模式，但受限于 RNN 简单的结构，序列信息在每一个 time step 都会丢失，RNN 往往也只能捕获短距离的模式。为了解决信息遗忘的问题，很多 RNN 的该键版本被提出，比如 LSTM、GRU，这些改进版本都引入了长期记忆模块。这些具有长时记忆模块的 RNN 结构在实践中被证明很有用，基础版本的 RNN 已经不在被使用了，现在提到 RNN 人们首先想到的会是 LSTM 和 GRU。
24 | 
25 | ## LSTM
26 | 
27 | Long Short-Term Memory (LSTM) 于 1997 年被提出，之后经过一些改进。它引入长时记忆模块，能够捕获到序列中长距离的依赖关系，在训练中收敛速度比基础版本的 RNN 快。LSTM 的结构如下图所示：
28 | 
29 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/10/06/5d99a7a6451253d1789e70b6.jpg)
30 | 
31 | 它的状态分为两部分，$h_{(t)}$ 和 $c_{(t)}$ , $h_{(t)}$ 是短时状态，$c_{(t)}$ 是长期状态，这里 $c$ 和 $h$ 都是向量。其主要思想是，LSTM 能够学习把什么存入长期状态，把什么从长期状态中扔掉。$c_{(t-1)}$ 先经过一个遗忘门，丢去一些记忆，然后再加上一些信息，得到新的状态 $c_{(t)}$。新的状态 $c_{(t)}$ 会经过一个 $tanh$ 函数，得到的向量被 output gate 选择后做为当前 time step 的输出，和新的短时状态 $h_{(t)}$。
32 | 
33 | 可以看到 LSTM 的输出是依托于长期状态 $c_{(t)}$ 的，而 $c_{(t)}$ 在每个 time step 会丢掉一些信息，再加入一些信息。控制如何丢弃，如何加入，最终输出什么，由 3 个门控制。加入什么信息由 $g_{(t)}$ 控制。而这些的输入都是 $x_{(t)}$ 和 $h_{(t-1)}$。
34 | 
35 | $x_{(t)}$ 和 $h_{(t-1)}$ 经过 4 个全连接网络输出 4 个向量，这 4 个向量有不同的目的：
36 | 
37 | $g_{(t)}$ 对应的全连接网络分析当前输入 $x_{(t)}$ 和前一个短期状态 $h_{(t-1)}$ 之间的关系，得到一个输出用于向长期状态中增加信息。
38 | 
39 | 其他的三个门 $f_{(t)}$、$i_{(t)}$、$o_{(t)}$ 分别被称为遗忘门、输入门、输出门，它们是由 sigmoid 激活函数输出的，其元素的值介于 0~1 之间。
40 | 
41 | - 遗忘门，控制长期状态中那些部分需要被遗忘。$f_{(t)}$ 和 $c_{(t-1)}$ 做对应元素向量，如果遗忘门的中元素为 1，那就是不遗忘，如果为 0，那就是遗忘。
42 | - 输入门，控制 $g_{(t)}$ 中那些部分加入长期状态中。
43 | - 输出门，在 $c_{(t)}$ 经过 $tanh$ 后，输出门控制那些信息会被输出。 
44 | 
45 | LSTM 能够识别到一个重要的输入，并将该输入的信息存入长期状态中。状态 $c$ 保留长期信息用于之后使用，并在合适的时刻将长期状态中的部分信息遗忘掉。这就是 LSTM 能够捕获序列中长距离模式的原因。
46 | 
47 | LSTM 的数学表达式如下：
48 | 
49 | ![<ml,0><width,340px>](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/10/06/5d99a99b451253d1789eae4b.jpg)
50 | 
51 | ### Peephole connections
52 | 
53 | 从前面的描述可以看出，LSTM 在计算各种门的输出时，只用了 $x_{(t)}$ 和 $h_{(t-1)}$，但有人觉得如果能够用到 $c_{(t-1)}$ 岂不更好。因此在 2000 年研究者提出了一个改进，将  $c_{(t-1)}$ 加入输入门和遗忘门的计算，把 $c_{(t)}$ 加入输出门的计算。
54 | 
55 | ## GRU
56 | 
57 | Gated Recurrent Unit (GRU) 于 2014 年被提出，是一种简化版本的 LSTM。其模型结构如下：
58 | 
59 | 
60 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/10/06/5d99a077451253d1789d9563.jpg)
61 | 
62 | 相比于 LSTM，GRU 有以下改变：
63 | 
64 | - 只使用了一个状态 $h_{(t)}$。
65 | - 使用一个门 $z_{(t)}$ 同时控制输出门和遗忘门，当遗忘了信息时（$z_{(t)}$ 为 0），那么就会输入信息（1-$z_{(t)}$ 为 1，注意图中黑色写着 -1 的圆圈）。当状态中的某个维度被遗忘后，就一定会加入新的信息。
66 | - 去除了输出门，但是加入了新控制门 $r_{(t)}$ 对参与运算的状态 $h_{(t-1)}$ 做了过滤。
67 | 
68 | GRU 的数学表达式如下：
69 | 
70 | ![<width,360px><ml,0>](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/10/06/5d99a2b1451253d1789ddc3d.jpg)
71 | 
72 | 
73 | 


--------------------------------------------------------------------------------
/_posts/network/2020-07-23-计算机网络.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: 计算机网络知识总结
  4 | category: 计算机网络
  5 | permalink: 2020/network/
  6 | published: false
  7 | ---
  8 | 
  9 | ## 网络模型
 10 | 
 11 | ### OSI 七层模型
 12 | 
 13 | 学习计算机网络的时候，我们都会学到网络中的协议是分层的，每层负责处理的事情不同。通常课本上会讲到 OSI 的七层模型，其中 OSI 是指 Open Source Interconnect。这七层从下到上分别为：
 14 | 
 15 | 1. 物理层
 16 | 2. 数据链路层
 17 | 3. 网络层
 18 | 4. 运输层
 19 | 5. 会话层
 20 | 6. 表示层
 21 | 7. 应用层
 22 | 
 23 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2020/08/14/2020-08-14-205101.png)
 24 | 
 25 | **应用层**
 26 | 
 27 | 网络可以用来发送数据，但是接收到一块数据后，我该如何知道这些数据该怎么解读呢？比如数据可以是压缩过的，该如何知道压缩格式呢？多次发送的数据可能混在一起了，该如何区分开这些数据呢？应用层协议为此制定了一套标准，有了这个标准，就像人类有了语言一样，使用同种语言的人就可以交流了。比如下面是一个 HTTP 的请求报文：
 28 | 
 29 | ```
 30 | GET /index.html HTTP/1.1\r\n
 31 | Host: 127.0.0.1:8002\r\n
 32 | \r\n
 33 | ```
 34 | 
 35 | 基于 HTTP 协议的规定，数据接收方可以准确地获知对方的意思。
 36 | 
 37 | 常见的应用层协议有 HTTP (hypertext transfer protocol)、DNS (domain name system)、FTP (file transfer protocol)、IMAP(Internet massage access protocol)、SMTP (simple mail transfer protocol) 等。
 38 | 
 39 | **表示层**
 40 | 
 41 | 表示层用来对数据做编解码，数据压缩与解压缩等操作，处理诸如大小端转换的问题。
 42 | 
 43 | **会话层**
 44 | 
 45 | 管理一个会话（两个设备之间的网络连接），完成连接的建立、保持、断开等功能。
 46 | 
 47 | **运输层**
 48 | 
 49 | 运输层协议支持数据在跨越多个网络的两个机器之间传输，运输层不关心发送的是什么东西，它只保存数据的发送与接收。就像一辆卡车，你把数据扔给它并指定目的地，它就给你运输，并保证数据在运输过程中不会出错。
 50 | 
 51 | 目前工作在运输层的有 TCP 和 UDP 两个协议。其中 TCP 提供可靠的数据传输，它通过一些复杂的机制，保证数据能够送达对方。而 UDP 协议，只是尽力传输地，数据有可能会丢失。
 52 | 
 53 | **网络层**
 54 | 
 55 | 互联网是有很多个小的网络互联而成的，网络层协议用来实现数据跨网络的传输。网络中存在很多岔路，网络层协议提供了路径选择（路由）功能，不同的网络单次能够发送的数据量不同，因此网络层协议实现了数据切分与拼装的功能。
 56 | 
 57 | 可以把网络层协议的工作想象成一些汽车、飞机、轮船、手推车等运输工具，数据在网络中传输，就是利用这些工具来完成数据的运输。网络层协议就要负责装货和卸货，有时候还需要把货物重新打包一下。
 58 | 
 59 | 网络层的常见协议有 ICMP，ARP。其中路由协议有 OSPF（开放最短路径优先）、BGP（Border Gateway Protocol）、RIP（Routing Information Protocol）等。
 60 | 
 61 | **数据链路层**
 62 | 
 63 | 数据链路层提供点到点的传输服务，在两个直接相连的节点间传输数据。链路层协议控制两个直接相连的设备之间连接的建立和断开。常见的协议有 PPP (Point-to-Point Protocol) 运用在广域网上。局域网中，通常使用以太网，其中用到的协议是 CSMA/CD
 64 | 
 65 | **物理层**
 66 | 
 67 | 物理层协议定义了物理特性和数字之间的转换方式，并且规定了各种接口的标准，比如光纤、以太网、串口等。
 68 | 
 69 | ### TCP/IP 四层模型
 70 | 
 71 | 但是在实际应用中的计算机网络，通常使用 TCP/IP 模型，这是一个四层模型，它和 OSI 大致可以对应起来，如下图所示：
 72 | 
 73 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/2020/08/14/2020-08-14-204347.png)
 74 | 
 75 | 
 76 | ## 物理层
 77 | 
 78 | 物理层涉及到传输介质、物理层设备、编码方式、通信原理等知识，涉及信号的调制与解调、数字信号和模拟信号的转换等内容。
 79 | 
 80 | 
 81 | ## 网络层
 82 | 
 83 | 网络层中包含 IP 协议，ARP 协议，ICMP 协议，还有一些路由算法和路由交换协议。
 84 | 
 85 | ### IP 协议
 86 | 
 87 | 
 88 | 
 89 | ### NAT 的原理
 90 | 
 91 | 因为 IPv4 的地址是 32 位，因此只有 40 多亿个唯一的 IP 地址，目前这些地址已经显得不太够用了。每个人一部手机+一台电脑，这就已经 100 多亿了。一个子网中常常只有和互联网连接的那个设备，通常是路由器，才有一个唯一的 IP，而子网内部机器的 IP 地址通常是 192.168.x.x 或者 10.1.x.x，这个地址是内网的地址。在一个子网中，这个 IP 是固定的，但是在很多子网中，都在使用 192.168.x.x 这样的地址。此时需要使用 NAT 网络地址穿越。
 92 | 
 93 | 其原理很简单，比如子网中存在 A B 两台设备，其 IP 分别为：
 94 | 
 95 | ```
 96 | A: 192.168.1.100
 97 | B: 192.168.1.101
 98 | 
 99 | 路由器: 127.57.71.67
100 | ```
101 | 
102 | 此时 A 使用 3000 和 8.8.8.8:53 连接，即：
103 | 
104 | ```
105 | 192.168.1.100:3000   ->   8.8.8.8:53
106 | ```
107 | 
108 | 路由器收到此连接后会先做改写，然后转发，改写后内容是：
109 | 
110 | ```
111 | 127.57.71.67:4000   ->  8.8.8.8:53
112 | ```
113 | 
114 | 同时记录一个端口映射关系：
115 | 
116 | ```
117 | 192.168.1.100:3000  <->  4000
118 | ```
119 | 
120 | 这样连接双方都具有了网络上的唯一地址，路由器和 8.8.8.8:53 建立了连接，当对方发来响应的时候，路由器发现是发送到自己的 4000 端口的，于是它从映射表中找到 `192.168.1.100:3000`，并把数据发送过去。
121 | 
122 | 以上就是 NAT 的原理了，它把子网中的一个 IP:PORT 映射到自己的某个端口上，代子网中的所有机器去和外边的机器进行连接。


--------------------------------------------------------------------------------
/site/assets/css/scss/highlight.scss:
--------------------------------------------------------------------------------
  1 | code[class*="language-"],
  2 | pre[class*="language-"] {
  3 | 	color: #393A34;
  4 | 	font-family: "Consolas", "Bitstream Vera Sans Mono", "Courier New", Courier, monospace;
  5 | 	direction: ltr;
  6 | 	text-align: left;
  7 | 	white-space: pre;
  8 | 	word-spacing: normal;
  9 | 	word-break: normal;
 10 | 	
 11 | 
 12 | 	-moz-tab-size: 4;
 13 | 	-o-tab-size: 4;
 14 | 	tab-size: 4;
 15 | 
 16 | 	-webkit-hyphens: none;
 17 | 	-moz-hyphens: none;
 18 | 	-ms-hyphens: none;
 19 | 	hyphens: none;
 20 | }
 21 | 
 22 | 
 23 | pre[class*="language-"]::-moz-selection, pre[class*="language-"] ::-moz-selection,
 24 | code[class*="language-"]::-moz-selection, code[class*="language-"] ::-moz-selection {
 25 | 	background: #C1DEF1!important;
 26 | }
 27 | 
 28 | pre[class*="language-"]::selection, pre[class*="language-"] ::selection,
 29 | code[class*="language-"]::selection, code[class*="language-"] ::selection {
 30 | 	background: #C1DEF1!important;
 31 | }
 32 | 
 33 | /* Code blocks */
 34 | pre[class*="language-"] {
 35 | 	padding: 1em;
 36 | 	overflow: auto;
 37 | }
 38 | 
 39 | 
 40 | .token.comment,
 41 | .token.prolog,
 42 | .token.doctype,
 43 | .token.cdata {
 44 | 	color: #008000;
 45 | }
 46 | 
 47 | .token.namespace {
 48 | 	opacity: .7;
 49 | }
 50 | 
 51 | .token.string {
 52 | 	color: #A31515;
 53 | }
 54 | 
 55 | .token.punctuation,
 56 | .token.operator {
 57 | 	color: #393A34; /* no highlight */
 58 | }
 59 | 
 60 | .token.url,
 61 | .token.symbol,
 62 | .token.number,
 63 | .token.boolean,
 64 | .token.variable,
 65 | .token.constant,
 66 | .token.inserted {
 67 | 	color: #36acaa;
 68 | }
 69 | 
 70 | .token.atrule,
 71 | .token.keyword,
 72 | .token.attr-value,
 73 | .language-autohotkey .token.selector,
 74 | .language-json .token.boolean,
 75 | .language-json .token.number,
 76 | code[class*="language-css"] {
 77 | 	color: #0000ff;
 78 | }
 79 | 
 80 | .token.function {
 81 | 	color: #393A34;
 82 | }
 83 | 
 84 | .token.deleted,
 85 | .language-autohotkey .token.tag {
 86 | 	color: #9a050f;
 87 | }
 88 | 
 89 | .token.selector,
 90 | .language-autohotkey .token.keyword {
 91 | 	color: #00009f;
 92 | }
 93 | 
 94 | .token.important,
 95 | .token.bold {
 96 | 	font-weight: bold;
 97 | }
 98 | 
 99 | .token.italic {
100 | 	font-style: italic;
101 | }
102 | 
103 | .token.class-name,
104 | .language-json .token.property {
105 | 	color: #2B91AF;
106 | }
107 | 
108 | .token.tag,
109 | .token.selector {
110 | 	color: #800000;
111 | }
112 | 
113 | .token.attr-name,
114 | .token.property,
115 | .token.regex,
116 | .token.entity {
117 | 	color: #ff0000;
118 | }
119 | 
120 | .token.directive.tag .tag {
121 | 	background: #ffff00;
122 | 	color: #393A34;
123 | }
124 | 
125 | /* overrides color-values for the Line Numbers plugin
126 | * http://prismjs.com/plugins/line-numbers/
127 | */
128 | .line-numbers .line-numbers-rows {
129 | 	border-right-color: #a5a5a5;
130 | }
131 | 
132 | .line-numbers-rows > span:before {
133 | 	color: #2B91AF;
134 | }
135 | 
136 | /* overrides color-values for the Line Highlight plugin
137 | * http://prismjs.com/plugins/line-highlight/
138 | */
139 | .line-highlight {
140 | 	background: rgba(193, 222, 241, 0.2);
141 | 	background: -webkit-linear-gradient(left, rgba(193, 222, 241, 0.2) 70%, rgba(221, 222, 241, 0));
142 | 	background: linear-gradient(to right, rgba(193, 222, 241, 0.2) 70%, rgba(221, 222, 241, 0));
143 | }


--------------------------------------------------------------------------------
/_posts/cpp/2015-11-03-effective-cpp-46.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: 《Effective C++》条款 46 补充
  4 | category: C/C++
  5 | ---
  6 | 
  7 | 
  8 | ## 问题
  9 | 
 10 | 《Effective C++》条款 46 的标题是：需要类型转换时请为模板定义非成员函数。本节作者定义了一个有理数类，希望他能做如下运算：
 11 | 
 12 | ```cpp
 13 | Rational<int> a(1, 3);
 14 | Rational<int> b = a * a;
 15 | Rational<int> c = a * 3;
 16 | Rational<int> d = 3 * a;
 17 | ```
 18 | 
 19 | 类的定义如下：
 20 | 
 21 | ```cpp
 22 | template <typename T>
 23 | class Rational{
 24 | public:
 25 |     Rational(T numerator, T denominator=1): numerator_(numerator), denominator_(denominator){}
 26 |     T numerator() const{ return numerator_; }
 27 |     T denominator() const{ return denominator_; }
 28 | 
 29 | private:
 30 |     T numerator_;
 31 |     T denominator_;
 32 | };
 33 | ```
 34 | 
 35 | ## 解法
 36 | 
 37 | 为了实现 `b = a * a` 可以重载类的 `operator*` 方法：
 38 | 
 39 | ```cpp
 40 | Rational operator*(const Rational &rhs) const{
 41 |     Rational ret(numerator_ * rhs.numerator_, denominator_ * rhs.denominator_);
 42 |     return ret;
 43 | }
 44 | ```
 45 | 
 46 | 而要想让 `Retional` 类可以和 `int` 或者 `double` 等直接进行运算，如 `a * 3`，需要这里的 `3` 可以隐式转换为 `Retional`，因此 `Retional` 需要有一个可以接受单参数，且不能是 `explicit` 的构造函数。目前的类定义满足此要求。
 47 | 
 48 | 但是为了实现 `d = 3 * a`，以上的工作都失去了意义，为此需要定义如下运算符：
 49 | 
 50 | ```cpp
 51 | template <typename T>
 52 | Rational<T> operator*(const Rational<T> &lhs, const Rational<T> &rhs){
 53 |     return Rational<T>(lhs.numerator() * rhs.numerator(),
 54 |             lhs.denominator() * rhs.denominator());
 55 | }
 56 | ```
 57 | 
 58 | 这个时候，`b = a * a` 可以正常工作，但是 `c = a * 3` 和 `d = 3 * a` 会出错。原因很简单，模板在实例化的时候是不会做由 `int` 到 `Rational<int>` 的转换的。 为了支持这两种运算，可以定义如下模板函数：
 59 | 
 60 | ```cpp
 61 | template <typename T>
 62 | Rational<T> operator*(const T &lhs, const Rational<T> &rhs){
 63 |     return Rational<T>(lhs) * rhs;
 64 | }
 65 | 
 66 | template <typename T>
 67 | Rational<T> operator*(const Rational<T> &lhs, const T &rhs){
 68 |     return lhs * Rational<T>(rhs);
 69 | }
 70 | ```
 71 | 
 72 | 在这两个模板函数内部，显示地进行了 `T` 到 `Rational<T>` 的转换。
 73 | 
 74 | ## 更精简的解法
 75 | 
 76 | 如果 `T` 可以隐式转换为 `Rational<T>`，那么就只需要一个函数。为了能够隐式转换，这个函数不能是模板函数。但是此函数又必须支持多种类型，一种方法是把他定义在类里面。为了在类里面定义一个普通函数，它就只能是友元的。
 77 | 
 78 | ```cpp
 79 | template <typename T>
 80 | class Rational{
 81 |     friend Rational<T> operator*(const Rational<T> &lhs, const Rational<T> &rhs);
 82 | public:
 83 |     Rational(T numerator, T denominator=1): numerator_(numerator), denominator_(denominator){}
 84 |     //...
 85 | }
 86 | ```
 87 | 
 88 | 这里只在类里面做了声明，还缺少定义。于是在类外部写下如此定义：
 89 | 
 90 | ```cpp
 91 | template <typename T>
 92 | Rational<T> operator*(const Rational<T> &lhs, const Rational<T> &rhs) {
 93 |     // ...
 94 | }
 95 | ```
 96 | 
 97 | 这就再度把自己引入了错误的深渊。因为 `friend` 声明的函数不是一个模板函数，而上面却定义了一个模板函数。结果是友元函数，没有定义。
 98 | 
 99 | ```cpp
100 | friend Rational<T> operator*(const Rational<T> &lhs, const Rational<T> &rhs);
101 | ```
102 | 
103 | 解决的办法就是在类里面完成对友元函数的定义：
104 | 
105 | ```cpp
106 | template <typename T>
107 | class Rational{
108 |     friend Rational<T> operator*(const Rational<T> &lhs, const Rational<T> &rhs){
109 |         return Rational<T>(lhs.numerator() * rhs.numerator(),
110 |                            lhs.denominator() * rhs.denominator());
111 |     }
112 |     // ...
113 | }
114 | ```
115 | 
116 | 这样以来，在对类模板实例化的时候，就对这个函数进行实例化。
117 | 
118 | ## 总结
119 | 
120 | 在编写模板类的时候，如果需要支持隐式类型转换，那就不能依赖于模板函数，因为模板函数不会做隐式类型转换。此时需要定义一个非模板函数，并把它作为 `friend` 函数，并在类里面完成函数的定义。因为定义在类中的函数会是内联的，因此可以把具体的操作交给类的某个方法来完成。
121 | 


--------------------------------------------------------------------------------
/_posts/machine_learning/2019-03-04-train-dl.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: 训练深度网络
  4 | category: 机器学习
  5 | ---
  6 | 
  7 | 
  8 | - *
  9 | {:toc}
 10 | 
 11 | ## 优化器
 12 | 
 13 | ### Momentum
 14 | 
 15 | 模拟石头滚下山的状态。在平坦的函数平面上因为有加速度的存在，能够快速通过平坦区域。
 16 | 
 17 | ![width=400](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/07/18/5d3005e4451253d1786a41ca.jpg)
 18 | 
 19 | ```python
 20 | optimizer = keras.optimizers.SGD(lr=0.001, momentum=0.9)
 21 | ```
 22 | 
 23 | ### Nesterov Accelerated Gradient
 24 | 
 25 | ![width=400](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/07/18/5d3006a3451253d1786a4882.jpg)
 26 | 
 27 | 在计算新的梯度时，考虑到已经加入的动量。
 28 | 
 29 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/07/18/5d3006c9451253d1786a49aa.jpg)
 30 | 
 31 | ```python
 32 | optimizer = keras.optimizers.SGD(lr=0.001, momentum=0.9, nesterov=True)
 33 | ```
 34 | 
 35 | ### AdaGrad
 36 | 
 37 | ![width=400](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/07/18/5d3007c1451253d1786a53d3.jpg)
 38 | 
 39 | 梯度小的方向，大幅更新。梯度大的方向，小幅度更新。
 40 | 
 41 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/07/18/5d300828451253d1786a5898.jpg)
 42 | 
 43 | 上图中，水平方向较长，较平坦，梯度较小。竖直方向，梯度较大。常规的梯度下降法，会走蓝色路径。而 AdaGrad 会走橙黄色路径。
 44 | 
 45 | 但是 AdaGrad 不断地对梯度值进行累加，最终导致上面式子中 `s` 的值过大，更新越来越慢。 
 46 | 
 47 | ### RMSProp
 48 | 
 49 | ![width=400](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/07/18/5d3008cd451253d1786a5dea.jpg)
 50 | 
 51 | RMSProp 修复了 AdaGrad 的问题，通过引入一个衰退系数，让 `s` 仅仅累加最近的梯度。 
 52 | 
 53 | ```python
 54 | optimizer = keras.optimizers.RMSprop(lr=0.001, rho=0.9)
 55 | ```
 56 | 
 57 | ### Adam and Nadam
 58 | 
 59 | ![width=400](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/07/18/5d300a57451253d1786a6821.jpg)
 60 | 
 61 | Adam 综合了 RMSProp 和 Momentum。3 4 两个式子中 t 代表的是迭代次数，当迭代次数较小的时候，m 和 s 的值能够被放大，当迭代次数增大是分母也就很接近 1 了，m 和 s 的值就不会在被放大了。这是为了在迭代的初始时，m 和 s 的值为 0，通过这两个式子，可以对初试阶段进行加速。
 62 | 
 63 | ```python
 64 | optimizer = keras.optimizers.Adam(lr=0.001, beta_1=0.9, beta_2=0.999)
 65 | ```
 66 | 
 67 | Nadam 是在 Adam 中加入了 Nesterov Accelerated Gradient 中的思想。
 68 | 
 69 | ## 梯度消失 / 梯度爆炸
 70 | 
 71 | 误差梯度在反向传播的过程中，变得越来越小，最后近乎消失，这导致网络的前面的层对应的参数得不到更新。相反，梯度也可能变得越来越大，在反向传播的过程中，梯度越变越大，最终模型无法收敛。
 72 | 
 73 | <img src="https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/05/16/5cdd45bd697df1fd0cda4cfc.jpg" width="400">
 74 | 
 75 | 梯度消失的原因主要是使用 sigmoid 作为激活函数导致的，sigmoid 函数当输入很大或很小时，其梯度都接近于 0。
 76 | 
 77 | Relu 激活函数的问题在于，一旦某个 unit 输出小于 0，那么它之后就只会输出 0，而且梯度也会是 0，即 ReLU 也可能出现梯度消失的问题，此 unit 的权重将得不到更新。这个问题称为 Dead ReLUs。
 78 | 
 79 | 梯度爆炸常常出现在循环神经网络中。_为啥_
 80 | 
 81 | ## Batch Normalization
 82 | 
 83 | 使用 ReLU 及其变种，加上合适的参数初始化策略，在训练的初期可以很好地消除梯度消失/爆炸的问题，但不能保证在整个训练过程中都不出现梯度消失/爆炸的问题。Batch Normalization 对输入的整个 batch 的数据做标准化，可以持续减缓梯度消失/爆炸的问题。
 84 | 
 85 | Batch Normalization 需要调整的参数不多，`momentum` 用于计算动态调整的均值，它的值应该接近于 1。样本集越大，或者 batch-size 越小时，`momentum` 应该越接近于 1。
 86 | 
 87 | 如果在输入层之后紧接一个 batch normalization 层，对数据做标准化操作就可以不用显式地完成了。
 88 | 
 89 | ## 梯度裁剪
 90 | 
 91 | 梯度裁剪是限制梯度的大小不超过某个阈值。在 RNN 中梯度裁剪尤其重要，因为 RNN 常常出现梯度爆炸的问题。 
 92 | 
 93 | ```python
 94 | optimizer = keras.optimizers.SGD(clipvalue=1.0)
 95 | model.compile(loss="mse", optimizer=optimizer)
 96 | ```
 97 | 
 98 | 在 keras 中设置梯度裁剪尤其简单，以上代码将限制梯度的绝对值小于 1.0。对梯度的某个分量进行裁剪，会导致梯度方向的改变，比如原梯度为 `[100, 1]`， 裁剪后变为 `[1, 1]`，这极大地改变了梯度方向。要想保证梯度方向不变，可以对梯度的 L2 范数做限制，即限制梯度向量的模长。下面的设置保证梯度的模长不大于 1，否则各个分量都进行缩减，保证梯度方向不变。
 99 | 
100 | ```python
101 | optimizer = keras.optimizers.SGD(clipnorm=1.0)
102 | ```


--------------------------------------------------------------------------------
/_posts/web/2016-09-08-css-center.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: CSS 垂直居中
  4 | category: Web
  5 | ---
  6 | 
  7 | 
  8 | 
  9 | - *
 10 | {:toc}
 11 | 
 12 | <style>
 13 | .ex-container{
 14 |   border: 1px solid #999;
 15 | }
 16 | #ex-center-single-text{
 17 |   height: 150px;  
 18 | }
 19 | #ex-center-single-text .content{
 20 |   line-height: 150px;
 21 |   text-align:center;
 22 | }
 23 | </style>
 24 | 
 25 | 
 26 | 垂直居中，这是任何前端开发者都遇到的场景，也是大多数人都为之困惑的问题。记得当时来公司后，进行了一次笔试，其中一个便是用 CSS 实现垂直居中，我突然发现自己竟不能写出一种自信无误的实现方式。
 27 | 
 28 | 下面来总结一下 CSS 垂直居中的方式，对于 hack 气息较重的方法（比如使用 table，button 等）这里不再讨论了，这里主要谈谈现代 CSS 中实现垂直居中的方式。
 29 | 
 30 | 
 31 | 下面的示例中均采用下面这样的 HTML 结构：
 32 | 
 33 | ```html
 34 | <div class="container">
 35 |     <div class="content"></div>
 36 | </div>
 37 | ```
 38 | 
 39 | 
 40 | 
 41 | ## 基于 line-height 的解决方案
 42 | 
 43 | 如果 content 的内容是单行的文本，或者是一个图片，或者说内容的 display 属性是 `inline` 或者 `inline-block`，那么我们可以通过 `line-height` 属性来让其居中，最简单的方式是将 `.content` 的 `line-height` 和 `.container` 的 `height` 设为相同的值。
 44 | 
 45 | 
 46 | <div id="ex-center-single-text" class="ex-container">
 47 |     <div class="content">CSS 垂直居中</div>
 48 | </div>
 49 | 
 50 | CSS 代码：
 51 | 
 52 | ```css
 53 | .container{
 54 |   height: 150px;  
 55 | }
 56 | .container .content{
 57 |   line-height: 150px;
 58 |   text-align: center;
 59 | }
 60 | ```
 61 | 
 62 | ## 基于 padding 的解决方案
 63 | 
 64 | 给 `.container` 设置相同的上下内边距，内容自然就实现了垂直居中，这很好理解。
 65 | 
 66 | ## 基于绝对定位的解决方案
 67 | 
 68 | 使用绝对定位，并设置 `top: 50%; left: 50%;` 可以将 `.content` 的左上角定位至容器的中心点。目前还尚未实现居中，还需将将 `.content` 向上向左各移动一半的 `.content` 的高度和宽度。这个时候有两种实现方法：
 69 | 
 70 | ### 1. 使用负外边距移动内容
 71 | 
 72 | 如果 `.content` 的大小已知，比如是 `200px * 120px`，那么我们可以使用 `margin-top: -60px; margin-left: -100px` 来达成目标。最后的 CSS 代码为：
 73 | 
 74 | ```css
 75 | .container{
 76 |     position: relative;
 77 | }
 78 | .container .content{
 79 |     position: absolute;
 80 |     top: 50%;
 81 |     left: 50%;
 82 |     width: 200px;
 83 |     height: 120px;
 84 |     margin-left: -100px;
 85 |     margin-top: -60px;
 86 | }
 87 | ```
 88 | 
 89 | ### 2. 使用 translate 移动内容
 90 | 
 91 | 很多时候 `.content` 的宽高可能并不固定，此时可以使用 `transform` 中的 `translate` 来移动内容，这是因为 `translate(-50%, -50%)` 中的百分比是基于自身尺寸计算的，而非 margin 中那样基于父元素尺寸计算。因此对于内容不固定的情况，以下代码能轻松实现垂直居中：
 92 | 
 93 | ```css
 94 | .container{
 95 |     position: relative;
 96 | }
 97 | .container .content{
 98 |     position: absolute;
 99 |     top: 50%;
100 |     left: 50%;
101 |     transform: translate(-50%, -50%);
102 | }
103 | ```
104 | 
105 | 该方案的缺点是，使用了 translate 可能影响到其他的变形，且为了兼容较旧的浏览器，需要添加浏览器厂商前缀。
106 | 
107 | ## 基于视口单位的解决方案
108 | 
109 | 在弹出对话框或者类似的场景下，我们希望某元素能够居中于视口中。这个时候可以使用 fixed 定位，外加上面提到的 “基于绝对定位的解决方案” 中类似的方法来实现。
110 | 
111 | 此外你还有另外一种选择，那就是使用 `vh` 和 `vw` 这两个单位，`100vw` 就等于视口的宽度，也就是说 `1vw` 等于 1/100 的视口宽度，`vh` 也同理，`1vh` 等于 1/100 视口的高度。因此可以写出下列代码来将一个对话框在视口中居中：
112 | 
113 | ```css
114 | .dialog{
115 |     position: fixed;
116 |     margin-top: 50vh;
117 |     margin-left: 50vw;
118 |     transform: translate(-50%, -50%);
119 | }
120 | ```
121 | 
122 | ## 基于 flexbox 的解决方案
123 | 
124 | 有了 flexbox 之后会发现实现垂直居中实在不能太容易，因为你只需要将容器的 `display` 指定为 `flex`，然后让内容在主轴和交叉轴上居中就可以了。甚至直接将容器指定为 `flex` 将内容的 `margin` 设置为 `auto` 就可以了。
125 | 
126 | ```css
127 | .container{
128 |     display: flex;
129 | }
130 | .container .content{
131 |     margin: auto;
132 | }
133 | ```
134 | 
135 | 或者只需给容器元素设置：
136 | 
137 | ```css
138 | .container{
139 |     display: flex;
140 |     justify-content: center;
141 |     align-items: center;
142 | }
143 | ```
144 | 
145 | 有了这些方案，再也不怕垂直居中了。:sunglasses:
146 | 


--------------------------------------------------------------------------------
/_posts/rec/2019-09-10-ncf.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: 论文阅读 - Neural Collaborative Filtering
 4 | category: 推荐系统
 5 | tags: ['推荐系统']
 6 | ---
 7 | 
 8 | 这是本文要讨论的论文：
 9 | 
10 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/10/5d773f80451253d178363e13.jpg)
11 | 
12 | - *
13 | {:toc}
14 | 
15 | ## 背景
16 | 
17 | 在基于模型的协同过滤技术（Model-Based CF）中，矩阵分解（matrix factorization, MF) 应用的最多。在 MF 中 user-item 矩阵被分解为 user 矩阵和 item 矩阵。user 和 item 都被映射到一个隐空间中，各自有一个隐向量。这个隐向量可以用来做基于近邻的推荐（计算隐向量的相似度），也可以使用 user 和 item 隐向量的内积，来预测该 user 对该 item 的评分。
18 | 
19 | user 和 item 的隐向量内积，可以用来确定 user 对 item 的评分。有了 user 对各个 item 的评分，自然可以对 item 进行排序，得出推荐。但本篇论文认为，简单地使用隐向量内积，不足以捕获到复杂的交互行为特征，即评分并不一定是隐向量之积。本文通过引入神经网络，来学习用户与物品的隐向量和评分的关系。
20 | 
21 | ## 问题设定
22 | 
23 | 本论文讨论的是隐式反馈协同过滤场景，关于显示反馈和隐式反馈，定义如下：
24 | 
25 | - 显式反馈：直接反应出用户的喜好的行为，比如评分。
26 | - 隐性反馈：间接反应用户的喜好的行为，比如浏览、点击、搜索
27 | 
28 | 隐式反馈的数据由 0 和 1 组成，1 不一定表示喜好，0 只表示用户尚未和该物品有过交互。设 $Y$ 为 user-item 矩阵，则 `$y_{ui}=1$` 表示 user u 和 item i 存在交互信息，否则 `$y_{ui}=0$`。
29 | 
30 | 推荐问题就变成了预测矩阵中为 0 部分的评分，并以此来排序生成推荐。
31 | 
32 | Matrix Factorization，MF 分解 user-item 矩阵，将 user 和 item 映射到低位隐空间中，但 MF 存在一些问题，作者举了一个例子：
33 | 
34 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/10/5d7754b8451253d17838bc20.jpg)
35 | 
36 | 上图中，左边为原始的 user-item 矩阵，观察这个矩阵可以计算出，`$u_1,u_2,u_3$` 之间的相似度。如果将矩阵进行分解，将 item 的向量降维至 2 维，`$p_i$` 为 `$u_i$` 的隐向量。右图中各向量的夹角可以正确地表达 `$u_1,u_2,u_3$` 之间的相似度，`$u_2$` 和 `$u_3$` 最相似，`$u_1$` 和 `$u_2$` 的相似度大于和 `$u_3$` 的相似度。
37 | 
38 | 观察虚线框中的 `$u_4$`，它与 `$u_1$` 最接近，其次是 `$u_3$`，最后才是 `$u_2$`。但在隐空间中，这种关系没法表示出来。`$p_4$` 要想和 `$p_1$` 的夹角最小，那么它必然和 `$p_2$` 的夹角要小于和 `$p_3$` 的夹角。
39 | 
40 | **注**：上面这个问题，直观地想，会在使用隐向量计算相似度的时候存在问题，因为相似度是用夹角衡量的。但怎么能说明 MF 使用内积来估计评分是有问题的呢？夹角大小关系在降维后出现了错乱，而 cosine 的分子上其实就是两个向量的内积。可能这能间接地说明，使用内积不足以可靠地预测评分。
41 | 
42 | ## Neural Collaborative Filtering
43 | 
44 | 作者试图用一个模型来学习 user 和 item 的隐向量和评分之间的关系。下面是模型的基本结构，很容易理解。
45 | 
46 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/10/5d7759f9451253d178397ea8.jpg)
47 | 
48 | 在 MF 中，其实就相当于对 user 和 item 做了嵌入，然后 user 和 item 的 Embedding 的内积等于 user 对 item 的打分，整体上可以作为一个回归问题，让均方误差最小即可。
49 | 
50 | 而此处因为是隐式反馈，在 user-item 矩阵中，user 和 item 有交互就是 1，否则为 0。这里模型的输入为 user 和 item，当输入的 user item 对之间存在交互的时候，就希望模型输出 1，否则输出 0。
51 | 
52 | 因此作者把问题转换为了一个分类问题，正例就是从存在交互的 user item 对，负例就是对每个 user 随机抽一些没有交互记录的 item，构成 user item 对，作为反例。
53 | 
54 | 整个模型就是做一个二分类的任务，使用 log loss，用梯度下降训练即可。
55 | 
56 | ### Generalized Matrix Factorization (GMF)
57 | 
58 | 作者指出如果上图中的 Neural CF Layers 部分做的工作就是将 user 和 item 的 Embedding 做点积（对应元素相乘），得到一个和 Embedding 等长的向量，然后交给 logistics regression。
59 | 
60 | $$
61 | \hat{y}_{u i}=a_{o u t}\left(\mathbf{h}^{T}\left(\mathbf{p}_{u} \odot \mathbf{q}_{i}\right)\right)
62 | $$
63 | 
64 | 上面式子中，`$\odot$` 表示对应元素相乘，如果 $h$ 是全 1 向量，那模型实际上就是 MF 了。
65 | 
66 | 
67 | ### Multi-Layer Perceptron (MLP)
68 | 
69 | 既然都说了，MF 存在问题，那自然要改进了，改进方法就是引入多层感知机。把 user 和 item 的 Embedding 拼起来，然后输入给多层感知机，就可以了。这里的 Embedding 在 MF 的语境下，就是隐向量。
70 | 
71 | MLP 能够引入非线性的变换，有能力捕获到更加复杂的特征组合。有望利用 user 和 item 的隐向量，学得一个更好的模型，用以估计 user 和 item 是否存在交互。
72 | 
73 | ### 结合 GMF 和 MLP
74 | 
75 | MF 对 user 和 item 的隐向量做内积，是线性模型。而 MLP 是非线性的。组合线性和非线性也许有效果，那就组合一下吧：
76 | 
77 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/10/5d776506451253d1783ac347.jpg)
78 | 
79 | 就是 MLP 和 GMF 的最后一层的向量拼接起来，然后交给 logistics regression。上图中好像 GMF 和 MLP 共用了一个 Embedding 一样。论文中说，共用 Embedding 需要 GMF 和 MLP 用相同的维度。学习单独的 Embedding 可能得到更好的集成效果。
80 | 
81 | 
82 | ## 实验
83 | 
84 | 在训练的时候正样本就是由评分记录构造，针对每个 user 随机选取其未交互过的 item 来构造负样本。在训练时为每个 user 保留最近的一个交互过的 item，评估性能时，随机抽取 100 个未与用户交互的 item，并加入保留的 item。用训练好的模型对所有 item 进行排序，然后看保留的这个 item 出现的位置。位置越靠前，说明效果越好。
85 | 
86 | ## 代码实现
87 | 
88 | 论文原作者在 github 给出了实现：[hexiangnan/neural_collaborative_filtering](https://github.com/hexiangnan/neural_collaborative_filtering)
89 | 
90 | 我参考上面的实现进行了一些改写，专注于模型部分：[NCF.ipynb](https://github.com/wy-ei/notebook/blob/master/rec/notebook/NCF.ipynb)


--------------------------------------------------------------------------------
/site/assets/css/scss/m-post.scss:
--------------------------------------------------------------------------------
  1 | @charset "utf-8";
  2 | 
  3 | 
  4 | .post {
  5 |     .content {
  6 |         img {
  7 |             display: block;
  8 |             margin: auto;
  9 |         }
 10 |         .img-alt {
 11 |             text-align: center;
 12 |             > p {
 13 |                 line-height: 1.5em;
 14 |                 display: inline-block;
 15 |                 margin: 1em auto;
 16 |                 text-indent: 0;
 17 |                 border-bottom: 1px solid $border-color;
 18 |             }
 19 |         }
 20 | 
 21 |         iframe {
 22 |             display: block;
 23 |             margin: auto;
 24 |             padding-top: 1em;
 25 |             padding-bottom: 2em;
 26 |             border: none;
 27 |         }
 28 |         iframe[src*='music'] {
 29 |             width: 100%;
 30 |         }
 31 |         .emoji {
 32 |             display: inline-block;
 33 |             height: 1.33em;
 34 |             width: 1.33em;
 35 |             border: none;
 36 |             vertical-align: -0.3em;
 37 |             margin: 0 0.1em;
 38 |             overflow: visible;
 39 |         }
 40 | 
 41 |         table{
 42 |             width: 100%;
 43 |         }
 44 | 
 45 |         .footnotes{
 46 |             margin-top: 50px;
 47 |             ol{
 48 |                 margin-left: 20px;
 49 |             }
 50 |         }
 51 |         .footnotes::before{
 52 |             content: "参考文献";
 53 |             font-size: 1.2em;
 54 |             border-bottom: 1px dotted #d1d1d1;
 55 |             display: block;
 56 |             line-height: 2em;
 57 |             margin-bottom: 20px;
 58 |         }
 59 |         .footnote{
 60 |             margin-left: 5px;
 61 |         }
 62 |         .footnote::after{
 63 |             content: "]"
 64 |         }
 65 |         .footnote::before{
 66 |             content: "["
 67 |         }
 68 | 
 69 |         h2 code,
 70 |         h3 code,
 71 |         h4 code,
 72 |         h5 code,
 73 |         li code,
 74 |         lo code,
 75 |         p code{
 76 |             padding: .1em .2em;
 77 |             color: #e50053;
 78 |             border-radius: 4px;
 79 |         
 80 |             &::before, &::after {
 81 |                 content: "`";
 82 |             }
 83 |         }
 84 | 
 85 |     }
 86 | 
 87 |     #markdown-toc{
 88 |         margin: 0;
 89 |         padding: 1em;
 90 |         border: 1px solid #eee;
 91 |         border-radius: 5px;
 92 |         margin-bottom: .3rem;
 93 |         background-color: #f8f8f8;
 94 |         box-sizing: border-box;
 95 | 
 96 |         li {
 97 |             list-style-position: inside;
 98 |         }
 99 |     }
100 |     #markdown-toc::before {
101 |         content: '目录:';
102 |         display: block;
103 |         font-size: .20rem;
104 |         border-bottom: 1px dotted #ccc;
105 |         margin-bottom: 20px;
106 |     }
107 | 
108 |     .toc{
109 |         margin-bottom: 30px;
110 |         background: $gray-background-color;
111 |         padding: 1em;
112 |     }
113 |     .toc ul{
114 |         margin-bottom: 0;
115 |     }
116 |     .toc h2{
117 |         margin-top: 0;
118 |     }
119 |     .toc-level-2{
120 |         margin-left: 1.5em;
121 |     }
122 |     .toc-level-3{
123 |         margin-left: 3em;
124 |     }
125 |     .toc-level-4{
126 |         margin-left: 4.5em;
127 |     }
128 | 
129 | }
130 | 
131 | 
132 | 
133 | #markdown-toc.popup{
134 |     display: block;
135 |     position: fixed;
136 |     top: 50%;
137 |     left: 50%;
138 |     transform: translate(-50%,-55%);
139 |     z-index: 20;
140 |     max-height: 80vh;
141 |     overflow: auto;
142 | }
143 | 
144 | .toc-placeholder{
145 |     display: none;
146 |     margin-bottom: .3rem;
147 |     border: 1px solid #fff;
148 | }
149 | .popup+.toc-placeholder{
150 |     display: block;
151 | }
152 | .popup+.toc-placeholder::after{
153 |     content: "";
154 |     width: 100%;
155 |     height: 100%;
156 |     position: fixed;
157 |     z-index: 10;
158 |     top: 0;
159 |     left: 0;
160 |     background-color: #000a;
161 |     cursor: pointer;
162 | }
163 | 
164 | 


--------------------------------------------------------------------------------
/_posts/machine_learning/2019-09-30-what-is-machine-learning.md:
--------------------------------------------------------------------------------
 1 | ---
 2 | layout: post
 3 | title: 机器学习 - 简介
 4 | category: 机器学习
 5 | ---
 6 | 
 7 | 
 8 | 我接触机器学习有一年多了，在学习过程中一直独自探索，走了不少弯路。比如，在网上查如何学习机器学习，别人会推荐你去看南京大学周志华老师的[《机器学习》](https://book.douban.com/subject/26708119/)，李航博士的[《统计学习方法》](https://book.douban.com/subject/33437381/)。但我相信大部分人在如何去读这些书，一定会遭受挫折，进而可能对机器学习敬而远之。因为在缺少必要的背景知识的情况时，去读这些偏重理论的书，是不会成功的。
 9 | 
10 | 有人认为机器学习很注重数学，应该先去把数学学好。其实错了，在入门阶段，大部分机器学习算法只需要有高中数学+忘得差不多的高等数学有足够了。我们应该去实践这些算法，用这些算法去解决某个问题，在实践中去感受各种算法，然后在去详细地了解原理，而不是一开始就埋头于理论中。
11 | 
12 | 学习机器学习和其他编程知识类似，你依然需要从代码入手，先跑一跑简短的例子，然后再试图搞明白其中的原理，这个时候你可以去查阅前面提到的书籍。看书 1 小时，就应该实践 10 小时，机器学习也是如此。本系列文章准备通俗（可能不严谨）地讲解常见的机器学习算法，并给出一些直观的解释。很多涉及推导的算法，我做不到比相关书籍讲的还好，在某些地方也会推荐看相关公开课，和相关书籍。每个知识点，会附加一些实际的例子，通过例子可能切实地观察到机器学习算法运行的过程和结果，加强对各个知识点的理解。对需要补充学习的知识点，我会给出我认为最好的参考资料，以及学习建议。
13 | 
14 | 李宏毅老师的机器学习[课程](speech.ee.ntu.edu.tw/~tlkagk/courses_ML16.html) 讲的很好，老师给出了大量的例子，已经直观的比喻，我认为可以从这门课程入手学习必要的理论。在学习过程中千万不要试图在短时间内穷尽所有的算法，应该一个一个来，在学习了理论之后，尝试使用该算法，然后再自行推导该算法，如此反复多次地使用算法。
15 | 
16 | 费曼先生说过 “If you want to master something, teach it.”，本系列文章更多是帮助自己梳理机器学习中的各种知识点。同时我希望他能对别人也有用。
17 | 
18 | ## 机器学习的整个脉络
19 | 
20 | 下图中总结了机器学习算法的大体分类：
21 | 
22 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/24/5d8a15f1451253d1785c319a.jpg)
23 | 
24 | 图片来源见水印，感谢原图作者。
25 | 
26 | 要想运用机器机器学习算法解决某个问题，单了解了机器学习算法是远远不够的，还需要了解数据处理的方法，掌握常见工具的使用。再后面的一系列文章中，我们用到具体的工具时，我会给出一些建议的资料。
27 | 
28 | 这里我想先对机器学习中的一些名词和基本概率做一下解释，万一真的有小白来看这些教程呢？
29 | 
30 | ## 什么是机器学习
31 | 
32 | 在学习具体的机器算法之前，需要大致知道机器学习是什么？机器学习是一系列方法，用于从数据中寻找规律，自动发掘出数据中某些特征之间的关系，进而给出有用的预测。下面举个例子：
33 | 
34 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/24/5d8a1bdd451253d1785d6864.jpg)
35 | 
36 | 一个邮件过滤程序，需要能够分辨出邮件是否为垃圾邮件。要想分辨出垃圾邮件，传统的编程方法可能是为垃圾邮件制定一系列的规则，比如包含 “促销”、"抢购" 等词的邮件视为垃圾邮件。但这需要大量的规则，而且还会出现误判。
37 | 
38 | 如果使用机器学习，解决这一问题的方法是：给机器学习算法一大堆邮件，并告诉它那些是垃圾邮件，那些是正常邮件，然后让算法自动地寻找垃圾邮件和正常邮件的特征。学习完成后，该机器学习算法就会知道垃圾邮件有什么特征，下一次遇到一封新的邮件，此程序就能对该邮件分类。
39 | 
40 | 机器学习就是让机器去从数据中学习，至于如何学习，这就是研究机器学习算法的人要考虑的事情了。我们学习机器学习，就是要学会那些能让机器进行自动学习的方法。然后将这些方法用代码实现，而后机器就可以自动地学习了。
41 | 
42 | 
43 | ## 机器学习算法的分类
44 | 
45 | 机器学习算法从不同的角度可以分为很多的类别，但这里，我不愿把问题弄的太复杂，只描述最常见的分类
46 | 
47 | 人类每天都在学习，我们通过看书、听课、做练习来进行学习，我们从书本、老师那里学习。机器学习算法是让机器进行学习的一系列方法，我们人类从书中学习，机器从数据中学习，人通过看书来学习，机器通过机器学习算法来学习。机器学习算法就是机器进行学习的策略。
48 | 
49 | 在垃圾分类的场景下，机器从大量的邮件中来学习，每个邮件有具体的内容，以及邮件对应的类别（是否为垃圾邮件）。在机器学习中，我们把邮件内容经过处理得到邮件的特征（feature），特征用 $x$ 表示，邮件的类别我们称为标签（label），标签使用 $y$ 来表示。
50 | 
51 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/24/5d8a1dbc451253d1785dc523.jpg)
52 | 
53 | 机器学习算法就相当于一个函数，把邮件的特征输入进入，函数返回分类的结果。那么这个函数的定义是怎样的呢，函数的定义就是机器要使用机器学习算法来学习的目标。有了这个函数，新的邮件输入进来就可以判断它是否为垃圾邮件了。
54 | 
55 | ### 监督学习（supervised learning）
56 | 
57 | 每个邮件的特征是多个维度的，比如发件人信息、文本内容、是否包含图片等等，在机器学习中，我们把参与训练的数据中最小单元成为样本。
58 | 
59 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/24/5d8a226e451253d1785ec030.jpg)
60 | 
61 | 假设这里的样本包含两个维度的特征，每个样本都对应在二维平面上的一个点，图中 O 和 X 是样本的标签。要想区分两类样本，机器学习算法可能会寻找到一条分界线，在平面上将两类样本完全分开。
62 | 
63 | 只有样本有对应的标签时，我们才能画出这条分界线。这类使用有标签的数据进行学习的算法被成为监督学习。监督学习给定了输入 $X$ 和 输出 $y$，然后去学习由 $X \to y$ 的映射函数 $f$。
64 | 
65 | ### 非监督学习（unsupervised learning）
66 | 
67 | 监督学习需要样本有标签，而标签往往时不易获得的，常常需要人工去进行标注。现实生活中有的往往是没有标签的样本。
68 | 
69 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/24/5d8a250e451253d1785f7889.jpg)
70 | 
71 | 对于没有标签的样本，机器学习算法可以通过分析整个样本集，发现其内在的规律。比如上图中的例子，样本并没有标签，但是它们明显聚成了两个簇。如果一个任务是对样本进行归类，那么不需要标签也可以做到。这类通过挖掘数据分布，而不依赖标签的学习方法被称为非监督学习。常见的聚类算法就是非监督学习。
72 | 
73 | ### 半监督学习（semisupervised learning）
74 | 
75 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/24/5d8a27d6451253d1786013ca.jpg)
76 | 
77 | 有大量无标签的样本，和少量有标签的样本。采用非监督学习可以对无标签样本进行聚类，利用落在各个类别中的少量有标签样本，能够确定各个类别的某些特征。比如相册应用，可以将一个人的不同照片聚类，一旦其中的某张照片被用户标记为某个人，那么类别中所有照片就都被标记了。
78 | 
79 | ## 总结
80 | 
81 | 本文交代了这一系列教程的用意，并对机器学习的个别概念进行了解释，这些内容对于熟悉的人而言没有任何价值，对不懂机器学习的人而言又显得太少。因此，推荐一些阅读材料供入门者食用。
82 | 
83 | ## 推荐阅读
84 | 
85 | 读完了上面的内容，你一定还是不知道什么是机器学习，这很正常。这里推荐台湾大学李宏毅老师的机器学习课程，你可以看一下第一讲。第一讲中举了大量的例子来描述什么是机器学习，相信看完之后你对机器学习的整体会有较清晰的认识。
86 | 
87 | 李宏毅老师机器学习课程介绍 [PPT](http://speech.ee.ntu.edu.tw/~tlkagk/courses/ML_2016/Lecture/Introduction%20(v4).pdf) 和 [课程](https://www.bilibili.com/video/av35932863?from=search&seid=1767191564165457969)。


--------------------------------------------------------------------------------
/_posts/web/css/2015-08-20-css-selector.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: CSS 选择器
  4 | category: Web
  5 | pid: css 
  6 | ---
  7 | 
  8 | 
  9 | * toc
 10 | {:toc}
 11 | 
 12 | 
 13 | ## 基本选择器
 14 | 
 15 | ```html
 16 | <ul id="list">
 17 |     <li class="item active">CSS</li>
 18 |     <li class="item">JavaScript</li>
 19 |     <li class="item">HTML</li>
 20 | </ul>
 21 | ```
 22 | 
 23 | ```css
 24 | /* 选择所有 li */
 25 | li 
 26 | 
 27 | /* 选择包含类 item 的元素 */
 28 | .item
 29 | 
 30 | /* 选择 id 为 list 的元素 */
 31 | #list
 32 | 
 33 | /* 选择同时有 item 和 active 类的 标签*/
 34 | .item.active
 35 | ```
 36 | 
 37 | **根据属性来选择**
 38 | 
 39 | ```css
 40 | /* 选择所有具有 class 属性的 h1 标签 */
 41 | h1[class]
 42 | 
 43 | /* 选择同时具有 href 和 class 属性的 a 标签 */
 44 | a[href][class]
 45 | 
 46 | /* 选择所有类型为 text 的 input 标签 */
 47 | input[type='text']
 48 | ```
 49 | 
 50 | **属性的匹配方式有多种，举例说明如下：**
 51 | 
 52 | 
 53 | ```css
 54 | /* 选择所有设置了 href 的 a 标签 */
 55 | a[href]
 56 | 
 57 | 
 58 | /* 选择所有 type 属性为 'text' 的 input 标签 */
 59 | input[type=text]
 60 | 
 61 | 
 62 | /*
 63 | 选择 alt 属性以单词 css 开头的 img 标签
 64 | 
 65 | <img src="..." alt="css selector">
 66 | <img src="..." alt="css-selector">
 67 | */
 68 | img[alt|=css]
 69 | 
 70 | 
 71 | /*
 72 | 选择 src 属性中包含字符串 selector 的 img 标签
 73 | 
 74 | <img src="/css/selector.jpg" alt="css selector">
 75 | */
 76 | img[src*=selector]
 77 | 
 78 | 
 79 | /*
 80 | 选择 class 属性中包含字符串单词 selector 的 img 标签，与前一个不同的是，这里要求是单词，前一个匹配的是子字符串
 81 | 
 82 | <img src="..." clsss="css-selector">
 83 | */
 84 | img[clsss~=selector]
 85 | 
 86 | 
 87 | /*
 88 | 选择 src 属性以 'http' 为前缀的 img 标签
 89 | 
 90 | <img src="http://...">
 91 | */
 92 | img[src^=http]
 93 | 
 94 | 
 95 | /*
 96 | 选择 src 属性以 'jpg' 为后缀的 img 标签
 97 | 
 98 | <img src="x.jpg">
 99 | */
100 | img[src$=jpg]
101 | ```
102 | 
103 | 
104 | 注意：乍一看好像 `img[src^=http]` 和 `img[src|=http]` 是一样的，其实不然。前者匹配前缀字符串，后缀匹配第一个单词。举个不恰当的例子：
105 | 
106 | ```html
107 | <img src="https://" >
108 | <img src="http://" >
109 | ```
110 | 
111 | 第一个 img 标签不会被 `img[src|=http]` 匹配，因为 src 属性开头的第一个单词为 `https`。
112 | 
113 | ## 层次选择器
114 | 
115 | + `div a` 后代选择器，选择所有在 div 里面的 a
116 | + `p>a` 直接后端选择器，选择所有为 p 元素的直接后代的 a 元素
117 | + `p+a`  相邻兄弟选择器，选择紧跟在 p 元素的 a 元素
118 | + `p~span`  选择 p 元素之后的所有 span 元素
119 | 
120 | ## 伪类选择器
121 | 
122 | 伪类选择器可以分为 6 类：
123 | 
124 | + 动态伪类选择器
125 | + 目标伪类选择器
126 | + 语言伪类选择器
127 | + UI状态伪类选择器
128 | + 结构伪类选择器
129 | + 否定伪类选择器
130 | 
131 | ### 动态伪类选择器
132 | 
133 | + `a:link`：匹配定义了 `href` 属性的 a 标签
134 | + `a:visited`：匹配点击过的 a 标签
135 | + `E:active`：匹配正被激活的元素，比如正在点击的连接或者按钮
136 | + `E:hover`：匹配鼠标落在其上的 E
137 | + `E:focus`：匹配获得焦点的 E
138 | 
139 | 关于以上属性有一个 LoVe/HAte 的规则，至于为什么，可以参看[这里](https://github.com/wy-ei/notebook/blob/master/css/2015-12-19-why-love-hate.md)
140 | 
141 | ### 目标伪类选择器
142 | 
143 | + `:target`：匹配有着和 URL 中的 hash 相同的 id 的元素
144 | 
145 | ```html
146 | <a href="#part-1">see part 1</a>
147 | <p id="part-1">part 1</p>
148 | ```
149 | 
150 | 当点击了标签之后，url 中的锚点就变成了 part-1 这就和 p 标签的 id 匹配了。此时该 p 标签被匹配。
151 | 
152 | ### 语言伪类选择器
153 | 
154 | 语言伪类选择器是通过标签的 lang 属性来进行匹配的
155 | 
156 | ```css
157 | E:lang(language){}
158 | ```
159 | 
160 | 可以使用该属性来匹配不同语言的元素
161 | 
162 | ### UI状态伪类选择器
163 | 
164 | + `E:checked`
165 | + `E:enabled`
166 | + `E:disabled`
167 | + `E:focus`
168 | 
169 | 这几个属性通常用在 `<input>` 和 `<button>` 标签上
170 | 
171 | ### 结构伪类选择器
172 | 
173 | + `:first-child`
174 | + `:last-child`
175 | + `:root`
176 | + `:nth-child(n)`
177 | + `:nth-last-child(n)`
178 | + `:nth-of-type(n)`
179 | + `:nth-last-of-type(n)`
180 | + `:first-of-type`
181 | + `:last-of-type`
182 | + `:only-child`
183 | + `:only-of-type`
184 | + `:empty`：选择没有子元素的元素
185 | 
186 | ### 否定伪类选择器
187 | 
188 | + `:not()`
189 | 
190 | ```css
191 | a:not([href^=https]){
192 |     color: red;
193 | }
194 | ```
195 | 
196 | 匹配所有地址不是 https 的 a 标签。
197 | 
198 | 更多伪类可以参见这里：[Pseudo-classes MDN](https://developer.mozilla.org/en-US/docs/Web/CSS/Pseudo-classes)
199 | 
200 | ## 伪元素
201 | 
202 | CSS3 中对伪元素进行了调整，使用双冒号开头 `::` ，目的是为了和伪类区分开来。
203 | 
204 | 
205 | + `::after`
206 | + `::before`
207 | + `::first-letter`：用来选择文本块的第一个字母，对于行内元素该选择器不起作用，需要修改 `display` 使其成为块状结构才有效
208 | + `::first-line`：用来匹配文本块的第一行文本
209 | + `::selection`：用来匹配被选中的文本，该伪元素仅接受 `background` 和 `color` 两个属性
210 | 
211 | 
212 | 更多伪元素可以参见这里 [Pseudo-elements MDN](https://developer.mozilla.org/en-US/docs/Web/CSS/pseudo-elements)
213 | 


--------------------------------------------------------------------------------
/_posts/web/css/2015-10-10-css-animation.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: CSS 动画
  4 | category: Web
  5 | ---
  6 | 
  7 | 
  8 | * toc
  9 | {:toc}
 10 | 
 11 | 
 12 | 
 13 | ## 状态过渡
 14 | 
 15 | `transition` 用于将元素从一种状态平滑地过渡到另外一种状态。基本语法如下：
 16 | 
 17 | ```css
 18 | transition: [<property>] || [<duration>] || [<timing-function>] || [<delay>];
 19 | ```
 20 | 
 21 | 比如鼠标移动到某个元素上 1 秒后将元素在 500 毫秒内将其 width 线性地变为 200px，可以这样写：
 22 | 
 23 | ```css
 24 | div{
 25 |   width: 100px;
 26 |   height: 100px;
 27 |   background-color: #333;
 28 |   transition: width 500ms linear 1s;
 29 | }
 30 | 
 31 | div:hover{
 32 |   width: 200px;
 33 | }
 34 | ```
 35 | 
 36 | 如果指定了过渡属性，那么就只会对指定的属性进行过渡。如果希望所有可过渡的属性都能在变化后平滑地过渡，那么可以不指定 property 或者指定为 all 。
 37 | 
 38 | 对于 time-function， 浏览器内预设了一些，如 ease, linear, ease-in, ease-out, ease-in-out ，可以使用这些预设的过渡函数，也可以使用三次贝塞尔函数或者 steps 函数来自定义过渡函数。
 39 | 
 40 | 三次贝塞尔函数就不再说了，steps 函数是将过渡过程划分为几个均匀的阶段，其具体语法为 `steps(n, [start|end])`, 其中 n 决定了整个渐变被分为几个阶段，第二个参数可以是 start 或 end，start 表示阶跃发生在开始阶段，而 end 表示阶跃发生在结束阶段。
 41 | 
 42 | ```css
 43 | div{
 44 |   width: 100px;
 45 |   height: 100px;
 46 |   background-color: #333;
 47 |   transition: width 1s steps(1, end);
 48 | }
 49 | 
 50 | div:hover{
 51 |   width: 200px;
 52 | }
 53 | ```
 54 | 
 55 | 这里 `steps(1, end)` 表示整个过渡就一次跳跃，使用了 end ，具体的效果就是鼠标移动到元素上 1 秒的时候，元素的宽度变为了 200px, 动画结束，整个过渡用时 1 秒。如果使用 `steps(1, start)` ，实际效果就是鼠标移动到元素上后元素的宽度立刻变为 200px ,这个时候过渡过程还没有结束，在 1 秒后过渡才算结束，整个过程也用时 1 秒。
 56 | 
 57 | 另外还有 `step-start` 和 `step-end` 两个过渡函数，它们实际上就是第二个参数固定的 steps 函数而已。
 58 | 
 59 | 多个过渡效果可以使用逗号隔开，如: `transition: width 1s steps(1, end), height 500ms linear;`
 60 | 
 61 | 
 62 | ## 动画
 63 | 
 64 | transition 仅仅是让元素在初始状态和结束状态之间进行过渡，虽然也是动画，但功能还是很局限，animation 引入关键帧来描述动画，并提供了更多的属性来控制动画，来看看如何使用 animation 吧。
 65 | 
 66 | ### keyframes
 67 | 
 68 | 前面提到 animation 是利用关键帧来描述动画的，所以首先需要定义关键帧，定义关键帧需要使用到 keyframes ，它的用法很简单，形如下面这样：
 69 | 
 70 | ```css
 71 | @keyframes rotating {
 72 |     from {
 73 |         transform: rotate(0);
 74 |     }
 75 |     to {
 76 |         transform: rotate(360deg);
 77 |     }
 78 | }
 79 | ```
 80 | 
 81 | 其中 from 和 to 可以替换为 0% 和 100%， 它们表示初始状态和结束状态。还可以添加更多帧信息，像这样：
 82 | 
 83 | ```css
 84 | @keyframes bounce {
 85 |   0% {
 86 |     transform: scale3d(.3, .3, .3);
 87 |   }
 88 |   20% {
 89 |     transform: scale3d(1.1, 1.1, 1.1);
 90 |   }
 91 |   40% {
 92 |     transform: scale3d(.9, .9, .9);
 93 |   }
 94 |   60% {
 95 |     opacity: 1;
 96 |     transform: scale3d(1.03, 1.03, 1.03);
 97 |   }
 98 |   80% {
 99 |     transform: scale3d(.97, .97, .97);
100 |   }
101 |   to {
102 |     transform: scale3d(1, 1, 1);
103 |   }
104 | }
105 | ```
106 | 
107 | ### animation
108 | 
109 | 定义个 keyframes 之后就可以将其运用在元素上了，这就用到了 animation 属性。
110 | 
111 | ```css
112 | div {
113 |     animation: bounce 2s linear infinite;
114 | }
115 | ```
116 | 
117 | 该属性的语法如下：
118 | 
119 | ```
120 | animation: <name> | <duration> | <timing-function> | <delay> |
121 |    <iteration-count> | <direction> | <fill-mode> | <play-state>;
122 | ```
123 | 该属性可以分为 8 个部分，其中每一部分都有单独的属性，就像 transition 一样，有 transition-duration 等等。animation 属性中至少有 <name>, <duration>, <timing-function> 这三个的值明确，动画才会执行。
124 | 
125 | 
126 | #### animation-name
127 | 
128 | 指定要运用的 keyframes， 该属性要对应一个 keyframes 的名字。
129 | 
130 | #### animation-duration
131 | 
132 | 表示该动画持续的时间，该值不可或缺。
133 | 
134 | #### animation-timing-function
135 | 
136 | 一个描述过渡过程的函数，同 transition-timing-function。
137 | 
138 | #### animation-delay
139 | 
140 | 表示动画开始执行前要延时的时间。
141 | 
142 | #### animation-direction
143 | 
144 | 指定动画执行的方向，有如下几个可选值：
145 | 
146 | + normal：动画向前播放，这是默认属性。
147 | + reverse：动画反向播放。
148 | + alternate：动画正向运行。到了终点后会再返回来。带时间功能的函数也反向，比如 ease-in 在反向时成为 ease-out，在动画执行偶数次时正向运行，奇数次时反向运行。
149 | + alternate-reverse：动画反向播放。同 alternate，到了终点后会返回来。
150 | 
151 | #### animation-iteration-count
152 | 
153 | 指定动画的播放次数，可以取任意正数，不一定是正整数，比如取值为　1.5 会完成一个整周期和一个半周期的动画。另外也可以取 infinite 这个特殊值让动画无限次执行。
154 | 
155 | #### animation-play-state
156 | 
157 | 该属性用于控制动画的播放与停止播放，可以 `running` 和 `paused` 两个值，可以修改这个属性来让动画停止或开始播放。
158 | 
159 | #### animation-fill-mode
160 | 
161 | 这个属性用来决定动画开始执行前和执行结束这两个时刻的一些动作。可以取得值有下面几个：
162 | 
163 | + none：这是默认值，动画按常规执行。
164 | + forwards：动画执行完成后，运用动画的元素保持动画最后一帧的样式。
165 | + bakcwards：动画在 delay 开始阶段就应用第一帧画面。在动画没有设置 delay 的时候该值可能看不出什么效果，但假如动画的第一帧是让元素背景色变为黑色，且动画有 1 秒的延时，那么元素会在运用了动画后立刻运用第一帧动画，改变背景色为黑色。假如没有设 bakcwards 这个值，那么元素会在 1 秒后才运用第一帧动画的样式。
166 | + both：同时执行 forwards 和 backwards 的动作。
167 | 
168 | _写到这里动画的使用是彻底清楚了_


--------------------------------------------------------------------------------
/site/_includes/echo.js:
--------------------------------------------------------------------------------
  1 | /*! echo-js v1.7.3 | (c) 2016 @toddmotto | https://github.com/toddmotto/echo */
  2 | (function (root, factory) {
  3 |   if (typeof define === 'function' && define.amd) {
  4 |     define(function() {
  5 |       return factory(root);
  6 |     });
  7 |   } else if (typeof exports === 'object') {
  8 |     module.exports = factory;
  9 |   } else {
 10 |     root.echo = factory(root);
 11 |   }
 12 | })(this, function (root) {
 13 | 
 14 |   'use strict';
 15 | 
 16 |   var echo = {};
 17 | 
 18 |   var callback = function () {};
 19 | 
 20 |   var offset, poll, delay, useDebounce, unload;
 21 | 
 22 |   var isHidden = function (element) {
 23 |     return (element.offsetParent === null);
 24 |   };
 25 |   
 26 |   var inView = function (element, view) {
 27 |     if (isHidden(element)) {
 28 |       return false;
 29 |     }
 30 | 
 31 |     var box = element.getBoundingClientRect();
 32 |     return (box.right >= view.l && box.bottom >= view.t && box.left <= view.r && box.top <= view.b);
 33 |   };
 34 | 
 35 |   var debounceOrThrottle = function () {
 36 |     if(!useDebounce && !!poll) {
 37 |       return;
 38 |     }
 39 |     clearTimeout(poll);
 40 |     poll = setTimeout(function(){
 41 |       echo.render();
 42 |       poll = null;
 43 |     }, delay);
 44 |   };
 45 | 
 46 |   echo.init = function (opts) {
 47 |     opts = opts || {};
 48 |     var offsetAll = opts.offset || 0;
 49 |     var offsetVertical = opts.offsetVertical || offsetAll;
 50 |     var offsetHorizontal = opts.offsetHorizontal || offsetAll;
 51 |     var optionToInt = function (opt, fallback) {
 52 |       return parseInt(opt || fallback, 10);
 53 |     };
 54 |     offset = {
 55 |       t: optionToInt(opts.offsetTop, offsetVertical),
 56 |       b: optionToInt(opts.offsetBottom, offsetVertical),
 57 |       l: optionToInt(opts.offsetLeft, offsetHorizontal),
 58 |       r: optionToInt(opts.offsetRight, offsetHorizontal)
 59 |     };
 60 |     delay = optionToInt(opts.throttle, 250);
 61 |     useDebounce = opts.debounce !== false;
 62 |     unload = !!opts.unload;
 63 |     callback = opts.callback || callback;
 64 |     echo.render();
 65 |     if (document.addEventListener) {
 66 |       root.addEventListener('scroll', debounceOrThrottle, false);
 67 |       root.addEventListener('load', debounceOrThrottle, false);
 68 |     } else {
 69 |       root.attachEvent('onscroll', debounceOrThrottle);
 70 |       root.attachEvent('onload', debounceOrThrottle);
 71 |     }
 72 |   };
 73 | 
 74 |   echo.render = function (context) {
 75 |     var nodes = (context || document).querySelectorAll('[data-echo], [data-echo-background]');
 76 |     var length = nodes.length;
 77 |     var src, elem;
 78 |     var view = {
 79 |       l: 0 - offset.l,
 80 |       t: 0 - offset.t,
 81 |       b: (root.innerHeight || document.documentElement.clientHeight) + offset.b,
 82 |       r: (root.innerWidth || document.documentElement.clientWidth) + offset.r
 83 |     };
 84 |     for (var i = 0; i < length; i++) {
 85 |       elem = nodes[i];
 86 |       if (inView(elem, view)) {
 87 | 
 88 |         if (unload) {
 89 |           elem.setAttribute('data-echo-placeholder', elem.src);
 90 |         }
 91 | 
 92 |         if (elem.getAttribute('data-echo-background') !== null) {
 93 |           elem.style.backgroundImage = 'url(' + elem.getAttribute('data-echo-background') + ')';
 94 |         }
 95 |         else if (elem.src !== (src = elem.getAttribute('data-echo'))) {
 96 |           elem.src = src;
 97 |         }
 98 | 
 99 |         if (!unload) {
100 |           elem.removeAttribute('data-echo');
101 |           elem.removeAttribute('data-echo-background');
102 |         }
103 | 
104 |         callback(elem, 'load');
105 |       }
106 |       else if (unload && !!(src = elem.getAttribute('data-echo-placeholder'))) {
107 | 
108 |         if (elem.getAttribute('data-echo-background') !== null) {
109 |           elem.style.backgroundImage = 'url(' + src + ')';
110 |         }
111 |         else {
112 |           elem.src = src;
113 |         }
114 | 
115 |         elem.removeAttribute('data-echo-placeholder');
116 |         callback(elem, 'unload');
117 |       }
118 |     }
119 |     if (!length) {
120 |       echo.detach();
121 |     }
122 |   };
123 | 
124 |   echo.detach = function () {
125 |     if (document.removeEventListener) {
126 |       root.removeEventListener('scroll', debounceOrThrottle);
127 |     } else {
128 |       root.detachEvent('onscroll', debounceOrThrottle);
129 |     }
130 |     clearTimeout(poll);
131 |   };
132 | 
133 |   return echo;
134 | 
135 | });
136 | 


--------------------------------------------------------------------------------
/_posts/algorithm/2019-08-11-binary-search.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: 二分查找
  4 | category: 算法
  5 | tags: ['算法']
  6 | ---
  7 | 
  8 | 二分查找的思想相当简单，但是实现起来却有很多的坑，本文来剖析一下各个坑点，并给出无 bug 的实现，便于复制粘贴。
  9 | 
 10 | ### 二分查找要点
 11 | 
 12 | 下面是二分查找算法的大体样子，自己动手实现时，需要注意的点，就是标 `???` 的地方。
 13 | 
 14 | ```cpp
 15 | int binary_search(int[] a, int len, int x) {
 16 |     int lo = 0, hi = ???;
 17 | 
 18 |     while(???) {
 19 |         int mid = lo + (hi - lo) / 2;
 20 |         if (a[mid] == x) {
 21 |             return mid
 22 |         } else if (a[mid] < x) {
 23 |             lo = ???
 24 |         } else {
 25 |             hi = ???
 26 |         }
 27 |     }
 28 |     return -1;
 29 | }
 30 | ```
 31 | 
 32 | **`hi` 该如何初始化**
 33 | 
 34 | `lo` 和 `hi` 用于确定搜索区间，这个区间可以是 `[lo, hi]` 也可以是 `[lo, hi)`。如果采用闭区间，`hi` 就是最后一个元素的下标，`hi=len-1`。要是采用开区间，`hi=len`。
 35 | 
 36 | **终止条件怎么写**
 37 | 
 38 | `while` 循环的条件可能有两种 `lo < hi` 或者 `lo <= hi`。到底要不要等号，这决定于前一步开闭区间的选择。二分搜索停止的条件就是待搜索的区间长度为 0。把握住这个想法，这个条件就很好决定了。
 39 | 
 40 | 如果采用闭区间，`lo==hi` 时，表示区间长度为 1。因此，如果采用闭区间，就需要有等号。否则，你想想如果列表中只有一个元素，那么 `lo` 和 `hi` 是相等的，你要不加等号，就进不去主循环。
 41 | 
 42 | 如果采用开区间，当区间为空时，`lo==hi`。只要满足 `lo<hi` ，就说明区间不为空。所以此时是不加等号的。
 43 | 
 44 | **`lo` 和 `hi` 该如何调整**
 45 | 
 46 | 当 `a[mid] < x` 时，说明中点的值是小于目标值，因此，`mid` 及其左边的范围可以抛掉了，因此可以放心大胆地写 `lo = mid + 1`。
 47 | 
 48 | 当 `a[mid] > x` 时，说明中点的值是大于目标值，中点及其右边的范围可以抛掉了。这个时候，采用开区间还是闭区间，写法自然是不一样的。闭区间，当然就是 `hi = mid - 1`，开区间就是 `hi = mid`。
 49 | 
 50 | ### 二分查找实现
 51 | 
 52 | 根据前面的分析，我们可以写出两种二分查找的实现：
 53 | 
 54 | ```cpp
 55 | // 实现一
 56 | int binary_search(int[] a, int len, int x) {
 57 |     int lo = 0, hi = len-1;
 58 | 
 59 |     while(lo<=hi) {
 60 |         int mid = lo + (hi - lo) / 2;
 61 |         if (a[mid] == x) {
 62 |             return mid
 63 |         } else if (a[mid] < x) {
 64 |             lo = mid+1;
 65 |         } else {
 66 |             hi = mid-1;
 67 |         }
 68 |     }
 69 |     return -1;
 70 | }
 71 | ```
 72 | 
 73 | ```cpp
 74 | //实现二
 75 | int binary_search(int[] a, int len, int x) {
 76 |     int lo = 0, hi = len;
 77 | 
 78 |     while(lo<hi) {
 79 |         int mid = lo + (hi - lo) / 2;
 80 |         if (a[mid] == x) {
 81 |             return mid
 82 |         } else if (a[mid] < x) {
 83 |             lo = mid+1;
 84 |         } else {
 85 |             hi = mid;
 86 |         }
 87 |     }
 88 |     return -1;
 89 | }
 90 | ```
 91 | 
 92 | ### 关于开闭区间
 93 | 
 94 | 涉及到边界的时候，常常要纠结到底右端用开区间还是闭区间。在快速排序，归并排序中也要纠结这个问题。如果你经常使用 Python，那么使用开区间就很自然。因为 Python 中，切片就是用的开区间。不过大多数语言中，我们都在使用开区间，比如下面的循环语句。因此，我建议以后不要纠结了，都采用开区间好了。大佬 E. W. Dijkstra [论证过](https://www.cs.utexas.edu/users/EWD/transcriptions/EWD08xx/EWD831.html)使用开区间的好处。
 95 | 
 96 | ```c
 97 | for(int i=0;i<n;i++){
 98 |     //...
 99 | }
100 | ```
101 | 
102 | ### 二分查找衍生算法
103 | 
104 | **搜索结束后 `lo` 和 `hi` 分别指向哪里**
105 | 
106 | 分析完上面几点，二分查找就说完了。但是常常我们使用二分查找来寻找某个位置，然后插入元素，而不是直接用来寻找元素。因此，有必要了解一下如果没有查到某个元素，循环退出时 `lo` 和 `hi` 指向哪里。
107 | 
108 | 如果采用的是闭区间，那么退出循环后，有 `lo>hi` 且 `lo=hi+1`。在退出前的一次迭代中，有 `lo=hi=mid`，此时，如果 `a[mid]>x` 会执行 `hi=mid-1`，如果 `a[mid]<x` 会执行 `lo=mid+1`。这带来的结果是退出循环后，有 `a[lo]>x`。而且 `lo` 指向的是第一个大于 `x` 的元素。而 `hi` 指向最后一个小于 `x` 的元素。
109 | 
110 | 如果采用开区间，循环退出后，有 `hi==lo`，都指向第一个大于 `x` 的元素。
111 | 
112 | 有了以上分析，我们可以很轻松地实现其他从二分查找中衍生出的算法。比如，寻找第一个大于等于 `x` 的元素的下标，寻找最后一个小于 `x` 的元素的下标等。
113 | 
114 | **寻找第一个大于等于 x 的元素的下标**
115 | 
116 | 根据前面的分析，在二分查找没有找到时，不要返回 -1 而返回 `lo`，就可以实现这个算法了。不过可以实现的更加简洁。
117 | 
118 | 我在考虑这个算法时，想法是不断减小区间范围。如果 `a[mid]` 小于 `x`，那么 `mid` 及其之前的范围不符合要求。否则，`mid` 后面的范围不符合要求，而 `mid` 有可能符合要求。但是在退出循环是 `lo = hi`，因此可以设 `hi = mid`。最终返回 `lo` 即得到结果。
119 | 
120 | 
121 | ```python
122 | def lower_bound(a, x):
123 |     lo, hi = 0, len(a)
124 |     
125 |     while lo < hi:
126 |         mid = (lo+hi)//2
127 |         if a[mid] < x:
128 |             lo = mid + 1
129 |         else:
130 |             hi = mid
131 |     return lo
132 | ```
133 | 
134 | **寻找第一个大于 x 的元素的下标**
135 | 
136 | 同理，可以写出如下代码：
137 | 
138 | ```python
139 | def upper_bound(a, x, lo=0, hi=None):
140 |     lo, hi = 0, len(a)
141 |     while lo < hi:
142 |         mid = (lo + hi) // 2
143 |         if a[mid] <= x:
144 |             lo = mid + 1
145 |         else:
146 |             hi = mid
147 |     return lo
148 | ```
149 | 
150 | 这里借用了 C++ STL 中的两个函数名，`lower_bound` 和 `upper_bound`。在列表中，如果存在重复元素，比如 `a = [1 2 3 3 3 5 6]`。对于元素 3 而言，`lower_bound(a, 3)` 和 `upper_bound(a, 3)` 分别返回 3 在序列中的下边界和上边界，下边界是闭区间，上边界是开区间。如果不存在 3，那么 `lower_bound` 会返回第一个大于 3 的元素的下标。
151 | 
152 | **寻找最后一个小于 x 的元素的下标**
153 | 
154 | 返回 `lower_bound(a, x) - 1` 即可。
155 | 
156 | 
157 | 
158 | ### 总结
159 | 
160 | 二分查找之所以容易出错，我想是因为人们常看到采用开闭区间的不同写法，另外没有仔细考虑这两种情况的边界情况。如果考虑清楚了，就很难出错了。


--------------------------------------------------------------------------------
/_posts/algorithm/2019-10-13-sample.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: 取样算法 - sample
  4 | category: 算法
  5 | tags: ['算法']
  6 | ---
  7 | 
  8 | 今天实验室的同学在面试中遇到了这样一个问题：写一个 `sample(nums, k)` 函数，从序列中等概率地抽取 `k` 个元素。
  9 | 
 10 | 这个问题的解法，在《编程珠玑续》第 13 章有讲到。先前曾看到过，但有些忘记了，重新看书后，将解法梳理在此。
 11 | 
 12 | ### 简单直白的解法
 13 | 
 14 | 为了避免在后文中，因为下标导致的叙述不畅，我把这个问题改变一个说法：从 `[1,n]` 间的 `n` 个整数中取出 `k` 个元素，要求每个元素被取到的概率相等。
 15 | 
 16 | 一个相当直接的解法如下：
 17 | 
 18 | ```python
 19 | import random
 20 | 
 21 | def sample(n, k):
 22 |     ret = set()
 23 |     
 24 |     for i in range(k):
 25 |         num = random.randint(1, n);
 26 |         while num in ret:
 27 |             num = random.randint(1, n);
 28 |         ret.add(num)
 29 |         
 30 |     return ret
 31 | ```
 32 | 
 33 | 注：`random.randint(1, n)` 返回 `[1, n]` 之间的整数。
 34 | 
 35 | 这个算法每次随机产生一个数，然后检查之前是否之前已经出现过，如果已经存在了，就重新生成一个数。内循环 `while` 用来确保随机数不存在于 set 中。这个算法不够好，原因如下：
 36 | 
 37 | 随机生成的数可能和先前生成的数重复了，这导致 `while` 循环可能会执行多次。当 `k` 远小于 `n` 的时候，随机生成的数与 `set` 中的数冲突的几率较小，这个算法的性能尚能接受。
 38 | 
 39 | 但是当 `k` 接近 `n` 的时候，更极端一点，比如 `n=k=100` 时，在生成最后一个数时，`while` 会盲猜很多次，直到恰好碰到那一个不在集合中的数。如果随机数发生器不是完全随机，有可能永远不会生成 set 中缺失的那一个数，算法可能不会停止。
 40 | 
 41 | 如果证明每个元素抽到的概率相同呢？这个过程其实相当于不放回的抽取，`while` 循环仅仅是模拟了不放回的事实。不放回的抽取，概率论老师已经告诉我们了，每个元素被抽到的概率是一样的。
 42 | 
 43 | ### Floyd 取样算法
 44 | 
 45 | 在《编程珠玑续》上讲到了一种算法，这算法由 Bob Floyd 提出，可以保证在与 k 成正比的时间内得出结果，且保证等概率。代码如下：
 46 |  
 47 | ```python
 48 | def sample(n, k):
 49 |     if k == 0:
 50 |         return set()
 51 |     
 52 |     ret = sample(n-1, k-1)
 53 |     
 54 |     num = random.randint(1, n)
 55 |     if num not in ret:
 56 |         ret.add(num)
 57 |     else:
 58 |         ret.add(n)
 59 |         
 60 |     return ret
 61 | ```
 62 | 
 63 | 采用递归的思想，先从 `[0, n-1]` 中取出 `k-1` 个数，然后在 `[0,n]` 中随机生成一个数，因为目前集合中的元素一定属于范围 `[0,n-1]`，如果随机数和集合中的数冲突了，那就把 `n` 加入集合。这个算法保证每次生成随机数，都能得到一个可行元素。
 64 | 
 65 | 但是它为什么有效呢？为什么能保证所有元素等概率被抽取到呢？下面证明每个元素被抽到的概率相等。
 66 | 
 67 | 从 `n` 个数中取 `k` 个数，每个数被取到的概率为 $\frac{k}{n}$。考虑最后一次递归调用，从 `[1,n]` 生成的随机数 `num=n` 的概率为 $\frac{1}{n}$，有 $\frac{k-1}{n}$ 的概率为集合中已经存在的数。因此最后一次递归调用，向集合中加入的值为 `n` 的概率为:
 68 | 
 69 | $$
 70 | \frac{1}{n} + \frac{k-1}{n} = \frac{k}{n}
 71 | $$
 72 | 
 73 | 考虑倒数倒数第 2 次递归调用，即抽取第 `k-1` 个数时。根据前面的分析不难得出 `n-1` 的概率为被加入集合的概率为 $\frac{k-1}{n-1}$。而最后一次递归调用中，在前一次 `n-1` 没被抽到的情况下，本次抽到 `n-1` 的概率为：$(1 - \frac{k-1}{n-1}) · \frac{1}{n}$。将前后两次递归中总的概率加起来，得：
 74 | 
 75 | $$
 76 | (1 - \frac{k-1}{n-1}) · \frac{1}{n} + \frac{k-1}{n-1} = \frac{k}{n}
 77 | $$
 78 | 
 79 | 以此类推，可以证明每个元素被抽到的概率都是 $\frac{k}{n}$。
 80 | 
 81 | ### Floyd 非递归版本
 82 | 
 83 | 写成递归形式的 Floyd 算法很容易理解，但为了更高的性能，可以去掉递归，用循环改写：
 84 | 
 85 | ```python
 86 | def sample(n, k):
 87 |     ret = set()
 88 | 
 89 |     for i in range(n-k+1, n+1):
 90 |         num = random.randint(1, i)
 91 |         
 92 |         if num not in result:
 93 |             ret.add(num)
 94 |         else:
 95 |             ret.add(i)
 96 | 
 97 |     return ret
 98 | ```
 99 | 
100 | ### 测试
101 | 
102 | 多次运行此取样算法，然后统计各个数被取到的频率，可以观察到所有数呈均匀分布。
103 | 
104 | ```python
105 | counter = Counter();
106 | for i in range(50000):
107 |     random.seed(i)
108 |     nums = sample(20, 4)
109 |     counter.update(nums)
110 | 
111 | df = pd.DataFrame({"count": list(counter.values())}, index=counter.keys())
112 | df = df.sort_index()
113 | df.plot(kind="bar", legend=False)
114 | ```
115 | 
116 | ![<width,400px><ml,0>](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/10/12/5da1f805451253d178e890a2.jpg)
117 | 
118 | 
119 | ## 蓄水池抽样
120 | 
121 | 2020.1.3 补充：
122 | 
123 | 今天在书上看到另外一种抽样方法，比起之前的方法更加简洁，而且我在 C++ 的 STL 中就发现了这种抽象算法的实现。
124 | 
125 | 而且这个算法有一个巨大的优势，它能在只读的输入流中进行抽样，这意味中如果输入非常大，或者根本不知道会有多少输入的时候，此算法都能工作。
126 | 
127 | 其思想是，先从输入流中取 k 个数，放到池子里，这个池子中保留的数，会在处理完所有数之后，作为抽样结果。对后续到来的第 i 个数，有 `k/i` 的概率用它替换池子中的一个数。这样每个数都有概率被选择，先出来的数由于 i 较小，因此被放入池子中的概率较大，但是因为它较早地被放入了池子，在后面被其他数替换的概率也会增大。该算法奇妙之处就是他能保证每个数被抽到的概率是相同的。
128 | 
129 | ```cpp
130 | vector<int> sample(Stream<int>& stream, size_t k){
131 |     srand(time(nullptr));
132 |     vector<int> ret;
133 |     int i = 0;
134 |     // 先从流中拿出 k 个数放入池子中
135 |     while(i < k){
136 |         ret.push_back(stream.next());
137 |         i++;
138 |     }
139 | 
140 |     while(!stream.empty()){
141 |         // 随机生成一个小于 i 的数，这里可能不严谨，但可以表达其中的意思
142 |         size_t m = rand() % i;
143 |         // m 小于 k 的概率就是 k / i
144 |         if(m < k){
145 |             // 替换池子中的数
146 |             ret[m] = stream.next();
147 |         }
148 |         i++;
149 |     }
150 |     return ret;
151 | }
152 | ```
153 | 
154 | 证明起来很容易：
155 | 
156 | - 最后一个数，被抽中的概率为 $\frac{k}{n}$
157 | - 倒数第二个数，在倒数第二次循环时被抽中的概率为 $\frac{k}{n-1}$，在最后一次被覆盖的概率为 $\frac{k}{n-1}· \frac{k}{n} · \frac{1}{k}$，把这两部分做减法能得到概率 $\frac{k}{n}$。


--------------------------------------------------------------------------------
/site/assets/css/scss/m-icon.scss:
--------------------------------------------------------------------------------
 1 | @font-face {font-family: "iconfont";
 2 |     src: url('//at.alicdn.com/t/font_691982_vq02w6i35s.eot?t=1604216885919'); /* IE9 */
 3 |     src: url('//at.alicdn.com/t/font_691982_vq02w6i35s.eot?t=1604216885919#iefix') format('embedded-opentype'), /* IE6-IE8 */
 4 |     url('data:application/x-font-woff2;charset=utf-8;base64,d09GMgABAAAAAAgwAAsAAAAAEHAAAAfhAAEAAAAAAAAAAAAAAAAAAAAAAAAAAAAAHEIGVgCFHAqRDI1OATYCJANACyIABCAFhG0HgR8bxw0jEfaCkRIn+4sEG4ypNfQmtETa4oVYzzZ6DebjGpzCJAwLp7/LsOAzXdGme3+P5B8LETVSc2IKUSNVpdM8rUPrSJKKaqyqSMUdnv/feV/9E6cQJJ7OYDymAU1W5uebOgsWp94Pi6cfQ2PXpx03clIZapBPUQoImzCGvuLH/Vo9RKzpwzQ1Wjrx7WQfHW7RVCKJkEw0XshAIhI6kVITBraNI8paJNETK1/K8QABoHgKh9Zrmgy4SESKkOeyikrg1oKRI2YIV87u2bYA3cDCbXOIiwCwQH8++iE2XAACqwM5UVadtAb6PIcXPzFjZZRgFTDHowAQ7wSAAYQDIAF6e6OuA7aScI2ovsKkDQA8iYLfgOBDbHmTG2iK2RbSxW2KS/60WnkOYzUls0M8edN/4QGwkIRsUNhoBA4ePoxLAAE0AIgXaJ3MFoLnwL0ACzxHXoAEz21549gbBGyA5SBAAQ8EATbwFBCggWeDAAG8EAQ4wDp4AR54gb0AH7ywkUIbi0GACywBAQHwTwi+QCSSyHtTAogHAO+MGE4GSiJ4BsZGUAkCYn0PXEvQJLY8x2AepSj7FQd+xUjElu1tBDb2iI0p2x9HUaiJOjj42Cmpk0ZvWG2S0mcsfmiNubrempqxe1cajTKTSW6x5JvNJY3+WkrtmKd33ILw0q2azS4gX79cKdh3zB2odceYFpoGr6JmBSywvCVeeLDNi7OideYX4W1wRUuD+Otd8st4JWhMJAfo288r7IHNZlmWrCAkv3nl0f2bl2/bFygLqc7PVQquUI2tJmRxLjqB2eQv2LAFcVRbg4TrN0MJb90mZnMAf+NW1ZY8njoIiuZrmCp6hAmknApVKpyWqkLrNlxwIZfamkamReN2SxkX3cnlly5dVa54sVZcllVUocpqJWOUafUIqUIPnrnQZkGqfntj9Wf9/U+rB+i3mP13xbQDY2o5dyp+k7t2nfqIa/MRR0e1VqdzcNBt5gdoOrxf4+TEuLgwWkezGakslhs8NCjreEStztQ732AZtUl9XXVDc41RGh8+8u+rRJYn+ebHhepWVZumZdUxnlmcOUYVK0uqFDVyuax8t5CmTdVKKQVqrT2ckAoNhsscnZ4iGqGT1u0ZHkjYfSElwRgpgdqMWCoLTWtMAHzB6Si0iaIQBZT6C1hIZUCKWgbye2jtv4qN62q0esdeeoOTYqMmQI5UhhlH0AHIdbr8pU4Kp637HWp1zDaXedU77HEfJispicWwhCLLdjcHOvrkW6tTQfDGfVrIv3+rQNwScSAqX7gsX2Tfl8XboCsfU/fY0YZsDm4mP8/Lc9sHnfwKM0THoHv3hRAHrt1XdHcFiS4SBwu7d4djojGxPQ6yZRnhbS8iggiRvTcROI7wrvKucKX/wOWEaI+IGIcui8AZMxVDT2U3N2efGlrBFtbXCw9VJDZIqqslDYkVF3JPP0esD3q3rZz98oX0u1xrTf4aLnvxcvbKtt4PrIa9TF5WYpIDOAhFll0JTjSIx4vyROPFoMlmmUT+JRvxtlvyxJFyghh4QoXjI3EzSiHbOoUnDwhSRUuH76cI6GjxioCoj006w9KPUWZFiM8xbYkWYsDC6DDeb5PMRE3lMqOqQ/eRzIKNz6aFfbq7n9DlJu4xrMQxJUba3n/l1wND0jNGZcy43seZXNC/XRrjmJw+rAeuTti3PjDp9GrH1bt504MUsbEnG0pLarrNCuzocIiIoN9+mha28dmC8WPPnRv74exYdfTx0C27399/pv7f3zrR58X7D1k+Cct6NA7wxf7A226UGbt/Iw9Bae6a5O4FVrWJrC7EOsg65PbN/4+7vAuKcKROHtIu0q5G3Z3D/2Ye0Du3C2rfvDa5PlAxOT0lfbBXbiMwd90lneO6xHWWuMf2IRvo91QK9X5Vw673dAr9nufaSInt67Rrb+UuV0s7SboE6+wC6DkqYIkkNVVyMD5F6AZImPiDVSJm5HwgWZQsFsoFd+8uZvsVyIVilI0S+Ul8gpgU1E0yguD0VyfTiJpHksoGwtzmPI9YD82Y4dxm7jB+41eTFblC6HWUY50z2xd2/Z822xr5MMJaJuvq/kd8hIYlxxKYwX0ArO24XTtsxHtwoSNDAlbZ4a2YSZqFnfAPZkG8lTADWO/iY7gzovbiS3McVPgXHl3wDe7ADgAAMCAeSy0uHFhcJj7GtBGqRd1y0Oledmm5sMc3Lv33N+HOyTnxvvD8mTDgIpBoBBZsfMcG5EYYhIhqVT+cdzQnERlwMggAFO0AsECLE7t/ToXDb5ki3Bo/BgKHB2Bc/mqkVjiw0CTAxtUbKGESd6bZGQUYKhsACDXDA0RkJxAE2gATuaRGat0DFkfvgE0UDJSLvvOwz73H2N0TgWQ4ifEu7IRRsTDembzvoBcvqSrU9t9As00VfdM1c98gAh1jg/miB2YlFGEQr97JwHsUifAMEzeGOR3bVvVt2EwYsp0nBEgs3Z8Io3tga4IiNTTbtT7+HdAWnkQjVa4DfwNkZucu9Bqdg9obik5VXkvh2YU2YJ8qgpcmKBBefQo8zUJC6l/qDExYw8zISI5avynliprzy8InPwMACnkQUQohFVXTDdOyHdfzc7A57+CdNdK9YhtgE5FhRHTV6FHXSSagOsKN+ypI69faslnGvmSpV94udxnr5MVhofJ25pVCfwKqDAYolpRlAAA=') format('woff2'),
 5 |     url('//at.alicdn.com/t/font_691982_vq02w6i35s.woff?t=1604216885919') format('woff'),
 6 |     url('//at.alicdn.com/t/font_691982_vq02w6i35s.ttf?t=1604216885919') format('truetype'), /* chrome, firefox, opera, Safari, Android, iOS 4.2+ */
 7 |     url('//at.alicdn.com/t/font_691982_vq02w6i35s.svg?t=1604216885919#iconfont') format('svg'); /* iOS 4.1- */
 8 |   }
 9 |   
10 |   .iconfont {
11 |     font-family: "iconfont" !important;
12 |     font-style: normal;
13 |     -webkit-font-smoothing: antialiased;
14 |     -moz-osx-font-smoothing: grayscale;
15 |   }
16 |   
17 |   .icon-category:before {
18 |     content: "\e7f8";
19 |   }
20 |   
21 |   .icon-time:before {
22 |     content: "\e688";
23 |   }
24 |   
25 |   .icon-notebook:before {
26 |     content: "\e709";
27 |   }
28 |   
29 |   .icon-blog:before {
30 |     content: "\e601";
31 |   }
32 |   
33 |   .icon-paper:before {
34 |     content: "\e600";
35 |   }
36 |   
37 |   .icon-next1:before {
38 |     content: "\e669";
39 |   }
40 |   
41 |   .icon-mail:before {
42 |     content: "\e690";
43 |   }
44 |   
45 |   .icon-github1:before {
46 |     content: "\e712";
47 |   }
48 |   
49 |   .icon-tag:before {
50 |     content: "\e620";
51 |   }
52 |   
53 |   .icon-liuyan:before {
54 |     content: "\e655";
55 |   }
56 |   
57 |   .icon-plane:before {
58 |     content: "\e67e";
59 |   }
60 |   
61 |   .icon-list:before {
62 |     content: "\e695";
63 |   }
64 |   
65 |   .icon-folder:before {
66 |     content: "\e703";
67 |   }
68 |   
69 |   .icon-home:before {
70 |     content: "\e734";
71 |   }
72 |   
73 |   .icon-up:before {
74 |     content: "\e611";
75 |   }
76 |   


--------------------------------------------------------------------------------
/_posts/machine_learning/2019-10-04-pca.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: 机器学习 - 主成分分析
  4 | category: 机器学习
  5 | ---
  6 | 
  7 | 
  8 | 在机器学习中，一个样本常常有多个属性，即多个维度。但不同维度间可能具有相关性，还有的维度则完全是噪声。主成分分析（Principle Component Analysis, PCA）找到样本中的线性无关的变量，样本的其他特征可以有这些线性无关的变量线性组合得来，这些线性无关的变量被称为主成分。
  9 | 
 10 | 如下图所示，每个样本可以由坐标 $(x, y)$ 来唯一表示。但如果使用红色箭头表示的坐标系来表示，可以看到所有样本大都分布在其中一个坐标轴上，且样本两个坐标值之间没有了线性关系。
 11 | 
 12 | ![<width,500px>](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/10/04/5d9763d7451253d178dd6abd.jpg)
 13 | 
 14 | 所以如果将样本均投影到红色箭头表示坐标系下，每个样本就可以使用一个维度来表示，且不会损失太多信息。这就得到了降维的目的，由两维降到了一维。
 15 | 
 16 | PCA 将原本 $m$ 维的数据降维至 $d$ 维，相当于对原来 $m$ 维空间中的点投射到 $d$ 维空间中。
 17 | 
 18 | ### 最大化方差
 19 | 
 20 | 让样本在投射后的各个维度上应该分的足够开，即有较大的方差。
 21 | 
 22 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/18-11-30/pca1.png)
 23 | 
 24 | 坐标变换，实际上就是对样本 $x$ 做一个线性变换，下图中， $x$ 是变换前的向量，$z$ 是变换后的向量。$z_1$ 就是 $x$ 在 $w^1$ 方向上的坐标。其中单位向量 $w^1$ 就是其中一个主成分的方向。
 25 | 
 26 | <div align="center"><img src="https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/18-11-30/pca2.png" width="500px" /></div>
 27 | 
 28 | 要保证在变换后，各个维度上有较大的方差，即 $var(z)$ 要越大越好。因为各个主成分相互正交，而且 $w^i$ 的模会影响方差值，所以这里限制 $W$ 为单位正交矩阵。
 29 | 
 30 | 第一个主成分 $w^1$，就是能让 $var(z_1)$ 最大化，同时满足约束条件的向量 $w$。下图中蓝色方框中给出了具体式子和约束条件。
 31 | 
 32 | <div align="center"><img src="https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/18-11-30/pca3.png" width="500px" /></div>
 33 | 
 34 | 对方差 $var(z_1)$ 的进行化简：
 35 | 
 36 | <div align="center"><img src="https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/18-11-30/pca4.png" width="500px" /></div>
 37 | 
 38 | 在约束条件下求极值，使用拉格朗日乘子法：
 39 | 
 40 | <div align="center"><img src="https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/18-11-30/pca5.png" width="500px" /></div>
 41 | 
 42 | 可以看出:
 43 | 
 44 | $$
 45 | \left(w^{1}\right)^{T} S w^{1}=\alpha\left(w^{1}\right)^{T} w^{1}=\alpha
 46 | $$
 47 | 
 48 | 要最大化 $\alpha$，就是让它等于 $S$ 的最大的特征值，这样以来 $w^1$ 就是 $S$ 最大特征值对应的特征向量。
 49 | 
 50 | <div align="center"><img src="https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/18-11-30/pca6.png" width="500px" /></div>
 51 | 
 52 | 相应地 $w^2$ 就是 S 第二大的特征值对应的特征向量。
 53 | 
 54 | 因此，主成分就是 $x$ 的协方差矩阵的特征向量，主成分存在重要程度，由对应的特征值的大小决定。为了降维，通常选取最大的 N 个特征值对应的特征向量作为主成分。
 55 | 
 56 | ### 最小化重建误差
 57 | 
 58 | 从投射后的空间中恢复到原空间时，损失应该越小越好，即投射到新的空间下，没有损失太多信息。
 59 | 
 60 | 要利用主成分重建原样本，一种方法是对主成分进行线性组合，就相当于拿主成分拼凑出原样本。另外一种方法是在所有样本的均值的基础上，加上主成分的线性组合，相当于在均值的基础上，进行修修补补得出原样本。
 61 | 
 62 | 如果主成分具有很好的代表性，那么就能让重建误差足够小，因此可以定义损失函数：
 63 | 
 64 | <div align="center"><img src="https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/18-11-30/pca7.png" width="500px" /></div>
 65 | 
 66 | 这里 $u$ 为主成分，对于所有样本，找到一组 $u$ 让重建误差越小越好。
 67 | 
 68 | 
 69 | 为了让误差足够小，即对每一个样本，可以用主成分 $u^i$ 以及一组系数 $c$ 让下面的等式两边足够接近。
 70 | 
 71 | <div align="center"><img src="https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/18-11-30/pca8.png" width="500px" /></div>
 72 | 
 73 | 因为矩阵的 SVD 分解，可以保证分解后的矩阵相乘得到的结果和原矩阵相近，可以把矩阵 $X$ 写为 $X=U  \Sigma V^{T}$ 。
 74 | 
 75 | <div align="center"><img src="https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/10/05/5d9772e9451253d178e8d179.jpg" width="500px" /></div>
 76 | 
 77 | 因此 $U$ 的各列就可以作为主成分，后面两个矩阵 $\Sigma$ 和 $V$ 的乘积就相当于系数矩阵 $C$。通过调整 SVD 分解时中间矩阵的维度，就可以得到不同数量的主成分。
 78 | 
 79 | 因此做 PCA 降维的一种方法就是构造矩阵 X，然后对 X 做 SVD 分解，得到：
 80 | 
 81 | $$
 82 | X=U \cdot \Sigma \cdot V^{T}
 83 | $$
 84 | 
 85 | 其中 $U$ 的各列为特征向量，$\Sigma$ 的主对角上为特征值。每个特征向量就是一个样本的基本组成成分，对应的特征值越大，该成分越重要。
 86 | 
 87 | ## 实战
 88 | 
 89 | 在 sklearn 中使用 PCA 的方式如下：
 90 | 
 91 | ```python
 92 | from sklearn.decomposition import PCA 
 93 | 
 94 | pca = PCA(n_components=2)
 95 | # pca = PCA(n_components=0.95)
 96 | 
 97 | X_pca = pca.fit_transform(X)
 98 | ```
 99 | 
100 | `n_components` 用于指定主成分个数。当取值为整数时，就是主成分个数。当取值为 0-1 之间的小数时，此小数指明了主成分包含信息量的占比。
101 | 
102 | 在实践中，当样本量较少，特征中存在噪声时，使用 PCA 对数据降维，可以减缓过拟合。当数据量较大的时候，使用 PCA 往往会因为损失了信息，会导致训练效果变差。
103 | 
104 | 
105 | ```python
106 | """
107 | 主成分
108 | """
109 | >>> pca.components_
110 | pca.components_
111 | array([[-0.40711968, -0.5547244 , -0.70611078,  0.16715852],
112 |        [ 0.1961092 , -0.0245544 ,  0.13603638,  0.97078956]])
113 | 
114 | """
115 | 主成分方差所占比重
116 | """
117 | >>> pca.explained_variance_ratio_
118 | array([0.5655843 , 0.11474345, 0.10048613, 0.04653823])
119 | 
120 | 
121 | """
122 | 奇异值
123 | """
124 | >>> pca.singular_values_
125 | array([64.32040069, 41.74411226])
126 | ```
127 | 
128 | 当样本量很大的时候，因为要进行矩阵分解，PCA 就会非常慢，为此可以使用 random PCA，它采用梯度下降的策略，寻找一个近似的矩阵分解方案。在样本量很大的时候，这个方法速度会快很多，且解的质量也不会太差。 
129 | 
130 | ```python
131 | pca = PCA(n_components=2, svd_solver="randomized")
132 | ```
133 | 
134 | ## 推荐阅读
135 | 
136 | 要想学懂 PCA，必须明白协方差、SVD、拉格朗日乘子法。如果不清楚这些概念建议查看相关博客。
137 | 
138 | 李宏毅老师的机器学习课程中 [Unsupervised Learning: Linear Dimension Reduction](http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML16.html) 对 PCA 进行了详细的推导，建议查看此视频进行学习。
139 | 
140 | Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow 的第 8 章 Dimensionality Reduction 详细大致讲解 PCA 的原理，给出了很多 PCA 使用案例，建议阅读。


--------------------------------------------------------------------------------
/_posts/network/2015-09-03-http-cookit.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: HTTP Cookie
  4 | category: 网络
  5 | ---
  6 | 
  7 | * toc
  8 | {:toc}
  9 | 
 10 | 
 11 | Web 服务常常需要用户进行登录，比如订票、买东西，只有登录了才能和服务器才知道当前客户对应的是哪一个账户。
 12 | 
 13 | 在 HTTP 协议中，通过 cookie 来标识客户。cookie 是一组记录在客户端的信息，客户端的每次 HTTP 请求都要把 cookie 传给服务器。服务器可以通过 `Set-Cookie` 头部字段设置一条 `cookie`。
 14 | 
 15 | 如此，在客户首次与服务器建立连接时，服务器可以设置一个 cookie，比如 `name=wang`，下次客户端发起新的请求是就会带上这条 cookie，如此服务器就知客户是谁了。
 16 | 
 17 | 
 18 | ## 检查 cookie 是否开启
 19 | 
 20 | 可以通过 navigator.cookieEnabled 这个属性判断浏览器是否开启了cookie。
 21 | 
 22 | ## cookie 的属性
 23 | 
 24 | ### path
 25 | 
 26 | 默认的 cookie 只对于他的同级目录和子目录可见，而对于父级目录不可见，比如在 `http://www.example.com/blog/category/index.html` 这个页面创建的 cookie 就不能被 `http://www.example.com/blog/index.html` 访问到。但是他对于 `/category` 目录中的文档是可见的。但是有的时候我希望来自同一个域名下的文档都可以共享 cookie 这个时候就可以将path 属性设置为 `/` 。
 27 | 
 28 | ### domain
 29 | 
 30 | 有的时候子域名间需要共享cookie,这个时候就需要用来 domain 属性。
 31 | 
 32 | ### secure
 33 | 
 34 | 这是一个布尔类型属性，它用来指示cookie以何种形式通过网络传输，如果为 true ，那么必须是 https 协议才能进行传输。
 35 | 
 36 | ## 保存 cookie
 37 | 
 38 | ```js
 39 | document.cookie = "version="+encodeURIComponent(document.lastModified)
 40 | ```
 41 | 
 42 | cookie 的名值中不允许有`;`出现，所以在存储的时候需要对其进行编码。按上面的方式存储 cookie 的有效期只是在浏览器会话期间，要想延长 cookie 的有效期就需要设置 max-age 属性来指示 cookie 的有效期。（单位为秒）
 43 | 
 44 | ```
 45 | name=value;max-age=seconds
 46 | ```
 47 | 
 48 | 需要设置其他属性同样只需要在设置cookie 之前追加在字符串后面就行了
 49 | 
 50 | ```
 51 | ;path=path
 52 | ;domain=domain
 53 | ;secure
 54 | ```
 55 | 
 56 | 要改变 cookie 的值就按同样的方法再次设置就可以了。如果删除一个 cookie 只需将他的 max-age 设置为 0 就可以了。
 57 | 
 58 | 
 59 | ## cookie 的局限性
 60 | 
 61 | 为每个 web 服务器保存的 cookie 不能超过20个，单个cookie大小不能超过4KB
 62 | 
 63 | ## cookie 的分类
 64 | 
 65 | ### 1. session cookie
 66 | 
 67 | session cookie 没有过期时间，当浏览器关闭后就消失了，浏览器将没有设置过期时间的 cookie 作为 session cookie 来处理。
 68 | 
 69 | ### 2. Persistent cookie
 70 | 
 71 | Persistent cookie(意为：持久 cookie),这类 cookie 有一个明确的过期时间，在这段时间里面访问 cookie 归属的网站的时候都会携带 cookie ，通常用 cookie 来存储一些用户的访问信息，比如保存用户的登录状态，用户不必每次访问网站都进行登录。
 72 | 
 73 | ### 3. Secure cookie
 74 | 
 75 | Secure cookie ，这类 cookie 只会在加密传输的情况下携带，比如通过 HTTPs 传输的时候。在通过 HTTP 传输的时候，不会携带设置有 secure 标记的 cookie。
 76 | 
 77 | ### 4. HttpOnly cookie
 78 | 
 79 | 当一个 cookie 被设置为 httpOnly 的以后，这个 cookie 不能被 javascript 这样的脚本语言拿到，只能通过 HTTP 和 HTTPs 传输。
 80 | 
 81 | 
 82 | ### 5. Third-party cookie
 83 | 
 84 | cookie 的 domain 属性和浏览器地址栏中 domain 一致的 cookie 叫做 first-party cookie， 第三方 cookie 就是其 domain 属性不同于 浏览器地址栏中的 domain 的，这类 cookie 通常是属于第三方广告商的，他们会记录用户的访问习惯，和浏览历史，以此做到准确投放广告。
 85 | 
 86 | 对于其中的原理，可以举个例子说明：
 87 | 
 88 | 当你访问 `a.example.com` 这个网站的时候，这个网站中引用了广告商 `ad.com` 的广告，当广告内容被下载后，广告提供商的脚本会设置一个属于 ad.com 的 cookie 。下次当你访问 `b.example.com` 的时候，这个网站的广告也是 `ad.com` 提供的，此时向 `ad.com` 请求广告内容的时候就会携带上次访问 `a.example.com` 的时候设置的 cookie 。
 89 | 
 90 | 对于现代浏览器都提供了禁止第三方 cookie 的选项。  
 91 | 
 92 | ## cookie 的注意事项
 93 | 
 94 | ### Domain 和 Path
 95 | 
 96 | 域名和路径定义了一个 cookie 的可见范围，它告诉浏览器这个 cookie 的归属范围。出于安全原因， domain 只能设置为当前域名的上层域名，比如在 `example.com` 下就不能把 cookie 的 domain 设置为 `a.example.com` ，而 `a.example.com`可以设置 cookie 的 domain 为 `example.com`
 97 | 
 98 | 对于 path ，如果一个 cookie 的 path 为 `/doc` 那么在 ``/doc/` 下面的所有页面都能访问到这个 cookie （前提是 domain 也是满足要求）
 99 | 
100 | ### 跨站脚本 - cookie 盗窃
101 | 
102 | 一个 web 页面中可以包含来自其他站点的 js 脚本，而这些脚本是可以访问到该网站下的 cookie 的，这种情况下这些脚本就可能将 cookie 内容发送出去。比如采用下面方法，将 cookie 发送给 www.foo.com
103 | 
104 | ```javascript
105 | var img = document.createElement(‘img’);
106 | img.src = ‘www.foo.com?’+ ‘text=’ + escape(document.cookie);
107 | ```
108 | 
109 | ### 跨站伪造请求
110 | 
111 | 假如，Mallory 在访问 Bob 的博客的时候在他的博客中留言，其中包含如下内容：
112 | 
113 | ```html
114 | <img src="http://bank.example.com/withdraw?account=bob&amount=1000000&for=mallory">
115 | ```
116 | 
117 | 如果 Bob 访问过银行的网站，且其中的 cookie 还没有过期，那么当 Bob 在访问自己的博客的时候，就会加载这幅图片，就会想 `bank.example.com` 发起请求，这样就形成了一次伪造的请求。
118 | 
119 | ## 使用 javascript 操作 cookie
120 | 
121 | ```javascript
122 | util.setCookie = function(name, value, dayToLive, option) {
123 | 	var cookie = name + '=' + encodeURIComponent(value);
124 | 	if (typeof dayToLive === 'number') {
125 | 		cookie += ';max-age=' + (dayToLive * 24 * 60 * 60);
126 | 	}
127 | 	if (option) {
128 | 		for (var key in option) {
129 | 			if (key === 'path') {
130 | 				cookie += ';path=' + option[key];
131 | 			} else if (key === 'domain') {
132 | 				cookie += ';domain=' + option[key];
133 | 			} else if (key === 'secure') {
134 | 				cookie += ';secure';
135 | 			}
136 | 		}
137 | 	}
138 | 	document.cookie = cookie;
139 | };
140 | 
141 | util.getCookie = function(name) {
142 | 	var cookie = document.cookie;
143 | 	var list = cookie.split(/;\s/);
144 | 	for (var i = 0; i < list.length; i++) {
145 | 		var pair = list[i].split('=');
146 | 		if (pair[0] == name) {
147 | 			return decodeURIComponent(pair[1]);
148 | 		}
149 | 	}
150 | 	return null;
151 | };
152 | ```
153 | 
154 | 需要注意的是：在  浏览器中 javascript 是拿不到 cookie 的过期时间，path，domain 等信息的，多条 cookie 之间是通过 `; ` 分号和空格分隔开来的，形如：`"name=xiaoming; age=21" ` 所以想要获取 cookie 首先需要使用 `/;\s/` 这样的正则将其分隔开来，然后对每一项，再使用 `=` 分割这样就得到了键值。最后在对结果进行一些转码。
155 | 
156 | 而设置 cookie 的方法则是直接在 document.cookie 上面赋值即可，这不会影响到现有的 cookie （当年我觉得这样会覆盖掉现有的 cookie，其实是并不是这样的），对于 domain 和 path 等信息，可以设置但是不会被访问到。
157 | 
158 | 


--------------------------------------------------------------------------------
/_posts/cs/2015-02-10-data-representation.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: 计算机中数值的表示
  4 | category: 理解计算机
  5 | ---
  6 | 
  7 | 
  8 | ## 首次使用
  9 | 
 10 | 
 11 | 1. 远程登录到实验室某台不关机的服务器上。
 12 | 
 13 | ssh xxx@ip
 14 | 
 15 | 
 16 | 2. 使用 screen 新建会话
 17 | 
 18 | screen -S zhy
 19 | 
 20 | 此时应该会新建一个 shell 页面
 21 | 
 22 | 
 23 | 3. 连接 GPU 服务器
 24 | 
 25 | ssh xxx@192.168.5.201
 26 | 
 27 | 4. 申请 GPU
 28 | 
 29 | srun --gres=gpu:1 -n1 --pty
 30 | 
 31 | 5. 后台运行脚本
 32 | 
 33 | python x.py &
 34 | 
 35 | 6. 直接关闭终端软件
 36 | 
 37 | 点右上角 x
 38 | 
 39 | 
 40 | ## 查看运行情况
 41 | 
 42 | 1. 登录
 43 | 
 44 | ssh xxx@ip
 45 | 
 46 | 2. 进入 screen 会话
 47 | 
 48 | 运行如下命令
 49 | 
 50 | screen -ls
 51 | 
 52 | 结果大致如下（下面是我运行时候的结果）：
 53 | 
 54 | wangyu@bd28:~$ screen -ls
 55 | There are screens on:
 56 |        16255.wy        (04/28/2020 09:58:03 PM)        (Attached)
 57 |         15989.pts-27.bd28       (04/28/2020 09:56:33 PM)        (Attached)
 58 | 
 59 | 
 60 | 3. 进入会话（这里 zhy 是前面使用 screen -S 新建会话时候制定的名字，可以随意）
 61 | 
 62 | screen -x zhy
 63 | 
 64 | 此时你应该可以可以继续在 GPU 服务器上操作了。
 65 | 
 66 | 
 67 | 谈谈数值在计算机中的表示。但跳过进制之间的转换。由于水平有限错误在所难免，如有发现恳请指出。
 68 | 
 69 | 
 70 | 
 71 | 
 72 | 
 73 | ## 1 原码，反码，补码
 74 | 
 75 | ### 1.1 原码
 76 | 
 77 | 最高有效位是符号位，用来指明这个数是正还是负。当最高位为1是表明这个数是负数。当为0的时候表示为正数。所以八位二进制数：1000 0011B 的原码表示为 -3。
 78 | 
 79 | ### 1.2 反码
 80 | 
 81 | 有的老师说，一个正数的反码表示同它的原码表示，而一个负数的反码表示是其对应整数的原码表示的各位取反。举例：3的反码与原码表示都是 0000 0011B，而-3的反码表示是将-3的原码表示除过符号位各位取反，-3的原码表示为: 1000 0011B ，所以其反码表示为：1111 1100B。这里很容易将符号位与原码表示搞混淆。所以我建议下面这个方法：
 82 | 
 83 | 我们将最高位解释为负权，其他位为正权。举例：1000 0011B的反码表示为 -1*（2^7-1）+1*(2^6)+1*(2^5)+1*(2^4)+1*(2^3)+1*(2^2)+0*(2^1)+0*(2^0)=-3。 这里最高位的1代表的不是128而是-127，也就是-(2^7-1),如果是32位的数，那么它最高位的1代表的将是-(2^31-1)
 84 | 
 85 | ### 1.3 补码
 86 | 
 87 | 看完反码可能你已经晕了，但是没有关系，补码可以将你解救出来。补码的规则很简单，最高位为负权，不像反码那样特殊减去了1，这里如歌是8位的二进制，那么它最高位的权值将是-2^7 也就是 -128，在反码里面最高位权值是 -127。所以我们知道用补码表示的最小的8位二进制数是：1000 0000B = -128 ，而最大为：0111 1111B = 127
 88 | 
 89 | 这样你就明白了吧。总结一下，原码和反码最小数和最大数的绝对值是相等的，而且0有两种表示方法。对于补码，最小数的绝对值比最大数大1。对于0的表示方法只有一种，那就是全0。以上知识很有用，尤其是补码。所以没有明白的再思考思考。
 90 | 
 91 | 
 92 | ## 2. 有符号数，无符号数
 93 | 
 94 | 在计算机中，面对有符号与无符号共存的场景我们常常感到困惑，根本原因在于没有理解他们的表示与两者之间的转换关系。下面分别进行讨论
 95 | 
 96 | ### 2.1 有符号数
 97 | 
 98 | 在计算机中，有符号数是用补码表示的，脑补一下补码的表示吧。我们需要最有注意的一个问题是，补码表示的非对称性。
 99 | 
100 | ### 2. 2 无符号数
101 | 
102 | 无符号的编码自然不是上面讲的三种编码方式中的任何一种咯。它不会是负数。它的编码方式是最最简单的。1111 1111B=255 ，对就是你想的那样。最高位乖乖地表示128，没有一点问题。
103 | 
104 | ### 2.3 有符号数的上溢和下溢
105 | 
106 | 我们考虑，200*300*400*500对于32位的有符号数来说，它的计算结果，不知道的可能会让他大吃一惊，得到的结果是：-884 901 888，这是一个负数，显然不符合逻辑。原来它发生了上溢，即超过能表示的最大值。同理小于最小的数以后会出现下溢出：
107 | 
108 | 现在将上下溢出的后果总结如下：（皆以8位为例，最大127，最小-128）
109 | 
110 | + 上溢：100+30 = 130 上溢，运算结果为 130 - 2^8 = 130 - 256 = -126 。这样你就明白了对8位的数来说，上溢后结果为减去 2的8次方（2^8）。
111 | + 下移：-100-30 = -130 下溢，结果为 -130 + 2^8 = 126。也就是说发生下溢后结果需要加上一个2的8次方。
112 | + 没有溢出：100+10 = 110，-100-10 = -110  该是咋就是咋，没有什么特殊的。
113 | 
114 | 对于32位要灵活运用，当一个有符号数大于 2^31-1 后它的结果就是 其减去2^32后的值。
115 | 
116 | 说了这么多，记住这个箭头就是了， 最大值加1会溢出成为最小值，最小值减1就会变成最大值，一个轮回有没有？ -128 <--> 0 <--> 127 <--> -128 <--> ...  所以不要太贪婪，否则前功尽弃啊。这一点在编程中也是最最容易犯错的一定要注意。
117 | 
118 | ### 2.4 无符号数的上溢和下溢
119 | 
120 | 有符号的讲了那么多，为的就是有符号的能少说两句。
121 | 
122 | ...<--> 255 <--> 0 <--> 255 <--> 0 <--> ...      
123 | 
124 | 简单一句话，255加1以后就会变成0，0减去1就会变成255。逆袭啊？
125 | 
126 | 至于公式嘛，就是 大于255的就会减去 2^8（256），小于0的就会加上2^8。
127 | 
128 | 
129 | ## 3. 有符号无符号之间的转换
130 | 
131 | 有时候，我们在会将一个有符号数赋值给无符号数，有时候反之。会存在什么隐患呢，这样的转换是如何进行的呢。
132 | 
133 | 其实很简单，计算机只是换了一下编码方式而已。有符号数 -1 赋值给无符号数，计算机会将有符号数 -1 的 编码 1111 1111B 按照无符号的编码方式来解读，这样得到的结果就是 255了。
134 | 
135 | 而无符号数 250 赋值给一个有符号数后 250的无符号编码 1111 1010B 会被解读为有符号数，所以结果将是 250-256 = -6. 最高位的权值不再是128了而是-128，所以实际上是被减去了256。
136 | 
137 | 这一点比较容易理解，就是一个编码方式的转变罢了。
138 | 
139 | ## 4. 左移右移
140 | 
141 | 这么简单的东西还拿出来讲，左右移位谁不知道。但是我还是有必要提提。
142 | 
143 | ### 4.1 左移
144 | 
145 | 左移就是各位向左移动一位，之后在最右边置0。所以，左移在不产生溢出的情况下可以看作是乘以了2。
146 | 
147 | ### 4.2 右移
148 | 
149 | 右移比较特殊，对于有符号数由于要保持符号，所以有符号负数右移时在左边补1。如果一直右移的话，最后就就变成0xFFFFFFFF 即-1。对于有符号正数，在其左边补0。也就是用它的符号位来扩展。这样的右移我们称之为算数右移。
150 | 
151 | 对于，无符号数的右移在其左边补0，所以一直右移的话最后会变成0x00000000 即0。这样的右移我们称之为逻辑右移。
152 | 
153 | 总结一下：有符号正数和无符号数在右移的时候都是在左边补0，而有符号负数是在左边补1。
154 | 
155 | ## 5. 浮点数
156 | 
157 | 现在计算机系统中的浮点表示基本都是采用IEEE754表示法。这里对它进行介绍，明白了浮点的表示以后我想你会明白很多之前困扰你的地方。
158 | 
159 | 在C语言里面，我们常常用到float和double这两种浮点类型，当然还有long double。但是他们的原理是一样的。我们介绍32位的float，之后很容易就可以扩展到double，long double。
160 | 
161 | 浮点表示是采用阶码，尾数，符号数这三个部分来表示一个浮点数的。看下图：
162 | 
163 | 
164 | ![浮点数的字节形式](http://img.blog.csdn.net/20150325225901575)
165 | 
166 | 这个浮点数的值可以表示为 Value=(-1)^S*M*2^(exp-127)，（注意：因为exp表示的是一个无符号数，减去127可以让指数的范围为-127~128）。下面说明这里的S，M，E分别是什么。
167 | 
168 | 用52.1314这个数的存储来说明：
169 | 
170 | + 这是个正数所以S为0，S是符号位。
171 | + 将这个数转换为2进制表示：110100.001000011(转换方法为：整数部分，除2取余，直到商为0，反向取余数。小数部分，乘2，直到被乘数为零，每次乘法的进位顺序取)。
172 | + 将二进制表示的这个数右移，直到小数点前面只有一位。1.10100001000011，移动了5次。1.10100001000011*2^5 = 110100.001000011
173 | + 因为小数点前面必然为1，所以在表示的时候可以去掉它。得到基数为：00000000010100001000011 这个是M （小数点后面部分,前面补0，补够23位）
174 | + 指数实际上是5，所以exp的值为127+5 = 132，exp：10000100
175 | 
176 | 
177 | 所以52.1314的浮点表示是: 0 10000100 00000000010100001000011
178 | 
179 | double类型也是一样的，只不过它的exp是11位，fra部分是52位。
180 | 
181 | 其次有下面几个特殊情况需要注意：
182 | 
183 | + 所有位为0表示0
184 | + exp=1111..1(全1) 以及 frac=000..0(全0) 表示无穷大
185 | + exp=1111..1（全1） 以及 frac!=000..0（不全0） 代表 NAN（not a number）.
186 | 
187 | 你不能理解我也表示理解，这确实需要你好好琢磨琢磨。
188 | 


--------------------------------------------------------------------------------
/_posts/cpp/2015-03-15-c-pre-processing.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: C/C++ 预处理指令详解
  4 | category: C/C++
  5 | ---
  6 | 
  7 | - *
  8 | {:toc}
  9 | 
 10 | ## 1.预定义符号
 11 | 
 12 | 下面这些是 C 语言的预处理器定义的符号，他们都是常量十进制数，或者是常量字符串。他们用来指示调试输出来源以及为编译程序加入时间信息。其详细意义如下：
 13 | 
 14 | + `__FILE__`：表示当前源文件的文件名
 15 | + `__LINE__`：当前行在源文件中的行数
 16 | + `__DATE__`：编译时候的日期
 17 | + `__TIME__`：编译时候的时间
 18 | + `__STDC__`：如果编译器遵循 ANSI C 那么这个值就是 1，否则未定义。
 19 | 
 20 | 
 21 | ## 2. #define
 22 | 
 23 | ### 2.1 使用 `#define` 定义字面上的替换
 24 | 
 25 | ```c
 26 | #define uint  unsigned int
 27 | #define uchar unsigned char
 28 | ```
 29 | 
 30 | 这样可以免去敲冗长的类型名，在预处理阶段所有的 `uint` 和 `uchar` 都会被分别替换为 `unsigned int` 和 `unsigned char`。
 31 | 
 32 | **注意**：遇到上面这样的情况，最佳的选择是使用typedef来创建别名，而不是使用宏替换。
 33 | 
 34 | ```c
 35 | typedef unsigned int uint;
 36 | typedef unsigned char uchar;
 37 | ```
 38 | 
 39 | `##` 用来连接两个符号，举例如下:
 40 | 
 41 | ```c
 42 | #define concat(m, n) m##n
 43 | #define ABCD 10
 44 | 
 45 | cout << concat(AB, CD); 
 46 | cout << ABCD
 47 | cout << 10
 48 | ```
 49 | 
 50 | `concat(AB, CD)` 把 AB 和 CD 拼起来得到了，ABCD 而 ABCD 又是另外一个宏定义，进而被替换成了 10。我暂时想不到这个可以在哪里派上用场。
 51 | 
 52 | `#arg` 被用来指代宏参数对应的字符串，下面一个例子能让你明白：
 53 | 
 54 | ```c++
 55 | #define PRINT(x)  cout<<"The value of " #x " is " << x
 56 | 
 57 | int width = 10;
 58 | PRINT(width*width);
 59 | // The value of width*width is 100
 60 | ```
 61 | 
 62 | ### 2.2 用宏来充当函数
 63 | 
 64 | 对于简短的函数段，可以直接插入在程序中，而若使用函数的话会在调用函数时产生堆栈上的开销。其次有些时候，参数类型不明确所以用函数实现不够方便。
 65 | 
 66 | 如：
 67 | 
 68 | ```c
 69 | #define MAX(x,y)   ((x) > (y) ? (x) : (y))
 70 | 
 71 | int a = 1, b = 2;
 72 | int max = MAX(a, b);
 73 | ```
 74 | 
 75 | 对于任何可以用 > 比较的类型，都可以使用这个宏定义来求两者间的最大值。
 76 | 
 77 | 
 78 | ### 2.3 副作用
 79 | 
 80 | **副作用 1**
 81 | 
 82 | 观察上面的定义，每一个字符都用括号括起来了，这是因为，宏只做简单的替换，带参数的宏定义也如此。
 83 | 
 84 | 如果写成下面这样:
 85 | 
 86 | ```c
 87 | #define MAX(a, b)   a > b ? a : b
 88 | ```
 89 | 
 90 | 在程序中假如有这样的语句:
 91 | 
 92 | ```c
 93 | int a = MAX(1+2, 2+3);
 94 | ```
 95 | 展开后得到:
 96 | 
 97 | ```c
 98 | int a=1+2>2+3?1+2:2+3;
 99 | ```
100 | 
101 | 这可不是我们想要的结果。所以记住一点，它只是替换，并不求值。
102 | 
103 | **副作用 2 **
104 | 
105 | 在考虑上面的 MAX 宏,我们用下面的方式调用：
106 | 
107 | ```c
108 | c = MAX(a++,b++);
109 | ```
110 | 
111 | 我们希望他像函数一样，在比较完大小后，a和b的值都能加1.但是我们展开后得到:
112 | 
113 | ```c
114 | c=((a++)>(b++)?(a++):(b++));
115 | ```
116 | 
117 | 显然，较大的那个变量将自加两次，这显然不是我们想要的。所以我们一定要注意自己调用的函数是不是真的是一个函数，因为我们无法成外观上区分他们到底本质上是不是一个宏。
118 | 
119 | **副作用 3 **
120 | 
121 | 有时候，因为宏而产生的错误是很隐蔽的，让你难以发现，考虑：
122 | 
123 | ```c
124 | #define PRINT_TWICE(ch)   putchar(ch);putchar(ch)
125 | ```
126 | 
127 | 我们希望这个定义能够帮我们打印一个字符两次，当我们用下面这样的方法调用时：
128 | 
129 | ```c
130 | PRINT_TWICE(fgetc(fp));
131 | ```
132 | 
133 | 从文件中读取一个字符，然后打印两次。但宏展开后，它从文件中读取了两次，取得两个字符，然后输入到标准输出。
134 | 
135 | 综上，当在使用宏的时候，一定要警惕，它是否会产生上面提到的这类不易察觉的副作用。在 C++ 中，应该尽可能使用 `const` 定义常理，使用 `inline` 定义内联函数，以此来消除对宏的依赖。
136 | 
137 | ### 2.4 `#undef`
138 | 
139 | 当我们需要在重新定义一个宏，或者要移除一个宏的时候，可以使用下面这样的形式：
140 | 
141 | ```c
142 | #undef name
143 | ```
144 | 
145 | ### 2.5 分号加不加？
146 | 
147 | 当用宏定义了一条完整的语句的时候，可能希望给它后面加上一个分号，这可能不会产生大的问题。其实我们在使用了宏以后习惯性的会在其后面加上一个分号，像普通的语句一样。永远记住宏做的工作是替换，你在定义它的时候在其后加了分号，那么在调用的时候就可以不用加分号了。如过你加了那么一个分号将产生一条空语句。
148 | 
149 | 虽然一条空语句可能不会影响到程序的执行，你也不会察觉，但是有时候它可能会导致发生错误，举例如下:
150 | 
151 | ```c
152 | #define PRINT(x)  putchar(x);
153 | 
154 | if(...)
155 | 	PRINT(x);
156 | else
157 | 	...
158 | ```
159 | 
160 | 这仅仅是由于 if 语句因为下面只有一条语句所以没有加花括号，但是这个宏实际上是两条语句。当然这个问题可以在 if 后加上花括号来解决。
161 | 
162 | ## 3. 条件编译
163 | 
164 | 有的时候，程序会根据编译环境来有逻辑的进行编译，举例如下:
165 | 
166 | ```cpp
167 | #define DEBUG 1
168 | 
169 | #if DEBUG
170 | 	cout << status << endl;
171 | #endif
172 | ```
173 | 
174 | 当我们在调试程序的时候，我们可以将 `DEBUG` 设置为 1，但调试完毕后将他改为 0，这样我们不必去删除分布于源文件中各个地方的打印状态的语句了。
175 | 
176 | 条件编译提供了一些关键字: `#define, #ifdef, #ifndef, #if, #elif, #else` 等，用法如下：
177 | 
178 | ```cpp
179 | #define LOG_LEVEL 1
180 | 
181 | #if LOG_LEVEL == 0
182 | 	info();
183 | #elif LOG_LEVEL == 1
184 | 	warning();
185 | #endif
186 | 
187 | #define _MSC_VER 1723
188 | #ifdef _MSC_VER
189 | 	...
190 | #else
191 | 	...
192 | #endif
193 | 
194 | #if !defined(_MSC_VER)
195 | 	...
196 | #endif
197 | ```
198 | 
199 | 其中意义大多很明确，`#ifdef name` 是说如果定义了 `name`, `#ifndef name` 是说如果没有定义`name`。
200 | 
201 | ## 4. `#include`
202 | 
203 | 当我们的程序需要依赖于起来的头文件的时候，我们使用 `#include <filename>` 这样的指令将源文件包含进来，就像用被包含的文件的内容替换掉 `#include <filename>` 这句话一样。
204 | 
205 | 使用尖括号是说明被包含的文件是库文件，它的路径由编译器的配置决定。使用 `#include "filename"` 这样的用双引号包围的形式，是说该文件不是库文件，它的路径引号内路径决定。如 `#include "cv/cv.h"` 是说包含当前目录下 cv 文件夹中的 cv.h 文件。
206 | 
207 | 当工程很大的时候，文件互相包含，这个时候会出现同一个文件被嵌套包含多次的情况，为了避免这种情况，我们在定义头文件时，常常像下面这样写:
208 | 
209 | ```c
210 | #ifndef __SPEACIAL_H_
211 | #define __SPEACIAL_H_
212 | 
213 | //在这里写文件内容
214 | 
215 | #endif
216 | ```
217 | 
218 | 每个头文件在被预处理的时候，都会定义一个特殊的宏。如果相同的头文件再次出现的时候，由于在 `#ifndef` 这里将为假，所以忽略里面的内容。这样一份头文件就只会被包含一次。
219 | 
220 | ## 5. 其他指令
221 | 
222 | ### 5.1 #error
223 | 
224 | ```c
225 | #error  error message
226 | ```
227 | 
228 | 当预处理器遇到这条指令的时候，会出现错误信息。在某些条件编译的分支中使用这个，或许还有点用。
229 | 
230 | ### 5.2 #line
231 | 
232 | ```c
233 | #line 12 "main.cpp"
234 | ```
235 | 
236 | 这个指令后面可以跟两个常量，前面一个是数字是必须有的，后面的字符串可有可无。前面的 12 将会修改 `__LINE__`，它指明下一行的行号是 12，而后面的字符串会修改 `__FILE__`。
237 | 
238 | ### 5.3 #progma
239 | 
240 | 这个指令因编译器不同而不同，它用来支持因编译器而异的特性。
241 | 
242 | ## 6. 结语
243 | 
244 | 关于 C/C++ 中的预处理指令需要讲的就这么多，以后遇到新的知识点了，再进行补充。


--------------------------------------------------------------------------------
/_posts/network/2020-06-10-http-body-encoding.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: HTTP 报文编码格式
  4 | category: 网络
  5 | ---
  6 | 
  7 | * -
  8 | {:toc}
  9 | 
 10 | 因为最近在尝试写一个 HTTP 服务器，用来练练手。处理 HTTP 请求首先需要解析 HTTP 请求，其中 HTTP 的 body 部分格式相对较多，在此期间我对常见格式做了了解，先记录于此。
 11 | 
 12 | ## chunk 编码
 13 | 
 14 | 首先谈谈 HTTP 报文的 body 部分在传输过程中的编码。而下一节，讨论内容的解析，即给定一个字符串，要从中解析出有用信息来。这两者都需要依靠某种规定好的格式。
 15 | 
 16 | 在 HTTP 中有 `Content-Length` 这个头部，它指明 body 部分有多少字节。如果知道待发送的数据的总长度，`Content-Length` 的值自然可以获得。此时数据可以直接放在 body 部分传输，并设置好 `Content-Length` 即可。为什么 `Content-Length` 很重要，因为现在的 HTTP 请求通常都是流水线式的，即在一个 TCP 连接中一次性发送多个请求。接收方需要从多个请求中找到请求之间的间隔吧，这就需要知道每个请求的 body 部分有多长。
 17 | 
 18 | 
 19 | 有时候，在没得到全部待发送数据之前，就需要先发送部分数据了，此时自然不知道 `Content-Length` 是多少。那么多个请求如何区分开呢？这种情况下可以使用 chunk 编码。chunk 即分块的意思。
 20 | 
 21 | 这种方式把 body 分成了多个分块来发送，每个分块的长度都是已知的。每个分块前都以十六进制指明分块的长度，而后跟随分块的内容。这样每个分块有多长就知道了。最后一个分块的长度为 0，它作为最后一个 chunk 的标志。
 22 | 
 23 | 下面借用 [MDN](https://developer.mozilla.org/zh-CN/docs/Web/HTTP/Headers/Transfer-Encoding)上的一个例子，如下：
 24 | 
 25 | ```http
 26 | HTTP/1.1 200 OK 
 27 | Content-Type: text/plain 
 28 | Transfer-Encoding: chunked
 29 | 
 30 | 7\r\n
 31 | Mozilla\r\n 
 32 | 9\r\n
 33 | Developer\r\n
 34 | 7\r\n
 35 | Network\r\n
 36 | 0\r\n 
 37 | \r\n
 38 | ```
 39 | 
 40 | 头部 `Transfer-Encoding: chunked` 说明 body 采用 chunk 编码。body 中的第一行为 7，说明第一个分块的长度为 7。下一行起 7 个字符就是本 chunk 的内容。解析 chunk 编码很容易，读取第一行得到第一个 chunk 的长度，然后从接下来的一行起读取指定长度的内容。而后再读取下一个 chunk。
 41 | 
 42 | 有了 chunk 编码方式，可以把数据分成多个部分发送，不必等到所有数据都收集完了之后才一次性发送。最后一个 chunk 的长度为 0，用于标志 body 结束了。
 43 | 
 44 | 在接收端，如果发现请求中包含 body ，比如 POST 请求，此时如果有 `Content-Length` 头部，那就读取固定长度作为 body 即可。如果没有，那就必须要使用 `chunk` 编码了，否则服务器端是无法解析的。
 45 | 
 46 | ## body 常见格式
 47 | 
 48 | HTTP 协议中并没有规定 body 部分采用什么格式，比如 JSON 格式、XML 格式，你可以发送任何数据。但是发过去的内容总得被解析。尤其是发送结构化数据，使用一个双方都支持的格式，这对收发双方都很重要。
 49 | 
 50 | 下面是几种常见的格式：
 51 | 
 52 | 1. `application/x-www-form-urlencoded`
 53 | 2. `multipart/form-data`
 54 | 3. `application/json`
 55 | 4. 其他
 56 | 
 57 | ### `application/x-www-form-urlencoded`
 58 | 
 59 | 这种格式传输的是键值对，就像 GET 请求的 query 部分一样，使用 `a=b` 来表示一个键值对，使用 `&` 连接多个键值对。比如：
 60 | 
 61 | ```
 62 | foo=123&bar=234
 63 | ```
 64 | 
 65 | 在浏览器中可以这样发起请求：
 66 | 
 67 | ```js
 68 | let params = new URLSearchParams;
 69 | params.append("foo", "123");
 70 | params.append("bar", "234");
 71 | 
 72 | fetch("http://127.0.0.1:8001", {
 73 |     method: "POST",
 74 |     body: params
 75 | });
 76 | ```
 77 | 
 78 | 发送的内容是一个 `URLSearchParams` 对象，此时浏览器会自动在请求头部加入 `Content-Type: application/x-www-form-urlencoded`。
 79 | 
 80 | 如果不是在浏览器环境中，也可以手动完成 body 的编码，并指定正确的 `Content-Type`：
 81 | 
 82 | ```js
 83 | // 或者手动编码
 84 | fetch("http://127.0.0.1:8001", {
 85 |     method: "POST",
 86 |     headers: {
 87 |         'Content-Type': 'application/x-www-form-urlencoded'
 88 |     },
 89 |     body: "foo=123&bar=234"
 90 | })
 91 | ```
 92 | 
 93 | ### `multipart/form-data`
 94 | 
 95 | 在网页中使用 form 提交表单是就是采用这种格式。如今已经是 2020 年了，通常很少使用 form 来发起 POST 请求了，通常都是由 JavaScript 来发起 HTTP 请求。
 96 | 
 97 | 使用 `FormData` 对象作为发送内容，就会这种格式，下面是个例子：
 98 | 
 99 | ```js
100 | var form = new FormData;
101 | form.append("foo", "123");
102 | form.append("bar", "234");
103 | 
104 | fetch("http://127.0.0.1:8001", {
105 |     method: "POST",
106 |     body: form
107 | }).then(res => res.text()).then(data => {
108 |     console.log(data);
109 | });
110 | ```
111 | 
112 | 浏览器会自动添加头部：
113 | 
114 | ```
115 | Content-Type: multipart/form-data; boundary=----WebKitFormBoundary0YIe7rP7SPMwpOvO
116 | ```
117 | 
118 | 请求的 body 部分的内容如下：
119 | 
120 | 
121 | ```
122 | ------WebKitFormBoundary0YIe7rP7SPMwpOvO
123 | Content-Disposition: form-data; name="foo"
124 | 
125 | 123
126 | ------WebKitFormBoundary0YIe7rP7SPMwpOvO
127 | Content-Disposition: form-data; name="bar"
128 | 
129 | 234
130 | ------WebKitFormBoundary0YIe7rP7SPMwpOvO--
131 | ```
132 | 
133 | 可见整个内容由 `boundary` 分为多个部分，这个 `boundary` 需要在 `Content-Type` 中指出。它可以是任意字符串，但为了防止与用户发送的内容冲突，通常随机生成一个较长的字符串。
134 | 
135 | `multipart/form-data` 格式如下：
136 | 
137 | ```
138 | --{boundary}\r\n
139 | Content-Disposition: form-data; name="key"\r\n
140 | \r\n
141 | value\r\n
142 | --{boundary}\r\n
143 | Content-Disposition: form-data; name="key"\r\n
144 | \r\n
145 | value\r\n
146 | --{boundary}--\r\n
147 | ```
148 | 
149 | 两个 boundary 之间的是一个条目。它分为头部和 body，两者之间空行分隔。
150 | 
151 | 其中 `Content-Disposition` 是一个 HTTP 头部，但是此处在 `multipart/form-data` 中复用了此头部，它的格式如下：
152 | 
153 | ```
154 | Content-Disposition: form-data; name="fieldName"
155 | Content-Disposition: form-data; name="fieldName"; filename="filename.jpg"
156 | ```
157 | 
158 | `name` 指明 form-data 中 key-value 对的 key，而 value 就是其后的内容了。如果发送的是文件，那么还会有 `filename` 这个字段，用来说明用户上传的文件的名称。比如我发送了一个文件，那么这部分的内容就大致为：
159 | 
160 | ```
161 | ------WebKitFormBoundaryZMPZDvIKME9OoGKU
162 | Content-Disposition: form-data; name="file"; filename="nlu.py"
163 | Content-Type: text/plain
164 | 
165 | import pandas as pd
166 | import re
167 | ...
168 | ```
169 | 
170 | 用 `Content-Type: text/plain` 指明了文件的类型。每次浏览器都会随机生成一个 `boundary`，所以这里的 `boundary` 不和上面的一样。
171 | 
172 | 最后一个 boundary 后面紧跟 `--`，这是结束的标志。
173 | 
174 | 
175 | ### `application/json`
176 | 
177 | 这种格式想必是目前最为流行的格式了，后端系统的请求和响应大多采用此格式。它没什么特别的，body 部分就是序列化后的 JSON 字符串，在 `Content-Type` 中指明 `application/json`，对端反序列化 JSON 字符串即可。
178 | 
179 | ### 其他格式
180 | 
181 | 无论什么格式，内容都是在 body 中放着，只不过解析方法不同罢了。用户完全可以自己定义一种格式，然后前后端采用匹配的格式化和解析方法即可。前面三种用的比较普遍，因此单拉出来说了说，其他的格式就不再说了。
182 | 


--------------------------------------------------------------------------------
/_posts/algorithm/2017-04-10-link-list.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: 链表相关算法
  4 | category: 算法
  5 | ---
  6 | 
  7 | 
  8 | ### 判断链表是否有环
  9 | 
 10 | ```cpp
 11 | class Solution {
 12 | public:
 13 |     bool hasCycle(ListNode *head) {
 14 |         ListNode *fast = head;
 15 |         ListNode *slow = head;
 16 |         
 17 |         while (fast && fast->next){
 18 |             fast = fast->next->next;
 19 |             slow = slow->next;
 20 |             if(fast == slow){
 21 |                 return true;
 22 |             }
 23 |         }
 24 |         return false;
 25 |     }
 26 | };
 27 | ```
 28 | 
 29 | 使用快慢指针，如果有环，快慢指针会相遇。有人疑惑，快指针每次走两步，慢指针每次走一步，有没有可能，每次快指针都跳过了慢指针。不会，每次都会相遇，原因如下：
 30 | 
 31 | 慢指针每次移动一格，快指针每次移动两格，在有环的链表里，他们一定会相遇
 32 | 1. 当快指针就在慢指针后面，那么下一次慢指针移动一位，快指针移动两位，相遇
 33 | 2. 当快指针和慢指针差一个位置，那么下一次慢指针移动一位，快指针移动两位，他们会变成第一种情况
 34 | 3. 当快指针和慢指针差两个位置，那么下一次慢指针移动一位，快指针移动两位，他们会变成第二种情况
 35 | 
 36 | ```
 37 | ————————————————
 38 | 版权声明：本文为CSDN博主「Leslie5205912」的原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接及本声明。
 39 | 原文链接：https://blog.csdn.net/Leslie5205912/article/details/89386769
 40 | ```
 41 | 
 42 | ### 判断两个链表是否相交
 43 | 
 44 | 为了找到交点，可以先得出两个链表的长度。算出它们的长度差异 N，让长链表的指针先走 N 步，然后两个链表的指针齐头并进。如果两个链表相交，这两个指针就一定会相遇，否则都会各自走到链表尾部。
 45 | 
 46 | ```cpp
 47 | class Solution {
 48 | public:
 49 |     ListNode *getIntersectionNode(ListNode *headA, ListNode *headB) {
 50 |         if(!headA || !headB) return NULL;
 51 |         int lenA = len(headA);
 52 |         int lenB = len(headB);
 53 | 
 54 |         if(lenA > lenB){
 55 |             headA = advance(headA, lenA-lenB);
 56 |         }else{
 57 |             headB = advance(headB, lenB-lenA);
 58 |         }
 59 |         while(headA && headA != headB){
 60 |             headA = headA->next;
 61 |             headB = headB->next;
 62 |         }
 63 |         return headA;
 64 |     }
 65 | 
 66 |     int len(ListNode *head){
 67 |         int n = 0;
 68 |         while(head->next){
 69 |             n++;
 70 |             head = head->next;
 71 |         }
 72 |         return n;
 73 |     }
 74 | 
 75 |     ListNode* advance(ListNode *head, int n){
 76 |         while(n > 0){
 77 |             head = head->next;
 78 |             n--;
 79 |         }
 80 |         return head;
 81 |     }
 82 | };
 83 | ```
 84 | 
 85 | 另外一种思路，很巧妙。设两个链表非公共部分的长度为 `a b` 设公共部分的长度为 `c`。如果将 A 和 B 链表后面各自接上另外一个链表。那么这两个链表的长度就一样了，即 `a+b+c+c`。如果两个链表相交，那么交点一定在倒数第 `c` 个节点上。
 86 | 
 87 | ```cpp
 88 | ListNode *getIntersectionNode(ListNode *headA, ListNode *headB) {
 89 |     if(!headA || !headB) return NULL;
 90 |     ListNode *pA = headA, *pB = headB;
 91 |     while(pA != pB){
 92 |         pA = (pA == NULL) ? headB : pA->next;
 93 |         pB = (pB == NULL) ? headA : pB->next;
 94 |     }
 95 |     return pA;
 96 | }
 97 | ```
 98 | 
 99 | ### 判断链表环的入口
100 | 
101 | 如果一个链表有环，那么找出环的入口。这个问题组合前面两步的思路来解决。如果链表有环，那么我们得到环内的某个节点，然后从该节点断开。这样就变成了找两个链表的交点的问题了。
102 | 
103 | ![](https://ae01.alicdn.com/kf/H3ef6de2d6b93425f939a75885f15aec7p.jpg)
104 | 
105 | ```cpp
106 | class Solution {
107 | public:
108 |     ListNode *detectCycle(ListNode *head) {
109 |         ListNode *head1 = head;
110 |         ListNode *node_in_cycle = findOneNodeInCycle(head);
111 |         if(!node_in_cycle){
112 |             return NULL;
113 |         }
114 |         ListNode *head2 = node_in_cycle->next;
115 | 
116 |         ListNode *p1 = head1, *p2 = head2;
117 |         while(p1 != p2){
118 |             p1 = p1->next;
119 |             p2 = (p2 == node_in_cycle) ? head1 : p2->next;
120 |         }
121 |         return p1;
122 |     }
123 | 
124 | 
125 |     ListNode* findOneNodeInCycle(ListNode *head) {
126 |         ListNode *fast = head;
127 |         ListNode *slow = head;
128 | 
129 |         while (fast && fast->next){
130 |             fast = fast->next->next;
131 |             slow = slow->next;
132 |             if(fast == slow){
133 |                 return fast;
134 |             }
135 |         }
136 |         return NULL;
137 |     }
138 | };
139 | ```
140 | 
141 | 
142 | ### 链表中倒数第k个结点
143 | 
144 | 
145 | 输入一个链表，输出该链表中倒数第k个结点。
146 | 
147 | ```cpp
148 | struct ListNode {
149 |     int val;
150 |     struct ListNode *next;
151 |     ListNode(int x): val(x), next(NULL) {}
152 | };
153 | 
154 | class Solution {
155 | public:
156 |     ListNode* FindKthToTail(ListNode* pListHead, unsigned int k) {
157 |         if(!pListHead) return NULL;
158 | 
159 |         ListNode *first = pListHead, *second = pListHead;
160 |         for(int i=0; i < k; ++i){
161 |             if(!first) return NULL;
162 |             first = first->next;
163 |         }
164 |         while(first){
165 |             first = first->next;
166 |             second = second->next;
167 |         }
168 |         return second;
169 |     }
170 | };
171 | ```
172 | 
173 | 用两个指针，第一个先走 k 步，然后两个指针一起向前走。当前一个达到终点的时候，第二个恰好是倒数第 k 个节点。
174 | 
175 | 
176 | ## 反转链表
177 | 
178 | 输入一个链表，反转链表后，输出新链表的表头。
179 | 
180 | ```cpp
181 | struct ListNode {
182 |     int val;
183 |     struct ListNode *next;
184 |     ListNode(int x): val(x), next(NULL) {}
185 | };
186 | 
187 | class Solution {
188 | public:
189 |     ListNode* ReverseList(ListNode* head) {
190 |         ListNode *p = NULL;
191 |         while(head){
192 |             ListNode *next = head->next;
193 |             head->next = p;
194 |             p = head;
195 |             head = next;
196 |         }
197 |         return p;
198 |     }
199 | };
200 | ```
201 | 
202 | 不断把后一个节点，作为头结点，即可反转链表。


--------------------------------------------------------------------------------
/_posts/web/2016-07-21-fetch-API.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: Fetch API
  4 | category: Web
  5 | ---
  6 | 
  7 | 
  8 | - *
  9 | {:toc}
 10 | 
 11 | 
 12 | Fetch API 包含一组类和方法，用来简化 HTTP 请求。其中包含以下方法和类：
 13 | - fetch 方法：用于发起 HTTP 请求
 14 | - Request 类：用来描述请求
 15 | - Response 类：用来表示响应
 16 | - Headers 类：用来表示 HTTP 头部信息。
 17 | 
 18 | ## 基本用法
 19 | 
 20 | fetch 接受一个 url 作为参数，发起 GET 请求，返回 Promise ,请求成功后将返回结果封装为一个 Response 对象，该对象上具有一些方法（比如 json 方法），调用 json 方法后同样返回一个 Promise 对象，并用解析 json 字符串得到的对象来 resolve。
 21 | 
 22 | ``` javascript
 23 | let url = 'https://api.github.com/repos/facebook/react';
 24 | fetch(url).then(res => res.json()).then(data => {
 25 |     console.log(data)
 26 | });
 27 | ```
 28 | 
 29 | fetch 方法有两种调用方法，第一个参数可以是一个 Request 对象，也可以是一个简单的 url，第二个参数是可选参数，包含一些配置信息。
 30 | 
 31 | ```javascript
 32 | Promise fetch(String url [, Object options]);
 33 | Promise fetch(Request req [, Object options]);
 34 | ```
 35 | 
 36 | 可选的配置信息是一个简单对象，可以包含下列字段：
 37 | 
 38 | - method: 请求的方法, 比如： GET, POST
 39 | - headers：请求头部信息，可以是一个 Headers 对象的实例，也可以是一个简单对象
 40 | - body: 任何希望发送的信息，可以是 Blob, BufferSource, FormData, URLSearchParams, 或者 USVString。
 41 | - mode：请求的模式，可以取这几个值：cors, no-cors, same-origin, navigate
 42 |   - same-origin：只允许同源的请求，否则直接报错
 43 |   - cors：允许跨域，但也要要求响应中 Access-Control-Allow-Origin 这样的头部信息表示允许跨域，响应中只有部分头部信息可以读取，但响应内容可以不受限地读取。
 44 |   - no-cors：只允许使用 HEAD、 GET 和 POST 方法，且 JavaScript 不允许访问 response 中的内容。ServiceWorkers 拦截了这些请求，它不能随意添加或者改写任何 headers。
 45 |   - navigate：不知道啥意思，通常用不到。
 46 | - credentials：表示是否发送 cookie，有三个可选值 omit, same-origin, include
 47 |   - omit：不发送 cookie
 48 |   - same-origin： 仅在同源时发生 cookie
 49 |   - include：发送 cookie
 50 | - cache：表示处理缓存的策略，关于此可以参考 [https://fetch.spec.whatwg.org](https://fetch.spec.whatwg.org/#concept-request-cache-mode)
 51 | - redirect：发生重定向时候的策略。有以下可选值：
 52 |   - follow：跟随
 53 |   - error：发生错误
 54 |   - manual：需要用户手动跟随
 55 | - referrer： 一个字符串，可以是 no-referrer, client, 或者是一个 URL。默认值是 client。
 56 | - integrity：包含一个用于验证子资源完整性的字符串。关于此，可以参看 [Subresource Integrity 介绍](https://imququ.com/post/subresource-integrity.html)
 57 | 
 58 | 该函数返回一个 Promise 对象，若请求成功会用 Response 的实例作为参数调用 resolve ，若请求失败会用一个错误对象来调用 reject。
 59 | 
 60 | ## Headers 类
 61 | 
 62 | Headers 类用来表示 HTTP 的头部信息，其构造函数可以接受一个表示 HTTP 头信息的对象，也可以接受一个 Headers 类的实例作为对象：
 63 | 
 64 | ``` javascript
 65 | var header = new Headers({
 66 |   'Content-Type': 'image/jpeg',
 67 |   'Accept-Charset': 'utf-8'
 68 | });
 69 | 
 70 | // 拷贝一份
 71 | var copy = new Headers(header);
 72 | 
 73 | // 删除某个字段
 74 | header.delete(key)
 75 | 
 76 | // 获取某个字段的第一个值
 77 | header.get(key)
 78 | 
 79 | // 获取某个字段的全部值
 80 | header.getAll(key)
 81 | 
 82 | // 对一个字段追加信息，如果该字段不存在，就创建一个
 83 | header.append('Accept-Encoding', '');
 84 | header.append('Accept-Encoding', 'gzip');
 85 | 
 86 | // 判断是否存在某个字段
 87 | header.has(key)
 88 | 
 89 | // 设置字段，如果该字段已经存在，就覆盖
 90 | header.set(key, val)
 91 | 
 92 | 
 93 | // 遍历所有的字段，接受一个回调函数，和可选的第二个参数。
 94 | // 可选的第二个参数地值作为回调函数的 this 值。
 95 | header.forEach(function(value, name, header){
 96 |   //...
 97 | },this);
 98 | ```
 99 | 
100 | ## Request 类
101 | 
102 | Request 对象用于描述请求内容。构造函数接受的参数和 fetch 函数的参数形式一样，实际上 fetch 方法会使用传入的参数构造出一个 Request 对象来。
103 | 
104 | 下面例子从 github 抓取到 react 的 star 数并打印出来。
105 | 
106 | ``` javascript
107 | var req = new Request('https://api.github.com/repos/facebook/react',{
108 |   method:'GET'
109 | });
110 | 
111 | fetch(req).then(function(res){
112 |   return res.json()
113 | }).then(function(data){
114 |   console.log(data.stargazers_count)
115 | });
116 | ```
117 | 
118 | ### Request 实例的属性
119 | 
120 | _以下属性均为只读属性。这些属性的意义均在上面介绍 fetch 的参数的时候有过说明。_
121 | 
122 | - method
123 | - url
124 | - headers
125 | - referrer
126 | - referrerPolicy：处理来源信息的策略，关于此可以参见[Referrer Policy](https://w3c.github.io/webappsec-referrer-policy/)
127 | - mode
128 | - credentials
129 | - redirect
130 | - integrity
131 | - cache
132 | 
133 | ## Response 类
134 | 
135 | Response 用来表示 HTTP 请求的响应。其构造函数形式如下：
136 | 
137 | ``` javascript
138 | var res = new Response(body, init);
139 | ```
140 | 
141 | 其中 body 可以是：
142 | 
143 | - Blob
144 | - BufferSource
145 | - FormData
146 | - URLSearchParams
147 | - USVString
148 | 
149 | init 是一个对象，其中包括以下字段：
150 | 
151 | - status：响应的状态码，比如 200，404
152 | - statusText：状态信息，比如 OK
153 | - headers: 头部信息，可以是一个对象，也可以是一个 Headers 实例
154 | 
155 | ### Response 实例属性
156 | 
157 | _以下属性均为只读属性_
158 | 
159 | - bodyUsed：用于表示响应内容是否有被使用过
160 | - headers：头部信息
161 | - ok：表明请求是否成功，当响应的状态码是 200~299 时，该值为 true
162 | - status：状态码
163 | - statusText：状态信息
164 | - type：表明了响应的类型，可能是下面几种值：
165 |   - basic： 同源
166 |   - cors：跨域
167 |   - error：出错
168 |   - opaque：Request 的 mode 设置为 “no-cors” 的响应
169 | - url：响应的地址
170 | 
171 | #### Response 实例方法
172 | 
173 | - clone：复制一个响应对象
174 | 
175 | 要想从 Response 的实例中拿到最终的数据需要调用下面这些方法，这些方法都返回一个 Promise 并且使用对应的数据类型来 resolve。
176 | 
177 | - arrayBuffer：把响应数据转化为 arrayBuffer 来 resolve
178 | - blob：把响应数据转换为 Blob 来 resolve
179 | - formData：把响应数据转化为 formData 来 resolve
180 | - json：把响应数据解析为对象后 resolve
181 | - text：把响应数据当做字符串来调用 resolve
182 | 
183 | ## 总结
184 | 
185 | 最后在把上面使用例子进行一个细致的说明：
186 | 
187 | ``` javascript
188 | // 构造出 Request 对象
189 | var req = new Request('https://api.github.com/repos/facebook/react',{
190 |   method:'GET'
191 | });
192 | 
193 | // 发起请求，fetch 方法返回一个 Promise 对象
194 | fetch(req).then(function(res){
195 |   // 得到了 response，这里调用 response 的 json 方法
196 |   // 该方法同样返回一个 Promise
197 |   return res.json();
198 | }).then(function(data){
199 |   // 得到解析后的对象
200 |   console.log(data.stargazers_count)
201 | });
202 | ```
203 | 
204 | 可以看出 fetch 方法使用起来比 XMLHttpRequest 要方便的多，关于其兼容性，可以参考 [这里](http://caniuse.com/#search=Fetch)，对于不兼容的浏览器，你可以使用 [polyfill](https://github.com/github/fetch)。
205 | 


--------------------------------------------------------------------------------
/_posts/rec/2019-09-24-crt-models.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: 常见 CRT 预估模型总结
  4 | category: 推荐系统
  5 | tags: ['推荐系统']
  6 | ---
  7 | 
  8 | 点击率预测模型的输入常常是高维稀疏稀疏向量，特征间的组合很重要，比如 “男生”、“游戏”、"晚间" 这三个特征的组合很可能触发点击行为，即男孩子在晚上没事干的时候喜欢玩玩游戏。点击率预测模型从 Logistics Regression 到 Factorization Machines，以及后来的神经网络模型，都在尝试高效地发掘组合特征。本文总结了近些年提出的 CRT 模型。
  9 | 
 10 | - *
 11 | {:toc}
 12 | 
 13 | 
 14 | ## FM (Factorization Machines)
 15 | 
 16 | 论文：Factorization Machines，这可以说是开创性的作品，但仔细想想，其实不复杂哈。后面提到的论文中，很多都是在这篇论文提出的模型的基础进行改进。
 17 | 
 18 | FM (Factorization Machine) 的思想是将组合特征的参数 $\mathbf{w}$ 进行矩阵分解，即 $\mathbf{w} = \mathbf{v}^T \mathbf{v}$。如此以来 $\mathbf{w}$ 可以由一个较小的句子 $\mathbf{v}$ 来表示。其中 $\mathbf{w}_{ij}=\mathbf{v}_i·\mathbf{v}_j$，即组合特征 $x_ix_j$ 的系数由为特征对应的隐向量 $\mathbf{v}_i$ 和 $\mathbf{v}_j$ 的内积。
 19 | 
 20 | FM 模型就可以表示为：
 21 | 
 22 | $$\hat{y}(\mathbf{x}) := w_0 + \sum_{i=1}^{n} w_i x_i + \sum_{i=1}^{n} \sum_{j=i+1}^{n} \langle \mathbf{v}_i, \mathbf{v}_j \rangle x_i x_j$$
 23 | 
 24 | 其中尖括号表示两个向量内积：
 25 | 
 26 | $$
 27 | \left\langle\mathbf{v}_{i}, \mathbf{v}_{j}\right\rangle :=\sum_{f=1}^{k} v_{i, f} \cdot v_{j, f}
 28 | $$
 29 | 
 30 | 当数据很稀疏时，组合特征的参数难以学习到，FM 使用基于矩阵分解的策略，组合特征的系数依然能够有效估计，而且可泛化到未观察到的组合特征。
 31 | 
 32 | ## FFM (Field-aware Factorization Machines)
 33 | 
 34 | 出自论文：Field-aware Factorization Machines for CTR Prediction
 35 | 
 36 | FM 模型的输入通常都是含有多个 Field 的稀疏向量，比如用户信息，商品信息，上下文信息，举例如下：
 37 | 
 38 | |Clicked| Publisher (P) |Advertiser (A)| Gender (G)|
 39 | |--|--|--|--|
 40 | |Yes| ESPN| Nike |Male|
 41 | 
 42 | FFM 认为不同类别的特征不应该向 FM 那样处在同一个隐空间中（FM 的所有特征的隐向量在一个特征空间中），FFM 把不同类别（每个 Field）区分在不同的特征空间中。
 43 | 
 44 | 举个例子，当 ESPN 和 Nick 交互时，ESPN 要使用在 Advertiser Field 下 ESPN 的向量，因为 ESPN 在和广告商交互，而此时 Nike 要使用 Publisher Filed 下 Nick 的向量，因为此时 Nick 正在和发行方交互。
 45 | 
 46 | ## Deep FM
 47 | 
 48 | 出自论文：DeepFM: A Factorization-Machine based Neural Network for CTR Prediction
 49 | 
 50 | 模型结构如下：
 51 | 
 52 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/06/5d71d1e5451253d17890cf77.jpg)
 53 | 
 54 | 把 FM 和神经网络联合起来，FM 中各个特征有一个隐向量，Deep FM 把这些隐向量拼起来，输入给多层感知机（MLP），然后 FM 和 MLP 的输出加起来，作为最终分类。
 55 | 
 56 | FM 可以捕获到二阶特征，而 MLP 则能捕获到更高纬度的特征，将两者结合有望捕获更高复杂的组合特征。
 57 | 
 58 | ## NFM (Neural Factorization Machines)
 59 | 
 60 | 出自论文：Neural Factorization Machines for Sparse Predictive Analytics
 61 | 
 62 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/27/5d8dc6b5451253d1784c6609.jpg)
 63 | 
 64 | NFM 就是对 FM 的 cross 部分做了改进，不做点积，而是做对应元素相乘，最后加起来输入全连接层。
 65 | 
 66 | $$
 67 | f_{B I}\left(\mathcal{V}_{x}\right)=\sum_{i=1}^{n} \sum_{j=i+1}^{n} x_{i} \mathbf{v}_{i} \odot x_{j} \mathbf{v}_{j}
 68 | $$
 69 | 
 70 | 这玩意也能 work ? 
 71 | 
 72 | ## AFM (Attentional Factorization Machines)
 73 | 
 74 | 出自论文：Attentional Factorization Machines:
 75 | Learning the Weight of Feature Interactions via Attention Networks
 76 | 
 77 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/27/5d8dbdf8451253d17849bc77.jpg)
 78 | 
 79 | AFM 在 FM 的基础上引入了 Attention 机制，AFM 认为二阶特征不应该具有相同的权重，引入 attention 来增加权重。AFM 的模型如下：
 80 | 
 81 | $$
 82 | ŷ_{AFM}(x)=ω_0+∑_{i=1}^{n}ω_{i}x_{i}+p^T∑^{n}_{i=1}∑^{n}_{j=i+1}a_{ij}(v_i⊙v_j)x_ix_j
 83 | $$
 84 | 
 85 | 其中 attention 就是常见的感知机：
 86 | 
 87 | $$
 88 | \acute{a_{ij}}=h^TReLU(W(v_i \odot v_j)x_ix_j+b)
 89 | $$
 90 | 
 91 | $$7
 92 | a_{ij}= \frac{exp(\acute{a_{ij}})}{ \sum exp(\acute{a_{ij}})}
 93 | $$
 94 | 
 95 | AFM 加入注意力机制，不同的交互特征使用不同权重，能够更有效地利用有用特征。
 96 | 
 97 | ## DCN (Deep & Cross Network)
 98 | 
 99 | 模型的输入是稀疏的类别特征和稠密特征，category 特征经过嵌入得到稠密向量。将输入的稠密特征和嵌入得到的稠密特征全部拼接起来，得到向量 $x_0$。$x_0$ 分别输入到 cross network 和 deep network 中。两者的输出拼接后，交给全连接层进行预测。
100 | 
101 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/24/5d89835b451253d178455bd2.jpg)
102 | 
103 | 在 cross network 中，每一层的计算是下面这样的：
104 | 
105 | $$
106 | x_{l+1} = x_0 x_l^T w_l + b_l + x_l = f(x_l, w_l, b_l) + x_l
107 | $$
108 | 
109 | 向量计算的图形化表示如下：
110 | 
111 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/24/5d898bd7451253d1784628a4.jpg)
112 | 
113 | 每一层的结果和原输入特征 $x_0$ 进行组合，就可以高效地组合出大量的高阶特征。
114 | 
115 | $x_0$ 和 $x^\prime$ 的乘积的结果是两个向量中各个特征两两组合的矩阵。这个矩阵中算是包含了所有的组合特征。但这个矩阵要乘以 $w$，而后矩阵中各列会加权求和得到一个向量。这样就把各种特征给加在了一起，组合特征混在一起，还能有意义吗？
116 | 
117 | 这里的 $x_0$ 中包含特征 Embedding 的一部分，做 $x_0$ 各个维度的 cross ，好像还能捕获到到特征隐空间之间的关系。
118 | 
119 | 在计算的时候有一点需要注意：
120 | 
121 | $x_0$ 和 $x^\prime$ 的乘积是一个矩阵，而  $x^\prime$ 和 $w$ 的乘积为向量，因此在计算的时候，应该先算 $x^\prime * w$，这样可以大幅节省时间和空间。
122 | 
123 | ## Wide & Deep
124 | 
125 | 出自论文：Wide & Deep Learning for Recommender Systems
126 | 
127 | 下图对比了 Wide & Deep 模型和单个的 Wide 和 Deep 模型。
128 | 
129 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/04/5d6f76ff451253d17822413b.jpg)
130 | 
131 | Wide 模型就是简单的线性模型，将稀疏的输入特征向量做加权和，而 Wide 部分是把特征做嵌入，然后拼接起来输入给多层感知机，最后 Wide 和 Deep 的输出加起来，作为整个模型的输出。
132 | 
133 | ## DIN (Deep Interest Network)
134 | 
135 | 出自论文：Deep Interest Network for Click-Through Rate Prediction
136 | 
137 | DIN 的模型为下图中右边那个，左边的 base model 就是 wide & deep 中 deep 部分，DIN 在 deep 部分做了改进。
138 | 
139 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/27/5d8dc988451253d1784d2b41.jpg)
140 | 
141 | 阿里巴巴提出的这个模型用于商品广告的排序，在进行排序的时候要用到用户的信息，这里就是用到用户的购买记录。包括用户买过的东西，买过东西的店铺，这些信息能够反映用户的偏好。但是对于待排序的 AD，并不是所有用户购买记录都有用。
142 | 
143 | 当计算衣服类的广告的 CTR 的时候，用户信息中最有用的就是用户曾经购买过的衣服的信息。所有这里使用 candidate 和 用户输入特征做了 attention。把用户购买的物品的特征使用 attention 的权重加权，把用户逛过的店铺的特征也加权起来。注意，candidate AD 是一个物品，它有自己所属店铺，在做 attention 的时候，那用户购买的物品和 candidate 做 attention，店铺和店铺做 attention。可以观察到，上图中不同物品算出来的 attention 是不同的，衣服的 attention 会更大一点，这就是 DIN 想要的效果。
144 | 
145 | ![](https://wangyu-name.oss-cn-hangzhou.aliyuncs.com/superbed/2019/09/27/5d8dca84451253d1784d6137.jpg)
146 | 
147 | 模型图中的 Activation Unit 的输入是两个向量，输出的就是权重了。看起来好像上两个向量相减，再和两个向量拼接，然后输入全连接网络，得出权重。
148 | 


--------------------------------------------------------------------------------
/_posts/python/2018-06-02-python-re.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: Python 中正则表达式的用法
  4 | category: Python
  5 | tags: ['编程']
  6 | ---
  7 | 
  8 | 
  9 | ## 部分正则语法
 10 | 
 11 | 
 12 | => `r"\n"` 表示两个字符 `\` 和 `n`，而 `"\n"` 表示一个字符，即换行符。 
 13 | 
 14 | 
 15 | => `{m,n}?`  匹配尽可能少的字符
 16 | 
 17 | 
 18 | => `[]` 用来表示一组字符，在 `[]` 中特殊字符失去它们特殊的含义，即 `[(+*)]` 就匹配 `( + * )` 这四个字符。
 19 | 
 20 | => `[^5]` 匹配所有不是 `5` 的字符，`[^^]` 匹配所有不是 `^` 的字符，在 `[]` 中，如果 `^` 不是第一个字符，那么它就没有特殊意义。
 21 | 
 22 | 
 23 | => `(?aiLmsux)` 放在正则表达式前，用来开启正则表达式标志，这个表达式匹配空字符串。其中 'a' 表示 `re.A`，'i' 表示 `re.I` ……
 24 | 
 25 | ```python
 26 | re.match(r'(?i)ab|AB', 'aB')
 27 | ```
 28 | 
 29 | => `(?:...)` 表示不捕获，有时候需要使用括号，但是又不想捕获分组，这个时候可用此法。
 30 | 
 31 | 
 32 | => `(?P<name>...)` 用来给一个分组进行命名，一个正则表达式中如果有多个分组，尤其是分组之间有嵌套的时候，后向引用分组的时候，使用数字就显得很麻烦且容易出错，而给一个分组命名后，就方便引用了。引用的时候使用 `(?P=name)` 即可。
 33 | 
 34 | ```python
 35 | re.match(r'(?P<underscore>_{1,2})abc(?P=underscore)', '__abc__')
 36 | ```
 37 | 
 38 | => `(?#...)` 这里表示一个注释，括号中的内容会被忽略。
 39 | 
 40 | 
 41 | => `(?=...)` 前向断言，如下例子，只匹配后面跟着 `def` 的 `abc`：
 42 | 
 43 | ```python
 44 | re.match(r'abc(?=def)', 'abcdef')
 45 | ```
 46 | 
 47 | => `(?!...)` 如下，匹配后面不跟 `d` 的 `abc`：
 48 | 
 49 | ```python
 50 | re.match(r'abc(?!d)', 'abce')
 51 | ```
 52 | 
 53 | => `(?<=...)` 和 `(?<!...)`
 54 | 
 55 | ```
 56 | >>> m = re.search('(?<=abc)def', 'abcdef')
 57 | >>> m.group(0)
 58 | 'def'
 59 | ```
 60 | 
 61 | => `(?(id/name)yes-pattern|no-pattern)`
 62 | 
 63 | 这里 `id/name` 表示一个分组的编号或者名称，即如果此前这个分组已经匹配到了，那么就匹配 `yes-pattern` 否则匹配（可选）`no-pattern`
 64 | 
 65 | ```python
 66 | >>> re.match(r'(<)?(\w+@\w+(?:\.\w+)+)(?(1)>|$)', 'wangyu@163.com').group(0)
 67 | <<< 'wangyu@163.com'
 68 | 
 69 | >>> re.match(r'(<)?(\w+@\w+(?:\.\w+)+)(?(1)>|$)', '<wangyu@163.com>').group(0)
 70 | <<< '<wangyu@163.com>'
 71 | ```
 72 | 
 73 | 这里如果前面的 `<` 有匹配上，那么结尾就要匹配一个 `>` 否则匹配 `$`。
 74 | 
 75 | => `\A`，匹配字符的开头，这和 `^` 是有差别的，`\A` 只会匹配一个位置，那就是字符串开头。而 `^` 在多行模式下，可以匹配每一行的开头。
 76 | 
 77 | => `\Z` 匹配字符的结尾。
 78 | 
 79 | => `\b`，匹配 `\W` 和 `\w` 的边界，如 `re.search(r'ABC\b', 'ABC>')`
 80 | 
 81 | => `\B`，匹配 `\w` 与 `\w` 或者 `\W` 与 `\W` 的边界。
 82 | 
 83 | => `\d` 和 `\D` 分别匹配数字和非数字。
 84 | 
 85 | => `\s` 匹配空白符，即 `[\t\n\r\f\v]`。
 86 | 
 87 | => `\S` 匹配非空白，即 `[^\t\n\r\f\v]`。
 88 | 
 89 | => `\w` 匹配字符，ASCII 范围内等价于 `[a-zA-Z0-9]`
 90 | 
 91 | => `\W` 匹配非 `\w`。
 92 | 
 93 | 
 94 | ## re 模块
 95 | 
 96 | => `re.compile`
 97 | 
 98 | 返回一个正则表达式对象，上面有很多下面介绍的在 `re` 模块上包含的方法。 
 99 | 
100 | ```python
101 | re.compile(pattern, flags=0)
102 | ```
103 | 
104 | ```python
105 | <<< r = re.compile(r'<(\d+)>')
106 | <<< r.match('<323>').groups()
107 | >>> ('323',)
108 | ```
109 | 
110 | => `re.search`
111 | 
112 | 在字符中搜索匹配的 pattern，如果有匹配则返回 match object，否则返回 None。
113 | 
114 | ```python
115 | match = re.search(pattern, string)
116 | if match:
117 |     process(match)
118 | ```
119 | 
120 | => `re.match`
121 | 
122 | 如果字符串的开头与 pattern 匹配，则返回 match object，否则返回 None。
123 | 
124 | ```python
125 | re.match(pattern, string, flags=0)
126 | ```
127 | 
128 | 
129 | 如果整个字符串都匹配，则返回 `match object`
130 | 
131 | ```python
132 | re.fullmatch(pattern, string, flags=0)
133 | ```
134 | 
135 | => `re.split`，使用正则表达式对字符串进行切分。
136 | 
137 | ```python
138 | re.split(pattern, string, maxsplit=0, flags=0)
139 | ```
140 | 
141 | 如果用于切分的正则表达式中包含分组，那么分组捕获的内容也会返回。
142 | 
143 | ```python
144 | >>> re.split(r'<->', '123<->456<->789')
145 | <<< ['123', '456', '789']
146 | 
147 | >>> re.split(r'<(-)>', '123<->456<->789')
148 | <<< ['123', '-', '456', '-', '789']
149 | ```
150 | 
151 | => `re.findall`
152 | 
153 | 返回所有匹配的子字符串。
154 | 
155 | ```python
156 | <<< re.findall(r'\d{3}', '123<->456<->789')
157 | >>> ['123', '456', '789']
158 | 
159 | # 含有多个分组的时候，返回的是元组的列表
160 | <<< re.findall(r'(\d)\d(\d)', '123<->456<->789')
161 | >>> [('1', '3'), ('4', '6'), ('7', '9')]
162 | ```
163 | 
164 | => `re.finditer`
165 | 
166 | 返回 match object 的迭代器，由此可以得到所有的匹配项，用于处理较长的文本。
167 | 
168 | => `re.sub`
169 | 
170 | 这个方法用来从源字符串中匹配部分内容，然后通过一个模板构成新的字符串。
171 | 
172 | ```python
173 | re.subn(pattern, repl, string, count=0, flags=0)
174 | ```
175 | 
176 | 举例子，比如用 `123->456` 构造出 `'456<-123'`
177 | 
178 | `pattern` 部分匹配 `123` 和 `456`，然后 `repl` 部分使用匹配项，拼凑出目标字符串。
179 | 
180 | 这里 `repl` 是一个字符串，要想使用 `pattern` 匹配的分组，可以使用 `\1` 这样的写法，对于命名分组，可以使用 `\g<name>` 这样的写法。
181 | 
182 | ```python
183 | >>> re.sub(r'(?P<from>\d{3})->(?P<to>\d{3})', '\g<to><-\g<from>', '123->456')
184 | <<< '456<-123'
185 | ```
186 | 
187 | ## Match 对象
188 | 
189 | => `Match.expand`
190 | 
191 | ```python
192 | <<< match = re.search(r'<(?P<name>\w+)@(\w+)\.(\w+)>', '<wangyu@163.com>')
193 | <<< match.expand('mailto:\g<name>[at]\g<2>[dot]\g<3>')
194 | >>> 'mailto:wangyu[at]163[dot]com'
195 | ```
196 | 
197 | => `Match.group`
198 | 
199 | ```python
200 | <<< match = re.search(r'<(?P<name>\w+)@(\w+)\.(\w+)>', '<wangyu@163.com>')
201 | <<< match.group(0) # or match.group()
202 | >>> '<wangyu@163.com>'
203 | 
204 | <<< match.group(0,1,2,3)
205 | >>> ('<wangyu@163.com>', 'wangyu', '163', 'com')
206 | ```
207 | 
208 | => `Match.groups`
209 | 
210 | 以元组的形式返回所有分组。
211 | 
212 | ```python
213 | <<< match.groups()
214 | >>> ('wangyu', '163', 'com')
215 | ```
216 | 
217 | => `Match.groupdict`
218 | 
219 | 以字典的形式返回所有命名分组，未命名的分组会被忽略。
220 | 
221 | ```python
222 | <<< match = re.search(r'<(?P<name>\w+)@(?P<host>\w+.\w+)>', '<wangyu@163.com>')
223 | <<< match.groupdict()
224 | >>> {'name': 'wangyu', 'host': '163.com'}
225 | ```
226 | 
227 | => `Match.start` / `Match.end`
228 | 
229 | 返回匹配的分组的起始和结束位置。
230 | 
231 | ```python
232 | << match = re.search(r'<(?P<name>\w+)@(?P<host>\w+.\w+)>', '<wangyu@163.com>')
233 | <<< match.start(),match.start(1),match.start(2)
234 | >>> (0, 1, 8)
235 | 
236 | <<< match.end(),match.end(1),match.end(2)
237 | >>> (16, 7, 15)
238 | ```
239 | 
240 | => `Match.span`
241 | 
242 | 返回指定分组的起始和结束位置。
243 | 
244 | ```python
245 | <<< match.span(),match.span(1),match.span(2)
246 | >>> ((0, 16), (1, 7), (8, 15))
247 | ```


--------------------------------------------------------------------------------
/_posts/cpp/2020-05-20-chrono.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: chrono 模块详解
  4 | category: C/C++
  5 | ---
  6 | 
  7 | - *
  8 | {:toc}
  9 | 
 10 | `std::chrono` 是一个与时间运算相关的模块，是 C++11 引入的，它提供了一系列函数和类都处于 `std::chrono` 命名空间下。
 11 | 
 12 | 使用该库需要了解它如下三个核心概念，了解了之后便可灵活运用。
 13 | 
 14 | - duration: 时间段
 15 | - time_point: 时间点
 16 | - clock: 时钟
 17 | 
 18 | 由于每次都写 `std::chrono` 这个很长的命名空间略显冗余，后文中只写 `chrono`，
 19 | 
 20 | 
 21 | ## 时间段
 22 | 
 23 | ### 时间段的表示
 24 | 
 25 | `chrono::duration` 用来表示一段时间，1小时，12分钟，0.01 秒都可以表示。
 26 | 不同的时间单位都能换算成秒，`duration` 正是通过秒来表示其他的时间段的。
 27 | 
 28 | ```cpp
 29 | chrono::duration<int, std::ratio<3600, 1>> two_hours(2);
 30 | ```
 31 | 
 32 | 上面的代码定义的时间段表示 2 个小时，这很难理解吧。看我慢慢解释。
 33 | 
 34 | `duration` 是一个模板类，它的定义如下：
 35 | 
 36 | ```cpp
 37 | template<typename Rep, typename Period = std::ratio<1>>
 38 | class duration;
 39 | 
 40 | template<std::intmax_t Num, std::intmax_t Denom = 1>
 41 | class ratio;
 42 | ```
 43 | 
 44 | `Period` 是一个 `std::ratio` 类型， `std::ratio` 表示一个分数，第一个参数是分子
 45 | 第二个是分子。`duration<Rep, Period>` 就表示这个时间段有 `Period` 秒。
 46 | 模板参数 `Rep` 是一种数据类型，用来表示 `Period` 的数量。
 47 | 
 48 | ```cpp
 49 | chrono::duration<int, std::ratio<60, 1>> minute(1) // 1 分钟
 50 | chrono::duration<int, std::ratio<1, 1000>> ms(2) // 2 毫秒
 51 | 
 52 | chrono::duration<int, ratio<1, 1>> n_second(22); // 22秒
 53 | chrono::duration<double, ratio<60, 1>> n_minute(n_second); // 用 22 秒初始化此时间段
 54 | // duration.count() 用于返回该时间段的数量，比如有多少个一分钟，几个一小时
 55 | cout << n_minute.count() << '\n';  // 0.366667 - 22 秒为 0.367 分钟
 56 | ```
 57 | 
 58 | 经过上面的分析，应该已经明白时间段是如何表示的了吧。
 59 | 
 60 | 在 `chrono` 中定义了常见的 `duration` 类型，下至纳秒上至小时：
 61 | 
 62 | ```cpp
 63 | chrono::nanoseconds
 64 | chrono::microseconds;
 65 | chrono::milliseconds;
 66 | chrono::seconds;
 67 | chrono::minutes;
 68 | chrono::hours;
 69 | ```
 70 | 
 71 | ### 时间段的转换
 72 | 
 73 | 前面的例子中，我用 22 秒来初始化浮点表示的分钟，这是可行的。但是如果分钟也是用整形表示的，由于会损失精度，此时整形表示的分钟无法用
 74 | 秒来表示。
 75 | 
 76 | ```cpp
 77 | chrono::duration<int, ratio<1, 1>> n_second(22); // 22秒
 78 | chrono::duration<double, ratio<60, 1>> n_minute(n_second); // 用 22 秒初始化此时间段
 79 | 
 80 | chrono::duration<int, ratio<60, 1>> n_minute(n_second); // 不行，不能通过编译
 81 | ```
 82 | 
 83 | 但有的时候有确实需要这样的转换，此时可以使用 `duration_cast`，此时会损失精度。
 84 | 
 85 | ```cpp
 86 | chrono::seconds n_second(122); // 122秒
 87 | chrono::minutes n_minute = chrono::duration_cast<chrono::minutes>(n_second);
 88 | cout << n_minute.count() << '\n';  // 2 分钟
 89 | ```
 90 | 
 91 | ### 时间段的运算
 92 | 
 93 | 不同类型的时间段间可以进行加减乘除取模等操作，比如一小时加一分钟，一小时除以一秒钟，一小时除以 4。运算结果是符合直觉的。
 94 | 即时间段与时间段相加自然还是时间段，而相除的结果自然是数值了。
 95 | 
 96 | ```cpp
 97 | chrono::seconds n_second(12);
 98 | chrono::minutes n_minute(1);
 99 | auto sum = n_minute + n_second;
100 | cout << sum.count() << '\n';  // 72s
101 | ```
102 | 
103 | ## 时间点
104 | 
105 | ### 时间点的表示
106 | 
107 | 时间点，顾名思义表示某个时刻。它的定义如下：
108 | 
109 | ```cpp
110 | template<typename Clock, typename Duration = typename Clock::duration>
111 | class time_point;
112 | ```
113 | 
114 | 其中 `Clock` 表示一个时钟，下一节介绍，可想象家里挂了好多个时钟，这里指明哪一个时钟的时间。`Duration` 表示从时钟的起始点开始经过的时间。
115 | 下面是个例子：
116 | 
117 | ```cpp
118 | chrono::time_point<chrono::system_clock, chrono::seconds> tp(chrono::seconds(1));
119 | ```
120 | 
121 | 上面的时间点表示时间起点后的一秒。通常是 `1970-01-01 00:00:01`。
122 | 
123 | ### 时间点的运算
124 | 
125 | 一个很有用的时间点就是当前时间点，可以通过如下方式获得：
126 | 
127 | ```cpp
128 | chrono::system_clock::time_point now = chrono::system_clock::now();
129 | ```
130 | 
131 | 时间点之间可以做减法得到时间段，时间点加时间段自然就是新的时间点了。
132 | 
133 | ```cpp
134 | chrono::system_clock::time_point now = chrono::system_clock::now();
135 | auto tomorrow = now + chrono::hours(24); // 明日此时
136 | 
137 | // 获得时间点距离时钟起始时刻的 duration
138 | decltype(now)::duration dur = now.time_since_epoch();
139 | cout << dur.count();
140 | ```
141 | 
142 | `epoch` 的意思是纪元，也就是某个时期的开始。不同的时钟可能对 `epoch` 选择不同，`system_clock` 选择的是 `1970-01-01 00:00:00`。
143 | 
144 | 时间点之间可能采用的 `duration` 不同，此时可以使用 `time_point_cast` 进行不同 `duration` 间的转换。
145 | 
146 | ```cpp
147 | chrono::time_point<chrono::system_clock> tp(chrono::hours(1));
148 | auto time_point_sec = chrono::time_point_cast<chrono::seconds>(tp);
149 | cout << time_point_sec.time_since_epoch().count();
150 | ```
151 | 
152 | 转换的时候存在精度丢失的问题，比如把分钟表示的时间点转为小时，零头就没了。
153 | 
154 | ## 时钟
155 | 
156 | 标准库中定义了大量的时钟，在 C++ 11 中存在下面三个时钟：
157 | 
158 | - `chrono::system_clock`
159 | - `chrono::steady_clock`
160 | - `chrono::high_resolution_clock`: 只是 `system_clock` 的别名罢了。
161 | 
162 | 
163 | ### `system_clock`
164 | 
165 | 系统时钟，其 epoch 为 `1970-01-01 00:00:00`，通常用于表示具体的日期。它具有一下实用方法：
166 | 
167 | ```cpp
168 | // 当前时间点
169 | chrono::system_clock::time_point now = chrono::system_clock::now();
170 | 
171 | // 转换为 time_t 类型
172 | time_t now_t = chrono::system_clock::to_time_t(now);
173 | 
174 | // 从 time_t 转为 time_point
175 | time_t t = time(nullptr);
176 | chrono::system_clock::time_point now = chrono::system_clock::from_time_t(t);
177 | ```
178 | 
179 | `system_clock` 提供了静态方法，可以获取当前时间，并且提供了与 `time_t` 类型的相互转化的接口。这样就可以利用 `ctime` 函数库中
180 | 时间格式化、转换时区等接口了。
181 | 
182 | ### `steady_clock`
183 | 
184 | 字面上的意思是稳定的时钟，什么意思呢。此时钟的 epoch 是开机时间，因此，就算用户修改了系统事件，这个时钟也不会受到影响。它的计时始终是
185 | 增加的。但是 `system_clock` 就不同了，如果把时间向前设置到 2000 年，那么获取到的系统时间一下子就比先前小了。
186 | 
187 | 下面例子中取 `steady_clock` 的当前时间，然后看看它距离 `epoch` 的时间长短：
188 | 
189 | ```c++
190 | auto now = chrono::steady_clock::now().time_since_epoch();
191 | 
192 | using hours = chrono::duration<double, ratio<3600, 1>>;
193 | 
194 | hours now_h = chrono::duration_cast<hours>(now);
195 | 
196 | cout << now_h.count(); // 79.66 - 说明我的机器开机 79.66 个小时了
197 | ```
198 | 
199 | 此时钟常常用来对程序运行时间进行计时，或设置定时器的定时时长：
200 | 
201 | ```cpp
202 | // 代码运行时间
203 | chrono::system_clock::time_point start = chrono::steady_clock::now();
204 | sleep(2);
205 | chrono::system_clock::time_point stop = chrono::steady_clock::now();
206 | 
207 | chrono::nanoseconds ns = stop - start;
208 | cout << ns.count(); // 约 2 000 000 000 ns
209 | ```
210 | 
211 | `steady_clock` 没有与 `time_t` 相互转换的接口，这很好理解，因为它不是干那事的。


--------------------------------------------------------------------------------
/_posts/web/2016-04-02-high-performace-web.md:
--------------------------------------------------------------------------------
  1 | ---
  2 | layout: post
  3 | title: 《高性能网站建设指南》笔记
  4 | category: Web
  5 | ---
  6 | 
  7 | 
  8 | 
  9 | 
 10 | - *
 11 | {:toc}
 12 | 
 13 | 
 14 | 黄金法则：只有10%-20%的响应时间是花费在了HTML文档的下载上，其余时间花在了下载页面中的所有组件。
 15 | 
 16 | ## HTTP 概述
 17 | 
 18 | ### 压缩：
 19 | 
 20 | Accept-Encoding：浏览器可以使用这个头来声明它支持的压缩
 21 | Content-Encoding：服务器使用这个头来确认响应内容是如何压缩的
 22 | 
 23 | ### 条件GET请求：
 24 | 
 25 | 如果浏览器在其缓存中保留了组件的一个副本，但是并不确定它是否仍然有效，就会生成一个条件 GET，如果确认缓存有效，就使用缓存。缓存的有效期是基于响应头中的 Last-Modified 头来决定的，浏览器在进行缓存的时候，会记下这个时间，下次遇到同样 url 的请求时候，会包含一个 If-Modified-Since 的头将本地缓存的最后修改时间发送给服务器。
 26 | 
 27 | 如果服务器发现这个缓存仍然有效，自己在这之后没有修改过这个文件，那么就会发送 304 Not Modified 的状态码，并且不包含响应体。浏览器就会根据这个响应来确认可以使用缓存。
 28 | 
 29 | ### Expires
 30 | 
 31 | 条件 GET 和 304 响应可以加快页面加载，但是每个资源仍然和服务器进行了一次交互，以确认缓存有效。使用 Expires 可以免去这一次确认。浏览器看到响应中含有这个头信息，就会把该信息和缓存内容保存起来，这个头信息告诉浏览器这个资源的有效期限，如果在这个有效期内，浏览器就可以放心大胆地使用该资源。
 32 | 
 33 | ### Keep-Alive
 34 | 
 35 | HTTP 构建在 TCP 之上，在 HTTP 的早期实现中每个 HTTP 请求都要打开一个 socket 连接，这样做的效率很低，因为一个 web 页面中很多内容是来自同一个服务器的，可以在一次链接中传输多个资源无疑是高效的。持久连接解决的这个问题。浏览器和服务器使用 Connection 头来指出对 Keep-Alive 的支持。浏览器和服务器可以发送 Connection:Keep-Alive 和 Connection:close 来保持或者关闭连接。
 36 | 
 37 | ## 规则一：减少HTTP请求
 38 | 
 39 | 减少文档中引入资源的数量，合并小的脚本文件，样式表，图片等等。
 40 | 
 41 | ### 图片地图
 42 | 
 43 | 使用 image 和 map 标签构成图片地图，可以显著减少 HTTP 请求数量，不需要为每个链接添加一个背景图片。但是这个应用好像很少见到。
 44 | 
 45 | ### CSS Sprites
 46 | 
 47 | 比上面的图片地图更加灵活，而且合并后的图片虽然包含一些空白，但是大小并不并未合并前大，因为合并在一幅图片上省去了在每个图片中都包含的颜色索引表，格式信息等等附加内容。
 48 | 
 49 | ### 内联图片
 50 | 
 51 | 使用 data:url 的模式来内联图片，图片信息就在 url 中，可以随文档一起传输减少了 HTTP 请求。这个 data:url 模式是在1995年提出的，数据格式如下：
 52 | 
 53 | data:[<mediatype>][;base64],<data>
 54 | 
 55 | 注意：IE7以及IE7- 不支持该方法
 56 | 
 57 | base64 编码会增大图片的大小，导致整体的下载量增大，所以要慎重使用。另外使用该方式导致资源不会被缓存下来，一个好的解决方案是讲 base64 编码的内容放在样式表内，样式表是会被缓存的。
 58 | 
 59 | ### 合并脚本和样式表
 60 | 
 61 | 在投入生产环境之前对样式表和脚本进行压缩。
 62 | 
 63 | ## 规则二：使用内容分发网络
 64 | 
 65 | 将静态资源部署在 CDN 上有助于消除地域上的差异，提高其他地方用户的响应速度。
 66 | 
 67 | ## 规则三：添加 Expires 头
 68 | 
 69 | ```
 70 | Expires:Mon, 15 Apr 2024 20:00:00 GMT
 71 | ```
 72 | 
 73 | 这个响应头告诉浏览器这个时间前，该资源都是有效的。
 74 | 
 75 | Expires 会有一些不好的地方，首先需要服务器和客户端的时间是同步的，另外真的这一天到来了，还要为资源重新提供一个新的时间。
 76 | 
 77 | HTTP1.1版本，提供了 Cache-Control , 使用 Cache-Control 可以克服这个问题。Cache-Control 使用 max-age 指令来指定组件可以被缓存多久。它以秒为单位定义了一个更新窗，如果从组件被请求开始少于这个秒数，那么可以使用这个资源。否则过期，使用这个方法也可以长时间地缓存一个资源。
 78 | 
 79 | ```
 80 | Cache-Control:max-age=315350000
 81 | ```
 82 | 
 83 | 如果一个识别 HTTP1.1的客户端同时看到了 Cache-Control: max-age 和 Expires 那么它会使用 Cache-control。对于 不支持 HTTP1.1的客户端（几乎没有了吧）那么它会使用 Expires。
 84 | 
 85 | ## 规则四：压缩组件
 86 | 
 87 | ### 压缩是如何工作的
 88 | 
 89 | web客户端通过 Accept-Encoding 头来表示对压缩的支持。
 90 | 
 91 | ```
 92 | Accept-Encoding:gzip,deflate
 93 | ```
 94 | 
 95 | 服务器看到这个信息，就会启用列表中列出的压缩方式进行压缩，然后将采用的压缩方法写在响应头部发送给客户端。
 96 | 
 97 | ```
 98 | Content-Encoding:gzip
 99 | ```
100 | 
101 | gzip 是 GNU 开发的一个免费的格式，使用相当广泛。
102 | 
103 | ### 压缩什么
104 | 
105 | 文档，样式表，脚本等文本值得进行压缩，但是图片、PDF等内容则不适合被压缩，因为它们以及被压缩过了。压缩带来的成本是服务器的压力增大，客户端需要解压缩也会带来消耗。根据经验通常对大于 1kb 的内容启用压缩，这在 web 服务器中可以自行配置。
106 | 
107 | ### 代理缓存
108 | 
109 | 当客户端通过代理来向服务器发送请求的时候，一些问题就产生了。当一个不支持压缩的客户端通过代理向服务器发送了请求，这个时候服务器返回的是一个未压缩的版本，然后代理将其缓存了起来，下一次一个支持压缩的客户端通过代理向服务器发送请求的时候，代理会直接返回未压缩的版本。这就导致后面的请求内容是未经压缩来传输的。
110 | 
111 | 如果反过来，先由支持压缩的客户端发送请求，后由不支持压缩的客户端发送请求，这个时候问题就严重了不少。解决方案是使用HTTP响应头信息中的 Vary 字段。服务器通过这个字段告诉代理，通过请求头部信息来决定缓存的响应。
112 | 
113 | ```
114 | Vary：Accept-Encoding
115 | ```
116 | 
117 | 上面这个响应头告诉代理，给包含不同的 Accept-Encoding 内容的请求保持一个缓存，此后根据这个请求头信息来提供缓存内容。
118 | 
119 | ## 规则五：将样式表放在顶部
120 | 
121 | ### 逐步呈现
122 | 
123 | 把样式表放在文档底部会导致浏览器阻止页面逐步呈现，这会导致用户看不到页面上内容的，在浏览器等待文档底部的样式表的时候，会延迟显示任何可视化组件。在 IE 中会导致白屏现象。
124 | 
125 | 将样式表放在文档的顶部则能很好地解决白屏现象，使页面逐步呈现。
126 | 
127 | 在样式表加载完毕之前构建呈现树是一种浪费，在样式表加载完成之前显示会导致无样式内容的闪烁，如果不显示会导致白屏。具体的表现不同的浏览器有不同的处理方案。
128 | 
129 | 另外 w3.org 中 HTML 的规范显示 Link 标签只应该出现在 head 中，之所以写在其他位置也可以是因为浏览器为了兼顾一些不安规范写的 HTML 文档。
130 | 
131 | ## 规则六：将脚本放在底部
132 | 
133 | 脚本的执行会阻塞文档剩余内容的呈现。可以看这个页面 [http://stevesouders.com/hpws/js-middle.php](http://stevesouders.com/hpws/js-middle.php) 看看实际效果。将脚本放在文档上方，还会阻塞浏览器并行下载。也就是浏览器会停止页面的解析，文档剩余部分的资源不会开始下载，直到脚本加载完，并执行完成。
134 | 
135 | 把脚本放在文档最下方，这是最佳实践。
136 | 
137 | ## 规则七：避免 CSS 表达式
138 | 
139 | 对于 IE ，其支持 CSS 表达式，如下：
140 | 
141 | ```
142 | width:expression(document.body.clientWidth < 600 ? “600px” : “auto”);
143 | ```
144 | 
145 | 其他浏览器会忽略该属性，但是 IE 认识。这个写法的性能低下之处，在于其更新频率远远超出你的预估。它不单单会在页面大小改变的时候求值，用户滚动页面，鼠标移动这都会进行求值，不信？使用 IE 浏览器打开这个页面 [http://stevesouders.com/hpws/expression-counter.php](http://stevesouders.com/hpws/expression-counter.php) 试试。页面的一次滚动都可能导致求值几千上万次。
146 | 
147 | 结论：避免使用 CSS 表达式，必要的时候使用 javascript 处理。
148 | 
149 | ## 规则八：使用外部 Javascript 和 CSS
150 | 
151 | 使用分离的样式表和脚本可以使其被浏览器缓存，本站的其他页面能够重用该文件。
152 | 
153 | ## 规则九：减少DNS查找
154 | 
155 | 客户端遇到一个域名首先要做的就是进行 DNS 解析，这个过程会消耗一定的时间，可以试图使用同一个地址来加载资源，但是浏览器可能限制同时对一台主机进行的 HTTP 请求数量，所以在主机名数量，与 DNS 查找这两者之间要找到一个平衡点。
156 | 
157 | 另外使用 Keep-alive 也可以有效减少 DNS 查找。
158 | 
159 | ## 规则十：对脚本进行压缩
160 | 
161 | 对脚本启用压缩
162 | 
163 | ## 规则十一：避免重定向
164 | 
165 | 最常见的重定向状态码是 302，（304并不是重定向），从定向的响应头中包含了 Location 字段，这个告诉浏览器转而访问另外一个页面。HTML文档中也可以进行重定向：
166 | 
167 | ```html
168 | <meta http-equiv="refresh" content="1; url=http://baidu.com">
169 | ```
170 | 
171 | 上面信息会在1秒后跳转至baidu。
172 | 
173 | **关于重定向的一个细节：**
174 | 
175 | 缺少结尾的斜线
176 | 
177 | 当 url 是对应于主机上的一个 目录的时候，主机会发送 301 重定向状态码。所以注意在写 url 的时候，路径要尽可能地指明要访问的资源。
178 | 
179 | 在地址栏输入：`http://www.baidu.com` 这个不会重定向，因为浏览器在发送请求的时候一定要有一个路径，如果没有指明，那么就会使用 `http://www.baidu.com/` 也就是根目录。
180 | 
181 | 你可以在命令行中尝试下列命令：
182 | 
183 | ```
184 | curl -g sports.qq.com/nba
185 | ```
186 | 
187 | 就可以看到 腾讯服务器发回来的重定向内容。
188 | 
189 | 当然了，也可以使用 Telnet 来看看HTTP报文。
190 | 
191 | 重定向还用于跟踪流量，对于搜索引擎，可能进行重定向将用户转向搜索结果所在页面。
192 | 
193 | 重定向也用于美化 url ，一个短的 url 总是更好记忆一些。
194 | 
195 | ## 规则十三：配置 ETag
196 | 
197 | Etag（实体标签）是web服务器和浏览器用于确认缓存组件有效性的一种机制。Expires 头指示了资源的过期时间。最新修改时间（Last-Modified）则说明了资源最后的修改时间，这在条件 GET 的时候很有用（If-Midified-Since）。
198 | 
199 | 而实体标签则用来唯一标识一个资源。如果你的组件必须通过最新修改时间之外的东西来验证的话，那么使用 Etag 是一个很有用的方法。
200 | 
201 | Etag 的合理使用可以避免资源被重新请求，因为就算是同一个资源，如果响应中每次都给出了不同的 Etag ，这个时候也不会发送 304 ，而是重新加载资源。所以配置或者移除Etag。
202 | 
203 | ## 规则十四：使 Ajax 可以缓存
204 | 
205 | 同样地给 Ajax 请求设置一个长的 Expires 头，另外可以使用 主动请求 在用户未访问数据之间请求数据。
206 | 


--------------------------------------------------------------------------------