├── .gitignore
├── Dockerfile
├── LICENSE
├── README.md
├── lib
    ├── arex.js
    ├── data
    │   ├── AFINN-zh_cn.json
    │   ├── AFINN-zh_cn.txt
    │   ├── D_U_protection.json
    │   ├── index.js
    │   ├── summary.json
    │   └── user-words.txt
    ├── httprequest.js
    ├── isummary.js
    ├── levenshtein.js
    ├── node-summary.js
    ├── pagerank.js
    └── sentiment.js
├── package.json
├── server.js
└── test
    ├── compare-summary.js
    ├── echart-line.html
    ├── summary-comparation.csv
    ├── test-summarize.js
    └── test.js


/.gitignore:
--------------------------------------------------------------------------------
 1 | # Logs
 2 | logs
 3 | *.log
 4 | npm-debug.log*
 5 | 
 6 | # Runtime data
 7 | pids
 8 | *.pid
 9 | *.seed
10 | 
11 | # Directory for instrumented libs generated by jscoverage/JSCover
12 | lib-cov
13 | 
14 | # Coverage directory used by tools like istanbul
15 | coverage
16 | 
17 | # Grunt intermediate storage (http://gruntjs.com/creating-plugins#storing-task-files)
18 | .grunt
19 | 
20 | # node-waf configuration
21 | .lock-wscript
22 | 
23 | # Compiled binary addons (http://nodejs.org/api/addons.html)
24 | build/Release
25 | 
26 | # Dependency directory
27 | node_modules
28 | 
29 | # Optional npm cache directory
30 | .npm
31 | 
32 | # Optional REPL history
33 | .node_repl_history
34 | 


--------------------------------------------------------------------------------
/Dockerfile:
--------------------------------------------------------------------------------
1 | FROM node:6.17.0-alpine
2 | WORKDIR /app
3 | COPY . /app
4 | CMD ["sh", "-c", "node server.js"]
5 | EXPOSE 3824


--------------------------------------------------------------------------------
/LICENSE:
--------------------------------------------------------------------------------
 1 | Copyright (c) 2016, Cherokee
 2 | All rights reserved.
 3 | 
 4 | Redistribution and use in source and binary forms, with or without
 5 | modification, are permitted provided that the following conditions are met:
 6 | 
 7 | * Redistributions of source code must retain the above copyright notice, this
 8 |   list of conditions and the following disclaimer.
 9 | 
10 | * Redistributions in binary form must reproduce the above copyright notice,
11 |   this list of conditions and the following disclaimer in the documentation
12 |   and/or other materials provided with the distribution.
13 | 
14 | THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
15 | AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
16 | IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
17 | DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS BE LIABLE
18 | FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
19 | DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR
20 | SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER
21 | CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
22 | OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
23 | OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
24 | 


--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
  1 | # arex
  2 | node.js实现自动提取文章正文， 标题， 发布日期。自动生成文章摘要.
  3 | 
  4 | # Node版本
  5 | 建议v6.17.0
  6 | 
  7 | 
  8 | # Http 服务
  9 | 
 10 | 运行
 11 | ```bash
 12 | node server.js
 13 | ```
 14 | 
 15 | 客户端链接
 16 | 
 17 | ```bash
 18 | curl -X POST -d '{"url":"https://export.shobserver.com/baijiahao/html/411796.html","size":100,"smooth":false}' http://localhost:3824|jq -r .
 19 | ```
 20 | 
 21 | #安装
 22 | ```shell
 23 | npm install arex
 24 | ```
 25 | 
 26 | #使用例子:
 27 | ```javascript
 28 | var arex = require('arex');
 29 | //example 1, 给定网址自动抓取，提取正文，生成摘要
 30 | arex.get_article('http://finance.sina.com.cn/consume/puguangtai/2016-03-15/doc-ifxqhmve9227502.shtml',120,(err,result)=>{
 31 |                 //120: 摘要长度为120，如果不需要生成摘要此参数传入false.
 32 | 		//result: {"title":"...","content":"....", "summary":"...", "pubdate":"..."}
 33 | 		console.log(result['content']);
 34 | });
 35 | 
 36 | //example 2, 给html内容，提取正文，生成摘要
 37 | result = arex.get_article_sync('<html.........</html>',120);//result: {"title":"...","content":"....", "summary":"...", "pubdate":"..."}
 38 | 
 39 | //example 3, 给html内容，生成摘要
 40 | //summarize(content, exptd_len=120, shingle=false, min=150, max=350, filter=[], title)
 41 | //shingle的意义: 以摘要长度的句子组合为单位计算权重，shingle为false则以自然句为单位计算权重, filter是过滤规则，符合规则的段落都会被过滤不作为摘要
 42 | var summary = arex.summarize('<html>.......</html>', 120, true);
 43 | var summary = arex.summarize('<html>.......</html>', 0.04, true, 100, 300);//摘要长度比例 4%, 最短 100, 最长 300
 44 | ```
 45 | 
 46 | #测试
 47 | 
 48 | ##获取源码
 49 | ```shell
 50 | git clone https://github.com/ahkimkoo/arex.git
 51 | ```
 52 | 
 53 | ##测试某个网页的抽取
 54 | ```shell
 55 | cd arex
 56 | npm install
 57 | node test/test.js http://finance.sina.com.cn/consume/puguangtai/2016-03-15/doc-ifxqhmve9227502.shtml 120
 58 | ```
 59 | 120表示期望文摘的长度
 60 | 
 61 | ##算法说明
 62 | * 正文抽取: 基于行块密度分布来抽取正文， 每个行块由若干自然段落组成。
 63 | * 标题抽取: 分别从正文附近抽取h1标签，从title标签取值，取最可能是标题的那一个。
 64 | * 发布日期抽取: 用正则表达式抽取正文附近的日期。（有误差）。
 65 | * 自动文摘: sentense rank算法，参照pagerank算法的实现，可以指定期望的文摘长度。优化点：加入了神经网络模型判断一句话是否适合作为摘要。
 66 | 
 67 | 
 68 | 
 69 | 
 70 | # arex
 71 | node.js article extractor, automatic summarization.
 72 | 
 73 | #Install
 74 | ```shell
 75 | npm install arex
 76 | ```
 77 | 
 78 | #Usage:
 79 | ```javascript
 80 | var arex = require('arex');
 81 | //example 1
 82 | arex.get_article('http://finance.sina.com.cn/consume/puguangtai/2016-03-15/doc-ifxqhmve9227502.shtml',120,(err,result)=>{
 83 |                 //120: summary limited, if you do not need summary set it to false.
 84 | 		//result: {"title":"...","content":"....", "summary":"...", "pubdate":"..."}
 85 | 		console.log(result['content']);
 86 | });
 87 | 
 88 | //example 2
 89 | result = arex.get_article_sync('<html.........</html>',120);//result: {"title":"...","content":"....", "summary":"...", "pubdate":"..."}
 90 | 
 91 | //example 3
 92 | //summarize(content, exptd_len=120, shingle=false, min=150, max=350, filter=[], title)
 93 | var summary = arex.summarize('<html>.......</html>', 120, true);
 94 | var summary = arex.summarize('<html>.......</html>', 0.04, true, 100, 300);//summary ratio 4%, min length 100, max length 300
 95 | ```
 96 | 
 97 | #Test
 98 | 
 99 | ##get source
100 | ```shell
101 | git clone https://github.com/ahkimkoo/arex.git
102 | ```
103 | 
104 | ##test link
105 | ```shell
106 | cd arex
107 | npm install
108 | node test/test.js http://finance.sina.com.cn/consume/puguangtai/2016-03-15/doc-ifxqhmve9227502.shtml 120
109 | ```
110 | 
111 | ##About algorithm
112 | * article extractor: based density of article blocks， a bock consists of a number of natual lines.
113 | * title extracor: h1 tag or title tag, choose the best one.
114 | * pubdate extractor: regex extraction nearby the begging or article.
115 | * summarizer: based sentense rank, similar pagerank. Optimization: neural network model to determine whether a sentence is suitable as a summary.
116 | 


--------------------------------------------------------------------------------
/lib/arex.js:
--------------------------------------------------------------------------------
  1 | 'use strict'
  2 | const httpreq = require('./httprequest.js');
  3 | const sentiment_zh = require('./sentiment.js');
  4 | const Summarizer = require('./node-summary.js');
  5 | const summarizer = new Summarizer(true);
  6 | 
  7 | /**
  8 |  * get page html via http.get
  9 |  * @param  {[string]}   url      [link]
 10 |  * @param  {Function} callback [description]
 11 |  * @return {[string]}            [html string]
 12 |  */
 13 | const get_page = function(url,callback){
 14 | 	http.get(url, (res) => {
 15 | 	  	var body = '';
 16 | 		res.on('data', function(d) {
 17 | 		    body += d;
 18 | 		});
 19 | 		res.on('end', function() {
 20 | 			callback(null,body);
 21 | 		});
 22 | 	}).on('error', (e) => {
 23 | 		console.error(`Got error: ${e.message}`);
 24 | 		callback(e);
 25 | 	});
 26 | }
 27 | 
 28 | /**
 29 |  * get blocks that split by block tag
 30 |  * @param  {[string]} html [html string]
 31 |  * @return {[array]}      [blolck array]
 32 |  */
 33 | const get_blocks = function(html){
 34 | 	const line_break_tags = ['address','article','aside','audio','blockquote','canvas',
 35 | 						'dd','div','dl','fieldset','figcaption','figure','footer','form',
 36 | 						'h1','h2','h3','h4','h5','h6','header','hgroup','hr','noscript','ol','output','p','pre','section',
 37 | 						'table','tr','tfoot','ul','video','img','br'];
 38 | 	const splter = line_break_tags.join('|');	
 39 | 	html = html.replace(/<!--[\s\S]*?-->/igm,'');
 40 | 	html = html.replace(/<script[\s\S]*?<\/script>/igm,'');
 41 | 	html = html.replace(/<style[\s\S]*?<\/style>/igm,'');
 42 | 	html = html.replace(/[\n\t\r]+/igm,'');
 43 | 	let split_regx = new RegExp('(<(?:'+splter+')[^>]*?>)','ig');
 44 | 	html = html.replace(split_regx,'\n$1');
 45 | 	html = html.replace(/<\/?[^>]*?>/ig,'');
 46 | 	html = html.replace(/&[a-z]+;/ig,'');
 47 | 	html = html.replace(/&#(\d+);/g, function(match, dec) {
 48 | 				return String.fromCharCode(dec);
 49 | 			});
 50 | 	let paragraphs = html.split('\n');
 51 | 	return  paragraphs.map(line=>{
 52 | 		return line.replace(/\s{2,}/gm,' ').replace(/^\s+$/gm,'');
 53 | 	});
 54 | }
 55 | 
 56 | /**
 57 |  * Specify deepth n, block score is the length from the block to the following n block.
 58 |  * @param  {[type]} blocks [description]
 59 |  * @param  {[type]} deep   [description]
 60 |  * @return {[Array]}        [score of each block]
 61 |  */
 62 | const get_block_score = function(blocks, deep){
 63 | 	let block_score = [];
 64 | 	for(let i=0;i<blocks.length-deep;i++){
 65 | 		let score = 0;
 66 | 		for(let ix=i; ix<i+deep; ix++){
 67 | 			score += blocks[ix].length;
 68 | 		}
 69 | 		block_score[i] = score;
 70 | 	}
 71 | 	return block_score;
 72 | }
 73 | 
 74 | /**
 75 |  * dump test js file
 76 |  * @param  {[type]} block       [description]
 77 |  * @param  {[type]} block_score [description]
 78 |  * @return {[type]}             [description]
 79 |  */
 80 | const dump_test_file = (blocks, blocks_score, position) =>{
 81 | 	let fs = require('fs');
 82 | 	let path = require('path');
 83 | 	let filepath = path.resolve(__dirname,'..','test','line-data.js');
 84 | 	fs.writeFileSync(filepath, `var blocks = ${JSON.stringify(blocks)};\n`,{'encoding':'utf-8', 'flag':'w+'});
 85 | 	let blocks_length = blocks.map(function(x) {
 86 | 	   return x.length;
 87 | 	});
 88 | 	fs.writeFileSync(filepath, `var blocks_length = ${JSON.stringify(blocks_length)};\n`,{'encoding':'utf-8', 'flag':'a+'});
 89 | 	fs.writeFileSync(filepath, `var blocks_score = ${JSON.stringify(blocks_score)};\n`,{'encoding':'utf-8', 'flag':'a+'});
 90 | 	fs.writeFileSync(filepath, `var position = ${JSON.stringify(position)};\n`,{'encoding':'utf-8', 'flag':'a+'});
 91 | }
 92 | 
 93 | /**
 94 |  * Block group that split by tripple blank block
 95 |  * @param  {[type]} block_score [description]
 96 |  * @return {[array]}             block group[start pisition, end position, rate]
 97 |  */
 98 | const jedge_article_block = function(block_score){
 99 | 	// for(let i=0;i<block_score.length;i++){
100 | 	// 	let point = '';
101 | 	// 	for(var x=0;x<block_score[i];x++)point+='.';
102 | 	// 	console.log(`${i}:${block_score[i]}${point}=>${blocks[i].substring(0,20)}#`);
103 | 	// }
104 | 	let block_groups = [];
105 | 	let seek_start = true;
106 | 	let start_point = 0;
107 | 	let total_length = 0;
108 | 	let max_block_length = 0;
109 | 	for(let i=0;i<block_score.length;i++){
110 | 		max_block_length = Math.max(max_block_length, block_score[i]);
111 | 		if(block_score[i]>0){
112 | 			if(seek_start){
113 | 				start_point = i;
114 | 				seek_start = false;
115 | 			}
116 | 			total_length += block_score[i];
117 | 		}else{
118 | 			if(!seek_start){
119 | 				let rate = Math.pow(max_block_length,2) / (total_length/(i-start_point));
120 | 				block_groups.push([start_point,i,rate]);
121 | 				seek_start = true;
122 | 				total_length = 0;
123 | 				max_block_length = 0;
124 | 			}
125 | 		}
126 | 	}
127 | 	block_groups.sort((a,b)=>{
128 | 		return b[2]-a[2];
129 | 	})
130 | 	return block_groups;
131 | }
132 | 
133 | /**
134 |  * get article title
135 |  * @param  {[type]} html [description]
136 |  * @return {[type]}      [description]
137 |  */
138 | const get_title = function(html){
139 | 	let h1_regex = new RegExp('<h1[^>]*?>([^<]+)</h1>','i');
140 | 	let h1_matched = h1_regex.exec(html);
141 | 
142 | 	let title_regex = new RegExp('<title[^>]*?>([^<]+)</title>','i');
143 | 	let title_matched = title_regex.exec(html);
144 | 
145 | 	let title = (h1_matched && h1_matched.length>1) ? h1_matched[1] : ((title_matched && title_matched.length)>1 ? title_matched[1] : '');
146 | 
147 | 	if(h1_matched&&h1_matched.length>1&&title_matched && title_matched.length){
148 | 		var tmch = title_matched[1].replace(/(?:\n|\r)/gm,'');
149 | 		var hmch = h1_matched[1].replace(/(?:\n|\r)/gm,'');
150 | 		if(tmch && tmch.indexOf(hmch.substring(0,10))<0)title = tmch;
151 | 	}
152 | 	return title.replace(/(?:\n|\r)/gm,'').trim();
153 | }
154 | 
155 | /**
156 |  * get pubdate by regex
157 |  * @param  {[type]} html [description]
158 |  * @return {[type]}      [description]
159 |  */
160 | const get_pubdate = function(html){
161 | 	let pubdate = '';
162 | 	html = html.replace(/<!--[\s\S]*?-->/igm,'');
163 | 	html = html.replace(/<script[\s\S]*?<\/script>/igm,'');
164 | 	html = html.replace(/<style[\s\S]*?<\/style>/igm,'');
165 | 	let pb_regex = new RegExp('([\\d\\-\u5e74\u6708\u65e5]{8,15}\\s?\\d{1,2}(?:\:|\：)\\d{1,2})','img');
166 | 	let matched = pb_regex.exec(html);
167 | 	if(matched&&matched.length>1)pubdate = matched[1];
168 | 	return pubdate;
169 | }
170 | 
171 | /**
172 |  * get pubdate that closed to article.
173 |  * @param  {[type]} blocks    [description]
174 |  * @param  {[type]} start_pos [description]
175 |  * @return {[type]}           [description]
176 |  */
177 | const get_pubdate_base_block = function(blocks,start_pos){
178 | 	let pubdate = '';
179 | 	let pb_regex = new RegExp('(\\d{4}(?:\\-|\\u5e74)\\d{1,2}(?:\\-|\\u6708)\\d{1,2}[\\s\\u65e5\\d\\:]*)','img');
180 | 	for(let i=start_pos;i>=0;i--){
181 | 		let matched = pb_regex.exec(blocks[i]);
182 | 		if(matched&&matched.length>1){
183 | 			pubdate = matched[1];
184 | 			break;
185 | 		}
186 | 	}
187 | 	return pubdate;
188 | }
189 | 
190 | /**
191 |  * filter none content tags
192 |  * @param  {[type]} html [description]
193 |  * @return {[type]}      [description]
194 |  */
195 | const filterNoneContentTags = function(html){
196 | 	return html
197 | 	.replace(/<script[\s\S]*?\/script>/img,'')
198 | 	.replace(/<!--[\s\S]*?-->/img,'')
199 | 	.replace(/<style[\s\S]*?\/style>/img,'')
200 | 	.replace(/<script[^>]+?>/ig,'')
201 | 	.replace(/<!--[^>]+?>/ig,'')
202 | 	.replace(/<input[^>]+?>/ig,'')
203 | 	.replace(/<img.*?>/ig,'\n')
204 | 	.replace(/<a[^>]*?>[^(<\/a>)]{10,}<\/a>/igm,'')
205 | 	.replace(/[\n ]+/ig,'\n')
206 | 	.replace(/[\n]{4,}/ig,'\n\n\n');
207 | }
208 | 
209 | /**
210 |  * get article info synchornized
211 |  * @param  {[string]} html      [html string]
212 |  * @param  {[int]} summarize [expected summary length]
213 |  * @return {[object]}           [article info{'content','title','pubdate','summary','content_html','author'}]
214 |  */
215 | const get_article_sync = function(html, exptd_len=120, shingle=false, min=150, max=350, filter=[]){
216 | 	let body = html.replace(/^[\s\S]*(<body[\s\S]*?<\/body>)[\s\S]*$/img,'$1');
217 | 	body = filterNoneContentTags(body);
218 | 	let blocks = get_blocks(body);
219 | 	let block_score  = get_block_score(blocks,5);
220 | 	let grate = jedge_article_block(block_score);
221 | 	let article_content = grate.length>0?blocks.slice(grate[0][0],grate[0][1]):blocks;
222 | 	// dump_test_file(blocks,block_score,grate[0]);
223 | 	let title = get_title(html);
224 | 	let content　= article_content.join('\n');
225 | 	let summarizer = new Summarizer(shingle,filter);
226 | 	return {
227 | 		'content' : content　,
228 | 		'title' : title,
229 | 		'pubdate' : grate.length>0?get_pubdate_base_block(blocks, grate[0][0]):get_pubdate(html),
230 | 		'summary' : summarizer.summarize(content, exptd_len, title),
231 | 		'sentiment' : sentiment_zh(article_content.join('\n')).score
232 | 	}
233 | }
234 | 
235 | const summarize = function(content, exptd_len=120, shingle=false, min=150, max=350, filter=[], title){
236 | 	content = filterNoneContentTags(content);
237 | 	let blocks = get_blocks(content); 
238 | 	if(exptd_len<1 && exptd_len>0){
239 | 		exptd_len = parseInt(blocks.join('').length * exptd_len);
240 | 		if(exptd_len<min)exptd_len=min;
241 | 		if(exptd_len>max)exptd_len=max;
242 | 	}
243 | 	content　= blocks.join('\n');
244 | 	let summarizer = new Summarizer(shingle,filter);
245 | 	return summarizer.summarize(content, exptd_len, title);
246 | }
247 | 
248 | /**
249 |  * get article info, wrapper of get_article_sync
250 |  * @param  {[string]}   url       [url]
251 |  * @param  {[int]}   summarize [expected summary length]
252 |  * @param  {Function} callback  [call back function]
253 |  * @return {[type]}             [description]
254 |  */
255 | const get_article = function(url, summarize, callback){
256 | 	httpreq.get(url,(err,body)=>{
257 | 		if(err)callback(err,{});
258 | 		else callback(null,get_article_sync(body, summarize));
259 | 	});
260 | }
261 | 
262 | exports.summarize = summarize
263 | 
264 | exports.sentiment = function(content, inject){
265 | 	content = filterNoneContentTags(content);
266 | 	let blocks = get_blocks(content);
267 | 	content　= blocks.join('\n');
268 | 	return sentiment_zh(content, inject);
269 | }
270 | 
271 | exports.get_article_sync = get_article_sync;
272 | exports.get_article = get_article;


--------------------------------------------------------------------------------
/lib/data/AFINN-zh_cn.json:
--------------------------------------------------------------------------------
   1 | {
   2 |     "一句话": -2,
   3 |     "一审宣判": -1,
   4 |     "一拖再拖": -1,
   5 |     "一文不值": -2,
   6 |     "一笑": 2,
   7 |     "三宝": 2,
   8 |     "上衣": 2,
   9 |     "下垂": -2,
  10 |     "不专业": -2,
  11 |     "不乖": -2,
  12 |     "不以为然": -2,
  13 |     "不便之处": -2,
  14 |     "不信": -1,
  15 |     "不信任": -3,
  16 |     "不健康": -2,
  17 |     "不公平": -2,
  18 |     "不可取": -2,
  19 |     "不可抗拒": 2,
  20 |     "不可爱": -2,
  21 |     "不可逆": -1,
  22 |     "不合理": -1,
  23 |     "不和谐": -2,
  24 |     "不喜欢": -2,
  25 |     "不好": -2,
  26 |     "不安": -1,
  27 |     "不安全": -2,
  28 |     "不完善": -2,
  29 |     "不尊重": -2,
  30 |     "不屑": -2,
  31 |     "不工作": -3,
  32 |     "不平等": -1,
  33 |     "不悦": -2,
  34 |     "不支持": -2,
  35 |     "不敏感": -2,
  36 |     "不敬": -2,
  37 |     "不方便": -2,
  38 |     "不明": -1,
  39 |     "不服气": -1,
  40 |     "不满": -2,
  41 |     "不满意": -2,
  42 |     "不知道": -2,
  43 |     "不确定": -1,
  44 |     "不确定性": -1,
  45 |     "不祥": 3,
  46 |     "不稳定": -2,
  47 |     "不耐烦": -2,
  48 |     "不能接受": -2,
  49 |     "不舒服": -2,
  50 |     "不要脸": -4,
  51 |     "不解": -2,
  52 |     "不诚实": -2,
  53 |     "不负责任": 2,
  54 |     "不足": -2,
  55 |     "不道德": -2,
  56 |     "不配": -2,
  57 |     "不错": 3,
  58 |     "不需要": -2,
  59 |     "不高兴": -2,
  60 |     "丑": -3,
  61 |     "丑闻": -3,
  62 |     "专用": 2,
  63 |     "丢失": -2,
  64 |     "丢弃": -1,
  65 |     "严厉": -2,
  66 |     "严惩": -3,
  67 |     "严格": 3,
  68 |     "严谨": 3,
  69 |     "严重": -2,
  70 |     "丧": -2,
  71 |     "丧偶": -1,
  72 |     "丧失抵押品赎回权": -2,
  73 |     "中伤": -2,
  74 |     "中断": -2,
  75 |     "中毒": -2,
  76 |     "主动": 1,
  77 |     "主管": 2,
  78 |     "举棋不定": -2,
  79 |     "乐观": 2,
  80 |     "乱": -2,
  81 |     "乳房": -2,
  82 |     "了不起": 4,
  83 |     "争议": -2,
  84 |     "争鸣": -1,
  85 |     "事": 1,
  86 |     "事故": -2,
  87 |     "事项": 1,
  88 |     "享受": 2,
  89 |     "享有": 2,
  90 |     "亮": 1,
  91 |     "亮度": 1,
  92 |     "亮点": 2,
  93 |     "亲切": 3,
  94 |     "亲情": 3,
  95 |     "亲爱": 2,
  96 |     "人渣": -4,
  97 |     "仇敌": -3,
  98 |     "从事": 1,
  99 |     "他妈的": -4,
 100 |     "付": -1,
 101 |     "代表作": 4,
 102 |     "代言": 2,
 103 |     "令人不安": -2,
 104 |     "令人印象深刻": 3,
 105 |     "令人叹为观止": 3,
 106 |     "令人失望": -2,
 107 |     "令人心寒": -1,
 108 |     "令人担忧": -3,
 109 |     "令人振奋": 3,
 110 |     "令人欣慰": 2,
 111 |     "令人沮丧": -2,
 112 |     "令人痛心": -2,
 113 |     "令人讨厌": -2,
 114 |     "令人难以忘怀": 1,
 115 |     "令人难以置信": -1,
 116 |     "令人震惊": -2,
 117 |     "优势": 2,
 118 |     "优点": 2,
 119 |     "优秀": 5,
 120 |     "优良": 3,
 121 |     "优雅": 2,
 122 |     "传染": -2,
 123 |     "传染性": -1,
 124 |     "伤亡": -2,
 125 |     "伤害": -2,
 126 |     "伤心": -2,
 127 |     "伤心欲绝": -3,
 128 |     "伤感": -2,
 129 |     "伤脑筋": -2,
 130 |     "伦理": 2,
 131 |     "伪科学": -3,
 132 |     "伪装": -1,
 133 |     "伪证": -3,
 134 |     "伪造": -3,
 135 |     "低估": -1,
 136 |     "低劣": -3,
 137 |     "低能儿": -3,
 138 |     "作假": -3,
 139 |     "你妈的": -4,
 140 |     "佩服": 3,
 141 |     "使...称叹": 3,
 142 |     "依赖": 2,
 143 |     "侮辱": -1,
 144 |     "侵权": -2,
 145 |     "侵略": -2,
 146 |     "促进": 1,
 147 |     "俏皮": 2,
 148 |     "保存": 2,
 149 |     "保护": 1,
 150 |     "保暖": 1,
 151 |     "保留": -1,
 152 |     "保证": 1,
 153 |     "信任": 1,
 154 |     "信心": 2,
 155 |     "信念": 1,
 156 |     "倒霉": -2,
 157 |     "倜傥": 2,
 158 |     "借口": -1,
 159 |     "倦怠": -2,
 160 |     "债务": -2,
 161 |     "值得": 2,
 162 |     "值得一": 2,
 163 |     "倾倒": -2,
 164 |     "倾注": 3,
 165 |     "假装": -1,
 166 |     "假货": -3,
 167 |     "偏向": -2,
 168 |     "偏见": -1,
 169 |     "停止": -1,
 170 |     "停滞": -2,
 171 |     "停车": -1,
 172 |     "健康": 2,
 173 |     "健忘": -2,
 174 |     "健身": 1,
 175 |     "偷": -2,
 176 |     "偷偷摸摸": -1,
 177 |     "傲慢": -2,
 178 |     "傻": -1,
 179 |     "傻瓜": -2,
 180 |     "像": 2,
 181 |     "僵局": -2,
 182 |     "允许": 1,
 183 |     "充足": 1,
 184 |     "先进": 1,
 185 |     "免疫": 1,
 186 |     "免费": 1,
 187 |     "免除": 2,
 188 |     "兑现": -2,
 189 |     "入狱": -2,
 190 |     "全神贯注": 1,
 191 |     "八卦": -2,
 192 |     "公平": 2,
 193 |     "公正": 2,
 194 |     "公鸡": -5,
 195 |     "关心": 2,
 196 |     "兴奋": 3,
 197 |     "兴趣": 1,
 198 |     "具有讽刺意味​​": -1,
 199 |     "具有里程碑意义": 2,
 200 |     "内疚": -3,
 201 |     "再次保证": 1,
 202 |     "冒犯": -2,
 203 |     "冒险": 2,
 204 |     "冠军": 4,
 205 |     "冤": -2,
 206 |     "冥想": 1,
 207 |     "冰雹": 2,
 208 |     "冲击": -2,
 209 |     "冲洗": -3,
 210 |     "冲突": -2,
 211 |     "冲突性": -2,
 212 |     "决定性": 1,
 213 |     "冷冷清清": -2,
 214 |     "冷漠": -2,
 215 |     "冷落": -2,
 216 |     "冷门": -2,
 217 |     "冷静": 2,
 218 |     "净度": 2,
 219 |     "凯旋": 4,
 220 |     "凶手": -2,
 221 |     "出轨": -2,
 222 |     "出逃": -1,
 223 |     "击碎": -1,
 224 |     "击退": -1,
 225 |     "分享": 1,
 226 |     "分享到": 1,
 227 |     "分心": -2,
 228 |     "分散": -2,
 229 |     "分散了": -2,
 230 |     "分离": -1,
 231 |     "切": -1,
 232 |     "切割": -1,
 233 |     "创意": 2,
 234 |     "创新": 1,
 235 |     "判决": -1,
 236 |     "利用": -2,
 237 |     "利益": 1,
 238 |     "制备": 1,
 239 |     "刺": -2,
 240 |     "刺伤": -2,
 241 |     "刺激": -3,
 242 |     "刺激性": -3,
 243 |     "刻板印象": null,
 244 |     "刻毒": -2,
 245 |     "削减": -2,
 246 |     "前景": 1,
 247 |     "前景堪忧": -3,
 248 |     "前锋": -2,
 249 |     "剧毒": -2,
 250 |     "功能强大": 2,
 251 |     "功能障碍": -2,
 252 |     "加强": 2,
 253 |     "加重": -2,
 254 |     "劣势": -2,
 255 |     "动机": 1,
 256 |     "助学金": 1,
 257 |     "励志": 2,
 258 |     "势不可挡": 2,
 259 |     "勇敢": 2,
 260 |     "勇气": 2,
 261 |     "勒死": -2,
 262 |     "勘探": 1,
 263 |     "勾结": -3,
 264 |     "包庇": -3,
 265 |     "千篇一律": -2,
 266 |     "千载难逢": 3,
 267 |     "升值": 2,
 268 |     "半信半疑": -2,
 269 |     "协议": 1,
 270 |     "卑鄙": -3,
 271 |     "卓越": 2,
 272 |     "单纯": -2,
 273 |     "占有欲": -2,
 274 |     "卡": -2,
 275 |     "印象": 3,
 276 |     "印象深刻": 3,
 277 |     "危害": -2,
 278 |     "危机": -3,
 279 |     "危言耸听": -2,
 280 |     "危险": -2,
 281 |     "厄运": -2,
 282 |     "压制": -1,
 283 |     "压力": -1,
 284 |     "压迫": -2,
 285 |     "厌倦了": -3,
 286 |     "厌恶": -3,
 287 |     "原谅": 1,
 288 |     "参加办法": 1,
 289 |     "友好": 2,
 290 |     "反应过度": -2,
 291 |     "反感": -3,
 292 |     "发人深省": -1,
 293 |     "发自内心": 3,
 294 |     "发誓": -2,
 295 |     "取消": -1,
 296 |     "取消比赛资格": -2,
 297 |     "受不了": -3,
 298 |     "受伤": -2,
 299 |     "受害": -3,
 300 |     "受害人": -3,
 301 |     "受害者": -3,
 302 |     "受理": 1,
 303 |     "受益": 2,
 304 |     "受限": -2,
 305 |     "受骗": -2,
 306 |     "叛逆": -3,
 307 |     "口交": -5,
 308 |     "句子": -2,
 309 |     "叫好": 2,
 310 |     "叫道": -2,
 311 |     "可以肯定": 1,
 312 |     "可信": 2,
 313 |     "可取": 2,
 314 |     "可怕": -2,
 315 |     "可怜": -2,
 316 |     "可恶": -3,
 317 |     "可悲是": -2,
 318 |     "可惜": -2,
 319 |     "可爱": 2,
 320 |     "可疑": -2,
 321 |     "可笑": -3,
 322 |     "可耻": -2,
 323 |     "可获免咎": 2,
 324 |     "可避免出现": -1,
 325 |     "合法": 1,
 326 |     "同情": -1,
 327 |     "同意": 1,
 328 |     "后卫": 1,
 329 |     "后悔": -2,
 330 |     "向往": -1,
 331 |     "吓了一跳": -2,
 332 |     "吓人": -2,
 333 |     "吓呆了": -2,
 334 |     "吓坏了": -2,
 335 |     "否认": -2,
 336 |     "含糊": -2,
 337 |     "吮吸": -3,
 338 |     "启发": 2,
 339 |     "启示": -2,
 340 |     "吸吮": -3,
 341 |     "吸引": 1,
 342 |     "吸引力": 2,
 343 |     "吸收": 1,
 344 |     "吹嘘": -2,
 345 |     "吹捧": -2,
 346 |     "呆滞": -2,
 347 |     "告诫": -2,
 348 |     "呛": -2,
 349 |     "呜呼": 3,
 350 |     "周到": 2,
 351 |     "呻吟": -2,
 352 |     "呼喊": -2,
 353 |     "咄咄逼人": -2,
 354 |     "咆哮": -3,
 355 |     "和平": 2,
 356 |     "和煦": 3,
 357 |     "哀悼": -2,
 358 |     "品味": 2,
 359 |     "哄骗": -2,
 360 |     "哇": 4,
 361 |     "哈": 2,
 362 |     "哈哈": 3,
 363 |     "哈哈哈": 3,
 364 |     "哑巴": -3,
 365 |     "哑弹": -2,
 366 |     "哗然": -2,
 367 |     "哭了": -1,
 368 |     "哭泣": -2,
 369 |     "哽咽": -2,
 370 |     "哽咽道": -2,
 371 |     "唉": -1,
 372 |     "商贩": -2,
 373 |     "善良": 3,
 374 |     "善解人意": 2,
 375 |     "喜剧": 1,
 376 |     "喜悦": 3,
 377 |     "喜欢": 2,
 378 |     "喧嚷": -1,
 379 |     "喧闹": -1,
 380 |     "嗜睡": -2,
 381 |     "嘲弄": -2,
 382 |     "嘲笑": -2,
 383 |     "囚犯": -2,
 384 |     "囚禁": -2,
 385 |     "回应": 2,
 386 |     "回避": -3,
 387 |     "团结": 1,
 388 |     "困": -2,
 389 |     "困境": -1,
 390 |     "困惑": -2,
 391 |     "困扰": -1,
 392 |     "困难": -2,
 393 |     "固体": 2,
 394 |     "固定": -1,
 395 |     "固执": -2,
 396 |     "在调解": 2,
 397 |     "地狱": -4,
 398 |     "坏蛋": -3,
 399 |     "坐立不安": -2,
 400 |     "坑蒙拐骗": -3,
 401 |     "块": -1,
 402 |     "坚不可摧": 2,
 403 |     "坚信": 1,
 404 |     "坚决": 2,
 405 |     "坚果": -3,
 406 |     "坦言": -1,
 407 |     "垂头丧气": -2,
 408 |     "垃圾邮件": -2,
 409 |     "垃圾邮件发送者": -3,
 410 |     "垄断": -2,
 411 |     "基本上": 1,
 412 |     "堆积": -1,
 413 |     "堕落": -2,
 414 |     "堵": -1,
 415 |     "堵嘴": -2,
 416 |     "增加": 1,
 417 |     "增益": 2,
 418 |     "士气低落": -2,
 419 |     "声讨": -2,
 420 |     "处于不利地位": -2,
 421 |     "处罚": -2,
 422 |     "复仇": -2,
 423 |     "复兴": 2,
 424 |     "复杂": 2,
 425 |     "复活": 2,
 426 |     "外伤": -3,
 427 |     "夜魔侠": 2,
 428 |     "大": 1,
 429 |     "大厅": -2,
 430 |     "大喜": 4,
 431 |     "大怒": -3,
 432 |     "大惊失色": -2,
 433 |     "大方": 2,
 434 |     "大胆": 2,
 435 |     "大赞": 3,
 436 |     "天上": 4,
 437 |     "天堂": 2,
 438 |     "天真": -2,
 439 |     "天赐": 4,
 440 |     "失业率": -2,
 441 |     "失去": -3,
 442 |     "失去人性": -2,
 443 |     "失望": -2,
 444 |     "失眠": -2,
 445 |     "失败": -2,
 446 |     "失速": -2,
 447 |     "头晕": -2,
 448 |     "夸大": -2,
 449 |     "夸张": -2,
 450 |     "奇": -2,
 451 |     "奇妙": 3,
 452 |     "奇怪是": -1,
 453 |     "奇迹": 3,
 454 |     "奋斗": -2,
 455 |     "奖励": 2,
 456 |     "奖牌": 3,
 457 |     "奖项": 3,
 458 |     "奴役": -2,
 459 |     "奸商": -2,
 460 |     "好": 2,
 461 |     "好处": 2,
 462 |     "好奇": 1,
 463 |     "好玩": 4,
 464 |     "好评": 3,
 465 |     "妈的": -4,
 466 |     "妒忌": -1,
 467 |     "妓女": -4,
 468 |     "委屈": -2,
 469 |     "委托": 2,
 470 |     "威胁": -2,
 471 |     "娘": -5,
 472 |     "娘们": -5,
 473 |     "娱乐": 2,
 474 |     "嫉妒": -2,
 475 |     "孔": -2,
 476 |     "孤独": -2,
 477 |     "孩子气": -2,
 478 |     "宁静": 2,
 479 |     "宇": 3,
 480 |     "安全": 1,
 481 |     "安慰": 2,
 482 |     "安抚": 1,
 483 |     "完善": 2,
 484 |     "完好": 2,
 485 |     "完成": 2,
 486 |     "完美": 3,
 487 |     "官司": -2,
 488 |     "宝": 2,
 489 |     "宝石": 1,
 490 |     "实战": -1,
 491 |     "实现": 1,
 492 |     "实用性": 2,
 493 |     "实质": 1,
 494 |     "审批": 2,
 495 |     "审查": -2,
 496 |     "审问": -2,
 497 |     "宣传": -2,
 498 |     "宣判": -2,
 499 |     "宣誓就职": -2,
 500 |     "害怕": -2,
 501 |     "害羞": -1,
 502 |     "宽容": 1,
 503 |     "宽松": 1,
 504 |     "宽限期": 1,
 505 |     "寂寞": -2,
 506 |     "富人": 2,
 507 |     "富有魅力": 3,
 508 |     "对号入座": -2,
 509 |     "对抗": -1,
 510 |     "射击": -2,
 511 |     "尊敬": 2,
 512 |     "小便": -4,
 513 |     "小姐": -2,
 514 |     "小心": -2,
 515 |     "小气": -2,
 516 |     "小白": -2,
 517 |     "小说": 2,
 518 |     "小霸王": -2,
 519 |     "尖刻": -3,
 520 |     "尖叫": -2,
 521 |     "尴尬": -2,
 522 |     "尸体": -1,
 523 |     "屁股": -4,
 524 |     "屄": -5,
 525 |     "屈辱": -3,
 526 |     "崇拜": 3,
 527 |     "崇敬": 2,
 528 |     "崩溃": -2,
 529 |     "巧": 2,
 530 |     "巨大": 3,
 531 |     "差": -2,
 532 |     "师爷": -2,
 533 |     "希望": 1,
 534 |     "帕利": -1,
 535 |     "帮助": 2,
 536 |     "平反": 2,
 537 |     "平庸": -3,
 538 |     "平淡": -2,
 539 |     "平静": 2,
 540 |     "幸存下来": 2,
 541 |     "幸存者": 2,
 542 |     "幸福": 3,
 543 |     "幸运": 3,
 544 |     "幸运是": 3,
 545 |     "幽默": 2,
 546 |     "庄严": -1,
 547 |     "庆幸": 4,
 548 |     "庆祝": 3,
 549 |     "应激": -2,
 550 |     "废墟": -2,
 551 |     "废话": -2,
 552 |     "延伸": 1,
 553 |     "延期": -1,
 554 |     "延迟": -1,
 555 |     "延长": 1,
 556 |     "开发": -2,
 557 |     "开导": 2,
 558 |     "开心": 3,
 559 |     "开朗": 2,
 560 |     "开脱": 2,
 561 |     "异化": -2,
 562 |     "异想天开": 1,
 563 |     "弊端": -3,
 564 |     "引人入胜": 3,
 565 |     "张力": -1,
 566 |     "弱": -2,
 567 |     "弱势": -2,
 568 |     "弱点": -2,
 569 |     "强": 2,
 570 |     "强人所难": -2,
 571 |     "强制": -1,
 572 |     "强制性": -1,
 573 |     "强化": 2,
 574 |     "强壮": 2,
 575 |     "强奸犯": -4,
 576 |     "强度": 2,
 577 |     "强盗": -2,
 578 |     "强调": -2,
 579 |     "归属": 1,
 580 |     "影响": -1,
 581 |     "征收": -1,
 582 |     "很简单": 1,
 583 |     "很酷东西": 3,
 584 |     "徒劳": 2,
 585 |     "得意": 2,
 586 |     "得意扬扬": 3,
 587 |     "得意洋洋": 3,
 588 |     "得罪": -2,
 589 |     "得罪了": -2,
 590 |     "徘": -2,
 591 |     "御史": -2,
 592 |     "微笑": 2,
 593 |     "心慌": -2,
 594 |     "心灰意冷": -2,
 595 |     "心生疑虑": -1,
 596 |     "心疼": -2,
 597 |     "心碎": -3,
 598 |     "心花怒放": 3,
 599 |     "忌": -1,
 600 |     "忐忑": -2,
 601 |     "忘记": -1,
 602 |     "忠实": 3,
 603 |     "忠诚": 3,
 604 |     "忠诚度": 3,
 605 |     "忧心忡忡": -2,
 606 |     "忧虑": -2,
 607 |     "忧郁": -1,
 608 |     "快乐": 3,
 609 |     "快乐可言": -2,
 610 |     "快捷": 2,
 611 |     "快活": 2,
 612 |     "忽略": -1,
 613 |     "忽视": -1,
 614 |     "怀疑": -1,
 615 |     "怀疑论者": -2,
 616 |     "怒气冲冲": -3,
 617 |     "怜悯": 2,
 618 |     "怠慢": -2,
 619 |     "急": -1,
 620 |     "急了": -2,
 621 |     "急切": 2,
 622 |     "性交": -4,
 623 |     "性感": 3,
 624 |     "怪": -1,
 625 |     "怪异": -2,
 626 |     "怯懦": -2,
 627 |     "恋情": 2,
 628 |     "恐吓": -2,
 629 |     "恐怖": -3,
 630 |     "恐惧": -2,
 631 |     "恐慌": -2,
 632 |     "恢复": 1,
 633 |     "恨": -3,
 634 |     "恭喜": 2,
 635 |     "恶人-2\r": null,
 636 |     "恶作剧": -1,
 637 |     "恶化": -3,
 638 |     "恶心": -3,
 639 |     "恶棍": -3,
 640 |     "恶毒": -2,
 641 |     "恶行": -1,
 642 |     "恼人": -2,
 643 |     "恼火": -2,
 644 |     "悍妇": -4,
 645 |     "悖论": -1,
 646 |     "悟": 2,
 647 |     "悲伤": -2,
 648 |     "悲切": -2,
 649 |     "悲剧": -2,
 650 |     "悲哀": -2,
 651 |     "悲怆": -2,
 652 |     "悲愤": -2,
 653 |     "悲痛": -2,
 654 |     "悲观": -2,
 655 |     "悼念": -2,
 656 |     "惆怅": -2,
 657 |     "惊": -2,
 658 |     "惊人": 3,
 659 |     "惊叹": 2,
 660 |     "惊呆了": -2,
 661 |     "惊奇": 2,
 662 |     "惊惶-2\r": null,
 663 |     "惊慌失措": -3,
 664 |     "惊艳": 4,
 665 |     "惊讶": 2,
 666 |     "惊险": 5,
 667 |     "惊魂": -2,
 668 |     "惜字": 2,
 669 |     "惨": -3,
 670 |     "惨不忍睹": -2,
 671 |     "惨淡": -2,
 672 |     "惨败": -3,
 673 |     "惩戒": -3,
 674 |     "惩罚": -2,
 675 |     "惭愧": -2,
 676 |     "想家": -2,
 677 |     "惹恼": -2,
 678 |     "惹恼了": -2,
 679 |     "愁眉苦脸": -1,
 680 |     "愉快": 3,
 681 |     "意义": -2,
 682 |     "意外": -2,
 683 |     "意愿": 2,
 684 |     "意气风发": 2,
 685 |     "愚蠢": -2,
 686 |     "感兴趣是": 2,
 687 |     "感叹": -2,
 688 |     "感染": -2,
 689 |     "感觉": 1,
 690 |     "感谢": 2,
 691 |     "愣神": -2,
 692 |     "愤世嫉俗者": -2,
 693 |     "愤怒": -2,
 694 |     "愤慨": -2,
 695 |     "愤懑": -2,
 696 |     "愿景": 1,
 697 |     "愿望": 1,
 698 |     "慈悲": 2,
 699 |     "憎恶": -3,
 700 |     "懊恼": -2,
 701 |     "懒得": -2,
 702 |     "懒惰": -1,
 703 |     "懦夫": -2,
 704 |     "成功": 2,
 705 |     "成名原因": 1,
 706 |     "成本": -2,
 707 |     "成熟": 2,
 708 |     "成长": 1,
 709 |     "战": -2,
 710 |     "战争": -2,
 711 |     "战斗": -1,
 712 |     "戡": -2,
 713 |     "戴": -1,
 714 |     "手无寸铁": -2,
 715 |     "打扰": -2,
 716 |     "打招呼": 1,
 717 |     "打断": -2,
 718 |     "打断了": -2,
 719 |     "打败了": -2,
 720 |     "扩展": 1,
 721 |     "扫地": -2,
 722 |     "扬言": -2,
 723 |     "扭曲": -2,
 724 |     "扰乱": -2,
 725 |     "批准": 2,
 726 |     "批评": -2,
 727 |     "扼流圈": -2,
 728 |     "承认": -1,
 729 |     "承诺": 1,
 730 |     "抑制": -1,
 731 |     "投机": -2,
 732 |     "抖动": -2,
 733 |     "抗议": -2,
 734 |     "抗议者": -2,
 735 |     "抗辩": -2,
 736 |     "折扣": -1,
 737 |     "折磨": -1,
 738 |     "抛弃": -2,
 739 |     "抢": -2,
 740 |     "抢劫": -2,
 741 |     "抢断": -2,
 742 |     "护理方法": 2,
 743 |     "报复": -2,
 744 |     "报料": -2,
 745 |     "报警": -2,
 746 |     "抱怨": -2,
 747 |     "抱怨道": -2,
 748 |     "抵制": -2,
 749 |     "抹杀": -2,
 750 |     "抽筋": -1,
 751 |     "抿着嘴": -2,
 752 |     "担心": -2,
 753 |     "拍摄": -1,
 754 |     "拍案而起": -3,
 755 |     "拒不": -2,
 756 |     "拒绝": -1,
 757 |     "拒绝了": -2,
 758 |     "拓展": 1,
 759 |     "拖": -1,
 760 |     "拘留": -2,
 761 |     "招呼": 1,
 762 |     "招徕": -2,
 763 |     "招标内容": 2,
 764 |     "拥抱": 1,
 765 |     "拮抗": -2,
 766 |     "拷问": -4,
 767 |     "拼命": -3,
 768 |     "持怀疑态度": -2,
 769 |     "挂羊头卖狗肉": -2,
 770 |     "指控": -2,
 771 |     "指责": -2,
 772 |     "挑刺": -5,
 773 |     "挑战": -1,
 774 |     "挑衅": -1,
 775 |     "挖苦": -2,
 776 |     "挣扎": -2,
 777 |     "挫败": -2,
 778 |     "振奋": 3,
 779 |     "挺举": -3,
 780 |     "损失": -3,
 781 |     "损害": -3,
 782 |     "授": 1,
 783 |     "掉落": -1,
 784 |     "掌声": 2,
 785 |     "排水": -2,
 786 |     "排除": -1,
 787 |     "探究": -2,
 788 |     "探索": 1,
 789 |     "接受": 1,
 790 |     "接合": 1,
 791 |     "接吻": 2,
 792 |     "推出": 1,
 793 |     "推广": 1,
 794 |     "推荐": 2,
 795 |     "推迟": -1,
 796 |     "提升": 1,
 797 |     "插科打诨": -2,
 798 |     "揭露": -1,
 799 |     "搞乱了": -2,
 800 |     "搞坏": -2,
 801 |     "搞砸了": -3,
 802 |     "搞笑": 4,
 803 |     "摇摆不定": -1,
 804 |     "摇晃": -2,
 805 |     "摊主": -2,
 806 |     "撒尿": -3,
 807 |     "撕裂": -2,
 808 |     "操作": -1,
 809 |     "操控": -1,
 810 |     "操纵": -1,
 811 |     "支持": 1,
 812 |     "支持者": 1,
 813 |     "收益": 2,
 814 |     "收藏": 2,
 815 |     "收费": -3,
 816 |     "收费标准": -2,
 817 |     "改善": 2,
 818 |     "改进": 2,
 819 |     "攻击": -1,
 820 |     "放弃": -1,
 821 |     "放心": 1,
 822 |     "放松": 2,
 823 |     "放缓": -1,
 824 |     "放逐": -1,
 825 |     "故障": -2,
 826 |     "敌人": -2,
 827 |     "敌意": -2,
 828 |     "敏锐": 1,
 829 |     "救市": -2,
 830 |     "救援": 2,
 831 |     "救生员": 4,
 832 |     "散播": -2,
 833 |     "敬佩": 3,
 834 |     "文盲": -2,
 835 |     "斗争": -2,
 836 |     "斜线": -2,
 837 |     "斧": -1,
 838 |     "新鲜": 1,
 839 |     "旗舰": 2,
 840 |     "无": -1,
 841 |     "无与伦比": 1,
 842 |     "无为": -2,
 843 |     "无力": -2,
 844 |     "无奈": -2,
 845 |     "无心": -2,
 846 |     "无忧无虑": 1,
 847 |     "无担保": -2,
 848 |     "无效": -2,
 849 |     "无敌": 2,
 850 |     "无牙": -2,
 851 |     "无用": -2,
 852 |     "无畏": 2,
 853 |     "无知": -2,
 854 |     "无精打采": -2,
 855 |     "无罪": 2,
 856 |     "无聊": -2,
 857 |     "无能": -2,
 858 |     "无行为能力": -2,
 859 |     "无视": -2,
 860 |     "无言以对": -2,
 861 |     "无赖": -2,
 862 |     "日照": 2,
 863 |     "旦": -2,
 864 |     "时髦": 2,
 865 |     "明快": 2,
 866 |     "明确": 1,
 867 |     "明确提出": 1,
 868 |     "昏睡": -2,
 869 |     "映入眼帘": 1,
 870 |     "是的": 1,
 871 |     "显着": 2,
 872 |     "显著": 1,
 873 |     "晕": -1,
 874 |     "景点": 2,
 875 |     "智能": 1,
 876 |     "智能化": 2,
 877 |     "暂停": -1,
 878 |     "暗杀": -3,
 879 |     "暴力": -3,
 880 |     "曝光": -1,
 881 |     "更大": 3,
 882 |     "更糟": -3,
 883 |     "替罪羊": -2,
 884 |     "最严厉": -2,
 885 |     "最低": -1,
 886 |     "最佳": 3,
 887 |     "最喜欢": 2,
 888 |     "最大": 3,
 889 |     "最强": 2,
 890 |     "最穷": -2,
 891 |     "最糟糕": -3,
 892 |     "最聪明": 2,
 893 |     "最脏": -2,
 894 |     "最黑暗": -2,
 895 |     "有影响": 2,
 896 |     "有效": 2,
 897 |     "有条不紊": 2,
 898 |     "有用": 2,
 899 |     "有罪": -3,
 900 |     "有趣": 4,
 901 |     "有远见": 3,
 902 |     "朗声道": -1,
 903 |     "期待已久": -1,
 904 |     "期望": 2,
 905 |     "未了": -2,
 906 |     "未定": -1,
 907 |     "未经批准": -2,
 908 |     "未经证实": -1,
 909 |     "机会": 2,
 910 |     "机遇": 2,
 911 |     "杀": -3,
 912 |     "杀敌": -3,
 913 |     "杀气": -3,
 914 |     "杂乱无章": -2,
 915 |     "杂役": -2,
 916 |     "权威": 1,
 917 |     "来头": 2,
 918 |     "来袭": -1,
 919 |     "松": -3,
 920 |     "松了口气": 2,
 921 |     "极权主义": -2,
 922 |     "枪": -1,
 923 |     "某种": 0,
 924 |     "查杀": -3,
 925 |     "柴": -3,
 926 |     "柴草": -3,
 927 |     "梦": 1,
 928 |     "梦幻": 4,
 929 |     "梦想": 1,
 930 |     "棘手": -2,
 931 |     "森森": -2,
 932 |     "模拟": -2,
 933 |     "模糊": -2,
 934 |     "欢乐": 2,
 935 |     "欢呼": 2,
 936 |     "欢喜": 3,
 937 |     "欢欣鼓舞": 4,
 938 |     "欢腾": 3,
 939 |     "欢迎": 2,
 940 |     "欣喜": 3,
 941 |     "欣喜若狂": 2,
 942 |     "欣快": 4,
 943 |     "欣赏": 2,
 944 |     "欲绝": -2,
 945 |     "欺凌": -2,
 946 |     "欺诈": -4,
 947 |     "欺负": -2,
 948 |     "欺骗": -2,
 949 |     "歇斯底里": -3,
 950 |     "正": 2,
 951 |     "正义": 2,
 952 |     "正确方向": 3,
 953 |     "正面": 2,
 954 |     "歹徒": -3,
 955 |     "死": -3,
 956 |     "死亡": -2,
 957 |     "死亡人数": -3,
 958 |     "死者家属": -2,
 959 |     "残酷": -3,
 960 |     "殴打": -2,
 961 |     "毁": -2,
 962 |     "毁灭": -2,
 963 |     "毁灭性": -2,
 964 |     "母犬": -5,
 965 |     "母狗": -5,
 966 |     "毒": -2,
 967 |     "毒药": -2,
 968 |     "比拟": 2,
 969 |     "毛": -2,
 970 |     "气势": -1,
 971 |     "气馁": -2,
 972 |     "汁液": -1,
 973 |     "求救": -2,
 974 |     "污垢": -2,
 975 |     "污染": -2,
 976 |     "污染者": -2,
 977 |     "沉思": -1,
 978 |     "沉着脸": -2,
 979 |     "沉船": -2,
 980 |     "沉闷": -2,
 981 |     "沉默": -1,
 982 |     "没头脑": -2,
 983 |     "没有乐趣": -3,
 984 |     "没有得到爱护": -2,
 985 |     "没用": -2,
 986 |     "没精打采": -2,
 987 |     "沮丧": -2,
 988 |     "油菜": -4,
 989 |     "泄漏": -1,
 990 |     "泄露": -1,
 991 |     "法律": 1,
 992 |     "法西斯": -2,
 993 |     "注定": -2,
 994 |     "泯": -2,
 995 |     "洗脑": -3,
 996 |     "洪琳": -2,
 997 |     "活力": 3,
 998 |     "活泼": 2,
 999 |     "活着": 1,
1000 |     "流感": -2,
1001 |     "流氓": -2,
1002 |     "流行": 3,
1003 |     "浩劫": -2,
1004 |     "浪费": -1,
1005 |     "浮力": 2,
1006 |     "涂片": -2,
1007 |     "消失": -1,
1008 |     "消极": -2,
1009 |     "消耗": -2,
1010 |     "淡然道": -2,
1011 |     "深情": 3,
1012 |     "混蛋": -4,
1013 |     "淹死": -2,
1014 |     "淹死了": -2,
1015 |     "清洁": 2,
1016 |     "清除": 1,
1017 |     "清零": 1,
1018 |     "温文尔雅": 2,
1019 |     "渴望": 2,
1020 |     "游说": -2,
1021 |     "滑头": 2,
1022 |     "滑稽": -2,
1023 |     "滞后": -1,
1024 |     "满目疮痍": -2,
1025 |     "满足": 2,
1026 |     "滥用": -3,
1027 |     "漂亮": 1,
1028 |     "漂绿": -3,
1029 |     "漏洞": -2,
1030 |     "演示": -1,
1031 |     "漠不关心": -2,
1032 |     "潇洒": 2,
1033 |     "潜伏": -1,
1034 |     "澄清": 2,
1035 |     "激动": -3,
1036 |     "激动不已": 5,
1037 |     "激励": 1,
1038 |     "激怒": -2,
1039 |     "激怒了": -2,
1040 |     "激情": 2,
1041 |     "激烈": 1,
1042 |     "激起了": -2,
1043 |     "灌输": -2,
1044 |     "火": -2,
1045 |     "火花": 1,
1046 |     "灰头土脸": -2,
1047 |     "灰色": -1,
1048 |     "灵巧": 2,
1049 |     "灾害": -2,
1050 |     "灾难": -2,
1051 |     "灾难性": -3,
1052 |     "炸弹": -1,
1053 |     "炽热": 2,
1054 |     "烁": 3,
1055 |     "烟": -2,
1056 |     "烟雾": -2,
1057 |     "烦": -2,
1058 |     "烦恼": -2,
1059 |     "烦躁": -2,
1060 |     "热切": 2,
1061 |     "热心": 1,
1062 |     "热情": 3,
1063 |     "热烈祝贺": 2,
1064 |     "热评": 2,
1065 |     "焦虑": -2,
1066 |     "煽动": -2,
1067 |     "煽动性": -2,
1068 |     "爆笑": 2,
1069 |     "爱": 3,
1070 |     "爱出风头": -1,
1071 |     "爱好": 2,
1072 |     "爱情": 3,
1073 |     "牵肠挂肚": -2,
1074 |     "特权": 2,
1075 |     "犯罪": -3,
1076 |     "犯罪嫌疑人": -1,
1077 |     "犹豫": -2,
1078 |     "狂": -3,
1079 |     "狂人": -3,
1080 |     "狂喜": 2,
1081 |     "狂暴": -3,
1082 |     "狂热": -3,
1083 |     "狂热者": -2,
1084 |     "狗屎": -4,
1085 |     "狠话": -1,
1086 |     "狡猾": -2,
1087 |     "独家": 2,
1088 |     "猥亵": -2,
1089 |     "猥琐": -2,
1090 |     "玩世不恭": -2,
1091 |     "珍惜": 2,
1092 |     "珍视": 2,
1093 |     "珠宝": 1,
1094 |     "理由": 2,
1095 |     "理直气壮": 2,
1096 |     "甜": 2,
1097 |     "生存": 2,
1098 |     "生气": -2,
1099 |     "生病": -2,
1100 |     "生闷气": -2,
1101 |     "疑虑": -2,
1102 |     "疑问": -1,
1103 |     "疯子": -3,
1104 |     "疯狂": -1,
1105 |     "疲劳": -2,
1106 |     "疲惫": -2,
1107 |     "疼痛": -1,
1108 |     "疾病": -2,
1109 |     "病": -2,
1110 |     "痒": -2,
1111 |     "痛苦": -2,
1112 |     "痛骂": -2,
1113 |     "痴情": 2,
1114 |     "痴迷": 2,
1115 |     "癌症": -1,
1116 |     "登上": 1,
1117 |     "白痴": -3,
1118 |     "百家争鸣": -1,
1119 |     "皮克": -2,
1120 |     "皮疹": -2,
1121 |     "皱眉道": -1,
1122 |     "监狱": -2,
1123 |     "盛大": 3,
1124 |     "盲人": -1,
1125 |     "盲目乐观": 2,
1126 |     "直": 1,
1127 |     "直索": -2,
1128 |     "相互矛盾": -2,
1129 |     "眉飞色舞": 3,
1130 |     "看点": 1,
1131 |     "看破红尘": -2,
1132 |     "真": 2,
1133 |     "真棒": 4,
1134 |     "真气": -2,
1135 |     "真诚": 2,
1136 |     "眼泪": -2,
1137 |     "着迷": 3,
1138 |     "矛盾": -1,
1139 |     "短视": -2,
1140 |     "破": -1,
1141 |     "破产": -3,
1142 |     "破坏": -2,
1143 |     "破坏力": -3,
1144 |     "硫酸": -3,
1145 |     "硬": -1,
1146 |     "确保": 1,
1147 |     "确定": 2,
1148 |     "碰撞": -1,
1149 |     "礼物": 2,
1150 |     "礼貌": 2,
1151 |     "祈祷": 1,
1152 |     "祝福": 1,
1153 |     "祝贺": 2,
1154 |     "神": 1,
1155 |     "神仙": 2,
1156 |     "神经": -1,
1157 |     "神话": -1,
1158 |     "神话般": 4,
1159 |     "祸患": -2,
1160 |     "禁止": -2,
1161 |     "禁用": -1,
1162 |     "离奇": -2,
1163 |     "离开": -1,
1164 |     "离线": -1,
1165 |     "种族主义": -3,
1166 |     "种族主义者": -3,
1167 |     "秘籍": -3,
1168 |     "称赞": 2,
1169 |     "移花接木": -3,
1170 |     "稳健": 2,
1171 |     "稳定": 2,
1172 |     "穆迪": -1,
1173 |     "穷": -2,
1174 |     "穷人": -2,
1175 |     "空": -1,
1176 |     "空虚": -1,
1177 |     "穿长袍": -2,
1178 |     "突出": 2,
1179 |     "突破": 3,
1180 |     "窒息": -1,
1181 |     "竞争性": 2,
1182 |     "竞争者": -1,
1183 |     "笑": 3,
1184 |     "笑声": 3,
1185 |     "笑话": 2,
1186 |     "笑道": 1,
1187 |     "笨蛋": -3,
1188 |     "笼罩": -1,
1189 |     "等待": -1,
1190 |     "简单化": -2,
1191 |     "类型": 2,
1192 |     "粉碎": -1,
1193 |     "粉饰": -3,
1194 |     "粗壮": 2,
1195 |     "粗心": -2,
1196 |     "粲": -3,
1197 |     "精力充沛": 2,
1198 |     "精彩": 3,
1199 |     "精益求精": 3,
1200 |     "精神": 1,
1201 |     "精美": 3,
1202 |     "紧张": -2,
1203 |     "紧张地问": -2,
1204 |     "紧急求助": -2,
1205 |     "累了": -2,
1206 |     "繁荣": 3,
1207 |     "红肿": -2,
1208 |     "织机": -1,
1209 |     "经济衰退": -2,
1210 |     "绑架": -2,
1211 |     "给予": 1,
1212 |     "绝望": -2,
1213 |     "统一": 1,
1214 |     "维护了": 2,
1215 |     "维生素": 1,
1216 |     "综合": 2,
1217 |     "绿洗": -3,
1218 |     "绿色洗涤": -3,
1219 |     "缓解": 1,
1220 |     "缩头缩脑": -2,
1221 |     "缺乏": -2,
1222 |     "缺乏自信": -2,
1223 |     "缺席者": -1,
1224 |     "缺点": -2,
1225 |     "缺陷": -2,
1226 |     "罚款": -1,
1227 |     "罢工": -1,
1228 |     "罪犯": -2,
1229 |     "美化": 3,
1230 |     "美味": 3,
1231 |     "美图": 3,
1232 |     "美眉": -1,
1233 |     "美艳": 3,
1234 |     "美观": 3,
1235 |     "美食": 3,
1236 |     "羞愧": -2,
1237 |     "羞辱": -2,
1238 |     "羡慕": -1,
1239 |     "翻牌": -2,
1240 |     "老张": -2,
1241 |     "耐力": 2,
1242 |     "耐寒": 2,
1243 |     "耗尽": -2,
1244 |     "耶": 1,
1245 |     "耶稣": 1,
1246 |     "耻辱": -2,
1247 |     "聚焦": -2,
1248 |     "聪明": 2,
1249 |     "肇事者": -2,
1250 |     "育雏": -2,
1251 |     "肿瘤": -2,
1252 |     "胆怯": -2,
1253 |     "背叛": -3,
1254 |     "背负": -2,
1255 |     "胜": 4,
1256 |     "胡说": -2,
1257 |     "能力": 1,
1258 |     "脏": -2,
1259 |     "脱节": -2,
1260 |     "自信": 2,
1261 |     "自夸": -2,
1262 |     "自我迷惑": -2,
1263 |     "自杀": -2,
1264 |     "自满": -2,
1265 |     "自然": 1,
1266 |     "自由": 2,
1267 |     "自私": -3,
1268 |     "自责": -2,
1269 |     "臭名昭著": -2,
1270 |     "臭屁": -2,
1271 |     "致害": -3,
1272 |     "舀": 3,
1273 |     "舍弃": -1,
1274 |     "舒缓": 3,
1275 |     "舒适": 2,
1276 |     "舒适度": 2,
1277 |     "节日": 2,
1278 |     "芊芊": 4,
1279 |     "苛刻": -1,
1280 |     "若隐若现": -1,
1281 |     "苦": -2,
1282 |     "苦恼": -2,
1283 |     "苦笑": -2,
1284 |     "英勇": 3,
1285 |     "英雄": 2,
1286 |     "荣耀": 2,
1287 |     "荣获": 3,
1288 |     "荣誉": 2,
1289 |     "获奖": 4,
1290 |     "获得": 2,
1291 |     "获救": 2,
1292 |     "葬礼": -1,
1293 |     "蓄势": -2,
1294 |     "蔑视": -2,
1295 |     "藏": -1,
1296 |     "虚伪": -2,
1297 |     "虚弱": -2,
1298 |     "虚构": -1,
1299 |     "螺纹": -2,
1300 |     "蠢蛋": -4,
1301 |     "蠢驴": -4,
1302 |     "血腥": -3,
1303 |     "行为不端": -2,
1304 |     "行骗者": -4,
1305 |     "补助": 1,
1306 |     "表彰": 2,
1307 |     "表白": 2,
1308 |     "被动": -1,
1309 |     "被提": 2,
1310 |     "被盗": -2,
1311 |     "被砍": -1,
1312 |     "被骗": -2,
1313 |     "裹挟": -2,
1314 |     "要求": -1,
1315 |     "见死不救": -2,
1316 |     "规定": -1,
1317 |     "解决": 1,
1318 |     "解决办法": 1,
1319 |     "解决方案": 1,
1320 |     "解析": 2,
1321 |     "解疑": 2,
1322 |     "解禁": -2,
1323 |     "解表": 2,
1324 |     "触发器": -2,
1325 |     "警告": -2,
1326 |     "警惕": -1,
1327 |     "讨价还价": 2,
1328 |     "讨厌": -3,
1329 |     "讽刺": -1,
1330 |     "评论家": -2,
1331 |     "诈骗": -3,
1332 |     "诉讼": -1,
1333 |     "诙谐": 2,
1334 |     "诚信": 2,
1335 |     "诚实": 2,
1336 |     "该死": -4,
1337 |     "语重心长地说": 2,
1338 |     "误": -2,
1339 |     "误传": -2,
1340 |     "误区一": -2,
1341 |     "误导": -2,
1342 |     "误导性": -3,
1343 |     "误报": -2,
1344 |     "误解": -2,
1345 |     "误读": -1,
1346 |     "诱人": 1,
1347 |     "诱惑": -1,
1348 |     "说服": 1,
1349 |     "请": 1,
1350 |     "调解": 2,
1351 |     "谋杀": -2,
1352 |     "谎称": -2,
1353 |     "谨慎": -1,
1354 |     "谴责": -2,
1355 |     "豁免": -1,
1356 |     "豪言壮语人": -3,
1357 |     "负担": -2,
1358 |     "负责": 2,
1359 |     "负面": -2,
1360 |     "财富": 3,
1361 |     "责罚": -3,
1362 |     "贤惠": 2,
1363 |     "质疑": -1,
1364 |     "贪婪": -2,
1365 |     "贫困": -1,
1366 |     "贬低": -2,
1367 |     "贱人": -5,
1368 |     "贻害": -2,
1369 |     "贿赂": -3,
1370 |     "赎回": 2,
1371 |     "赏识": -2,
1372 |     "赞同": 2,
1373 |     "赞成": 2,
1374 |     "赞扬": 2,
1375 |     "赞美": 3,
1376 |     "赞赏": 2,
1377 |     "赤字": -2,
1378 |     "赦免": 2,
1379 |     "走投无路": -2,
1380 |     "起诉": -1,
1381 |     "超强": 3,
1382 |     "超重": -1,
1383 |     "越狱": -1,
1384 |     "跆拳道": -4,
1385 |     "跛": -2,
1386 |     "跳动": -1,
1387 |     "跳跃": -1,
1388 |     "踏实": 2,
1389 |     "踩踏事故": -2,
1390 |     "转储": -1,
1391 |     "轻信": -2,
1392 |     "轻快": 2,
1393 |     "轻松": 1,
1394 |     "轻松活泼": 2,
1395 |     "轻率": -2,
1396 |     "轻蔑": -2,
1397 |     "轻视": -2,
1398 |     "辉煌": 2,
1399 |     "输家": -3,
1400 |     "辞职": -1,
1401 |     "辱骂": -3,
1402 |     "达到": 1,
1403 |     "迅速": 2,
1404 |     "过于简单化": -2,
1405 |     "过度反应": -2,
1406 |     "过度销售": -2,
1407 |     "过敏": -2,
1408 |     "过时": -2,
1409 |     "过载": -1,
1410 |     "运气": 3,
1411 |     "还原": 1,
1412 |     "进取": 1,
1413 |     "进展": 2,
1414 |     "远景": 1,
1415 |     "违反": -2,
1416 |     "违规": -2,
1417 |     "迪克": -4,
1418 |     "迫使": 1,
1419 |     "迫害": -2,
1420 |     "迷人": 3,
1421 |     "迷住": 3,
1422 |     "迷住了": 3,
1423 |     "迷失方向": -2,
1424 |     "迷惑": -2,
1425 |     "追问": -1,
1426 |     "退": -1,
1427 |     "退化": -2,
1428 |     "退让": -2,
1429 |     "适用于": 1,
1430 |     "逃脱": -1,
1431 |     "逃跑": -1,
1432 |     "逗": 3,
1433 |     "逗乐了": 3,
1434 |     "逮捕": -2,
1435 |     "道歉": -1,
1436 |     "遗忘": -1,
1437 |     "遗憾": -1,
1438 |     "避免": -1,
1439 |     "邀请": 1,
1440 |     "邪": -3,
1441 |     "郁闷": -2,
1442 |     "鄙视": -2,
1443 |     "配套": 1,
1444 |     "配料": -2,
1445 |     "酷": 1,
1446 |     "酷刑": -4,
1447 |     "醉": -2,
1448 |     "采用": 1,
1449 |     "释疑": -1,
1450 |     "重度": -2,
1451 |     "重磅炸弹": 3,
1452 |     "重罪": -3,
1453 |     "重要性": 2,
1454 |     "重要是": 2,
1455 |     "量刑": -2,
1456 |     "金德": 2,
1457 |     "钻机": -1,
1458 |     "钻石": 1,
1459 |     "铁青": -2,
1460 |     "错杀": -3,
1461 |     "错误": -2,
1462 |     "错过了": -2,
1463 |     "镦": -2,
1464 |     "闪避": -2,
1465 |     "闪闪发光": 3,
1466 |     "问候": 2,
1467 |     "问候语": 1,
1468 |     "问题": -2,
1469 |     "闷闷不乐": -2,
1470 |     "闹剧": -1,
1471 |     "闹鬼": -2,
1472 |     "防": -1,
1473 |     "防暴": -2,
1474 |     "阳痿": -2,
1475 |     "阴云密布": -1,
1476 |     "阴沉": -2,
1477 |     "阴谋": -3,
1478 |     "阴郁": -2,
1479 |     "阻力": -1,
1480 |     "阻挠": -2,
1481 |     "阻止": -1,
1482 |     "阻碍": -2,
1483 |     "阿飞": -2,
1484 |     "附魔": 2,
1485 |     "降": -1,
1486 |     "降低": -2,
1487 |     "限制": -1,
1488 |     "陷阱": -1,
1489 |     "隐藏": -1,
1490 |     "隔离": -1,
1491 |     "障碍": -2,
1492 |     "难点": -1,
1493 |     "雄心勃勃": 2,
1494 |     "雒": -3,
1495 |     "雨天": -1,
1496 |     "雨衣": 2,
1497 |     "需求": -1,
1498 |     "震惊": -2,
1499 |     "震撼": -2,
1500 |     "震耳欲聋": -1,
1501 |     "霍元甲": 2,
1502 |     "青春": 2,
1503 |     "青睐": 2,
1504 |     "非人": -2,
1505 |     "非人化": -2,
1506 |     "非人性化": -2,
1507 |     "非法": -3,
1508 |     "面色凝重": -2,
1509 |     "顶": 2,
1510 |     "预防": -1,
1511 |     "题为": 1,
1512 |     "颠覆性": -2,
1513 |     "颤抖": -2,
1514 |     "风扇": 3,
1515 |     "风景如画": 2,
1516 |     "风趣": 3,
1517 |     "风险": -2,
1518 |     "饥饿": -2,
1519 |     "饿死": -2,
1520 |     "驱逐": -1,
1521 |     "驴": -4,
1522 |     "骂": -2,
1523 |     "骂道": -1,
1524 |     "骄傲地说": 2,
1525 |     "骇然": -2,
1526 |     "验证": 1,
1527 |     "骗": -3,
1528 |     "骗子": -3,
1529 |     "骗局": -2,
1530 |     "骚乱": -2,
1531 |     "高估": -2,
1532 |     "高兴": 3,
1533 |     "高昂代价": 3,
1534 |     "高贵": 2,
1535 |     "高超": 5,
1536 |     "鬼": -1,
1537 |     "魅力": 3,
1538 |     "鲁莽": -2,
1539 |     "麻木": -1,
1540 |     "麻烦": -2,
1541 |     "黑人": -5,
1542 |     "黑客": -1,
1543 |     "黑暗": -1,
1544 |     "黑鬼": -5,
1545 |     "鼓励": 2,
1546 |     "鼓掌": 2,
1547 |     "鼓舞人心": 3,
1548 |     "杀跌":-5,
1549 |     "跌":-3,
1550 |     "跌破":-5,
1551 |     "跳水":-3,
1552 |     "涨":1,
1553 |     "连续阴跌":-5,
1554 |     "持续下挫":-5,
1555 |     "跌停":-3
1556 | }


--------------------------------------------------------------------------------
/lib/data/AFINN-zh_cn.txt:
--------------------------------------------------------------------------------
   1 | 一句话	-2
   2 | 一审宣判	-1
   3 | 一拖再拖	-1
   4 | 一文不值	-2
   5 | 一笑	2
   6 | 三宝	2
   7 | 上衣	2
   8 | 下垂	-2
   9 | 不专业	-2
  10 | 不乖	-2
  11 | 不以为然	-2
  12 | 不便之处	-2
  13 | 不信	-1
  14 | 不信任	-3
  15 | 不健康	-2
  16 | 不公平	-2
  17 | 不可取	-2
  18 | 不可抗拒	2
  19 | 不可爱	-2
  20 | 不可逆	-1
  21 | 不合理	-1
  22 | 不和谐	-2
  23 | 不喜欢	-2
  24 | 不好	-2
  25 | 不安	-1
  26 | 不安全	-2
  27 | 不完善	-2
  28 | 不尊重	-2
  29 | 不屑	-2
  30 | 不工作	-3
  31 | 不平等	-1
  32 | 不悦	-2
  33 | 不支持	-2
  34 | 不敏感	-2
  35 | 不敬	-2
  36 | 不方便	-2
  37 | 不明	-1
  38 | 不服气	-1
  39 | 不满	-2
  40 | 不满意	-2
  41 | 不知道	-2
  42 | 不确定	-1
  43 | 不确定性	-1
  44 | 不祥	3
  45 | 不稳定	-2
  46 | 不耐烦	-2
  47 | 不能接受	-2
  48 | 不舒服	-2
  49 | 不要脸	-4
  50 | 不解	-2
  51 | 不诚实	-2
  52 | 不负责任	2
  53 | 不足	-2
  54 | 不道德	-2
  55 | 不配	-2
  56 | 不错	3
  57 | 不需要	-2
  58 | 不高兴	-2
  59 | 丑	-3
  60 | 丑闻	-3
  61 | 专用	2
  62 | 丢失	-2
  63 | 丢弃	-1
  64 | 严厉	-2
  65 | 严惩	-3
  66 | 严格	3
  67 | 严谨	3
  68 | 严重	-2
  69 | 丧	-2
  70 | 丧偶	-1
  71 | 丧失抵押品赎回权	-2
  72 | 中伤	-2
  73 | 中断	-2
  74 | 中毒	-2
  75 | 主动	1
  76 | 主管	2
  77 | 举棋不定	-2
  78 | 乐观	2
  79 | 乱	-2
  80 | 乳房	-2
  81 | 了不起	4
  82 | 争议	-2
  83 | 争鸣	-1
  84 | 事	1
  85 | 事故	-2
  86 | 事项	1
  87 | 享受	2
  88 | 享有	2
  89 | 亮	1
  90 | 亮度	1
  91 | 亮点	2
  92 | 亲切	3
  93 | 亲情	3
  94 | 亲爱	2
  95 | 人渣	-4
  96 | 仇敌	-3
  97 | 从事	1
  98 | 他妈的	-4
  99 | 付	-1
 100 | 代表作	4
 101 | 代言	2
 102 | 令人不安	-2
 103 | 令人印象深刻	3
 104 | 令人叹为观止	3
 105 | 令人失望	-2
 106 | 令人心寒	-1
 107 | 令人担忧	-3
 108 | 令人振奋	3
 109 | 令人欣慰	2
 110 | 令人沮丧	-2
 111 | 令人痛心	-2
 112 | 令人讨厌	-2
 113 | 令人难以忘怀	1
 114 | 令人难以置信	-1
 115 | 令人震惊	-2
 116 | 优势	2
 117 | 优点	2
 118 | 优秀	5
 119 | 优良	3
 120 | 优雅	2
 121 | 传染	-2
 122 | 传染性	-1
 123 | 伤亡	-2
 124 | 伤害	-2
 125 | 伤心	-2
 126 | 伤心欲绝	-3
 127 | 伤感	-2
 128 | 伤脑筋	-2
 129 | 伦理	2
 130 | 伪科学	-3
 131 | 伪装	-1
 132 | 伪证	-3
 133 | 伪造	-3
 134 | 低估	-1
 135 | 低劣	-3
 136 | 低能儿	-3
 137 | 作假	-3
 138 | 你妈的	-4
 139 | 佩服	3
 140 | 使...称叹	3
 141 | 依赖	2
 142 | 侮辱	-1
 143 | 侵权	-2
 144 | 侵略	-2
 145 | 促进	1
 146 | 俏皮	2
 147 | 保存	2
 148 | 保护	1
 149 | 保暖	1
 150 | 保留	-1
 151 | 保证	1
 152 | 信任	1
 153 | 信心	2
 154 | 信念	1
 155 | 倒霉	-2
 156 | 倜傥	2
 157 | 借口	-1
 158 | 倦怠	-2
 159 | 债务	-2
 160 | 值得	2
 161 | 值得一	2
 162 | 倾倒	-2
 163 | 倾注	3
 164 | 假装	-1
 165 | 假货	-3
 166 | 偏向	-2
 167 | 偏见	-1
 168 | 停止	-1
 169 | 停滞	-2
 170 | 停车	-1
 171 | 健康	2
 172 | 健忘	-2
 173 | 健身	1
 174 | 偷	-2
 175 | 偷偷摸摸	-1
 176 | 傲慢	-2
 177 | 傻	-1
 178 | 傻瓜	-2
 179 | 像	2
 180 | 僵局	-2
 181 | 允许	1
 182 | 充足	1
 183 | 先进	1
 184 | 免疫	1
 185 | 免费	1
 186 | 免除	2
 187 | 兑现	-2
 188 | 入狱	-2
 189 | 全神贯注	1
 190 | 八卦	-2
 191 | 公平	2
 192 | 公正	2
 193 | 公鸡	-5
 194 | 关心	2
 195 | 兴奋	3
 196 | 兴趣	1
 197 | 具有讽刺意味​​	-1
 198 | 具有里程碑意义	2
 199 | 内疚	-3
 200 | 再次保证	1
 201 | 冒犯	-2
 202 | 冒险	2
 203 | 冠军	4
 204 | 冤	-2
 205 | 冥想	1
 206 | 冰雹	2
 207 | 冲击	-2
 208 | 冲洗	-3
 209 | 冲突	-2
 210 | 冲突性	-2
 211 | 决定性	1
 212 | 冷冷清清	-2
 213 | 冷漠	-2
 214 | 冷落	-2
 215 | 冷门	-2
 216 | 冷静	2
 217 | 净度	2
 218 | 凯旋	4
 219 | 凶手	-2
 220 | 出轨	-2
 221 | 出逃	-1
 222 | 击碎	-1
 223 | 击退	-1
 224 | 分享	1
 225 | 分享到	1
 226 | 分心	-2
 227 | 分散	-2
 228 | 分散了	-2
 229 | 分离	-1
 230 | 切	-1
 231 | 切割	-1
 232 | 创意	2
 233 | 创新	1
 234 | 判决	-1
 235 | 利用	-2
 236 | 利益	1
 237 | 制备	1
 238 | 刺	-2
 239 | 刺伤	-2
 240 | 刺激	-3
 241 | 刺激性	-3
 242 | 刻板印象	-2​​
 243 | 刻毒	-2
 244 | 削减	-2
 245 | 前景	1
 246 | 前景堪忧	-3
 247 | 前锋	-2
 248 | 剧毒	-2
 249 | 功能强大	2
 250 | 功能障碍	-2
 251 | 加强	2
 252 | 加重	-2
 253 | 劣势	-2
 254 | 动机	1
 255 | 助学金	1
 256 | 励志	2
 257 | 势不可挡	2
 258 | 勇敢	2
 259 | 勇气	2
 260 | 勒死	-2
 261 | 勘探	1
 262 | 勾结	-3
 263 | 包庇	-3
 264 | 千篇一律	-2
 265 | 千载难逢	3
 266 | 升值	2
 267 | 半信半疑	-2
 268 | 协议	1
 269 | 卑鄙	-3
 270 | 卓越	2
 271 | 单纯	-2
 272 | 占有欲	-2
 273 | 卡	-2
 274 | 印象	3
 275 | 印象深刻	3
 276 | 危害	-2
 277 | 危机	-3
 278 | 危言耸听	-2
 279 | 危险	-2
 280 | 厄运	-2
 281 | 压制	-1
 282 | 压力	-1
 283 | 压迫	-2
 284 | 厌倦了	-3
 285 | 厌恶	-3
 286 | 原谅	1
 287 | 参加办法	1
 288 | 友好	2
 289 | 反应过度	-2
 290 | 反感	-3
 291 | 发人深省	-1
 292 | 发自内心	3
 293 | 发誓	-2
 294 | 取消	-1
 295 | 取消比赛资格	-2
 296 | 受不了	-3
 297 | 受伤	-2
 298 | 受害	-3
 299 | 受害人	-3
 300 | 受害者	-3
 301 | 受理	1
 302 | 受益	2
 303 | 受限	-2
 304 | 受骗	-2
 305 | 叛逆	-3
 306 | 口交	-5
 307 | 句子	-2
 308 | 叫好	2
 309 | 叫道	-2
 310 | 可以肯定	1
 311 | 可信	2
 312 | 可取	2
 313 | 可怕	-2
 314 | 可怜	-2
 315 | 可恶	-3
 316 | 可悲是	-2
 317 | 可惜	-2
 318 | 可爱	2
 319 | 可疑	-2
 320 | 可笑	-3
 321 | 可耻	-2
 322 | 可获免咎	2
 323 | 可避免出现	-1
 324 | 合法	1
 325 | 同情	-1
 326 | 同意	1
 327 | 后卫	1
 328 | 后悔	-2
 329 | 向往	-1
 330 | 吓了一跳	-2
 331 | 吓人	-2
 332 | 吓呆了	-2
 333 | 吓坏了	-2
 334 | 否认	-2
 335 | 含糊	-2
 336 | 吮吸	-3
 337 | 启发	2
 338 | 启示	-2
 339 | 吸吮	-3
 340 | 吸引	1
 341 | 吸引力	2
 342 | 吸收	1
 343 | 吹嘘	-2
 344 | 吹捧	-2
 345 | 呆滞	-2
 346 | 告诫	-2
 347 | 呛	-2
 348 | 呜呼	3
 349 | 周到	2
 350 | 呻吟	-2
 351 | 呼喊	-2
 352 | 咄咄逼人	-2
 353 | 咆哮	-3
 354 | 和平	2
 355 | 和煦	3
 356 | 哀悼	-2
 357 | 品味	2
 358 | 哄骗	-2
 359 | 哇	4
 360 | 哈	2
 361 | 哈哈	3
 362 | 哈哈哈	3
 363 | 哑巴	-3
 364 | 哑弹	-2
 365 | 哗然	-2
 366 | 哭了	-1
 367 | 哭泣	-2
 368 | 哽咽	-2
 369 | 哽咽道	-2
 370 | 唉	-1
 371 | 商贩	-2
 372 | 善良	3
 373 | 善解人意	2
 374 | 喜剧	1
 375 | 喜悦	3
 376 | 喜欢	2
 377 | 喧嚷	-1
 378 | 喧闹	-1
 379 | 嗜睡	-2
 380 | 嘲弄	-2
 381 | 嘲笑	-2
 382 | 囚犯	-2
 383 | 囚禁	-2
 384 | 回应	2
 385 | 回避	-3
 386 | 团结	1
 387 | 困	-2
 388 | 困境	-1
 389 | 困惑	-2
 390 | 困扰	-1
 391 | 困难	-2
 392 | 固体	2
 393 | 固定	-1
 394 | 固执	-2
 395 | 在调解	2
 396 | 地狱	-4
 397 | 坏蛋	-3
 398 | 坐立不安	-2
 399 | 坑蒙拐骗	-3
 400 | 块	-1
 401 | 坚不可摧	2
 402 | 坚信	1
 403 | 坚决	2
 404 | 坚果	-3
 405 | 坦言	-1
 406 | 垂头丧气	-2
 407 | 垃圾邮件	-2
 408 | 垃圾邮件发送者	-3
 409 | 垄断	-2
 410 | 基本上	1
 411 | 堆积	-1
 412 | 堕落	-2
 413 | 堵	-1
 414 | 堵嘴	-2
 415 | 增加	1
 416 | 增益	2
 417 | 士气低落	-2
 418 | 声讨	-2
 419 | 处于不利地位	-2
 420 | 处罚	-2
 421 | 复仇	-2
 422 | 复兴	2
 423 | 复杂	2
 424 | 复活	2
 425 | 外伤	-3
 426 | 夜魔侠	2
 427 | 大	1
 428 | 大厅	-2
 429 | 大喜	4
 430 | 大怒	-3
 431 | 大惊失色	-2
 432 | 大方	2
 433 | 大胆	2
 434 | 大赞	3
 435 | 天上	4
 436 | 天堂	2
 437 | 天真	-2
 438 | 天赐	4
 439 | 失业率	-2
 440 | 失去	-3
 441 | 失去人性	-2
 442 | 失望	-2
 443 | 失眠	-2
 444 | 失败	-2
 445 | 失速	-2
 446 | 头晕	-2
 447 | 夸大	-2
 448 | 夸张	-2
 449 | 奇	-2
 450 | 奇妙	3
 451 | 奇怪是	-1
 452 | 奇迹	3
 453 | 奋斗	-2
 454 | 奖励	2
 455 | 奖牌	3
 456 | 奖项	3
 457 | 奴役	-2
 458 | 奸商	-2
 459 | 好	2
 460 | 好处	2
 461 | 好奇	1
 462 | 好玩	4
 463 | 好评	3
 464 | 妈的	-4
 465 | 妒忌	-1
 466 | 妓女	-4
 467 | 委屈	-2
 468 | 委托	2
 469 | 威胁	-2
 470 | 娘	-5
 471 | 娘们	-5
 472 | 娱乐	2
 473 | 嫉妒	-2
 474 | 孔	-2
 475 | 孤独	-2
 476 | 孩子气	-2
 477 | 宁静	2
 478 | 宇	3
 479 | 安全	1
 480 | 安慰	2
 481 | 安抚	1
 482 | 完善	2
 483 | 完好	2
 484 | 完成	2
 485 | 完美	3
 486 | 官司	-2
 487 | 宝	2
 488 | 宝石	1
 489 | 实战	-1
 490 | 实现	1
 491 | 实用性	2
 492 | 实质	1
 493 | 审批	2
 494 | 审查	-2
 495 | 审问	-2
 496 | 宣传	-2
 497 | 宣判	-2
 498 | 宣誓就职	-2
 499 | 害怕	-2
 500 | 害羞	-1
 501 | 宽容	1
 502 | 宽松	1
 503 | 宽限期	1
 504 | 寂寞	-2
 505 | 富人	2
 506 | 富有魅力	3
 507 | 对	1
 508 | 对号入座	-2
 509 | 对抗	-1
 510 | 射击	-2
 511 | 尊敬	2
 512 | 小便	-4
 513 | 小姐	-2
 514 | 小心	-2
 515 | 小气	-2
 516 | 小白	-2
 517 | 小说	2
 518 | 小霸王	-2
 519 | 尖刻	-3
 520 | 尖叫	-2
 521 | 尴尬	-2
 522 | 尸体	-1
 523 | 屁股	-4
 524 | 屄	-5
 525 | 屈辱	-3
 526 | 崇拜	3
 527 | 崇敬	2
 528 | 崩溃	-2
 529 | 巧	2
 530 | 巨大	1
 531 | 巨大	3
 532 | 差	-2
 533 | 师爷	-2
 534 | 希望	1
 535 | 帕利	-1
 536 | 帮助	2
 537 | 平反	2
 538 | 平庸	-3
 539 | 平淡	-2
 540 | 平静	2
 541 | 幸存下来	2
 542 | 幸存者	2
 543 | 幸福	3
 544 | 幸运	2
 545 | 幸运	3
 546 | 幸运是	3
 547 | 幽默	2
 548 | 庄严	-1
 549 | 庆幸	4
 550 | 庆祝	3
 551 | 应激	-2
 552 | 废墟	-2
 553 | 废话	-2
 554 | 延伸	1
 555 | 延期	-1
 556 | 延迟	-1
 557 | 延长	1
 558 | 开发	-2
 559 | 开导	2
 560 | 开心	3
 561 | 开朗	2
 562 | 开脱	2
 563 | 异化	-2
 564 | 异想天开	1
 565 | 弊端	-3
 566 | 引人入胜	3
 567 | 张力	-1
 568 | 弱	-2
 569 | 弱势	-2
 570 | 弱点	-2
 571 | 强	2
 572 | 强人所难	-2
 573 | 强制	-1
 574 | 强制性	-1
 575 | 强化	2
 576 | 强壮	2
 577 | 强奸犯	-4
 578 | 强度	2
 579 | 强盗	-2
 580 | 强调	-2
 581 | 归属	1
 582 | 影响	-1
 583 | 征收	-1
 584 | 很简单	1
 585 | 很酷东西	3
 586 | 徒劳	2
 587 | 得意	2
 588 | 得意扬扬	3
 589 | 得意洋洋	3
 590 | 得罪	-2
 591 | 得罪了	-2
 592 | 徘	-2
 593 | 御史	-2
 594 | 微笑	2
 595 | 心慌	-2
 596 | 心灰意冷	-2
 597 | 心生疑虑	-1
 598 | 心疼	-2
 599 | 心碎	-3
 600 | 心花怒放	3
 601 | 忌	-1
 602 | 忐忑	-2
 603 | 忘记	-1
 604 | 忠实	3
 605 | 忠诚	3
 606 | 忠诚度	3
 607 | 忧心忡忡	-2
 608 | 忧虑	-2
 609 | 忧郁	-1
 610 | 快乐	3
 611 | 快乐可言	-2
 612 | 快捷	2
 613 | 快活	2
 614 | 忽略	-1
 615 | 忽视	-1
 616 | 怀疑	-1
 617 | 怀疑论者	-2
 618 | 怒气冲冲	-3
 619 | 怜悯	2
 620 | 怠慢	-2
 621 | 急	-1
 622 | 急了	-2
 623 | 急切	2
 624 | 性交	-4
 625 | 性感	3
 626 | 怪	-1
 627 | 怪异	-2
 628 | 怯懦	-2
 629 | 恋情	2
 630 | 恐吓	-2
 631 | 恐怖	-3
 632 | 恐惧	-2
 633 | 恐慌	-2
 634 | 恢复	1
 635 | 恨	-3
 636 | 恭喜	2
 637 | 恶人-2
 638 | 恶作剧	-1
 639 | 恶化	-3
 640 | 恶心	-3
 641 | 恶棍	-3
 642 | 恶毒	-2
 643 | 恶行	-1
 644 | 恼人	-2
 645 | 恼火	-2
 646 | 悍妇	-4
 647 | 悖论	-1
 648 | 悟	2
 649 | 悲伤	-2
 650 | 悲切	-2
 651 | 悲剧	-2
 652 | 悲哀	-2
 653 | 悲怆	-2
 654 | 悲愤	-2
 655 | 悲痛	-2
 656 | 悲观	-2
 657 | 悼念	-2
 658 | 惆怅	-2
 659 | 惊	-2
 660 | 惊人	3
 661 | 惊叹	2
 662 | 惊呆了	-2
 663 | 惊奇	2
 664 | 惊惶-2
 665 | 惊慌失措	-3
 666 | 惊艳	4
 667 | 惊讶	2
 668 | 惊险	5
 669 | 惊魂	-2
 670 | 惜字	2
 671 | 惨	-3
 672 | 惨不忍睹	-2
 673 | 惨淡	-2
 674 | 惨败	-3
 675 | 惩戒	-3
 676 | 惩罚	-2
 677 | 惭愧	-2
 678 | 想家	-2
 679 | 惹恼	-2
 680 | 惹恼了	-2
 681 | 愁眉苦脸	-1
 682 | 愉快	3
 683 | 意义	-2
 684 | 意外	-2
 685 | 意愿	2
 686 | 意气风发	2
 687 | 愚蠢	-2
 688 | 感兴趣是	2
 689 | 感叹	-2
 690 | 感染	-2
 691 | 感觉	1
 692 | 感谢	2
 693 | 愣神	-2
 694 | 愤世嫉俗者	-2
 695 | 愤怒	-2
 696 | 愤慨	-2
 697 | 愤懑	-2
 698 | 愿景	1
 699 | 愿望	1
 700 | 慈悲	2
 701 | 憎恶	-3
 702 | 懊恼	-2
 703 | 懒得	-2
 704 | 懒惰	-1
 705 | 懦夫	-2
 706 | 成功	2
 707 | 成名原因	1
 708 | 成本	-2
 709 | 成熟	2
 710 | 成长	1
 711 | 战	-2
 712 | 战争	-2
 713 | 战斗	-1
 714 | 戡	-2
 715 | 戴	-1
 716 | 手无寸铁	-2
 717 | 打扰	-2
 718 | 打招呼	1
 719 | 打断	-2
 720 | 打断了	-2
 721 | 打败了	-2
 722 | 扩展	1
 723 | 扫地	-2
 724 | 扬言	-2
 725 | 扭曲	-2
 726 | 扰乱	-2
 727 | 批准	2
 728 | 批评	-2
 729 | 扼流圈	-2
 730 | 承认	-1
 731 | 承诺	1
 732 | 抑制	-1
 733 | 投机	-2
 734 | 抖动	-2
 735 | 抗议	-2
 736 | 抗议者	-2
 737 | 抗辩	-2
 738 | 折扣	-1
 739 | 折磨	-1
 740 | 抛弃	-2
 741 | 抢	-2
 742 | 抢劫	-2
 743 | 抢断	-2
 744 | 护理方法	2
 745 | 报复	-2
 746 | 报料	-2
 747 | 报警	-2
 748 | 抱怨	-2
 749 | 抱怨道	-2
 750 | 抵制	-2
 751 | 抹杀	-2
 752 | 抽筋	-1
 753 | 抿着嘴	-2
 754 | 担心	-2
 755 | 拍摄	-1
 756 | 拍案而起	-3
 757 | 拒不	-2
 758 | 拒绝	-1
 759 | 拒绝了	-2
 760 | 拓展	1
 761 | 拖	-1
 762 | 拘留	-2
 763 | 招呼	1
 764 | 招徕	-2
 765 | 招标内容	2
 766 | 拥抱	1
 767 | 拮抗	-2
 768 | 拷问	-4
 769 | 拼命	-3
 770 | 持怀疑态度	-2
 771 | 挂羊头卖狗肉	-2
 772 | 指控	-2
 773 | 指责	-2
 774 | 挑刺	-5
 775 | 挑战	-1
 776 | 挑衅	-1
 777 | 挖苦	-2
 778 | 挣扎	-2
 779 | 挫败	-2
 780 | 振奋	3
 781 | 挺举	-3
 782 | 损失	-3
 783 | 损害	-3
 784 | 授	1
 785 | 掉落	-1
 786 | 掌声	2
 787 | 排水	-2
 788 | 排除	-1
 789 | 探究	-2
 790 | 探索	1
 791 | 接受	1
 792 | 接合	1
 793 | 接吻	2
 794 | 推出	1
 795 | 推广	1
 796 | 推荐	2
 797 | 推迟	-1
 798 | 提升	1
 799 | 插科打诨	-2
 800 | 揭露	-1
 801 | 搞乱了	-2
 802 | 搞坏	-2
 803 | 搞砸了	-3
 804 | 搞笑	4
 805 | 摇摆不定	-1
 806 | 摇晃	-2
 807 | 摊主	-2
 808 | 撒尿	-3
 809 | 撕裂	-2
 810 | 操作	-1
 811 | 操控	-1
 812 | 操纵	-1
 813 | 支持	1
 814 | 支持者	1
 815 | 收益	2
 816 | 收藏	2
 817 | 收费	-3
 818 | 收费标准	-2
 819 | 改善	2
 820 | 改进	2
 821 | 攻击	-1
 822 | 放弃	-1
 823 | 放心	1
 824 | 放松	2
 825 | 放缓	-1
 826 | 放逐	-1
 827 | 故障	-2
 828 | 敌人	-2
 829 | 敌意	-2
 830 | 敏锐	1
 831 | 救市	-2
 832 | 救援	2
 833 | 救生员	4
 834 | 散播	-2
 835 | 敬佩	3
 836 | 文盲	-2
 837 | 斗争	-2
 838 | 斜线	-2
 839 | 斧	-1
 840 | 新鲜	1
 841 | 旗舰	2
 842 | 无	-1
 843 | 无与伦比	1
 844 | 无为	-2
 845 | 无力	-2
 846 | 无奈	-2
 847 | 无心	-2
 848 | 无忧无虑	1
 849 | 无担保	-2
 850 | 无效	-2
 851 | 无敌	2
 852 | 无牙	-2
 853 | 无用	-2
 854 | 无畏	2
 855 | 无知	-2
 856 | 无精打采	-2
 857 | 无罪	2
 858 | 无聊	-2
 859 | 无能	-2
 860 | 无行为能力	-2
 861 | 无视	-2
 862 | 无言以对	-2
 863 | 无赖	-2
 864 | 日照	2
 865 | 旦	-2
 866 | 时髦	2
 867 | 明快	2
 868 | 明确	1
 869 | 明确提出	1
 870 | 昏睡	-2
 871 | 映入眼帘	1
 872 | 是的	1
 873 | 显着	2
 874 | 显著	1
 875 | 晕	-1
 876 | 景点	2
 877 | 智能	1
 878 | 智能化	2
 879 | 暂停	-1
 880 | 暗杀	-3
 881 | 暴力	-3
 882 | 曝光	-1
 883 | 更大	3
 884 | 更糟	-3
 885 | 替罪羊	-2
 886 | 最严厉	-2
 887 | 最低	-1
 888 | 最佳	3
 889 | 最喜欢	2
 890 | 最大	3
 891 | 最强	2
 892 | 最穷	-2
 893 | 最糟糕	-3
 894 | 最聪明	2
 895 | 最脏	-2
 896 | 最黑暗	-2
 897 | 有影响	2
 898 | 有效	2
 899 | 有条不紊	2
 900 | 有用	2
 901 | 有罪	-3
 902 | 有趣	2
 903 | 有趣	4
 904 | 有远见	3
 905 | 朗声道	-1
 906 | 期待已久	-1
 907 | 期望	2
 908 | 未了	-2
 909 | 未定	-1
 910 | 未经批准	-2
 911 | 未经证实	-1
 912 | 机会	2
 913 | 机遇	2
 914 | 杀	-3
 915 | 杀敌	-3
 916 | 杀气	-3
 917 | 杂乱无章	-2
 918 | 杂役	-2
 919 | 权威	1
 920 | 来头	2
 921 | 来袭	-1
 922 | 松	-3
 923 | 松了口气	2
 924 | 极权主义	-2
 925 | 枪	-1
 926 | 某种	0
 927 | 查杀	-3
 928 | 柴	-3
 929 | 柴草	-3
 930 | 梦	1
 931 | 梦幻	4
 932 | 梦想	1
 933 | 棘手	-2
 934 | 森森	-2
 935 | 模拟	-2
 936 | 模糊	-2
 937 | 欢乐	2
 938 | 欢呼	2
 939 | 欢喜	3
 940 | 欢欣鼓舞	4
 941 | 欢腾	3
 942 | 欢迎	2
 943 | 欣喜	3
 944 | 欣喜若狂	2
 945 | 欣快	4
 946 | 欣赏	2
 947 | 欲绝	-2
 948 | 欺凌	-2
 949 | 欺诈	-4
 950 | 欺负	-2
 951 | 欺骗	-2
 952 | 歇斯底里	-3
 953 | 正	2
 954 | 正义	2
 955 | 正确方向	3
 956 | 正面	2
 957 | 歹徒	-3
 958 | 死	-3
 959 | 死亡	-2
 960 | 死亡人数	-3
 961 | 死者家属	-2
 962 | 残酷	-3
 963 | 殴打	-2
 964 | 毁	-2
 965 | 毁灭	-2
 966 | 毁灭性	-2
 967 | 母犬	-5
 968 | 母狗	-5
 969 | 毒	-2
 970 | 毒药	-2
 971 | 比拟	2
 972 | 毛	-2
 973 | 气势	-1
 974 | 气馁	-2
 975 | 汁液	-1
 976 | 求救	-2
 977 | 污垢	-2
 978 | 污染	-2
 979 | 污染者	-2
 980 | 沉思	-1
 981 | 沉着脸	-2
 982 | 沉船	-2
 983 | 沉闷	-2
 984 | 沉默	-1
 985 | 没头脑	-2
 986 | 没有乐趣	-3
 987 | 没有得到爱护	-2
 988 | 没用	-2
 989 | 没精打采	-2
 990 | 沮丧	-2
 991 | 油菜	-4
 992 | 泄漏	-1
 993 | 泄露	-1
 994 | 法律	1
 995 | 法西斯	-2
 996 | 注定	-2
 997 | 泯	-2
 998 | 洗脑	-3
 999 | 洪琳	-2
1000 | 活力	3
1001 | 活泼	2
1002 | 活着	1
1003 | 流感	-2
1004 | 流氓	-2
1005 | 流行	3
1006 | 浩劫	-2
1007 | 浪费	-1
1008 | 浮力	2
1009 | 涂片	-2
1010 | 消失	-1
1011 | 消极	-2
1012 | 消耗	-2
1013 | 淡然道	-2
1014 | 深情	3
1015 | 混蛋	-4
1016 | 淹死	-2
1017 | 淹死了	-2
1018 | 清洁	2
1019 | 清除	1
1020 | 清零	1
1021 | 温文尔雅	2
1022 | 渴望	2
1023 | 游	3
1024 | 游说	-2
1025 | 滑头	2
1026 | 滑稽	-2
1027 | 滞后	-1
1028 | 满目疮痍	-2
1029 | 满足	2
1030 | 滥用	-3
1031 | 漂亮	1
1032 | 漂绿	-3
1033 | 漏洞	-2
1034 | 演示	-1
1035 | 漠不关心	-2
1036 | 潇洒	2
1037 | 潜伏	-1
1038 | 澄清	2
1039 | 激动	-3
1040 | 激动不已	5
1041 | 激励	1
1042 | 激怒	-2
1043 | 激怒了	-2
1044 | 激情	2
1045 | 激烈	1
1046 | 激起了	-2
1047 | 灌输	-2
1048 | 火	-2
1049 | 火花	1
1050 | 灰头土脸	-2
1051 | 灰色	-1
1052 | 灵巧	2
1053 | 灾害	-2
1054 | 灾难	-2
1055 | 灾难性	-3
1056 | 炸弹	-1
1057 | 炽热	2
1058 | 烁	3
1059 | 烟	-2
1060 | 烟雾	-2
1061 | 烦	-2
1062 | 烦恼	-2
1063 | 烦躁	-2
1064 | 热切	2
1065 | 热心	1
1066 | 热情	3
1067 | 热烈祝贺	2
1068 | 热评	2
1069 | 焦虑	-2
1070 | 煽动	-2
1071 | 煽动性	-2
1072 | 爆笑	2
1073 | 爱	3
1074 | 爱出风头	-1
1075 | 爱好	2
1076 | 爱情	3
1077 | 牵肠挂肚	-2
1078 | 特权	2
1079 | 犯罪	-3
1080 | 犯罪嫌疑人	-1
1081 | 犹豫	-2
1082 | 狂	-3
1083 | 狂人	-3
1084 | 狂喜	2
1085 | 狂暴	-3
1086 | 狂热	-3
1087 | 狂热者	-2
1088 | 狗屎	-4
1089 | 狠话	-1
1090 | 狡猾	-2
1091 | 独家	2
1092 | 猥亵	-2
1093 | 猥琐	-2
1094 | 玩世不恭	-2
1095 | 珍惜	2
1096 | 珍视	2
1097 | 珠宝	1
1098 | 理由	2
1099 | 理直气壮	2
1100 | 甜	2
1101 | 生存	2
1102 | 生气	-2
1103 | 生病	-2
1104 | 生闷气	-2
1105 | 疑虑	-2
1106 | 疑问	-1
1107 | 疯子	-3
1108 | 疯狂	-1
1109 | 疲劳	-2
1110 | 疲惫	-2
1111 | 疼痛	-1
1112 | 疾病	-2
1113 | 病	-2
1114 | 痒	-2
1115 | 痛苦	-2
1116 | 痛骂	-2
1117 | 痴情	2
1118 | 痴迷	2
1119 | 癌症	-1
1120 | 登上	1
1121 | 白痴	-3
1122 | 百家争鸣	-1
1123 | 皮克	-2
1124 | 皮疹	-2
1125 | 皱眉道	-1
1126 | 监狱	-2
1127 | 盛大	3
1128 | 盲人	-1
1129 | 盲目乐观	2
1130 | 直	1
1131 | 直索	-2
1132 | 相互矛盾	-2
1133 | 眉飞色舞	3
1134 | 看点	1
1135 | 看破红尘	-2
1136 | 真	2
1137 | 真棒	4
1138 | 真气	-2
1139 | 真诚	2
1140 | 眼泪	-2
1141 | 着迷	3
1142 | 矛盾	-1
1143 | 短视	-2
1144 | 破	-1
1145 | 破产	-3
1146 | 破坏	-2
1147 | 破坏力	-3
1148 | 硫酸	-3
1149 | 硬	-1
1150 | 确保	1
1151 | 确定	2
1152 | 碰撞	-1
1153 | 礼物	2
1154 | 礼貌	2
1155 | 祈祷	1
1156 | 祝福	1
1157 | 祝贺	2
1158 | 神	1
1159 | 神仙	2
1160 | 神经	-1
1161 | 神话	-1
1162 | 神话般	4
1163 | 祸患	-2
1164 | 禁止	-2
1165 | 禁用	-1
1166 | 离奇	-2
1167 | 离开	-1
1168 | 离线	-1
1169 | 种族主义	-3
1170 | 种族主义者	-3
1171 | 秘籍	-3
1172 | 称赞	2
1173 | 移花接木	-3
1174 | 稳健	2
1175 | 稳定	2
1176 | 穆迪	-1
1177 | 穷	-2
1178 | 穷人	-2
1179 | 空	-1
1180 | 空虚	-1
1181 | 穿长袍	-2
1182 | 突出	1
1183 | 突出	2
1184 | 突破	3
1185 | 窒息	-1
1186 | 竞争性	2
1187 | 竞争者	-1
1188 | 笑	3
1189 | 笑声	3
1190 | 笑话	2
1191 | 笑道	1
1192 | 笨蛋	-3
1193 | 笼罩	-1
1194 | 等待	-1
1195 | 简单化	-2
1196 | 类型	2
1197 | 粉碎	-1
1198 | 粉饰	-3
1199 | 粗壮	2
1200 | 粗心	-2
1201 | 粲	-3
1202 | 精力充沛	2
1203 | 精彩	3
1204 | 精益求精	3
1205 | 精神	1
1206 | 精美	3
1207 | 紧张	-2
1208 | 紧张地问	-2
1209 | 紧急求助	-2
1210 | 累了	-2
1211 | 繁荣	3
1212 | 红肿	-2
1213 | 织机	-1
1214 | 经济衰退	-2
1215 | 绑架	-2
1216 | 给予	1
1217 | 绝望	-2
1218 | 统一	1
1219 | 维护了	2
1220 | 维生素	1
1221 | 综合	2
1222 | 绿洗	-3
1223 | 绿色洗涤	-3
1224 | 缓解	1
1225 | 缩头缩脑	-2
1226 | 缺乏	-2
1227 | 缺乏自信	-2
1228 | 缺席者	-1
1229 | 缺点	-2
1230 | 缺陷	-2
1231 | 罚款	-1
1232 | 罢工	-1
1233 | 罪犯	-2
1234 | 美化	3
1235 | 美味	3
1236 | 美图	3
1237 | 美眉	-1
1238 | 美艳	3
1239 | 美观	3
1240 | 美食	3
1241 | 羞愧	-2
1242 | 羞辱	-2
1243 | 羡慕	-1
1244 | 翻牌	-2
1245 | 老张	-2
1246 | 耐力	2
1247 | 耐寒	2
1248 | 耗尽	-2
1249 | 耶	1
1250 | 耶稣	1
1251 | 耻辱	-2
1252 | 聚焦	-2
1253 | 聪明	2
1254 | 肇事者	-2
1255 | 股份	1
1256 | 育雏	-2
1257 | 肿瘤	-2
1258 | 胆怯	-2
1259 | 背叛	-3
1260 | 背负	-2
1261 | 胜	4
1262 | 胡说	-2
1263 | 能力	1
1264 | 脏	-2
1265 | 脱节	-2
1266 | 自信	2
1267 | 自夸	-2
1268 | 自我迷惑	-2
1269 | 自杀	-2
1270 | 自满	-2
1271 | 自然	1
1272 | 自由	2
1273 | 自私	-3
1274 | 自责	-2
1275 | 臭名昭著	-2
1276 | 臭屁	-2
1277 | 致害	-3
1278 | 舀	3
1279 | 舍弃	-1
1280 | 舒缓	3
1281 | 舒适	2
1282 | 舒适度	2
1283 | 节日	2
1284 | 芊芊	4
1285 | 苛刻	-1
1286 | 若隐若现	-1
1287 | 苦	-2
1288 | 苦恼	-2
1289 | 苦笑	-2
1290 | 英勇	3
1291 | 英雄	2
1292 | 荣耀	2
1293 | 荣获	3
1294 | 荣誉	2
1295 | 获奖	4
1296 | 获得	2
1297 | 获救	2
1298 | 葬礼	-1
1299 | 蓄势	-2
1300 | 蔑视	-2
1301 | 藏	-1
1302 | 虚伪	-2
1303 | 虚弱	-2
1304 | 虚构	-1
1305 | 螺纹	-2
1306 | 蠢蛋	-4
1307 | 蠢驴	-4
1308 | 血腥	-3
1309 | 行为不端	-2
1310 | 行骗者	-4
1311 | 补助	1
1312 | 表彰	2
1313 | 表白	2
1314 | 被动	-1
1315 | 被提	2
1316 | 被盗	-2
1317 | 被砍	-1
1318 | 被骗	-2
1319 | 裹挟	-2
1320 | 要求	-1
1321 | 见死不救	-2
1322 | 规定	-1
1323 | 解决	1
1324 | 解决办法	1
1325 | 解决方案	1
1326 | 解析	2
1327 | 解疑	2
1328 | 解禁	-2
1329 | 解表	2
1330 | 触发器	-2
1331 | 警告	-2
1332 | 警惕	-1
1333 | 讨价还价	2
1334 | 讨厌	-2
1335 | 讨厌	-3
1336 | 讽刺	-1
1337 | 评论家	-2
1338 | 诈骗	-3
1339 | 诉讼	-1
1340 | 诙谐	2
1341 | 诚信	2
1342 | 诚实	2
1343 | 该死	-3
1344 | 该死	-4
1345 | 语重心长地说	2
1346 | 误	-2
1347 | 误传	-2
1348 | 误区一	-2
1349 | 误导	-2
1350 | 误导性	-3
1351 | 误报	-2
1352 | 误解	-2
1353 | 误读	-1
1354 | 诱人	1
1355 | 诱惑	-1
1356 | 说服	1
1357 | 请	1
1358 | 调解	2
1359 | 调解	2
1360 | 谋杀	-2
1361 | 谎称	-2
1362 | 谨慎	-1
1363 | 谴责	-2
1364 | 豁免	-1
1365 | 豪言壮语人	-3
1366 | 负担	-2
1367 | 负责	2
1368 | 负面	-2
1369 | 财富	3
1370 | 责罚	-3
1371 | 贤惠	2
1372 | 质疑	-1
1373 | 贪婪	-2
1374 | 贫困	-1
1375 | 贬低	-2
1376 | 贱人	-5
1377 | 贻害	-2
1378 | 贿赂	-3
1379 | 资产	2
1380 | 赎回	2
1381 | 赏识	-2
1382 | 赞同	2
1383 | 赞成	2
1384 | 赞扬	2
1385 | 赞美	3
1386 | 赞赏	2
1387 | 赤字	-2
1388 | 赦免	2
1389 | 走投无路	-2
1390 | 起诉	-1
1391 | 超强	3
1392 | 超重	-1
1393 | 越狱	-1
1394 | 跆拳道	-4
1395 | 跛	-2
1396 | 跳动	-1
1397 | 跳跃	-1
1398 | 踏实	2
1399 | 踩踏事故	-2
1400 | 转储	-1
1401 | 轻信	-2
1402 | 轻快	2
1403 | 轻松	1
1404 | 轻松活泼	2
1405 | 轻率	-2
1406 | 轻蔑	-2
1407 | 轻视	-2
1408 | 辉煌	2
1409 | 输家	-3
1410 | 辞职	-1
1411 | 辱骂	-3
1412 | 达到	1
1413 | 迅速	2
1414 | 过于简单化	-2
1415 | 过度反应	-2
1416 | 过度销售	-2
1417 | 过敏	-2
1418 | 过时	-2
1419 | 过载	-1
1420 | 运气	3
1421 | 还原	1
1422 | 进取	1
1423 | 进展	2
1424 | 远景	1
1425 | 违反	-2
1426 | 违规	-2
1427 | 迪克	-4
1428 | 迫使	1
1429 | 迫害	-2
1430 | 迷人	3
1431 | 迷住	3
1432 | 迷住了	3
1433 | 迷失方向	-2
1434 | 迷惑	-2
1435 | 追问	-1
1436 | 退	-1
1437 | 退化	-2
1438 | 退让	-2
1439 | 适用于	1
1440 | 逃脱	-1
1441 | 逃跑	-1
1442 | 逗	3
1443 | 逗乐了	3
1444 | 逮捕	-2
1445 | 道歉	-1
1446 | 遗忘	-1
1447 | 遗憾	-1
1448 | 避免	-1
1449 | 邀请	1
1450 | 邪	-3
1451 | 郁闷	-2
1452 | 鄙视	-2
1453 | 配套	1
1454 | 配料	-2
1455 | 酷	1
1456 | 酷刑	-4
1457 | 醉	-2
1458 | 采用	1
1459 | 释疑	-1
1460 | 重度	-2
1461 | 重磅炸弹	3
1462 | 重罪	-3
1463 | 重要性	2
1464 | 重要是	2
1465 | 量刑	-2
1466 | 金德	2
1467 | 钻机	-1
1468 | 钻石	1
1469 | 铁青	-2
1470 | 错杀	-3
1471 | 错误	-2
1472 | 错过了	-2
1473 | 镦	-2
1474 | 闪避	-2
1475 | 闪闪发光	3
1476 | 问候	2
1477 | 问候语	1
1478 | 问题	-2
1479 | 闷闷不乐	-2
1480 | 闹剧	-1
1481 | 闹鬼	-2
1482 | 防	-1
1483 | 防暴	-2
1484 | 阳痿	-2
1485 | 阴云密布	-1
1486 | 阴沉	-2
1487 | 阴谋	-3
1488 | 阴郁	-2
1489 | 阻力	-1
1490 | 阻挠	-2
1491 | 阻止	-1
1492 | 阻碍	-2
1493 | 阿飞	-2
1494 | 附魔	2
1495 | 降	-1
1496 | 降低	-2
1497 | 限制	-1
1498 | 陷阱	-1
1499 | 隐藏	-1
1500 | 隔离	-1
1501 | 障碍	-2
1502 | 难点	-1
1503 | 雄心勃勃	2
1504 | 雒	-3
1505 | 雨天	-1
1506 | 雨衣	2
1507 | 需求	-1
1508 | 震惊	-2
1509 | 震撼	-2
1510 | 震耳欲聋	-1
1511 | 霍元甲	2
1512 | 青春	2
1513 | 青睐	2
1514 | 非人	-2
1515 | 非人化	-2
1516 | 非人性化	-2
1517 | 非法	-3
1518 | 面色凝重	-2
1519 | 顶	2
1520 | 预防	-1
1521 | 题为	1
1522 | 颠覆性	-2
1523 | 颤抖	-2
1524 | 风扇	3
1525 | 风景如画	2
1526 | 风趣	3
1527 | 风险	-2
1528 | 饥饿	-2
1529 | 饿死	-2
1530 | 驱逐	-1
1531 | 驴	-4
1532 | 骂	-2
1533 | 骂道	-1
1534 | 骄傲地说	2
1535 | 骇然	-2
1536 | 验证	1
1537 | 骗	-3
1538 | 骗子	-3
1539 | 骗局	-2
1540 | 骚乱	-2
1541 | 高估	-2
1542 | 高兴	3
1543 | 高昂代价	3
1544 | 高贵	2
1545 | 高超	5
1546 | 鬼	-1
1547 | 魅力	3
1548 | 鲁莽	-2
1549 | 麻木	-1
1550 | 麻烦	-2
1551 | 黑人	-5
1552 | 黑客	-1
1553 | 黑暗	-1
1554 | 黑鬼	-5
1555 | 鼓励	2
1556 | 鼓掌	2
1557 | 鼓舞人心	3


--------------------------------------------------------------------------------
/lib/data/D_U_protection.json:
--------------------------------------------------------------------------------
1 | ["妈的", "是的", "他妈的", "你妈的"]
2 | 


--------------------------------------------------------------------------------
/lib/data/index.js:
--------------------------------------------------------------------------------
 1 | /**
 2 |  * Converts raw AFINN data to JSON hash table.
 3 |  *
 4 |  * @package sentiment
 5 |  * @author Andrew Sliwinski <andrew@diy.org>
 6 |  */
 7 | 
 8 | /**
 9 |  * Dependencies
10 |  */
11 | var async   = require('async'),
12 |     fs      = require('fs');
13 | 
14 | /**
15 |  * Read AFINN data from original format
16 |  */
17 | fs.readFile(__dirname + '/AFINN-zh_cn.txt', function (err, data) {
18 |     // Storage object
19 |     var hash = new Object(null);
20 | 
21 |     // Split lines
22 |     var lines = data.toString().split(/\n/);
23 |     async.forEach(lines, function (obj, callback) {
24 |         var item = obj.split(/\t/);
25 |         hash[item[0]] = Number(item[1]);
26 |         callback();
27 |     }, function (err) {
28 |         if (err) throw new Error(err);
29 | 
30 |         // Write out JSON
31 |         fs.writeFile(
32 |             __dirname + '/AFINN-zh_cn.json', 
33 |             JSON.stringify(hash), 
34 |         function (err) {
35 |             if (err) throw new Error(err);
36 |             process.stdout.write('Complete.');
37 |         });
38 |     });
39 | });
40 | 


--------------------------------------------------------------------------------
/lib/data/user-words.txt:
--------------------------------------------------------------------------------
   1 | 一句话
   2 | 一审宣判
   3 | 一拖再拖
   4 | 一文不值
   5 | 一笑
   6 | 三宝
   7 | 上衣
   8 | 下垂
   9 | 不专业
  10 | 不乖
  11 | 不以为然
  12 | 不便之处
  13 | 不信
  14 | 不信任
  15 | 不健康
  16 | 不公平
  17 | 不可取
  18 | 不可抗拒
  19 | 不可爱
  20 | 不可逆
  21 | 不合理
  22 | 不和谐
  23 | 不喜欢
  24 | 不好
  25 | 不安
  26 | 不安全
  27 | 不完善
  28 | 不尊重
  29 | 不屑
  30 | 不工作
  31 | 不平等
  32 | 不悦
  33 | 不支持
  34 | 不敏感
  35 | 不敬
  36 | 不方便
  37 | 不明
  38 | 不服气
  39 | 不满
  40 | 不满意
  41 | 不知道
  42 | 不确定
  43 | 不确定性
  44 | 不祥
  45 | 不稳定
  46 | 不耐烦
  47 | 不能接受
  48 | 不舒服
  49 | 不要脸
  50 | 不解
  51 | 不诚实
  52 | 不负责任
  53 | 不足
  54 | 不道德
  55 | 不配
  56 | 不错
  57 | 不需要
  58 | 不高兴
  59 | 丑
  60 | 丑闻
  61 | 专用
  62 | 丢失
  63 | 丢弃
  64 | 严厉
  65 | 严惩
  66 | 严格
  67 | 严谨
  68 | 严重
  69 | 丧
  70 | 丧偶
  71 | 丧失抵押品赎回权
  72 | 中伤
  73 | 中断
  74 | 中毒
  75 | 主动
  76 | 主管
  77 | 举棋不定
  78 | 乐观
  79 | 乱
  80 | 乳房
  81 | 了不起
  82 | 争议
  83 | 争鸣
  84 | 事
  85 | 事故
  86 | 事项
  87 | 享受
  88 | 享有
  89 | 亮
  90 | 亮度
  91 | 亮点
  92 | 亲切
  93 | 亲情
  94 | 亲爱
  95 | 人渣
  96 | 仇敌
  97 | 从事
  98 | 他妈的
  99 | 付
 100 | 代表作
 101 | 代言
 102 | 令人不安
 103 | 令人印象深刻
 104 | 令人叹为观止
 105 | 令人失望
 106 | 令人心寒
 107 | 令人担忧
 108 | 令人振奋
 109 | 令人欣慰
 110 | 令人沮丧
 111 | 令人痛心
 112 | 令人讨厌
 113 | 令人难以忘怀
 114 | 令人难以置信
 115 | 令人震惊
 116 | 优势
 117 | 优点
 118 | 优秀
 119 | 优良
 120 | 优雅
 121 | 传染
 122 | 传染性
 123 | 伤亡
 124 | 伤害
 125 | 伤心
 126 | 伤心欲绝
 127 | 伤感
 128 | 伤脑筋
 129 | 伦理
 130 | 伪科学
 131 | 伪装
 132 | 伪证
 133 | 伪造
 134 | 低估
 135 | 低劣
 136 | 低能儿
 137 | 作假
 138 | 你妈的
 139 | 佩服
 140 | 使...称叹
 141 | 依赖
 142 | 侮辱
 143 | 侵权
 144 | 侵略
 145 | 促进
 146 | 俏皮
 147 | 保存
 148 | 保护
 149 | 保暖
 150 | 保留
 151 | 保证
 152 | 信任
 153 | 信心
 154 | 信念
 155 | 倒霉
 156 | 倜傥
 157 | 借口
 158 | 倦怠
 159 | 债务
 160 | 值得
 161 | 值得一
 162 | 倾倒
 163 | 倾注
 164 | 假装
 165 | 假货
 166 | 偏向
 167 | 偏见
 168 | 停止
 169 | 停滞
 170 | 停车
 171 | 健康
 172 | 健忘
 173 | 健身
 174 | 偷
 175 | 偷偷摸摸
 176 | 傲慢
 177 | 傻
 178 | 傻瓜
 179 | 像
 180 | 僵局
 181 | 允许
 182 | 充足
 183 | 先进
 184 | 免疫
 185 | 免费
 186 | 免除
 187 | 兑现
 188 | 入狱
 189 | 全神贯注
 190 | 八卦
 191 | 公平
 192 | 公正
 193 | 公鸡
 194 | 关心
 195 | 兴奋
 196 | 兴趣
 197 | 具有讽刺意味​​
 198 | 具有里程碑意义
 199 | 内疚
 200 | 再次保证
 201 | 冒犯
 202 | 冒险
 203 | 冠军
 204 | 冤
 205 | 冥想
 206 | 冰雹
 207 | 冲击
 208 | 冲洗
 209 | 冲突
 210 | 冲突性
 211 | 决定性
 212 | 冷冷清清
 213 | 冷漠
 214 | 冷落
 215 | 冷门
 216 | 冷静
 217 | 净度
 218 | 凯旋
 219 | 凶手
 220 | 出轨
 221 | 出逃
 222 | 击碎
 223 | 击退
 224 | 分享
 225 | 分享到
 226 | 分心
 227 | 分散
 228 | 分散了
 229 | 分离
 230 | 切
 231 | 切割
 232 | 创意
 233 | 创新
 234 | 判决
 235 | 利用
 236 | 利益
 237 | 制备
 238 | 刺
 239 | 刺伤
 240 | 刺激
 241 | 刺激性
 242 | 刻板印象
 243 | 刻毒
 244 | 削减
 245 | 前景
 246 | 前景堪忧
 247 | 前锋
 248 | 剧毒
 249 | 功能强大
 250 | 功能障碍
 251 | 加强
 252 | 加重
 253 | 劣势
 254 | 动机
 255 | 助学金
 256 | 励志
 257 | 势不可挡
 258 | 勇敢
 259 | 勇气
 260 | 勒死
 261 | 勘探
 262 | 勾结
 263 | 包庇
 264 | 千篇一律
 265 | 千载难逢
 266 | 升值
 267 | 半信半疑
 268 | 协议
 269 | 卑鄙
 270 | 卓越
 271 | 单纯
 272 | 占有欲
 273 | 卡
 274 | 印象
 275 | 印象深刻
 276 | 危害
 277 | 危机
 278 | 危言耸听
 279 | 危险
 280 | 厄运
 281 | 压制
 282 | 压力
 283 | 压迫
 284 | 厌倦了
 285 | 厌恶
 286 | 原谅
 287 | 参加办法
 288 | 友好
 289 | 反应过度
 290 | 反感
 291 | 发人深省
 292 | 发自内心
 293 | 发誓
 294 | 取消
 295 | 取消比赛资格
 296 | 受不了
 297 | 受伤
 298 | 受害
 299 | 受害人
 300 | 受害者
 301 | 受理
 302 | 受益
 303 | 受限
 304 | 受骗
 305 | 叛逆
 306 | 口交
 307 | 句子
 308 | 叫好
 309 | 叫道
 310 | 可以肯定
 311 | 可信
 312 | 可取
 313 | 可怕
 314 | 可怜
 315 | 可恶
 316 | 可悲是
 317 | 可惜
 318 | 可爱
 319 | 可疑
 320 | 可笑
 321 | 可耻
 322 | 可获免咎
 323 | 可避免出现
 324 | 合法
 325 | 同情
 326 | 同意
 327 | 后卫
 328 | 后悔
 329 | 向往
 330 | 吓了一跳
 331 | 吓人
 332 | 吓呆了
 333 | 吓坏了
 334 | 否认
 335 | 含糊
 336 | 吮吸
 337 | 启发
 338 | 启示
 339 | 吸吮
 340 | 吸引
 341 | 吸引力
 342 | 吸收
 343 | 吹嘘
 344 | 吹捧
 345 | 呆滞
 346 | 告诫
 347 | 呛
 348 | 呜呼
 349 | 周到
 350 | 呻吟
 351 | 呼喊
 352 | 咄咄逼人
 353 | 咆哮
 354 | 和平
 355 | 和煦
 356 | 哀悼
 357 | 品味
 358 | 哄骗
 359 | 哇
 360 | 哈
 361 | 哈哈
 362 | 哈哈哈
 363 | 哑巴
 364 | 哑弹
 365 | 哗然
 366 | 哭了
 367 | 哭泣
 368 | 哽咽
 369 | 哽咽道
 370 | 唉
 371 | 商贩
 372 | 善良
 373 | 善解人意
 374 | 喜剧
 375 | 喜悦
 376 | 喜欢
 377 | 喧嚷
 378 | 喧闹
 379 | 嗜睡
 380 | 嘲弄
 381 | 嘲笑
 382 | 囚犯
 383 | 囚禁
 384 | 回应
 385 | 回避
 386 | 团结
 387 | 困
 388 | 困境
 389 | 困惑
 390 | 困扰
 391 | 困难
 392 | 固体
 393 | 固定
 394 | 固执
 395 | 在调解
 396 | 地狱
 397 | 坏蛋
 398 | 坐立不安
 399 | 坑蒙拐骗
 400 | 块
 401 | 坚不可摧
 402 | 坚信
 403 | 坚决
 404 | 坚果
 405 | 坦言
 406 | 垂头丧气
 407 | 垃圾邮件
 408 | 垃圾邮件发送者
 409 | 垄断
 410 | 基本上
 411 | 堆积
 412 | 堕落
 413 | 堵
 414 | 堵嘴
 415 | 增加
 416 | 增益
 417 | 士气低落
 418 | 声讨
 419 | 处于不利地位
 420 | 处罚
 421 | 复仇
 422 | 复兴
 423 | 复杂
 424 | 复活
 425 | 外伤
 426 | 夜魔侠
 427 | 大
 428 | 大厅
 429 | 大喜
 430 | 大怒
 431 | 大惊失色
 432 | 大方
 433 | 大胆
 434 | 大赞
 435 | 天上
 436 | 天堂
 437 | 天真
 438 | 天赐
 439 | 失业率
 440 | 失去
 441 | 失去人性
 442 | 失望
 443 | 失眠
 444 | 失败
 445 | 失速
 446 | 头晕
 447 | 夸大
 448 | 夸张
 449 | 奇
 450 | 奇妙
 451 | 奇怪是
 452 | 奇迹
 453 | 奋斗
 454 | 奖励
 455 | 奖牌
 456 | 奖项
 457 | 奴役
 458 | 奸商
 459 | 好
 460 | 好处
 461 | 好奇
 462 | 好玩
 463 | 好评
 464 | 妈的
 465 | 妒忌
 466 | 妓女
 467 | 委屈
 468 | 委托
 469 | 威胁
 470 | 娘
 471 | 娘们
 472 | 娱乐
 473 | 嫉妒
 474 | 孔
 475 | 孤独
 476 | 孩子气
 477 | 宁静
 478 | 宇
 479 | 安全
 480 | 安慰
 481 | 安抚
 482 | 完善
 483 | 完好
 484 | 完成
 485 | 完美
 486 | 官司
 487 | 宝
 488 | 宝石
 489 | 实战
 490 | 实现
 491 | 实用性
 492 | 实质
 493 | 审批
 494 | 审查
 495 | 审问
 496 | 宣传
 497 | 宣判
 498 | 宣誓就职
 499 | 害怕
 500 | 害羞
 501 | 宽容
 502 | 宽松
 503 | 宽限期
 504 | 寂寞
 505 | 富人
 506 | 富有魅力
 507 | 对号入座
 508 | 对抗
 509 | 射击
 510 | 尊敬
 511 | 小便
 512 | 小姐
 513 | 小心
 514 | 小气
 515 | 小白
 516 | 小说
 517 | 小霸王
 518 | 尖刻
 519 | 尖叫
 520 | 尴尬
 521 | 尸体
 522 | 屁股
 523 | 屄
 524 | 屈辱
 525 | 崇拜
 526 | 崇敬
 527 | 崩溃
 528 | 巧
 529 | 巨大
 530 | 巨大
 531 | 差
 532 | 师爷
 533 | 希望
 534 | 帕利
 535 | 帮助
 536 | 平反
 537 | 平庸
 538 | 平淡
 539 | 平静
 540 | 幸存下来
 541 | 幸存者
 542 | 幸福
 543 | 幸运
 544 | 幸运
 545 | 幸运是
 546 | 幽默
 547 | 庄严
 548 | 庆幸
 549 | 庆祝
 550 | 应激
 551 | 废墟
 552 | 废话
 553 | 延伸
 554 | 延期
 555 | 延迟
 556 | 延长
 557 | 开发
 558 | 开导
 559 | 开心
 560 | 开朗
 561 | 开脱
 562 | 异化
 563 | 异想天开
 564 | 弊端
 565 | 引人入胜
 566 | 张力
 567 | 弱
 568 | 弱势
 569 | 弱点
 570 | 强
 571 | 强人所难
 572 | 强制
 573 | 强制性
 574 | 强化
 575 | 强壮
 576 | 强奸犯
 577 | 强度
 578 | 强盗
 579 | 强调
 580 | 归属
 581 | 影响
 582 | 征收
 583 | 很简单
 584 | 很酷东西
 585 | 徒劳
 586 | 得意
 587 | 得意扬扬
 588 | 得意洋洋
 589 | 得罪
 590 | 得罪了
 591 | 徘
 592 | 御史
 593 | 微笑
 594 | 心慌
 595 | 心灰意冷
 596 | 心生疑虑
 597 | 心疼
 598 | 心碎
 599 | 心花怒放
 600 | 忌
 601 | 忐忑
 602 | 忘记
 603 | 忠实
 604 | 忠诚
 605 | 忠诚度
 606 | 忧心忡忡
 607 | 忧虑
 608 | 忧郁
 609 | 快乐
 610 | 快乐可言
 611 | 快捷
 612 | 快活
 613 | 忽略
 614 | 忽视
 615 | 怀疑
 616 | 怀疑论者
 617 | 怒气冲冲
 618 | 怜悯
 619 | 怠慢
 620 | 急
 621 | 急了
 622 | 急切
 623 | 性交
 624 | 性感
 625 | 怪
 626 | 怪异
 627 | 怯懦
 628 | 恋情
 629 | 恐吓
 630 | 恐怖
 631 | 恐惧
 632 | 恐慌
 633 | 恢复
 634 | 恨
 635 | 恭喜
 636 | 恶人-2
 637 | 恶作剧
 638 | 恶化
 639 | 恶心
 640 | 恶棍
 641 | 恶毒
 642 | 恶行
 643 | 恼人
 644 | 恼火
 645 | 悍妇
 646 | 悖论
 647 | 悟
 648 | 悲伤
 649 | 悲切
 650 | 悲剧
 651 | 悲哀
 652 | 悲怆
 653 | 悲愤
 654 | 悲痛
 655 | 悲观
 656 | 悼念
 657 | 惆怅
 658 | 惊
 659 | 惊人
 660 | 惊叹
 661 | 惊呆了
 662 | 惊奇
 663 | 惊惶-2
 664 | 惊慌失措
 665 | 惊艳
 666 | 惊讶
 667 | 惊险
 668 | 惊魂
 669 | 惜字
 670 | 惨
 671 | 惨不忍睹
 672 | 惨淡
 673 | 惨败
 674 | 惩戒
 675 | 惩罚
 676 | 惭愧
 677 | 想家
 678 | 惹恼
 679 | 惹恼了
 680 | 愁眉苦脸
 681 | 愉快
 682 | 意义
 683 | 意外
 684 | 意愿
 685 | 意气风发
 686 | 愚蠢
 687 | 感兴趣是
 688 | 感叹
 689 | 感染
 690 | 感觉
 691 | 感谢
 692 | 愣神
 693 | 愤世嫉俗者
 694 | 愤怒
 695 | 愤慨
 696 | 愤懑
 697 | 愿景
 698 | 愿望
 699 | 慈悲
 700 | 憎恶
 701 | 懊恼
 702 | 懒得
 703 | 懒惰
 704 | 懦夫
 705 | 成功
 706 | 成名原因
 707 | 成本
 708 | 成熟
 709 | 成长
 710 | 战
 711 | 战争
 712 | 战斗
 713 | 戡
 714 | 戴
 715 | 手无寸铁
 716 | 打扰
 717 | 打招呼
 718 | 打断
 719 | 打断了
 720 | 打败了
 721 | 扩展
 722 | 扫地
 723 | 扬言
 724 | 扭曲
 725 | 扰乱
 726 | 批准
 727 | 批评
 728 | 扼流圈
 729 | 承认
 730 | 承诺
 731 | 抑制
 732 | 投机
 733 | 抖动
 734 | 抗议
 735 | 抗议者
 736 | 抗辩
 737 | 折扣
 738 | 折磨
 739 | 抛弃
 740 | 抢
 741 | 抢劫
 742 | 抢断
 743 | 护理方法
 744 | 报复
 745 | 报料
 746 | 报警
 747 | 抱怨
 748 | 抱怨道
 749 | 抵制
 750 | 抹杀
 751 | 抽筋
 752 | 抿着嘴
 753 | 担心
 754 | 拍摄
 755 | 拍案而起
 756 | 拒不
 757 | 拒绝
 758 | 拒绝了
 759 | 拓展
 760 | 拖
 761 | 拘留
 762 | 招呼
 763 | 招徕
 764 | 招标内容
 765 | 拥抱
 766 | 拮抗
 767 | 拷问
 768 | 拼命
 769 | 持怀疑态度
 770 | 挂羊头卖狗肉
 771 | 指控
 772 | 指责
 773 | 挑刺
 774 | 挑战
 775 | 挑衅
 776 | 挖苦
 777 | 挣扎
 778 | 挫败
 779 | 振奋
 780 | 挺举
 781 | 损失
 782 | 损害
 783 | 授
 784 | 掉落
 785 | 掌声
 786 | 排水
 787 | 排除
 788 | 探究
 789 | 探索
 790 | 接受
 791 | 接合
 792 | 接吻
 793 | 推出
 794 | 推广
 795 | 推荐
 796 | 推迟
 797 | 提升
 798 | 插科打诨
 799 | 揭露
 800 | 搞乱了
 801 | 搞坏
 802 | 搞砸了
 803 | 搞笑
 804 | 摇摆不定
 805 | 摇晃
 806 | 摊主
 807 | 撒尿
 808 | 撕裂
 809 | 操作
 810 | 操控
 811 | 操纵
 812 | 支持
 813 | 支持者
 814 | 收益
 815 | 收藏
 816 | 收费
 817 | 收费标准
 818 | 改善
 819 | 改进
 820 | 攻击
 821 | 放弃
 822 | 放心
 823 | 放松
 824 | 放缓
 825 | 放逐
 826 | 故障
 827 | 敌人
 828 | 敌意
 829 | 敏锐
 830 | 救市
 831 | 救援
 832 | 救生员
 833 | 散播
 834 | 敬佩
 835 | 文盲
 836 | 斗争
 837 | 斜线
 838 | 斧
 839 | 新鲜
 840 | 旗舰
 841 | 无
 842 | 无与伦比
 843 | 无为
 844 | 无力
 845 | 无奈
 846 | 无心
 847 | 无忧无虑
 848 | 无担保
 849 | 无效
 850 | 无敌
 851 | 无牙
 852 | 无用
 853 | 无畏
 854 | 无知
 855 | 无精打采
 856 | 无罪
 857 | 无聊
 858 | 无能
 859 | 无行为能力
 860 | 无视
 861 | 无言以对
 862 | 无赖
 863 | 日照
 864 | 旦
 865 | 时髦
 866 | 明快
 867 | 明确
 868 | 明确提出
 869 | 昏睡
 870 | 映入眼帘
 871 | 是的
 872 | 显着
 873 | 显著
 874 | 晕
 875 | 景点
 876 | 智能
 877 | 智能化
 878 | 暂停
 879 | 暗杀
 880 | 暴力
 881 | 曝光
 882 | 更大
 883 | 更糟
 884 | 替罪羊
 885 | 最严厉
 886 | 最低
 887 | 最佳
 888 | 最喜欢
 889 | 最大
 890 | 最强
 891 | 最穷
 892 | 最糟糕
 893 | 最聪明
 894 | 最脏
 895 | 最黑暗
 896 | 有影响
 897 | 有效
 898 | 有条不紊
 899 | 有用
 900 | 有罪
 901 | 有趣
 902 | 有趣
 903 | 有远见
 904 | 朗声道
 905 | 期待已久
 906 | 期望
 907 | 未了
 908 | 未定
 909 | 未经批准
 910 | 未经证实
 911 | 机会
 912 | 机遇
 913 | 杀
 914 | 杀敌
 915 | 杀气
 916 | 杂乱无章
 917 | 杂役
 918 | 权威
 919 | 来头
 920 | 来袭
 921 | 松
 922 | 松了口气
 923 | 极权主义
 924 | 枪
 925 | 某种
 926 | 查杀
 927 | 柴
 928 | 柴草
 929 | 梦
 930 | 梦幻
 931 | 梦想
 932 | 棘手
 933 | 森森
 934 | 模拟
 935 | 模糊
 936 | 欢乐
 937 | 欢呼
 938 | 欢喜
 939 | 欢欣鼓舞
 940 | 欢腾
 941 | 欢迎
 942 | 欣喜
 943 | 欣喜若狂
 944 | 欣快
 945 | 欣赏
 946 | 欲绝
 947 | 欺凌
 948 | 欺诈
 949 | 欺负
 950 | 欺骗
 951 | 歇斯底里
 952 | 正
 953 | 正义
 954 | 正确方向
 955 | 正面
 956 | 歹徒
 957 | 死
 958 | 死亡
 959 | 死亡人数
 960 | 死者家属
 961 | 残酷
 962 | 殴打
 963 | 毁
 964 | 毁灭
 965 | 毁灭性
 966 | 母犬
 967 | 母狗
 968 | 毒
 969 | 毒药
 970 | 比拟
 971 | 毛
 972 | 气势
 973 | 气馁
 974 | 汁液
 975 | 求救
 976 | 污垢
 977 | 污染
 978 | 污染者
 979 | 沉思
 980 | 沉着脸
 981 | 沉船
 982 | 沉闷
 983 | 沉默
 984 | 没头脑
 985 | 没有乐趣
 986 | 没有得到爱护
 987 | 没用
 988 | 没精打采
 989 | 沮丧
 990 | 油菜
 991 | 泄漏
 992 | 泄露
 993 | 法律
 994 | 法西斯
 995 | 注定
 996 | 泯
 997 | 洗脑
 998 | 洪琳
 999 | 活力
1000 | 活泼
1001 | 活着
1002 | 流感
1003 | 流氓
1004 | 流行
1005 | 浩劫
1006 | 浪费
1007 | 浮力
1008 | 涂片
1009 | 消失
1010 | 消极
1011 | 消耗
1012 | 淡然道
1013 | 深情
1014 | 混蛋
1015 | 淹死
1016 | 淹死了
1017 | 清洁
1018 | 清除
1019 | 清零
1020 | 温文尔雅
1021 | 渴望
1022 | 游说
1023 | 滑头
1024 | 滑稽
1025 | 滞后
1026 | 满目疮痍
1027 | 满足
1028 | 滥用
1029 | 漂亮
1030 | 漂绿
1031 | 漏洞
1032 | 演示
1033 | 漠不关心
1034 | 潇洒
1035 | 潜伏
1036 | 澄清
1037 | 激动
1038 | 激动不已
1039 | 激励
1040 | 激怒
1041 | 激怒了
1042 | 激情
1043 | 激烈
1044 | 激起了
1045 | 灌输
1046 | 火
1047 | 火花
1048 | 灰头土脸
1049 | 灰色
1050 | 灵巧
1051 | 灾害
1052 | 灾难
1053 | 灾难性
1054 | 炸弹
1055 | 炽热
1056 | 烁
1057 | 烟
1058 | 烟雾
1059 | 烦
1060 | 烦恼
1061 | 烦躁
1062 | 热切
1063 | 热心
1064 | 热情
1065 | 热烈祝贺
1066 | 热评
1067 | 焦虑
1068 | 煽动
1069 | 煽动性
1070 | 爆笑
1071 | 爱
1072 | 爱出风头
1073 | 爱好
1074 | 爱情
1075 | 牵肠挂肚
1076 | 特权
1077 | 犯罪
1078 | 犯罪嫌疑人
1079 | 犹豫
1080 | 狂
1081 | 狂人
1082 | 狂喜
1083 | 狂暴
1084 | 狂热
1085 | 狂热者
1086 | 狗屎
1087 | 狠话
1088 | 狡猾
1089 | 独家
1090 | 猥亵
1091 | 猥琐
1092 | 玩世不恭
1093 | 珍惜
1094 | 珍视
1095 | 珠宝
1096 | 理由
1097 | 理直气壮
1098 | 甜
1099 | 生存
1100 | 生气
1101 | 生病
1102 | 生闷气
1103 | 疑虑
1104 | 疑问
1105 | 疯子
1106 | 疯狂
1107 | 疲劳
1108 | 疲惫
1109 | 疼痛
1110 | 疾病
1111 | 病
1112 | 痒
1113 | 痛苦
1114 | 痛骂
1115 | 痴情
1116 | 痴迷
1117 | 癌症
1118 | 登上
1119 | 白痴
1120 | 百家争鸣
1121 | 皮克
1122 | 皮疹
1123 | 皱眉道
1124 | 监狱
1125 | 盛大
1126 | 盲人
1127 | 盲目乐观
1128 | 直
1129 | 直索
1130 | 相互矛盾
1131 | 眉飞色舞
1132 | 看点
1133 | 看破红尘
1134 | 真
1135 | 真棒
1136 | 真气
1137 | 真诚
1138 | 眼泪
1139 | 着迷
1140 | 矛盾
1141 | 短视
1142 | 破
1143 | 破产
1144 | 破坏
1145 | 破坏力
1146 | 硫酸
1147 | 硬
1148 | 确保
1149 | 确定
1150 | 碰撞
1151 | 礼物
1152 | 礼貌
1153 | 祈祷
1154 | 祝福
1155 | 祝贺
1156 | 神
1157 | 神仙
1158 | 神经
1159 | 神话
1160 | 神话般
1161 | 祸患
1162 | 禁止
1163 | 禁用
1164 | 离奇
1165 | 离开
1166 | 离线
1167 | 种族主义
1168 | 种族主义者
1169 | 秘籍
1170 | 称赞
1171 | 移花接木
1172 | 稳健
1173 | 稳定
1174 | 穆迪
1175 | 穷
1176 | 穷人
1177 | 空
1178 | 空虚
1179 | 穿长袍
1180 | 突出
1181 | 突出
1182 | 突破
1183 | 窒息
1184 | 竞争性
1185 | 竞争者
1186 | 笑
1187 | 笑声
1188 | 笑话
1189 | 笑道
1190 | 笨蛋
1191 | 笼罩
1192 | 等待
1193 | 简单化
1194 | 类型
1195 | 粉碎
1196 | 粉饰
1197 | 粗壮
1198 | 粗心
1199 | 粲
1200 | 精力充沛
1201 | 精彩
1202 | 精益求精
1203 | 精神
1204 | 精美
1205 | 紧张
1206 | 紧张地问
1207 | 紧急求助
1208 | 累了
1209 | 繁荣
1210 | 红肿
1211 | 织机
1212 | 经济衰退
1213 | 绑架
1214 | 给予
1215 | 绝望
1216 | 统一
1217 | 维护了
1218 | 维生素
1219 | 综合
1220 | 绿洗
1221 | 绿色洗涤
1222 | 缓解
1223 | 缩头缩脑
1224 | 缺乏
1225 | 缺乏自信
1226 | 缺席者
1227 | 缺点
1228 | 缺陷
1229 | 罚款
1230 | 罢工
1231 | 罪犯
1232 | 美化
1233 | 美味
1234 | 美图
1235 | 美眉
1236 | 美艳
1237 | 美观
1238 | 美食
1239 | 羞愧
1240 | 羞辱
1241 | 羡慕
1242 | 翻牌
1243 | 老张
1244 | 耐力
1245 | 耐寒
1246 | 耗尽
1247 | 耶
1248 | 耶稣
1249 | 耻辱
1250 | 聚焦
1251 | 聪明
1252 | 肇事者
1253 | 育雏
1254 | 肿瘤
1255 | 胆怯
1256 | 背叛
1257 | 背负
1258 | 胜
1259 | 胡说
1260 | 能力
1261 | 脏
1262 | 脱节
1263 | 自信
1264 | 自夸
1265 | 自我迷惑
1266 | 自杀
1267 | 自满
1268 | 自然
1269 | 自由
1270 | 自私
1271 | 自责
1272 | 臭名昭著
1273 | 臭屁
1274 | 致害
1275 | 舀
1276 | 舍弃
1277 | 舒缓
1278 | 舒适
1279 | 舒适度
1280 | 节日
1281 | 芊芊
1282 | 苛刻
1283 | 若隐若现
1284 | 苦
1285 | 苦恼
1286 | 苦笑
1287 | 英勇
1288 | 英雄
1289 | 荣耀
1290 | 荣获
1291 | 荣誉
1292 | 获奖
1293 | 获得
1294 | 获救
1295 | 葬礼
1296 | 蓄势
1297 | 蔑视
1298 | 藏
1299 | 虚伪
1300 | 虚弱
1301 | 虚构
1302 | 螺纹
1303 | 蠢蛋
1304 | 蠢驴
1305 | 血腥
1306 | 行为不端
1307 | 行骗者
1308 | 补助
1309 | 表彰
1310 | 表白
1311 | 被动
1312 | 被提
1313 | 被盗
1314 | 被砍
1315 | 被骗
1316 | 裹挟
1317 | 要求
1318 | 见死不救
1319 | 规定
1320 | 解决
1321 | 解决办法
1322 | 解决方案
1323 | 解析
1324 | 解疑
1325 | 解禁
1326 | 解表
1327 | 触发器
1328 | 警告
1329 | 警惕
1330 | 讨价还价
1331 | 讨厌
1332 | 讨厌
1333 | 讽刺
1334 | 评论家
1335 | 诈骗
1336 | 诉讼
1337 | 诙谐
1338 | 诚信
1339 | 诚实
1340 | 该死
1341 | 该死
1342 | 语重心长地说
1343 | 误
1344 | 误传
1345 | 误区一
1346 | 误导
1347 | 误导性
1348 | 误报
1349 | 误解
1350 | 误读
1351 | 诱人
1352 | 诱惑
1353 | 说服
1354 | 请
1355 | 调解
1356 | 调解
1357 | 谋杀
1358 | 谎称
1359 | 谨慎
1360 | 谴责
1361 | 豁免
1362 | 豪言壮语人
1363 | 负担
1364 | 负责
1365 | 负面
1366 | 财富
1367 | 责罚
1368 | 贤惠
1369 | 质疑
1370 | 贪婪
1371 | 贫困
1372 | 贬低
1373 | 贱人
1374 | 贻害
1375 | 贿赂
1376 | 赎回
1377 | 赏识
1378 | 赞同
1379 | 赞成
1380 | 赞扬
1381 | 赞美
1382 | 赞赏
1383 | 赤字
1384 | 赦免
1385 | 走投无路
1386 | 起诉
1387 | 超强
1388 | 超重
1389 | 越狱
1390 | 跆拳道
1391 | 跛
1392 | 跳动
1393 | 跳跃
1394 | 踏实
1395 | 踩踏事故
1396 | 转储
1397 | 轻信
1398 | 轻快
1399 | 轻松
1400 | 轻松活泼
1401 | 轻率
1402 | 轻蔑
1403 | 轻视
1404 | 辉煌
1405 | 输家
1406 | 辞职
1407 | 辱骂
1408 | 达到
1409 | 迅速
1410 | 过于简单化
1411 | 过度反应
1412 | 过度销售
1413 | 过敏
1414 | 过时
1415 | 过载
1416 | 运气
1417 | 还原
1418 | 进取
1419 | 进展
1420 | 远景
1421 | 违反
1422 | 违规
1423 | 迪克
1424 | 迫使
1425 | 迫害
1426 | 迷人
1427 | 迷住
1428 | 迷住了
1429 | 迷失方向
1430 | 迷惑
1431 | 追问
1432 | 退
1433 | 退化
1434 | 退让
1435 | 适用于
1436 | 逃脱
1437 | 逃跑
1438 | 逗
1439 | 逗乐了
1440 | 逮捕
1441 | 道歉
1442 | 遗忘
1443 | 遗憾
1444 | 避免
1445 | 邀请
1446 | 邪
1447 | 郁闷
1448 | 鄙视
1449 | 配套
1450 | 配料
1451 | 酷
1452 | 酷刑
1453 | 醉
1454 | 采用
1455 | 释疑
1456 | 重度
1457 | 重磅炸弹
1458 | 重罪
1459 | 重要性
1460 | 重要是
1461 | 量刑
1462 | 金德
1463 | 钻机
1464 | 钻石
1465 | 铁青
1466 | 错杀
1467 | 错误
1468 | 错过了
1469 | 镦
1470 | 闪避
1471 | 闪闪发光
1472 | 问候
1473 | 问候语
1474 | 问题
1475 | 闷闷不乐
1476 | 闹剧
1477 | 闹鬼
1478 | 防
1479 | 防暴
1480 | 阳痿
1481 | 阴云密布
1482 | 阴沉
1483 | 阴谋
1484 | 阴郁
1485 | 阻力
1486 | 阻挠
1487 | 阻止
1488 | 阻碍
1489 | 阿飞
1490 | 附魔
1491 | 降
1492 | 降低
1493 | 限制
1494 | 陷阱
1495 | 隐藏
1496 | 隔离
1497 | 障碍
1498 | 难点
1499 | 雄心勃勃
1500 | 雒
1501 | 雨天
1502 | 雨衣
1503 | 需求
1504 | 震惊
1505 | 震撼
1506 | 震耳欲聋
1507 | 霍元甲
1508 | 青春
1509 | 青睐
1510 | 非人
1511 | 非人化
1512 | 非人性化
1513 | 非法
1514 | 面色凝重
1515 | 顶
1516 | 预防
1517 | 题为
1518 | 颠覆性
1519 | 颤抖
1520 | 风扇
1521 | 风景如画
1522 | 风趣
1523 | 风险
1524 | 饥饿
1525 | 饿死
1526 | 驱逐
1527 | 驴
1528 | 骂
1529 | 骂道
1530 | 骄傲地说
1531 | 骇然
1532 | 验证
1533 | 骗
1534 | 骗子
1535 | 骗局
1536 | 骚乱
1537 | 高估
1538 | 高兴
1539 | 高昂代价
1540 | 高贵
1541 | 高超
1542 | 鬼
1543 | 魅力
1544 | 鲁莽
1545 | 麻木
1546 | 麻烦
1547 | 黑人
1548 | 黑客
1549 | 黑暗
1550 | 黑鬼
1551 | 鼓励
1552 | 鼓掌
1553 | 鼓舞人心
1554 | 连续阴跌
1555 | 持续下挫
1556 | 跌停


--------------------------------------------------------------------------------
/lib/httprequest.js:
--------------------------------------------------------------------------------
  1 | /**
  2 |  * Created by cherokee on 14-6-16.
  3 |  */
  4 | var urlUtil = require("url");
  5 | var iconv = require('iconv-lite');
  6 | var BufferHelper = require('bufferhelper');
  7 | try { var unzip = require('zlib').unzip } catch (e) { console.error('unzip not supported') }
  8 | try { var inflate = require('zlib').inflate } catch (e) { console.error('inflate not supported') }
  9 | var httplib = { 'http:': require('http'), 'https:': require('https') }
 10 | 
 11 | /**
 12 |  * request page
 13 |  * callback(err,status_code,content,page_encoding,param)
 14 |  */
 15 | var request = function(url, referer, cookie, proxy, timeout, isbin, callback, param) {
 16 |     var timeOuter = false;
 17 |     var callbackCount = 0;
 18 | 
 19 |     var urlobj = urlUtil.parse(url);
 20 |     var http = httplib[urlobj['protocol']];
 21 |     if (proxy) {
 22 |         var proxyRouter = proxy.split(':');
 23 |         var __host = proxyRouter[0];
 24 |         var __port = proxyRouter[1];
 25 |         var __path = url;
 26 |     } else {
 27 |         var __host = urlobj['hostname'];
 28 |         var __port = urlobj['port'];
 29 |         var __path = urlobj['path'];
 30 |     }
 31 |     var startTime = new Date();
 32 |     var options = {
 33 |         'host': __host,
 34 |         'port': __port,
 35 |         'path': __path,
 36 |         'method': 'GET',
 37 |         'headers': {
 38 |             "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/60.0.3112.113 Chrome/60.0.3112.113 Safari/537.36",
 39 |             "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8",
 40 |             // "Accept-Encoding": "gzip,deflate,sdch",
 41 |             "Accept-Encoding": "gzip",
 42 |             "Accept-Language": "zh-CN,zh;q=0.8,en-US;q=0.6,en;q=0.4"
 43 |         }
 44 |     };
 45 | 
 46 |     if (cookie) {
 47 |         var cookie_kvarray = [];
 48 |         for (var i = 0; i < cookie.length; i++) {
 49 |             cookie_kvarray.push(cookie[i]['name'] + '=' + cookie[i]['value']);
 50 |         }
 51 |         var cookies_str = cookie_kvarray.join(';');
 52 |         if (cookies_str.length > 0) options['headers']['Cookie'] = cookies_str;
 53 |     }
 54 | 
 55 |     if (referer) options['headers']['Referer'] = referer;
 56 | 
 57 |     var req = http.request(options, function(res) {
 58 |         if (res.statusCode == 301 || res.statusCode == 302) {
 59 |             if (res.headers['location']) {
 60 |                 callbackCount = 1;
 61 |                 req.abort();
 62 |                 req.destroy();
 63 |                 if (timeOuter) {
 64 |                     clearTimeout(timeOuter);
 65 |                     timeOuter = false;
 66 |                 }
 67 |                 return request(res.headers['location'], referer, cookie, proxy, timeout, isbin, callback, param);
 68 |             }
 69 |         } else {
 70 |             var bufferHelper = new BufferHelper();
 71 | 
 72 |             // res.setEncoding('utf8');
 73 | 
 74 |             res.on('data', function(chunk) {
 75 |                 bufferHelper.concat(chunk);
 76 |             });
 77 | 
 78 |             res.on('end', function() {
 79 |                 //console.log('Response end, '+url+' use proxy: '+proxy);
 80 |                 if (timeOuter) {
 81 |                     clearTimeout(timeOuter);
 82 |                     timeOuter = false;
 83 |                 }
 84 |                 if (!req) return callback(new Error('time out'), 504, null, null, param || callbackCount++);
 85 |                 req = null;
 86 | 
 87 |                 var res_encoding = res.headers['content-encoding'];
 88 |                 if (res_encoding == 'gzip' && typeof unzip != 'undefined') {
 89 |                     unzip(bufferHelper.toBuffer(), function(err, buff) {
 90 |                         if (!err && buff) {
 91 |                             var page_encoding = get_page_encoding(res.headers, buff);
 92 |                             page_encoding = page_encoding.toLowerCase().replace('\-', '');
 93 |                             if (isbin) {
 94 |                                 if (callbackCount < 1) callback(null, res.statusCode, buff, page_encoding, param || callbackCount++);
 95 |                             } else {
 96 |                                 if (callbackCount < 1) callback(null, res.statusCode, iconv.decode(buff, page_encoding), page_encoding, param || callbackCount++);
 97 |                             }
 98 |                         } else { if (callbackCount < 1) callback(new Error('gzip no content ' + err), res.statusCode, null, page_encoding, param || callbackCount++); }
 99 |                     });
100 |                 } else if (res_encoding == 'deflate' && typeof inflate != 'undefined') {
101 |                     inflate(bufferHelper.toBuffer(), function(err, buff) {
102 |                         if (!err && buff) {
103 |                             var page_encoding = get_page_encoding(res.headers, buff);
104 |                             page_encoding = page_encoding.toLowerCase().replace('\-', '');
105 |                             if (isbin) { if (callbackCount < 1) callback(null, res.statusCode, buff, page_encoding, param || callbackCount++); } else { if (callbackCount < 1) callback(null, res.statusCode, iconv.decode(buff, page_encoding), page_encoding, param || callbackCount++); }
106 |                         } else { if (callbackCount < 1) callback(new Error('deflate no content ' + err), res.statusCode, null, page_encoding, param || callbackCount++); }
107 |                     });
108 |                 } else {
109 |                     var page_encoding = get_page_encoding(res.headers, bufferHelper.toBuffer());
110 |                     page_encoding = page_encoding.toLowerCase().replace('\-', '');
111 |                     if (isbin) { if (callbackCount < 1) callback(null, res.statusCode, bufferHelper.toBuffer(), page_encoding, param || callbackCount++); } else { if (callbackCount < 1) callback(null, res.statusCode, iconv.decode(bufferHelper.toBuffer(), page_encoding), page_encoding, param || callbackCount++); }
112 |                 }
113 |             });
114 |         }
115 |     });
116 | 
117 |     timeOuter = setTimeout(function() {
118 |         if (timeOuter) {
119 |             clearTimeout(timeOuter);
120 |             timeOuter = false;
121 |         }
122 |         if (req) {
123 |             console.error('download timeout, ' + url + ', cost: ' + ((new Date()) - startTime) + 'ms ');
124 |             req.abort(); //req.destroy();
125 |             req = null;
126 |             if (callbackCount < 1) callback(new Error('time out'), 504, null, null, param || callbackCount++);
127 |         }
128 |     }, (timeout || 30) * 1000);
129 | 
130 | 
131 |     req.on('error', function(e) {
132 |         //console.error('problem with request: ' + e.message+', url:'+url);
133 |         if (timeOuter) {
134 |             clearTimeout(timeOuter);
135 |             timeOuter = false;
136 |         }
137 |         if (req) {
138 |             req.abort(); //req.destroy();
139 |             req = null;
140 |             if (callbackCount < 1) callback(new Error('request error'), 500, null, null, param || callbackCount++);
141 |         }
142 |     });
143 |     req.end();
144 | }
145 | 
146 | var get_page_encoding = function(header, buff) {
147 |     var page_encoding = 'utf-8';
148 |     //get the encoding from header
149 |     if (header['content-type'] != undefined) {
150 |         var contentType = header['content-type'];
151 |         var patt = new RegExp("^.*?charset\=(.+)$", "ig");
152 |         var mts = patt.exec(contentType);
153 |         if (mts != null) {
154 |             page_encoding = mts[1];
155 |         } else if (buff) {
156 |             var decoded_body = iconv.decode(buff, 'utf-8');
157 |             var m = /<meta.*?charset\s?=\"?([\w\d-]+)[^>]+>/ig.exec(decoded_body);
158 |             if (m && m.length > 0) {
159 |                 var ecode_from_page = m[1];
160 |                 page_encoding = ecode_from_page;
161 |             }
162 |         }
163 |     }
164 |     return page_encoding;
165 | }
166 | 
167 | exports.request = request;
168 | exports.get = function(url, callback) {
169 |     request(url, null, null, null, 10, false, (err, status_code, content, page_encoding, param) => {
170 |         callback(err, content);
171 |     });
172 | }


--------------------------------------------------------------------------------
/lib/isummary.js:
--------------------------------------------------------------------------------
  1 | const fs = require('fs');
  2 | const path = require('path');
  3 | const brain = require('brain.js');
  4 | const nodejieba = require("nodejieba");
  5 | const defaultModelPath = path.resolve(__dirname, 'data/summary.json');
  6 | 
  7 | const natures = ['', 'a', 'ad', 'ag', 'an', 'b', 'c', 'd', 'df', 'dg', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'mg', 'mq', 'n', 'ng', 'nr', 'nrfg', 'nrt', 'ns', 'nt', 'nz', 'o', 'p', 'q', 'r', 'rg', 'rr', 'rz', 's', 't', 'tg', 'u', 'ud', 'ug', 'uj', 'ul', 'uv', 'uz', 'v', 'vd', 'vg', 'vi', 'vn', 'vq', 'x', 'y', 'z', 'zg', 'eng']
  8 | const feature_size = 500;
  9 | 
 10 | var net, loaded = false;
 11 | 
 12 | /**
 13 |  * init brain net
 14 |  * @return {[type]} [description]
 15 |  */
 16 | const initNet = () => {
 17 |     net = new brain.NeuralNetwork({
 18 |         hiddenLayers: [200,100,50,25,5]//[200, 100, 50, 25, 12, 6]
 19 |     });
 20 |     // net = new brain.NeuralNetwork();
 21 | }
 22 | 
 23 | /**
 24 |  * reload net from json
 25 |  * @param  {[type]} json [description]
 26 |  * @return {[type]}      [description]
 27 |  */
 28 | const reloadModel = (json) => {
 29 |     initNet();
 30 |     net.fromJSON(JSON.parse(fs.readFileSync(defaultModelPath, 'utf8')));
 31 | }
 32 | 
 33 | /**
 34 |  * generate reature for a line
 35 |  * @param  {[type]} p [description]
 36 |  * @return {[type]}   [n,n...]
 37 |  */
 38 | const generateFeature = (p) => {
 39 |     let arr = new Array(feature_size).fill(0);
 40 |     nodejieba.tag(p).forEach((word, index) => {
 41 |         if (index < feature_size) arr[index] = natures.indexOf(word['tag']);
 42 |     });
 43 |     return arr;
 44 | }
 45 | 
 46 | /**
 47 |  * generate features for a text(multiple lines)
 48 |  * @param  {[type]} lines [description]
 49 |  * @param  {[type]} value [description]
 50 |  * @return {[type]}       [{'input':[n,n...],'output':[v]}]
 51 |  */
 52 | const generateLinesFeature = (lines, value) => {
 53 |     return lines.map(line => {
 54 |         return {
 55 |             'input': generateFeature(line),
 56 |             'output': [value]
 57 |         };
 58 |     });
 59 | }
 60 | 
 61 | /**
 62 |  * rank summarization score
 63 |  * @param  {[type]} p [description]
 64 |  * @return {[int]}   score
 65 |  */
 66 | const rank = (p) => {
 67 |     if (!loaded) {
 68 |         reloadModel();
 69 |         loaded = true;
 70 |     }
 71 |     return net.run(generateFeature(p))[0]
 72 | }
 73 | 
 74 | /**
 75 |  * train model
 76 |  * @param  {[type]} features [description]
 77 |  * @return {[type]}          [description]
 78 |  */
 79 | const train = (features) => {
 80 |     let start = new Date().getTime();
 81 |     net.train(features, {
 82 |         errorThresh: 0.0005, // error threshold to reach
 83 |         iterations: 20000, // maximum training iterations
 84 |         log: true, // console.log() progress periodically
 85 |         logPeriod: 10, // number of iterations between logging
 86 |         learningRate: 0.03 // learning rate
 87 |     });
 88 |     let model_json = net.toJSON();
 89 |     fs.writeFile(defaultModelPath, JSON.stringify(model_json), (err) => {
 90 |         if (err) console.error(err);
 91 |         else console.log('model dump to file, cost ' + (new Date().getTime() - start) + ' ms');
 92 |     });
 93 | }
 94 | 
 95 | initNet();
 96 | 
 97 | if (module.parent) {
 98 |     module.exports = {
 99 |         'rank': rank,
100 |         'train': train,
101 |         'generateLinesFeature': generateLinesFeature
102 |     }
103 | } else {
104 |     console.log(rank('第三方机构网贷之家公布数据：截至2015年底，全年网贷成交量达到了9823.04亿元，比2014年全年成交量增长了288.57%。'));
105 | }


--------------------------------------------------------------------------------
/lib/levenshtein.js:
--------------------------------------------------------------------------------
  1 | (function() {
  2 |   'use strict';
  3 | 
  4 |   /**
  5 |    * Extend an Object with another Object's properties.
  6 |    *
  7 |    * The source objects are specified as additional arguments.
  8 |    *
  9 |    * @param dst Object the object to extend.
 10 |    *
 11 |    * @return Object the final object.
 12 |    */
 13 |   var _extend = function(dst) {
 14 |     var sources = Array.prototype.slice.call(arguments, 1);
 15 |     for (var i=0; i<sources.length; ++i) {
 16 |       var src = sources[i];
 17 |       for (var p in src) {
 18 |         if (src.hasOwnProperty(p)) dst[p] = src[p];
 19 |       }
 20 |     }
 21 |     return dst;
 22 |   };
 23 | 
 24 | 
 25 |   /**
 26 |    * Defer execution of given function.
 27 |    * @param  {Function} func
 28 |    */
 29 |   var _defer = function(func) {
 30 |     if (typeof setImmediate === 'function') {
 31 |       return setImmediate(func);
 32 |     } else {
 33 |       return setTimeout(func, 0);
 34 |     }
 35 |   };
 36 | 
 37 |   /**
 38 |    * Based on the algorithm at http://en.wikipedia.org/wiki/Levenshtein_distance.
 39 |    */
 40 |   var Levenshtein = {
 41 |     /**
 42 |      * Calculate levenshtein distance of the two strings.
 43 |      *
 44 |      * @param str1 String the first string.
 45 |      * @param str2 String the second string.
 46 |      * @return Integer the levenshtein distance (0 and above).
 47 |      */
 48 |     get: function(str1, str2) {
 49 |       // base cases
 50 |       if (str1 === str2) return 0;
 51 |       if (str1.length === 0) return str2.length;
 52 |       if (str2.length === 0) return str1.length;
 53 | 
 54 |       // two rows
 55 |       var prevRow  = new Array(str2.length + 1),
 56 |           curCol, nextCol, i, j, tmp;
 57 | 
 58 |       // initialise previous row
 59 |       for (i=0; i<prevRow.length; ++i) {
 60 |         prevRow[i] = i;
 61 |       }
 62 | 
 63 |       // calculate current row distance from previous row
 64 |       for (i=0; i<str1.length; ++i) {
 65 |         nextCol = i + 1;
 66 | 
 67 |         for (j=0; j<str2.length; ++j) {
 68 |           curCol = nextCol;
 69 | 
 70 |           // substution
 71 |           nextCol = prevRow[j] + ( (str1[i] === str2[j]) ? 0 : 1 );
 72 |           // insertion
 73 |           tmp = curCol + 1;
 74 |           if (nextCol > tmp) {
 75 |             nextCol = tmp;
 76 |           }
 77 |           // deletion
 78 |           tmp = prevRow[j + 1] + 1;
 79 |           if (nextCol > tmp) {
 80 |             nextCol = tmp;
 81 |           }
 82 | 
 83 |           // copy current col value into previous (in preparation for next iteration)
 84 |           prevRow[j] = curCol;
 85 |         }
 86 | 
 87 |         // copy last col value into previous (in preparation for next iteration)
 88 |         prevRow[j] = nextCol;
 89 |       }
 90 | 
 91 |       return nextCol;
 92 |     },
 93 | 
 94 |     /**
 95 |      * Asynchronously calculate levenshtein distance of the two strings.
 96 |      *
 97 |      * @param str1 String the first string.
 98 |      * @param str2 String the second string.
 99 |      * @param cb Function callback function with signature: function(Error err, int distance)
100 |      * @param [options] Object additional options.
101 |      * @param [options.progress] Function progress callback with signature: function(percentComplete)
102 |      */
103 |     getAsync: function(str1, str2, cb, options) {
104 |       options = _extend({}, {
105 |         progress: null
106 |       }, options);
107 | 
108 |       // base cases
109 |       if (str1 === str2) return cb(null, 0);
110 |       if (str1.length === 0) return cb(null, str2.length);
111 |       if (str2.length === 0) return cb(null, str1.length);
112 | 
113 |       // two rows
114 |       var prevRow  = new Array(str2.length + 1),
115 |           curCol, nextCol,
116 |           i, j, tmp,
117 |           startTime, currentTime;
118 | 
119 |       // initialise previous row
120 |       for (i=0; i<prevRow.length; ++i) {
121 |         prevRow[i] = i;
122 |       }
123 | 
124 |       nextCol = 1;
125 |       i = 0;
126 |       j = -1;
127 | 
128 |       var __calculate = function() {
129 |         // reset timer
130 |         startTime = new Date().valueOf();
131 |         currentTime = startTime;
132 | 
133 |         // keep going until one second has elapsed
134 |         while (currentTime - startTime < 1000) {
135 |           // reached end of current row?
136 |           if (str2.length <= (++j)) {
137 |             // copy current into previous (in preparation for next iteration)
138 |             prevRow[j] = nextCol;
139 | 
140 |             // if already done all chars
141 |             if (str1.length <= (++i)) {
142 |               return cb(null, nextCol);
143 |             }
144 |             // else if we have more left to do
145 |             else {
146 |               nextCol = i + 1;
147 |               j = 0;
148 |             }
149 |           }
150 | 
151 |           // calculation
152 |           curCol = nextCol;
153 | 
154 |           // substution
155 |           nextCol = prevRow[j] + ( (str1.charAt(i) === str2.charAt(j)) ? 0 : 1 );
156 |           // insertion
157 |           tmp = curCol + 1;
158 |           if (nextCol > tmp) {
159 |             nextCol = tmp;
160 |           }
161 |           // deletion
162 |           tmp = prevRow[j + 1] + 1;
163 |           if (nextCol > tmp) {
164 |             nextCol = tmp;
165 |           }
166 | 
167 |           // copy current into previous (in preparation for next iteration)
168 |           prevRow[j] = curCol;
169 | 
170 |           // get current time
171 |           currentTime = new Date().valueOf();
172 |         }
173 | 
174 |         // send a progress update?
175 |         if (null !== options.progress) {
176 |           try {
177 |             options.progress.call(null, (i * 100.0/ str1.length));
178 |           } catch (err) {
179 |             return cb('Progress callback: ' + err.toString());
180 |           }
181 |         }
182 | 
183 |         // next iteration
184 |         _defer(__calculate);
185 |       };
186 | 
187 |       __calculate();
188 |     }
189 | 
190 |   };
191 | 
192 |   // amd
193 |   if (typeof define !== "undefined" && define !== null && define.amd) {
194 |     define(function() {
195 |       return Levenshtein;
196 |     });
197 |   }
198 |   // commonjs
199 |   else if (typeof module !== "undefined" && module !== null) {
200 |     module.exports = Levenshtein;
201 |   }
202 |   // web worker
203 |   else if (typeof self !== "undefined" && typeof self.postMessage === 'function' && typeof self.importScripts === 'function') {
204 |     self.Levenshtein = Levenshtein;
205 |   }
206 |   // browser main thread
207 |   else if (typeof window !== "undefined" && window !== null) {
208 |     window.Levenshtein = Levenshtein;
209 |   }
210 | }());
211 | 


--------------------------------------------------------------------------------
/lib/node-summary.js:
--------------------------------------------------------------------------------
  1 | 'use strict'
  2 | var levenshtein = require('./levenshtein.js');
  3 | var nodejieba = require("nodejieba");
  4 | var pagerank = require('./pagerank.js');
  5 | var isummary = require('./isummary.js');
  6 | var stringSimilarity = require('string-similarity');
  7 | 
  8 | const summary_clear_rules = [
  9 | 	[/^编者按：/,''],
 10 | 	[/^[^，日天前]{1,4}，/,''],
 11 | 	[/^“/,''],
 12 | 	[/^其该此而[^，]{1,10}，/,''],
 13 | 	[/^[并且至于而]+/,'']
 14 | ]
 15 | 
 16 | class Summarizer{
 17 | 	constructor(shingle,filter){
 18 | 		this.shingle = shingle;
 19 | 		this.filter = filter;
 20 | 	}
 21 | 
 22 | 	splitToParagraphs(content){
 23 | 		return content.split('\n\n');
 24 | 	}
 25 | 
 26 | 	splitToSentences(content){
 27 | 		return content.split(/(?:\n|\u3002|\uff1f|\uff01)/g);
 28 | 	}
 29 | 
 30 | 	splitToTerms(content){
 31 | 		let self = this;
 32 | 		let terms = [];
 33 | 		let ps = Array.isArray(content)?content:self.splitToParagraphs(content);
 34 | 		for(let x of ps){
 35 | 			let sens = self.splitToSentences(x);
 36 | 			let parag = [];
 37 | 			for(let y of sens){
 38 | 				let sentens = [];
 39 | 				for(let z of nodejieba.cut(y.trim()))sentens.push(z);
 40 | 			    if(sentens.length>0){
 41 | 			    	if(sentens[sentens.length-1]!='。')sentens.push('。');
 42 | 			    	parag.push(sentens);
 43 | 			    }
 44 | 			}
 45 | 			if(parag.length>0)terms.push(parag);
 46 | 		}
 47 | 		return terms;
 48 | 	}
 49 | 
 50 | 	splitToWords(content){
 51 | 		return nodejieba.cut(content);
 52 | 	}
 53 | 
 54 | 	getSimilarityGraph(sentences){
 55 | 		var graph = new Array();
 56 | 	    for(let s of sentences) {
 57 | 	      let sentenceSimilarity = new Array();
 58 | 	      for(let t of sentences) {
 59 | 	        sentenceSimilarity.push(levenshtein.get(s, t));
 60 | 	      }
 61 | 	      graph.push(sentenceSimilarity);
 62 | 	    }
 63 | 	    return graph;
 64 | 	}
 65 | 
 66 | 	getTextRank(graph){
 67 | 		return pagerank.Pagerank(graph, 0.85, 0.0001, function (err, res) {
 68 | 	      if (err) throw new Error(err)
 69 | 	    });
 70 | 	}
 71 | 
 72 | 	isValidateSentence(charArr){
 73 | 		if(!charArr)return false;
 74 | 		let slen=0,dlen = 0;  
 75 | 	    for (let i=0; i<charArr.length; i++) {  
 76 | 		     let c = charArr[i].charCodeAt();   
 77 | 		     if ((c >= 0x0001 && c <= 0x007e) || (0xff60<=c && c<=0xff9f)) {   
 78 | 		       	slen++;
 79 | 		     }else {
 80 | 		      	dlen++;   
 81 | 		     }   
 82 | 	    }
 83 | 	    if(slen > dlen)return false;
 84 | 	    let ok = true;
 85 | 	    if(this.filter){
 86 | 	    	let sentense = charArr.join('');
 87 | 	    	for(let rule of this.filter){
 88 | 	    		if(new RegExp(rule,'ig').test(sentense)){
 89 | 	    			ok = false;
 90 | 	    			break;
 91 | 	    		}
 92 | 	    	}
 93 | 	    }
 94 | 	    return ok;
 95 | 	}
 96 | 
 97 | 	score(sentence_rank, model_score, title_similarity, len_score){
 98 | 		// return Math.pow(sentence_rank, 0.35) * Math.pow(model_score, 0.35) * Math.pow(title_similarity, 0.1) * Math.pow(len_score, 0.2);
 99 | 		// return Math.pow(sentence_rank, 10) * Math.pow(model_score, 10)
100 | 		// console.log(sentence_rank, model_score, title_similarity, len_score);
101 | 		// return Math.pow(sentence_rank, 10) * Math.pow(Math.min(model_score, 0.7), 10) * Math.pow(title_similarity, 1) * Math.pow(len_score, 1);
102 | 		// let final_score = Math.ceil(sentence_rank* 1000)*100000 + Math.ceil(len_score*1000)*100 + Math.ceil(model_score*100) + Math.ceil(title_similarity * 10);
103 | 		let final_score = sentence_rank * 0.5 + len_score*0.2 + model_score*0.2 + title_similarity * 0.1;
104 | 		// console.log("score=>",final_score);
105 | 		return final_score
106 | 	}
107 | 
108 | 	summarize(content, expected_length, title){
109 | 	    let terms = this.splitToTerms(content);
110 | 	    let cursor = 0;
111 | 	    let sentences = [];
112 | 	    let spaces_title = title ? nodejieba.cut(title.trim()).join(' ') : [];
113 | 	    for(let x = 0;x<terms.length;x++){
114 | 	    	for(let y = 0;y<terms[x].length;y++){
115 | 	    		if(this.shingle){
116 | 	    			let sentence = [];
117 | 		    		let cu_size = 0;
118 | 		    		let max_covered = 0;
119 | 		    		for(let z=y;z<terms[x].length;z++){
120 | 		    			cu_size += terms[x][z].length;
121 | 		    			if(z>y && cu_size>expected_length*1)break;
122 | 		    			else {sentence = sentence.concat(terms[x][z]);}
123 | 		    			max_covered = z;
124 | 		    		}
125 | 		    		sentences.push(sentence);
126 | 		    		if(max_covered >= terms[x].length-1)break;
127 | 	    		}else sentences.push(terms[x][y]);
128 | 	    	}
129 | 	    }
130 | 
131 | 
132 | 	    let similarityGraph = this.getSimilarityGraph(sentences);
133 | 	    let textRank = this.getTextRank(similarityGraph).probabilityNodes;
134 | 	    
135 | 	    let copied_rank = [];
136 | 	    let len_arr = sentences.map(_=>_.length);
137 | 	    let max_len = Math.max(...len_arr);
138 | 	    for(let i=0;i<textRank.length;i++){
139 | 	    	let origin_setence = sentences[i].join('');
140 | 	    	let spaces_setence = sentences[i].join(' ');
141 | 	    	let title_similarity = spaces_title.length>0 ? stringSimilarity.compareTwoStrings(spaces_title, spaces_setence) : 0.1;
142 | 	    	let len_score = sentences[i].length * 1.0 / max_len;
143 | 	    	let score = this.score(textRank[i], isummary.rank(origin_setence), title_similarity, len_score)
144 | 	    	copied_rank.push([score, i]);
145 | 	    }
146 | 	    copied_rank.sort((a,b)=> b[0] - a[0]);
147 | 
148 | 	    let selectIndex = [];
149 | 	    let summary_size = 0;
150 | 	    let forb_rules = [];
151 | 	    for(let i=0;i<copied_rank.length;i++){
152 | 	    	let ordinal = copied_rank[i][1];
153 | 	    	if(this.isValidateSentence(sentences[ordinal])){
154 | 	    		summary_size += sentences[ordinal].length;
155 | 		    	if(selectIndex.length>0){
156 | 		    		if(summary_size>expected_length*1)break;
157 | 		    		else selectIndex.push(ordinal);
158 | 		    	}else selectIndex.push(ordinal);
159 | 	    	}
160 | 	    }
161 | 	    selectIndex.sort(function(a, b) {
162 | 		  return a - b;
163 | 		});
164 | 	    let selectSentences = [];
165 | 	    for(let i of selectIndex)selectSentences.push(sentences[i].join(''));
166 | 	 	let f_ret = selectSentences.join('...');
167 | 	 	for(let r of summary_clear_rules){
168 | 	 		f_ret = f_ret.replace(...r);
169 | 	 	}
170 | 	    return f_ret;
171 | 	}
172 | }
173 | 
174 | module.exports = Summarizer;
175 | 
176 | /*
177 | let summarizer = new Summarizer(true);
178 | 
179 | var content  = '一线楼市“调控风”来袭\n\n去年以来深圳、上海房价上涨迅速，除了流动性相对宽裕、供应量下降及3·30新政等因素外，“首付贷”等操作也助涨市场。相关部门嗅到了其中被放大的购房杠杆风险。3月25日，上海发布《关于进一步完善本市住房市场体系和保障体系促进房地产市场平稳健康发展的若干意见》（下称“沪九条”），非沪籍限购“2改5”确定，上海二套房首付比例提高。当晚，深圳也发布新政，提高限购门槛和二套房首付比例。这标志着一线城市房地产调控的再次收紧。而除了一线城市的上海和深圳，重点二线城市中的武汉和南京也已出台楼市新政。\n\n本报记者张晓玲何苗实习记者杨悦祺上海、深圳报道\n\n纵观一线城市的调控政策，核心其实就是限购和限贷两条。随着沪深两地明里暗里的调控，同为一线城市的北京和广州风声渐紧。从非户籍人口购房需缴纳的社保年限来看，北京和上海需要连续缴纳5年及以上，但上海还要求必须是“家庭购房”，即已婚，单身人士被排除在外。这一条，比北京更严。\n\n彻夜未眠！\n\n从下午6点开始，在中介的签约室排队等合同网签，直到晚上11点才签上，中间网签系统“瘫痪一次”，对于上海的年轻购房者陈嘉来说，3月24日是“战斗般”的一天。\n\n与陈嘉一样战斗的，还有上海郊环线外的房产中介们。经纪人徐伟在当晚零点才拖着疲惫的身躯回家，但在后半夜，他仍不断接到客户的电话，整夜未眠。\n\n3月25日一早，上海即出台“沪九条”，大幅提高了购房资格和首付比例。赶在新政前买房的人们，心中不知是喜是忧？\n\n自2014年央行9·30新政以来，一年半时间内，一线城市受惠于信贷宽松和首付下调，房价出现了大幅飙升，尤其是深圳和上海，其中更出现了裹挟着互联网金融的“首付贷”，再次放大了购房杠杆，刺激了投资投机需求大量入市。\n\n相关部门嗅到了其中的风险。实际上，在上海此次新政之前，一线城市的“降杠杆”行动已在进行。业内预计接下来，北京甚至房价温和的广州，相关政策都会有所调整。\n\n上海成调控最严城市\n\n3月25日，上海发布《关于进一步完善本市住房市场体系和保障体系促进房地产市场平稳健康发展的若干意见》（下称“沪九条”）。\n\n核心调控政策主要集中于前两条：一是从严执行住房限购政策。非沪籍居民购房缴纳社保从2年调整为连续缴满5年及以上；二是对拥有1套住房的居民家庭，再次申请商业个贷的首付款比例不低于50%；购买非普通住房的，首付款比例不低于70%。\n\n这是对需求端的调控。而在开发商端，此前上海已通过收紧高端楼盘预售许可等措施来进行调控。\n\n这标志着，继深圳、北京打击“首付贷”之后，一线城市房地产调控的再次收紧。政策出台与上海市场表现紧密相关。\n\n同策咨询研究部数据显示，2016年1-2月上海商品住宅成交面积分别为134万平方米、79万平方米，截至3月21日，3月份上海商品住宅成交量已高达136万平方米，预计3月上海商品住宅成交量会突破230万平方米。\n\n按照这样的预估值来计算，2016年一季度上海商品住宅成交量将超过440万平方米，这是前所未有的。且在新房和二手房价格的涨幅上，上海越来越有“冠军相”。\n\n新城控股(14.230,0.05,0.35%)副总裁欧阳捷表示，上海房价疯涨主要是因为三个因素，供求矛盾、货币廉价和投资避险，这三个因素有的是上海市政府能够控制的，有些是控制不了的。\n\n“上海只能在供求矛盾上去下功夫，想办法增加供应，比如在土地出让合同中增加中小套型的供应比例，或适当提高容积率；而在需求端，控制需求是一直以来调控的主要思路，此次政策最主要的落点也就在于控制需求方面”，欧阳捷说。\n\n上海官方亦表示，今年的土地管理中，会加大土地的供应，确保“十三五”供地总量不会低于“十二五”，而且会有所增加。2016年的商品房土地供应量比2015年提高169公顷。不过，产生的效果可能在明年或者后年才能显现。\n\n同策咨询研究部总监张宏伟预计，从历次上海楼市调控政策面从严开始的月份计算，大约7个月左右时间上海楼市的成交量将跌入低谷期，从这个时间点来判断，10月份将是此次新政后上海楼市成交量跌入低谷期的时间段；10月份为了激活市场成交量，或者部分房企因为资金面的问题，上海楼市可能会出现开发商以价换量的局面。\n\n一线城市集体去杠杆\n\n纵观一线城市的调控政策，核心其实就是限购和限贷两条。\n\n随着沪深两地明里暗里的调控，同为一线城市的北京和广州风声渐紧。\n\n从非户籍人口购房需缴纳的社保年限来看，北京和上海需要连续缴纳5年及以上，但上海还要求必须是“家庭购房”，即已婚，单身人士被排除在外。这一条，比北京更严。\n\n广州则要求符合5年内在本市连续缴纳3年以上个人所得税或社会保险，深圳目前只需缴纳1年社保，在四大城市里是最宽松的。\n\n3月25日晚，深圳新政突袭出台，大幅提高了购房门槛：本市户籍居民家庭限购2套住房；非本市户籍能提供3年及以上个税或社保证明的，限购1套住房。\n\n此外，从二套房首付比例来看，根据330新政，四个一线城市申请首套房商业贷款首付款比例不低于30%，二套房商业贷款首付比不低于40%。\n\n但在执行层面，四个城市表现不一。融360本月初的报告显示，广州对二套房的限制最严格，首付达到7成，上海对二套房购房者最为宽松，四五成首付为主，北京的首付比例以五六成为主，深圳是六七成为主。\n\n记者从北京中介机构伟嘉安捷了解到，北京地区除兴业银行(15.520,0.05,0.32%)和中信银行(6.000,0.02,0.33%)两家的“二套房”首付比例为60%，其他各银行的二套房首付比例均为50%；另据融360消息，有极个别银行可以做到40%。\n\n融360房贷分析师胡飞船表示，广州首付比例一直严格控制，这也是2015年广州楼市价格变动幅度较小的主要原因。但对于北上深，较低的首付则再次刺激了投资客的大幅增加。\n\n而此次上海调整后，二套房商业贷款购买普通住房的首付比例加到了50%，购买非普通自住房的，首付款比例要求不低于70%。\n\n尽管在多数业内人士看来，北京和广州跟进收紧调控的余地并不太大，但上海这条二套房首付提高、收紧的政策，很大可能会被其他城市效仿写进文件。\n\n而在深圳的新政中，也提高了二套房的首付比例，对购房人家庭名下在本市无房但近2年内有住房贷款记录的或在本市已有一套住房但已结清相应住房贷款的，贷款首付比例执行最低4成。\n\n这被业内人士视为一线城市调控正在向3·30新政甚至9·30新政之前的回归。对从未取消限购的一线城市而言，2014年的9·30新政核心是放宽首套房认定，已有一套房结清贷款依然可认定为首套房，从而降低了首付比例；而2015年的3·30新政进一步放宽二套房贷款，二套房商业贷款从此前的7成首付降低为4成首付。\n\n至此，一年半时间内，二套房首付比例从7成到4成再到5成，一线城市经历了从加杠杆到降杠杆的过程。“在实际执行中，几个大城市很多项目银行都要求二套房首付7成了。”一位大型开发商内部人士说。\n\n狙击投机防范风险\n\n从上海和深圳各个政府部门的表态来看，收紧楼市调控，在于看到其中的投机需求、非理性需求太多了。\n\n“我们要控制一些过早释放的需求。因此无论贷款是否结清都视同第二套房”，在“沪九条”出台后，央行上海总部调查统计研究部主任王振营如此解释。\n\n2015年下半年以来上海楼市的火爆行情中，价格推涨带来的恐慌性入市也占了一定比例，在上海市住建委主任顾金山看来，这是提前透支了一部分需求。同时，市场上房东毁约、跳价的现象频现，“确实是非理性上涨”，他说。\n\n3月2日，深圳市金融办下发“防范房地产行业金融风险”的函件，要求相关单位对P2P、小贷公司涉及众筹买房、“首付贷”或其他涉及高杠杆放贷的情况进行摸底排查。\n\n18日，深圳市互联网金融协会发出通知，要求相关企业严禁新开展“众筹炒楼”业务，对于存量业务，立即停止募集并清理。\n\n一份深圳房产经纪行业协会名为《深圳房价飙升的动因分析》的分析报告显示，2015年的深圳楼市，能借助的金融工具多了，因此看上去可以支付的总价更高了，但这里隐含了金融泡沫的魅影。';
180 | 
181 | var k = summarizer.summarize(content, 200, '一线楼市“调控风”来袭');
182 | console.dir(k);
183 | */


--------------------------------------------------------------------------------
/lib/pagerank.js:
--------------------------------------------------------------------------------
  1 | "use strict";
  2 | // pagerank.js 0.0.1
  3 | 
  4 | //Use a random surfer algorithm to determine the relative 
  5 | //rank of nodes. The importance of each node is determined
  6 | //by the number of incoming links as well as the importance 
  7 | //of those incoming links. 
  8 | 
  9 | // Expose
 10 | // ----------
 11 | 
 12 | //Expose our library to be called externally
 13 | // module.exports = function (nodeMatrix, linkProb, tolerance, callback, debug) {
 14 | //     if (!nodeMatrix || !linkProb || !tolerance || !callback) {
 15 | //         throw new Error("Provide 4 arguments: "+
 16 | //             "nodeMatrix, link probability, tolerance, callback");
 17 | //     }
 18 | //     //If debug is unset set it to false
 19 | //     if (!debug) { 
 20 | //         debug=false;
 21 | //     }
 22 | //     return new Pagerank(nodeMatrix, linkProb, tolerance, callback, debug);
 23 | // };
 24 | 
 25 | exports.Pagerank = function (nodeMatrix, linkProb, tolerance, callback, debug) {
 26 |     if (!nodeMatrix || !linkProb || !tolerance || !callback) {
 27 |         throw new Error("Provide 4 arguments: "+
 28 |             "nodeMatrix, link probability, tolerance, callback");
 29 |     }
 30 |     //If debug is unset set it to false
 31 |     if (!debug) { 
 32 |         debug=false;
 33 |     }
 34 |     return new Pagerank(nodeMatrix, linkProb, tolerance, callback, debug);
 35 | };
 36 | 
 37 | // Initialize
 38 | // ----------
 39 | function Pagerank(nodeMatrix, linkProb, tolerance, callback, debug) {
 40 |     //**OutgoingNodes:** represents an array of nodes. Each node in this 
 41 |     //array contains an array of nodes to which the corresponding node has
 42 |     //outgoing links.
 43 |     this.outgoingNodes = nodeMatrix;
 44 |     //**LinkProb:** a value ??
 45 |     this.linkProb = linkProb;
 46 |     //**Tolerance:** the point at which a solution is deemed optimal. 
 47 |     //Higher values are more accurate, lower values are faster to computer. 
 48 |     this.tolerance = tolerance;
 49 |     this.callback = callback;
 50 | 
 51 |     //Number of outgoing nodes
 52 |     this.pageCount = Object.keys(this.outgoingNodes).length;
 53 |     //**Coeff:** coefficient for the likelihood that a page will be visited.
 54 |     this.coeff = (1-linkProb)/this.pageCount;
 55 |     
 56 |     this.probabilityNodes = !(nodeMatrix instanceof Array) ? {} : [];
 57 |     this.incomingNodes = !(nodeMatrix instanceof Array) ? {} : [];
 58 |     this.debug=debug;
 59 |     
 60 |     this.startRanking();
 61 | }
 62 | 
 63 | //Start ranking 
 64 | // ----------
 65 | Pagerank.prototype.startRanking = function () {
 66 | 
 67 |     //we initialize all of our probabilities
 68 |     var initialProbability = 1/this.pageCount, 
 69 |         outgoingNodes = this.outgoingNodes, i, a, index;
 70 |     
 71 |     //rearray the graph and generate initial probability
 72 |     for (let i=0;i<outgoingNodes.length;i++) {
 73 |         this.probabilityNodes[i]=initialProbability;
 74 |         for (let a=0;a<outgoingNodes[i].length;a++) {
 75 |             index = outgoingNodes[i][a];
 76 |             if (!this.incomingNodes[index]) {
 77 |                 this.incomingNodes[index]=[]; 
 78 |             }
 79 |             this.incomingNodes[index].push(i);
 80 |         }
 81 |     }
 82 | 
 83 |     //if debug is set, print each iteration
 84 |     if (this.debug) this.reportDebug(1)
 85 |     
 86 |     this.iterate(1);
 87 | };
 88 | 
 89 | //Log iteration to console 
 90 | // ----------
 91 | Pagerank.prototype.reportDebug = function (count) {
 92 |     console.log("____ITERATION "+count+"____");
 93 |     console.log("Pages: " + Object.keys(this.outgoingNodes).length);
 94 |     console.log("outgoing %j", this.outgoingNodes);
 95 |     console.log("incoming %j",this.incomingNodes);
 96 |     console.log("probability %j",this.probabilityNodes);
 97 | };
 98 | 
 99 | 
100 | //Calculate new weights 
101 | // ----------
102 | Pagerank.prototype.iterate = function(count) {
103 |     var result = [];
104 |     var resultHash={};
105 |     var prob, ct, b, a, sum, res, max, min;
106 | 
107 |     //For each node, we look at the incoming edges and 
108 |     //the weight of the node connected via each edge. 
109 |     //This weight is divided by the total number of 
110 |     //outgoing edges from each weighted node and summed to 
111 |     //determine the new weight of the original node.
112 |     for (let b=0;b<this.probabilityNodes.length;b++) {
113 |         sum = 0;
114 |         if( this.incomingNodes[b] ) {
115 |             for (let a=0; a<this.incomingNodes[b].length; a++) {
116 |                 prob = this.probabilityNodes[ this.incomingNodes[b][a] ];
117 |                 ct = this.outgoingNodes[ this.incomingNodes[b][a] ].length;
118 |                 sum += (prob/ct) ;
119 |             }
120 |         }
121 | 
122 |         //determine if the new probability is within tolerance.
123 |         res = this.coeff+this.linkProb*sum;
124 |         max = this.probabilityNodes[b]+this.tolerance;
125 |         min = this.probabilityNodes[b]-this.tolerance;   
126 | 
127 |         //if the result has changed push that result
128 |         if (min <= res && res<= max) {
129 |             resultHash[b]=res;
130 |             result.push(res);
131 |         }
132 |     
133 |         //update the probability for node *b*
134 |         this.probabilityNodes[b]=res;
135 |     }
136 | 
137 |     //When we have all results (no weights are changing) we return via callback
138 |     if (result.length == this.pageCount) {
139 |         if( !(this.outgoingNodes instanceof Array)) {
140 |             return this.callback(null, resultHash);
141 |         }
142 |         return this.callback(null, result);
143 |     }
144 |     
145 |     //if debug is set, print each iteration
146 |     if (this.debug) {
147 |         this.reportDebug(count); 
148 |     }
149 |     
150 |     ++count;
151 |     return this.iterate(count);
152 | };


--------------------------------------------------------------------------------
/lib/sentiment.js:
--------------------------------------------------------------------------------
  1 | const nodejieba = require("nodejieba");
  2 | const D_U_protection = require('./data/D_U_protection.json');
  3 | var afinn = require('./data/AFINN-zh_cn.json');
  4 | const path = require('path');
  5 | 
  6 | 
  7 | nodejieba.load({
  8 |   userDict: path.resolve(__dirname,'data','user-words.txt'),
  9 | });
 10 | 
 11 | const tokenize = (input) =>{
 12 | 	var seg_i = nodejieba.cut(input);
 13 | 	var seg_o = [];
 14 | 	for (var i in seg_i)
 15 | 	{
 16 | 		var it = seg_i[i].replace(/[的得着了过]$/g, '');
 17 | 		if (i >= 1)
 18 | 		{
 19 | 			if(D_U_protection.indexOf(seg_i[i - 1] + seg_i[i]) != -1)
 20 | 			{
 21 | 				seg_o.pop();
 22 | 				seg_o.push(seg_i[i - 1] + seg_i[i]);
 23 | 			}
 24 | 		}
 25 | 		if(D_U_protection.indexOf(seg_i[i]) != -1)
 26 | 			seg_o.push(seg_i[i])
 27 | 		else if(it) seg_o.push(it);
 28 | 	}
 29 |     return seg_o;
 30 | }
 31 | 
 32 | const sentiment = (phrase, inject, callback) => {
 33 | 	// Parse arguments
 34 |     if (typeof phrase === 'undefined') phrase = '';
 35 |     if (typeof inject === 'undefined') inject = null;
 36 |     if (typeof inject === 'function') callback = inject;
 37 |     if (typeof callback === 'undefined') callback = null;
 38 | 
 39 |     // Merge
 40 |     if (inject !== null) {
 41 |     	afinn = Object.assign(afinn, inject);
 42 |     }
 43 | 
 44 |     // Storage objects
 45 |     var tokens      = tokenize(phrase),
 46 |         score       = 0,
 47 |         words       = [],
 48 |         positive    = [],
 49 |         negative    = [];
 50 | 
 51 |     // Iterate over tokens
 52 |     var len = tokens.length;
 53 |     while (len--) { 
 54 |         var obj = tokens[len];
 55 |         var item = afinn[obj];
 56 |         if (!afinn.hasOwnProperty(obj)) continue;
 57 | 
 58 |         words.push(obj);
 59 |         if (item > 0) positive.push(obj);
 60 |         if (item < 0) negative.push(obj);
 61 | 
 62 |         score += item;
 63 |     }
 64 | 
 65 |     // Handle optional async interface
 66 |     var result = {
 67 |         score:          score,
 68 |         comparative:    score / tokens.length,
 69 |         tokens:         tokens,
 70 |         words:          words,
 71 |         positive:       positive,
 72 |         negative:       negative
 73 |     };
 74 | 
 75 |     if (callback === null) return result;
 76 |     process.nextTick(function () {
 77 |         callback(null, result);
 78 |     });
 79 | } 
 80 | 
 81 | if(module.parent){
 82 | 	module.exports = sentiment;
 83 | }else{
 84 | 	// console.dir(sentiment('建国大业非常好看，今天过得太开心了！'));
 85 | 	// console.dir(sentiment('他妈的你不想活了？', {'妈的': -10}));
 86 | 	// 
 87 | 	let s = `相比中小散户的“盲打误撞”，同样出身于草根，但已浸淫市场多年、财富节节攀升的牛散们则有着各自的“赚钱之道”。
 88 | 
 89 | 　　除了精准独到的选股眼光外，市场中多年的摸爬滚打也令牛散们形成了不同的投资风格：有的无视题材、热点，坚定持有传统产业周期类个股，静待基本面转暖；有的则喜好市值相对较低的中小板、创业板个股，憧憬高成长预期；有的则执著押注基本面模糊、具有整合预期的股票，希冀潜伏收获暴利……
 90 | 
 91 | 　　那么，今年以来，在A股市场“重价值、轻题材、严监管”的整体环境氛围下，牛散们依照自身的投资逻辑究竟又取得了怎样的成绩？一些传统的投机套利方式是否已日渐失灵？
 92 | 
 93 | 　　徐开东：坚守“传统股”静待反转
 94 | 
 95 | 　　在国家大力推进供给侧改革的背景下，钢铁、化工等传统产业逐步走出低谷，而近年来一直以传统产业个股为投资重心的徐开东，也慢慢步入投资收获期。
 96 | 
 97 | 　　安阳钢铁(4.270, -0.06, -1.39%)前期披露的2017年半年报显示，牛散徐开东持股规模基本未变，以2428.83万股的持股数继续位列安阳钢铁第二大股东。
 98 | 
 99 | 　　记者注意到，徐开东大举建仓安阳钢铁始于2015年第三季度，此后安阳钢铁虽经历了长期的低迷走势，但徐开东始终坚定持有并不断增持。值得一提的是，随着钢铁行业景气度的回升、钢价的不断上涨，钢铁板块自7月份起迎来了一波“主升浪”，安阳钢铁同期股价涨幅一度超过80%，近期虽有回落，但即使以最新股价计算，徐开东此番对安阳钢铁的长期投资目前应已由亏转盈。
100 | 
101 | 　　除安阳钢铁外，在徐开东的长期持股名单中还包括青海华鼎(8.070, -0.11, -1.34%)、中煤能源(6.210, -0.03, -0.48%)、太钢不锈(5.080, -0.02, -0.39%)、东北电气(5.200, -0.05, -0.95%)（后两家尚未披露半年报）等个股，不难发现，上述标的皆为传统产业类个股，而徐开东始终对传统产业抱有信心，坚定持股，显然有其自身的投资逻辑。
102 | 
103 | 　　值得一提的是，近期因投资中国联通(8.360, -0.60, -6.70%)而“一战成名”的王素芳，在今年一季度也大举建仓了太钢不锈，与徐开东分列公司第三、第四大股东（2017年一季报），颇有共同作战的意味，这也显示出两人的投资风格颇为相近。
104 | 
105 | 　　周信钢：执著创业板亏多盈少
106 | 
107 | 　　在市场的牛散阵营中，有一批大户醉心于对中小市值股票的投资，也在过去几年间凭借着创业板市场的高景气度赚取了不菲收益。然而，随着A股投资氛围的转变，尤其是在今年投资者更加注重价值投资的背景下，以“上证50”为代表的绩优股涨势明显，而创业板个股则呈现普跌态势。在此背景下，以周信钢为代表的、执著于中小市值股票投资的牛散们今年的“收成”也并不如愿。
108 | 
109 | 　　根据上市公司目前所发半年报，周信钢截至6月末已进驻5家上市公司的十大流通股东序列，未出所料，其“上榜”公司均来自于创业板。鉴于上市公司半年报披露工作尚未完成，而若以一季报持股来计算，周信钢重点持有（进入十大流通股东）的10只股票也均是创业板公司。
110 | 
111 | 　　事实上，周信钢并不讳言对中小市值股票的喜爱。早前接受媒体采访时，周信钢便坦言自己偏好小盘股，在其看来，小市值个股虽质地优劣不一，但一旦经过相关并购运作，未来成长的空间也很大。遵循这一思路，周信钢在此前几年创业板“火爆”时资产规模一路上升。然而今年“风向”一变，仍坚定持有创业板个股的周信钢的资产也难免缩水。
112 | 
113 | 　　以康斯特(18.160, -0.38, -2.05%)为例，半年报显示，周信钢及其妻子李欣截至6月末仍分别持有281.58万股、190.13万股，分列第一、第二大流通股股东。而事实上，周信钢建仓康斯特始于2016年四季度，去年末，周信钢和其女周晨分别持有143.06万股和60.47万股。此后，周氏一门又不断加仓。而回看康斯特股价走势，在去年11月迎来一波短暂上涨后便持续下跌，今年以来，股价跌幅已超过了30%，周信钢一家对康斯特的投资明显处于浮亏状态。
114 | 
115 | 　　此外，在创业板市场整体不景气的背景下，周信钢一家先前大规模买入的美联新材(25.700, -0.30, -1.15%)、新元科技(26.080, -0.33, -1.25%)等个股今年以来也处于下跌通道中。其中，美联新材二季度至今跌幅也超过了30%。
116 | 
117 | 　　陈庆桃：押注ST 结果不如意
118 | 
119 | 　　相比周信钢，另一位知名牛散陈庆桃则信奉“富贵险中求”，其对ST股执著投资的背后则有着强烈的“赌博”意味。然而，相较于几年前押注ST股所获暴利，陈庆桃今年对ST股的押注却未能如愿。
120 | 
121 | 　　ST新梅(6.900, 0.17, 2.53%)8月22日发布的半年报显示，陈庆桃截至6月末已从公司十大流通股股东名单中消失。这意味着，在ST新梅暂停上市前突击买入1318.24万股的陈庆桃，已在6月份快速清仓。
122 | 
123 | 　　而回看ST新梅恢复上市后的股价走势，其在6月6日恢复上市当天股价一度大涨40%，孰料尾盘却遭到巨大抛压，在短短五分钟内股价竟快速“翻绿”，此后几日公司股价也未有起色，呈整体下跌态势。这意味着，倘若陈庆桃未在上述五分钟前离场，其对ST新梅长达一年多的潜伏最终也是徒劳无功。
124 | 
125 | 　　相比之下，陈庆桃早前押注的另一只暂停上市股ST常林(7.170, 0.10, 1.41%)重返A股市场时表现更差。ST常林7月31日复牌交易首日即大跌近19%，此后又连续两日跌停，至今未出现明显反弹。虽不知陈庆桃是否已减持撤退（持有1000万股），但其所持ST常林市值却显著缩水。
126 | 
127 | 　　在市场人士看来，近年来，随着并购重组、退市等一系列配套政策、规定的出台，ST板块如今则日益边缘化。从实践来看，投资者出于规避潜在风险、不确定性等考虑，对ST板块的炒作也日趋谨慎，已不再盲目追涨杀跌并回归理性，ST新梅、ST常林恢复上市后的走势也证明了这一点，类似陈庆桃的投资者赚钱或越来越难。
128 | 
129 | 　　蒋政一：博弈重组股前景未知
130 | 
131 | 　　由于在重组股筛选方面独具慧眼，蒋政一近年来一直被视作A股市场牛散的“杰出代表”。
132 | 
133 | 　　记者注意到，仅2014年以来，以蒋政一为代表的“蒋氏二人组”便已相继押中了金磊股份（旧名）、步森股份(52.880, 0.00, 0.00%)、万达信息(14.660, -0.46, -3.04%)3只具有并购重组预期的个股，潜伏成功率相当之高。而如今，蒋政一又再次押中了重组股——通达动力(24.660, 0.00, 0.00%)。
134 | 
135 | 　　记者注意到，去年末尚未现身十大流通股东榜的蒋政一，凭借着灵敏的“嗅觉”于今年1月份突然买入通达动力120万股，随后，通达动力在1月23日停牌重组。而根据前期披露的重组方案，隆基泰和置业拟作价160亿元实施借壳。
136 | 
137 | 　　无疑，蒋政一再次向外界展示了其挑选重组股的精准眼光。不过，此番押中通达动力，会否也像早年案例一样，为蒋政一带来丰厚的利润呢？
138 | 
139 | 
140 | 　　细心的投资者不难发现，随着并购重组尤其是重组上市相关政策导向的日趋严厉，上市公司实施重组已不像以往那样会轻松“过关”，交易所首先会结合其方案发出针对性的问询函，此前已有不少公司的重组方案因存在瑕疵无法回应监管部门问询而被迫终止。
141 | 
142 | 　　回看通达动力本次重组，由于涉及房企借壳，其方案披露后投服中心便抛出诸多质疑。投服中心直接指出，重组上市应当参照IPO标准审核，故公司本次重组存在的两个问题，可能导致重组不能通过监管部门审核。
143 | 
144 | 　　而面对着本次重组的诸多变数，蒋政一此番投资押注能否兑现成丰厚的投资收益，也充满着不确定性。
145 | 
146 | 　　随着A股投资氛围的转变，在投资者更加注重价值投资，逐渐远离“炒小、炒差、炒新”的大背景下，在监管部门对并购重组从严审核监管的政策导向下，无论是痴迷投资创业板个股的周信钢，或选择投机博弈ST股的陈庆桃，还是擅长押注重组的蒋政一，以及代表着三种投资风格的牛散们，今年的股市战绩都不会太理想。而这一现象，是否该引起这类牛散乃至投资风格相近投资者的反思呢？`;
147 | 	console.dir(sentiment(s));
148 | }


--------------------------------------------------------------------------------
/package.json:
--------------------------------------------------------------------------------
 1 | {
 2 |   "name": "arex",
 3 |   "version": "0.4.5",
 4 |   "description": "node article extractor",
 5 |   "main": "lib/arex.js",
 6 |   "scripts": {
 7 |     "test": "test/test.js"
 8 |   },
 9 |   "repository": {
10 |     "type": "git",
11 |     "url": "git+https://github.com/ahkimkoo/arex.git"
12 |   },
13 |   "keywords": [
14 |     "article",
15 |     "extractor",
16 |     "nodejs"
17 |   ],
18 |   "author": "cherokee",
19 |   "license": "BSD-2-Clause",
20 |   "bugs": {
21 |     "url": "https://github.com/ahkimkoo/arex/issues"
22 |   },
23 |   "homepage": "https://github.com/ahkimkoo/arex#readme",
24 |   "dependencies": {
25 |     "async": "^2.0.0-rc.2",
26 |     "brain.js": "^1.0.4",
27 |     "bufferhelper": "^0.2.1",
28 |     "iconv-lite": "^0.4.13",
29 |     "nodejieba": "^2.2.4",
30 |     "string-similarity": "^1.2.0"
31 |   }
32 | }
33 | 


--------------------------------------------------------------------------------
/server.js:
--------------------------------------------------------------------------------
 1 | var http = require('http');
 2 | var httpreq = require('./lib/httprequest.js');
 3 | var arex = require('./lib/arex.js');
 4 | 
 5 | var hostname = '0.0.0.0';
 6 | var port = 3824;
 7 | 
 8 | var server = http.createServer((req, res) => {
 9 | 
10 |     var chunks = [];
11 |     req.on('data', chunk => chunks.push(chunk));
12 |     res.statusCode = 200;
13 |     req.on('end', () => {
14 |         res.setHeader('Content-Type', 'application/json');
15 |         try {
16 |             var data = Buffer.concat(chunks);
17 |             var json_data = JSON.parse(data.toString());
18 |             httpreq.get(json_data['url'],(err,body)=>{
19 |               if(err)res.end('{}');
20 |               else {
21 |                 var result = arex.get_article_sync(body, json_data['size']||200, json_data['smooth']);
22 |                 res.end(JSON.stringify(result));
23 |               }
24 |             });
25 |         } catch (e) {
26 |             //console.error(e);
27 |             res.end('{}');
28 |         }
29 |     });
30 | });
31 | 
32 | server.listen(port, hostname, () => {
33 |     console.log(`Server running at http://${hostname}:${port}/`);
34 | });


--------------------------------------------------------------------------------
/test/compare-summary.js:
--------------------------------------------------------------------------------
  1 | const mysql = require("mysql");
  2 | const arex = require('../lib/arex.js');
  3 | const fs = require('fs');
  4 | const boson = require('./BosonNlp.js');
  5 | const async = require('async');
  6 | 
  7 | const pool = mysql.createPool({
  8 |     "host": "10.10.119.133",
  9 |     "database": "news_cfg",
 10 |     "user": "news",
 11 |     "password": "pwd@news$",
 12 |     "connectionLimit": 10
 13 | });
 14 | 
 15 | const getTextFromHtml = function(html) {
 16 |     html = html.replace(/<!--[\s\S]*?-->/igm, '');
 17 |     html = html.replace(/<script[\s\S]*?<\/script>/igm, '');
 18 |     html = html.replace(/<style[\s\S]*?<\/style>/igm, '');
 19 |     html = html.replace(/<\/?[^>]*?>/ig, '');
 20 |     html = html.replace(/&[a-zA-Z]+;/ig, '');
 21 |     html = html.replace(/[\n\t\r]+/igm, '');
 22 |     html = html.replace(/[\s]+/igm, '');
 23 |     return html;
 24 | }
 25 | 
 26 | 
 27 | if(process.argv.length>2){
 28 |     let id = parseInt(process.argv[2]);
 29 |     let sql = `SELECT
 30 |                     a.id,
 31 |                     b.title,
 32 |                     b.url,
 33 |                     b.summary,
 34 |                     b.content,
 35 |                     a.score
 36 |                 FROM
 37 |                     fe_avnews a,
 38 |                     fe_articles b
 39 |                 WHERE
 40 |                     a.id = ${id} 
 41 |                     AND a.article_id = b.id 
 42 |                 LIMIT 1;`;
 43 |     pool.query(sql, (err, ret) => {
 44 |         if(err)throw err;
 45 |         if(ret.length>0){
 46 |             let article = ret[0];
 47 |             console.log('TITLE:::',article['title']);
 48 |             console.log('SUMMARY:::',article['summary']);
 49 |             console.log('NEW SUMMARY:::',arex.summarize(article['content'], 0.04, false, 50, 80,[],article['title']));
 50 |         }
 51 |         process.exit();
 52 |     });
 53 | }else{
 54 |     let sql = `SELECT
 55 |                     a.id,
 56 |                     b.title,
 57 |                     b.url,
 58 |                     b.summary,
 59 |                     b.content,
 60 |                     a.score
 61 |                 FROM
 62 |                     fe_avnews a,
 63 |                     fe_articles b
 64 |                 WHERE
 65 |                     a.create_time > SUBSTR(NOW() FROM 1 FOR 10)
 66 |                     AND b.origin <> '交易所' 
 67 |                     AND a.article_id = b.id 
 68 |                 ORDER BY score DESC 
 69 |                 LIMIT 500;`;
 70 | 
 71 |     pool.query(sql, (err, ret) => {
 72 |         if(err)throw err;
 73 |         async.mapLimit(
 74 |             ret,
 75 |             10,
 76 |             (article, cb)=>{
 77 |                 let new_summary = arex.summarize(article['content'], 0.04, false, 50, 80,[],article['title']).replace(/\"/ig,'“');
 78 |                 boson.summarize(
 79 |                     article['title'],
 80 |                     getTextFromHtml(article['content']),
 81 |                     80,
 82 |                     (err,smy)=>{
 83 |                         console.log(article['id']);
 84 |                         console.log(article['title']);
 85 |                         console.log(new_summary);
 86 |                         console.log('\n');
 87 |                         if(err)console.error(err);
 88 |                         cb(null, [
 89 |                                 article['id'],
 90 |                                 article['title'].replace(/\"/ig,'“'),
 91 |                                 article['summary'] ? article['summary'].replace(/\"/ig,'“') : '',
 92 |                                 new_summary,
 93 |                                 smy,
 94 |                                 article['url']
 95 |                         ]);
 96 |                     }
 97 |                     );
 98 |             },
 99 |             (err, paragraphs)=>{
100 |                 paragraphs.unshift(['ID','标题','摘要（V2）','摘要（V3）','摘要（Boson）','网址']);
101 |                 fs.writeFile('summary-comparation.csv', paragraphs.join(new Buffer('\xEF\xBB\xBF', 'binary')+'\n'), (err) => {
102 |                     if(err)throw err;
103 |                     else console.log('dump to summary-comparation.csv');
104 |                     process.exit();
105 |                 });
106 |             }
107 |             );        
108 |     });
109 | }
110 | 


--------------------------------------------------------------------------------
/test/echart-line.html:
--------------------------------------------------------------------------------
 1 | <!DOCTYPE html>
 2 | <html>
 3 | <head>
 4 |     <meta charset="utf-8">
 5 |     <script src="http://cdn.bootcss.com/echarts/3.5.4/echarts.min.js"></script>
 6 |     <script type="text/javascript" src="line-data.js"></script>
 7 |     <title>文章行块密度</title>
 8 | </head>
 9 | <body>
10 | 	<h1>文章行块密度</h1>
11 |     <div id="main" style="width: 100%;height:800px;"></div>
12 |     <div>从<input type="text" value="0" id="line_from">到<input type="text" value="10" id="line_to">行<input type="button" value="显示" id="show_trigger"></div>
13 |     <div id="text">
14 |     	
15 |     </div>
16 |     <script type="text/javascript">
17 |     var myChart = echarts.init(document.getElementById('main'));
18 | 
19 |     var getOption = function(fn){
20 |     	var xarr = [];
21 | 	    for(var i=0; i<blocks.length; i++){
22 | 	    	xarr.push(i);
23 | 	    }
24 | 
25 | 		 return option = {
26 | 		        title: {
27 | 		            text: '行块文字密度'
28 | 		        },
29 | 		        tooltip: {},
30 | 		        xAxis: {
31 | 		        	name: '行数',
32 | 		        	type: 'category',
33 | 		            data: xarr
34 | 		        },
35 | 		        yAxis: {
36 | 		        	name : '字数'
37 | 		        },
38 | 		        series: [{
39 | 			            name: '单行字数',
40 | 			            type: 'bar',
41 | 			            data: blocks_length
42 | 			        	},
43 | 			        	{
44 | 			            name: '行块字数',
45 | 			            type: 'line',
46 | 			            data: blocks_score
47 | 			        	}
48 | 		        	]
49 | 		    };
50 |     }
51 |     myChart.setOption(getOption());
52 |     document.getElementById('line_from').value = position[0];
53 |     document.getElementById('line_to').value = position[1];
54 |     document.getElementById('show_trigger').addEventListener('click',function(){
55 |     	var line_from = parseInt(document.getElementById('line_from').value);
56 |     	var line_to = parseInt(document.getElementById('line_to').value);
57 |     	document.getElementById('text').innerHTML = blocks.slice(line_from,line_to).join('<br/>');
58 |     },false);
59 |     </script>
60 | </body>
61 | </html>


--------------------------------------------------------------------------------
/test/test-summarize.js:
--------------------------------------------------------------------------------
1 | const arex = require('../lib/arex.js');
2 | 
3 | const html  = `<div class="article" id="artibody" data-sudaclick="blk_content"> <!--新增众测推广文案--> <!--新增众测推广文案end--> <div class="img_wrapper"><img src="//n.sinaimg.cn/tech/transform/460/w630h630/20201005/1a61-kaaxtfn0161239.jpg" alt="" data-link=""><span class="img_descr"></span></div> <p><strong>　　<a href="https://news.sina.cn/zt_d/2020nbej" target="_blank" data-comos-dataid="comos:ivhvpwy7921654">专题：2020年诺贝尔奖</a></strong></p> <p>　　新浪科技讯&nbsp;北京时间10月5日消息，2020年诺贝尔生理学或医学奖揭晓：美国科学家Harvey J。 Alter，英国科学家 Michael Houghton 和美国科学家Charles M。 Rice 三人 获奖，获奖理由：发现丙型肝炎病毒。</p> <p>　　有史以来的第一次，丙型肝炎病毒现在可以被治愈。2020年诺贝尔生理学或医学奖获奖者们的发现，揭示了慢性肝炎其余病例的病因，并使得血液检查成为可能，新的药物也拯救了数百万人的生命。</p> <p>　　今年的诺贝尔生理学和医学奖授予为抗击血源性肝炎做出决定性贡献的三位科学家。血源性肝炎是一种主要的全球健康问题，会导致世界各地的人罹患肝硬化和肝癌。</p> <p>　　Harvey J。 Alter、Michael Houghton和Charles M。 Rice的重大发现使我们能够鉴定一种新的病毒——丙型肝炎病毒。在他们的工作之前，尽管甲型肝炎和乙型肝炎病毒的发现至关重要，但大多数血源性肝炎病例仍然无法解释。丙型肝炎病毒的发现揭示了其余慢性肝炎病例的原因，并使验血和新药物成为可能，从而挽救了数百万人的生命。</p> <p>　　<strong>详细解读：</strong></p> <div class="img_wrapper"><img src="//n.sinaimg.cn/tech/transform/218/w630h388/20201005/b65f-kaaxtfn0205486.jpg" alt="肝炎主要有两种形式。其一是由甲型肝炎病毒引起的急性疾病，该病毒通过被污染的水和食物传播。另一种是有乙型肝炎病毒或丙型肝炎病毒（今年的诺贝尔奖）引起的。这种血源性肝炎通常是一种慢性疾病，可能会发展为肝硬化和肝细胞癌。" data-link=""><span class="img_descr">　　肝炎主要有两种形式。其一是由甲型肝炎病毒引起的急性疾病，该病毒通过被污染的水和食物传播。另一种是有乙型肝炎病毒或丙型肝炎病毒（今年的诺贝尔奖）引起的。这种血源性肝炎通常是一种慢性疾病，可能会发展为肝硬化和肝细胞癌。</span></div> <p>　　<strong>肝炎——人类健康的全球威胁</strong></p> <p>　　肝炎（hepatitis），是希腊语中的“肝”和“炎症”一词的组合。肝炎主要由病毒感染引起，但酗酒、环境毒素和自身免疫疾病等也是重要的原因。二十世纪四十年代，人们发现主要有两种类型的传染性肝炎。第一种成为甲型肝炎（hepatitis A），其通过被污染的水或事物传播，但对患者几乎没有长期影响。第二种类型主要通过血液和体液传播。因为可以导致慢性疾病，并发展为肝硬化和肝癌（图1），这种类型的肝炎威胁更严重。这种类型的肝炎是隐性的，因为健康个体在感染之后，可能会经过许多年才会显现出严重的并发症。血源性肝炎与高发病率和高死亡率相关，每年在全球范围内造成一百多万人死亡，从而使其成为与HIV感染和结核病相当的全球性健康问题。</p> <p>　　<strong>传染源未知</strong></p> <p>　　成功干预传染病的关键在于确定病原体。二十世纪六十年代，巴鲁克·布伦伯格（Baruch Blumberg）确定，一种形式的血源性肝炎由被称为乙型肝炎病毒的病毒所致，这一发现促进了诊断检测和有效疫苗的开发。布伦伯格也因此获得了1976年的诺贝尔生理学或医学奖。</p> <p>　　当时，Harvey J。 Alter正在美国国家卫生研究院（NIH）研究接受输血的患者中患上肝炎的情况。尽管针对新发现的乙型肝炎病毒的血液检测确实减少了输血相关的肝炎病例数，但Alter及其同事仍证明，还有大量肝炎病例存在。在此期间，甲型肝炎病毒感染的检测也已经开发了出来。但很明显，甲型肝炎病毒无法解释这些原因不明病例。</p> <p>　　令人担忧的是，大量输血者由于未知的传染原而患上慢性肝炎。Alter及其同事发现，这些肝炎患者的血液可以将疾病传染给黑猩猩，这是人类之外唯一的易感宿主。随后的研究还表明，未知的传染原具有病毒的特征。Alter的系统研究定义了一种新型的、独特的慢性病毒性肝炎。这种神秘的疾病被称为“非甲型、非乙型”肝炎。</p> <p>　　<strong>丙型肝炎病毒的鉴定</strong></p> <p>　　这种新型病毒的鉴定具有重要的意义，研究者使用了所有传统的病毒搜索技术，但在十多年的时间里，该病毒依然无法分离出来。在制药公司Chiron工作的Michael Houghton承担了分离病毒基因序列的艰巨工作。他和同事从一只被感染的黑猩猩的血液中采集了核酸，从中收集了一组DNA片段。这些片段大部分来自黑猩猩自身的基因组，但研究人员估计，一些片段可能来自这种未知的病毒。假设肝炎患者的血液中含有抗病毒抗体，研究人员就可以利用患者的血清来鉴定编码病毒蛋白的克隆病毒DNA片段。经过全面的搜寻，他们发现了一个阳性的克隆。进一步的研究表明，该克隆来自一种新的属于黄病毒科的RNA病毒，被命名为丙型肝炎病毒。慢性肝炎患者中抗体的存在强烈暗示了这种病毒就是缺失的病原体。</p> <div class="img_wrapper"> <div class="img_wrapper"> <div class="img_wrapper"><img src="//n.sinaimg.cn/tech/transform/76/w630h246/20201005/7a03-kaaxtfn0245589.jpg" alt="" data-link=""><span class="img_descr"></span></div> <span class="img_descr"></span></div> <span class="img_descr">　　Harvey J。 Alter对输血相关性肝炎的系统研究表明，一种未知病毒是慢性肝炎的常见病因。Michael Houghton使用了一种未经验证的策略，分离出一种名为丙型肝炎病毒（Hepatitis C virus）的新病毒的基因组。Charles M。 Rice提供了最终的证据，表明仅丙型肝炎病毒就能导致肝炎。</span></div> <p>　　丙型肝炎病毒的发现是决定性的，但是这个谜题的另一关键部分尚未解答：单是病毒就能导致肝炎吗？为了回答这个问题，科学家们必须研究克隆的病毒是否能够复制并导致疾病。华盛顿大学圣路易斯分校的研究者Charles M。 Rice和其他研究RNA病毒的小组注意到，在丙型肝炎病毒基因组末端有一个此前未被识别的区域，他们怀疑该区域可能对病毒复制很重要。Charles M。 Rice还在分离的病毒样本中观察到遗传变异，并推测其中一些可能会阻碍病毒复制。通过基因工程，Charles M。 Rice获得了丙型肝炎病毒的RNA变异，其中包括新定义的病毒基因组区域，不存在失活基因变异。当这种RNA被注射到黑猩猩的肝脏时，在它们的血液中检测到了病毒，并观察到了与患有这种慢性疾病的人类相似的病理变化。这是最后的证据，证明单单丙型肝炎病毒就可以导致不明原因的输血介导型肝炎病例。</p> <p>　　<strong>今年诺奖发现的重要意义</strong></p> <p>　　今年诺奖获得者对于丙型肝炎病毒的发现是人类与病毒对抗过程中取得的一场里程碑式胜利（图2）。由于他们的这项发现，我们才能拥有针对这一病毒的高灵敏血液测试，并在世界的很多地区基本消除输血性肝炎的发生，从而极大增进了全球健康。他们的发现同时也让直接作用于丙肝的抗病毒药物研发成为可能。历史上第一次，这项疾病现在可以被治愈，从而燃起了在全球范围内根除丙型肝炎的希望。而为了达成这项目标，国际社会需要采取更多措施，让全球各地的人们能够获得所需的血液检测和抗病毒药物。</p> <p>　　<strong>获奖人介绍：</strong></p> <div class="img_wrapper"><img src="//n.sinaimg.cn/tech/transform/150/w630h1120/20201005/3176-kaaxtfn0231138.jpg" alt="" data-link=""><span class="img_descr"></span></div> <div id="ad_44124" class="otherContent_01" style="display: block; margin: 10px 20px 10px 0px; float: left; overflow: hidden; clear: both; padding: 4px; width: 300px; height: 250px;"><ins class="sinaads sinaads-done" id="Sinads49447" data-ad-pdps="PDPS000000056054" data-ad-status="done" style="display: block; overflow: hidden; text-decoration: none;"><ins style="text-decoration:none;margin:0px auto;width:300px;display:block;position:relative;overflow:hidden;"><iframe adtypeturning="false" width="300px" height="250px" frameborder="0" marginwidth="0" marginheight="0" vspace="0" hspace="0" allowtransparency="true" scrolling="no" sandbox="allow-popups allow-same-origin allow-scripts allow-top-navigation-by-user-activation" src="javascript:'<html><body style=background:transparent;></body></html>'" id="sinaadtk_sandbox_id_11" style="float:left;" name="sinaadtk_sandbox_id_11"></iframe></ins></ins></div><p>　　<strong>Harvey J。 Alter</strong>于1935年出生于纽约。他在罗切斯特大学医学院获得医学学位，并在斯特朗纪念医院和西雅图大学医院接受内科训练。1961年，他加入美国国家卫生研究院（NIH）担任临床助理。在乔治敦大学任职数年之后，他于1969年回到NIH，加入临床中心的输血医学系，担任高级研究员。</p> <p>　　<strong>Michael Houghton</strong>出生于英国。1977年，他在伦敦国王学院获得博士学位。1982年，他加入了G。 D。 Searle &amp; Company公司，之后又在加利福尼亚州埃默里维尔的Chiron公司任职。他于2010年迁往加拿大阿尔伯塔大学，现为加拿大卓越研究教授，主攻病毒学；他还是阿尔伯塔大学的“李嘉诚教授”，并兼任李嘉诚应用病毒学研究所所长。</p> <p>　　<strong>Charles M。 Rice&nbsp;</strong>1952年出生于萨克拉门托。1981年，他在加州理工学院获得博士学位，并在1981-1985年期间接受博士后培训。1986年，他在圣路易斯的华盛顿大学医学院建立了自己的研究小组，并于1995年成为全职教授。自2001年以来，他一直是纽约洛克菲勒大学的教授。2001年至2018年期间，他担任洛克菲勒大学丙型肝炎研究中心的科学和执行主任，目前仍在该中心工作。</p><div style="font-size: 0px; height: 0px; clear: both;"></div> <!-- <div class="show_statement">　　声明：新浪网独家稿件，未经授权禁止转载。</div> --> <!-- tech_web_article_v2015_block_bottom --> <!-- 非定向300*250按钮    17/09  wenjing  begin --> <div id="left_hzh_ad"> <script async="" charset="utf-8" src="//d5.sina.com.cn/litong/zhitou/sinaads/release/sinaads.js"></script> <script language="javascript" type="text/javascript" src="//d2.sina.com.cn/d1images/button/rotator.js"></script> <script type="text/javascript"> (function(){var adScript = document.createElement('script'); adScript.src = '//d1.sina.com.cn/litong/zhitou/sinaads/demo/wenjing8/js/yl_left_hzh_20171020.js'; document.getElementsByTagName('head')[0].appendChild(adScript); })(); </script> </div> <!-- 非定向300*250按钮  end --> </div>`;
4 | var summary = arex.summarize(html, 200, true);
5 | 
6 | console.log(summary);


--------------------------------------------------------------------------------
/test/test.js:
--------------------------------------------------------------------------------
1 | var arex = require('../lib/arex.js');
2 | 
3 | if(process.argv.length>2){
4 | 	arex.get_article(process.argv[2],process.argv[3]?parseInt(process.argv[3]):200,(err,result)=>{
5 | 		console.log(result);
6 | 	});
7 | }else console.log('useage: node test.js [link]');


--------------------------------------------------------------------------------