├── PrefixSpan.py
├── README.md
├── bi_tri_gram.py
├── boost_tree.py
├── feature
├── train.csv
├── train.svm
└── valid.svm
├── feature_enti_num.py
├── feature_fresq.py
├── feature_low_fre.py
├── feature_pos.py
├── feature_senti_num.py
├── feature_sentiment.py
├── feature_slen.py
├── import_csv.py
├── lib
├── test.txt
├── train.txt
├── train_Wpos.txt
├── train_cut.txt
├── train_feature_enti_num.txt
├── train_feature_fresq.txt
├── train_feature_pos.txt
├── train_feature_senti_num.txt
├── train_feature_sentiment.txt
├── train_feature_slen.txt
├── train_negative_Wpos.txt
├── train_negative_cut.txt
├── train_negative_pos.txt
├── train_negative_prefixFrequentSub_sup100.txt
├── train_negative_prefixFrequentSub_sup50.txt
├── train_negative_prefixPattern.txt
├── train_negative_trigram.txt
├── train_pos.txt
├── train_positive_Wpos.txt
├── train_positive_cut.txt
├── train_positive_pos.txt
├── train_positive_prefixFrequentSub_sup25.txt
├── train_positive_prefixFrequentSub_sup50.txt
├── train_positive_prefixPattern.txt
├── train_positive_trigram.txt
└── train_squence_dict.txt
├── model
├── model.txt
└── xgb.dump.raw.txt
├── pretreatment.py
├── sentiment_dic
├── #README.txt
├── degree.txt
├── deny.txt
├── negative_comment.txt
├── negative_sentiment.txt
├── positive_comment.txt
└── positive_sentiment.txt
└── word2vec_test.py
/PrefixSpan.py:
--------------------------------------------------------------------------------
1 | # PrefixSpan
2 |
3 | import sys
4 | import codecs # 写入txt文件
5 | import numpy as np
6 | # sys.setrecursionlimit(1000000) #例如这里设置为一百万
7 | #import pdb
8 | #pdb.set_trace()
9 |
10 | PLACE_HOLDER = '_'
11 |
12 | # 读取txt文件
13 | def read(filename):
14 | S = []
15 | with open(filename, encoding='utf-8') as input:
16 | for line in input.readlines():
17 | elements = line.strip('\n').strip(',').split(',')
18 | s = []
19 | for e in elements:
20 | s.append(e.split())
21 | S.append(s)
22 | return S
23 |
24 | # 写入txt文件
25 | def write_file(patterns, file_name):
26 | fin = codecs.open(file_name, "w", "UTF-8")
27 | for i in patterns:
28 | fin.write("pattern:" + str(i.squence) + ", support:" + str(i.support))
29 | fin.write("\n")
30 | fin.close()
31 |
32 | # 写入txt文件
33 | def write_file1(dict, file_name):
34 | fin = codecs.open(file_name, "w", "UTF-8")
35 | for k,v in dict.items():
36 | fin.write("pattern:" + str(k) + ", dist:" + str(v))
37 | fin.write("\n")
38 | fin.close()
39 |
40 | # 提取满足要求的频繁子序列Frequent subsequence保存成字典类型的变量,并存储在文件中
41 | def frequent_sub(patterns, file_name):
42 | squence_support_dict = {}
43 | fin = codecs.open(file_name, "w", "UTF-8")
44 | for i in patterns:
45 | if len(i.squence) == 1:
46 | squence_support_dict.update({str(i.squence).replace('[','').replace(']','').replace("'",''):i.support})
47 | fin.write("pattern:" + str(i.squence).replace('[','').replace(']','').replace("'",'') + ", support:" + str(i.support) + "\n")
48 | fin.close()
49 | return squence_support_dict
50 |
51 |
52 | # 合并3个字典,key的value组成一个列表,第1列是负例的supp100,第1列是负例的supp50,第3列是正例的supp50
53 | def merge_dict(dict1, dict2, dict3, dict4):
54 | dict_hidden = {} #合并后的字典的初始化
55 | dict_hidden.update(dict1)
56 | dict_hidden.update(dict2)
57 | dict_hidden.update(dict3)
58 | dict_hidden.update(dict4)
59 | dictMerge_keyList = list(dict_hidden.keys())
60 | dict_merge = {}.fromkeys(dictMerge_keyList, [0,0,0,0])
61 | for k,v in dict1.items():
62 | dict_merge[k] = list(np.array(dict_merge[k])+np.array([v,0,0,0]))
63 | for k,v in dict2.items():
64 | dict_merge[k] = list(np.array(dict_merge[k])+np.array([0,v,0,0]))
65 | for k,v in dict3.items():
66 | dict_merge[k] = list(np.array(dict_merge[k])+np.array([0,0,v,0]))
67 | for k,v in dict4.items():
68 | dict_merge[k] = list(np.array(dict_merge[k])+np.array([0,0,0,v]))
69 | return dict_merge
70 |
71 |
72 | class SquencePattern:
73 | def __init__(self, squence, support):
74 | self.squence = []
75 | for s in squence:
76 | self.squence.append(list(s))
77 | self.support = support
78 |
79 | def append(self, p):
80 | if p.squence[0][0] == PLACE_HOLDER:
81 | first_e = p.squence[0]
82 | first_e.remove(PLACE_HOLDER)
83 | self.squence[-1].extend(first_e)
84 | self.squence.extend(p.squence[1:])
85 | else:
86 | self.squence.extend(p.squence)
87 | self.support = min(self.support, p.support)
88 |
89 |
90 | def prefixSpan(pattern, S, threshold):
91 | patterns = []
92 | f_list = frequent_items(S, pattern, threshold)
93 |
94 | for i in f_list:
95 | p = SquencePattern(pattern.squence, pattern.support)
96 | p.append(i)
97 | patterns.append(p)
98 |
99 |
100 | p_S = build_projected_database(S, p)
101 | p_patterns = prefixSpan(p, p_S, threshold)
102 | patterns.extend(p_patterns)
103 | return patterns
104 |
105 |
106 | def frequent_items(S, pattern, threshold):
107 | items = {}
108 | _items = {}
109 | f_list = []
110 | if S is None or len(S) == 0:
111 | return []
112 |
113 | if len(pattern.squence) != 0:
114 | last_e = pattern.squence[-1]
115 | else:
116 | last_e = []
117 | for s in S:
118 | #class 1
119 | is_prefix = True
120 | for item in last_e:
121 | if item not in s[0]:
122 | is_prefix = False
123 | break
124 | if is_prefix and len(last_e) > 0:
125 | index = s[0].index(last_e[-1])
126 | if index < len(s[0]) - 1:
127 | for item in s[0][index + 1:]:
128 | if item in _items:
129 | _items[item] += 1
130 | else:
131 | _items[item] = 1
132 |
133 | #class 2
134 | if PLACE_HOLDER in s[0]:
135 | for item in s[0][1:]:
136 | if item in _items:
137 | _items[item] += 1
138 | else:
139 | _items[item] = 1
140 | s = s[1:]
141 |
142 | #class 3
143 | counted = []
144 | for element in s:
145 | for item in element:
146 | if item not in counted:
147 | counted.append(item)
148 | if item in items:
149 | items[item] += 1
150 | else:
151 | items[item] = 1
152 |
153 | f_list.extend([SquencePattern([[PLACE_HOLDER, k]], v)
154 | for k, v in _items.items()
155 | if v >= threshold])
156 | f_list.extend([SquencePattern([[k]], v)
157 | for k, v in items.items()
158 | if v >= threshold])
159 | sorted_list = sorted(f_list, key=lambda p: p.support)
160 | return sorted_list
161 |
162 |
163 |
164 | def build_projected_database(S, pattern):
165 | """
166 | suppose S is projected database base on pattern's prefix,
167 | so we only need to use the last element in pattern to
168 | build projected database
169 | """
170 | p_S = []
171 | last_e = pattern.squence[-1]
172 | last_item = last_e[-1]
173 | for s in S:
174 | p_s = []
175 | for element in s:
176 | is_prefix = False
177 | if PLACE_HOLDER in element:
178 | if last_item in element and len(pattern.squence[-1]) > 1:
179 | is_prefix = True
180 | else:
181 | is_prefix = True
182 | for item in last_e:
183 | if item not in element:
184 | is_prefix = False
185 | break
186 |
187 | if is_prefix:
188 | e_index = s.index(element)
189 | i_index = element.index(last_item)
190 | if i_index == len(element) - 1:
191 | p_s = s[e_index + 1:]
192 | else:
193 | p_s = s[e_index:]
194 | e = element[i_index:]
195 | e[0] = PLACE_HOLDER
196 | p_s[0] = e
197 | break
198 | if len(p_s) != 0:
199 | p_S.append(p_s)
200 |
201 | return p_S
202 |
203 |
204 | def print_patterns(patterns):
205 | for p in patterns:
206 | print("pattern:{0}, support:{1}".format(p.squence, p.support))
207 |
208 |
209 | if __name__ == "__main__":
210 | S_positive = read("./lib/train_positive_trigram.txt")
211 | patterns_positive = prefixSpan(SquencePattern([], sys.maxsize), S_positive, 50)
212 | # print_patterns(patterns) 显示出所有的频繁项,下面有把频繁项保存在txt文件中
213 | write_file(patterns_positive, "./lib/train_positive_prefixPattern.txt")
214 | squence_support50_dict_positive = frequent_sub(patterns_positive, './lib/train_positive_prefixFrequentSub_sup50.txt')
215 |
216 | patterns_positive = prefixSpan(SquencePattern([], sys.maxsize), S_positive, 25)
217 | squence_support25_dict_positive = frequent_sub(patterns_positive, './lib/train_positive_prefixFrequentSub_sup25.txt')
218 |
219 | S_negative = read("./lib/train_negative_trigram.txt")
220 | # 因为正负数据数量不平衡,所以支持度设置也不一样
221 | patterns_negative = prefixSpan(SquencePattern([], sys.maxsize), S_negative, 100)
222 | write_file(patterns_negative, "./lib/train_negative_prefixPattern.txt")
223 | squence_support100_dict_negative = frequent_sub(patterns_negative, './lib/train_negative_prefixFrequentSub_sup100.txt')
224 |
225 | patterns_negative = prefixSpan(SquencePattern([], sys.maxsize), S_negative, 50)
226 | squence_support50_dict_negative = frequent_sub(patterns_negative, './lib/train_negative_prefixFrequentSub_sup50.txt')
227 |
228 |
229 | # 合并正例和负例的频繁词序列的字典
230 | squence_support_dict = merge_dict(squence_support100_dict_negative, squence_support50_dict_negative, squence_support50_dict_positive, squence_support25_dict_positive)
231 |
232 | squence_support_dist_dict = {} # 计算词典中每个频繁词序列的区分度dist(初始化)
233 | squence_support_dist_dict_filter = {} # 筛选出区分度dist>=0.85的频繁词序列重新组成词典(初始化)
234 | for k,v in squence_support_dict.items():
235 | if v[1] == 0: # 这里做了一个近似,如果支持度小于50,直接令其支持度为50(负例)
236 | v[1] = 50
237 | if v[3] == 0: # 这里做了一个近似,如果支持度小于25,直接令其支持度为25
238 | v[3] = 25
239 | dist = max(v[1]*0.5,v[3])/(v[1]*0.5+v[3]) # 计算每个频繁词序列的区分度dist(正例)
240 | squence_support_dist_dict.update({k:dist})
241 | if dist >= 0.85:
242 | squence_support_dist_dict_filter.update({k:dist})
243 | write_file1(squence_support_dist_dict_filter, "./lib/train_squence_dict.txt")
244 |
245 |
246 |
247 |
248 |
249 |
250 |
251 |
252 |
253 |
--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
1 | # TextClassification-MeiTuan-FeatureExtraction-Classifier
2 |
3 | 这里是利用python3.6进行“特征提取+分类器”来实现美团评论的文本二分类问题。在特征提取部分提取了6种特征,分类器选择了python里面的包xgboost和lightGBM分别实现提升树和GBDT(梯度提升决策树)。现在,最终的结果(准确率和AUC)不是特别好,希望通过调节分类器模型和参数最终可以有一个比较好的结果。
4 |
5 |
6 | 其中:
7 | * (1)-(5):数据预处理
8 | * (6)-(12):一层、两层以及双向lstm模型
9 | * (13):分类器
10 | * (14):feature文件夹下的数据文件介绍
11 | * (15):lib文件夹下的数据文件介绍
12 | * (16):model文件夹下的数据文件介绍
13 | * (17):sentiment_dic文件夹下的数据文件介绍
14 | * (18):tool文件夹下的数据文件介绍
15 |
16 | ****
17 |
18 | |Author|manderous|
19 | |---|---|
20 | |E-mail|manderous@foxmail.com|
21 |
22 | ****
23 |
24 | ## 目录
25 | * [数据预处理](#数据预处理)
26 | * (1)pretreatment.py
27 | * (2)bi_tri_gram.py
28 | * (3)word2vec_test.py
29 | * (4)zhwiki_2017_03.sg_50d.word2vec
30 | * (5)PrefixSpan.py
31 | * [特征提取](#特征提取)
32 | * (6)feature_pos.py
33 | * (7)feature_fresq.py
34 | * (8)feature_sentiment.py
35 | * (9)feature_slen.py
36 | * (10)feature_senti_num.py
37 | * (11)feature_enti_num.py
38 | * (12)import_csv.py
39 | * [分类器](#分类器)
40 | * (13)boost_tree.py
41 | * [(14)feature文件夹下的数据文件介绍](#feature文件夹下的数据文件介绍)
42 | * [(15)lib文件夹下的数据文件介绍](#lib文件夹下的数据文件介绍)
43 | * [(16)model文件夹下的数据文件介绍](#model文件夹下的数据文件介绍)
44 | * [(17)sentiment_dic文件夹下的数据文件介绍](#sentiment_dic文件夹下的数据文件介绍)
45 | * [(18)tool文件夹下的数据文件介绍](#tool文件夹下的数据文件介绍)
46 |
47 | ****
48 |
49 | ## 数据预处理
50 | ### pretreatment.py
51 | #### 分词、词性标注、正负文本的划分、训练集测试集的划分(python文件)
52 | 输入:
53 | ```
54 | ./lib/train.txt:训练集
55 | ./lib/test.txt:测试集
56 | ```
57 | 输出:
58 | ```
59 | ./lib/train_positive_cut.txt:训练集,正标签,的分词结果
60 | ./lib/train_positive_pos.txt:训练集,正标签,的词性标注结果
61 | ./lib/train_positive_Wpos.txt:训练集,正标签,的分词和词性标注结果
62 |
63 | ./lib/train_negative_cut.txt:训练集,负标签,的分词结果
64 | ./lib/train_negative_pos.txt:训练集,负标签,的词性标注结果
65 | ./lib/train_negative_Wpos.txt:训练集,负标签,的分词和词性标注结果
66 |
67 | ./lib/train_cut.txt:训练集,的分词结果
68 | ./lib/train_pos.txt':训练集,的词性标注结果
69 | ./lib/train_Wpos.txt:训练集,的分词和词性标注结果
70 | ```
71 |
72 | ### (2)bi_tri_gram.py
73 | #### 生成bi-gram、tri-gram(python文件)
74 | 输入:
75 | ```
76 | ./lib/train_positive_cut.txt:训练集,正标签,的分词结果
77 | ./lib/train_negative_cut.txt:训练集,负标签,的分词结果
78 | ```
79 | 输出:
80 | ```
81 | ./lib/train_positive_trigram.txt:训练集,正标签,的tri-gram结果
82 | ./lib/train_negative_trigram.txt:训练集,负标签,的tri-gram结果
83 | ```
84 |
85 | ### (3)word2vec_test.py
86 | #### 导入搜狗词向量语料加载,将积极文本和消极文本的词语生成词向量,保存至文本文件中(python文件)
87 | 输入:
88 | ```
89 | ./lib/train_positive_cut.txt:训练集,正标签,的分词结果
90 | ./lib/train_negative_cut.txt:训练集,负标签,的分词结果
91 | ```
92 | 输出:
93 | ```
94 | ./lib/wordsList.npy:数字索引词语变量
95 | ./lib/wordIndexVector.npy:数字索引词向量变量
96 | ```
97 |
98 | ### (4)./tool/zhwiki_2017_03.sg_50d.word2vec
99 | #### 搜狗词向量语料(word2vec文件)
100 | 百度云资源:https://pan.baidu.com/s/1C94HXCCWOmX-W4IbajXFyA
101 |
102 | ### (5)PrefixSpan.py
103 | #### 导入搜狗词向量语料加载,将积极文本和消极文本的词语生成词向量,保存至文本文件中(python文件)
104 | 输入:
105 | ```
106 | ./lib/train_positive_trigram.txt:训练集,正标签,的tri-gram结果
107 | ./lib/train_negative_trigram.txt:训练集,负标签,的tri-gram结果
108 | ```
109 | 输出:
110 | ```
111 | ./lib/train_positive_prefixPattern.txt:训练集,正标签,的所以频繁项(支持度50)
112 | ./lib/train_positive_prefixFrequentSub_sup50.txt:训练集,正标签,的所以频繁项(做了一些处理,比如删除中括号,只保留在train_positive_prefixPattern.txt中第一个中括号里面的频繁词序列)(支持度50)
113 | ./lib/train_positive_prefixFrequentSub_sup25.txt:训练集,正标签,的所以频繁项(做了一些处理,比如删除中括号,只保留在train_positive_prefixPattern.txt中第一个中括号里面的频繁词序列)(支持度25)
114 |
115 | ./lib/train_negative_prefixPattern.txt:训练集,负标签,的所以频繁项(支持度100)
116 | ./lib/train_negative_prefixFrequentSub_sup100.txt:训练集,负标签,的所以频繁项(做了一些处理,比如删除中括号,只保留在train_positive_prefixPattern.txt中第一个中括号里面的频繁词序列)(支持度100)
117 | ./lib/train_negative_prefixFrequentSub_sup50.txt:训练集,负标签,的所以频繁项(做了一些处理,比如删除中括号,只保留在train_positive_prefixPattern.txt中第一个中括号里面的频繁词序列)(支持度50)
118 |
119 | ./lib/train_squence_dict.txt:最终得到的训练集的频繁词序列!!!以及对应的区分度dist(这里最终选出的频繁词序列要求支持度dist>=0.85)
120 | ```
121 |
122 | ****
123 |
124 | ## 特征提取
125 | ### (6)feature_pos.py
126 | #### 词性组合模式的特征(python文件)
127 | jieba词性对照表:
128 | 参考网址:
129 | * 1 jieba分词中所有词性对应字母(词性列表及符号表示)
130 | https://blog.csdn.net/a2099948768/article/details/82216906
131 | * 2 jieba中文分词词性/解释对照表
132 | http://www.niumou.com.cn/183
133 | * 3 重要词性对照:
134 | n/n开头的:名词 ng nl nr ns nt nz
135 | v/v开头的:动词 vd vf vg vi vl vn vs vx vy
136 | a/a开头的:形容词 ad ag al an
137 | zg(部分是副词)/d:副词
138 | uj:助词“的”
139 | * 4 根据佳峰师兄的论文中的词性组合
140 | a + a:1
141 | a + n:2
142 | a + uj + n:3
143 | d/zg + a:4
144 | d/zg + v:5
145 | d + d/zg + a:6
146 | n + a:7
147 | 其它:0
148 | 输入:
149 | ```
150 | ./lib/train_pos.txt:训练集,的词性标注结果
151 | ```
152 | 输出:
153 | ```
154 | ./lib/train_feature_pos.txt:训练集,词性组合模式的特征
155 | ```
156 |
157 | ### (7)feature_fresq.py
158 | #### 频繁词序列模式的特征(python文件)
159 | 根据PrefixSpan.py文件提取出来的,输出字典变量:squence_support_dist_dict_filter,或者输出文件:train_data_squence_dict.txt
160 | 一如既往 的 好:1
161 | 不错:2
162 | 不错 的:3
163 | 古色古香:4
164 | 味道 不错:5
165 | 很 不错:6
166 | 很 好:7
167 | 很 新鲜:8
168 | 得 恰到好处:9
169 | 恰到好处:10
170 | 新鲜:11
171 | 最:12
172 | 服务:13
173 | 服务态度:14
174 | 烤:15
175 | 的 恰到好处:16
176 | 还:17
177 | 还不错:18
178 | 其它:0
179 | 输入:
180 | ```
181 | ./lib/train_cut.txt:训练集,的分词结果
182 | ```
183 | 输出:
184 | ```
185 | ./lib/train_feature_fresq.txt:训练集,频繁词序列模式的特征
186 | ```
187 |
188 | ### (8)feature_sentiment.py
189 | #### 情感的特征(基于情感词典的情感分类)(python文件)
190 | 情感得分
191 | 积极:2
192 | 消极:1
193 | 中性:0
194 | 输入:
195 | ```
196 | ./lib/train_cut.txt:训练集,的分词结果
197 | ./sentiment_dic/deny.txt:否定词典
198 | ./sentiment_dic/positive_sentiment.txt:正面情感词语
199 | ./sentiment_dic/positive_comment.txt:正面评价词语
200 | ./sentiment_dic/negative_sentiment.txt:负面情感词语
201 | ./sentiment_dic/negative_comment.txt:负面评价词语
202 | ./sentiment_dic/degree.txt:程度级别词语(有extreme、very、more、ish、insufficiently、over六个程度等级)
203 | ```
204 | 输出:
205 | ```
206 | ./lib/train_feature_sentiment.txt:训练集,情感模式的特征
207 | ```
208 |
209 | ### (9)feature_slen.py
210 | #### 句子长度的特征(python文件)
211 | 输入:
212 | ```
213 | ./lib/train_cut.txt:训练集,的分词结果
214 | ```
215 | 输出:
216 | ```
217 | ./lib/train_feature_slen.txt:训练集,句子长度的特征
218 | ```
219 |
220 | ### (10)feature_senti_num.py
221 | #### 情感词的个数(python文件)
222 | 输入:
223 | ```
224 | ./lib/train_cut.txt:训练集,的分词结果
225 | ./sentiment_dic/positive_sentiment.txt:正面情感词语
226 | ./sentiment_dic/positive_comment.txt:正面评价词语
227 | ./sentiment_dic/negative_sentiment.txt:负面情感词语
228 | ./sentiment_dic/negative_comment.txt:负面评价词语
229 | ```
230 | 输出:
231 | ```
232 | ./lib/train_feature_senti_num.txt:训练集,情感次个数的特征
233 | ```
234 |
235 | ### (11)feature_enti_num.py
236 | #### 实体的个数(python文件)
237 | 在这里,我认为所有的名词都是实体,也就是在jieba词性标注中,被标注为n, ng, nl, nr, ns, nt, nz的词语。
238 | 输入:
239 | ```
240 | ./lib/train_pos.txt':训练集,的词性标注结果
241 | ```
242 | 输出:
243 | ```
244 | ./lib/train_feature_enti_num.txt:训练集,情感次个数的特征
245 | ```
246 |
247 | ### (12)import_csv.py
248 | #### 将文本所有的特征导出在一个csv文件中(python文件)
249 | 输入:
250 | ```
251 | ./lib/train.txt:训练集
252 | ./lib/train_feature_pos.txt:训练集,词性组合模式的特征
253 | ./lib/train_feature_fresq.txt:训练集,频繁词序列模式的特征
254 | ./lib/train_feature_sentiment.txt:训练集,情感模式的特征
255 | ./lib/train_feature_slen.txt:训练集,句子长度的特征
256 | ```
257 | 输出:
258 | ```
259 | ./feature/train.csv:训练集,所有的特征(特征空间)
260 | ```
261 |
262 | ****
263 |
264 | ## 分类器
265 | ### (13)boost_tree.py
266 | #### 利用XGBoost和LightGBM对评论进行分类(python文件)
267 | 最后还会显示出XGBoost和LightGBM的损失值。
268 | 输入:
269 | ```
270 | ./feature/train.csv:训练集,所有的特征(特征空间)
271 | ```
272 | 输出:
273 | ```
274 | ./feature/train.svm:训练集(原训练集的80%),表示成稀疏矩阵的形式
275 | ./feature/valid.svm:验证集(原训练集的20%),表示成稀疏矩阵的形式
276 | ./model/model.txt:XGBoost训练出来的模型的可视化
277 | ./model/xgb.dump.raw.txt:LightGBM训练出来的模型的可视化
278 | ```
279 |
280 | ****
281 |
282 | ### feature文件夹下的数据文件介绍
283 | * 1 train.csv:训练集,所有的特征(特征空间)(import_csv.py生成的 csv文件)
284 | * 2 train.svm:训练集(原训练集的80%),表示成稀疏矩阵的形式(boost_tree.py生成的 svm文件)
285 | * 3 valid.svm:验证集(原训练集的20%),表示成稀疏矩阵的形式(boost_tree.py生成的 svm文件)
286 |
287 | ****
288 |
289 | ### lib文件夹下的数据文件介绍
290 | * 1 train_positive_cut.txt:训练集,正标签,的分词结果(pretreatment.py生成的 txt文件)
291 | * 2 train_positive_pos.txt:训练集,正标签,的词性标注结果(pretreatment.py生成的 txt文件)
292 | * 3 train_positive_Wpos.txt:训练集,正标签,的分词和词性标注结果(pretreatment.py生成的 txt文件)
293 | * 4 train_negative_cut.txt:训练集,负标签,的分词结果(pretreatment.py生成的 txt文件)
294 | * 5 train_negative_pos.txt:训练集,负标签,的词性标注结果(pretreatment.py生成的 txt文件)
295 | * 6 train_negative_Wpos.txt:训练集,负标签,的分词和词性标注结果(pretreatment.py生成的 txt文件)
296 | * 7 train_cut.txt:训练集,的分词结果(pretreatment.py生成的 txt文件)
297 | * 8 train_pos.txt':训练集,的词性标注结果(pretreatment.py生成的 txt文件)
298 | * 9 train_Wpos.txt:训练集,的分词和词性标注结果(pretreatment.py生成的 txt文件)
299 |
300 | * 10 train_positive_trigram.txt:训练集,正标签,的tri-gram结果(bi_tri_gram.py生成的 txt文件)
301 | * 11 train_negative_trigram.txt:训练集,负标签,的tri-gram结果(bi_tri_gram.py生成的 txt文件)
302 |
303 | * 12 wordsList.npy:数字索引词语变量(word2vec_test.py生成的 npy文件)
304 | * 13 wordIndexVector.npy:数字索引词向量变量(word2vec_test.py生成的 npy文件)
305 |
306 | * 14 train_positive_prefixPattern.txt:训练集,正标签,的所以频繁项(支持度50)(PrefixSpan.py生成的 txt文件)
307 | * 15 train_positive_prefixFrequentSub_sup50.txt:训练集,正标签,的所以频繁项(做了一些处理,比如删除中括号,只保留在train_positive_prefixPattern.txt中第一个中括号里面的频繁词序列)(支持度50)(PrefixSpan.py生成的 txt文件)
308 | * 16 train_positive_prefixFrequentSub_sup25.txt:训练集,正标签,的所以频繁项(做了一些处理,比如删除中括号,只保留在train_positive_prefixPattern.txt中第一个中括号里面的频繁词序列)(支持度25)(PrefixSpan.py生成的 txt文件)
309 |
310 | * 17 train_negative_prefixPattern.txt:训练集,负标签,的所以频繁项(支持度100)(PrefixSpan.py生成的 txt文件)
311 | * 18 train_negative_prefixFrequentSub_sup100.txt:训练集,负标签,的所以频繁项(做了一些处理,比如删除中括号,只保留在train_positive_prefixPattern.txt中第一个中括号里面的频繁词序列)(支持度100)(PrefixSpan.py生成的 txt文件)
312 | * 19 train_negative_prefixFrequentSub_sup50.txt:训练集,负标签,的所以频繁项(做了一些处理,比如删除中括号,只保留在train_positive_prefixPattern.txt中第一个中括号里面的频繁词序列)(支持度50)(PrefixSpan.py生成的 txt文件)
313 |
314 | * 20 train_squence_dict.txt:最终得到的训练集的频繁词序列!!!以及对应的区分度dist(这里最终选出的频繁词序列要求支持度dist>=0.85)(PrefixSpan.py生成的 txt文件)
315 |
316 | ****
317 |
318 | ### model文件夹下的数据文件介绍
319 | * 1 model.txt:XGBoost训练出来的模型的可视化(boost_tree.py生成的 txt文件)
320 | * 2 xgb.dump.raw.txt:LightGBM训练出来的模型的可视化(boost_tree.py生成的 txt文件)
321 |
322 | ****
323 |
324 | ### sentiment_dic文件夹下的数据文件介绍
325 | * 1 degree.txt:程度级别词语(中文)(txt文件)
326 | * 2 deny.txt:自己上网搜集的否定词典(txt文件)
327 | * 3 negative_comment.txt:负面评价词语(中文)(txt文件)
328 | * 4 negative_sentiment.txt:负面情感词语(中文)(txt文件)
329 | * 5 positive_comment.txt:正面评价词语(中文)(txt文件)
330 | * 6 positive_sentiment.txt:正面情感词语(中文)(txt文件)
331 |
332 | ****
333 |
334 | ### tool文件夹下的数据文件介绍
335 | 因为tool文件夹中的这个文件需要在百度云中下载,所以在我的github项目里面没有这个文件夹。
336 | * 1 zhwiki_2017_03.sg_50d.word2vec:搜狗词向量语料(word2vec文件)
337 |
338 | ### (end)
339 |
--------------------------------------------------------------------------------
/bi_tri_gram.py:
--------------------------------------------------------------------------------
1 | from nltk.util import ngrams
2 | import codecs # 写入txt文件
3 |
4 | # 读取txt文件
5 | def load_file(file_name):
6 | data = []
7 | with open(file_name, encoding='utf-8') as fin:
8 | for line in fin:
9 | line = line.strip().split()
10 | data.append(line)
11 | return data
12 |
13 | # 写入txt文件
14 | def write_file(data, file_name):
15 | fin = codecs.open(file_name, "w", "UTF-8")
16 | for i in range(len(data)):
17 | for j in range(len(data[i])):
18 | for k in range(len(data[i][j])):
19 | fin.write(str(data[i][j][k])+" ")
20 | fin.write(",")
21 | fin.write("\n")
22 | fin.close()
23 |
24 |
25 | # 生成bigram
26 | def bi_gram(data):
27 | data_bi_gram = []
28 | for i in range(len(data)):
29 | data_bi_gram.append([])
30 | data_bigram = ngrams(data[i],2)
31 | for i in data_bigram:
32 | data_bi_gram[-1].append(list(i))
33 | return data_bi_gram
34 |
35 |
36 | # 生成trigram
37 | def tri_gram(data):
38 | data_tri_gram = []
39 | for i in range(len(data)):
40 | data_tri_gram.append([])
41 | if len(data[i]) > 2:
42 | data_trigram = ngrams(data[i],3)
43 | else:
44 | data_trigram = ngrams(data[i],2)
45 | for i in data_trigram:
46 | data_tri_gram[-1].append(list(i))
47 | return data_tri_gram
48 |
49 |
50 | # 生成bigram,trigram
51 | def bi_tri_gram(data):
52 | data_bi_tri_gram = []
53 | for i in range(len(data)):
54 | data_bi_tri_gram.append([])
55 | data_bigram = ngrams(data[i],2)
56 | data_tringram = ngrams(data[i],3)
57 | for i in data_bigram:
58 | data_bi_tri_gram[-1].append(list(i))
59 | for i in data_tringram:
60 | data_bi_tri_gram[-1].append(list(i))
61 | return data_bi_tri_gram
62 |
63 |
64 | # 加载正、负文本的分词文件
65 | train_data_positive_cut = load_file('./lib/train_positive_cut.txt')
66 | train_data_negative_cut = load_file('./lib/train_negative_cut.txt')
67 |
68 | # 调用函数,生成文本的bigram、trigram
69 | # train_data_positive_bigram = bi_gram(train_data_positive_cut)
70 | # train_data_positive_bi_trigram = bi_tri_gram(train_data_positive_cut)
71 | train_data_positive_trigram = tri_gram(train_data_positive_cut)
72 | train_data_negative_trigram = tri_gram(train_data_negative_cut)
73 |
74 | # 将生成的bigram、trigram写入txt文件
75 | # write_file(train_data_positive_bigram, './lib/train_data_positive_bigram.txt')
76 | # write_file(train_data_positive_bi_trigram, './lib/train_data_positive_bi_trigram.txt')
77 | write_file(train_data_positive_trigram, './lib/train_positive_trigram.txt')
78 | write_file(train_data_negative_trigram, './lib/train_negative_trigram.txt')
79 |
80 |
81 |
82 |
83 |
--------------------------------------------------------------------------------
/boost_tree.py:
--------------------------------------------------------------------------------
1 | import numpy as np
2 | import xgboost as xgb
3 | import lightgbm as lgb
4 |
5 | '''
6 | 0: 'Sentence', (text)
7 | 1: 'feature_enti_num', (num)
8 | 2: 'feature_fresq', (set)
9 | 3: 'feature_pos', (set)
10 | 4: 'feature_senti_num', (num)
11 | 5: 'feature_sentiment', (cat)
12 | 6: 'feature_slen', (num)
13 | '''
14 | CAT_FEAT = [5]
15 | NUM_FEAT = [1, 4, 6]
16 | SET_FEAT = [2, 3]
17 |
18 | FEAT_TYPE = {0: 'text', 1: 'num', 2: 'set', 3: 'set', 4: 'num', 5: 'cat', 6: 'num'}
19 |
20 |
21 | # parse a string into fields, skip quotations
22 | def parse_feat(line):
23 | quota = False
24 | j = 0
25 | feats = []
26 | for i in range(len(line)):
27 | if line[i] == '\"':
28 | quota = not quota
29 | if line[i] == ',' and not quota:
30 | feat = line[j:i]
31 | feats.append(feat)
32 | j = i+1
33 | return feats + [line[j:]]
34 |
35 |
36 | # load a csv file, use parse_feat() to convert format
37 | def load_file(file_name):
38 | data = []
39 | with open(file_name, 'r') as fin:
40 | print('field_names:', fin.readline().strip().split(','))
41 | for line in fin:
42 | line = line.strip()
43 | data.append(parse_feat(line))
44 | return np.array(data)
45 |
46 | def get_feat_name(field, feat_val):
47 | assert field != 'text'
48 | if FEAT_TYPE[field] == 'cat':
49 | return str(field) + ':' + feat_val
50 | elif FEAT_TYPE[field] == 'num':
51 | return str(field) + ':'
52 | elif FEAT_TYPE[field] == 'set':
53 | return [str(field) + ':' + fv for fv in feat_val.split()]
54 |
55 | def build_feat_map(data):
56 | feat_map = {}
57 | for i in range(len(FEAT_TYPE)):
58 | if FEAT_TYPE[i] == 'num':
59 | fn = get_feat_name(i, None)
60 | if fn not in feat_map:
61 | feat_map[fn] = len(feat_map)
62 | continue
63 | elif FEAT_TYPE[i] == 'text':
64 | continue
65 |
66 | feat = data[:, i]
67 | for f in feat:
68 | if FEAT_TYPE[i] == 'cat':
69 | fn = get_feat_name(i, f)
70 | if fn not in feat_map:
71 | feat_map[fn] = len(feat_map)
72 | elif FEAT_TYPE[i] == 'set':
73 | for fn in get_feat_name(i, f):
74 | if fn not in feat_map:
75 | feat_map[fn] = len(feat_map)
76 | return feat_map
77 |
78 | def to_float(x):
79 | if len(x):
80 | return float(x)
81 | return -1
82 |
83 | def get_feat_id_val(field, feat_val):
84 | assert field != 'text'
85 | feat_name = get_feat_name(field, feat_val)
86 | if FEAT_TYPE[field] == 'cat':
87 | return feat_map[feat_name], 1
88 | elif FEAT_TYPE[field] == 'num':
89 | return feat_map[feat_name], to_float(feat_val)
90 | elif FEAT_TYPE[field] == 'set':
91 | return [feat_map[fn] for fn in feat_name], [1] * len(feat_name)
92 |
93 | def to_libsvm(data):
94 | libsvm_data = []
95 | for d in data:
96 | libsvm_data.append([])
97 | for i in range(len(FEAT_TYPE)):
98 | if FEAT_TYPE[i] == 'cat' or FEAT_TYPE[i] == 'num':
99 | fv = get_feat_id_val(i, d[i])
100 | libsvm_data[-1].append(fv)
101 | elif FEAT_TYPE[i] == 'set':
102 | fvs = get_feat_id_val(i, d[i])
103 | for fv in zip(*fvs):
104 | libsvm_data[-1].append(fv)
105 | return libsvm_data
106 |
107 |
108 | train_data = load_file('./feature/train.csv')
109 | # test_data = load_file('./feature/test.csv')
110 |
111 | train_id, train_label, train_feat = train_data[:, 0], train_data[:, 1], train_data[:, 2:]
112 | # test_id, test_feat = test_data[:, 0], test_data[:, 1:]
113 |
114 | print('train_feat:\n', train_feat[0])
115 | # print('test_feat:\n', test_feat[0])
116 |
117 | train_feat[:, 0] = None
118 | # test_feat[:, [1, 6]] = None
119 |
120 | print('train_feat:\n', train_feat[0])
121 | # print('test_feat:\n', test_feat[0])
122 |
123 | feat_map = build_feat_map(train_feat)
124 | # feat_map = build_feat_map(np.vstack([train_feat, test_feat]))
125 |
126 | train_data = to_libsvm(train_feat)
127 | # test_data = to_libsvm(test_feat)
128 |
129 | np.random.seed(123)
130 | rnd = np.random.random(len(train_data))
131 | train_ind = np.where(rnd < 0.8)[0]
132 | valid_ind = np.where(rnd >= 0.8)[0]
133 |
134 | MAX_FEAT = ' %d:0\n' % len(feat_map)
135 |
136 | flag = True
137 | with open('./feature/train.svm', 'w') as fout:
138 | for i in train_ind:
139 | line = train_label[i]
140 | for fv in train_data[i]:
141 | line += ' {}:{}'.format(*fv)
142 | if flag:
143 | line += MAX_FEAT
144 | flag = False
145 | else:
146 | line += '\n'
147 | fout.write(line)
148 |
149 | flag = True
150 | with open('./feature/valid.svm', 'w') as fout:
151 | for i in valid_ind:
152 | line = train_label[i]
153 | for fv in train_data[i]:
154 | line += ' {}:{}'.format(*fv)
155 | if flag:
156 | line += MAX_FEAT
157 | flag = False
158 | else:
159 | line += '\n'
160 | fout.write(line)
161 |
162 |
163 | dtrain = xgb.DMatrix('./feature/train.svm')
164 | dtest = xgb.DMatrix('./feature/valid.svm')
165 | param = {
166 | # learner params
167 | 'booster': 'gbtree', # gbtree ot gblinear
168 | 'nthread': 1,
169 | 'silent':1,
170 | # tree params
171 | 'eta':1,
172 | 'gamma': 0,
173 | 'max_depth':4,
174 | 'subsample': 1,
175 | 'lambda': 1,
176 | 'alpha': 0,
177 | # learning params
178 | 'objective':'binary:logistic',
179 | 'eval_metric': 'error', }
180 | evallist = [(dtrain, 'train'), (dtest, 'eval')]
181 | num_round = 50
182 | bst = xgb.train(param, dtrain, num_round, evallist, early_stopping_rounds=5)
183 | # bst.save_model('./model/xgb.model')
184 | bst.dump_model('./model/xgb.dump.raw.txt')
185 | # bst = xgb.Booster({'nthread': 4}) # init model
186 | # bst.load_model('xgb.model') # load data
187 |
188 |
189 |
190 | dtrain = lgb.Dataset('./feature/train.svm')
191 | dtest = lgb.Dataset('./feature/valid.svm')
192 | param = {
193 | 'objective':'binary',
194 | 'boosting': 'gbdt',
195 | 'num_threads': 1,
196 | 'learning_rate': 1,
197 | 'num_leaves': 31,
198 | 'max_depth': 9,
199 | 'metric': 'binary_error',
200 | 'lambda_l1': 0,
201 | 'lambda_l2': 0,
202 | }
203 |
204 | num_round = 100
205 | bst = lgb.train(param, dtrain, num_round, valid_sets=[dtest], early_stopping_rounds=5)
206 |
207 | bst.save_model('./model/model.txt')
208 | # json_model = bst.dump_model()
209 | # bst = lgb.Booster(model_file='model.txt')
--------------------------------------------------------------------------------
/feature_enti_num.py:
--------------------------------------------------------------------------------
1 | import matplotlib.pyplot as plt
2 | import codecs # 写入txt文件
3 |
4 | '''
5 | import nltk
6 | tokens = nltk.word_tokenize(train_data) #分词
7 | tagged = nltk.pos_tag(tokens) #词性标注
8 | entities = nltk.chunk.ne_chunk(tagged) #命名实体识别
9 | '''
10 |
11 |
12 | # 读取txt文件
13 | def load_file(file_name):
14 | data = [] # 保存数据
15 | with open(file_name, encoding='utf-8') as fin:
16 | for line in fin:
17 | line = line.strip().split()
18 | data.append(line)
19 | return data
20 |
21 | # 写入txt文件
22 | def write_file(data, file_name):
23 | fin = codecs.open(file_name, "w", "UTF-8")
24 | for i in range(len(data)):
25 | fin.write(str(data[i])+"\n")
26 | fin.close()
27 |
28 | # 画出特征的直方图分布
29 | def figure_attribution(pos_label, label_num):
30 | plt.hist(pos_label, label_num)
31 | plt.xlabel('pos_label')
32 | plt.ylabel('pos_label_num')
33 | # plt.axis([0, 24, 0, 1000]) # 限定坐标的范围
34 | plt.show()
35 |
36 |
37 | # 导入训练集的词性文本
38 | pos = load_file('./lib/train_pos.txt')
39 |
40 | # 统计每句话中的名词(在这里,我认为名词就是实体)
41 | enti_num = []
42 | for i in range(len(pos)):
43 | num = 0 # 初始化每句话的名词个数
44 | for j in range(len(pos[i])):
45 | spos = pos[i][j]
46 | if spos == 'n':
47 | num += 1
48 | elif spos == 'ng':
49 | num += 1
50 | elif spos == 'nl':
51 | num += 1
52 | elif spos == 'nr':
53 | num += 1
54 | elif spos == 'ns':
55 | num += 1
56 | elif spos == 'nt':
57 | num += 1
58 | elif spos == 'nz':
59 | num += 1
60 | enti_num.append(num)
61 |
62 | # 情感词个数的结果写入文件
63 | write_file(enti_num, './lib/train_feature_enti_num.txt')
64 |
65 | # 画出特征的直方图分布
66 | figure_attribution(enti_num, max(enti_num))
--------------------------------------------------------------------------------
/feature_fresq.py:
--------------------------------------------------------------------------------
1 | import matplotlib.pyplot as plt
2 | import codecs # 写入txt文件
3 |
4 | # 读取txt文件
5 | def load_file(file_name):
6 | data = [] # 保存数据
7 | with open(file_name, encoding='utf-8') as fin:
8 | for line in fin:
9 | line = line.strip().split()
10 | data.append(line)
11 | return data
12 |
13 | # 写入txt文件
14 | def write_file(data, file_name):
15 | fin = codecs.open(file_name, "w", "UTF-8")
16 | for i in range(len(data)):
17 | for j in range(len(data[i])):
18 | fin.write(str(data[i][j])+" ")
19 | fin.write("\n")
20 | fin.close()
21 |
22 | # 构造了7个特征对应的函数
23 | def feature_pos1(cut_row, cut_len, cut_label):
24 | for i in range(cut_len):
25 | if cut_row[i] == '一如既往':
26 | if i+1 < cut_len and cut_row[i+1] == '的':
27 | if i+2 < cut_len and cut_row[i+2] == '好':
28 | cut_label[-1].append(1)
29 |
30 |
31 | def feature_pos2(cut_row, cut_len, cut_label):
32 | for i in range(cut_len):
33 | if cut_row[i] == '不错':
34 | cut_label[-1].append(2)
35 |
36 | def feature_pos3(cut_row, cut_len, cut_label):
37 | for i in range(cut_len):
38 | if cut_row[i] == '不错':
39 | if i+1 < cut_len and cut_row[i+1] == '的':
40 | cut_label[-1].append(3)
41 |
42 | def feature_pos4(cut_row, cut_len, cut_label):
43 | for i in range(cut_len):
44 | if cut_row[i] == '古色古香':
45 | cut_label[-1].append(4)
46 |
47 | def feature_pos5(cut_row, cut_len, cut_label):
48 | for i in range(cut_len):
49 | if cut_row[i] == '味道':
50 | if i+1 < cut_len and cut_row[i+1] == '不错':
51 | cut_label[-1].append(5)
52 |
53 | def feature_pos6(cut_row, cut_len, cut_label):
54 | for i in range(cut_len):
55 | if cut_row[i] == '很':
56 | if i+1 < cut_len and cut_row[i+1] == '不错':
57 | cut_label[-1].append(6)
58 |
59 | def feature_pos7(cut_row, cut_len, cut_label):
60 | for i in range(cut_len):
61 | if cut_row[i] == '很':
62 | if i+1 < cut_len and cut_row[i+1] == '好':
63 | cut_label[-1].append(7)
64 |
65 | def feature_pos8(cut_row, cut_len, cut_label):
66 | for i in range(cut_len):
67 | if cut_row[i] == '很':
68 | if i+1 < cut_len and cut_row[i+1] == '新鲜':
69 | cut_label[-1].append(8)
70 |
71 | def feature_pos9(cut_row, cut_len, cut_label):
72 | for i in range(cut_len):
73 | if cut_row[i] == '得':
74 | if i+1 < cut_len and cut_row[i+1] == '恰到好处':
75 | cut_label[-1].append(9)
76 |
77 | def feature_pos10(cut_row, cut_len, cut_label):
78 | for i in range(cut_len):
79 | if cut_row[i] == '恰到好处':
80 | cut_label[-1].append(10)
81 |
82 | def feature_pos11(cut_row, cut_len, cut_label):
83 | for i in range(cut_len):
84 | if cut_row[i] == '新鲜':
85 | cut_label[-1].append(11)
86 |
87 | def feature_pos12(cut_row, cut_len, cut_label):
88 | for i in range(cut_len):
89 | if cut_row[i] == '最':
90 | cut_label[-1].append(12)
91 |
92 | def feature_pos13(cut_row, cut_len, cut_label):
93 | for i in range(cut_len):
94 | if cut_row[i] == '服务':
95 | cut_label[-1].append(13)
96 |
97 | def feature_pos14(cut_row, cut_len, cut_label):
98 | for i in range(cut_len):
99 | if cut_row[i] == '服务态度':
100 | cut_label[-1].append(14)
101 |
102 | def feature_pos15(cut_row, cut_len, cut_label):
103 | for i in range(cut_len):
104 | if cut_row[i] == '烤':
105 | cut_label[-1].append(15)
106 |
107 | def feature_pos16(cut_row, cut_len, cut_label):
108 | for i in range(cut_len):
109 | if cut_row[i] == '的':
110 | if i+1 < cut_len and cut_row[i+1] == '恰到好处':
111 | cut_label[-1].append(16)
112 |
113 | def feature_pos17(cut_row, cut_len, cut_label):
114 | for i in range(cut_len):
115 | if cut_row[i] == '还':
116 | cut_label[-1].append(17)
117 |
118 | def feature_pos18(cut_row, cut_len, cut_label):
119 | for i in range(cut_len):
120 | if cut_row[i] == '还不错':
121 | cut_label[-1].append(18)
122 |
123 | #多维list转化为1维度list(相当于把列表压平),递归
124 | def getnewList(newlist):
125 | d = []
126 | for element in newlist:
127 | if not isinstance(element,list):
128 | d.append(element)
129 | else:
130 | d.extend(getnewList(element))
131 | return d
132 |
133 |
134 | # 画出特征的直方图分布
135 | def figure_attribution(fresq_label, label_num):
136 | plt.hist(fresq_label, label_num)
137 | plt.xlabel('fresq_label')
138 | plt.ylabel('fresq_label_num')
139 | # plt.axis([0, 24, 0, 1000]) # 限定坐标的范围
140 | plt.show()
141 |
142 | def call_feature(cut):
143 | cut_label = [] # 初始化词性组合模式的标签为0
144 | for i in range(len(cut)):
145 | cut_label.append([])
146 | cut_row = cut[i] # 句子的某一行(词性)
147 | cut_len = len(cut[i]) # 句子的长度(词性)
148 | feature_pos1(cut_row, cut_len, cut_label)
149 | feature_pos2(cut_row, cut_len, cut_label)
150 | feature_pos3(cut_row, cut_len, cut_label)
151 | feature_pos4(cut_row, cut_len, cut_label)
152 | feature_pos5(cut_row, cut_len, cut_label)
153 | feature_pos6(cut_row, cut_len, cut_label)
154 | feature_pos7(cut_row, cut_len, cut_label)
155 | feature_pos8(cut_row, cut_len, cut_label)
156 | feature_pos9(cut_row, cut_len, cut_label)
157 | feature_pos10(cut_row, cut_len, cut_label)
158 | feature_pos11(cut_row, cut_len, cut_label)
159 | feature_pos12(cut_row, cut_len, cut_label)
160 | feature_pos13(cut_row, cut_len, cut_label)
161 | feature_pos14(cut_row, cut_len, cut_label)
162 | feature_pos15(cut_row, cut_len, cut_label)
163 | feature_pos16(cut_row, cut_len, cut_label)
164 | feature_pos17(cut_row, cut_len, cut_label)
165 | feature_pos18(cut_row, cut_len, cut_label)
166 | if len(cut_label[i]) == 0: # 如果一句话不具有以上任何一种频繁词序列模式,则赋值0
167 | cut_label[-1].append(0)
168 | return cut_label
169 |
170 |
171 | cut = load_file('./lib/train_cut.txt')
172 | fresq_label = call_feature(cut)
173 |
174 | # 频繁词序列模式的结果写入文件
175 | write_file(fresq_label, './lib/train_feature_fresq.txt')
176 |
177 | # 画出特征的直方图分布
178 | figure_attribution(getnewList(fresq_label), 18)
179 | # cut_label是频繁词序列模式得到的特征!!!
--------------------------------------------------------------------------------
/feature_low_fre.py:
--------------------------------------------------------------------------------
1 | import codecs # 写入txt文件
2 | import matplotlib.pyplot as plt
3 |
4 | # 打开情感词典文件,返回列表
5 | def open_dict(Dict, path = './sentiment_dic/'):
6 | path = path + '%s.txt' %Dict
7 | dictionary = open(path, 'r', encoding='utf-8',errors='ignore')
8 | dict = []
9 | for word in dictionary:
10 | word = word.strip('\n').strip()
11 | dict.append(word)
12 | return dict
13 |
14 | # 读取txt文件
15 | def load_file(file_name):
16 | data = [] # 保存数据
17 | with open(file_name, encoding='utf-8') as fin:
18 | for line in fin:
19 | line = line.strip().split()
20 | data.append(line)
21 | return data
22 |
23 | # 写入txt文件
24 | def write_file(data, file_name):
25 | fin = codecs.open(file_name, "w", "UTF-8")
26 | for i in range(len(data)):
27 | fin.write(str(data[i])+"\n")
28 | fin.close()
29 |
30 | # 画出特征的直方图分布
31 | def figure_attribution(label, label_num):
32 | plt.hist(label, label_num)
33 | plt.xlabel('label')
34 | plt.ylabel('label_num')
35 | # plt.axis([0, 24, 0, 1000]) # 限定坐标的范围
36 | plt.show()
37 |
38 | # 统计词频
39 | def wordcount(cut):
40 | count_dict = {}
41 | for i in range(len(cut)):
42 | for j in range(len(cut[i])):
43 | word = cut[i][j]
44 | if word in count_dict.keys():
45 | count_dict[word] += 1
46 | else:
47 | count_dict[word] = 1
48 | #按照词频从高到低排列
49 | count_list=sorted(count_dict.items(),key=lambda x:x[1],reverse=True)
50 | return count_list
51 | # return count_dict
52 |
53 |
54 | # 导入训练集的分词文本
55 | cut = load_file('./lib/train_cut.txt')
56 |
57 | # 统计训练集文本的词频
58 | count_list = wordcount(cut)
59 |
60 |
61 | # 情感词个数的结果写入文件
62 | # write_file(senti_num, './lib/train_feature_senti_num.txt')
63 |
64 | # 画出特征的直方图分布
65 | # figure_attribution(senti_num, max(senti_num))
66 |
--------------------------------------------------------------------------------
/feature_pos.py:
--------------------------------------------------------------------------------
1 | import matplotlib.pyplot as plt
2 | import codecs # 写入txt文件
3 |
4 | # 读取txt文件
5 | def load_file(file_name):
6 | data = [] # 保存数据
7 | with open(file_name, encoding='utf-8') as fin:
8 | for line in fin:
9 | line = line.strip().split()
10 | data.append(line)
11 | return data
12 |
13 | # 写入txt文件
14 | def write_file(data, file_name):
15 | fin = codecs.open(file_name, "w", "UTF-8")
16 | for i in range(len(data)):
17 | for j in range(len(data[i])):
18 | fin.write(str(data[i][j])+" ")
19 | fin.write("\n")
20 | fin.close()
21 |
22 | # 构造了7个特征对应的函数
23 | def feature_pos1(pos_row, pos_len, pos_label):
24 | for i in range(pos_len):
25 | if pos_row[i] == 'a' or \
26 | pos_row[i] == 'ad' or \
27 | pos_row[i] == 'ag' or \
28 | pos_row[i] == 'al' or \
29 | pos_row[i] == 'an':
30 | if i+1 < pos_len:
31 | if pos_row[i+1] == 'a' or \
32 | pos_row[i+1] == 'ad' or \
33 | pos_row[i+1] == 'ag' or \
34 | pos_row[i+1] == 'al' or \
35 | pos_row[i+1] == 'an':
36 | pos_label[-1].append(1)
37 |
38 | def feature_pos2(pos_row, pos_len, pos_label):
39 | for i in range(pos_len):
40 | if pos_row[i] == 'a' or \
41 | pos_row[i] == 'ad' or \
42 | pos_row[i] == 'ag' or \
43 | pos_row[i] == 'al' or \
44 | pos_row[i] == 'an':
45 | if i+1 < pos_len:
46 | if pos_row[i+1] == 'n' or \
47 | pos_row[i+1] == 'ng' or \
48 | pos_row[i+1] == 'nl' or \
49 | pos_row[i+1] == 'nr' or \
50 | pos_row[i+1] == 'ns' or \
51 | pos_row[i+1] == 'nt' or \
52 | pos_row[i+1] == 'nz':
53 | pos_label[-1].append(2)
54 |
55 | def feature_pos3(pos_row, pos_len, pos_label):
56 | for i in range(pos_len):
57 | if pos_row[i] == 'a' or \
58 | pos_row[i] == 'ad' or \
59 | pos_row[i] == 'ag' or \
60 | pos_row[i] == 'al' or \
61 | pos_row[i] == 'an':
62 | if i+1 < pos_len and pos_row[i+1] == 'uj':
63 | if i+2 < pos_len:
64 | if pos_row[i+2] == 'n' or \
65 | pos_row[i+2] == 'ng' or \
66 | pos_row[i+2] == 'nl' or \
67 | pos_row[i+2] == 'nr' or \
68 | pos_row[i+2] == 'ns' or \
69 | pos_row[i+2] == 'nt' or \
70 | pos_row[i+2] == 'nz':
71 | pos_label[-1].append(3)
72 |
73 | def feature_pos4(pos_row, pos_len, pos_label):
74 | for i in range(pos_len):
75 | if pos_row[i] == 'd' or pos_row[i] == 'zg':
76 | if i+1 < pos_len:
77 | if pos_row[i+1] == 'a' or \
78 | pos_row[i+1] == 'ad' or \
79 | pos_row[i+1] == 'ag' or \
80 | pos_row[i+1] == 'al' or \
81 | pos_row[i+1] == 'an':
82 | pos_label[-1].append(4)
83 |
84 | # vd vf vg vi vl vn vs vx vy
85 | def feature_pos5(pos_row, pos_len, pos_label):
86 | for i in range(pos_len):
87 | if pos_row[i] == 'd' or pos_row[i] == 'zg':
88 | if i+1 < pos_len:
89 | if pos_row[i+1] == 'v' or \
90 | pos_row[i+1] == 'vd' or \
91 | pos_row[i+1] == 'vf' or \
92 | pos_row[i+1] == 'vg' or \
93 | pos_row[i+1] == 'vi' or \
94 | pos_row[i+1] == 'vl' or \
95 | pos_row[i+1] == 'vn' or \
96 | pos_row[i+1] == 'vs' or \
97 | pos_row[i+1] == 'vx' or \
98 | pos_row[i+1] == 'vy':
99 | pos_label[-1].append(5)
100 |
101 | def feature_pos6(pos_row, pos_len, pos_label):
102 | for i in range(pos_len):
103 | if pos_row[i] == 'd':
104 | if i+1 < pos_len:
105 | if pos_row[i+1] == 'd' or pos_row[i+1] == 'zg':
106 | if i+2 < pos_len:
107 | if pos_row[i+2] == 'a' or \
108 | pos_row[i+2] == 'ad' or \
109 | pos_row[i+2] == 'ag' or \
110 | pos_row[i+2] == 'al' or \
111 | pos_row[i+2] == 'an':
112 | pos_label[-1].append(6)
113 |
114 | def feature_pos7(pos_row, pos_len, pos_label):
115 | for i in range(pos_len):
116 | if pos_row[i] == 'n' or \
117 | pos_row[i] == 'ng' or \
118 | pos_row[i] == 'nl' or \
119 | pos_row[i] == 'nr' or \
120 | pos_row[i] == 'ns' or \
121 | pos_row[i] == 'nt' or \
122 | pos_row[i] == 'nz':
123 | if i+1 < pos_len:
124 | if pos_row[i+1] == 'a' or \
125 | pos_row[i+1] == 'ad' or \
126 | pos_row[i+1] == 'ag' or \
127 | pos_row[i+1] == 'al' or \
128 | pos_row[i+1] == 'an':
129 | pos_label[-1].append(7)
130 |
131 |
132 | #多维list转化为1维度list(相当于把列表压平),递归
133 | def getnewList(newlist):
134 | d = []
135 | for element in newlist:
136 | if not isinstance(element,list):
137 | d.append(element)
138 | else:
139 | d.extend(getnewList(element))
140 | return d
141 |
142 |
143 | # 画出特征的直方图分布
144 | def figure_attribution(pos_label, label_num):
145 | plt.hist(pos_label, label_num)
146 | plt.xlabel('pos_label')
147 | plt.ylabel('pos_label_num')
148 | # plt.axis([0, 24, 0, 1000]) # 限定坐标的范围
149 | plt.show()
150 |
151 |
152 | def call_feature(pos):
153 | pos_label = [] # 初始化词性组合模式的标签为0
154 | for i in range(len(pos)):
155 | pos_label.append([])
156 | pos_row = pos[i] # 句子的某一行(词性)
157 | pos_len = len(pos[i]) # 句子的长度(词性)
158 | feature_pos1(pos_row, pos_len, pos_label)
159 | feature_pos2(pos_row, pos_len, pos_label)
160 | feature_pos3(pos_row, pos_len, pos_label)
161 | feature_pos4(pos_row, pos_len, pos_label)
162 | feature_pos5(pos_row, pos_len, pos_label)
163 | feature_pos6(pos_row, pos_len, pos_label)
164 | feature_pos7(pos_row, pos_len, pos_label)
165 | if len(pos_label[i]) == 0: # 如果一句话不具有以上任何一种频繁词序列模式,则赋值0
166 | pos_label[-1].append(0)
167 | return pos_label
168 |
169 |
170 | # 导入训练集的词性文本
171 | pos = load_file('./lib/train_pos.txt')
172 | pos_label = call_feature(pos)
173 |
174 | # 词性组合模式的结果写入文件
175 | write_file(pos_label, './lib/train_feature_pos.txt')
176 |
177 | # 画出特征的直方图分布
178 | figure_attribution(getnewList(pos_label), 7)
179 | # pos_label是词性组合模式得到的特征!!!
--------------------------------------------------------------------------------
/feature_senti_num.py:
--------------------------------------------------------------------------------
1 | import codecs # 写入txt文件
2 | import matplotlib.pyplot as plt
3 |
4 | # 打开情感词典文件,返回列表
5 | def open_dict(Dict, path = './sentiment_dic/'):
6 | path = path + '%s.txt' %Dict
7 | dictionary = open(path, 'r', encoding='utf-8',errors='ignore')
8 | dict = []
9 | for word in dictionary:
10 | word = word.strip('\n').strip()
11 | dict.append(word)
12 | return dict
13 |
14 | # 读取txt文件
15 | def load_file(file_name):
16 | data = [] # 保存数据
17 | with open(file_name, encoding='utf-8') as fin:
18 | for line in fin:
19 | line = line.strip().split()
20 | data.append(line)
21 | return data
22 |
23 | # 写入txt文件
24 | def write_file(data, file_name):
25 | fin = codecs.open(file_name, "w", "UTF-8")
26 | for i in range(len(data)):
27 | fin.write(str(data[i])+"\n")
28 | fin.close()
29 |
30 | # 画出特征的直方图分布
31 | def figure_attribution(label, label_num):
32 | plt.hist(label, label_num)
33 | plt.xlabel('label')
34 | plt.ylabel('label_num')
35 | # plt.axis([0, 24, 0, 1000]) # 限定坐标的范围
36 | plt.show()
37 |
38 |
39 | # 导入训练集的分词文本
40 | cut = load_file('./lib/train_cut.txt')
41 |
42 | # 合并所有的积极情感和消极情感的词典
43 | sentiment_dict = open_dict(Dict='positive_sentiment') + open_dict(Dict='positive_comment') + \
44 | open_dict(Dict = 'negative_sentiment') + open_dict(Dict='negative_comment')
45 |
46 | # 统计每句话中的情感词
47 | senti_num = []
48 | for i in range(len(cut)):
49 | num = 0 # 初始化每句话的情感词个数
50 | for j in range(len(cut[i])):
51 | if cut[i][j] in sentiment_dict:
52 | num += 1
53 | senti_num.append(num)
54 |
55 | # 情感词个数的结果写入文件
56 | write_file(senti_num, './lib/train_feature_senti_num.txt')
57 |
58 | # 画出特征的直方图分布
59 | figure_attribution(senti_num, max(senti_num))
60 |
61 |
62 |
63 |
64 |
65 |
66 |
67 |
68 |
--------------------------------------------------------------------------------
/feature_sentiment.py:
--------------------------------------------------------------------------------
1 | #本脚本主要实现了基于python通过已有的情感词典对文本数据做的情感分析的项目目的
2 | import numpy as np
3 | import matplotlib.pyplot as plt
4 | import codecs # 写入txt文件
5 |
6 | # 打开情感词典文件,返回列表
7 | def open_dict(Dict, path = './sentiment_dic/'):
8 | path = path + '%s.txt' %Dict
9 | dictionary = open(path, 'r', encoding='utf-8',errors='ignore')
10 | dict = []
11 | for word in dictionary:
12 | word = word.strip('\n').strip()
13 | dict.append(word)
14 | return dict
15 |
16 | # 读取txt文件,这里是为了读取分词后的文本
17 | def load_file(file_name):
18 | data = [] # 保存数据
19 | with open(file_name, encoding='utf-8') as fin:
20 | for line in fin:
21 | line = line.strip().split()
22 | data.append(line)
23 | return data
24 |
25 | # 写入txt文件
26 | def write_file(data, file_name):
27 | fin = codecs.open(file_name, "w", "UTF-8")
28 | for i in range(len(data)):
29 | fin.write(str(data[i])+"\n")
30 | fin.close()
31 |
32 | def judgeodd(num): #往情感词前查找否定词,找完全部否定词,若数量为奇数,乘以-1,若数量为偶数,乘以1.
33 | if num % 2 == 0:
34 | return 'even'
35 | else:
36 | return 'odd'
37 |
38 |
39 | def sentiment_score_list(cut):
40 | count1 = []
41 | count2 = []
42 | for segtmp in cut:
43 | #print(sen)# 循环遍历每一个评论
44 | #print(segtmp)
45 | i = 0 #记录扫描到的词的位置
46 | a = 0 #记录情感词的位置
47 | poscount = 0 # 积极词的第一次分值
48 | poscount2 = 0 # 积极反转后的分值
49 | poscount3 = 0 # 积极词的最后分值(包括叹号的分值)
50 | negcount = 0
51 | negcount2 = 0
52 | negcount3 = 0
53 | for word in segtmp:
54 | if word in posdict: # 判断词语是否是积极情感词
55 | poscount +=1
56 | c = 0
57 | for w in segtmp[a:i]: # 扫描情感词前的程度词
58 | if w in mostdict:
59 | poscount *= 4.0
60 | elif w in verydict:
61 | poscount *= 3.0
62 | elif w in moredict:
63 | poscount *= 2.0
64 | elif w in ishdict:
65 | poscount *= 0.5
66 | elif w in insuffhdict:
67 | poscount *= 0.3
68 | elif w in deny_word: c+= 1
69 | if judgeodd(c) == 'odd': # 扫描情感词前的否定词数
70 | poscount *= -1.0
71 | poscount2 += poscount
72 | poscount = 0
73 | poscount3 = poscount + poscount2 + poscount3
74 | poscount2 = 0
75 | else:
76 | poscount3 = poscount + poscount2 + poscount3
77 | poscount = 0
78 | a = i+1
79 | elif word in negdict: # 消极情感的分析,与上面一致
80 | negcount += 1
81 | d = 0
82 | for w in segtmp[a:i]:
83 | if w in mostdict:
84 | negcount *= 4.0
85 | elif w in verydict:
86 | negcount *= 3.0
87 | elif w in moredict:
88 | negcount *= 2.0
89 | elif w in ishdict:
90 | negcount *= 0.5
91 | elif w in insuffhdict:
92 | poscount *= 0.3
93 | elif w in degree_word:
94 | d += 1
95 | if judgeodd(d) == 'odd':
96 | negcount *= -1.0
97 | negcount2 += negcount
98 | negcount = 0
99 | negcount3 = negcount + negcount2 + negcount3
100 | negcount2 = 0
101 | else:
102 | negcount3 = negcount + negcount2 + negcount3
103 | negcount = 0
104 | a = i + 1
105 | elif word == '!' or word == '!': # 判断句子是否有感叹号
106 | for w2 in segtmp[::-1]: # 扫描感叹号前的情感词,发现后权值+2,然后退出循环
107 | if w2 in posdict:
108 | poscount3 += 2
109 | elif w2 in negdict:
110 | negcount3 += 2
111 | else:
112 | poscount3 +=0
113 | negcount3 +=0
114 | break
115 | else:
116 | poscount3=0
117 | negcount3=0
118 | i += 1
119 |
120 | # 以下是防止出现负数的情况
121 | pos_count = 0
122 | neg_count = 0
123 | if poscount3 <0 and negcount3 > 0:
124 | neg_count = negcount3 - poscount3
125 | pos_count = 0
126 | elif negcount3 <0 and poscount3 > 0:
127 | pos_count = poscount3 - negcount3
128 | neg_count = 0
129 | elif poscount3 <0 and negcount3 < 0:
130 | neg_count = -pos_count
131 | pos_count = -neg_count
132 | else:
133 | pos_count = poscount3
134 | neg_count = negcount3
135 | count1.append([pos_count,neg_count]) #返回每条评论打分后的列表
136 | #print(count1)
137 | count2.append(count1)
138 | count1=[]
139 | #print(count2)
140 | return count2 #返回所有评论打分后的列表
141 |
142 | def sentiment_score(senti_score_list):#分析完所有评论后,正式对每句评论打情感分
143 | score = []
144 | sentiment_label = []
145 | for review in senti_score_list:#senti_score_list
146 | score_array = np.array(review)
147 | Pos = np.sum(score_array[:,0])#积极总分
148 | Neg = np.sum(score_array[:,1])#消极总分
149 | AvgPos = np.mean(score_array[:,0])#积极情感均值
150 | AvgPos = float('%.lf' % AvgPos)
151 | AvgNeg = np.mean(score_array[:, 1])#消极情感均值
152 | AvgNeg = float('%.1f' % AvgNeg)
153 | StdPos = np.std(score_array[:, 0])#积极情感方差
154 | StdPos = float('%.1f' % StdPos)
155 | StdNeg = np.std(score_array[:, 1])#消极情感方差
156 | StdNeg = float('%.1f' % StdNeg)
157 | res=Pos-Neg # 最终情感得分
158 | # 情感得分细节:总得分,积极得分,消极得分,积极情感均值,消极情感均值,积极情感方差,消极情感方差
159 | score.append([res, Pos, Neg, AvgPos, AvgNeg, StdPos, StdNeg])
160 | if res>0:
161 | sentiment_label.append(2) # 好评
162 | elif res<0:
163 | sentiment_label.append(1) # 差评
164 | else:
165 | sentiment_label.append(0) # 中评
166 | return sentiment_label
167 |
168 | # 画出特征的直方图分布
169 | def figure_attribution(sentiment_label, label_num):
170 | plt.hist(sentiment_label, label_num)
171 | plt.xlabel('sentiment_label')
172 | plt.ylabel('sentiment_label_num')
173 | # plt.axis([0, 24, 0, 1000]) # 限定坐标的范围
174 | plt.show()
175 |
176 | deny_word = open_dict(Dict='deny')#否定词词典
177 | posdict = open_dict(Dict='positive_sentiment') + open_dict(Dict='positive_comment') #积极词典
178 | negdict = open_dict(Dict = 'negative_sentiment') + open_dict(Dict='negative_comment') # 消极词典
179 | degree_word = open_dict(Dict = 'degree')#程度词词典
180 |
181 | #为程度词设置权重
182 | mostdict = degree_word[degree_word.index('extreme')+1: degree_word.index('very')] #权重4,即在情感前乘以3
183 | verydict = degree_word[degree_word.index('very')+1: degree_word.index('more')] #权重3
184 | moredict = degree_word[degree_word.index('more')+1: degree_word.index('ish')]#权重2
185 | ishdict = degree_word[degree_word.index('ish')+1: degree_word.index('insufficiently')]#权重0.5
186 | insuffhdict = degree_word[degree_word.index('insufficiently')+1: degree_word.index('over')]#权重0.3
187 | overdict = degree_word[degree_word.index('over')+1: degree_word.index('last')]#权重-0.5,这个程度词先不管
188 |
189 |
190 | #读取要做情感分析的文本,这里读取的是已经分词后的文本
191 | cut = load_file('./lib/train_cut.txt')
192 |
193 | # 返回每句话的情感标签
194 | sentiment_label = sentiment_score(sentiment_score_list(cut))
195 |
196 | # 情感模式的结果写入文件
197 | write_file(sentiment_label, './lib/train_feature_sentiment.txt')
198 |
199 | # 画出特征的直方图分布
200 | figure_attribution(sentiment_label, 3)
--------------------------------------------------------------------------------
/feature_slen.py:
--------------------------------------------------------------------------------
1 | import codecs # 写入txt文件
2 | import matplotlib.pyplot as plt
3 |
4 | # 读取txt文件
5 | def load_file(file_name):
6 | data = [] # 保存数据
7 | with open(file_name, encoding='utf-8') as fin:
8 | for line in fin:
9 | line = line.strip().split()
10 | data.append(line)
11 | return data
12 |
13 | # 写入txt文件
14 | def write_file(data, file_name):
15 | fin = codecs.open(file_name, "w", "UTF-8")
16 | for i in range(len(data)):
17 | fin.write(str(data[i])+"\n")
18 | fin.close()
19 |
20 | # 画出特征的直方图分布
21 | def figure_attribution(label, label_num):
22 | plt.hist(label, label_num)
23 | plt.xlabel('label')
24 | plt.ylabel('label_num')
25 | # plt.axis([0, 24, 0, 1000]) # 限定坐标的范围
26 | plt.show()
27 |
28 |
29 | # 导入训练集的分词文本
30 | cut = load_file('./lib/train_cut.txt')
31 |
32 | # 统计每句话的长度
33 | sentence_length = []
34 | for i in range(len(cut)):
35 | sentence_length.append(len(cut[i]))
36 |
37 | # 句子长度的结果写入文件
38 | write_file(sentence_length, './lib/train_feature_slen.txt')
39 |
40 | # 画出特征的直方图分布
41 | figure_attribution(sentence_length, max(sentence_length))
--------------------------------------------------------------------------------
/import_csv.py:
--------------------------------------------------------------------------------
1 | import numpy as np
2 | import pandas as pd
3 |
4 |
5 | # 读取txt文件,并且转成数组类型
6 | # 如果flag是1,会把读取文件的每一行都按空格分割开;如果flag是2,就不分割
7 | def load_file(file_name, flag):
8 | data = [] # 保存数据
9 | with open(file_name, encoding='utf-8') as fin:
10 | for line in fin:
11 | if flag == 1:
12 | line = line.strip().split()
13 | if flag == 2:
14 | line = line.strip()
15 | data.append(line)
16 | return data
17 | # return np.array(data)
18 |
19 |
20 | train = np.array(load_file('./lib/train.txt', 1)) # 因为读取train.txt文件需要把句子和标签分开,所以flag=1
21 | feature_pos = load_file('./lib/train_feature_pos.txt', 2) # 词性组合模式
22 | feature_fresq = load_file('./lib/train_feature_fresq.txt', 2) # 频繁词序列模式
23 | feature_sentiment = load_file('./lib/train_feature_sentiment.txt', 2) # 情感打分
24 | feature_slen = load_file('./lib/train_feature_slen.txt', 2) # 句子长度
25 | feature_senti_num = load_file('./lib/train_feature_senti_num.txt', 2) # 情感词个数
26 | feature_enti_num = load_file('./lib/train_feature_enti_num.txt', 2) # 实体个数
27 |
28 |
29 | #字典中的key值即为csv中列名
30 | dataframe = pd.DataFrame({'Label':train[:,0], 'Sentence':train[:,1], \
31 | 'feature_pos':feature_pos, 'feature_fresq':feature_fresq, \
32 | 'feature_sentiment':feature_sentiment, 'feature_slen':feature_slen, \
33 | 'feature_senti_num':feature_senti_num, 'feature_enti_num':feature_enti_num})
34 |
35 | #将DataFrame存储为csv,index表示是否显示行名,default=True
36 | dataframe.to_csv("./feature/train.csv", index=True)
37 |
38 |
39 |
--------------------------------------------------------------------------------
/lib/train_negative_prefixFrequentSub_sup100.txt:
--------------------------------------------------------------------------------
1 | pattern:超级, support:103
2 | pattern:口感, support:104
3 | pattern:高, support:104
4 | pattern:店里, support:106
5 | pattern:位置, support:108
6 | pattern:有点, support:109
7 | pattern:辣, support:110
8 | pattern:态度, support:110
9 | pattern:得, support:115
10 | pattern:一家, support:116
11 | pattern:新开, support:119
12 | pattern:新开, 的, support:103
13 | pattern:牛肉, support:125
14 | pattern:团购, support:131
15 | pattern:做, support:134
16 | pattern:菜, support:135
17 | pattern:人, support:137
18 | pattern:真的, support:138
19 | pattern:好找, support:143
20 | pattern:可以, support:145
21 | pattern:在, support:150
22 | pattern:店, support:162
23 | pattern:菜品, support:175
24 | pattern:免费, support:197
25 | pattern:口味, support:205
26 | pattern:装修, support:209
27 | pattern:有, support:256
28 | pattern:特别, support:268
29 | pattern:特别, 好, support:146
30 | pattern:感觉, support:275
31 | pattern:多, support:276
32 | pattern:服务, support:286
33 | pattern:服务态度, support:294
34 | pattern:服务态度, 很, support:208
35 | pattern:服务态度, 很, 好, support:183
36 | pattern:服务态度, 好, support:219
37 | pattern:吃, support:366
38 | pattern:好吃, support:371
39 | pattern:非常, support:383
40 | pattern:非常, 好, support:188
41 | pattern:和, support:389
42 | pattern:环境, support:436
43 | pattern:环境, 不错, support:127
44 | pattern:环境, 很, support:155
45 | pattern:还, support:455
46 | pattern:还, 不错, support:381
47 | pattern:是, support:544
48 | pattern:一如既往, support:547
49 | pattern:一如既往, 的, support:453
50 | pattern:一如既往, 的, 好, support:321
51 | pattern:都, support:547
52 | pattern:都, 很, support:125
53 | pattern:都, 不错, support:138
54 | pattern:恰到好处, support:571
55 | pattern:了, support:713
56 | pattern:味道, support:1277
57 | pattern:味道, 很, support:208
58 | pattern:味道, 很, 不错, support:130
59 | pattern:味道, 的, support:219
60 | pattern:味道, 的, 味道, support:126
61 | pattern:味道, 一如既往, support:249
62 | pattern:味道, 一如既往, 的, support:203
63 | pattern:味道, 不错, support:562
64 | pattern:好, support:1559
65 | pattern:很, support:2058
66 | pattern:很, 好找, support:130
67 | pattern:很, 好吃, support:157
68 | pattern:很, 不错, support:387
69 | pattern:很, 好, support:653
70 | pattern:不错, support:2632
71 | pattern:不错, 的, support:306
72 | pattern:的, support:3871
73 | pattern:的, 味道, support:134
74 | pattern:的, 恰到好处, support:149
75 | pattern:的, 好, support:371
76 |
--------------------------------------------------------------------------------
/lib/train_negative_prefixFrequentSub_sup50.txt:
--------------------------------------------------------------------------------
1 | pattern:饭, support:50
2 | pattern:原汁原味, support:51
3 | pattern:三文鱼, support:52
4 | pattern:便宜, support:52
5 | pattern:豆腐, support:53
6 | pattern:面包, support:54
7 | pattern:新, support:55
8 | pattern:有种, support:55
9 | pattern:朋友, support:55
10 | pattern:生意, support:55
11 | pattern:芝士, support:56
12 | pattern:风格, support:56
13 | pattern:一个, support:58
14 | pattern:啊, support:58
15 | pattern:要, support:60
16 | pattern:虾, support:60
17 | pattern:类似, support:60
18 | pattern:着, support:60
19 | pattern:烤, support:60
20 | pattern:个, support:60
21 | pattern:真心, support:61
22 | pattern:会, support:63
23 | pattern:蛋糕, support:64
24 | pattern:汤, support:64
25 | pattern:鱼, support:66
26 | pattern:整体, support:66
27 | pattern:总体, support:68
28 | pattern:茶, support:69
29 | pattern:里, support:69
30 | pattern:水果, support:70
31 | pattern:价格, support:70
32 | pattern:挺, support:70
33 | pattern:地方, support:72
34 | pattern:新鲜, support:72
35 | pattern:最, support:72
36 | pattern:饮料, support:72
37 | pattern:很大, support:73
38 | pattern:选择, support:74
39 | pattern:这家, support:74
40 | pattern:回味无穷, support:74
41 | pattern:去, support:76
42 | pattern:东西, support:76
43 | pattern:上, support:76
44 | pattern:火锅, support:77
45 | pattern:推荐, support:77
46 | pattern:到, support:77
47 | pattern:点, support:78
48 | pattern:套餐, support:78
49 | pattern:性价比, support:79
50 | pattern:餐厅, support:83
51 | pattern:爱, support:87
52 | pattern:哦, support:88
53 | pattern:来, support:89
54 | pattern:效果, support:91
55 | pattern:海鲜, support:96
56 | pattern:超级, support:103
57 | pattern:超级, 好, support:55
58 | pattern:口感, support:104
59 | pattern:高, support:104
60 | pattern:店里, support:106
61 | pattern:位置, support:108
62 | pattern:位置, 好找, support:74
63 | pattern:位置, 很, support:81
64 | pattern:位置, 很, 好找, support:72
65 | pattern:有点, support:109
66 | pattern:辣, support:110
67 | pattern:辣, 恰到好处, support:53
68 | pattern:辣, 的, support:72
69 | pattern:辣, 的, 恰到好处, support:50
70 | pattern:态度, support:110
71 | pattern:得, support:115
72 | pattern:一家, support:116
73 | pattern:新开, support:119
74 | pattern:新开, 的, support:103
75 | pattern:牛肉, support:125
76 | pattern:团购, support:131
77 | pattern:团购, 很, support:52
78 | pattern:做, support:134
79 | pattern:做, 的, support:73
80 | pattern:菜, support:135
81 | pattern:人, support:137
82 | pattern:真的, support:138
83 | pattern:好找, support:143
84 | pattern:可以, support:145
85 | pattern:在, support:150
86 | pattern:店, support:162
87 | pattern:菜品, support:175
88 | pattern:菜品, 一如既往, support:53
89 | pattern:菜品, 的, support:55
90 | pattern:免费, support:197
91 | pattern:免费, 的, support:61
92 | pattern:口味, support:205
93 | pattern:口味, 一如既往, support:50
94 | pattern:口味, 不错, support:54
95 | pattern:装修, support:209
96 | pattern:有, support:256
97 | pattern:特别, support:268
98 | pattern:特别, 好, support:146
99 | pattern:感觉, support:275
100 | pattern:感觉, 很, support:66
101 | pattern:多, support:276
102 | pattern:服务, support:286
103 | pattern:服务, 很, support:60
104 | pattern:服务, 好, support:66
105 | pattern:服务态度, support:294
106 | pattern:服务态度, 很, support:208
107 | pattern:服务态度, 很, 好, support:183
108 | pattern:服务态度, 好, support:219
109 | pattern:吃, support:366
110 | pattern:吃, 的, support:62
111 | pattern:好吃, support:371
112 | pattern:非常, support:383
113 | pattern:非常, 好, support:188
114 | pattern:和, support:389
115 | pattern:环境, support:436
116 | pattern:环境, 好, support:67
117 | pattern:环境, 不错, support:127
118 | pattern:环境, 很, support:155
119 | pattern:环境, 很, 好, support:57
120 | pattern:环境, 很, 不错, support:68
121 | pattern:还, support:455
122 | pattern:还, 不错, support:381
123 | pattern:是, support:544
124 | pattern:一如既往, support:547
125 | pattern:一如既往, 的, support:453
126 | pattern:一如既往, 的, 好吃, support:67
127 | pattern:一如既往, 的, 好, support:321
128 | pattern:都, support:547
129 | pattern:都, 是, support:72
130 | pattern:都, 很, support:125
131 | pattern:都, 很, 好, support:59
132 | pattern:都, 不错, support:138
133 | pattern:恰到好处, support:571
134 | pattern:恰到好处, 的, support:61
135 | pattern:了, support:713
136 | pattern:味道, support:1277
137 | pattern:味道, 还, support:51
138 | pattern:味道, 都, support:58
139 | pattern:味道, 好, support:64
140 | pattern:味道, 很, support:208
141 | pattern:味道, 很, 不错, support:130
142 | pattern:味道, 的, support:219
143 | pattern:味道, 的, 不错, support:57
144 | pattern:味道, 的, 味道, support:126
145 | pattern:味道, 的, 味道, 不错, support:57
146 | pattern:味道, 一如既往, support:249
147 | pattern:味道, 一如既往, 的, support:203
148 | pattern:味道, 不错, support:562
149 | pattern:好, support:1559
150 | pattern:好, 的, support:74
151 | pattern:很, support:2058
152 | pattern:很, 好找, support:130
153 | pattern:很, 好吃, support:157
154 | pattern:很, 不错, support:387
155 | pattern:很, 不错, 的, support:54
156 | pattern:很, 好, support:653
157 | pattern:很, 好, 的, support:56
158 | pattern:不错, support:2632
159 | pattern:不错, 的, support:306
160 | pattern:的, support:3871
161 | pattern:的, 一家, support:65
162 | pattern:的, 感觉, support:70
163 | pattern:的, 好吃, support:75
164 | pattern:的, 很, support:78
165 | pattern:的, 不错, support:92
166 | pattern:的, 不错, 的, support:92
167 | pattern:的, 味道, support:134
168 | pattern:的, 味道, 不错, support:57
169 | pattern:的, 恰到好处, support:149
170 | pattern:的, 好, support:371
171 |
--------------------------------------------------------------------------------
/lib/train_negative_prefixPattern.txt:
--------------------------------------------------------------------------------
1 | pattern:[['超级']], support:103
2 | pattern:[['口感']], support:104
3 | pattern:[['高']], support:104
4 | pattern:[['店里']], support:106
5 | pattern:[['位置']], support:108
6 | pattern:[['有点']], support:109
7 | pattern:[['辣']], support:110
8 | pattern:[['态度']], support:110
9 | pattern:[['得']], support:115
10 | pattern:[['一家']], support:116
11 | pattern:[['一家'], ['的']], support:101
12 | pattern:[['新开']], support:119
13 | pattern:[['新开', '的']], support:103
14 | pattern:[['牛肉']], support:125
15 | pattern:[['团购']], support:131
16 | pattern:[['做']], support:134
17 | pattern:[['菜']], support:135
18 | pattern:[['人']], support:137
19 | pattern:[['真的']], support:138
20 | pattern:[['真的'], ['真的']], support:107
21 | pattern:[['好找']], support:143
22 | pattern:[['可以']], support:145
23 | pattern:[['可以'], ['可以']], support:112
24 | pattern:[['在']], support:150
25 | pattern:[['在'], ['在']], support:145
26 | pattern:[['店']], support:162
27 | pattern:[['菜品']], support:175
28 | pattern:[['免费']], support:197
29 | pattern:[['免费'], ['免费']], support:119
30 | pattern:[['口味']], support:205
31 | pattern:[['装修']], support:209
32 | pattern:[['有']], support:256
33 | pattern:[['有'], ['的']], support:101
34 | pattern:[['有'], ['有']], support:168
35 | pattern:[['有'], ['有'], ['有']], support:114
36 | pattern:[['特别']], support:268
37 | pattern:[['特别'], ['特别']], support:122
38 | pattern:[['特别', '好']], support:146
39 | pattern:[['感觉']], support:275
40 | pattern:[['多']], support:276
41 | pattern:[['多'], ['多']], support:112
42 | pattern:[['服务']], support:286
43 | pattern:[['服务'], ['服务']], support:102
44 | pattern:[['服务'], ['很']], support:102
45 | pattern:[['服务'], ['好']], support:149
46 | pattern:[['服务态度']], support:294
47 | pattern:[['服务态度', '很']], support:208
48 | pattern:[['服务态度', '很', '好']], support:183
49 | pattern:[['服务态度', '好']], support:219
50 | pattern:[['吃']], support:366
51 | pattern:[['吃'], ['的']], support:160
52 | pattern:[['吃'], ['的'], ['的']], support:109
53 | pattern:[['吃'], ['吃']], support:224
54 | pattern:[['吃'], ['吃'], ['的']], support:105
55 | pattern:[['吃'], ['吃'], ['吃']], support:107
56 | pattern:[['好吃']], support:371
57 | pattern:[['非常']], support:383
58 | pattern:[['非常', '好']], support:188
59 | pattern:[['非常'], ['非常']], support:189
60 | pattern:[['和']], support:389
61 | pattern:[['和'], ['不错']], support:119
62 | pattern:[['和'], ['和']], support:382
63 | pattern:[['和'], ['和'], ['不错']], support:106
64 | pattern:[['和'], ['和'], ['和']], support:182
65 | pattern:[['环境']], support:436
66 | pattern:[['环境'], ['很']], support:124
67 | pattern:[['环境', '不错']], support:127
68 | pattern:[['环境'], ['好']], support:136
69 | pattern:[['环境', '很']], support:155
70 | pattern:[['环境', '很'], ['很']], support:102
71 | pattern:[['环境'], ['环境']], support:159
72 | pattern:[['还']], support:455
73 | pattern:[['还'], ['不错']], support:292
74 | pattern:[['还'], ['还']], support:354
75 | pattern:[['还'], ['还', '不错']], support:284
76 | pattern:[['还', '不错']], support:381
77 | pattern:[['是']], support:544
78 | pattern:[['是'], ['的']], support:362
79 | pattern:[['是'], ['的'], ['的']], support:209
80 | pattern:[['是'], ['的'], ['的'], ['的']], support:107
81 | pattern:[['是'], ['是']], support:456
82 | pattern:[['是'], ['是'], ['的']], support:247
83 | pattern:[['是'], ['是'], ['的'], ['的']], support:130
84 | pattern:[['是'], ['是'], ['是']], support:264
85 | pattern:[['是'], ['是'], ['是'], ['的']], support:131
86 | pattern:[['一如既往']], support:547
87 | pattern:[['一如既往'], ['好']], support:333
88 | pattern:[['一如既往', '的']], support:453
89 | pattern:[['一如既往', '的', '好']], support:321
90 | pattern:[['一如既往', '的'], ['好']], support:326
91 | pattern:[['一如既往', '的'], ['一如既往']], support:431
92 | pattern:[['一如既往', '的'], ['一如既往', '好']], support:313
93 | pattern:[['一如既往', '的'], ['一如既往', '的']], support:431
94 | pattern:[['一如既往', '的'], ['一如既往', '的', '好']], support:313
95 | pattern:[['一如既往', '的'], ['的']], support:453
96 | pattern:[['一如既往', '的'], ['的', '好']], support:321
97 | pattern:[['一如既往'], ['的']], support:458
98 | pattern:[['一如既往'], ['的', '好']], support:321
99 | pattern:[['一如既往'], ['一如既往']], support:467
100 | pattern:[['一如既往'], ['一如既往', '好']], support:271
101 | pattern:[['一如既往'], ['一如既往', '的']], support:433
102 | pattern:[['一如既往'], ['一如既往', '的', '好']], support:313
103 | pattern:[['都']], support:547
104 | pattern:[['都'], ['的']], support:109
105 | pattern:[['都', '很']], support:125
106 | pattern:[['都', '很'], ['都']], support:125
107 | pattern:[['都', '很'], ['都', '很']], support:125
108 | pattern:[['都', '很'], ['很']], support:125
109 | pattern:[['都'], ['很']], support:136
110 | pattern:[['都', '不错']], support:138
111 | pattern:[['都'], ['不错']], support:177
112 | pattern:[['都'], ['都']], support:514
113 | pattern:[['都'], ['都', '很']], support:132
114 | pattern:[['都'], ['都', '不错']], support:132
115 | pattern:[['都'], ['都'], ['都']], support:257
116 | pattern:[['恰到好处']], support:571
117 | pattern:[['了']], support:713
118 | pattern:[['了'], ['的']], support:155
119 | pattern:[['了'], ['的'], ['的']], support:142
120 | pattern:[['了'], ['了']], support:452
121 | pattern:[['了'], ['了'], ['的']], support:153
122 | pattern:[['了'], ['了'], ['的'], ['的']], support:132
123 | pattern:[['了'], ['了'], ['了']], support:227
124 | pattern:[['味道']], support:1277
125 | pattern:[['味道'], ['很']], support:126
126 | pattern:[['味道', '很']], support:208
127 | pattern:[['味道', '很'], ['很']], support:111
128 | pattern:[['味道', '很', '不错']], support:130
129 | pattern:[['味道', '的']], support:219
130 | pattern:[['味道', '的', '味道']], support:126
131 | pattern:[['味道', '的'], ['好']], support:185
132 | pattern:[['味道', '的'], ['一如既往']], support:206
133 | pattern:[['味道', '的'], ['一如既往', '好']], support:167
134 | pattern:[['味道', '的'], ['一如既往', '的']], support:206
135 | pattern:[['味道', '的'], ['一如既往', '的', '好']], support:170
136 | pattern:[['味道', '的'], ['的']], support:219
137 | pattern:[['味道', '的'], ['的', '好']], support:178
138 | pattern:[['味道'], ['一如既往']], support:231
139 | pattern:[['味道'], ['一如既往', '好']], support:166
140 | pattern:[['味道'], ['一如既往', '的']], support:219
141 | pattern:[['味道'], ['一如既往', '的', '好']], support:181
142 | pattern:[['味道', '一如既往']], support:249
143 | pattern:[['味道', '一如既往'], ['好']], support:178
144 | pattern:[['味道', '一如既往', '的']], support:203
145 | pattern:[['味道', '一如既往', '的'], ['好']], support:169
146 | pattern:[['味道', '一如既往', '的'], ['一如既往']], support:203
147 | pattern:[['味道', '一如既往', '的'], ['一如既往', '好']], support:168
148 | pattern:[['味道', '一如既往', '的'], ['一如既往', '的']], support:203
149 | pattern:[['味道', '一如既往', '的'], ['一如既往', '的', '好']], support:168
150 | pattern:[['味道', '一如既往', '的'], ['的']], support:203
151 | pattern:[['味道', '一如既往', '的'], ['的', '好']], support:168
152 | pattern:[['味道', '一如既往'], ['的']], support:212
153 | pattern:[['味道', '一如既往'], ['的', '好']], support:175
154 | pattern:[['味道', '一如既往'], ['一如既往']], support:224
155 | pattern:[['味道', '一如既往'], ['一如既往', '好']], support:166
156 | pattern:[['味道', '一如既往'], ['一如既往', '的']], support:213
157 | pattern:[['味道', '一如既往'], ['一如既往', '的', '好']], support:175
158 | pattern:[['味道'], ['好']], support:262
159 | pattern:[['味道'], ['的']], support:416
160 | pattern:[['味道'], ['的', '味道']], support:126
161 | pattern:[['味道'], ['的', '好']], support:187
162 | pattern:[['味道'], ['不错']], support:418
163 | pattern:[['味道'], ['味道']], support:457
164 | pattern:[['味道'], ['味道'], ['不错']], support:108
165 | pattern:[['味道'], ['味道'], ['味道']], support:150
166 | pattern:[['味道'], ['味道', '不错']], support:265
167 | pattern:[['味道', '不错']], support:562
168 | pattern:[['好']], support:1559
169 | pattern:[['好'], ['很']], support:108
170 | pattern:[['好'], ['很', '好']], support:102
171 | pattern:[['好'], ['的']], support:123
172 | pattern:[['好'], ['好']], support:234
173 | pattern:[['很']], support:2058
174 | pattern:[['很', '好找']], support:130
175 | pattern:[['很'], ['都']], support:130
176 | pattern:[['很'], ['都', '很']], support:125
177 | pattern:[['很', '好吃']], support:157
178 | pattern:[['很'], ['不错']], support:195
179 | pattern:[['很'], ['的']], support:305
180 | pattern:[['很'], ['的'], ['的']], support:116
181 | pattern:[['很', '不错']], support:387
182 | pattern:[['很'], ['好']], support:469
183 | pattern:[['很', '好']], support:653
184 | pattern:[['很', '好'], ['很']], support:103
185 | pattern:[['很', '好'], ['很', '好']], support:102
186 | pattern:[['很', '好'], ['好']], support:124
187 | pattern:[['很'], ['很']], support:1225
188 | pattern:[['很'], ['很'], ['的']], support:159
189 | pattern:[['很'], ['很', '不错']], support:180
190 | pattern:[['很'], ['很'], ['很']], support:231
191 | pattern:[['很'], ['很', '好']], support:447
192 | pattern:[['不错']], support:2632
193 | pattern:[['不错'], ['的']], support:289
194 | pattern:[['不错'], ['的'], ['的']], support:112
195 | pattern:[['不错', '的']], support:306
196 | pattern:[['不错', '的'], ['不错']], support:117
197 | pattern:[['不错', '的'], ['不错', '的']], support:113
198 | pattern:[['不错', '的'], ['的']], support:131
199 | pattern:[['不错'], ['不错']], support:425
200 | pattern:[['不错'], ['不错'], ['的']], support:114
201 | pattern:[['不错'], ['不错'], ['不错']], support:135
202 | pattern:[['不错'], ['不错', '的']], support:257
203 | pattern:[['不错'], ['不错', '的'], ['的']], support:105
204 | pattern:[['的']], support:3871
205 | pattern:[['的'], ['都']], support:100
206 | pattern:[['的'], ['店']], support:102
207 | pattern:[['的'], ['是']], support:107
208 | pattern:[['的'], ['是'], ['是']], support:104
209 | pattern:[['的'], ['好吃']], support:127
210 | pattern:[['的', '味道']], support:134
211 | pattern:[['的', '味道'], ['不错']], support:111
212 | pattern:[['的', '味道'], ['的']], support:130
213 | pattern:[['的', '味道'], ['的', '味道']], support:127
214 | pattern:[['的', '味道'], ['味道']], support:134
215 | pattern:[['的'], ['恰到好处']], support:140
216 | pattern:[['的', '恰到好处']], support:149
217 | pattern:[['的'], ['了']], support:161
218 | pattern:[['的'], ['味道']], support:185
219 | pattern:[['的'], ['味道'], ['味道']], support:115
220 | pattern:[['的'], ['很']], support:244
221 | pattern:[['的'], ['很'], ['很']], support:230
222 | pattern:[['的', '好']], support:371
223 | pattern:[['的'], ['一如既往']], support:433
224 | pattern:[['的'], ['一如既往', '好']], support:308
225 | pattern:[['的'], ['一如既往', '的']], support:432
226 | pattern:[['的'], ['一如既往', '的', '好']], support:313
227 | pattern:[['的'], ['不错']], support:538
228 | pattern:[['的'], ['不错', '的']], support:145
229 | pattern:[['的'], ['好']], support:542
230 | pattern:[['的'], ['的']], support:3148
231 | pattern:[['的'], ['的'], ['是']], support:104
232 | pattern:[['的'], ['的'], ['味道']], support:123
233 | pattern:[['的'], ['的'], ['好']], support:140
234 | pattern:[['的'], ['的', '很']], support:144
235 | pattern:[['的'], ['的', '很'], ['很']], support:144
236 | pattern:[['的'], ['的', '味道']], support:147
237 | pattern:[['的'], ['的', '味道'], ['味道']], support:102
238 | pattern:[['的'], ['的'], ['了']], support:147
239 | pattern:[['的'], ['的', '不错']], support:175
240 | pattern:[['的'], ['的'], ['很']], support:230
241 | pattern:[['的'], ['的'], ['很'], ['很']], support:116
242 | pattern:[['的'], ['的'], ['不错']], support:286
243 | pattern:[['的'], ['的', '好']], support:386
244 | pattern:[['的'], ['的'], ['的']], support:1329
245 | pattern:[['的'], ['的'], ['的'], ['不错']], support:105
246 | pattern:[['的'], ['的'], ['的'], ['的']], support:249
247 | pattern:[['的'], ['的'], ['的'], ['的'], ['的']], support:131
248 |
--------------------------------------------------------------------------------
/lib/train_positive_prefixFrequentSub_sup25.txt:
--------------------------------------------------------------------------------
1 | pattern:鲜嫩, support:25
2 | pattern:生, support:25
3 | pattern:处理, support:25
4 | pattern:琳琅满目, support:25
5 | pattern:老师, support:25
6 | pattern:糯, support:26
7 | pattern:超大, support:26
8 | pattern:店, support:26
9 | pattern:调味, support:26
10 | pattern:茶味, support:26
11 | pattern:鸡蛋, support:26
12 | pattern:让, support:27
13 | pattern:龙虾, support:27
14 | pattern:肉, support:27
15 | pattern:配合, support:27
16 | pattern:套餐, support:27
17 | pattern:音乐, support:27
18 | pattern:寿司, support:28
19 | pattern:与, support:28
20 | pattern:确实, support:28
21 | pattern:爽口, support:28
22 | pattern:蚝, support:28
23 | pattern:火锅, support:28
24 | pattern:蟹, support:28
25 | pattern:富丽堂皇, support:28
26 | pattern:实惠, support:29
27 | pattern:着, support:29
28 | pattern:牛腩, support:29
29 | pattern:土豆, support:29
30 | pattern:到, support:29
31 | pattern:炖, support:30
32 | pattern:独特, support:30
33 | pattern:汤汁, support:30
34 | pattern:酱, support:31
35 | pattern:羊肉串, support:31
36 | pattern:还, support:31
37 | pattern:里面, support:31
38 | pattern:在, support:32
39 | pattern:芥末, support:32
40 | pattern:认真, support:32
41 | pattern:装饰, support:32
42 | pattern:地道, support:33
43 | pattern:好喝, support:33
44 | pattern:面条, support:33
45 | pattern:牛舌, support:33
46 | pattern:啊, support:34
47 | pattern:精致, support:34
48 | pattern:别具一格, support:36
49 | pattern:人, support:36
50 | pattern:推荐, support:36
51 | pattern:出乎意料, support:36
52 | pattern:出乎意料, 的, support:26
53 | pattern:店里, support:37
54 | pattern:按摩, support:37
55 | pattern:一家, support:37
56 | pattern:牛蛙, support:38
57 | pattern:酱料, support:38
58 | pattern:口味, support:40
59 | pattern:地, support:40
60 | pattern:豆腐, support:41
61 | pattern:回味无穷, support:41
62 | pattern:蒸, support:41
63 | pattern:蒸, 的, support:34
64 | pattern:配, support:42
65 | pattern:沙拉, support:42
66 | pattern:特色, support:42
67 | pattern:里, support:43
68 | pattern:饭, support:44
69 | pattern:最好, support:44
70 | pattern:最好, 的, support:34
71 | pattern:蛋糕, support:44
72 | pattern:感觉, support:45
73 | pattern:很香, support:45
74 | pattern:刺身, support:46
75 | pattern:方便, support:46
76 | pattern:肝, support:47
77 | pattern:水果, support:48
78 | pattern:上, support:48
79 | pattern:菜, support:48
80 | pattern:鹅, support:48
81 | pattern:鹅, 肝, support:43
82 | pattern:美味, support:49
83 | pattern:鸡, support:49
84 | pattern:米饭, support:49
85 | pattern:鲜美, support:50
86 | pattern:鳗鱼, support:50
87 | pattern:最爱, support:50
88 | pattern:最爱, 的, support:36
89 | pattern:很嫩, support:52
90 | pattern:餐厅, support:53
91 | pattern:货真价实, support:53
92 | pattern:浓郁, support:54
93 | pattern:抹, support:55
94 | pattern:抹, 茶, support:40
95 | pattern:面包, support:58
96 | pattern:正宗, support:58
97 | pattern:鸡肉, support:59
98 | pattern:鱼, support:59
99 | pattern:三文鱼, support:60
100 | pattern:风格, support:60
101 | pattern:超级, support:60
102 | pattern:辣, support:60
103 | pattern:辣, 的, support:40
104 | pattern:辣, 的, 恰到好处, support:34
105 | pattern:干净, support:63
106 | pattern:口感, support:65
107 | pattern:汤, support:69
108 | pattern:咖喱, support:69
109 | pattern:味, support:69
110 | pattern:味, 恰到好处, support:28
111 | pattern:煎, support:70
112 | pattern:煎, 的, support:36
113 | pattern:煎, 的, 恰到好处, support:26
114 | pattern:搭配, support:70
115 | pattern:搭配, 的, support:28
116 | pattern:搭配, 的, 恰到好处, support:26
117 | pattern:茶, support:76
118 | pattern:茶, 的, support:25
119 | pattern:环境, support:77
120 | pattern:挺好吃, support:77
121 | pattern:挺好吃, 的, support:52
122 | pattern:香, support:78
123 | pattern:煮, support:79
124 | pattern:煮, 的, support:56
125 | pattern:煮, 的, 恰到好处, support:51
126 | pattern:芝士, support:81
127 | pattern:真的, support:81
128 | pattern:棒, support:82
129 | pattern:虾, support:83
130 | pattern:不错, support:89
131 | pattern:吃, support:97
132 | pattern:海鲜, support:105
133 | pattern:海鲜, 新鲜, support:32
134 | pattern:海鲜, 很, support:35
135 | pattern:海鲜, 很, 新鲜, support:26
136 | pattern:爱, support:107
137 | pattern:做, support:108
138 | pattern:做, 的, support:79
139 | pattern:嫩, support:109
140 | pattern:有, support:110
141 | pattern:挺, support:125
142 | pattern:了, support:126
143 | pattern:很棒, support:128
144 | pattern:火候, support:128
145 | pattern:火候, 恰到好处, support:97
146 | pattern:入味, support:129
147 | pattern:特别, support:139
148 | pattern:特别, 棒, support:25
149 | pattern:古色古香, support:201
150 | pattern:古色古香, 的, support:55
151 | pattern:牛肉, support:210
152 | pattern:牛肉, 的, support:36
153 | pattern:烤, support:219
154 | pattern:烤, 得, support:61
155 | pattern:烤, 得, 恰到好处, support:55
156 | pattern:烤, 的, support:124
157 | pattern:烤, 的, 恰到好处, support:104
158 | pattern:一如既往, support:221
159 | pattern:一如既往, 的, support:160
160 | pattern:一如既往, 的, 好, support:26
161 | pattern:一如既往, 的, 好吃, support:67
162 | pattern:最, support:226
163 | pattern:最, 好吃, support:83
164 | pattern:最, 好吃, 的, support:51
165 | pattern:最, 爱, support:103
166 | pattern:得, support:237
167 | pattern:得, 恰到好处, support:184
168 | pattern:非常, support:241
169 | pattern:非常, 新鲜, support:26
170 | pattern:是, support:259
171 | pattern:是, 最, support:27
172 | pattern:好, support:272
173 | pattern:好, 好吃, support:63
174 | pattern:都, support:276
175 | pattern:都, 是, support:29
176 | pattern:都, 恰到好处, support:52
177 | pattern:都, 很, support:89
178 | pattern:都, 很, 新鲜, support:31
179 | pattern:味道, support:303
180 | pattern:味道, 好, support:31
181 | pattern:味道, 很, support:42
182 | pattern:味道, 恰到好处, support:80
183 | pattern:装修, support:305
184 | pattern:装修, 挺, support:25
185 | pattern:装修, 风格, support:47
186 | pattern:装修, 古色古香, support:54
187 | pattern:装修, 的, support:74
188 | pattern:装修, 的, 装修, support:31
189 | pattern:装修, 的, 装修, 的, support:26
190 | pattern:装修, 的, 很, support:46
191 | pattern:装修, 很, support:133
192 | pattern:装修, 很, 古色古香, support:28
193 | pattern:新鲜, support:309
194 | pattern:新鲜, 的, support:30
195 | pattern:和, support:319
196 | pattern:好吃, support:441
197 | pattern:好吃, 的, support:70
198 | pattern:很, support:1398
199 | pattern:很, 美味, support:27
200 | pattern:很, 浓郁, support:28
201 | pattern:很, 好, support:28
202 | pattern:很, 香, support:29
203 | pattern:很, 鲜美, support:31
204 | pattern:很, 方便, support:31
205 | pattern:很, 正宗, support:37
206 | pattern:很, 好吃, support:39
207 | pattern:很, 干净, support:41
208 | pattern:很, 嫩, support:43
209 | pattern:很, 有, support:49
210 | pattern:很, 古色古香, support:72
211 | pattern:很, 入味, support:73
212 | pattern:很, 新鲜, support:202
213 | pattern:恰到好处, support:1672
214 | pattern:恰到好处, 的, support:96
215 | pattern:的, support:2446
216 | pattern:的, 最, support:27
217 | pattern:的, 装修, support:31
218 | pattern:的, 装修, 的, support:26
219 | pattern:的, 装修, 的, 装修, support:26
220 | pattern:的, 好, support:35
221 | pattern:的, 火候, support:53
222 | pattern:的, 火候, 恰到好处, support:39
223 | pattern:的, 好吃, support:85
224 | pattern:的, 好吃, 的, support:59
225 | pattern:的, 味道, support:90
226 | pattern:的, 味道, 恰到好处, support:34
227 | pattern:的, 很, support:123
228 | pattern:的, 恰到好处, support:450
229 | pattern:的, 恰到好处, 的, support:73
230 |
--------------------------------------------------------------------------------
/lib/train_positive_prefixFrequentSub_sup50.txt:
--------------------------------------------------------------------------------
1 | pattern:鲜美, support:50
2 | pattern:鳗鱼, support:50
3 | pattern:最爱, support:50
4 | pattern:很嫩, support:52
5 | pattern:餐厅, support:53
6 | pattern:货真价实, support:53
7 | pattern:浓郁, support:54
8 | pattern:抹, support:55
9 | pattern:面包, support:58
10 | pattern:正宗, support:58
11 | pattern:鸡肉, support:59
12 | pattern:鱼, support:59
13 | pattern:三文鱼, support:60
14 | pattern:风格, support:60
15 | pattern:超级, support:60
16 | pattern:辣, support:60
17 | pattern:干净, support:63
18 | pattern:口感, support:65
19 | pattern:汤, support:69
20 | pattern:咖喱, support:69
21 | pattern:味, support:69
22 | pattern:煎, support:70
23 | pattern:搭配, support:70
24 | pattern:茶, support:76
25 | pattern:环境, support:77
26 | pattern:挺好吃, support:77
27 | pattern:挺好吃, 的, support:52
28 | pattern:香, support:78
29 | pattern:煮, support:79
30 | pattern:煮, 的, support:56
31 | pattern:煮, 的, 恰到好处, support:51
32 | pattern:芝士, support:81
33 | pattern:真的, support:81
34 | pattern:棒, support:82
35 | pattern:虾, support:83
36 | pattern:不错, support:89
37 | pattern:吃, support:97
38 | pattern:海鲜, support:105
39 | pattern:爱, support:107
40 | pattern:做, support:108
41 | pattern:做, 的, support:79
42 | pattern:嫩, support:109
43 | pattern:有, support:110
44 | pattern:挺, support:125
45 | pattern:了, support:126
46 | pattern:很棒, support:128
47 | pattern:火候, support:128
48 | pattern:火候, 恰到好处, support:97
49 | pattern:入味, support:129
50 | pattern:特别, support:139
51 | pattern:古色古香, support:201
52 | pattern:古色古香, 的, support:55
53 | pattern:牛肉, support:210
54 | pattern:烤, support:219
55 | pattern:烤, 得, support:61
56 | pattern:烤, 得, 恰到好处, support:55
57 | pattern:烤, 的, support:124
58 | pattern:烤, 的, 恰到好处, support:104
59 | pattern:一如既往, support:221
60 | pattern:一如既往, 的, support:160
61 | pattern:一如既往, 的, 好吃, support:67
62 | pattern:最, support:226
63 | pattern:最, 好吃, support:83
64 | pattern:最, 好吃, 的, support:51
65 | pattern:最, 爱, support:103
66 | pattern:得, support:237
67 | pattern:得, 恰到好处, support:184
68 | pattern:非常, support:241
69 | pattern:是, support:259
70 | pattern:好, support:272
71 | pattern:好, 好吃, support:63
72 | pattern:都, support:276
73 | pattern:都, 恰到好处, support:52
74 | pattern:都, 很, support:89
75 | pattern:味道, support:303
76 | pattern:味道, 恰到好处, support:80
77 | pattern:装修, support:305
78 | pattern:装修, 古色古香, support:54
79 | pattern:装修, 的, support:74
80 | pattern:装修, 很, support:133
81 | pattern:新鲜, support:309
82 | pattern:和, support:319
83 | pattern:好吃, support:441
84 | pattern:好吃, 的, support:70
85 | pattern:很, support:1398
86 | pattern:很, 古色古香, support:72
87 | pattern:很, 入味, support:73
88 | pattern:很, 新鲜, support:202
89 | pattern:恰到好处, support:1672
90 | pattern:恰到好处, 的, support:96
91 | pattern:的, support:2446
92 | pattern:的, 火候, support:53
93 | pattern:的, 好吃, support:85
94 | pattern:的, 好吃, 的, support:59
95 | pattern:的, 味道, support:90
96 | pattern:的, 很, support:123
97 | pattern:的, 恰到好处, support:450
98 | pattern:的, 恰到好处, 的, support:73
99 |
--------------------------------------------------------------------------------
/lib/train_positive_prefixPattern.txt:
--------------------------------------------------------------------------------
1 | pattern:[['鲜美']], support:50
2 | pattern:[['鳗鱼']], support:50
3 | pattern:[['最爱']], support:50
4 | pattern:[['很嫩']], support:52
5 | pattern:[['餐厅']], support:53
6 | pattern:[['货真价实']], support:53
7 | pattern:[['浓郁']], support:54
8 | pattern:[['抹']], support:55
9 | pattern:[['面包']], support:58
10 | pattern:[['正宗']], support:58
11 | pattern:[['鸡肉']], support:59
12 | pattern:[['鱼']], support:59
13 | pattern:[['三文鱼']], support:60
14 | pattern:[['风格']], support:60
15 | pattern:[['风格'], ['风格']], support:53
16 | pattern:[['超级']], support:60
17 | pattern:[['辣']], support:60
18 | pattern:[['干净']], support:63
19 | pattern:[['口感']], support:65
20 | pattern:[['口感'], ['口感']], support:50
21 | pattern:[['汤']], support:69
22 | pattern:[['咖喱']], support:69
23 | pattern:[['味']], support:69
24 | pattern:[['煎']], support:70
25 | pattern:[['煎'], ['恰到好处']], support:63
26 | pattern:[['煎'], ['煎']], support:67
27 | pattern:[['搭配']], support:70
28 | pattern:[['搭配'], ['恰到好处']], support:51
29 | pattern:[['搭配'], ['搭配']], support:56
30 | pattern:[['茶']], support:76
31 | pattern:[['茶'], ['茶']], support:65
32 | pattern:[['环境']], support:77
33 | pattern:[['挺好吃']], support:77
34 | pattern:[['挺好吃', '的']], support:52
35 | pattern:[['香']], support:78
36 | pattern:[['煮']], support:79
37 | pattern:[['煮', '的']], support:56
38 | pattern:[['煮', '的', '恰到好处']], support:51
39 | pattern:[['煮', '的'], ['煮']], support:54
40 | pattern:[['煮', '的'], ['煮', '恰到好处']], support:51
41 | pattern:[['煮', '的'], ['煮', '的']], support:54
42 | pattern:[['煮', '的'], ['煮', '的', '恰到好处']], support:51
43 | pattern:[['煮', '的'], ['恰到好处']], support:54
44 | pattern:[['煮', '的'], ['的']], support:56
45 | pattern:[['煮', '的'], ['的', '恰到好处']], support:52
46 | pattern:[['煮'], ['的']], support:58
47 | pattern:[['煮'], ['的', '恰到好处']], support:52
48 | pattern:[['煮'], ['恰到好处']], support:73
49 | pattern:[['煮'], ['煮']], support:76
50 | pattern:[['煮'], ['煮', '的']], support:54
51 | pattern:[['煮'], ['煮', '的', '恰到好处']], support:51
52 | pattern:[['芝士']], support:81
53 | pattern:[['真的']], support:81
54 | pattern:[['真的'], ['真的']], support:75
55 | pattern:[['棒']], support:82
56 | pattern:[['虾']], support:83
57 | pattern:[['不错']], support:89
58 | pattern:[['吃']], support:97
59 | pattern:[['吃'], ['吃']], support:76
60 | pattern:[['海鲜']], support:105
61 | pattern:[['爱']], support:107
62 | pattern:[['爱'], ['爱']], support:63
63 | pattern:[['做']], support:108
64 | pattern:[['做', '的']], support:79
65 | pattern:[['做', '的'], ['做']], support:68
66 | pattern:[['做', '的'], ['做'], ['的']], support:50
67 | pattern:[['做', '的'], ['做', '的']], support:68
68 | pattern:[['做', '的'], ['做', '的'], ['的']], support:50
69 | pattern:[['做', '的'], ['的']], support:79
70 | pattern:[['做', '的'], ['的'], ['的']], support:57
71 | pattern:[['做'], ['的']], support:85
72 | pattern:[['做'], ['的'], ['的']], support:71
73 | pattern:[['做'], ['做']], support:89
74 | pattern:[['做'], ['做'], ['的']], support:62
75 | pattern:[['做'], ['做', '的']], support:68
76 | pattern:[['做'], ['做', '的'], ['的']], support:59
77 | pattern:[['嫩']], support:109
78 | pattern:[['有']], support:110
79 | pattern:[['有'], ['很']], support:57
80 | pattern:[['有'], ['很', '有']], support:52
81 | pattern:[['有'], ['有']], support:106
82 | pattern:[['有'], ['有'], ['有']], support:50
83 | pattern:[['挺']], support:125
84 | pattern:[['挺'], ['的']], support:85
85 | pattern:[['挺'], ['挺']], support:116
86 | pattern:[['挺'], ['挺'], ['的']], support:53
87 | pattern:[['挺'], ['挺'], ['挺']], support:57
88 | pattern:[['挺'], ['挺'], ['挺', '的']], support:52
89 | pattern:[['了']], support:126
90 | pattern:[['了'], ['了']], support:64
91 | pattern:[['很棒']], support:128
92 | pattern:[['火候']], support:128
93 | pattern:[['火候'], ['的']], support:64
94 | pattern:[['火候'], ['的', '火候']], support:53
95 | pattern:[['火候', '恰到好处']], support:97
96 | pattern:[['火候'], ['火候']], support:104
97 | pattern:[['火候'], ['火候', '恰到好处']], support:74
98 | pattern:[['火候'], ['恰到好处']], support:104
99 | pattern:[['入味']], support:129
100 | pattern:[['特别']], support:139
101 | pattern:[['特别'], ['特别']], support:110
102 | pattern:[['古色古香']], support:201
103 | pattern:[['古色古香'], ['很']], support:52
104 | pattern:[['古色古香', '的']], support:55
105 | pattern:[['古色古香'], ['的']], support:68
106 | pattern:[['古色古香'], ['古色古香']], support:85
107 | pattern:[['牛肉']], support:210
108 | pattern:[['牛肉'], ['恰到好处']], support:59
109 | pattern:[['牛肉'], ['牛肉']], support:76
110 | pattern:[['牛肉'], ['的']], support:87
111 | pattern:[['牛肉'], ['的'], ['的']], support:51
112 | pattern:[['烤']], support:219
113 | pattern:[['烤', '得']], support:61
114 | pattern:[['烤', '得', '恰到好处']], support:55
115 | pattern:[['烤', '得'], ['恰到好处']], support:57
116 | pattern:[['烤', '得'], ['烤']], support:61
117 | pattern:[['烤', '得'], ['烤', '恰到好处']], support:55
118 | pattern:[['烤', '得'], ['烤', '得']], support:61
119 | pattern:[['烤', '得'], ['烤', '得', '恰到好处']], support:55
120 | pattern:[['烤', '得'], ['得']], support:61
121 | pattern:[['烤', '得'], ['得', '恰到好处']], support:55
122 | pattern:[['烤'], ['得']], support:64
123 | pattern:[['烤'], ['得', '恰到好处']], support:55
124 | pattern:[['烤', '的']], support:124
125 | pattern:[['烤', '的', '恰到好处']], support:104
126 | pattern:[['烤', '的'], ['恰到好处']], support:119
127 | pattern:[['烤', '的'], ['烤']], support:121
128 | pattern:[['烤', '的'], ['烤', '恰到好处']], support:102
129 | pattern:[['烤', '的'], ['烤', '的']], support:121
130 | pattern:[['烤', '的'], ['烤', '的', '恰到好处']], support:102
131 | pattern:[['烤', '的'], ['的']], support:124
132 | pattern:[['烤', '的'], ['的', '恰到好处']], support:104
133 | pattern:[['烤'], ['的']], support:131
134 | pattern:[['烤'], ['的'], ['恰到好处']], support:53
135 | pattern:[['烤'], ['的'], ['的']], support:58
136 | pattern:[['烤'], ['的', '恰到好处']], support:104
137 | pattern:[['烤'], ['恰到好处']], support:185
138 | pattern:[['烤'], ['烤']], support:196
139 | pattern:[['烤'], ['烤'], ['的']], support:56
140 | pattern:[['烤'], ['烤', '得']], support:62
141 | pattern:[['烤'], ['烤', '得', '恰到好处']], support:55
142 | pattern:[['烤'], ['烤'], ['烤']], support:62
143 | pattern:[['烤'], ['烤'], ['恰到好处']], support:71
144 | pattern:[['烤'], ['烤', '恰到好处']], support:111
145 | pattern:[['烤'], ['烤', '的']], support:122
146 | pattern:[['烤'], ['烤', '的'], ['的']], support:52
147 | pattern:[['烤'], ['烤', '的', '恰到好处']], support:102
148 | pattern:[['一如既往']], support:221
149 | pattern:[['一如既往'], ['好吃']], support:130
150 | pattern:[['一如既往', '的']], support:160
151 | pattern:[['一如既往', '的', '好吃']], support:67
152 | pattern:[['一如既往', '的'], ['好吃']], support:96
153 | pattern:[['一如既往', '的'], ['一如既往']], support:150
154 | pattern:[['一如既往', '的'], ['一如既往', '好吃']], support:66
155 | pattern:[['一如既往', '的'], ['一如既往'], ['的']], support:71
156 | pattern:[['一如既往', '的'], ['一如既往', '的']], support:149
157 | pattern:[['一如既往', '的'], ['一如既往', '的', '好吃']], support:65
158 | pattern:[['一如既往', '的'], ['一如既往', '的'], ['的']], support:71
159 | pattern:[['一如既往', '的'], ['的']], support:160
160 | pattern:[['一如既往', '的'], ['的', '好吃']], support:68
161 | pattern:[['一如既往', '的'], ['的'], ['的']], support:76
162 | pattern:[['一如既往'], ['的']], support:169
163 | pattern:[['一如既往'], ['的', '好吃']], support:68
164 | pattern:[['一如既往'], ['的'], ['好吃']], support:86
165 | pattern:[['一如既往'], ['的'], ['一如既往']], support:101
166 | pattern:[['一如既往'], ['的'], ['一如既往', '好吃']], support:51
167 | pattern:[['一如既往'], ['的'], ['一如既往', '的']], support:100
168 | pattern:[['一如既往'], ['的'], ['一如既往', '的', '好吃']], support:50
169 | pattern:[['一如既往'], ['的'], ['的']], support:142
170 | pattern:[['一如既往'], ['的'], ['的', '好吃']], support:64
171 | pattern:[['一如既往'], ['一如既往']], support:200
172 | pattern:[['一如既往'], ['一如既往'], ['好吃']], support:107
173 | pattern:[['一如既往'], ['一如既往'], ['一如既往']], support:126
174 | pattern:[['一如既往'], ['一如既往'], ['一如既往', '好吃']], support:70
175 | pattern:[['一如既往'], ['一如既往'], ['一如既往', '的']], support:102
176 | pattern:[['一如既往'], ['一如既往'], ['一如既往', '的', '好吃']], support:50
177 | pattern:[['一如既往'], ['一如既往'], ['的']], support:140
178 | pattern:[['一如既往'], ['一如既往'], ['的', '好吃']], support:64
179 | pattern:[['一如既往'], ['一如既往', '的']], support:152
180 | pattern:[['一如既往'], ['一如既往', '的', '好吃']], support:65
181 | pattern:[['一如既往'], ['一如既往', '的'], ['好吃']], support:80
182 | pattern:[['一如既往'], ['一如既往', '的'], ['一如既往']], support:100
183 | pattern:[['一如既往'], ['一如既往', '的'], ['一如既往', '好吃']], support:50
184 | pattern:[['一如既往'], ['一如既往', '的'], ['一如既往', '的']], support:100
185 | pattern:[['一如既往'], ['一如既往', '的'], ['一如既往', '的', '好吃']], support:50
186 | pattern:[['一如既往'], ['一如既往', '的'], ['的']], support:137
187 | pattern:[['一如既往'], ['一如既往', '的'], ['的', '好吃']], support:64
188 | pattern:[['最']], support:226
189 | pattern:[['最'], ['好吃']], support:72
190 | pattern:[['最'], ['好吃', '的']], support:51
191 | pattern:[['最'], ['好吃'], ['的']], support:51
192 | pattern:[['最'], ['好吃'], ['好吃']], support:52
193 | pattern:[['最'], ['好吃'], ['好吃', '的']], support:51
194 | pattern:[['最', '好吃']], support:83
195 | pattern:[['最', '好吃', '的']], support:51
196 | pattern:[['最', '好吃'], ['的']], support:51
197 | pattern:[['最', '好吃'], ['最']], support:53
198 | pattern:[['最', '好吃'], ['最', '的']], support:51
199 | pattern:[['最', '好吃'], ['最', '好吃']], support:53
200 | pattern:[['最', '好吃'], ['最', '好吃', '的']], support:51
201 | pattern:[['最', '好吃'], ['好吃']], support:53
202 | pattern:[['最', '好吃'], ['好吃', '的']], support:51
203 | pattern:[['最'], ['爱']], support:96
204 | pattern:[['最'], ['的']], support:102
205 | pattern:[['最'], ['的'], ['的']], support:74
206 | pattern:[['最'], ['的'], ['的'], ['的']], support:52
207 | pattern:[['最', '爱']], support:103
208 | pattern:[['最', '爱'], ['爱']], support:61
209 | pattern:[['最'], ['最']], support:159
210 | pattern:[['最'], ['最'], ['好吃']], support:52
211 | pattern:[['最'], ['最'], ['好吃', '的']], support:51
212 | pattern:[['最'], ['最', '好吃']], support:72
213 | pattern:[['最'], ['最', '好吃', '的']], support:51
214 | pattern:[['最'], ['最', '好吃'], ['的']], support:51
215 | pattern:[['最'], ['最', '好吃'], ['好吃']], support:52
216 | pattern:[['最'], ['最', '好吃'], ['好吃', '的']], support:51
217 | pattern:[['最'], ['最'], ['最']], support:78
218 | pattern:[['最'], ['最'], ['最'], ['的']], support:54
219 | pattern:[['最'], ['最'], ['最', '的']], support:65
220 | pattern:[['最'], ['最'], ['最', '的'], ['的']], support:53
221 | pattern:[['最'], ['最'], ['的']], support:78
222 | pattern:[['最'], ['最'], ['的'], ['的']], support:63
223 | pattern:[['得']], support:237
224 | pattern:[['得'], ['烤']], support:63
225 | pattern:[['得'], ['烤', '恰到好处']], support:55
226 | pattern:[['得'], ['烤', '得']], support:63
227 | pattern:[['得'], ['烤', '得', '恰到好处']], support:55
228 | pattern:[['得', '恰到好处']], support:184
229 | pattern:[['得'], ['恰到好处']], support:193
230 | pattern:[['得'], ['得']], support:235
231 | pattern:[['得'], ['得', '恰到好处']], support:183
232 | pattern:[['非常']], support:241
233 | pattern:[['非常'], ['的']], support:54
234 | pattern:[['非常'], ['非常']], support:195
235 | pattern:[['是']], support:259
236 | pattern:[['是'], ['最']], support:61
237 | pattern:[['是'], ['最'], ['最']], support:58
238 | pattern:[['是'], ['的']], support:174
239 | pattern:[['是'], ['的'], ['的']], support:130
240 | pattern:[['是'], ['的'], ['的'], ['的']], support:81
241 | pattern:[['是'], ['是']], support:234
242 | pattern:[['是'], ['是'], ['最']], support:52
243 | pattern:[['是'], ['是'], ['的']], support:133
244 | pattern:[['是'], ['是'], ['的'], ['的']], support:101
245 | pattern:[['是'], ['是'], ['的'], ['的'], ['的']], support:54
246 | pattern:[['是'], ['是'], ['是']], support:151
247 | pattern:[['是'], ['是'], ['是'], ['的']], support:83
248 | pattern:[['好']], support:272
249 | pattern:[['好'], ['的']], support:61
250 | pattern:[['好', '好吃']], support:63
251 | pattern:[['好'], ['好']], support:155
252 | pattern:[['好'], ['好'], ['好']], support:53
253 | pattern:[['都']], support:276
254 | pattern:[['都', '恰到好处']], support:52
255 | pattern:[['都'], ['的']], support:72
256 | pattern:[['都'], ['恰到好处']], support:81
257 | pattern:[['都', '很']], support:89
258 | pattern:[['都', '很'], ['都']], support:89
259 | pattern:[['都', '很'], ['都', '很']], support:89
260 | pattern:[['都', '很'], ['很']], support:89
261 | pattern:[['都'], ['很']], support:100
262 | pattern:[['都'], ['很'], ['都']], support:65
263 | pattern:[['都'], ['很'], ['都', '很']], support:65
264 | pattern:[['都'], ['很'], ['很']], support:77
265 | pattern:[['都'], ['都']], support:272
266 | pattern:[['都'], ['都', '恰到好处']], support:50
267 | pattern:[['都'], ['都'], ['的']], support:62
268 | pattern:[['都'], ['都'], ['很']], support:77
269 | pattern:[['都'], ['都', '很']], support:91
270 | pattern:[['都'], ['都', '很'], ['都']], support:65
271 | pattern:[['都'], ['都', '很'], ['都', '很']], support:65
272 | pattern:[['都'], ['都', '很'], ['很']], support:70
273 | pattern:[['都'], ['都'], ['都']], support:158
274 | pattern:[['都'], ['都'], ['都', '很']], support:65
275 | pattern:[['味道']], support:303
276 | pattern:[['味道'], ['很']], support:50
277 | pattern:[['味道', '恰到好处']], support:80
278 | pattern:[['味道'], ['恰到好处']], support:88
279 | pattern:[['味道'], ['的']], support:124
280 | pattern:[['味道'], ['的', '味道']], support:92
281 | pattern:[['味道'], ['味道']], support:236
282 | pattern:[['味道'], ['味道', '恰到好处']], support:59
283 | pattern:[['味道'], ['味道'], ['味道']], support:102
284 | pattern:[['装修']], support:305
285 | pattern:[['装修'], ['风格']], support:51
286 | pattern:[['装修', '古色古香']], support:54
287 | pattern:[['装修', '的']], support:74
288 | pattern:[['装修', '的'], ['古色古香']], support:51
289 | pattern:[['装修', '的'], ['装修']], support:56
290 | pattern:[['装修', '的'], ['很']], support:73
291 | pattern:[['装修', '的'], ['很'], ['很']], support:50
292 | pattern:[['装修', '的'], ['的']], support:74
293 | pattern:[['装修'], ['古色古香']], support:115
294 | pattern:[['装修'], ['装修']], support:119
295 | pattern:[['装修'], ['装修'], ['很']], support:58
296 | pattern:[['装修', '很']], support:133
297 | pattern:[['装修', '很'], ['古色古香']], support:54
298 | pattern:[['装修', '很'], ['很']], support:120
299 | pattern:[['装修'], ['的']], support:141
300 | pattern:[['装修'], ['的', '很']], support:57
301 | pattern:[['装修'], ['的'], ['很']], support:58
302 | pattern:[['装修'], ['的'], ['的']], support:61
303 | pattern:[['装修'], ['很']], support:152
304 | pattern:[['装修'], ['很'], ['很']], support:91
305 | pattern:[['新鲜']], support:309
306 | pattern:[['新鲜'], ['新鲜']], support:76
307 | pattern:[['和']], support:319
308 | pattern:[['和'], ['很']], support:56
309 | pattern:[['和'], ['很'], ['很']], support:55
310 | pattern:[['和'], ['都']], support:76
311 | pattern:[['和'], ['都'], ['都']], support:76
312 | pattern:[['和'], ['的']], support:112
313 | pattern:[['和'], ['的'], ['恰到好处']], support:66
314 | pattern:[['和'], ['的'], ['的']], support:100
315 | pattern:[['和'], ['的'], ['的'], ['的']], support:54
316 | pattern:[['和'], ['恰到好处']], support:138
317 | pattern:[['和'], ['和']], support:315
318 | pattern:[['和'], ['和'], ['很']], support:55
319 | pattern:[['和'], ['和'], ['很'], ['很']], support:50
320 | pattern:[['和'], ['和'], ['都']], support:75
321 | pattern:[['和'], ['和'], ['都'], ['都']], support:64
322 | pattern:[['和'], ['和'], ['的']], support:111
323 | pattern:[['和'], ['和'], ['的'], ['恰到好处']], support:66
324 | pattern:[['和'], ['和'], ['的'], ['的']], support:99
325 | pattern:[['和'], ['和'], ['恰到好处']], support:129
326 | pattern:[['和'], ['和'], ['和']], support:158
327 | pattern:[['和'], ['和'], ['和'], ['的']], support:56
328 | pattern:[['和'], ['和'], ['和'], ['恰到好处']], support:57
329 | pattern:[['好吃']], support:441
330 | pattern:[['好吃'], ['最']], support:53
331 | pattern:[['好吃'], ['最', '的']], support:51
332 | pattern:[['好吃'], ['最', '好吃']], support:53
333 | pattern:[['好吃'], ['最', '好吃', '的']], support:51
334 | pattern:[['好吃', '的']], support:70
335 | pattern:[['好吃', '的'], ['的']], support:62
336 | pattern:[['好吃', '的'], ['好吃']], support:64
337 | pattern:[['好吃', '的'], ['好吃', '的']], support:56
338 | pattern:[['好吃'], ['的']], support:100
339 | pattern:[['好吃'], ['的'], ['好吃']], support:63
340 | pattern:[['好吃'], ['的'], ['好吃', '的']], support:55
341 | pattern:[['好吃'], ['的'], ['的']], support:65
342 | pattern:[['好吃'], ['好吃']], support:148
343 | pattern:[['好吃'], ['好吃'], ['的']], support:65
344 | pattern:[['好吃'], ['好吃', '的']], support:68
345 | pattern:[['好吃'], ['好吃', '的'], ['好吃']], support:54
346 | pattern:[['好吃'], ['好吃', '的'], ['好吃', '的']], support:54
347 | pattern:[['好吃'], ['好吃', '的'], ['的']], support:57
348 | pattern:[['好吃'], ['好吃'], ['好吃']], support:84
349 | pattern:[['好吃'], ['好吃'], ['好吃', '的']], support:59
350 | pattern:[['很']], support:1398
351 | pattern:[['很'], ['有']], support:54
352 | pattern:[['很'], ['有'], ['有']], support:52
353 | pattern:[['很'], ['入味']], support:54
354 | pattern:[['很'], ['好吃']], support:57
355 | pattern:[['很', '古色古香']], support:72
356 | pattern:[['很', '入味']], support:73
357 | pattern:[['很'], ['古色古香']], support:93
358 | pattern:[['很'], ['都']], support:93
359 | pattern:[['很'], ['都', '很']], support:90
360 | pattern:[['很'], ['新鲜']], support:126
361 | pattern:[['很', '新鲜']], support:202
362 | pattern:[['很'], ['的']], support:235
363 | pattern:[['很'], ['的'], ['的']], support:84
364 | pattern:[['很'], ['的', '很']], support:131
365 | pattern:[['很'], ['很']], support:1091
366 | pattern:[['很'], ['很'], ['有']], support:52
367 | pattern:[['很'], ['很', '古色古香']], support:57
368 | pattern:[['很'], ['很'], ['的']], support:103
369 | pattern:[['很'], ['很'], ['的'], ['的']], support:74
370 | pattern:[['很'], ['很', '新鲜']], support:122
371 | pattern:[['很'], ['很'], ['很']], support:247
372 | pattern:[['很'], ['很'], ['很'], ['的']], support:53
373 | pattern:[['恰到好处']], support:1672
374 | pattern:[['恰到好处', '的']], support:96
375 | pattern:[['恰到好处', '的'], ['恰到好处']], support:84
376 | pattern:[['恰到好处', '的'], ['恰到好处', '的']], support:70
377 | pattern:[['恰到好处', '的'], ['的']], support:93
378 | pattern:[['恰到好处'], ['的']], support:126
379 | pattern:[['恰到好处'], ['的'], ['恰到好处']], support:62
380 | pattern:[['恰到好处'], ['的'], ['的']], support:78
381 | pattern:[['恰到好处'], ['恰到好处']], support:137
382 | pattern:[['恰到好处'], ['恰到好处'], ['的']], support:69
383 | pattern:[['恰到好处'], ['恰到好处', '的']], support:74
384 | pattern:[['恰到好处'], ['恰到好处', '的'], ['的']], support:62
385 | pattern:[['恰到好处'], ['恰到好处'], ['恰到好处']], support:84
386 | pattern:[['恰到好处'], ['恰到好处'], ['恰到好处', '的']], support:50
387 | pattern:[['的']], support:2446
388 | pattern:[['的'], ['是']], support:50
389 | pattern:[['的', '火候']], support:53
390 | pattern:[['的', '火候'], ['恰到好处']], support:53
391 | pattern:[['的', '火候'], ['的']], support:53
392 | pattern:[['的', '火候'], ['的', '火候']], support:53
393 | pattern:[['的', '火候'], ['火候']], support:53
394 | pattern:[['的'], ['煮']], support:54
395 | pattern:[['的'], ['煮', '的']], support:54
396 | pattern:[['的'], ['煮', '的', '恰到好处']], support:51
397 | pattern:[['的'], ['特别']], support:59
398 | pattern:[['的'], ['火候']], support:60
399 | pattern:[['的'], ['装修']], support:62
400 | pattern:[['的'], ['了']], support:63
401 | pattern:[['的'], ['都']], support:66
402 | pattern:[['的'], ['都'], ['都']], support:66
403 | pattern:[['的'], ['非常']], support:69
404 | pattern:[['的'], ['非常'], ['非常']], support:53
405 | pattern:[['的'], ['做']], support:73
406 | pattern:[['的'], ['做'], ['的']], support:53
407 | pattern:[['的'], ['做', '的']], support:68
408 | pattern:[['的'], ['做', '的'], ['的']], support:52
409 | pattern:[['的'], ['和']], support:80
410 | pattern:[['的'], ['和'], ['和']], support:79
411 | pattern:[['的'], ['和'], ['和'], ['和']], support:71
412 | pattern:[['的', '好吃']], support:85
413 | pattern:[['的', '好吃', '的']], support:59
414 | pattern:[['的', '好吃'], ['的']], support:59
415 | pattern:[['的'], ['古色古香']], support:88
416 | pattern:[['的', '味道']], support:90
417 | pattern:[['的', '味道'], ['的']], support:90
418 | pattern:[['的', '味道'], ['的', '味道']], support:90
419 | pattern:[['的', '味道'], ['味道']], support:90
420 | pattern:[['的'], ['好']], support:98
421 | pattern:[['的'], ['味道']], support:120
422 | pattern:[['的'], ['味道'], ['的']], support:56
423 | pattern:[['的'], ['味道'], ['味道']], support:86
424 | pattern:[['的', '很']], support:123
425 | pattern:[['的', '很'], ['的']], support:123
426 | pattern:[['的', '很'], ['的', '很']], support:123
427 | pattern:[['的', '很'], ['很']], support:123
428 | pattern:[['的', '很'], ['很'], ['很']], support:54
429 | pattern:[['的'], ['烤']], support:128
430 | pattern:[['的'], ['烤', '恰到好处']], support:100
431 | pattern:[['的'], ['烤', '的']], support:122
432 | pattern:[['的'], ['烤', '的', '恰到好处']], support:102
433 | pattern:[['的'], ['一如既往']], support:153
434 | pattern:[['的'], ['一如既往', '好吃']], support:59
435 | pattern:[['的'], ['一如既往'], ['的']], support:84
436 | pattern:[['的'], ['一如既往', '的']], support:149
437 | pattern:[['的'], ['一如既往', '的', '好吃']], support:65
438 | pattern:[['的'], ['一如既往', '的'], ['的']], support:83
439 | pattern:[['的'], ['好吃']], support:213
440 | pattern:[['的'], ['好吃', '的']], support:58
441 | pattern:[['的'], ['好吃'], ['的']], support:58
442 | pattern:[['的'], ['很']], support:332
443 | pattern:[['的'], ['很'], ['的']], support:112
444 | pattern:[['的'], ['很'], ['的', '很']], support:97
445 | pattern:[['的'], ['很'], ['很']], support:308
446 | pattern:[['的'], ['很'], ['很'], ['很']], support:60
447 | pattern:[['的', '恰到好处']], support:450
448 | pattern:[['的', '恰到好处'], ['的']], support:68
449 | pattern:[['的', '恰到好处', '的']], support:73
450 | pattern:[['的'], ['恰到好处']], support:900
451 | pattern:[['的'], ['恰到好处'], ['恰到好处']], support:50
452 | pattern:[['的'], ['恰到好处'], ['的']], support:66
453 | pattern:[['的'], ['恰到好处', '的']], support:72
454 | pattern:[['的'], ['的']], support:2225
455 | pattern:[['的'], ['的'], ['特别']], support:50
456 | pattern:[['的'], ['的'], ['非常']], support:53
457 | pattern:[['的'], ['的', '火候']], support:55
458 | pattern:[['的'], ['的'], ['了']], support:59
459 | pattern:[['的'], ['的'], ['都']], support:66
460 | pattern:[['的'], ['的'], ['都'], ['都']], support:56
461 | pattern:[['的'], ['的'], ['好']], support:74
462 | pattern:[['的'], ['的'], ['和']], support:80
463 | pattern:[['的'], ['的'], ['和'], ['和']], support:77
464 | pattern:[['的'], ['的', '好吃']], support:85
465 | pattern:[['的'], ['的'], ['味道']], support:93
466 | pattern:[['的'], ['的', '味道']], support:95
467 | pattern:[['的'], ['的', '味道'], ['的']], support:55
468 | pattern:[['的'], ['的', '味道'], ['味道']], support:78
469 | pattern:[['的'], ['的'], ['好吃']], support:103
470 | pattern:[['的'], ['的', '很']], support:176
471 | pattern:[['的'], ['的', '很'], ['的']], support:107
472 | pattern:[['的'], ['的', '很'], ['的', '很']], support:97
473 | pattern:[['的'], ['的', '很'], ['很']], support:176
474 | pattern:[['的'], ['的'], ['很']], support:308
475 | pattern:[['的'], ['的'], ['很'], ['很']], support:189
476 | pattern:[['的'], ['的'], ['恰到好处']], support:348
477 | pattern:[['的'], ['的', '恰到好处']], support:533
478 | pattern:[['的'], ['的'], ['的']], support:1075
479 | pattern:[['的'], ['的'], ['的'], ['好吃']], support:50
480 | pattern:[['的'], ['的'], ['的', '味道']], support:51
481 | pattern:[['的'], ['的'], ['的', '好吃']], support:59
482 | pattern:[['的'], ['的'], ['的'], ['很']], support:127
483 | pattern:[['的'], ['的'], ['的'], ['很'], ['很']], support:71
484 | pattern:[['的'], ['的'], ['的', '很']], support:141
485 | pattern:[['的'], ['的'], ['的', '很'], ['很']], support:78
486 | pattern:[['的'], ['的'], ['的', '恰到好处']], support:153
487 | pattern:[['的'], ['的'], ['的'], ['恰到好处']], support:157
488 | pattern:[['的'], ['的'], ['的'], ['的']], support:240
489 | pattern:[['的'], ['的'], ['的'], ['的'], ['恰到好处']], support:50
490 | pattern:[['的'], ['的'], ['的'], ['的', '恰到好处']], support:53
491 | pattern:[['的'], ['的'], ['的'], ['的'], ['的']], support:146
492 |
--------------------------------------------------------------------------------
/lib/train_squence_dict.txt:
--------------------------------------------------------------------------------
1 | pattern:服务, dist:0.85119047619
2 | pattern:服务态度, dist:0.854651162791
3 | pattern:还, dist:0.880077369439
4 | pattern:还, 不错, dist:0.883990719258
5 | pattern:一如既往, 的, 好, dist:0.860589812332
6 | pattern:恰到好处, dist:0.854150702427
7 | pattern:味道, 不错, dist:0.918300653595
8 | pattern:很, 不错, dist:0.885583524027
9 | pattern:很, 好, dist:0.92101551481
10 | pattern:不错, dist:0.93665480427
11 | pattern:不错, 的, dist:0.859550561798
12 | pattern:的, 恰到好处, dist:0.857959961868
13 | pattern:烤, dist:0.879518072289
14 | pattern:新鲜, dist:0.895652173913
15 | pattern:最, dist:0.862595419847
16 | pattern:古色古香, dist:0.889380530973
17 | pattern:得, 恰到好处, dist:0.88038277512
18 | pattern:很, 新鲜, dist:0.88986784141
19 |
--------------------------------------------------------------------------------
/model/model.txt:
--------------------------------------------------------------------------------
1 | tree
2 | version=v2
3 | num_class=1
4 | num_tree_per_iteration=1
5 | label_index=0
6 | max_feature_idx=32
7 | objective=binary sigmoid:1
8 | feature_names=Column_0 Column_1 Column_2 Column_3 Column_4 Column_5 Column_6 Column_7 Column_8 Column_9 Column_10 Column_11 Column_12 Column_13 Column_14 Column_15 Column_16 Column_17 Column_18 Column_19 Column_20 Column_21 Column_22 Column_23 Column_24 Column_25 Column_26 Column_27 Column_28 Column_29 Column_30 Column_31 Column_32
9 | feature_infos=[0:7] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:6] [0:1] [0:1] [0:1] [2:14] none
10 | tree_sizes=2506 2543 2552 2555 2552 2547 2543
11 |
12 | Tree=0
13 | num_leaves=31
14 | num_cat=0
15 | split_feature=3 2 6 13 18 1 31 22 27 0 28 15 31 25 0 31 24 27 11 19 27 15 27 0 27 21 0 4 0 16
16 | split_gain=1672.7 662.476 335.058 296.572 257.955 209.945 165.141 145.247 93.0893 79.7694 69.8833 50.3365 49.0074 46.734 45.9252 34.9812 16.7761 14.0129 12.9446 8.90445 12.1735 8.28578 7.1752 5.11464 4.92162 4.47465 4.099 8.48594 3.30777 3.19911
17 | threshold=1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 3.5000000000000004 1.0000000180025095e-35 1.5000000000000002 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 7.5000000000000009 1.0000000180025095e-35 1.5000000000000002 2.5000000000000004 1.0000000180025095e-35 1.5000000000000002 1.0000000180025095e-35 1.0000000180025095e-35 1.5000000000000002 1.0000000180025095e-35 2.5000000000000004 2.5000000000000004 1.5000000000000002 1.0000000180025095e-35 1.5000000000000002 1.0000000180025095e-35 1.5000000000000002 1.0000000180025095e-35
18 | decision_type=2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
19 | left_child=1 2 3 4 5 11 9 8 13 -2 14 12 18 -7 -9 -11 -10 -3 -1 20 -6 25 -19 -14 -4 26 27 29 -17 -8
20 | right_child=6 17 24 -5 19 7 21 10 16 15 -12 -13 23 -15 -16 28 -18 22 -20 -21 -22 -23 -24 -25 -26 -27 -28 -29 -30 -31
21 | leaf_value=-2.0550189461947905 -1.43359967695186 -2.1238630485802656 1.3324744193585658 1.9337655915343765 -0.46314352002920495 -0.71826729292988867 0.82513904335239108 -1.2573287935892716 0.34715700441359321 -0.13478960358733616 -1.600032030544702 0.48144301777598986 -0.85923101510887101 0.91251519944103365 -0.66282756015982114 0.87470354242320036 -0.42132783139909341 -1.7845300302750768 -0.89245125663168179 1.5977725624548567 1.2674090364743396 2.0520701510719954 -0.84262089434746568 0.32778493198668257 1.9358513750862374 2.0509531566496841 1.6062272322182027 1.6560158430467975 1.3638675475976221 1.4144494497720264
22 | leaf_count=944 107 1747 200 173 26 2914 128 1036 559 166 961 42 27 81 1332 123 165 389 45 154 61 165 40 41 87 73 682 182 125 61
23 | internal_value=0 -0.309936 -0.0524874 -0.127942 -0.184548 -0.248422 1.88562 -0.11418 0.17345 0.879238 -0.435506 -1.10933 -1.19967 0.00871845 -0.240041 1.30051 0.8549 -1.35677 -1.31924 1.9747 1.43311 2.29175 -1.01383 0.539351 2.19826 2.22681 2.19166 2.01251 1.80414 1.69822
24 | internal_count=12836 11024 8848 8561 8388 8147 1812 7048 3719 521 3329 1099 1057 2995 2368 414 724 2176 989 241 87 1291 429 68 287 1126 1053 371 248 189
25 | shrinkage=1
26 |
27 |
28 | Tree=1
29 | num_leaves=31
30 | num_cat=0
31 | split_feature=2 0 7 20 21 31 29 29 19 27 31 27 31 27 31 9 31 31 22 10 31 0 0 27 0 11 21 31 24 31
32 | split_gain=114.803 48.5266 36.7434 34.635 29.9606 26.9151 23.0683 18.7995 17.4169 15.4168 15.2932 12.0685 11.0383 12.1317 14.3242 13.084 8.07905 6.91425 6.83414 6.62709 6.58866 10.4742 5.33016 5.32485 5.17965 5.17898 5.42688 4.80956 4.72427 4.6733
33 | threshold=1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 4.5000000000000009 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.5000000000000002 8.5000000000000018 2.5000000000000004 11.500000000000002 2.5000000000000004 7.5000000000000009 1.0000000180025095e-35 5.5000000000000009 2.5000000000000004 1.0000000180025095e-35 1.0000000180025095e-35 5.5000000000000009 2.5000000000000004 2.5000000000000004 1.5000000000000002 2.5000000000000004 1.0000000180025095e-35 1.0000000180025095e-35 5.5000000000000009 1.0000000180025095e-35 3.5000000000000004
34 | decision_type=2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
35 | left_child=1 8 3 4 7 6 -5 18 17 28 11 20 13 15 -15 -9 -4 -1 -3 -19 23 -22 -7 -6 -11 26 -26 -20 -2 -8
36 | right_child=9 2 16 5 10 22 29 12 -10 24 -12 -13 -14 14 -16 -17 -18 19 27 -21 21 -23 -24 -25 25 -27 -28 -29 -30 -31
37 | leaf_value=-1.072787817473303 -0.99143030324820647 -0.58301498931364892 -1.0533906648917402 0.57553047205342522 0.34668252739656358 0.51937105807709505 -0.45846102736128586 -0.050869127262312297 -1.2148470169001131 -0.56891188427912098 -0.61880657916297133 1.6229148458709972 -1.3071510236995709 0.90513099342250936 -0.099481208336353391 -0.8047535232902987 -0.19475151409256594 -0.23805065166435288 -0.10177182020897647 -1.2772456598100361 -0.50612807977557017 0.40951014753595427 0.94921090720815615 0.89562210588321467 0.97602095546759693 -1.2098072280005219 -0.2328265837454141 -0.47120193870363308 0.32635563936740086 0.012058618257987454
38 | leaf_count=89 1718 405 399 222 591 439 268 4994 169 305 81 41 33 157 146 232 110 481 682 62 108 133 189 101 49 20 61 363 29 159
39 | internal_value=0 -0.0597912 -0.0159528 0.00921915 -0.0511479 0.334795 0.0234401 -0.110746 -0.625012 -0.81592 0.287014 0.362811 -0.0514284 -0.0428279 0.406317 -0.0694361 -0.819104 -0.415534 -0.36151 -0.3144 0.316216 0.00506864 0.648413 0.423047 -0.367423 0.0828826 0.309904 -0.233897 -0.969555 -0.278643
40 | internal_count=12836 10654 9853 9344 8067 1277 649 7012 801 2182 1055 974 5562 5529 303 5226 509 632 1450 543 933 241 628 692 435 130 110 1045 1747 427
41 | shrinkage=1
42 |
43 |
44 | Tree=2
45 | num_leaves=31
46 | num_cat=0
47 | split_feature=2 31 31 25 19 0 8 23 10 26 31 9 31 0 31 24 20 24 1 24 27 0 15 27 31 26 3 0 4 27
48 | split_gain=24.8262 12.6623 21.4841 11.4282 10.5548 10.4549 7.66577 7.36499 7.36913 6.13696 6.66623 5.7936 16.253 5.13747 6.19751 4.95007 4.7082 6.20012 4.6244 4.37831 6.66809 4.37316 4.24535 4.14792 4.84689 4.08009 3.92112 6.49702 3.81669 3.61685
49 | threshold=1.0000000180025095e-35 3.5000000000000004 6.5000000000000009 1.0000000180025095e-35 1.0000000180025095e-35 2.5000000000000004 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 4.5000000000000009 1.0000000180025095e-35 4.5000000000000009 4.5000000000000009 9.5000000000000018 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 3.5000000000000004 1.5000000000000002 1.0000000180025095e-35 1.5000000000000002 5.5000000000000009 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 2.5000000000000004
50 | decision_type=2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
51 | left_child=1 6 7 4 23 19 16 8 9 11 -11 15 -13 29 -15 22 17 26 -17 20 25 -19 -3 24 -2 28 27 -1 -4 -7
52 | right_child=3 2 5 -5 -6 13 -8 -9 -10 10 -12 12 -14 14 -16 18 -18 21 -20 -21 -22 -23 -24 -25 -26 -27 -28 -29 -30 -31
53 | leaf_value=-0.67349032755458926 -0.84517582340787911 0.15644005186322876 -0.50042817977061227 1.629711881441342 0.9398979959210193 -0.14965875338958282 -1.0663700819369211 -0.3774201185991547 -0.74439049070234486 -1.1903881994668726 0.036517745979831519 -1.0583263561454659 1.9034316995745442 0.045189168725435734 1.0065819474815956 0.55985258913896407 0.06126216725013884 -0.080278576859951267 -0.22186881207374839 0.20894594351269716 0.88922308742772593 -1.1627299087656517 0.61086077494217328 -0.34056537690887184 -0.062368686198472217 0.55700865437479896 -0.00090272375185887152 -0.17791252746562625 0.48212965908394456 0.26601808634637619
54 | leaf_count=279 1528 4628 758 25 47 879 183 155 125 60 62 202 26 123 55 76 457 27 258 63 21 59 170 378 204 22 519 1285 29 133
55 | internal_value=0 -0.0278934 0.0215249 -0.501287 -0.546784 -0.17728 -0.167066 0.101064 0.116926 0.126035 -0.442469 0.13765 -0.533056 -0.0353251 0.337486 0.147134 -0.149397 -0.196634 -0.117614 -0.366977 -0.412725 -0.794134 0.167952 -0.6083 -0.748095 -0.445993 -0.169785 -0.23256 -0.473092 -0.0973796
56 | internal_count=12836 10654 7845 2182 2157 2083 2809 5762 5607 5482 122 5360 228 1190 178 5132 2626 2169 334 893 830 86 4798 2110 1732 809 2083 1564 787 1012
57 | shrinkage=1
58 |
59 |
60 | Tree=3
61 | num_leaves=31
62 | num_cat=0
63 | split_feature=8 2 31 31 1 0 30 13 7 31 0 27 21 19 25 31 10 11 24 0 31 0 28 31 20 22 31 31 0 31
64 | split_gain=6.71021 4.85772 4.30692 3.76561 5.83757 4.38595 6.56774 5.79834 5.18061 4.60596 3.95081 3.83341 3.27985 5.31947 4.96405 4.68151 3.10336 2.75141 2.27144 2.23361 2.19412 2.98619 2.31141 3.59664 2.16553 2.05352 2.22162 2.21449 2.16622 2.00491
65 | threshold=1.0000000180025095e-35 1.0000000180025095e-35 3.5000000000000004 9.5000000000000018 1.0000000180025095e-35 2.5000000000000004 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 5.5000000000000009 5.5000000000000009 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 2.5000000000000004 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 3.5000000000000004 4.5000000000000009 3.5000000000000004 1.0000000180025095e-35 8.5000000000000018 1.0000000180025095e-35 1.0000000180025095e-35 7.5000000000000009 6.5000000000000009 2.5000000000000004 7.5000000000000009
66 | decision_type=2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
67 | left_child=1 3 24 5 -5 7 10 8 12 -10 20 -6 14 15 16 -14 -1 18 19 25 21 -7 23 -22 -3 26 27 -4 -28 -24
68 | right_child=-2 2 17 4 11 6 -8 -9 9 -11 -12 -13 13 -15 -16 -17 -18 -19 -20 -21 22 -23 29 -25 -26 -27 28 -29 -30 -31
69 | leaf_value=-0.048873450666162804 -0.95761440885089855 -0.88910411123100086 0.032679373816888659 0.27657927105347768 0.43388862563259956 0.39415154675555086 -0.6774180080658786 0.69756570568118559 -0.96548280206818371 0.086429634737766561 -0.75375299716225685 -0.54161936766310248 0.89194540635156194 1.159286185871004 0.4514820222712036 0.039076045783276919 -0.68164654114375478 -0.67812174120880564 0.56391902889373602 -0.68919638312496889 0.19732327262213731 -0.50033632245286841 -0.18133569231222604 -0.12305895545147537 -0.21558073172611611 -0.57369287918420897 -1.0017323774632108 0.71582547703130339 0.34805465971922328 0.30236984337079675
70 | leaf_count=6707 240 550 656 97 30 256 57 104 270 65 29 198 30 27 96 693 137 228 57 76 1056 20 265 217 339 158 28 56 20 74
71 | internal_value=0 -0.0211186 -0.262226 -0.01023 -0.258069 -0.00164773 0.0958663 -0.0279332 -0.033863 -0.570496 0.119244 -0.442338 -0.0266418 0.111768 -0.0446056 0.0782576 -0.0531757 -0.124023 -0.0398946 -0.113305 0.132077 0.323298 0.0990613 0.141 -0.652006 -0.0284151 0.0661624 0.175535 -0.532429 -0.0869003
72 | internal_count=12836 12596 2168 10428 325 10103 1974 8129 8025 335 1917 228 7690 750 6940 723 6844 1279 1051 994 1888 276 1612 1273 889 918 760 712 48 339
73 | shrinkage=1
74 |
75 |
76 | Tree=4
77 | num_leaves=31
78 | num_cat=0
79 | split_feature=4 31 0 27 3 22 0 9 9 19 30 20 19 31 0 16 27 31 7 31 14 31 15 31 31 17 22 31 0 0
80 | split_gain=2.95349 2.09107 7.61079 5.71605 10.8131 2.69255 2.15869 8.36049 5.97966 5.80797 5.80534 5.60773 5.34924 6.07975 10.7853 5.21571 3.80563 4.25929 5.11087 3.64466 3.17517 5.0602 2.7163 2.5368 2.52847 2.51108 2.50341 2.45734 3.11318 2.24878
81 | threshold=1.0000000180025095e-35 2.5000000000000004 1.5000000000000002 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.5000000000000002 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 9.5000000000000018 3.5000000000000004 1.0000000180025095e-35 1.0000000180025095e-35 5.5000000000000009 1.0000000180025095e-35 4.5000000000000009 1.0000000180025095e-35 5.5000000000000009 1.0000000180025095e-35 6.5000000000000009 5.5000000000000009 1.0000000180025095e-35 1.0000000180025095e-35 4.5000000000000009 1.0000000180025095e-35 1.0000000180025095e-35
82 | decision_type=2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
83 | left_child=1 2 3 5 -5 -1 7 9 12 10 16 27 15 19 -15 20 23 18 -18 -14 22 -22 26 -3 -12 -19 -8 28 -11 -29
84 | right_child=-2 6 -4 4 -6 -7 8 -9 -10 11 24 -13 13 14 -16 -17 17 25 -20 -21 21 -23 -24 -25 -26 -27 -28 29 -30 -31
85 | leaf_value=0.28588926412019627 0.20548196811039632 -0.20694232236917057 -1.0671229395897599 -0.99840180448308158 0.039275536682173359 1.3872347254614692 -0.08025632049054908 -1.1111376959092034 1.1779891993825276 -0.67965403273145197 0.80032049833917773 0.68332053844162055 0.76126504060950584 -0.93889503707649657 0.84407935256935107 0.75814809036338493 0.091246042855297013 -0.22235392419757691 -1.0497793995849904 0.22767372979825046 2.7705739827444456 0.11349945407609044 -0.66966149335001335 0.70036274319917913 -0.11753440550808683 1.3446014439697709 0.028781679993167247 0.28130271193786566 -0.10105890402259009 -0.52753342111862278
86 | leaf_count=48 529 615 57 201 179 35 2813 232 26 136 67 35 81 64 27 67 2701 422 316 458 48 26 50 35 22 22 2872 29 404 219
87 | internal_value=0 -0.0174247 -0.178527 -0.0673055 -0.212563 0.507656 -0.00997688 -0.0537394 0.0196359 -0.0419781 0.0059506 -0.22424 0.0144398 0.217877 -0.36383 -0.0121458 -0.0130797 0.0316094 0.0777117 0.309307 -0.0198865 0.958419 -0.0236342 -0.180157 0.585434 -0.198135 -0.0187605 -0.268875 -0.171226 -0.4596
88 | internal_count=12836 12307 520 463 380 83 11787 5255 6532 5023 4200 823 6506 630 91 5876 4111 3461 3017 539 5809 74 5735 650 89 444 5685 788 540 248
89 | shrinkage=1
90 |
91 |
92 | Tree=5
93 | num_leaves=31
94 | num_cat=0
95 | split_feature=14 2 0 31 27 22 22 3 0 9 3 0 31 31 0 0 27 21 29 25 25 0 31 11 30 0 31 31 27 20
96 | split_gain=8.0797 1.41833 1.49682 2.90015 1.4793 5.37403 3.69211 3.40794 3.11617 3.066 3.34189 3.06452 3.36994 2.58858 7.43189 3.74184 2.58506 2.57085 2.99114 4.64915 2.58018 2.11639 1.94118 1.84212 1.82033 1.7451 1.58627 1.50993 2.13683 1.8482
97 | threshold=1.0000000180025095e-35 1.0000000180025095e-35 4.5000000000000009 9.5000000000000018 1.5000000000000002 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 7.5000000000000009 4.5000000000000009 1.5000000000000002 1.5000000000000002 2.5000000000000004 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 2.5000000000000004 4.5000000000000009 1.0000000180025095e-35 1.0000000180025095e-35 1.5000000000000002 4.5000000000000009 3.5000000000000004 1.0000000180025095e-35 1.0000000180025095e-35
98 | decision_type=2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
99 | left_child=1 4 3 -3 6 17 7 22 -8 10 13 -12 -13 15 16 -7 -15 20 -19 -20 24 -16 27 -10 26 -9 -6 -1 -29 -30
100 | right_child=-2 2 -4 -5 5 9 8 25 23 -11 11 12 -14 14 21 -17 -18 18 19 -21 -22 -23 -24 -25 -26 -27 -28 28 29 -31
101 | leaf_value=0.03170035808869482 -0.69079099725543081 -0.15557901433712443 0.6584285825803281 -1.5172651190139466 -0.4732035534280104 -0.13200299260800519 -0.37087600824375072 0.97649659497508845 -0.051930789941908723 -0.49814575141268291 0.46446902268315321 -0.42423664243607362 0.28306546409253325 1.0350819297896348 0.35321660509050085 0.54929060437939448 0.34448358446026622 -0.7045863156101434 0.35626138341077834 -0.92078073431480623 0.4083801502362065 0.051075837726934935 0.085436828272078033 -0.70617404378735527 0.38969919256714836 0.19971802263131966 -0.14513079221986447 0.05558167529924643 -0.29694188840460278 -0.0089717072398676524
102 | leaf_count=1296 329 1804 24 25 88 210 340 40 3923 240 57 169 77 115 237 57 41 27 209 23 45 250 1551 23 29 58 649 263 319 318
103 | internal_value=0 -0.00841308 -0.163634 -0.195601 -0.0032152 0.0500899 -0.0195305 0.034081 -0.0724102 0.161177 0.183521 -0.0728149 -0.213296 0.248287 0.325001 0.0383019 0.811718 -0.0712727 0.156315 0.244554 -0.130571 0.195265 0.0242746 -0.0564861 -0.16225 0.571455 -0.185357 -0.0256981 -0.10096 -0.191221
104 | internal_count=12836 12507 1853 1829 10654 2523 8131 3845 4286 1453 1213 303 246 910 643 267 156 1070 259 232 811 487 3747 3946 766 98 737 2196 900 637
105 | shrinkage=1
106 |
107 |
108 | Tree=6
109 | num_leaves=31
110 | num_cat=0
111 | split_feature=5 22 8 31 0 0 12 31 31 24 0 20 31 0 28 31 27 31 7 10 14 27 17 31 0 27 1 27 27 17
112 | split_gain=1.88932 2.56327 1.04426 0.934031 0.85097 0.696562 0.663971 2.22751 0.798063 0.700531 5.2877 3.34037 2.92166 1.53369 1.13783 1.11071 1.87414 1.06014 1.0239 1.0768 0.860488 1.73991 1.28486 1.6205 0.745665 0.905978 0.664893 0.61309 0.477053 0.437942
113 | threshold=1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 3.5000000000000004 5.5000000000000009 1.5000000000000002 1.0000000180025095e-35 4.5000000000000009 6.5000000000000009 1.0000000180025095e-35 1.5000000000000002 1.0000000180025095e-35 5.5000000000000009 4.5000000000000009 1.0000000180025095e-35 8.5000000000000018 1.5000000000000002 3.5000000000000004 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.5000000000000002 1.0000000180025095e-35 5.5000000000000009 1.0000000180025095e-35 1.5000000000000002 1.0000000180025095e-35 1.5000000000000002 1.5000000000000002 1.0000000180025095e-35
114 | decision_type=2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
115 | left_child=2 -2 4 -3 6 -4 9 -8 -9 18 12 13 17 14 -12 16 -13 -11 20 24 22 29 26 -24 -20 -26 -1 -5 -19 -22
116 | right_child=1 3 5 27 -6 -7 7 8 -10 10 11 15 -14 -15 -16 -17 -18 28 19 -21 21 -23 23 -25 25 -27 -28 -29 -30 -31
117 | leaf_value=0.036860401016981056 1.1150567535245364 -0.004703486242172295 -1.047725186830176 0.51228452616816034 0.34103373588574293 -0.090328537949230028 -1.0217366267459043 -0.18693358372592297 0.78207185396005563 0.1437791693515631 -0.32375026928689593 0.030703883589016368 -0.27068788599881771 -0.89951870914315168 -0.0048903627427402578 -0.24403738854710949 0.82255401883839063 0.46061406832327284 -1.1616515905485312 -1.1114029011344582 -0.41204483113273793 0.49364247162752961 -0.44581570934906301 0.65729035813041847 -0.28145438266364625 0.38497862049267345 -0.0114951691308038 -0.0476015464035454 0.83083709727774957 -1.1033428580219313
118 | leaf_count=3925 28 84 210 52 46 30 230 73 22 37 337 36 33 20 94 21 37 48 22 64 255 24 107 92 237 37 6519 33 49 34
119 | internal_value=0 0.245146 -0.00843234 0.146559 -0.00740326 -0.593286 -0.00881333 -0.332832 0.180313 -0.00762542 -0.0830963 -0.19998 0.311052 -0.292768 -0.257699 0.206688 0.356528 0.502364 -0.00222484 -0.28086 6.61776e-05 -0.286743 0.00195207 0.410373 -0.181744 -0.116627 -3.84114e-05 0.376574 0.652019 -0.501282
120 | internal_count=12836 197 12639 169 12399 240 12353 325 95 12028 712 545 167 451 431 94 73 134 11316 360 10956 313 10643 199 296 274 10444 85 97 289
121 | shrinkage=1
122 |
123 |
124 | end of trees
125 |
126 | feature importances:
127 | Column_31=48
128 | Column_0=35
129 | Column_27=23
130 | Column_22=8
131 | Column_24=7
132 | Column_19=6
133 | Column_20=6
134 | Column_2=5
135 | Column_3=5
136 | Column_9=5
137 | Column_21=5
138 | Column_25=5
139 | Column_1=4
140 | Column_7=4
141 | Column_10=4
142 | Column_11=4
143 | Column_15=4
144 | Column_4=3
145 | Column_8=3
146 | Column_14=3
147 | Column_17=3
148 | Column_28=3
149 | Column_29=3
150 | Column_30=3
151 | Column_13=2
152 | Column_16=2
153 | Column_26=2
154 | Column_5=1
155 | Column_6=1
156 | Column_12=1
157 | Column_18=1
158 | Column_23=1
159 |
160 | parameters:
161 | [boosting: gbdt]
162 | [objective: binary]
163 | [metric: binary_error]
164 | [tree_learner: serial]
165 | [device_type: cpu]
166 | [data: ]
167 | [valid: ]
168 | [num_iterations: 100]
169 | [learning_rate: 1]
170 | [num_leaves: 31]
171 | [num_threads: 1]
172 | [max_depth: 9]
173 | [min_data_in_leaf: 20]
174 | [min_sum_hessian_in_leaf: 0.001]
175 | [bagging_fraction: 1]
176 | [bagging_freq: 0]
177 | [bagging_seed: 3]
178 | [feature_fraction: 1]
179 | [feature_fraction_seed: 2]
180 | [early_stopping_round: 0]
181 | [max_delta_step: 0]
182 | [lambda_l1: 0]
183 | [lambda_l2: 0]
184 | [min_gain_to_split: 0]
185 | [drop_rate: 0.1]
186 | [max_drop: 50]
187 | [skip_drop: 0.5]
188 | [xgboost_dart_mode: 0]
189 | [uniform_drop: 0]
190 | [drop_seed: 4]
191 | [top_rate: 0.2]
192 | [other_rate: 0.1]
193 | [min_data_per_group: 100]
194 | [max_cat_threshold: 32]
195 | [cat_l2: 10]
196 | [cat_smooth: 10]
197 | [max_cat_to_onehot: 4]
198 | [top_k: 20]
199 | [monotone_constraints: ]
200 | [feature_contri: ]
201 | [forcedsplits_filename: ]
202 | [refit_decay_rate: 0.9]
203 | [verbosity: 1]
204 | [max_bin: 255]
205 | [min_data_in_bin: 3]
206 | [bin_construct_sample_cnt: 200000]
207 | [histogram_pool_size: -1]
208 | [data_random_seed: 1]
209 | [output_model: LightGBM_model.txt]
210 | [snapshot_freq: -1]
211 | [input_model: ]
212 | [output_result: LightGBM_predict_result.txt]
213 | [initscore_filename: ]
214 | [valid_data_initscores: ]
215 | [pre_partition: 0]
216 | [enable_bundle: 1]
217 | [max_conflict_rate: 0]
218 | [is_enable_sparse: 1]
219 | [sparse_threshold: 0.8]
220 | [use_missing: 1]
221 | [zero_as_missing: 0]
222 | [two_round: 0]
223 | [save_binary: 0]
224 | [enable_load_from_binary_file: 1]
225 | [header: 0]
226 | [label_column: ]
227 | [weight_column: ]
228 | [group_column: ]
229 | [ignore_column: ]
230 | [categorical_feature: ]
231 | [predict_raw_score: 0]
232 | [predict_leaf_index: 0]
233 | [predict_contrib: 0]
234 | [num_iteration_predict: -1]
235 | [pred_early_stop: 0]
236 | [pred_early_stop_freq: 10]
237 | [pred_early_stop_margin: 10]
238 | [convert_model_language: ]
239 | [convert_model: gbdt_prediction.cpp]
240 | [num_class: 1]
241 | [is_unbalance: 0]
242 | [scale_pos_weight: 1]
243 | [sigmoid: 1]
244 | [boost_from_average: 1]
245 | [reg_sqrt: 0]
246 | [alpha: 0.9]
247 | [fair_c: 1]
248 | [poisson_max_delta_step: 0.7]
249 | [tweedie_variance_power: 1.5]
250 | [max_position: 20]
251 | [label_gain: ]
252 | [metric_freq: 1]
253 | [is_provide_training_metric: 0]
254 | [eval_at: ]
255 | [num_machines: 1]
256 | [local_listen_port: 12400]
257 | [time_out: 120]
258 | [machine_list_filename: ]
259 | [machines: ]
260 | [gpu_platform_id: -1]
261 | [gpu_device_id: -1]
262 | [gpu_use_dp: 0]
263 |
264 | end of parameters
265 |
266 | pandas_categorical:null
267 |
--------------------------------------------------------------------------------
/model/xgb.dump.raw.txt:
--------------------------------------------------------------------------------
1 | booster[0]:
2 | 0:[f3<-9.53674e-007] yes=1,no=2,missing=1
3 | 1:[f2<-9.53674e-007] yes=3,no=4,missing=3
4 | 3:[f6<-9.53674e-007] yes=7,no=8,missing=7
5 | 7:[f13<-9.53674e-007] yes=15,no=16,missing=15
6 | 15:leaf=-0.821735
7 | 16:leaf=1.63842
8 | 8:[f31<3.5] yes=17,no=18,missing=17
9 | 17:leaf=0.964286
10 | 18:leaf=1.45355
11 | 4:[f6<-9.53674e-007] yes=9,no=10,missing=9
12 | 9:[f27<2.5] yes=19,no=20,missing=19
13 | 19:leaf=-1.88956
14 | 20:leaf=-0.790698
15 | 10:leaf=1
16 | 2:[f31<3.5] yes=5,no=6,missing=5
17 | 5:[f0<0.5] yes=11,no=12,missing=11
18 | 11:[f28<-9.53674e-007] yes=21,no=22,missing=21
19 | 21:leaf=-1.49206
20 | 22:leaf=-0.923077
21 | 12:[f31<2.5] yes=23,no=24,missing=23
22 | 23:leaf=-0.164706
23 | 24:leaf=0.936508
24 | 6:[f10<-9.53674e-007] yes=13,no=14,missing=13
25 | 13:[f15<-9.53674e-007] yes=25,no=26,missing=25
26 | 25:leaf=1.33215
27 | 26:leaf=1.73965
28 | 14:leaf=-0.5
29 | booster[1]:
30 | 0:[f18<-9.53674e-007] yes=1,no=2,missing=1
31 | 1:[f2<-9.53674e-007] yes=3,no=4,missing=3
32 | 3:[f7<-9.53674e-007] yes=7,no=8,missing=7
33 | 7:[f22<-9.53674e-007] yes=13,no=14,missing=13
34 | 13:leaf=0.314021
35 | 14:leaf=-0.224416
36 | 8:[f31<7.5] yes=15,no=16,missing=15
37 | 15:leaf=-1.33295
38 | 16:leaf=0.615335
39 | 4:[f27<1.5] yes=9,no=10,missing=9
40 | 9:[f24<-9.53674e-007] yes=17,no=18,missing=17
41 | 17:leaf=-1.03867
42 | 18:leaf=0.0446815
43 | 10:[f0<2.5] yes=19,no=20,missing=19
44 | 19:leaf=-0.530085
45 | 20:leaf=0.0885103
46 | 2:[f23<-9.53674e-007] yes=5,no=6,missing=5
47 | 5:[f29<-9.53674e-007] yes=11,no=12,missing=11
48 | 11:[f0<2.5] yes=21,no=22,missing=21
49 | 21:leaf=-0.255734
50 | 22:leaf=0.714835
51 | 12:[f31<11.5] yes=23,no=24,missing=23
52 | 23:leaf=2.36027
53 | 24:leaf=0.0737543
54 | 6:leaf=0.0864305
55 | booster[2]:
56 | 0:[f0<1.5] yes=1,no=2,missing=1
57 | 1:[f25<-9.53674e-007] yes=3,no=4,missing=3
58 | 3:[f3<-9.53674e-007] yes=7,no=8,missing=7
59 | 7:[f1<-9.53674e-007] yes=15,no=16,missing=15
60 | 15:leaf=-0.833785
61 | 16:leaf=-0.308235
62 | 8:[f4<-9.53674e-007] yes=17,no=18,missing=17
63 | 17:leaf=0.0309599
64 | 18:leaf=0.441062
65 | 4:[f31<6.5] yes=9,no=10,missing=9
66 | 9:[f31<4.5] yes=19,no=20,missing=19
67 | 19:leaf=0.810088
68 | 20:leaf=1.89812
69 | 10:leaf=-0.28343
70 | 2:[f29<-9.53674e-007] yes=5,no=6,missing=5
71 | 5:[f20<-9.53674e-007] yes=11,no=12,missing=11
72 | 11:[f21<-9.53674e-007] yes=21,no=22,missing=21
73 | 21:leaf=-0.577434
74 | 22:leaf=-0.0028292
75 | 12:[f31<3.5] yes=23,no=24,missing=23
76 | 23:leaf=-0.156102
77 | 24:leaf=0.856824
78 | 6:[f2<-9.53674e-007] yes=13,no=14,missing=13
79 | 13:[f27<1.5] yes=25,no=26,missing=25
80 | 25:leaf=0.231247
81 | 26:leaf=0.618416
82 | 14:[f27<1.5] yes=27,no=28,missing=27
83 | 27:leaf=-0.705093
84 | 28:leaf=-0.00610159
85 | booster[3]:
86 | 0:[f0<0.5] yes=1,no=2,missing=1
87 | 1:[f20<-9.53674e-007] yes=3,no=4,missing=3
88 | 3:[f27<1.5] yes=7,no=8,missing=7
89 | 7:[f19<-9.53674e-007] yes=15,no=16,missing=15
90 | 15:leaf=-0.678991
91 | 16:leaf=-1.18221
92 | 8:[f31<3.5] yes=17,no=18,missing=17
93 | 17:leaf=-0.452843
94 | 18:leaf=-0.0122485
95 | 4:[f10<-9.53674e-007] yes=9,no=10,missing=9
96 | 9:[f29<-9.53674e-007] yes=19,no=20,missing=19
97 | 19:leaf=-0.12872
98 | 20:leaf=0.424762
99 | 10:leaf=-1.03684
100 | 2:[f8<-9.53674e-007] yes=5,no=6,missing=5
101 | 5:[f31<6.5] yes=11,no=12,missing=11
102 | 11:[f9<-9.53674e-007] yes=21,no=22,missing=21
103 | 21:leaf=0.0983527
104 | 22:leaf=-0.936762
105 | 12:[f20<-9.53674e-007] yes=23,no=24,missing=23
106 | 23:leaf=-0.253504
107 | 24:leaf=0.23708
108 | 6:[f31<6.5] yes=13,no=14,missing=13
109 | 13:leaf=-1.16213
110 | 14:leaf=-0.294644
111 | booster[4]:
112 | 0:[f27<2.5] yes=1,no=2,missing=1
113 | 1:[f15<-9.53674e-007] yes=3,no=4,missing=3
114 | 3:[f7<-9.53674e-007] yes=7,no=8,missing=7
115 | 7:[f13<-9.53674e-007] yes=15,no=16,missing=15
116 | 15:leaf=-0.0529392
117 | 16:leaf=0.772912
118 | 8:[f31<5.5] yes=17,no=18,missing=17
119 | 17:leaf=-0.95063
120 | 18:leaf=-0.336567
121 | 4:[f31<7.5] yes=9,no=10,missing=9
122 | 9:[f3<-9.53674e-007] yes=19,no=20,missing=19
123 | 19:leaf=1.55243
124 | 20:leaf=0.615241
125 | 10:leaf=-0.536299
126 | 2:[f31<7.5] yes=5,no=6,missing=5
127 | 5:[f10<-9.53674e-007] yes=11,no=12,missing=11
128 | 11:[f18<-9.53674e-007] yes=21,no=22,missing=21
129 | 21:leaf=1.06691
130 | 22:leaf=-0.260892
131 | 12:leaf=-0.513161
132 | 6:[f22<-9.53674e-007] yes=13,no=14,missing=13
133 | 13:[f31<8.5] yes=23,no=24,missing=23
134 | 23:leaf=0.345343
135 | 24:leaf=-0.45714
136 | 14:[f1<-9.53674e-007] yes=25,no=26,missing=25
137 | 25:leaf=0.795905
138 | 26:leaf=0.0597556
139 | booster[5]:
140 | 0:[f0<2.5] yes=1,no=2,missing=1
141 | 1:[f10<-9.53674e-007] yes=3,no=4,missing=3
142 | 3:[f27<1.5] yes=7,no=8,missing=7
143 | 7:[f3<-9.53674e-007] yes=15,no=16,missing=15
144 | 15:leaf=-0.126376
145 | 16:leaf=0.151212
146 | 8:[f21<-9.53674e-007] yes=17,no=18,missing=17
147 | 17:leaf=0.0587987
148 | 18:leaf=0.68416
149 | 4:[f21<-9.53674e-007] yes=9,no=10,missing=9
150 | 9:[f31<7.5] yes=19,no=20,missing=19
151 | 19:leaf=-1.01924
152 | 20:leaf=-0.0633188
153 | 10:leaf=0
154 | 2:[f24<-9.53674e-007] yes=5,no=6,missing=5
155 | 5:[f25<-9.53674e-007] yes=11,no=12,missing=11
156 | 11:[f2<-9.53674e-007] yes=21,no=22,missing=21
157 | 21:leaf=0.216265
158 | 22:leaf=-0.321342
159 | 12:leaf=1.41876
160 | 6:[f21<-9.53674e-007] yes=13,no=14,missing=13
161 | 13:[f1<-9.53674e-007] yes=23,no=24,missing=23
162 | 23:leaf=0.179113
163 | 24:leaf=-0.593337
164 | 14:[f30<-9.53674e-007] yes=25,no=26,missing=25
165 | 25:leaf=0.209776
166 | 26:leaf=-0.800748
167 | booster[6]:
168 | 0:[f20<-9.53674e-007] yes=1,no=2,missing=1
169 | 1:[f24<-9.53674e-007] yes=3,no=4,missing=3
170 | 3:[f23<-9.53674e-007] yes=7,no=8,missing=7
171 | 7:[f2<-9.53674e-007] yes=15,no=16,missing=15
172 | 15:leaf=0.0173922
173 | 16:leaf=-0.39285
174 | 8:[f27<2.5] yes=17,no=18,missing=17
175 | 17:leaf=-0.423076
176 | 18:leaf=0.322943
177 | 4:[f0<1.5] yes=9,no=10,missing=9
178 | 9:[f31<3.5] yes=19,no=20,missing=19
179 | 19:leaf=-0.101153
180 | 20:leaf=0.258696
181 | 10:[f0<2.5] yes=21,no=22,missing=21
182 | 21:leaf=-0.734043
183 | 22:leaf=-0.174865
184 | 2:[f0<1.5] yes=5,no=6,missing=5
185 | 5:[f29<-9.53674e-007] yes=11,no=12,missing=11
186 | 11:[f31<5.5] yes=23,no=24,missing=23
187 | 23:leaf=0.801589
188 | 24:leaf=-0.109166
189 | 12:[f31<3.5] yes=25,no=26,missing=25
190 | 25:leaf=-0.201747
191 | 26:leaf=0.488246
192 | 6:[f31<4.5] yes=13,no=14,missing=13
193 | 13:[f28<-9.53674e-007] yes=27,no=28,missing=27
194 | 27:leaf=-0.487416
195 | 28:leaf=-0.0367897
196 | 14:[f10<-9.53674e-007] yes=29,no=30,missing=29
197 | 29:leaf=0.0894192
198 | 30:leaf=-0.898212
199 | booster[7]:
200 | 0:[f21<-9.53674e-007] yes=1,no=2,missing=1
201 | 1:[f27<0.5] yes=3,no=4,missing=3
202 | 3:[f31<8.5] yes=7,no=8,missing=7
203 | 7:[f0<1.5] yes=15,no=16,missing=15
204 | 15:leaf=-0.339847
205 | 16:leaf=-0.141733
206 | 8:[f22<-9.53674e-007] yes=17,no=18,missing=17
207 | 17:leaf=0.793061
208 | 18:leaf=0.0578814
209 | 4:[f31<2.5] yes=9,no=10,missing=9
210 | 9:[f3<-9.53674e-007] yes=19,no=20,missing=19
211 | 19:leaf=-1.05684
212 | 20:leaf=-0.035109
213 | 10:[f8<-9.53674e-007] yes=21,no=22,missing=21
214 | 21:leaf=0.0281911
215 | 22:leaf=-0.868101
216 | 2:[f0<1.5] yes=5,no=6,missing=5
217 | 5:[f2<-9.53674e-007] yes=11,no=12,missing=11
218 | 11:[f27<1.5] yes=23,no=24,missing=23
219 | 23:leaf=0.427309
220 | 24:leaf=1.1673
221 | 12:[f31<3.5] yes=25,no=26,missing=25
222 | 25:leaf=-0.725163
223 | 26:leaf=0.0699187
224 | 6:[f31<8.5] yes=13,no=14,missing=13
225 | 13:[f31<3.5] yes=27,no=28,missing=27
226 | 27:leaf=-0.214998
227 | 28:leaf=0.1541
228 | 14:[f2<-9.53674e-007] yes=29,no=30,missing=29
229 | 29:leaf=-0.430892
230 | 30:leaf=0.300681
231 | booster[8]:
232 | 0:[f31<10.5] yes=1,no=2,missing=1
233 | 1:[f7<-9.53674e-007] yes=3,no=4,missing=3
234 | 3:[f25<-9.53674e-007] yes=7,no=8,missing=7
235 | 7:[f5<-9.53674e-007] yes=15,no=16,missing=15
236 | 15:leaf=-0.00766696
237 | 16:leaf=0.315451
238 | 8:[f0<1.5] yes=17,no=18,missing=17
239 | 17:leaf=-0.0340331
240 | 18:leaf=0.797249
241 | 4:[f24<-9.53674e-007] yes=9,no=10,missing=9
242 | 9:[f19<-9.53674e-007] yes=19,no=20,missing=19
243 | 19:leaf=-0.527685
244 | 20:leaf=-0.241811
245 | 10:[f31<8.5] yes=21,no=22,missing=21
246 | 21:leaf=0.546652
247 | 22:leaf=-0.314251
248 | 2:[f0<4.5] yes=5,no=6,missing=5
249 | 5:[f20<-9.53674e-007] yes=11,no=12,missing=11
250 | 11:[f0<3.5] yes=23,no=24,missing=23
251 | 23:leaf=-0.916697
252 | 24:leaf=-0.383964
253 | 12:[f2<-9.53674e-007] yes=25,no=26,missing=25
254 | 25:leaf=0.248193
255 | 26:leaf=-0.324032
256 | 6:[f22<-9.53674e-007] yes=13,no=14,missing=13
257 | 13:leaf=1.44253
258 | 14:leaf=-0.386791
259 | booster[9]:
260 | 0:[f9<-9.53674e-007] yes=1,no=2,missing=1
261 | 1:[f31<5.5] yes=3,no=4,missing=3
262 | 3:[f2<-9.53674e-007] yes=7,no=8,missing=7
263 | 7:[f13<-9.53674e-007] yes=13,no=14,missing=13
264 | 13:leaf=0.0433643
265 | 14:leaf=0.65465
266 | 8:[f20<-9.53674e-007] yes=15,no=16,missing=15
267 | 15:leaf=-0.558606
268 | 16:leaf=-0.0501384
269 | 4:[f17<-9.53674e-007] yes=9,no=10,missing=9
270 | 9:[f16<-9.53674e-007] yes=17,no=18,missing=17
271 | 17:leaf=-0.0776021
272 | 18:leaf=0.552179
273 | 10:[f23<-9.53674e-007] yes=19,no=20,missing=19
274 | 19:leaf=1.88839
275 | 20:leaf=0.00354584
276 | 2:[f31<4.5] yes=5,no=6,missing=5
277 | 5:leaf=-0.983435
278 | 6:[f0<1.5] yes=11,no=12,missing=11
279 | 11:[f22<-9.53674e-007] yes=21,no=22,missing=21
280 | 21:leaf=0.703799
281 | 22:leaf=-0.573726
282 | 12:[f0<2.5] yes=23,no=24,missing=23
283 | 23:leaf=1.06149
284 | 24:leaf=0.139718
285 | booster[10]:
286 | 0:[f11<-9.53674e-007] yes=1,no=2,missing=1
287 | 1:[f31<3.5] yes=3,no=4,missing=3
288 | 3:[f18<-9.53674e-007] yes=7,no=8,missing=7
289 | 7:[f19<-9.53674e-007] yes=15,no=16,missing=15
290 | 15:leaf=-0.0376201
291 | 16:leaf=-0.303873
292 | 8:leaf=0.630718
293 | 4:[f19<-9.53674e-007] yes=9,no=10,missing=9
294 | 9:[f31<11.5] yes=17,no=18,missing=17
295 | 17:leaf=0.012662
296 | 18:leaf=-0.788187
297 | 10:[f31<9.5] yes=19,no=20,missing=19
298 | 19:leaf=0.144924
299 | 20:leaf=-0.339938
300 | 2:[f2<-9.53674e-007] yes=5,no=6,missing=5
301 | 5:[f20<-9.53674e-007] yes=11,no=12,missing=11
302 | 11:[f27<0.5] yes=21,no=22,missing=21
303 | 21:leaf=-0.850763
304 | 22:leaf=0.119742
305 | 12:[f31<5.5] yes=23,no=24,missing=23
306 | 23:leaf=-0.0298949
307 | 24:leaf=1.23398
308 | 6:[f31<5.5] yes=13,no=14,missing=13
309 | 13:[f27<1.5] yes=25,no=26,missing=25
310 | 25:leaf=-0.664988
311 | 26:leaf=0.183825
312 | 14:leaf=-0.99024
313 | booster[11]:
314 | 0:[f27<3.5] yes=1,no=2,missing=1
315 | 1:[f27<2.5] yes=3,no=4,missing=3
316 | 3:[f8<-9.53674e-007] yes=7,no=8,missing=7
317 | 7:[f9<-9.53674e-007] yes=13,no=14,missing=13
318 | 13:leaf=0.00388098
319 | 14:leaf=-0.402797
320 | 8:leaf=-0.788359
321 | 4:[f21<-9.53674e-007] yes=9,no=10,missing=9
322 | 9:[f23<-9.53674e-007] yes=15,no=16,missing=15
323 | 15:leaf=-0.242939
324 | 16:leaf=0.570836
325 | 10:[f24<-9.53674e-007] yes=17,no=18,missing=17
326 | 17:leaf=-0.248544
327 | 18:leaf=0.64505
328 | 2:[f20<-9.53674e-007] yes=5,no=6,missing=5
329 | 5:[f0<3.5] yes=11,no=12,missing=11
330 | 11:[f27<4.5] yes=19,no=20,missing=19
331 | 19:leaf=0.954944
332 | 20:leaf=0.0403577
333 | 12:leaf=-0.195032
334 | 6:leaf=-1.59441
335 | booster[12]:
336 | 0:[f0<4.5] yes=1,no=2,missing=1
337 | 1:[f17<-9.53674e-007] yes=3,no=4,missing=3
338 | 3:[f14<-9.53674e-007] yes=7,no=8,missing=7
339 | 7:[f31<6.5] yes=15,no=16,missing=15
340 | 15:leaf=0.00857334
341 | 16:leaf=-0.0585062
342 | 8:[f31<3.5] yes=17,no=18,missing=17
343 | 17:leaf=-0.461265
344 | 18:leaf=1.04763
345 | 4:[f20<-9.53674e-007] yes=9,no=10,missing=9
346 | 9:[f0<1.5] yes=19,no=20,missing=19
347 | 19:leaf=0.220695
348 | 20:leaf=-0.304324
349 | 10:leaf=-0.642145
350 | 2:[f31<7.5] yes=5,no=6,missing=5
351 | 5:[f0<5.5] yes=11,no=12,missing=11
352 | 11:[f27<0.5] yes=21,no=22,missing=21
353 | 21:leaf=-0.995081
354 | 22:leaf=0.254432
355 | 12:leaf=-1.23996
356 | 6:[f31<9.5] yes=13,no=14,missing=13
357 | 13:[f29<-9.53674e-007] yes=23,no=24,missing=23
358 | 23:leaf=0.776009
359 | 24:leaf=-0.0701542
360 | 14:[f28<-9.53674e-007] yes=25,no=26,missing=25
361 | 25:leaf=0.93862
362 | 26:leaf=-0.41759
363 | booster[13]:
364 | 0:[f26<-9.53674e-007] yes=1,no=2,missing=1
365 | 1:[f20<-9.53674e-007] yes=3,no=4,missing=3
366 | 3:[f0<6.5] yes=7,no=8,missing=7
367 | 7:[f12<-9.53674e-007] yes=15,no=16,missing=15
368 | 15:leaf=-0.00735334
369 | 16:leaf=-0.35686
370 | 8:leaf=-0.663981
371 | 4:[f10<-9.53674e-007] yes=9,no=10,missing=9
372 | 9:[f0<3.5] yes=17,no=18,missing=17
373 | 17:leaf=0.0434706
374 | 18:leaf=0.390639
375 | 10:[f31<5.5] yes=19,no=20,missing=19
376 | 19:leaf=-0.780065
377 | 20:leaf=-0.0684597
378 | 2:[f31<4.5] yes=5,no=6,missing=5
379 | 5:[f29<-9.53674e-007] yes=11,no=12,missing=11
380 | 11:leaf=-0.388065
381 | 12:leaf=-1.30039
382 | 6:[f1<-9.53674e-007] yes=13,no=14,missing=13
383 | 13:[f31<6.5] yes=21,no=22,missing=21
384 | 21:leaf=-0.794325
385 | 22:leaf=0.156165
386 | 14:[f24<-9.53674e-007] yes=23,no=24,missing=23
387 | 23:leaf=0.42538
388 | 24:leaf=-0.488206
389 |
--------------------------------------------------------------------------------
/pretreatment.py:
--------------------------------------------------------------------------------
1 | import numpy as np
2 | import jieba # 分词
3 | import jieba.posseg as psg # 词性标注
4 | import codecs # 写入txt文件
5 |
6 | # jieba.load_userdict("百度分词词库.txt") # 可以扩展jieba分词的词库
7 |
8 | '''
9 | # 测试数据
10 | import linecache # 读取文件中的某一行
11 | file_name = 'train.txt'
12 | linecache.getline(file_name, 1) # 读取文件中的某一行
13 | a = linecache.getline(file_name, 1).strip().split()
14 | a[0] = int(a[0])
15 | b = [[x.word,x.flag] for x in psg.cut(a[1])]
16 | c = [x for x in jieba.cut(a[1])]
17 | '''
18 |
19 | # 读取txt文件,并且转成数组类型
20 | def load_file(file_name):
21 | data = [] # 保存数据
22 | with open(file_name, encoding='utf-8') as fin:
23 | for line in fin:
24 | line = line.strip().split()
25 | data.append(line)
26 | return np.array(data)
27 |
28 | # 分词与词性标注
29 | def cut_pos_file(data):
30 | data_cut = [] # 保存分词结果
31 | data_w_pos = [] # 保存分词与词性标注结果
32 | data_pos = [] # 仅保存词性标注结果
33 | for i in range(len(data)):
34 | data_cut.append([])
35 | data_w_pos.append([])
36 | data_pos.append([])
37 | [data_cut[-1].append(x) for x in jieba.cut(data[i])]
38 | for x in psg.cut(data[i]):
39 | data_pos[-1].append(x.flag)
40 | data_w_pos[-1].append([x.word,x.flag])
41 | return data_cut, data_pos, data_w_pos
42 |
43 | # 写入txt文件
44 | def write_file(data, file_name):
45 | fin = codecs.open(file_name, "w", "UTF-8")
46 | for i in range(len(data)):
47 | for j in range(len(data[i])):
48 | fin.write(str(data[i][j])+" ")
49 | fin.write("\n")
50 | fin.close()
51 |
52 |
53 | train = load_file('./lib/train.txt')
54 | train_data = train[:,1]
55 | train_label = np.array([int(x) for x in train[:,0]]) # 将字符串数组转换成整型数组
56 | train_data_positive = train_data[train_label == 1] # 提取标签等于1的训练数据
57 | train_data_negative = train_data[train_label ==0] # 提取标签等于0的训练数据
58 | train_cut, train_pos, train_Wpos = cut_pos_file(train_data)
59 | train_positive_cut, train_positive_pos, train_positive_Wpos = cut_pos_file(train_data_positive)
60 | train_negative_cut, train_negative_pos, train_negative_Wpos = cut_pos_file(train_data_negative)
61 |
62 | write_file(train_cut, './lib/train_cut.txt')
63 | write_file(train_pos, './lib/train_pos.txt')
64 | write_file(train_Wpos, './lib/train_Wpos.txt')
65 |
66 | write_file(train_positive_cut, './lib/train_positive_cut.txt')
67 | write_file(train_positive_pos, './lib/train_positive_pos.txt')
68 | write_file(train_positive_Wpos, './lib/train_positive_Wpos.txt')
69 |
70 | write_file(train_negative_cut, './lib/train_negative_cut.txt')
71 | write_file(train_negative_pos, './lib/train_negative_pos.txt')
72 | write_file(train_negative_Wpos, './lib/train_negative_Wpos.txt')
73 |
74 |
75 |
76 | test = load_file('./lib/test.txt')
77 | test_data = test[:,1]
78 | test_label = np.array([int(x) for x in test[:,0]]) # 将字符串数组转换成整型数组
79 | # 提取标签等于1的测试数据,主要用于频繁词序列挖掘,计算词序列的正负类区分度
80 | test_data_positive = test_data[test_label == 1]
81 | test_data_negative = test_data[test_label ==0] # 提取标签等于0的测试数据
82 | test_cut, test_pos, test_Wpos = cut_pos_file(test_data)
83 | test_positive_cut, test_positive_pos, test_positive_Wpos = cut_pos_file(test_data_positive)
84 | test_negative_cut, test_negative_pos, test_negative_Wpos = cut_pos_file(test_data_negative)
85 |
--------------------------------------------------------------------------------
/sentiment_dic/#README.txt:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/manderous/TextClassification-MeiTuan-FeatureExtraction-Classifier/c3d444f187dcb56f0e87f8facaf9117e5a4deef1/sentiment_dic/#README.txt
--------------------------------------------------------------------------------
/sentiment_dic/degree.txt:
--------------------------------------------------------------------------------
1 | extreme
2 | 百分之百
3 | 倍加
4 | 备至
5 | 不得了
6 | 不堪
7 | 不可开交
8 | 不亦乐乎
9 | 不折不扣
10 | 彻头彻尾
11 | 充分
12 | 到头
13 | 地地道道
14 | 非常
15 | 极
16 | 极度
17 | 极端
18 | 极其
19 | 极为
20 | 截然
21 | 尽
22 | 惊人地
23 | 绝
24 | 绝顶
25 | 绝对
26 | 绝对化
27 | 刻骨
28 | 酷
29 | 满
30 | 满贯
31 | 满心
32 | 莫大
33 | 奇
34 | 入骨
35 | 甚为
36 | 十二分
37 | 十分
38 | 十足
39 | 死
40 | 滔天
41 | 痛
42 | 透
43 | 完全
44 | 完完全全
45 | 万
46 | 万般
47 | 万分
48 | 万万
49 | 无比
50 | 无度
51 | 无可估量
52 | 无以复加
53 | 无以伦比
54 | 要命
55 | 要死
56 | 已极
57 | 已甚
58 | 异常
59 | 逾常
60 | 贼
61 | 之极
62 | 之至
63 | 至极
64 | 卓绝
65 | 最为
66 | 佼佼
67 | 郅
68 | 綦
69 | 齁
70 | 最
71 | very
72 | 不过
73 | 不少
74 | 不胜
75 | 惨
76 | 沉
77 | 沉沉
78 | 出奇
79 | 大为
80 | 多
81 | 多多
82 | 多加
83 | 多么
84 | 分外
85 | 格外
86 | 够瞧的
87 | 够戗
88 | 好
89 | 好不
90 | 何等
91 | 很
92 | 很是
93 | 坏
94 | 可
95 | 老
96 | 老大
97 | 良
98 | 颇
99 | 颇为
100 | 甚
101 | 实在
102 | 太
103 | 太甚
104 | 特
105 | 特别
106 | 尤
107 | 尤其
108 | 尤为
109 | 尤以
110 | 远
111 | 着实
112 | 曷
113 | 碜
114 | more
115 | 大不了
116 | 多
117 | 更
118 | 更加
119 | 更进一步
120 | 更为
121 | 还
122 | 还要
123 | 较
124 | 较比
125 | 较为
126 | 进一步
127 | 那般
128 | 那么
129 | 那样
130 | 强
131 | 如斯
132 | 益
133 | 益发
134 | 尤甚
135 | 逾
136 | 愈
137 | 愈 ... 愈
138 | 愈发
139 | 愈加
140 | 愈来愈
141 | 愈益
142 | 远远
143 | 越 ... 越
144 | 越发
145 | 越加
146 | 越来越
147 | 越是
148 | 这般
149 | 这样
150 | 足
151 | 足足
152 | ish
153 | 点点滴滴
154 | 多多少少
155 | 怪
156 | 好生
157 | 还
158 | 或多或少
159 | 略
160 | 略加
161 | 略略
162 | 略微
163 | 略为
164 | 蛮
165 | 稍
166 | 稍稍
167 | 稍微
168 | 稍为
169 | 稍许
170 | 挺
171 | 未免
172 | 相当
173 | 些
174 | 些微
175 | 些小
176 | 一点
177 | 一点儿
178 | 一些
179 | 有点
180 | 有点儿
181 | 有些
182 | insufficiently
183 | 半点
184 | 不大
185 | 不丁点儿
186 | 不甚
187 | 不怎么
188 | 聊
189 | 没怎么
190 | 轻度
191 | 弱
192 | 丝毫
193 | 微
194 | 相对
195 | over
196 | 不为过
197 | 超
198 | 超额
199 | 超外差
200 | 超微结构
201 | 超物质
202 | 出头
203 | 多
204 | 浮
205 | 过
206 | 过度
207 | 过分
208 | 过火
209 | 过劲
210 | 过了头
211 | 过猛
212 | 过热
213 | 过甚
214 | 过头
215 | 过于
216 | 过逾
217 | 何止
218 | 何啻
219 | 开外
220 | 苦
221 | 老
222 | 偏
223 | 强
224 | 溢
225 | 忒
226 | last
227 |
228 |
229 |
--------------------------------------------------------------------------------
/sentiment_dic/deny.txt:
--------------------------------------------------------------------------------
1 | 不
2 | 非
3 | 无
4 | 未
5 | 不曾
6 | 没
7 | 没有
8 | 请勿
9 | 不用
10 | 无须
11 | 并非
12 | 毫无
13 | 决不
14 | 休想
15 | 永不
16 | 不要
17 | 未尝
18 | 未曾
19 | 毋
20 | 莫
21 | 从不
22 | 从未
23 | 从未有过
24 | 尚未
25 | 一无
26 | 并未
27 | 尚无
28 | 从来不
29 | 从没
30 | 绝非
31 | 远非
32 | 切莫
33 | 永不
34 | 休想
35 | 绝不
36 | 毫不
37 | 不必
38 | 禁止
39 | 忌
40 | 拒绝
41 | 杜绝
42 | 否
43 | 弗
44 | 木有
45 | 甭
46 | 勿
47 | 不
48 | 没
49 | 无
50 | 非
51 | 莫
52 | 弗
53 | 毋
54 | 勿
55 | 未
56 | 否
57 | 别
58 | 無
59 | 休
--------------------------------------------------------------------------------
/sentiment_dic/negative_comment.txt:
--------------------------------------------------------------------------------
1 | 僄
2 | 啰啰唆唆
3 | 啰啰嗦嗦
4 | 啰里啰唆
5 | 啰里啰嗦
6 | 啰唆
7 | 啰嗦
8 | 噲
9 | 奓着头发
10 | 婞
11 | 婞直
12 | 崒
13 | 弇陋
14 | 惛
15 | 惼
16 | 梼昧
17 | 獪
18 | 瘆
19 | 瘆得慌
20 | 哀鸿遍野
21 | 矮
22 | 碍难
23 | 碍眼
24 | 爱搭不理
25 | 爱理不理
26 | 暗
27 | 暗暗
28 | 暗沉沉
29 | 暗淡
30 | 暗地
31 | 暗地里
32 | 暗黑
33 | 暗里
34 | 暗昧
35 | 暗弱
36 | 暗无天日
37 | 暗下
38 | 暗中
39 | 暗自
40 | 暗朦
41 | 岸然
42 | 肮里肮脏
43 | 肮脏
44 | 昂贵
45 | 凹凸
46 | 凹凸不平
47 | 傲
48 | 傲岸
49 | 傲慢
50 | 八面玲珑
51 | 跋扈
52 | 霸道
53 | 霸气
54 | 白
55 | 白白
56 | 白痴般
57 | 白搭
58 | 白忙
59 | 白忙活儿
60 | 白衣苍狗
61 | 白云苍狗
62 | 百孔千疮
63 | 败坏
64 | 稗
65 | 板
66 | 板板六十四
67 | 板滞
68 | 半半拉拉
69 | 半路出家
70 | 半新不旧
71 | 半真半假
72 | 薄
73 | 薄情
74 | 薄弱
75 | 薄幸
76 | 保残守缺
77 | 保守
78 | 抱残守缺
79 | 暴
80 | 暴烈
81 | 暴虐
82 | 暴躁
83 | 暴戾
84 | 暴戾恣睢
85 | 爆炸性
86 | 悲惨
87 | 悲观
88 | 悲观地
89 | 悲剧
90 | 悲凉
91 | 卑
92 | 卑鄙
93 | 卑鄙无耻
94 | 卑贱
95 | 卑劣
96 | 卑陋
97 | 卑怯
98 | 卑俗
99 | 卑琐
100 | 卑微
101 | 卑污
102 | 卑下
103 | 卑猥
104 | 背地
105 | 背地里
106 | 背光
107 | 背后
108 | 背悔
109 | 背静
110 | 背靠背
111 | 背理
112 | 背令
113 | 背人
114 | 背时
115 | 背阴
116 | 被动
117 | 被动式
118 | 被动性
119 | 本本主义
120 | 笨
121 | 笨手笨脚
122 | 笨头笨脑
123 | 笨重
124 | 笨拙
125 | 比肩接踵
126 | 鄙
127 | 鄙贱
128 | 鄙吝
129 | 鄙陋
130 | 鄙俗
131 | 鄙俚
132 | 蔽塞
133 | 闭塞
134 | 必修
135 | 变化不定
136 | 变化多端
137 | 变化万千
138 | 变化无常
139 | 变化无穷
140 | 变幻不定
141 | 变幻莫测
142 | 变幻无常
143 | 变态
144 | 变相
145 | 表里不一
146 | 憋拗
147 | 别别扭扭
148 | 别扭
149 | 别有用心
150 | 冰冷
151 | 冰炭不相容
152 | 秉性剌戾
153 | 病病歪歪
154 | 病弱
155 | 病态
156 | 病歪歪
157 | 病殃殃
158 | 病恹恹
159 | 波谲云诡
160 | 驳杂
161 | 捕风捉影
162 | 不爱交际
163 | 不便
164 | 不辨菽麦
165 | 不才
166 | 不成材
167 | 不成功
168 | 不成话
169 | 不成器
170 | 不成熟
171 | 不成体统
172 | 不成样子
173 | 不打紧
174 | 不大重要
175 | 不当
176 | 不到黄河心不死
177 | 不道德
178 | 不得当
179 | 不得劲
180 | 不得了
181 | 不得体
182 | 不登大雅之堂
183 | 不等
184 | 不端
185 | 不对
186 | 不对茬儿
187 | 不对称
188 | 不对付
189 | 不对劲
190 | 不对头
191 | 不发达
192 | 不法
193 | 不方便
194 | 不分青红皂白
195 | 不分皂白
196 | 不负责任
197 | 不干不净
198 | 不更事
199 | 不公
200 | 不公正
201 | 不共戴天
202 | 不够格
203 | 不够完善
204 | 不够意思
205 | 不关痛痒
206 | 不管三七二十一
207 | 不管用
208 | 不光彩
209 | 不光明
210 | 不规则
211 | 不轨
212 | 不好吃
213 | 不好看
214 | 不好客
215 | 不好卖
216 | 不好使
217 | 不好听
218 | 不好用
219 | 不和
220 | 不和蔼
221 | 不和谐
222 | 不合法
223 | 不合格
224 | 不合理
225 | 不合逻辑
226 | 不合情理
227 | 不合时令
228 | 不合时宜
229 | 不合适
230 | 不合算
231 | 不合宜
232 | 不合语法
233 | 不划算
234 | 不济
235 | 不济事
236 | 不俭省
237 | 不健康
238 | 不洁
239 | 不谨慎
240 | 不近情理
241 | 不近人情
242 | 不尽
243 | 不尽如人意
244 | 不精确
245 | 不敬
246 | 不绝如缕
247 | 不均匀
248 | 不开化
249 | 不堪入耳
250 | 不堪入目
251 | 不堪设想
252 | 不堪一击
253 | 不堪造就
254 | 不科学
255 | 不可爱
256 | 不可补救
257 | 不可读
258 | 不可告人
259 | 不可更新
260 | 不可恢复
261 | 不可降解
262 | 不可接受
263 | 不可救药
264 | 不可理喻
265 | 不可逆转
266 | 不可容忍
267 | 不可收拾
268 | 不可挽回
269 | 不可行
270 | 不可一世
271 | 不可逾越
272 | 不客气
273 | 不宽容
274 | 不郎不秀
275 | 不冷不热
276 | 不理智
277 | 不礼貌
278 | 不利
279 | 不利于健康
280 | 不力
281 | 不良
282 | 不灵敏
283 | 不灵巧
284 | 不流行
285 | 不伦不类
286 | 不美观
287 | 不妙
288 | 不民主
289 | 不明不白
290 | 不明显
291 | 不明智
292 | 不名一文
293 | 不名誉
294 | 不能解救
295 | 不能容忍
296 | 不宁
297 | 不努力
298 | 不平
299 | 不平等
300 | 不平衡
301 | 不起眼
302 | 不起眼儿
303 | 不巧
304 | 不切实际
305 | 不清不白
306 | 不清不楚
307 | 不清楚
308 | 不清洁
309 | 不确切
310 | 不仁
311 | 不仁不义
312 | 不人道
313 | 不三不四
314 | 不善
315 | 不善交际
316 | 不善交谈
317 | 不甚重要
318 | 不慎
319 | 不胜
320 | 不是味儿
321 | 不是滋味儿
322 | 不适当
323 | 不适宜
324 | 不适应
325 | 不适于居住
326 | 不受欢迎
327 | 不熟练
328 | 不疼不痒
329 | 不体面
330 | 不痛不痒
331 | 不透明
332 | 不透气
333 | 不妥
334 | 不为人知
335 | 不卫生
336 | 不文明
337 | 不文雅
338 | 不稳定
339 | 不问青红皂白
340 | 不问三七二十一
341 | 不问是非情由
342 | 不显眼
343 | 不现实
344 | 不相适应
345 | 不祥
346 | 不详
347 | 不详尽
348 | 不像话
349 | 不消化
350 | 不孝
351 | 不肖
352 | 不协调
353 | 不兴
354 | 不行
355 | 不幸
356 | 不修边幅
357 | 不学无术
358 | 不逊
359 | 不雅
360 | 不雅观
361 | 不雅致
362 | 不要紧
363 | 不一致
364 | 不宜
365 | 不宜居住
366 | 不宜说出口
367 | 不易
368 | 不友好
369 | 不友善
370 | 不择手段
371 | 不真诚
372 | 不真实
373 | 不贞洁
374 | 不正常
375 | 不正当
376 | 不正派
377 | 不正直
378 | 不值得羡慕
379 | 不值一文
380 | 不中用
381 | 不重要
382 | 不周
383 | 不周到
384 | 不注意
385 | 不着边际
386 | 不着调
387 | 不足道
388 | 不足挂齿
389 | 不足轻重
390 | 不足取
391 | 不足为外人道
392 | 不足为训
393 | 不羁
394 | 不稂不莠
395 | 不虔诚
396 | 才疏学浅
397 | 财迷心窍
398 | 残
399 | 残败
400 | 残暴
401 | 残毒
402 | 残酷
403 | 残酷无情
404 | 残虐
405 | 残破
406 | 残破不全
407 | 残缺
408 | 残缺不全
409 | 残忍
410 | 残损
411 | 惨
412 | 惨不忍睹
413 | 惨淡
414 | 惨毒
415 | 惨绝人寰
416 | 惨苦
417 | 惨厉
418 | 惨烈
419 | 惨痛
420 | 惨无人道
421 | 苍白
422 | 苍白无力
423 | 苍凉
424 | 苍茫
425 | 操切
426 | 糙
427 | 草
428 | 草草
429 | 草荒
430 | 草率
431 | 草木皆兵
432 | 策略
433 | 策略性
434 | 差
435 | 差点儿
436 | 差劲
437 | 差可
438 | 豺狼成性
439 | 豺狼当道
440 | 缠手
441 | 颤颤巍巍
442 | 颤颤悠悠
443 | 颤巍巍
444 | 猖
445 | 猖狂
446 | 长长短短
447 | 长篇大论
448 | 长篇累牍
449 | 长线
450 | 超标
451 | 超常
452 | 超然
453 | 超重
454 | 朝不保夕
455 | 朝不谋夕
456 | 朝秦暮楚
457 | 朝三暮四
458 | 潮
459 | 吵吵闹闹
460 | 吵人
461 | 沉闷
462 | 沉痛
463 | 沉滞
464 | 陈
465 | 陈腐
466 | 陈旧
467 | 成事不足,败事有余
468 | 逞性
469 | 逞性子
470 | 吃不开
471 | 吃劲
472 | 吃力
473 | 吃重
474 | 痴
475 | 痴痴
476 | 痴呆
477 | 痴呆呆
478 | 痴傻
479 | 痴愚
480 | 迟钝
481 | 侈
482 | 侈靡
483 | 侈糜
484 | 赤地千里
485 | 赤裸裸淫秽
486 | 赤贫
487 | 充满危机
488 | 冲昏头脑
489 | 丑
490 | 丑恶
491 | 丑陋
492 | 臭
493 | 臭不可闻
494 | 臭哄哄
495 | 臭烘烘
496 | 臭名远扬
497 | 臭名昭彰
498 | 臭名昭著
499 | 臭气冲天
500 | 臭气熏天
501 | 臭味
502 | 初出茅庐
503 | 出手阔气
504 | 触目惊心
505 | 穿不出去
506 | 穿不得
507 | 串秧儿
508 | 疮痍满目
509 | 蠢
510 | 蠢笨
511 | 蠢头蠢脑
512 | 刺鼻
513 | 刺耳
514 | 刺眼
515 | 次
516 | 次等
517 | 从动
518 | 从心所欲
519 | 从严
520 | 从重
521 | 粗
522 | 粗暴
523 | 粗笨
524 | 粗鄙
525 | 粗糙
526 | 粗放
527 | 粗拉
528 | 粗里粗气
529 | 粗劣
530 | 粗陋
531 | 粗鲁
532 | 粗率
533 | 粗蛮
534 | 粗莽
535 | 粗浅
536 | 粗涩
537 | 粗手笨脚
538 | 粗疏
539 | 粗俗
540 | 粗线条
541 | 粗心
542 | 粗心大意
543 | 粗野
544 | 粗枝大叶
545 | 粗制滥造
546 | 粗重
547 | 粗拙
548 | 粗犷
549 | 促狭
550 | 脆弱
551 | 村气
552 | 村野
553 | 寸草不生
554 | 错
555 | 错乱
556 | 错误
557 | 错误百出
558 | 错杂
559 | 错综
560 | 错综复杂
561 | 大
562 | 大错而特错
563 | 大错特错
564 | 大大咧咧
565 | 大而笨拙
566 | 大而化之
567 | 大而无当
568 | 大海捞针
569 | 大面额
570 | 大谬不然
571 | 大手大脚
572 | 大肆
573 | 大摇大摆
574 | 大意
575 | 大咧咧
576 | 呆
577 | 呆板
578 | 呆笨
579 | 呆痴
580 | 呆呆
581 | 呆钝
582 | 呆气
583 | 呆傻
584 | 呆头呆脑
585 | 歹
586 | 歹毒
587 | 带有敌意
588 | 殆
589 | 怠惰
590 | 单
591 | 单薄
592 | 单调
593 | 单调枯燥
594 | 单弱
595 | 胆怯
596 | 胆小
597 | 胆小怕事
598 | 胆小如鼠
599 | 淡
600 | 淡薄
601 | 淡淡
602 | 淡而无味
603 | 淡漠
604 | 淡然
605 | 诞
606 | 荡
607 | 刀光剑影
608 | 蹈常袭故
609 | 倒胃口
610 | 道德败坏
611 | 道貌岸然
612 | 德行
613 | 德性
614 | 得寸进尺
615 | 得陇望蜀
616 | 得鱼忘筌
617 | 灯红酒绿
618 | 灯火阑珊
619 | 等而下之
620 | 等外
621 | 等因奉此
622 | 低
623 | 低卑
624 | 低标准
625 | 低层
626 | 低档
627 | 低等
628 | 低端
629 | 低级
630 | 低贱
631 | 低劣
632 | 低迷
633 | 低能
634 | 低人一等
635 | 低三下四
636 | 低声下气
637 | 低俗
638 | 低下
639 | 低效
640 | 低效能
641 | 低值
642 | 低智
643 | 低质
644 | 滴里嘟噜
645 | 敌对
646 | 地位低下
647 | 地下
648 | 地狱般
649 | 颠倒
650 | 颠连
651 | 颠三倒四
652 | 凋敝
653 | 刁
654 | 刁恶
655 | 刁悍
656 | 刁滑
657 | 刁赖
658 | 刁蛮
659 | 刁钻
660 | 刁钻古怪
661 | 吊儿郎当
662 | 调皮
663 | 鼎沸
664 | 丢魂
665 | 丢脸
666 | 丢三落四
667 | 东倒西歪
668 | 冬烘
669 | 动荡
670 | 动荡不安
671 | 动魄惊心
672 | 动作迟顿
673 | 毒
674 | 毒辣
675 | 独裁
676 | 独断
677 | 度量小
678 | 短浅
679 | 短视
680 | 钝
681 | 多变
682 | 多病
683 | 多事
684 | 多义
685 | 多余
686 | 惰
687 | 惰性
688 | 讹
689 | 恶
690 | 恶毒
691 | 恶贯满盈
692 | 恶狠狠
693 | 恶劣
694 | 恶煞煞
695 | 恶心
696 | 恶浊
697 | 饿殍遍野
698 | 耳生
699 | 二把刀
700 | 二手
701 | 二五眼
702 | 发狂
703 | 发腻
704 | 发育不全
705 | 乏
706 | 乏味
707 | 翻手为云,覆手为雨
708 | 翻云覆雨
709 | 繁复
710 | 繁乱
711 | 繁难
712 | 繁冗
713 | 繁琐
714 | 繁芜
715 | 繁杂
716 | 繁重
717 | 繁缛
718 | 烦
719 | 烦难
720 | 烦冗
721 | 烦琐
722 | 烦嚣
723 | 反
724 | 反常
725 | 反对称
726 | 反反复复
727 | 反复无常
728 | 反面
729 | 反叛
730 | 反社会
731 | 犯有罪行
732 | 饭桶
733 | 泛
734 | 泛泛
735 | 放诞
736 | 放荡
737 | 放荡不羁
738 | 放浪
739 | 放肆
740 | 放纵
741 | 菲
742 | 菲薄
743 | 非
744 | 非法
745 | 非分
746 | 非婚生
747 | 非礼
748 | 非人
749 | 非生产性
750 | 非正常
751 | 非正统
752 | 非正义
753 | 废
754 | 废弛
755 | 废旧
756 | 废物
757 | 沸沸扬扬
758 | 费
759 | 费工夫
760 | 费功夫
761 | 费劲
762 | 费力
763 | 费时
764 | 费事
765 | 纷
766 | 纷繁
767 | 纷乱
768 | 纷扰
769 | 纷杂
770 | 封闭
771 | 封闭式
772 | 封闭型
773 | 封建
774 | 锋芒毕露
775 | 风吹日晒
776 | 风刀霜剑
777 | 风风火火
778 | 风流
779 | 风骚
780 | 风声鹤唳
781 | 风雨飘摇
782 | 疯疯癫癫
783 | 疯狂
784 | 疯狂般
785 | 疯癫癫
786 | 否
787 | 否定
788 | 肤泛
789 | 肤皮潦草
790 | 肤浅
791 | 浮
792 | 浮泛
793 | 浮光掠影
794 | 浮滑
795 | 浮皮蹭痒
796 | 浮漂
797 | 浮浅
798 | 浮躁
799 | 浮噪
800 | 腐败
801 | 腐败堕落
802 | 腐臭
803 | 腐恶
804 | 腐化
805 | 腐化堕落
806 | 腐旧
807 | 腐烂
808 | 腐朽
809 | 腐朽没落
810 | 覆雨翻云
811 | 复
812 | 复合
813 | 复合式
814 | 复合型
815 | 复杂
816 | 复杂多变
817 | 傅会
818 | 负
819 | 负面
820 | 富余
821 | 附会
822 | 嘎
823 | 该死
824 | 概念化
825 | 干
826 | 干巴
827 | 干巴巴
828 | 干瘪
829 | 干瘪瘪
830 | 干干巴巴
831 | 干燥
832 | 赶尽杀绝
833 | 刚愎
834 | 刚愎自用
835 | 高昂
836 | 高傲
837 | 高不成,低不就
838 | 高不成低不就
839 | 高成本
840 | 高价
841 | 高价位
842 | 高难
843 | 高难度
844 | 高压
845 | 疙疙瘩瘩
846 | 疙里疙瘩
847 | 隔靴搔痒
848 | 勾心斗角
849 | 苟且
850 | 狗眼看人
851 | 垢
852 | 够呛
853 | 够戗
854 | 孤
855 | 孤傲
856 | 孤傲不群
857 | 孤单
858 | 孤单单
859 | 孤独
860 | 孤孤单单
861 | 孤寡
862 | 孤寂
863 | 孤立
864 | 孤立无援
865 | 孤零零
866 | 孤陋寡闻
867 | 孤僻
868 | 古怪
869 | 古旧
870 | 古里古怪
871 | 固定不变
872 | 固执
873 | 寡
874 | 寡淡
875 | 寡断
876 | 寡了叭叽
877 | 寡情
878 | 寡味
879 | 寡言
880 | 寡言少语
881 | 挂漏
882 | 挂名
883 | 挂一漏万
884 | 乖谬
885 | 乖僻
886 | 乖张
887 | 乖剌
888 | 乖戾
889 | 怪里怪气
890 | 怪僻
891 | 官僚
892 | 官僚主义
893 | 光怪陆离
894 | 鬼
895 | 鬼鬼祟祟
896 | 鬼计多端
897 | 鬼头鬼脑
898 | 诡
899 | 诡计多端
900 | 诡秘
901 | 诡诈
902 | 诡谲
903 | 贵
904 | 过当
905 | 过分简单化
906 | 过分拥挤
907 | 过河拆桥
908 | 过了气
909 | 过气
910 | 过桥抽板
911 | 过时
912 | 哈喇
913 | 孩子气
914 | 海底捞月
915 | 海底捞针
916 | 害
917 | 骇人听闻
918 | 憨
919 | 含含糊糊
920 | 含含混混
921 | 含糊
922 | 含糊不清
923 | 含糊其辞
924 | 含糊其词
925 | 含混
926 | 含混不清
927 | 含蓄
928 | 涵蓄
929 | 寒
930 | 寒苦
931 | 寒素
932 | 寒酸
933 | 寒微
934 | 寒伧
935 | 寒碜
936 | 悍
937 | 悍然
938 | 豪
939 | 豪侈
940 | 豪横
941 | 豪强
942 | 豪奢
943 | 毫不客气
944 | 毫不留情
945 | 毫无价值
946 | 毫无目标
947 | 毫无意义
948 | 毫无用处
949 | 好不容易
950 | 好容易
951 | 好事多磨
952 | 黑
953 | 黑暗
954 | 黑沉沉
955 | 黑灯瞎火
956 | 黑洞洞
957 | 黑咕隆咚
958 | 黑乎乎
959 | 黑茫茫
960 | 黑蒙蒙
961 | 黑漆寥光
962 | 黑漆漆
963 | 黑森森
964 | 黑心
965 | 黑心肠
966 | 黑黝黝
967 | 黑黢黢
968 | 狠
969 | 狠毒
970 | 狠劲
971 | 狠心
972 | 横
973 | 横暴
974 | 横加
975 | 横蛮无理
976 | 横七竖八
977 | 哄然
978 | 猴
979 | 后患无穷
980 | 后进
981 | 呼幺喝六
982 | 胡
983 | 胡里胡涂
984 | 胡乱
985 | 胡子拉茬
986 | 胡子拉碴
987 | 糊糊涂涂
988 | 糊里糊涂
989 | 糊涂
990 | 虎踞龙蟠
991 | 虎头蛇尾
992 | 花
993 | 花插着
994 | 花搭着
995 | 花花搭搭
996 | 花里胡哨
997 | 花钱浪费
998 | 花拳绣腿
999 | 花天酒地
1000 | 花心
1001 | 哗然
1002 | 华
1003 | 华而不实
1004 | 猾
1005 | 滑
1006 | 滑头
1007 | 滑头滑脑
1008 | 怀着恶意
1009 | 坏
1010 | 坏脾气
1011 | 坏人当道
1012 | 幻
1013 | 幻异
1014 | 荒
1015 | 荒诞
1016 | 荒诞不经
1017 | 荒诞派
1018 | 荒诞无稽
1019 | 荒废
1020 | 荒寂
1021 | 荒凉
1022 | 荒乱
1023 | 荒落
1024 | 荒谬
1025 | 荒谬绝伦
1026 | 荒漠
1027 | 荒僻
1028 | 荒弃
1029 | 荒疏
1030 | 荒唐
1031 | 荒唐无稽
1032 | 荒无人烟
1033 | 荒芜
1034 | 荒淫
1035 | 荒淫无耻
1036 | 荒淫无度
1037 | 荒瘠
1038 | 黄色
1039 | 晃晃悠悠
1040 | 晃悠悠
1041 | 恍恍惚惚
1042 | 恍惚
1043 | 谎
1044 | 灰暗
1045 | 灰沉沉
1046 | 灰溜溜
1047 | 灰茫茫
1048 | 灰蒙蒙
1049 | 灰色
1050 | 灰头灰脸
1051 | 灰头土脸
1052 | 灰秃秃
1053 | 灰朦朦
1054 | 慧黠
1055 | 晦
1056 | 晦暗
1057 | 晦涩
1058 | 晦冥
1059 | 晦暝
1060 | 秽
1061 | 秽恶
1062 | 秽乱
1063 | 秽土
1064 | 秽亵
1065 | 会来事
1066 | 昏
1067 | 昏暗
1068 | 昏沉
1069 | 昏黑
1070 | 昏乱
1071 | 昏昧
1072 | 昏天黑地
1073 | 昏头昏脑
1074 | 昏庸
1075 | 昏愦
1076 | 昏聩
1077 | 婚外
1078 | 浑
1079 | 浑浑噩噩
1080 | 浑头浑脑
1081 | 浑浊
1082 | 浑噩
1083 | 混
1084 | 混合
1085 | 混混沌沌
1086 | 混交
1087 | 混乱
1088 | 混淆不清
1089 | 混血
1090 | 混账
1091 | 混浊
1092 | 混沌
1093 | 活动
1094 | 火暴
1095 | 火爆
1096 | 祸不单行
1097 | 祸从天降
1098 | 机变
1099 | 机械
1100 | 机械式
1101 | 机械性
1102 | 畸
1103 | 畸轻畸重
1104 | 畸形
1105 | 积满灰尘
1106 | 积重难返
1107 | 鸡零狗碎
1108 | 鸡毛蒜皮
1109 | 鸡犬不留
1110 | 鸡犬不宁
1111 | 棘手
1112 | 急不可待
1113 | 急功近利
1114 | 急切
1115 | 急性子
1116 | 急于
1117 | 急躁
1118 | 疾言厉色
1119 | 挤
1120 | 挤巴
1121 | 挤得水泄不通
1122 | 挤得要命
1123 | 挤挤插插
1124 | 挤满
1125 | 寂
1126 | 寂寥
1127 | 寂寞
1128 | 忌刻
1129 | 夹七夹八
1130 | 家长式
1131 | 家贫如洗
1132 | 家徒壁立
1133 | 家徒四壁
1134 | 假
1135 | 假冒
1136 | 假模假式
1137 | 假仁假义
1138 | 假想
1139 | 假惺惺
1140 | 假意
1141 | 假造
1142 | 假正经
1143 | 假装神圣
1144 | 价高
1145 | 价格不菲
1146 | 价格高昂
1147 | 架空
1148 | 尖刻
1149 | 尖酸
1150 | 尖酸刻薄
1151 | 尖嘴薄舌
1152 | 尖嘴猴腮
1153 | 间不容发
1154 | 间杂
1155 | 肩摩毂击
1156 | 艰
1157 | 艰巨
1158 | 艰苦
1159 | 艰苦卓绝
1160 | 艰难
1161 | 艰难曲折
1162 | 艰难险阻
1163 | 艰涩
1164 | 艰深
1165 | 艰危
1166 | 艰辛
1167 | 奸
1168 | 奸刁
1169 | 奸恶
1170 | 奸猾
1171 | 奸险
1172 | 奸邪
1173 | 奸诈
1174 | 奸佞
1175 | 简单
1176 | 简陋
1177 | 简慢
1178 | 贱
1179 | 见不得人
1180 | 见风使舵
1181 | 见风转舵
1182 | 见识短浅
1183 | 见异思迁
1184 | 剑拔弩张
1185 | 僵
1186 | 僵化
1187 | 僵硬
1188 | 胶柱鼓瑟
1189 | 浇薄
1190 | 浇漓
1191 | 骄
1192 | 骄傲
1193 | 骄傲自满
1194 | 骄横
1195 | 骄慢
1196 | 骄气
1197 | 骄人
1198 | 骄奢淫逸
1199 | 骄纵
1200 | 骄矜
1201 | 娇
1202 | 娇痴
1203 | 娇贵
1204 | 娇憨
1205 | 娇嫩
1206 | 娇气
1207 | 娇弱
1208 | 娇生惯养
1209 | 矫情
1210 | 矫情造作
1211 | 矫揉造作
1212 | 侥
1213 | 狡
1214 | 狡猾
1215 | 狡计多端
1216 | 狡兔三窟
1217 | 狡诈
1218 | 狡狯
1219 | 狡黠
1220 | 揭不开锅
1221 | 竭蹶
1222 | 洁身自好
1223 | 结结巴巴
1224 | 斤斤计较
1225 | 金刚努目
1226 | 紧
1227 | 紧巴
1228 | 紧巴巴
1229 | 近视
1230 | 荆棘载途
1231 | 惊爆
1232 | 惊人
1233 | 惊天动地
1234 | 惊险
1235 | 精力枯竭
1236 | 精神不振
1237 | 精神溜号
1238 | 经济拮据
1239 | 经验不足
1240 | 静僻
1241 | 净余
1242 | 窘
1243 | 窘促
1244 | 窘急
1245 | 窘困
1246 | 窘迫
1247 | 窘涩
1248 | 旧
1249 | 旧式
1250 | 拘
1251 | 拘礼
1252 | 拘执
1253 | 狙
1254 | 拒人于千里之外
1255 | 剧毒
1256 | 倔
1257 | 倔强
1258 | 倔头倔脑
1259 | 倔犟
1260 | 绝
1261 | 绝情
1262 | 峻
1263 | 开小差
1264 | 坎坷
1265 | 坎坷不平
1266 | 看风使舵
1267 | 糠
1268 | 亢
1269 | 靠不住
1270 | 苛
1271 | 苛刻
1272 | 磕磕绊绊
1273 | 磕头碰脑
1274 | 可悲
1275 | 可鄙
1276 | 可怖
1277 | 可耻
1278 | 可恶
1279 | 可骇
1280 | 可恨
1281 | 可惊
1282 | 可怜
1283 | 可怕
1284 | 可叹
1285 | 可有可无
1286 | 可憎
1287 | 刻板
1288 | 刻薄
1289 | 刻毒
1290 | 刻舟求剑
1291 | 坑坑洼洼
1292 | 坑洼
1293 | 坑洼不平
1294 | 空
1295 | 空洞
1296 | 空洞洞
1297 | 空洞无聊
1298 | 空洞无物
1299 | 空乏
1300 | 空泛
1301 | 空幻
1302 | 空空洞洞
1303 | 空落落
1304 | 空头
1305 | 空虚
1306 | 空中楼阁
1307 | 恐怖
1308 | 抠
1309 | 抠门儿
1310 | 抠搜
1311 | 抠唆
1312 | 口蜜腹剑
1313 | 口是心非
1314 | 口头上
1315 | 枯
1316 | 枯寂
1317 | 枯涩
1318 | 枯燥
1319 | 枯燥乏味
1320 | 枯燥无味
1321 | 枯槁
1322 | 苦
1323 | 苦不唧
1324 | 苦口
1325 | 苦苦
1326 | 苦涩
1327 | 酷
1328 | 酷烈
1329 | 酷虐
1330 | 夸诞
1331 | 狂
1332 | 狂傲
1333 | 狂暴
1334 | 狂荡
1335 | 狂妄
1336 | 狂妄自大
1337 | 狂躁
1338 | 狂悖
1339 | 狂恣
1340 | 困顿
1341 | 困窘
1342 | 困苦
1343 | 困难
1344 | 困难重重
1345 | 困人
1346 | 阔绰
1347 | 阔气
1348 | 拉忽
1349 | 拉拉杂杂
1350 | 拉杂
1351 | 辣
1352 | 辣手
1353 | 来路不明
1354 | 来之不易
1355 | 赖
1356 | 赖皮
1357 | 懒
1358 | 懒到极点
1359 | 懒惰
1360 | 懒散
1361 | 烂
1362 | 滥
1363 | 狼狈
1364 | 狼狈不堪
1365 | 狼籍
1366 | 狼藉
1367 | 狼心狗肺
1368 | 浪
1369 | 浪荡
1370 | 劳而无功
1371 | 老
1372 | 老大难
1373 | 老掉牙
1374 | 老赶
1375 | 老虎屁股摸不得
1376 | 老奸巨猾
1377 | 老奸巨滑
1378 | 老辣
1379 | 老派
1380 | 老气
1381 | 老气横秋
1382 | 老弱病残
1383 | 老实
1384 | 老式
1385 | 老朽
1386 | 累卵
1387 | 累赘
1388 | 累牍连篇
1389 | 肋脦
1390 | 冷
1391 | 冷冰冰
1392 | 冷淡
1393 | 冷峻
1394 | 冷酷
1395 | 冷酷无情
1396 | 冷冷
1397 | 冷冷清清
1398 | 冷厉
1399 | 冷落
1400 | 冷门
1401 | 冷漠
1402 | 冷峭
1403 | 冷清
1404 | 冷清清
1405 | 冷若冰霜
1406 | 冷销
1407 | 冷血
1408 | 冷噤
1409 | 离索
1410 | 离题
1411 | 离心离德
1412 | 理亏
1413 | 理屈
1414 | 理屈词穷
1415 | 理由不充分
1416 | 里出外进
1417 | 厉
1418 | 厉害
1419 | 厉声
1420 | 利令智昏
1421 | 利已
1422 | 利欲熏心
1423 | 哩哩啦啦
1424 | 哩哩罗罗
1425 | 哩溜歪斜
1426 | 连篇累牍
1427 | 良莠不齐
1428 | 两面光
1429 | 两面三刀
1430 | 寥
1431 | 寥寂
1432 | 潦草
1433 | 了不得
1434 | 了不起
1435 | 烈
1436 | 烈性子
1437 | 劣
1438 | 劣等
1439 | 劣质
1440 | 劣中之劣
1441 | 鳞状
1442 | 凛
1443 | 凛凛
1444 | 凛然
1445 | 吝
1446 | 吝啬
1447 | 零
1448 | 零丁
1449 | 零零散散
1450 | 零零碎碎
1451 | 零乱
1452 | 零落
1453 | 零七八碎
1454 | 零散
1455 | 零碎
1456 | 零星
1457 | 伶仃
1458 | 凌乱
1459 | 凌杂
1460 | 令人不安
1461 | 令人齿冷
1462 | 令人恶心
1463 | 令人发指
1464 | 令人费解
1465 | 令人寒心
1466 | 令人敬畏
1467 | 令人困倦
1468 | 令人毛骨悚然
1469 | 令人恼火
1470 | 令人疲倦
1471 | 令人生气
1472 | 令人生厌
1473 | 令人讨厌
1474 | 令人厌恶
1475 | 令人厌倦
1476 | 令人遗憾
1477 | 令人折断腰
1478 | 令人窒息
1479 | 令人作呕
1480 | 溜号
1481 | 流里流气
1482 | 流气
1483 | 六亲不认
1484 | 娄
1485 | 漏洞百出
1486 | 陋
1487 | 鲁
1488 | 鲁钝
1489 | 鲁莽
1490 | 碌
1491 | 碌碌
1492 | 碌碌无为
1493 | 驴唇不对马嘴
1494 | 率
1495 | 率尔
1496 | 率然
1497 | 乱
1498 | 乱成一团
1499 | 乱纷纷
1500 | 乱哄哄
1501 | 乱烘烘
1502 | 乱乎
1503 | 乱了营
1504 | 乱乱哄哄
1505 | 乱虐并生
1506 | 乱蓬蓬
1507 | 乱七八糟
1508 | 乱套
1509 | 乱腾
1510 | 乱腾腾
1511 | 乱杂
1512 | 乱糟糟
1513 | 乱真
1514 | 乱嘈嘈
1515 | 落后
1516 | 落落寡合
1517 | 落寞
1518 | 落市
1519 | 落俗套
1520 | 落套
1521 | 落拓
1522 | 落伍
1523 | 麻
1524 | 麻痹
1525 | 麻烦
1526 | 麻麻黑
1527 | 麻木
1528 | 麻木不仁
1529 | 马虎
1530 | 马马虎虎
1531 | 埋汰
1532 | 卖不掉
1533 | 卖不动
1534 | 蛮
1535 | 蛮不讲理
1536 | 蛮悍
1537 | 蛮横
1538 | 蛮横无理
1539 | 蛮荒
1540 | 满
1541 | 满脸横肉
1542 | 满目疮痍
1543 | 漫
1544 | 漫不经心
1545 | 漫不经意
1546 | 漫无边际
1547 | 漫无目标
1548 | 漫无目的
1549 | 漫漶
1550 | 谩
1551 | 茫
1552 | 茫茫
1553 | 茫茫然
1554 | 盲目
1555 | 盲人瞎马
1556 | 莽
1557 | 莽苍
1558 | 莽莽苍苍
1559 | 莽莽撞撞
1560 | 莽撞
1561 | 猫哭老鼠
1562 | 毛
1563 | 毛糙
1564 | 毛毛躁躁
1565 | 毛手毛脚
1566 | 毛头毛脑
1567 | 毛躁
1568 | 冒
1569 | 冒牌
1570 | 冒失
1571 | 冒险
1572 | 冒有风险
1573 | 貌似强大
1574 | 貌似真实的
1575 | 贸贸然
1576 | 贸然
1577 | 没边儿
1578 | 没出息
1579 | 没骨头
1580 | 没关系
1581 | 没好气
1582 | 没见过世面
1583 | 没教养
1584 | 没劲
1585 | 没理
1586 | 没礼貌
1587 | 没良心
1588 | 没两下子
1589 | 没轻没重
1590 | 没什么了不得
1591 | 没什么了不起
1592 | 没受过教育
1593 | 没头没脑
1594 | 没头脑
1595 | 没味
1596 | 没心没肺
1597 | 没心眼儿
1598 | 没意思
1599 | 没用
1600 | 没有教养
1601 | 没有礼貌
1602 | 没有头脑
1603 | 没有学问
1604 | 没有勇气
1605 | 媚俗
1606 | 闷
1607 | 闷气
1608 | 蒙昧
1609 | 蒙蒙
1610 | 蒙蒙胧胧
1611 | 蒙胧
1612 | 孟浪
1613 | 靡丽
1614 | 靡靡
1615 | 糜
1616 | 糜烂
1617 | 迷濛
1618 | 迷宫般
1619 | 迷糊
1620 | 迷离
1621 | 迷离扑朔
1622 | 迷离倘恍
1623 | 迷漫
1624 | 迷茫
1625 | 迷蒙
1626 | 迷蒙蒙
1627 | 迷迷糊糊
1628 | 迷迷茫茫
1629 | 迷迷蒙蒙
1630 | 迷迷怔怔
1631 | 弥天
1632 | 米珠薪桂
1633 | 秘
1634 | 秘密
1635 | 密
1636 | 密不透风
1637 | 绵里藏针
1638 | 绵软
1639 | 勉勉强强
1640 | 勉强
1641 | 面呈病色
1642 | 面黄肌瘦
1643 | 面目可憎
1644 | 面目狰狞
1645 | 面色蜡黄
1646 | 面生
1647 | 面无表情
1648 | 藐小
1649 | 渺
1650 | 渺茫
1651 | 渺渺
1652 | 渺然
1653 | 渺若烟云
1654 | 渺小
1655 | 灭绝人性
1656 | 明哲保身
1657 | 名不副实
1658 | 名过其实
1659 | 名义
1660 | 名义上
1661 | 名誉扫地
1662 | 命苦
1663 | 谬
1664 | 模糊
1665 | 模糊不清
1666 | 模棱两可
1667 | 摩肩接踵
1668 | 魔鬼般
1669 | 魔怔
1670 | 莫须有
1671 | 墨
1672 | 漠
1673 | 漠不关心
1674 | 漠漠
1675 | 漠然
1676 | 寞
1677 | 陌生
1678 | 暮气
1679 | 暮气沉沉
1680 | 暮色苍茫
1681 | 幕后
1682 | 木
1683 | 木雕泥塑
1684 | 木头木脑
1685 | 木讷
1686 | 目不识丁
1687 | 目光短浅
1688 | 目光如豆
1689 | 目光凶狠
1690 | 目空一切
1691 | 目无余子
1692 | 目中无人
1693 | 拿腔拿调
1694 | 拿腔作势
1695 | 奶声奶气
1696 | 男盗女娼
1697 | 难
1698 | 难吃
1699 | 难看
1700 | 难人
1701 | 难上加难
1702 | 难上难
1703 | 难说话
1704 | 难听
1705 | 难闻
1706 | 难相处
1707 | 难驯服
1708 | 难以
1709 | 难以沟通
1710 | 囊空如洗
1711 | 囊中羞涩
1712 | 闹
1713 | 闹得慌
1714 | 闹哄哄
1715 | 闹闹哄哄
1716 | 闹闹嚷嚷
1717 | 闹嚷嚷
1718 | 嫩
1719 | 泥沙俱下
1720 | 你死我活
1721 | 匿名
1722 | 腻
1723 | 腻人
1724 | 逆
1725 | 逆耳
1726 | 蔫不唧儿
1727 | 蔫儿坏
1728 | 蔫头耷脑
1729 | 拈轻怕重
1730 | 年久失修
1731 | 鸟尽弓藏
1732 | 狞
1733 | 狞恶
1734 | 凝滞
1735 | 泞
1736 | 牛
1737 | 牛气
1738 | 扭扭捏捏
1739 | 奴颜婢膝
1740 | 虐
1741 | 懦
1742 | 懦怯
1743 | 懦弱
1744 | 盘根错节
1745 | 盘陁
1746 | 庞杂
1747 | 旁若无人
1748 | 配不上
1749 | 蓬乱
1750 | 蓬散
1751 | 蓬首垢面
1752 | 蓬头垢面
1753 | 蓬头散发
1754 | 脾气暴
1755 | 脾气爆躁
1756 | 脾气坏
1757 | 脾气火暴
1758 | 脾气急躁
1759 | 皮
1760 | 皮毛
1761 | 皮相
1762 | 僻
1763 | 僻静
1764 | 偏
1765 | 偏激
1766 | 偏颇
1767 | 偏听偏信
1768 | 偏狭
1769 | 偏斜
1770 | 偏心
1771 | 偏心眼
1772 | 片断
1773 | 片面
1774 | 骗人
1775 | 漂浮
1776 | 贫
1777 | 贫寒
1778 | 贫苦
1779 | 贫困
1780 | 贫穷
1781 | 贫瘠
1782 | 平白
1783 | 平白无故
1784 | 平淡
1785 | 平淡无奇
1786 | 平淡无味
1787 | 平铺直叙
1788 | 平铺直序
1789 | 凭白无故
1790 | 凭空
1791 | 坡
1792 | 泼
1793 | 泼辣
1794 | 婆婆妈妈
1795 | 破
1796 | 破败
1797 | 破坏性
1798 | 破旧
1799 | 破烂不堪
1800 | 破陋
1801 | 扑朔迷离
1802 | 铺张
1803 | 铺张浪费
1804 | 欺诈性
1805 | 七零八落
1806 | 凄
1807 | 凄惨
1808 | 凄楚
1809 | 凄寒
1810 | 凄寂
1811 | 凄苦
1812 | 凄冷
1813 | 凄厉
1814 | 凄凉
1815 | 凄迷
1816 | 凄怆
1817 | 漆黑
1818 | 漆黑一团
1819 | 其貌不扬
1820 | 奇丑无比
1821 | 奇形怪状
1822 | 崎
1823 | 崎岖
1824 | 崎岖不平
1825 | 起绉
1826 | 起褶子
1827 | 岂有此理
1828 | 气粗
1829 | 气闷
1830 | 气盛
1831 | 气势汹汹
1832 | 气壮如牛
1833 | 千变万化
1834 | 千疮百孔
1835 | 千金一掷
1836 | 千钧一发
1837 | 千篇一律
1838 | 前呼后拥
1839 | 潜
1840 | 浅
1841 | 浅薄
1842 | 浅尝辄止
1843 | 浅陋
1844 | 欠妥
1845 | 欠完善
1846 | 欠周到
1847 | 强
1848 | 强暴
1849 | 强横
1850 | 强行
1851 | 强制
1852 | 强制性
1853 | 巧
1854 | 巧黠
1855 | 翘尾巴
1856 | 峭
1857 | 峭直
1858 | 怯
1859 | 怯懦
1860 | 怯然
1861 | 怯弱
1862 | 怯生生
1863 | 窃
1864 | 禽兽不如
1865 | 轻
1866 | 轻薄
1867 | 轻淡
1868 | 轻浮
1869 | 轻贱
1870 | 轻狂
1871 | 轻率
1872 | 轻描淡写
1873 | 轻易
1874 | 轻佻
1875 | 倾斜
1876 | 清淡
1877 | 清高
1878 | 清寒
1879 | 清苦
1880 | 清冷
1881 | 清贫
1882 | 穷
1883 | 穷乏
1884 | 穷极潦倒
1885 | 穷苦
1886 | 穷困
1887 | 穷困潦倒
1888 | 穷奢极侈
1889 | 穷奢极欲
1890 | 穷酸
1891 | 穷途潦倒
1892 | 穷途末路
1893 | 穷凶极恶
1894 | 穷匮
1895 | 囚首垢面
1896 | 区区
1897 | 曲曲折折
1898 | 曲折
1899 | 屈才
1900 | 屈理
1901 | 犬牙交错
1902 | 缺
1903 | 缺德
1904 | 缺乏才智
1905 | 缺乏教养
1906 | 缺乏绅士风度
1907 | 缺乏幽默
1908 | 缺心眼
1909 | 缺心眼儿
1910 | 群魔乱舞
1911 | 攘攘
1912 | 扰扰
1913 | 绕脖子
1914 | 人不为己,天诛地灭
1915 | 人不知,鬼不觉
1916 | 人声鼎沸
1917 | 人声嘈杂
1918 | 人头攒动
1919 | 人为财死,鸟为食亡
1920 | 任重道远
1921 | 任纵
1922 | 认死理
1923 | 认死理儿
1924 | 冗
1925 | 冗长
1926 | 冗余
1927 | 冗赘
1928 | 柔弱
1929 | 肉
1930 | 肉了叭叽
1931 | 肉麻
1932 | 如临大敌
1933 | 如临深渊
1934 | 如履薄冰
1935 | 乳臭未干
1936 | 软
1937 | 软绵绵
1938 | 软弱
1939 | 软弱无力
1940 | 若明若暗
1941 | 若隐若现
1942 | 弱
1943 | 弱不禁风
1944 | 弱不胜衣
1945 | 弱势
1946 | 弱小
1947 | 弱智
1948 | 三天打鱼两天晒网
1949 | 散
1950 | 散乱
1951 | 散漫
1952 | 嗓子不好
1953 | 丧尽天良
1954 | 丧心病狂
1955 | 骚
1956 | 骚乱性
1957 | 色厉内荏
1958 | 色迷迷
1959 | 色情
1960 | 涩
1961 | 涩苦
1962 | 涩滞
1963 | 森
1964 | 杀气腾腾
1965 | 杀人不见血
1966 | 杀人不眨眼
1967 | 杀人如麻
1968 | 傻
1969 | 傻呵呵
1970 | 傻乎乎
1971 | 傻里瓜唧
1972 | 傻里傻气
1973 | 傻头傻脑
1974 | 山南海北
1975 | 山穷水尽
1976 | 闪烁
1977 | 伤风败俗
1978 | 伤脑筋
1979 | 伤天害理
1980 | 伤心惨目
1981 | 少不更事
1982 | 奢
1983 | 奢侈
1984 | 奢华
1985 | 奢靡
1986 | 奢糜
1987 | 蛇蝎心肠
1988 | 涉世不深
1989 | 身无分文
1990 | 深重
1991 | 神不知,鬼不觉
1992 | 神不知鬼不觉
1993 | 神秘
1994 | 神气活现
1995 | 神气十足
1996 | 神神秘秘
1997 | 神志委靡
1998 | 声名狼藉
1999 | 声色俱厉
2000 | 生
2001 | 生拉硬拽
2002 | 生涩
2003 | 生疏
2004 | 生硬
2005 | 盛气凌人
2006 | 剩余
2007 | 失常
2008 | 失当
2009 | 失检
2010 | 失礼
2011 | 失落
2012 | 失去理性
2013 | 失神
2014 | 失慎
2015 | 失实
2016 | 失宜
2017 | 十恶不赦
2018 | 十室九空
2019 | 什
2020 | 什锦
2021 | 食而不化
2022 | 食而不知其味
2023 | 食古不化
2024 | 实属不易
2025 | 使不得
2026 | 使人疲劳
2027 | 世故
2028 | 世情冷暖
2029 | 世俗
2030 | 世态炎凉
2031 | 誓不两立
2032 | 势不两立
2033 | 势利
2034 | 势利眼
2035 | 嗜杀成性
2036 | 嗜血
2037 | 嗜血成性
2038 | 恃才傲物
2039 | 手脚不干净
2040 | 手紧
2041 | 手生
2042 | 手头紧
2043 | 手无缚鸡之力
2044 | 守旧
2045 | 守株待兔
2046 | 瘦
2047 | 瘦弱
2048 | 输理
2049 | 疏忽
2050 | 疏懒
2051 | 疏松
2052 | 书生气
2053 | 鼠胆
2054 | 鼠目寸光
2055 | 数不上
2056 | 数不着
2057 | 衰弱
2058 | 衰颓
2059 | 水火不相容
2060 | 水泄不通
2061 | 水性杨花
2062 | 水中捞月
2063 | 瞬息万变
2064 | 说不过去
2065 | 说来话长
2066 | 斯文扫地
2067 | 私
2068 | 私底下
2069 | 私密
2070 | 私下
2071 | 私下里
2072 | 私自
2073 | 死
2074 | 死板
2075 | 死板板
2076 | 死沉沉
2077 | 死脑筋
2078 | 死气沉沉
2079 | 死去活来
2080 | 死死
2081 | 死心塌地
2082 | 死心眼
2083 | 死心眼儿
2084 | 死性
2085 | 死一般
2086 | 死硬
2087 | 死有余辜
2088 | 肆
2089 | 肆无忌惮
2090 | 肆意
2091 | 四大皆空
2092 | 四面楚歌
2093 | 似
2094 | 似乎
2095 | 似是而非
2096 | 松垮
2097 | 松垮垮
2098 | 松散
2099 | 松散散
2100 | 松松垮垮
2101 | 耸人听闻
2102 | 酥
2103 | 酥软
2104 | 酥松
2105 | 俗
2106 | 俗气
2107 | 素不相识
2108 | 素昧平生
2109 | 肃
2110 | 肃杀
2111 | 酸
2112 | 酸不溜丢
2113 | 酸臭
2114 | 酸刻
2115 | 酸溜溜
2116 | 酸涩
2117 | 随便
2118 | 随风倒
2119 | 随风使舵
2120 | 随风转舵
2121 | 随随便便
2122 | 随心所欲
2123 | 碎
2124 | 祟
2125 | 损
2126 | 损人利己
2127 | 琐
2128 | 琐碎
2129 | 琐细
2130 | 琐屑
2131 | 索
2132 | 索然
2133 | 索然乏味
2134 | 索然寡味
2135 | 索然无味
2136 | 所谓
2137 | 太随便
2138 | 太虚
2139 | 贪
2140 | 贪得无厌
2141 | 贪婪
2142 | 贪心
2143 | 贪心不足
2144 | 瘫软
2145 | 谈何容易
2146 | 唐突
2147 | 烫手
2148 | 淘
2149 | 淘气
2150 | 淘神
2151 | 讨厌
2152 | 特困
2153 | 特贫
2154 | 体力不支
2155 | 体弱
2156 | 体衰
2157 | 天昏地暗
2158 | 天南地北
2159 | 天南海北
2160 | 天真
2161 | 恬淡
2162 | 腆
2163 | 挑逗性
2164 | 铁杆儿
2165 | 铁公鸡一毛不拔
2166 | 铁石心肠
2167 | 铁血
2168 | 听天由命
2169 | 偷
2170 | 偷工减料
2171 | 偷偷
2172 | 偷偷摸摸
2173 | 投机
2174 | 头脑空虚
2175 | 头痛
2176 | 秃
2177 | 徒
2178 | 徒劳
2179 | 徒劳无功
2180 | 徒劳无益
2181 | 徒然
2182 | 土
2183 | 土得掉渣
2184 | 土里土气
2185 | 土气
2186 | 土俗
2187 | 土头土脑
2188 | 兔死狗烹
2189 | 兔子不吃窝边草
2190 | 兔子尾巴长不了
2191 | 颓
2192 | 颓败
2193 | 颓废
2194 | 蜕化
2195 | 蜕化变质
2196 | 退化
2197 | 拖泥带水
2198 | 拖沓
2199 | 歪
2200 | 歪歪扭扭
2201 | 歪斜
2202 | 外面儿光
2203 | 外行
2204 | 顽
2205 | 顽钝
2206 | 顽梗
2207 | 顽固
2208 | 顽劣
2209 | 顽皮
2210 | 完全不重要
2211 | 万恶
2212 | 万花筒似
2213 | 万马齐喑
2214 | 万难
2215 | 枉
2216 | 枉费心机
2217 | 枉然
2218 | 望梅止渴
2219 | 忘恩负义
2220 | 忘情
2221 | 妄
2222 | 妄自尊大
2223 | 威
2224 | 威厉
2225 | 微不足道
2226 | 微贱
2227 | 微茫
2228 | 微末
2229 | 危殆
2230 | 危机四伏
2231 | 危机重重
2232 | 危急
2233 | 危如累卵
2234 | 危亡
2235 | 危险
2236 | 危在旦夕
2237 | 唯利是图
2238 | 唯我独尊
2239 | 惟利是图
2240 | 惟我独尊
2241 | 为人作嫁
2242 | 为人作嫁衣裳
2243 | 为所欲为
2244 | 萎靡不振
2245 | 委靡不振
2246 | 委琐
2247 | 伪
2248 | 伪善
2249 | 伪造
2250 | 未便
2251 | 未成熟
2252 | 未归类
2253 | 未揭露
2254 | 未老先衰
2255 | 未列计划
2256 | 未受过教育
2257 | 味道不好
2258 | 味同嚼蜡
2259 | 畏怯
2260 | 畏首畏尾
2261 | 文不对题
2262 | 文弱
2263 | 文恬武嬉
2264 | 紊
2265 | 紊乱
2266 | 问道于盲
2267 | 窝囊
2268 | 乌沉沉
2269 | 乌灯黑火
2270 | 乌洞洞
2271 | 乌七八糟
2272 | 乌漆墨黑
2273 | 乌涂
2274 | 乌托邦
2275 | 乌压压
2276 | 乌烟瘴气
2277 | 污
2278 | 污秽
2279 | 污七八糟
2280 | 污浊
2281 | 无伴
2282 | 无表情
2283 | 无补
2284 | 无补于事
2285 | 无常
2286 | 无诚意
2287 | 无道德观念
2288 | 无的放矢
2289 | 无动于衷
2290 | 无度
2291 | 无端
2292 | 无端端
2293 | 无法无天
2294 | 无根据
2295 | 无故
2296 | 无关大局
2297 | 无关宏旨
2298 | 无关紧要
2299 | 无关痛痒
2300 | 无光
2301 | 无光泽
2302 | 无规
2303 | 无涵养
2304 | 无稽
2305 | 无济于事
2306 | 无计划
2307 | 无记名
2308 | 无纪律
2309 | 无价值
2310 | 无教养
2311 | 无节制
2312 | 无可无不可
2313 | 无口才
2314 | 无赖
2315 | 无理
2316 | 无礼
2317 | 无力
2318 | 无聊
2319 | 无眉目
2320 | 无目的
2321 | 无能
2322 | 无能为力
2323 | 无凭无据
2324 | 无情
2325 | 无情无义
2326 | 无人过问
2327 | 无人问津
2328 | 无伤大雅
2329 | 无生气
2330 | 无实效
2331 | 无实质
2332 | 无所帮助
2333 | 无所不用其极
2334 | 无特色
2335 | 无望
2336 | 无味
2337 | 无谓
2338 | 无吸引力
2339 | 无限制
2340 | 无效
2341 | 无依无靠
2342 | 无意义
2343 | 无益
2344 | 无用
2345 | 无原则
2346 | 无缘无故
2347 | 无证据
2348 | 无知
2349 | 无中生有
2350 | 无助
2351 | 无足轻重
2352 | 芜
2353 | 芜杂
2354 | 武断
2355 | 雾里看花
2356 | 误
2357 | 误诊
2358 | 稀里糊涂
2359 | 稀松
2360 | 稀松平常
2361 | 喜新厌旧
2362 | 细
2363 | 细碎
2364 | 细小
2365 | 瞎
2366 | 下
2367 | 下乘
2368 | 下道儿
2369 | 下等
2370 | 下贱
2371 | 下流
2372 | 下品
2373 | 下三烂
2374 | 下三滥
2375 | 下作
2376 | 吓人
2377 | 纤弱
2378 | 险
2379 | 险毒
2380 | 险恶
2381 | 险峻
2382 | 险峭
2383 | 险象环生
2384 | 险要
2385 | 险诈
2386 | 险阻
2387 | 现行
2388 | 羡余
2389 | 香艳
2390 | 享乐
2391 | 向上倾斜
2392 | 向下倾斜
2393 | 象征性
2394 | 萧
2395 | 萧然
2396 | 萧瑟
2397 | 萧森
2398 | 萧疏
2399 | 萧索
2400 | 萧条
2401 | 萧飒
2402 | 嚣杂
2403 | 嚣张
2404 | 消极
2405 | 小
2406 | 小肚鸡肠
2407 | 小儿科
2408 | 小家子气
2409 | 小家子相
2410 | 小里小气
2411 | 小气
2412 | 小手小脚
2413 | 小小不言
2414 | 小心眼
2415 | 小心眼儿
2416 | 笑里藏刀
2417 | 效率很差
2418 | 携贰
2419 | 邪
2420 | 邪恶
2421 | 斜
2422 | 斜体
2423 | 斜歪
2424 | 卸磨杀驴
2425 | 懈怠
2426 | 辛
2427 | 辛苦
2428 | 辛酸
2429 | 辛辛苦苦
2430 | 心不在焉
2431 | 心粗
2432 | 心地狭窄
2433 | 心毒
2434 | 心浮
2435 | 心黑手辣
2436 | 心狠
2437 | 心狠手辣
2438 | 心口不一
2439 | 心切
2440 | 心如蛇蝎
2441 | 心如铁石
2442 | 心胸狭隘
2443 | 心胸狭窄
2444 | 心眼儿小
2445 | 心眼儿窄
2446 | 心眼小
2447 | 心猿意马
2448 | 星星点点
2449 | 腥
2450 | 腥臭
2451 | 腥臊
2452 | 腥膻
2453 | 形单影只
2454 | 形格势禁
2455 | 形同路人
2456 | 形同虚设
2457 | 形影相吊
2458 | 行不通
2459 | 行为不端
2460 | 行为不检
2461 | 性格内向
2462 | 性急
2463 | 性情急躁
2464 | 凶
2465 | 凶巴巴
2466 | 凶暴
2467 | 凶残
2468 | 凶毒
2469 | 凶恶
2470 | 凶悍
2471 | 凶狠
2472 | 凶横
2473 | 凶狂
2474 | 凶蛮
2475 | 凶猛
2476 | 凶煞
2477 | 凶顽
2478 | 凶险
2479 | 凶戾
2480 | 胸无城府
2481 | 胸无点墨
2482 | 熊
2483 | 虚
2484 | 虚诞
2485 | 虚浮
2486 | 虚幻
2487 | 虚假
2488 | 虚空
2489 | 虚夸
2490 | 虚拟
2491 | 虚荣
2492 | 虚弱
2493 | 虚设
2494 | 虚妄
2495 | 虚伪
2496 | 虚无
2497 | 虚无飘渺
2498 | 虚无缥缈
2499 | 虚虚实实
2500 | 虚有其表
2501 | 虚诈
2502 | 絮
2503 | 絮叨
2504 | 絮聒
2505 | 喧
2506 | 喧天
2507 | 喧嚣
2508 | 喧杂
2509 | 喧噪
2510 | 悬
2511 | 悬乎
2512 | 悬空
2513 | 玄
2514 | 学究气
2515 | 学识浅薄
2516 | 学识谫陋
2517 | 雪上加霜
2518 | 血淋淋
2519 | 血腥
2520 | 血雨腥风
2521 | 牙碜
2522 | 亚
2523 | 烟雾弥漫
2524 | 烟雾腾腾
2525 | 严
2526 | 严加
2527 | 严峻
2528 | 严苛
2529 | 严酷
2530 | 严冷
2531 | 严厉
2532 | 严肃
2533 | 严重
2534 | 言不由衷
2535 | 言之无物
2536 | 眼巴巴
2537 | 眼光短浅
2538 | 眼皮子高
2539 | 眼皮子浅
2540 | 眼生
2541 | 衍
2542 | 扬长
2543 | 羊质虎皮
2544 | 阳奉阴违
2545 | 妖
2546 | 妖里妖气
2547 | 摇摇晃晃
2548 | 摇摇欲坠
2549 | 要不得
2550 | 野
2551 | 野鸡
2552 | 野蛮
2553 | 叶公好龙
2554 | 夜郎自大
2555 | 一把死拿
2556 | 一暴十寒
2557 | 一波三折
2558 | 一不小心
2559 | 一场空
2560 | 一成不变
2561 | 一触即溃
2562 | 一发千钧
2563 | 一锅粥
2564 | 一脸横肉
2565 | 一脸稚气
2566 | 一毛不拔
2567 | 一偏
2568 | 一贫如洗
2569 | 一钱不值
2570 | 一仍旧贯
2571 | 一手遮天
2572 | 一塌糊涂
2573 | 一团乱麻
2574 | 一团漆黑
2575 | 一团糟
2576 | 一文不名
2577 | 一文不值
2578 | 一窝蜂
2579 | 一无可取
2580 | 一无是处
2581 | 一无所长
2582 | 一无所有
2583 | 一言堂
2584 | 一掷千金
2585 | 依违
2586 | 依稀
2587 | 衣衫不整
2588 | 颐指气使
2589 | 疑难
2590 | 倚老卖老
2591 | 以怨报德
2592 | 易变
2593 | 易怒
2594 | 臆
2595 | 意马心猿
2596 | 义正词严
2597 | 溢价
2598 | 异常
2599 | 异形
2600 | 荫
2601 | 因循守旧
2602 | 殷
2603 | 殷切
2604 | 阴
2605 | 阴暗
2606 | 阴沉
2607 | 阴沉沉
2608 | 阴毒
2609 | 阴恶
2610 | 阴晦
2611 | 阴冷
2612 | 阴凄
2613 | 阴森
2614 | 阴森森
2615 | 阴损
2616 | 阴险
2617 | 阴险毒辣
2618 | 阴性
2619 | 阴阳怪气
2620 | 淫
2621 | 淫荡
2622 | 淫秽
2623 | 淫贱
2624 | 淫乱
2625 | 淫靡
2626 | 淫邪
2627 | 淫逸
2628 | 淫亵
2629 | 淫猥
2630 | 引起反感
2631 | 隐
2632 | 隐晦
2633 | 隐秘
2634 | 隐然
2635 | 隐身
2636 | 隐形
2637 | 隐性
2638 | 隐隐
2639 | 隐隐绰绰
2640 | 隐隐约约
2641 | 隐约
2642 | 应名儿
2643 | 影影绰绰
2644 | 硬
2645 | 硬气
2646 | 硬生生
2647 | 硬性
2648 | 拥挤
2649 | 拥挤不堪
2650 | 庸
2651 | 庸碌
2652 | 庸俗
2653 | 庸庸碌碌
2654 | 用不着
2655 | 幽
2656 | 幽暗
2657 | 幽晦
2658 | 幽幽
2659 | 幽冥
2660 | 幽黯
2661 | 优柔
2662 | 优柔寡断
2663 | 悠谬
2664 | 犹犹豫豫
2665 | 犹豫不决
2666 | 犹豫不前
2667 | 油
2668 | 油乎乎
2669 | 油滑
2670 | 油腻
2671 | 油腻腻
2672 | 油头滑脑
2673 | 油汪汪
2674 | 油脂麻花
2675 | 油渍渍
2676 | 有碍观瞻
2677 | 有弊
2678 | 有点旧
2679 | 有毒
2680 | 有毒性
2681 | 有害
2682 | 有名无实
2683 | 有难度
2684 | 有伤风化
2685 | 有失检点
2686 | 有失偏颇
2687 | 有失身分
2688 | 有始无终
2689 | 有恃无恐
2690 | 有头无尾
2691 | 有一搭没一搭
2692 | 有义务
2693 | 有罪
2694 | 幼稚
2695 | 迂
2696 | 迂腐
2697 | 迂阔
2698 | 迂拙
2699 | 于事无补
2700 | 愚
2701 | 愚笨
2702 | 愚不可及
2703 | 愚痴
2704 | 愚蠢
2705 | 愚钝
2706 | 愚陋
2707 | 愚鲁
2708 | 愚昧
2709 | 愚昧无知
2710 | 愚蒙
2711 | 愚傻
2712 | 愚顽
2713 | 愚妄
2714 | 愚拙
2715 | 余剩
2716 | 逾分
2717 | 鱼龙混杂
2718 | 鱼游釜中
2719 | 与虎谋皮
2720 | 与世隔绝
2721 | 与世无争
2722 | 语无伦次
2723 | 语焉不详
2724 | 羽毛未丰
2725 | 欲壑难填
2726 | 原始
2727 | 圆
2728 | 圆滑
2729 | 约略
2730 | 越轨
2731 | 越礼
2732 | 云遮雾障
2733 | 云谲波诡
2734 | 蕴藉
2735 | 晕头转向
2736 | 杂
2737 | 杂草丛生
2738 | 杂乱
2739 | 杂乱无章
2740 | 杂牌
2741 | 杂七杂八
2742 | 杂遝
2743 | 杂沓
2744 | 灾难性
2745 | 在困难中
2746 | 脏
2747 | 脏乎乎
2748 | 脏乱
2749 | 脏乱差
2750 | 脏兮兮
2751 | 糟
2752 | 糟糕
2753 | 凿空
2754 | 凿死理儿
2755 | 躁
2756 | 躁急
2757 | 躁狂
2758 | 造次
2759 | 造作
2760 | 贼
2761 | 贼溜溜
2762 | 贼眉鼠眼
2763 | 贼去关门
2764 | 贼头贼脑
2765 | 扎手
2766 | 轧
2767 | 窄
2768 | 张冠李戴
2769 | 张狂
2770 | 招致不幸
2771 | 照本宣科
2772 | 狰狞
2773 | 正色
2774 | 正颜厉色
2775 | 枝蔓
2776 | 支离
2777 | 支离破碎
2778 | 直呆呆
2779 | 直瞪瞪
2780 | 直盯盯
2781 | 直勾勾
2782 | 直愣愣
2783 | 执迷不悟
2784 | 执拗
2785 | 趾高气扬
2786 | 只顾自身利益
2787 | 只听楼梯响,不见人下来
2788 | 纸上谈兵
2789 | 纸醉金迷
2790 | 志大才疏
2791 | 智障
2792 | 稚气
2793 | 质次价高
2794 | 质量差
2795 | 滞
2796 | 滞背
2797 | 滞钝
2798 | 滞涩
2799 | 滞销
2800 | 窒闷
2801 | 重
2802 | 重沓
2803 | 众叛亲离
2804 | 皱
2805 | 皱巴
2806 | 皱巴巴
2807 | 皱皱巴巴
2808 | 竹篮打水
2809 | 竹篮子打水
2810 | 竹篮子打水一场空
2811 | 煮豆燃萁
2812 | 主观
2813 | 主观上
2814 | 讆
2815 | 专横
2816 | 专横跋扈
2817 | 专制
2818 | 转移性
2819 | 装备不良
2820 | 装模作样
2821 | 装腔
2822 | 装腔作势
2823 | 装相
2824 | 装样子
2825 | 赘
2826 | 赘余
2827 | 捉襟见肘
2828 | 捉摸不定
2829 | 拙
2830 | 拙笨
2831 | 拙劣
2832 | 着三不着两
2833 | 浊
2834 | 子虚
2835 | 子虚乌有
2836 | 自傲
2837 | 自大
2838 | 自负
2839 | 自高自大
2840 | 自豪
2841 | 自命不凡
2842 | 自命清高
2843 | 自恃
2844 | 自私
2845 | 自私自利
2846 | 自相矛盾
2847 | 纵恣
2848 | 走神
2849 | 走油
2850 | 嘴尖
2851 | 醉翁之意不在酒
2852 | 最差
2853 | 最坏
2854 | 罪不容诛
2855 | 罪大恶极
2856 | 罪恶
2857 | 罪恶多端
2858 | 罪恶深重
2859 | 罪恶滔天
2860 | 罪恶昭彰
2861 | 罪恶昭著
2862 | 罪该万死
2863 | 罪孽深重
2864 | 左
2865 | 做作
2866 | 作势
2867 | 坐而论道
2868 | 坐井观天
2869 | 兀突
2870 | 孬
2871 | 噩
2872 | 卮
2873 | 孛
2874 | 啬
2875 | 啬刻
2876 | 厝火积薪
2877 | 赝
2878 | 剌
2879 | 剌戾
2880 | 剽悍
2881 | 罔
2882 | 伧
2883 | 伧俗
2884 | 佶屈聱牙
2885 | 侉
2886 | 佻
2887 | 俚
2888 | 俚俗
2889 | 倜然
2890 | 倥
2891 | 倥侗
2892 | 倥偬
2893 | 倨
2894 | 倨傲
2895 | 傥
2896 | 僭
2897 | 儇
2898 | 巽
2899 | 亵
2900 | 羸弱
2901 | 跅弛
2902 | 跅驰
2903 | 冥
2904 | 冥顽
2905 | 冥顽不化
2906 | 冥顽不灵
2907 | 冥冥
2908 | 讷
2909 | 诎
2910 | 诘屈聱牙
2911 | 谫
2912 | 谫陋
2913 | 谲
2914 | 谲诈
2915 | 阢
2916 | 阽
2917 | 刍
2918 | 堙
2919 | 艽
2920 | 芴
2921 | 苴
2922 | 茕
2923 | 茕茕
2924 | 茕茕孑立
2925 | 茕茕孑立,形影相吊
2926 | 荏
2927 | 荏弱
2928 | 萋迷
2929 | 迍邅
2930 | 瞢
2931 | 拗
2932 | 拮据
2933 | 吆三喝四
2934 | 吆五喝六
2935 | 咄咄逼人
2936 | 哙
2937 | 哝
2938 | 啷
2939 | 嗲
2940 | 嗲声嗲气
2941 | 嘈
2942 | 嘈杂
2943 | 嘀里嘟噜
2944 | 岌岌
2945 | 岌岌不可终日
2946 | 岌岌可危
2947 | 嶙峋
2948 | 嶙嶙
2949 | 犷
2950 | 犷悍
2951 | 狃
2952 | 狎
2953 | 狎昵
2954 | 狯
2955 | 狷
2956 | 狷急
2957 | 猥
2958 | 猥鄙
2959 | 猥贱
2960 | 猥劣
2961 | 猥陋
2962 | 猥琐
2963 | 猥亵
2964 | 獐头鼠目
2965 | 獠
2966 | 舛
2967 | 馀
2968 | 廪
2969 | 忉
2970 | 忮
2971 | 忸忸怩怩
2972 | 忸怩作态
2973 | 怊
2974 | 恹
2975 | 恹恹
2976 | 悖
2977 | 悖晦
2978 | 悖谬
2979 | 悖逆
2980 | 悖妄
2981 | 悭
2982 | 悭吝
2983 | 悱
2984 | 愦
2985 | 愣
2986 | 愣头愣脑
2987 | 愀然
2988 | 愎
2989 | 慵懒
2990 | 懵
2991 | 懵懂
2992 | 懵里懵懂
2993 | 懵懵懂懂
2994 | 阙陋
2995 | 阙略
2996 | 湎
2997 | 溲
2998 | 溷浊
2999 | 滂
3000 | 澹然
3001 | 蹇
3002 | 遴
3003 | 邋里邋遢
3004 | 邋遢
3005 | 邋邋遢遢
3006 | 孱
3007 | 孱弱
3008 | 羼
3009 | 娆
3010 | 媸
3011 | 孑
3012 | 孑然
3013 | 孑然一身
3014 | 孑身
3015 | 驽
3016 | 驽钝
3017 | 骈枝
3018 | 绌
3019 | 缈
3020 | 缛
3021 | 缥缈
3022 | 缭乱
3023 | 幺麽
3024 | 杌
3025 | 桀
3026 | 桀骜不驯
3027 | 棼
3028 | 槁
3029 | 轫
3030 | 辁
3031 | 暧
3032 | 暧昧
3033 | 暝
3034 | 犟
3035 | 毵毵
3036 | 虢
3037 | 朦
3038 | 朦胧
3039 | 朦朦胧胧
3040 | 臊
3041 | 膻
3042 | 膻气
3043 | 膻腥
3044 | 熹微
3045 | 戾
3046 | 恝
3047 | 恝然
3048 | 恣
3049 | 恣肆
3050 | 恣意
3051 | 憝
3052 | 戆
3053 | 戆头戆脑
3054 | 沓
3055 | 硗
3056 | 硗薄
3057 | 硗瘠
3058 | 碜
3059 | 睨
3060 | 瞀
3061 | 瞑
3062 | 瞽
3063 | 锱铢必较
3064 | 鸷
3065 | 鸷悍
3066 | 疣赘
3067 | 瘠
3068 | 瘠薄
3069 | 癃
3070 | 癫狂
3071 | 窈冥
3072 | 窭
3073 | 窳
3074 | 窳败
3075 | 窳惰
3076 | 窳劣
3077 | 褊
3078 | 褊急
3079 | 褊狭
3080 | 褶
3081 | 矜
3082 | 矜持
3083 | 矜夸
3084 | 聒
3085 | 聒噪
3086 | 颛
3087 | 颛蒙
3088 | 颟顸
3089 | 蚍蜉撼大树
3090 | 蚍蜉撼树
3091 | 蚩
3092 | 蜻蜓点水
3093 | 笃
3094 | 箪食瓢饮
3095 | 趄
3096 | 蹩脚
3097 | 霭霭
3098 | 龃
3099 | 龃龉
3100 | 龉
3101 | 龌
3102 | 龌龊
3103 | 鲰
3104 | 饕
3105 | 黝
3106 | 黝暗
3107 | 黝黯
3108 | 黠
3109 | 黠慧
3110 | 黢
3111 | 黢黑
3112 | 黩
3113 | 黪
3114 | 黯
3115 | 黯淡
3116 | 黯然
3117 |
--------------------------------------------------------------------------------
/sentiment_dic/negative_sentiment.txt:
--------------------------------------------------------------------------------
1 | 傒倖
2 | 忷
3 | 恟
4 | 懆懆
5 | 搥胸顿足
6 | 哀
7 | 哀哀切切
8 | 哀愁
9 | 哀怜
10 | 哀悯
11 | 哀戚
12 | 哀凄
13 | 哀切
14 | 哀伤
15 | 哀痛
16 | 哀痛欲绝
17 | 哀怨
18 | 哀恸
19 | 哀矜
20 | 傲视
21 | 懊
22 | 懊恨
23 | 懊悔
24 | 懊恼
25 | 懊丧
26 | 百无聊赖
27 | 败兴
28 | 板
29 | 板脸
30 | 板面孔
31 | 板起脸
32 | 板着脸
33 | 板着面孔
34 | 半信半疑
35 | 包涵
36 | 包容
37 | 褒贬
38 | 睖睁
39 | 薄
40 | 抱不平
41 | 抱憾
42 | 抱憾终身
43 | 抱恨
44 | 抱恨终生
45 | 抱恨终天
46 | 抱疚
47 | 抱愧
48 | 抱歉
49 | 抱怨
50 | 暴跳
51 | 暴跳如雷
52 | 杯弓蛇影
53 | 悲
54 | 悲哀
55 | 悲愁
56 | 悲观失望
57 | 悲悯
58 | 悲戚
59 | 悲凄
60 | 悲切
61 | 悲切切
62 | 悲伤
63 | 悲酸
64 | 悲天悯人
65 | 悲痛
66 | 悲痛欲绝
67 | 悲怆
68 | 悲恸
69 | 悲恻
70 | 背包袱
71 | 绷
72 | 绷脸
73 | 绷着脸
74 | 鼻酸
75 | 鄙
76 | 鄙薄
77 | 鄙贱
78 | 鄙弃
79 | 鄙视
80 | 鄙夷
81 | 鞭挞
82 | 贬斥
83 | 变脸
84 | 变色
85 | 变心
86 | 表示坏情感
87 | 憋
88 | 憋得慌
89 | 憋闷
90 | 憋气
91 | 憋屈
92 | 憋着一肚子气
93 | 勃然大怒
94 | 驳难
95 | 驳议
96 | 不待见
97 | 不甘
98 | 不甘心
99 | 不顾
100 | 不过意
101 | 不寒而栗
102 | 不好过
103 | 不好意思
104 | 不快
105 | 不落忍
106 | 不满
107 | 不满意
108 | 不满足
109 | 不念旧恶
110 | 不平
111 | 不容
112 | 不是味儿
113 | 不是滋味
114 | 不是滋味儿
115 | 不爽
116 | 不死心
117 | 不同意
118 | 不闻不问
119 | 不屑
120 | 不屑一顾
121 | 不屑于
122 | 不以为然
123 | 不愿
124 | 不愿意
125 | 不悦
126 | 不赞成
127 | 不赞同
128 | 不忠
129 | 不忠诚
130 | 怖
131 | 猜忌
132 | 猜嫌
133 | 猜疑
134 | 惭
135 | 惭惶
136 | 惭愧
137 | 惨痛
138 | 仓皇失措
139 | 藏奸
140 | 操心
141 | 诧
142 | 诧异
143 | 诧愕
144 | 嘲骂
145 | 嘲谑
146 | 沉闷
147 | 沉痛
148 | 沉吟
149 | 沉郁
150 | 沉重
151 | 诚惶诚恐
152 | 吃不准
153 | 吃错药
154 | 吃后悔药
155 | 痴愣
156 | 持异议
157 | 迟疑
158 | 迟疑不决
159 | 耻骂
160 | 斥
161 | 斥骂
162 | 斥责
163 | 踌躇
164 | 踌躇不决
165 | 踌躇不前
166 | 愁
167 | 愁惨
168 | 愁肠百结
169 | 愁眉不展
170 | 愁眉紧锁
171 | 愁眉苦脸
172 | 愁眉锁眼
173 | 愁闷
174 | 愁容满面
175 | 仇恨
176 | 仇视
177 | 臭骂
178 | 出气
179 | 出神
180 | 吹胡子瞪眼
181 | 捶胸顿足
182 | 垂怜
183 | 垂头丧气
184 | 戳壁脚
185 | 戳脊梁骨
186 | 刺打
187 | 蹿火
188 | 错愕
189 | 打骂
190 | 打入冷宫
191 | 打入十八层地狱
192 | 打问号
193 | 打怵
194 | 打憷
195 | 大吃一惊
196 | 大跌眼镜
197 | 大动肝火
198 | 大发雷霆
199 | 大惊失色
200 | 大骂
201 | 大失所望
202 | 呆
203 | 呆若木鸡
204 | 呆怔
205 | 呆滞
206 | 呆住
207 | 呆愣愣
208 | 贷
209 | 担惊受怕
210 | 担心
211 | 担忧
212 | 胆颤心惊
213 | 胆寒
214 | 胆战心惊
215 | 惮
216 | 当紧
217 | 当头棒喝
218 | 得饶人处且饶人
219 | 等不及
220 | 等闲视之
221 | 瞪眼
222 | 低沉
223 | 低落
224 | 敌视
225 | 惦
226 | 惦挂
227 | 惦记
228 | 惦念
229 | 掉魂
230 | 掉以轻心
231 | 跌眼镜
232 | 动肝火
233 | 动火
234 | 动怒
235 | 动气
236 | 动摇
237 | 恫
238 | 斗
239 | 斗争
240 | 堵
241 | 堵得慌
242 | 堵心
243 | 断肠
244 | 断魂
245 | 顿生疑窦
246 | 顿足捶胸
247 | 多虑
248 | 多有微词
249 | 恶
250 | 恶骂
251 | 扼腕
252 | 耳热
253 | 发愁
254 | 发呆
255 | 发狠
256 | 发火
257 | 发急
258 | 发牢骚
259 | 发毛
260 | 发怒
261 | 发脾气
262 | 发怔
263 | 发指
264 | 发作
265 | 发怵
266 | 发愣
267 | 发憷
268 | 发飙
269 | 翻然悔悟
270 | 烦
271 | 烦愁
272 | 烦闷
273 | 烦恼
274 | 烦腻
275 | 烦扰
276 | 烦神
277 | 烦厌
278 | 烦忧
279 | 烦躁
280 | 反唇相讥
281 | 反感
282 | 犯愁
283 | 犯急
284 | 犯难
285 | 犯疑心病
286 | 犯怵
287 | 犯憷
288 | 非常悲哀
289 | 非难
290 | 非议
291 | 费精神
292 | 费神
293 | 忿忿
294 | 忿忿不平
295 | 忿忿然
296 | 忿恨
297 | 忿怒
298 | 忿恚
299 | 忿懑
300 | 愤愤
301 | 愤愤不平
302 | 愤愤然
303 | 愤恨
304 | 愤怒
305 | 愤世嫉俗
306 | 愤懑
307 | 讽
308 | 讽刺
309 | 付之一笑
310 | 负疚
311 | 负气
312 | 肝肠寸断
313 | 感伤
314 | 给 ... 当头棒喝
315 | 给 ... 一点颜色看看
316 | 攻击
317 | 骨鲠在喉
318 | 顾忌
319 | 顾虑
320 | 顾虑重重
321 | 顾念
322 | 寡欢
323 | 挂
324 | 挂怀
325 | 挂火
326 | 挂记
327 | 挂虑
328 | 挂念
329 | 挂牵
330 | 挂心
331 | 怪
332 | 怪罪
333 | 光火
334 | 过不去
335 | 过分操心
336 | 过虑
337 | 过意不去
338 | 害怕
339 | 害羞
340 | 害臊
341 | 骇
342 | 骇怪
343 | 骇惧
344 | 骇怕
345 | 骇然失色
346 | 骇异
347 | 骇愕
348 | 含悲
349 | 含愤
350 | 含恨
351 | 含怒
352 | 含沙射影
353 | 含羞
354 | 含怨
355 | 涵容
356 | 寒
357 | 寒心
358 | 憾
359 | 悍然不顾
360 | 汗颜
361 | 毫不在乎
362 | 呵
363 | 呵斥
364 | 呵责
365 | 呵叱
366 | 喝斥
367 | 喝叱
368 | 恨
369 | 恨入骨髓
370 | 恨铁不成钢
371 | 恨之入骨
372 | 红脸
373 | 红眼
374 | 猴儿急
375 | 后顾之忧
376 | 后悔
377 | 后悔莫及
378 | 后怕
379 | 忽略
380 | 忽视
381 | 狐疑不决
382 | 虎着脸
383 | 怀恨
384 | 怀恨在心
385 | 怀疑
386 | 坏情
387 | 患
388 | 荒
389 | 荒废
390 | 慌恐
391 | 皇皇
392 | 惶
393 | 惶惶
394 | 惶惶不安
395 | 惶惶不可终日
396 | 惶惶然
397 | 惶惑
398 | 惶惧
399 | 惶恐
400 | 惶恐不安
401 | 惶然
402 | 惶然不安
403 | 惶悚
404 | 惶遽
405 | 灰溜溜
406 | 灰头灰脸
407 | 灰头土脸
408 | 灰心
409 | 灰心丧气
410 | 回头
411 | 悔
412 | 悔不当初
413 | 悔不该
414 | 悔恨
415 | 悔悟
416 | 悔之不及
417 | 悔之晚矣
418 | 悔之无及
419 | 魂不附体
420 | 魂飞魄散
421 | 魂飞天外
422 | 火
423 | 火急火燎
424 | 火冒三丈
425 | 火烧火燎
426 | 火头上
427 | 饥不择食
428 | 激愤
429 | 讥嘲
430 | 讥刺
431 | 讥讽
432 | 讥讪
433 | 讥诮
434 | 鸡蛋里挑骨头
435 | 极度悲哀
436 | 极度悲伤
437 | 急
438 | 急巴巴
439 | 急急巴巴
440 | 急死
441 | 急眼
442 | 疾
443 | 嫉恨
444 | 悸栗
445 | 忌
446 | 忌惮
447 | 忌恨
448 | 见怪
449 | 见罪
450 | 将心比心
451 | 将信将疑
452 | 焦愁
453 | 焦急
454 | 焦虑
455 | 焦心
456 | 焦炙
457 | 焦灼
458 | 娇羞
459 | 教训
460 | 叫苦
461 | 叫苦不迭
462 | 叫苦连天
463 | 叫骂
464 | 叫嚣
465 | 解气
466 | 借古讽今
467 | 介怀
468 | 介意
469 | 进退两难
470 | 进退维谷
471 | 惊
472 | 惊怖
473 | 惊诧
474 | 惊呆
475 | 惊怪
476 | 惊骇
477 | 惊慌
478 | 惊慌失措
479 | 惊惶
480 | 惊惧
481 | 惊恐
482 | 惊怕
483 | 惊奇
484 | 惊奇不已
485 | 惊叹
486 | 惊讶
487 | 惊疑
488 | 惊异
489 | 惊悚
490 | 惊愕
491 | 窘
492 | 窘迫
493 | 揪心
494 | 疚愧
495 | 拘束
496 | 举棋不定
497 | 沮
498 | 沮丧
499 | 惧
500 | 惧怕
501 | 眷顾
502 | 觉得自己理亏
503 | 绝望
504 | 开炮
505 | 看扁
506 | 看不惯
507 | 看不开
508 | 看不起
509 | 看不上
510 | 看不上眼
511 | 看不顺眼
512 | 看淡
513 | 看低
514 | 看轻
515 | 抗议
516 | 苛察
517 | 苛责
518 | 可怜
519 | 可惜
520 | 恐
521 | 恐慌
522 | 恐惧
523 | 口诛笔伐
524 | 哭丧着脸
525 | 哭笑不得
526 | 苦闷
527 | 苦恼
528 | 苦涩
529 | 宽贷
530 | 宽假
531 | 宽免
532 | 宽赦
533 | 宽恕
534 | 宽宥
535 | 狂怒
536 | 亏心
537 | 愧
538 | 愧对
539 | 愧汗
540 | 愧恨
541 | 愧悔
542 | 愧疚
543 | 愧怍
544 | 愧恧
545 | 愧赧
546 | 困窘
547 | 困迫
548 | 拉不下脸
549 | 拉不下脸来
550 | 拉长个脸
551 | 拉下脸
552 | 拉下脸来
553 | 来火
554 | 来气
555 | 赖
556 | 懒得
557 | 懒洋洋
558 | 劳神
559 | 老羞成怒
560 | 冷嘲热讽
561 | 冷淡
562 | 怜
563 | 怜悯
564 | 怜惜
565 | 怜恤
566 | 脸红脖子粗
567 | 脸红耳热
568 | 脸皮薄
569 | 脸上下不来
570 | 凉
571 | 两难
572 | 亮红灯
573 | 谅
574 | 谅解
575 | 虑
576 | 乱
577 | 乱了方寸
578 | 骂
579 | 骂不绝口
580 | 骂大街
581 | 骂得狗血淋头
582 | 骂得狗血喷头
583 | 骂街
584 | 骂骂咧咧
585 | 骂娘
586 | 骂人
587 | 埋没
588 | 埋汰
589 | 埋怨
590 | 满不在乎
591 | 满脸愁雾
592 | 漫骂
593 | 谩骂
594 | 毛骨悚然
595 | 冒火
596 | 没个好脸
597 | 没精打采
598 | 没意思
599 | 没有好脸
600 | 闷
601 | 闷沉沉
602 | 闷闷
603 | 闷闷不乐
604 | 闷郁
605 | 面斥
606 | 面带怒色
607 | 面带嗔色
608 | 面面相觑
609 | 面如死灰
610 | 面如土色
611 | 面无人色
612 | 面有愧色
613 | 面有难色
614 | 面有愠色
615 | 藐视
616 | 蔑
617 | 蔑视
618 | 民怨沸腾
619 | 悯
620 | 鸣不平
621 | 鸣冤叫屈
622 | 摸不准
623 | 磨不开
624 | 抹不开
625 | 漠然视之
626 | 漠然置之
627 | 漠视
628 | 木然
629 | 目瞪口呆
630 | 纳罕
631 | 难
632 | 难过
633 | 难堪
634 | 难受
635 | 难为情
636 | 恼
637 | 恼恨
638 | 恼火
639 | 恼怒
640 | 恼羞成怒
641 | 闹脾气
642 | 闹情绪
643 | 闹性子
644 | 馁
645 | 内疚
646 | 腻
647 | 腻烦
648 | 腻歪
649 | 腻味
650 | 捏把汗
651 | 捏一把汗
652 | 怒
653 | 怒不可遏
654 | 怒斥
655 | 怒冲冲
656 | 怒发冲冠
657 | 怒喝
658 | 怒火冲天
659 | 怒火中烧
660 | 怒骂
661 | 怒目
662 | 怒气冲冲
663 | 怒气冲天
664 | 怒形于色
665 | 怒叱
666 | 怕
667 | 怕生
668 | 怕羞
669 | 拍案而起
670 | 排揎
671 | 徘徊
672 | 派不是
673 | 旁敲侧击
674 | 抨
675 | 抨击
676 | 批
677 | 批斗
678 | 苶
679 | 皮里阳秋
680 | 屁滚尿流
681 | 偏废
682 | 品头论足
683 | 评头论足
684 | 评头品足
685 | 颇有微词
686 | 破口大骂
687 | 魄散魂飞
688 | 迫不及待
689 | 戚戚
690 | 戚然
691 | 七窍生烟
692 | 凄惶
693 | 凄切
694 | 凄然
695 | 凄酸
696 | 凄婉
697 | 凄怨
698 | 凄恻
699 | 歧视
700 | 骑虎难下
701 | 起疑心
702 | 气
703 | 气昂昂
704 | 气不忿
705 | 气不过
706 | 气不平
707 | 气冲冲
708 | 气冲牛斗
709 | 气短
710 | 气忿
711 | 气忿忿
712 | 气愤
713 | 气愤愤
714 | 气鼓鼓
715 | 气狠狠
716 | 气哼哼
717 | 气呼呼
718 | 气乎乎
719 | 气急败坏
720 | 气恼
721 | 气馁
722 | 气头上
723 | 气汹汹
724 | 牵念
725 | 迁怒
726 | 谴
727 | 谴责
728 | 歉然
729 | 歉甚
730 | 瞧不起
731 | 瞧不上
732 | 瞧不上眼
733 | 切齿
734 | 切齿痛恨
735 | 怯
736 | 怯阵
737 | 轻
738 | 轻忽
739 | 轻看
740 | 轻蔑
741 | 轻视
742 | 清算
743 | 穷极无聊
744 | 饶
745 | 饶人
746 | 饶恕
747 | 惹气
748 | 人身攻击
749 | 忍让
750 | 柔肠百结
751 | 柔肠寸断
752 | 如泣如诉
753 | 如丧考妣
754 | 如鲠在喉
755 | 辱骂
756 | 撒气
757 | 三心二意
758 | 丧胆
759 | 丧魂落魄
760 | 丧气
761 | 丧志
762 | 扫兴
763 | 杀气
764 | 傻眼
765 | 伤
766 | 伤悲
767 | 伤怀
768 | 伤神
769 | 伤心
770 | 慑
771 | 申斥
772 | 申讨
773 | 申饬
774 | 深恶痛绝
775 | 深以为异
776 | 声讨
777 | 生恐
778 | 生怕
779 | 生气
780 | 生疑
781 | 失悔
782 | 失节
783 | 失神
784 | 失望
785 | 失意
786 | 使性子
787 | 示不满
788 | 示不同意
789 | 示怒
790 | 势成骑虎
791 | 视同儿戏
792 | 视同蝼蚁
793 | 首鼠两端
794 | 受窘
795 | 疏
796 | 数落
797 | 数说
798 | 恕
799 | 恕宥
800 | 说
801 | 说不
802 | 说风凉话
803 | 说怪话
804 | 酸
805 | 酸楚
806 | 酸溜溜
807 | 缩头缩脑
808 | 谈虎色变
809 | 讨
810 | 讨厌
811 | 提心吊胆
812 | 啼笑皆非
813 | 体谅
814 | 体念
815 | 体惜
816 | 体恤
817 | 天怒人怨
818 | 挑刺儿
819 | 挑毛病
820 | 同病相怜
821 | 同情
822 | 痛
823 | 痛不欲生
824 | 痛斥
825 | 痛恶
826 | 痛恨
827 | 痛骂
828 | 痛惜
829 | 痛心
830 | 痛心疾首
831 | 痛责
832 | 投诉
833 | 兔死狐悲
834 | 颓
835 | 颓废
836 | 颓靡
837 | 颓然
838 | 颓丧
839 | 颓唐
840 | 唾骂
841 | 挖苦
842 | 玩
843 | 玩忽
844 | 玩世不恭
845 | 惋
846 | 惋惜
847 | 万箭穿心
848 | 万念俱灰
849 | 往心里去
850 | 望而生畏
851 | 微愠
852 | 唯恐
853 | 惟恐
854 | 为难
855 | 萎靡
856 | 委决不下
857 | 委靡
858 | 委屈
859 | 委罪
860 | 畏
861 | 畏忌
862 | 畏惧
863 | 畏葸
864 | 闻风丧胆
865 | 问心有愧
866 | 窝火
867 | 窝囊
868 | 窝气
869 | 窝心
870 | 无地自容
871 | 无精打采
872 | 无聊
873 | 无名火起
874 | 无视
875 | 无所谓
876 | 无心
877 | 无意
878 | 物伤其类
879 | 惜
880 | 系
881 | 系念
882 | 戏侮
883 | 下不来台
884 | 下不了台
885 | 衔恨
886 | 衔冤
887 | 嫌
888 | 嫌恶
889 | 嫌弃
890 | 嫌厌
891 | 嫌憎
892 | 想不开
893 | 向 ... 问罪
894 | 向隅
895 | 向隅而泣
896 | 消沉
897 | 小看
898 | 小瞧
899 | 小视
900 | 笑骂
901 | 泄劲
902 | 泄气
903 | 心胆俱裂
904 | 心烦
905 | 心烦意乱
906 | 心寒
907 | 心灰意懒
908 | 心灰意冷
909 | 心急
910 | 心急火燎
911 | 心急如焚
912 | 心急如火
913 | 心焦
914 | 心焦如焚
915 | 心惊胆颤
916 | 心惊胆战
917 | 心惊肉跳
918 | 心里堵得慌
919 | 心情沉重
920 | 心如刀割
921 | 心如刀绞
922 | 心如死灰
923 | 心酸
924 | 心碎
925 | 心疼
926 | 心痛
927 | 心虚
928 | 心绪沉落
929 | 心有余悸
930 | 杏眼圆睁
931 | 羞
932 | 羞惭
933 | 羞答答
934 | 羞恶
935 | 羞窘
936 | 羞愧
937 | 羞怯
938 | 羞人
939 | 羞人答答
940 | 羞涩
941 | 羞羞答答
942 | 羞于
943 | 羞臊
944 | 羞赧
945 | 虚惊
946 | 嘘
947 | 恤
948 | 絮烦
949 | 悬
950 | 悬念
951 | 悬系
952 | 悬心
953 | 训斥
954 | 训戒
955 | 训诫
956 | 讶
957 | 讶然
958 | 讶然失色
959 | 讶异
960 | 厌
961 | 厌恶
962 | 厌烦
963 | 厌恨
964 | 厌倦
965 | 厌腻
966 | 厌气
967 | 厌弃
968 | 摇摆
969 | 要紧
970 | 一怒之下
971 | 一气之下
972 | 一怔
973 | 遗憾
974 | 疑
975 | 疑惑
976 | 疑忌
977 | 疑虑
978 | 疑虑重重
979 | 疑神疑鬼
980 | 抑郁
981 | 抑郁寡欢
982 | 意意思思
983 | 义愤
984 | 义愤填膺
985 | 异
986 | 阴郁
987 | 引咎
988 | 引咎自责
989 | 隐忧
990 | 幽忧
991 | 忧
992 | 忧愁
993 | 忧烦
994 | 忧愤
995 | 忧惧
996 | 忧虑
997 | 忧闷
998 | 忧伤
999 | 忧思
1000 | 忧心
1001 | 忧心如焚
1002 | 忧心忡忡
1003 | 忧郁
1004 | 忧怨
1005 | 忧悒
1006 | 犹疑
1007 | 犹豫
1008 | 油煎火燎
1009 | 游移
1010 | 有愧
1011 | 于心有愧
1012 | 虞
1013 | 郁
1014 | 郁闷
1015 | 郁郁不乐
1016 | 郁郁寡欢
1017 | 欲哭无泪
1018 | 詟
1019 | 原
1020 | 原谅
1021 | 原宥
1022 | 怨
1023 | 怨恨
1024 | 怨悔
1025 | 怨声载道
1026 | 怨天尤人
1027 | 在乎
1028 | 糟心
1029 | 责
1030 | 责备
1031 | 责斥
1032 | 责怪
1033 | 责骂
1034 | 责难
1035 | 责怨
1036 | 憎
1037 | 憎恶
1038 | 憎恨
1039 | 咋舌
1040 | 炸
1041 | 瞻前顾后
1042 | 战兢兢
1043 | 战战兢兢
1044 | 张口结舌
1045 | 找茬
1046 | 找茬儿
1047 | 找碴
1048 | 找碴儿
1049 | 找岔子
1050 | 针砭
1051 | 震
1052 | 震惊
1053 | 震怒
1054 | 震悚
1055 | 睁一眼闭一眼
1056 | 睁一只眼闭一只眼
1057 | 睁只眼闭只眼
1058 | 怔
1059 | 怔神儿
1060 | 怔怔
1061 | 怔住
1062 | 怔忪
1063 | 直眉瞪眼
1064 | 指斥
1065 | 指鸡骂狗
1066 | 指桑骂槐
1067 | 指责
1068 | 指摘
1069 | 置疑
1070 | 置于脑后
1071 | 置之不顾
1072 | 置之不理
1073 | 置之度外
1074 | 置之脑后
1075 | 质疑
1076 | 滞呆
1077 | 周恤
1078 | 咒
1079 | 咒骂
1080 | 咒诅
1081 | 抓瞎
1082 | 椎心泣血
1083 | 追悔
1084 | 追悔莫及
1085 | 着急
1086 | 着忙
1087 | 自暴自弃
1088 | 自惭形秽
1089 | 自咎
1090 | 自疚
1091 | 自馁
1092 | 自怨自艾
1093 | 自责
1094 | 诅
1095 | 诅骂
1096 | 诅咒
1097 | 左右两难
1098 | 左右为难
1099 | 做贼心虚
1100 | 作难
1101 | 作色
1102 | 倥
1103 | 讪讪
1104 | 诃
1105 | 诘
1106 | 诟
1107 | 诟病
1108 | 诮
1109 | 诶
1110 | 谇
1111 | 谪
1112 | 矍
1113 | 芴
1114 | 菀
1115 | 葸
1116 | 奚落
1117 | 奚幸
1118 | 尴尬
1119 | 挹
1120 | 掎
1121 | 掊
1122 | 掊击
1123 | 摭
1124 | 撸
1125 | 撺
1126 | 叱
1127 | 叱骂
1128 | 叱责
1129 | 哓
1130 | 呲
1131 | 啧有烦言
1132 | 嗔
1133 | 嗔斥
1134 | 嗔怪
1135 | 嗔怒
1136 | 嗤之以鼻
1137 | 嘀咕
1138 | 噍
1139 | 彷
1140 | 彷徨
1141 | 忏
1142 | 忏悔
1143 | 怃
1144 | 怄
1145 | 怄气
1146 | 忡
1147 | 怅
1148 | 怅恨
1149 | 怅然
1150 | 怅然若失
1151 | 怅怅
1152 | 怅惘
1153 | 怆
1154 | 怆怳
1155 | 怆恍
1156 | 怆然
1157 | 怆恻
1158 | 忪
1159 | 忸
1160 | 忸怩
1161 | 怵
1162 | 怵然
1163 | 怵头
1164 | 怛
1165 | 怏
1166 | 怏然
1167 | 怏然不悦
1168 | 怏怏
1169 | 怏怏不乐
1170 | 怍
1171 | 怫
1172 | 怫然
1173 | 怫然不悦
1174 | 怫然作色
1175 | 恸
1176 | 恻
1177 | 恻然
1178 | 恻隐
1179 | 恂
1180 | 悚
1181 | 悚然
1182 | 悒
1183 | 悒闷
1184 | 悒郁
1185 | 悒郁寡欢
1186 | 悒悒不乐
1187 | 悛
1188 | 悻然
1189 | 悻悻
1190 | 悻悻然
1191 | 惝恍
1192 | 惘
1193 | 惘然
1194 | 惘然若失
1195 | 惆
1196 | 惆怅
1197 | 愠
1198 | 愠怒
1199 | 愕
1200 | 愕然
1201 | 愣
1202 | 愣神儿
1203 | 愣怔
1204 | 愣怔怔
1205 | 愣住
1206 | 惴
1207 | 愀
1208 | 慊
1209 | 憷
1210 | 憷头
1211 | 懔
1212 | 忝
1213 | 闵
1214 | 渎
1215 | 宥
1216 | 骞
1217 | 娆
1218 | 嬉笑怒骂
1219 | 槁木死灰
1220 | 殚
1221 | 轸
1222 | 戟指
1223 | 腼腆
1224 | 膈应
1225 | 臊
1226 | 恝置
1227 | 恚
1228 | 恚愤
1229 | 恚恨
1230 | 恚怒
1231 | 恧
1232 | 愍
1233 | 憝
1234 | 懑
1235 | 瞠目结舌
1236 | 瞠然
1237 | 詈
1238 | 詈骂
1239 | 瘅
1240 | 竦
1241 | 矜
1242 | 赧
1243 | 赧然
1244 | 赧颜
1245 | 踟
1246 | 踟躇
1247 | 踟蹰
1248 | 踟蹰不前
1249 | 蹰
1250 | 觖
1251 | 觖望
1252 | 訾议
1253 | 黯然神伤
1254 | 黯然销魂
1255 |
--------------------------------------------------------------------------------
/sentiment_dic/positive_sentiment.txt:
--------------------------------------------------------------------------------
1 | 噲
2 | 媢
3 | 媢嫉
4 | 忺
5 | 爱
6 | 爱不忍释
7 | 爱不释手
8 | 爱宠
9 | 爱戴
10 | 爱抚
11 | 爱好
12 | 爱护
13 | 爱怜
14 | 爱恋
15 | 爱慕
16 | 爱上
17 | 爱屋及乌
18 | 爱惜
19 | 安
20 | 昂扬
21 | 巴
22 | 巴不得
23 | 巴望
24 | 摆好
25 | 拜
26 | 拜拜
27 | 拜服
28 | 拜贺
29 | 拜谒
30 | 褒
31 | 褒奖
32 | 褒扬
33 | 睎
34 | 表扬
35 | 表彰
36 | 并重
37 | 补台
38 | 不看僧面看佛面
39 | 不愧
40 | 不胜欣忭
41 | 不惜
42 | 不厌
43 | 睬
44 | 采纳
45 | 参拜
46 | 参谒
47 | 侧重
48 | 馋
49 | 畅快
50 | 唱喏
51 | 倡
52 | 朝拜
53 | 朝思暮想
54 | 撑台面
55 | 撑腰
56 | 称
57 | 称道
58 | 称快
59 | 称赏
60 | 称颂
61 | 称叹
62 | 称羡
63 | 称谢
64 | 称心
65 | 称心如意
66 | 称心如愿
67 | 称许
68 | 称誉
69 | 称愿
70 | 称赞
71 | 承
72 | 承蒙
73 | 承情
74 | 承望
75 | 承应
76 | 骋怀
77 | 吃醋
78 | 痴
79 | 痴恋
80 | 痴迷
81 | 痴情
82 | 痴心不改
83 | 痴心妄想
84 | 驰念
85 | 驰思
86 | 崇
87 | 崇拜
88 | 崇敬
89 | 崇尚
90 | 崇仰
91 | 宠
92 | 宠爱
93 | 宠幸
94 | 酬谢
95 | 踌躇满志
96 | 出迎
97 | 垂爱
98 | 垂念
99 | 垂青
100 | 垂涎
101 | 垂涎三尺
102 | 垂涎欲滴
103 | 春风得意
104 | 春风满面
105 | 醋意大发
106 | 措意
107 | 答礼
108 | 答谢
109 | 答应
110 | 打千
111 | 大快人心
112 | 大喜过望
113 | 戴
114 | 胆敢
115 | 弹冠相庆
116 | 当真
117 | 当之无愧
118 | 倒向
119 | 道贺
120 | 道谢
121 | 得意
122 | 得意忘形
123 | 点头
124 | 点头称是
125 | 点头哈腰
126 | 电贺
127 | 奠祭
128 | 吊祭
129 | 盯紧
130 | 盯住
131 | 顶礼
132 | 顶礼膜拜
133 | 抖
134 | 睹物思人
135 | 妒
136 | 妒恨
137 | 妒火中烧
138 | 妒嫉
139 | 妒忌
140 | 妒羡
141 | 多留个心眼儿
142 | 堕入爱河
143 | 堕入情网
144 | 额手称庆
145 | 反哺
146 | 放胆
147 | 放在心上
148 | 费心
149 | 封禅
150 | 疯魔
151 | 奉
152 | 奉若神明
153 | 奉迎
154 | 俯允
155 | 甘
156 | 甘心
157 | 甘心情愿
158 | 甘愿
159 | 感
160 | 感恩
161 | 感恩戴德
162 | 感激
163 | 感激不尽
164 | 感激涕零
165 | 感同身受
166 | 感谢
167 | 感兴趣
168 | 敢
169 | 高看
170 | 高山仰止
171 | 高兴
172 | 歌颂
173 | 给 ... 留面子
174 | 给脸
175 | 给面子
176 | 恭而敬之
177 | 恭贺
178 | 恭敬
179 | 恭维
180 | 恭喜
181 | 恭祝
182 | 供奉
183 | 公祭
184 | 拱手
185 | 顾
186 | 顾及
187 | 顾盼自雄
188 | 顾全
189 | 顾惜
190 | 挂牵
191 | 关爱
192 | 关怀
193 | 关怀备至
194 | 关切
195 | 关心
196 | 关照
197 | 关注
198 | 管
199 | 贯注
200 | 鬼迷心窍
201 | 跪拜
202 | 跪叩
203 | 过
204 | 过奖
205 | 过问
206 | 过誉
207 | 哈
208 | 酣畅
209 | 豪情满怀
210 | 好
211 | 好奇
212 | 好情
213 | 喝彩
214 | 合掌
215 | 贺
216 | 狠抓
217 | 恨不得
218 | 恨不能
219 | 横心
220 | 厚望
221 | 怀
222 | 怀恋
223 | 怀念
224 | 怀想
225 | 欢
226 | 欢畅
227 | 欢欢喜喜
228 | 欢快
229 | 欢乐
230 | 欢闹
231 | 欢声雷动
232 | 欢腾
233 | 欢天喜地
234 | 欢慰
235 | 欢喜
236 | 欢欣
237 | 欢欣鼓舞
238 | 欢迎
239 | 欢愉
240 | 欢娱
241 | 欢悦
242 | 欢忭
243 | 还礼
244 | 回敬
245 | 回礼
246 | 魂牵梦系
247 | 魂牵梦萦
248 | 豁朗
249 | 稽首
250 | 极热心
251 | 集中
252 | 集注
253 | 急
254 | 嫉
255 | 嫉妒
256 | 冀
257 | 冀求
258 | 冀望
259 | 祭
260 | 祭拜
261 | 祭奠
262 | 祭扫
263 | 祭祀
264 | 记挂
265 | 忌
266 | 忌妒
267 | 嘉
268 | 嘉奖
269 | 嘉许
270 | 夹道欢迎
271 | 兼顾
272 | 检点
273 | 见爱
274 | 见义勇为
275 | 奖
276 | 奖励
277 | 奖赏
278 | 奖掖
279 | 讲
280 | 讲究
281 | 讲求
282 | 交口称誉
283 | 交口称赞
284 | 叫好
285 | 叫绝
286 | 接受
287 | 皆大欢喜
288 | 尽
289 | 尽孝
290 | 尽忠
291 | 惊喜
292 | 景仰
293 | 敬
294 | 敬爱
295 | 敬奉
296 | 敬服
297 | 敬贺
298 | 敬礼
299 | 敬慕
300 | 敬佩
301 | 敬若神明
302 | 敬畏
303 | 敬仰
304 | 敬重
305 | 敬祝
306 | 竟敢
307 | 鞠躬
308 | 聚焦
309 | 聚精会神
310 | 眷爱
311 | 眷恋
312 | 眷念
313 | 开绿灯
314 | 开心
315 | 看车
316 | 看得起
317 | 看得上
318 | 看得上眼
319 | 看上
320 | 看上眼
321 | 看在
322 | 看中
323 | 看重
324 | 考究
325 | 磕头
326 | 渴慕
327 | 渴念
328 | 渴盼
329 | 渴求
330 | 渴望
331 | 渴想
332 | 肯
333 | 肯定
334 | 肯于
335 | 口角春风
336 | 酷爱
337 | 酷好
338 | 夸
339 | 夸奖
340 | 夸赞
341 | 快
342 | 快活
343 | 快乐
344 | 快慰
345 | 快意
346 | 宽畅
347 | 宽松
348 | 狂喜
349 | 狂想
350 | 来神
351 | 乐
352 | 乐不可支
353 | 乐颠颠
354 | 乐呵呵
355 | 乐乐呵呵
356 | 乐陶陶
357 | 乐意
358 | 乐悠悠
359 | 乐于
360 | 乐滋滋
361 | 理会
362 | 理直气壮
363 | 礼赞
364 | 立项
365 | 力主
366 | 怜爱
367 | 恋
368 | 恋爱
369 | 恋恋不舍
370 | 领情
371 | 留个心眼儿
372 | 留神
373 | 留心
374 | 留意
375 | 论功行赏
376 | 买账
377 | 满
378 | 满怀豪情
379 | 满怀激情
380 | 满面春风
381 | 满心欢喜
382 | 满意
383 | 满足
384 | 眉飞色舞
385 | 美
386 | 美言
387 | 美滋滋
388 | 梦魂萦绕
389 | 梦寐以求
390 | 梦想
391 | 迷
392 | 迷恋
393 | 迷上
394 | 面有喜色
395 | 鸣谢
396 | 谬奖
397 | 膜拜
398 | 默认
399 | 默许
400 | 慕
401 | 慕名
402 | 溺爱
403 | 念
404 | 拍案叫绝
405 | 拍手称快
406 | 拍手叫好
407 | 盼
408 | 盼念
409 | 盼望
410 | 佩
411 | 佩服
412 | 捧场
413 | 批准
414 | 偏爱
415 | 偏宠
416 | 偏好
417 | 偏重
418 | 飘飘然
419 | 飘飘欲仙
420 | 迫切需要
421 | 普天同庆
422 | 期
423 | 期待
424 | 期盼
425 | 期望
426 | 祈盼
427 | 起敬
428 | 企
429 | 企慕
430 | 企盼
431 | 企望
432 | 器重
433 | 牵肠挂肚
434 | 牵挂
435 | 千恩万谢
436 | 敲边鼓
437 | 瞧得起
438 | 瞧得上眼
439 | 翘盼
440 | 翘企
441 | 翘望
442 | 钦
443 | 钦佩
444 | 亲热
445 | 亲热亲热
446 | 轻快
447 | 倾慕
448 | 倾向
449 | 倾心
450 | 情有独钟
451 | 情愿
452 | 庆
453 | 庆贺
454 | 庆幸
455 | 庆祝
456 | 圈定
457 | 饶有兴趣
458 | 热心
459 | 人心大快
460 | 认
461 | 认可
462 | 认了
463 | 认命
464 | 日有所思
465 | 融融
466 | 容
467 | 容许
468 | 如痴如狂
469 | 如痴如醉
470 | 如获至宝
471 | 如意
472 | 如愿以偿
473 | 如醉如痴
474 | 入迷
475 | 入魔
476 | 入神
477 | 赏
478 | 赏识
479 | 赏赉
480 | 尚
481 | 烧高香
482 | 奢望
483 | 申谢
484 | 伸张
485 | 神魂颠倒
486 | 神往
487 | 甚感欢慰
488 | 盛赞
489 | 施礼
490 | 十分满意
491 | 示好
492 | 示同意
493 | 示喜
494 | 释放善意
495 | 手舞足蹈
496 | 首肯
497 | 守候
498 | 守岁
499 | 舒畅
500 | 舒服
501 | 舒坦
502 | 属望
503 | 属意
504 | 树碑立传
505 | 爽
506 | 爽快
507 | 爽心
508 | 爽怡
509 | 说好
510 | 说好话
511 | 说妥
512 | 说项
513 | 思
514 | 思恋
515 | 思慕
516 | 思念
517 | 松心
518 | 颂
519 | 颂扬
520 | 颂赞
521 | 送往迎来
522 | 随心
523 | 遂心
524 | 遂意
525 | 抬爱
526 | 抬举
527 | 贪
528 | 贪恋
529 | 贪图
530 | 叹
531 | 叹服
532 | 叹赏
533 | 叹为观止
534 | 叹羡
535 | 陶然
536 | 陶陶
537 | 陶醉
538 | 特许
539 | 疼
540 | 疼爱
541 | 疼惜
542 | 提倡
543 | 甜丝丝
544 | 甜滋滋
545 | 挑三拣四
546 | 挑眼
547 | 通过
548 | 通融
549 | 同意
550 | 吐口
551 | 吐气扬眉
552 | 推
553 | 推崇
554 | 推戴
555 | 推许
556 | 推重
557 | 推尊
558 | 望
559 | 望眼欲穿
560 | 忘乎所以
561 | 妄想
562 | 维护
563 | 畏
564 | 温存
565 | 问心无愧
566 | 无愧
567 | 嘻嘻哈哈
568 | 稀罕
569 | 希
570 | 希罕
571 | 希冀
572 | 希图
573 | 希望
574 | 惜
575 | 喜
576 | 喜爱
577 | 喜不自禁
578 | 喜不自胜
579 | 喜冲冲
580 | 喜出望外
581 | 喜好
582 | 喜欢
583 | 喜乐
584 | 喜眉笑眼
585 | 喜气洋洋
586 | 喜上眉梢
587 | 喜上心头
588 | 喜兴
589 | 喜形于色
590 | 喜幸
591 | 喜洋洋
592 | 喜吟吟
593 | 喜盈盈
594 | 喜悦
595 | 喜滋滋
596 | 喜孜孜
597 | 显扬
598 | 羡
599 | 羡慕
600 | 相中
601 | 想
602 | 想念
603 | 想望
604 | 向
605 | 向 ... 倾斜
606 | 向往
607 | 向着
608 | 销魂
609 | 消魂
610 | 孝敬
611 | 孝顺
612 | 写意
613 | 谢
614 | 谢天谢地
615 | 谢谢
616 | 欣
617 | 欣赏
618 | 欣慰
619 | 欣喜
620 | 欣喜若狂
621 | 欣羡
622 | 欣幸
623 | 忻
624 | 心驰神往
625 | 心荡神驰
626 | 心甘
627 | 心甘情愿
628 | 心花怒放
629 | 心旷神怡
630 | 心满意足
631 | 心疼
632 | 心向
633 | 心醉
634 | 兴高采烈
635 | 行礼
636 | 需
637 | 需要
638 | 许
639 | 许可
640 | 轩然
641 | 悬红
642 | 悬赏
643 | 眼馋
644 | 眼红
645 | 眼热
646 | 艳羡
647 | 扬眉吐气
648 | 扬扬
649 | 扬扬得意
650 | 扬扬自得
651 | 洋洋得意
652 | 洋洋自得
653 | 仰
654 | 仰慕
655 | 摇头摆尾
656 | 摇头晃脑
657 | 要
658 | 夜有所梦
659 | 一往情深
660 | 揖
661 | 依依不舍
662 | 依允
663 | 以期
664 | 以求
665 | 意欲
666 | 溢美
667 | 引颈企待
668 | 引领
669 | 应
670 | 应承
671 | 应下
672 | 应许
673 | 应允
674 | 应准
675 | 迎
676 | 迎候
677 | 迎接
678 | 迎来
679 | 迎迓
680 | 拥
681 | 拥戴
682 | 拥护
683 | 咏赞
684 | 用
685 | 用心良苦
686 | 有心
687 | 有意
688 | 俞允
689 | 愉
690 | 愉快
691 | 愉悦
692 | 欲
693 | 誉
694 | 愿
695 | 愿意
696 | 跃跃欲试
697 | 悦
698 | 悦服
699 | 允
700 | 允许
701 | 允准
702 | 在乎
703 | 在心
704 | 在意
705 | 赞
706 | 赞成
707 | 赞服
708 | 赞美
709 | 赞慕
710 | 赞佩
711 | 赞赏
712 | 赞颂
713 | 赞叹
714 | 赞同
715 | 赞羡
716 | 赞许
717 | 赞扬
718 | 赞誉
719 | 沾沾自喜
720 | 照准
721 | 折服
722 | 珍
723 | 珍爱
724 | 珍视
725 | 珍惜
726 | 珍重
727 | 正中下怀
728 | 支持
729 | 知冷知热
730 | 知冷着热
731 | 知足
732 | 指靠
733 | 指望
734 | 志愿
735 | 挚爱
736 | 致贺
737 | 致敬
738 | 致谢
739 | 中意
740 | 钟
741 | 钟爱
742 | 钟情
743 | 重
744 | 重视
745 | 重在
746 | 瞩目
747 | 瞩望
748 | 主持
749 | 注
750 | 注意
751 | 注重
752 | 祝
753 | 祝福
754 | 祝贺
755 | 祝颂
756 | 祝愿
757 | 抓
758 | 抓紧
759 | 准
760 | 准许
761 | 准予
762 | 着迷
763 | 着想
764 | 着眼
765 | 着眼于
766 | 自得
767 | 自得其乐
768 | 自告奋勇
769 | 自满
770 | 自鸣得意
771 | 自认
772 | 自愿
773 | 自足
774 | 宗仰
775 | 醉心
776 | 尊
777 | 尊崇
778 | 尊敬
779 | 尊重
780 | 傧
781 | 佥同
782 | 跂望
783 | 讴歌
784 | 谒
785 | 哿
786 | 埽
787 | 萦念
788 | 揄扬
789 | 叩
790 | 叩拜
791 | 叩首
792 | 叩头
793 | 哙
794 | 啧啧称羡
795 | 啧啧称赞
796 | 喁
797 | 嗟
798 | 醊
799 | 徼
800 | 夤
801 | 饫
802 | 廑
803 | 忮
804 | 忭
805 | 忭跃
806 | 怏然自足
807 | 怿
808 | 怡然自得
809 | 恺
810 | 悚
811 | 惬
812 | 惬意
813 | 慊
814 | 憧憬
815 | 迓
816 | 嬖
817 | 绻
818 | 觊
819 | 觊觎
820 | 犒
821 | 犒劳
822 | 犒赏
823 | 胪
824 | 歆
825 | 歆慕
826 | 歆羡
827 | 祀
828 | 祗
829 | 眄
830 | 顒
831 | 锺
832 | 鹄望
833 | 翊戴
834 | 裣衽
835 | 酹
836 | 雩
837 |
--------------------------------------------------------------------------------
/word2vec_test.py:
--------------------------------------------------------------------------------
1 | import gensim
2 | import numpy as np
3 |
4 | word_vectors=gensim.models.KeyedVectors.load_word2vec_format('./tool/zhwiki_2017_03.sg_50d.word2vec',binary=False)
5 | vocab = word_vectors.wv.vocab
6 | print ('搜狗词向量语料加载,成功!')
7 |
8 | '''显示所有词向量,并其存储在变量中'''
9 | wordVectors = {}
10 | wordsList = []
11 | wordIndexVector = []
12 | for word in vocab:
13 | wordVectors[word] = word_vectors[word] # 词语索引词向量(形式:dictionary)
14 | wordsList.append(word) # 数字索引词语(形式:list)
15 | wordIndexVector.append(word_vectors[word]) # 数字索引词向量(形式:list)
16 |
17 |
18 | # 搜索文件,增加原本词向量库中没有的词语的向量和索引
19 | def add_words(file_name):
20 | with open(file_name, "r", encoding='utf-8') as f:
21 | for line in f.readlines():
22 | row_words = line.split()
23 | for word in row_words:
24 | if word not in wordsList:
25 | wordsList.append(word)
26 | wordIndexVector.append(np.random.uniform(-1,1,size=50))
27 |
28 |
29 | file_name_positive = './lib/train_positive_cut.txt'
30 | file_name_negtive = './lib/train_negative_cut.txt'
31 | add_words(file_name_positive)
32 | print ('积极文本词语遍历,成功!')
33 | add_words(file_name_negtive)
34 | print ('消极文本词语遍历,成功!')
35 |
36 |
37 | '''以npy文件格式保存变量,在下一个文件夹lstm中使用以下这两个变量'''
38 | # 以npy文件格式存储变量(变量会以矩阵array形式保存,在下一次加载load该变量时,若是需要其它形式的变量,则需要转换变量形式)
39 | np.save('./lib/wordsList.npy', wordsList) # 保存数字索引词语变量
40 | print ('wordsList.npy保存,成功!')
41 | np.save('./lib/wordIndexVector.npy', wordIndexVector) # 保存数字索引词向量变量
42 | print ('wordIndexVector.npy保存,成功!')
43 |
--------------------------------------------------------------------------------