├── PrefixSpan.py ├── README.md ├── bi_tri_gram.py ├── boost_tree.py ├── feature ├── train.csv ├── train.svm └── valid.svm ├── feature_enti_num.py ├── feature_fresq.py ├── feature_low_fre.py ├── feature_pos.py ├── feature_senti_num.py ├── feature_sentiment.py ├── feature_slen.py ├── import_csv.py ├── lib ├── test.txt ├── train.txt ├── train_Wpos.txt ├── train_cut.txt ├── train_feature_enti_num.txt ├── train_feature_fresq.txt ├── train_feature_pos.txt ├── train_feature_senti_num.txt ├── train_feature_sentiment.txt ├── train_feature_slen.txt ├── train_negative_Wpos.txt ├── train_negative_cut.txt ├── train_negative_pos.txt ├── train_negative_prefixFrequentSub_sup100.txt ├── train_negative_prefixFrequentSub_sup50.txt ├── train_negative_prefixPattern.txt ├── train_negative_trigram.txt ├── train_pos.txt ├── train_positive_Wpos.txt ├── train_positive_cut.txt ├── train_positive_pos.txt ├── train_positive_prefixFrequentSub_sup25.txt ├── train_positive_prefixFrequentSub_sup50.txt ├── train_positive_prefixPattern.txt ├── train_positive_trigram.txt └── train_squence_dict.txt ├── model ├── model.txt └── xgb.dump.raw.txt ├── pretreatment.py ├── sentiment_dic ├── #README.txt ├── degree.txt ├── deny.txt ├── negative_comment.txt ├── negative_sentiment.txt ├── positive_comment.txt └── positive_sentiment.txt └── word2vec_test.py /PrefixSpan.py: -------------------------------------------------------------------------------- 1 | # PrefixSpan 2 | 3 | import sys 4 | import codecs # 写入txt文件 5 | import numpy as np 6 | # sys.setrecursionlimit(1000000) #例如这里设置为一百万 7 | #import pdb 8 | #pdb.set_trace() 9 | 10 | PLACE_HOLDER = '_' 11 | 12 | # 读取txt文件 13 | def read(filename): 14 | S = [] 15 | with open(filename, encoding='utf-8') as input: 16 | for line in input.readlines(): 17 | elements = line.strip('\n').strip(',').split(',') 18 | s = [] 19 | for e in elements: 20 | s.append(e.split()) 21 | S.append(s) 22 | return S 23 | 24 | # 写入txt文件 25 | def write_file(patterns, file_name): 26 | fin = codecs.open(file_name, "w", "UTF-8") 27 | for i in patterns: 28 | fin.write("pattern:" + str(i.squence) + ", support:" + str(i.support)) 29 | fin.write("\n") 30 | fin.close() 31 | 32 | # 写入txt文件 33 | def write_file1(dict, file_name): 34 | fin = codecs.open(file_name, "w", "UTF-8") 35 | for k,v in dict.items(): 36 | fin.write("pattern:" + str(k) + ", dist:" + str(v)) 37 | fin.write("\n") 38 | fin.close() 39 | 40 | # 提取满足要求的频繁子序列Frequent subsequence保存成字典类型的变量,并存储在文件中 41 | def frequent_sub(patterns, file_name): 42 | squence_support_dict = {} 43 | fin = codecs.open(file_name, "w", "UTF-8") 44 | for i in patterns: 45 | if len(i.squence) == 1: 46 | squence_support_dict.update({str(i.squence).replace('[','').replace(']','').replace("'",''):i.support}) 47 | fin.write("pattern:" + str(i.squence).replace('[','').replace(']','').replace("'",'') + ", support:" + str(i.support) + "\n") 48 | fin.close() 49 | return squence_support_dict 50 | 51 | 52 | # 合并3个字典,key的value组成一个列表,第1列是负例的supp100,第1列是负例的supp50,第3列是正例的supp50 53 | def merge_dict(dict1, dict2, dict3, dict4): 54 | dict_hidden = {} #合并后的字典的初始化 55 | dict_hidden.update(dict1) 56 | dict_hidden.update(dict2) 57 | dict_hidden.update(dict3) 58 | dict_hidden.update(dict4) 59 | dictMerge_keyList = list(dict_hidden.keys()) 60 | dict_merge = {}.fromkeys(dictMerge_keyList, [0,0,0,0]) 61 | for k,v in dict1.items(): 62 | dict_merge[k] = list(np.array(dict_merge[k])+np.array([v,0,0,0])) 63 | for k,v in dict2.items(): 64 | dict_merge[k] = list(np.array(dict_merge[k])+np.array([0,v,0,0])) 65 | for k,v in dict3.items(): 66 | dict_merge[k] = list(np.array(dict_merge[k])+np.array([0,0,v,0])) 67 | for k,v in dict4.items(): 68 | dict_merge[k] = list(np.array(dict_merge[k])+np.array([0,0,0,v])) 69 | return dict_merge 70 | 71 | 72 | class SquencePattern: 73 | def __init__(self, squence, support): 74 | self.squence = [] 75 | for s in squence: 76 | self.squence.append(list(s)) 77 | self.support = support 78 | 79 | def append(self, p): 80 | if p.squence[0][0] == PLACE_HOLDER: 81 | first_e = p.squence[0] 82 | first_e.remove(PLACE_HOLDER) 83 | self.squence[-1].extend(first_e) 84 | self.squence.extend(p.squence[1:]) 85 | else: 86 | self.squence.extend(p.squence) 87 | self.support = min(self.support, p.support) 88 | 89 | 90 | def prefixSpan(pattern, S, threshold): 91 | patterns = [] 92 | f_list = frequent_items(S, pattern, threshold) 93 | 94 | for i in f_list: 95 | p = SquencePattern(pattern.squence, pattern.support) 96 | p.append(i) 97 | patterns.append(p) 98 | 99 | 100 | p_S = build_projected_database(S, p) 101 | p_patterns = prefixSpan(p, p_S, threshold) 102 | patterns.extend(p_patterns) 103 | return patterns 104 | 105 | 106 | def frequent_items(S, pattern, threshold): 107 | items = {} 108 | _items = {} 109 | f_list = [] 110 | if S is None or len(S) == 0: 111 | return [] 112 | 113 | if len(pattern.squence) != 0: 114 | last_e = pattern.squence[-1] 115 | else: 116 | last_e = [] 117 | for s in S: 118 | #class 1 119 | is_prefix = True 120 | for item in last_e: 121 | if item not in s[0]: 122 | is_prefix = False 123 | break 124 | if is_prefix and len(last_e) > 0: 125 | index = s[0].index(last_e[-1]) 126 | if index < len(s[0]) - 1: 127 | for item in s[0][index + 1:]: 128 | if item in _items: 129 | _items[item] += 1 130 | else: 131 | _items[item] = 1 132 | 133 | #class 2 134 | if PLACE_HOLDER in s[0]: 135 | for item in s[0][1:]: 136 | if item in _items: 137 | _items[item] += 1 138 | else: 139 | _items[item] = 1 140 | s = s[1:] 141 | 142 | #class 3 143 | counted = [] 144 | for element in s: 145 | for item in element: 146 | if item not in counted: 147 | counted.append(item) 148 | if item in items: 149 | items[item] += 1 150 | else: 151 | items[item] = 1 152 | 153 | f_list.extend([SquencePattern([[PLACE_HOLDER, k]], v) 154 | for k, v in _items.items() 155 | if v >= threshold]) 156 | f_list.extend([SquencePattern([[k]], v) 157 | for k, v in items.items() 158 | if v >= threshold]) 159 | sorted_list = sorted(f_list, key=lambda p: p.support) 160 | return sorted_list 161 | 162 | 163 | 164 | def build_projected_database(S, pattern): 165 | """ 166 | suppose S is projected database base on pattern's prefix, 167 | so we only need to use the last element in pattern to 168 | build projected database 169 | """ 170 | p_S = [] 171 | last_e = pattern.squence[-1] 172 | last_item = last_e[-1] 173 | for s in S: 174 | p_s = [] 175 | for element in s: 176 | is_prefix = False 177 | if PLACE_HOLDER in element: 178 | if last_item in element and len(pattern.squence[-1]) > 1: 179 | is_prefix = True 180 | else: 181 | is_prefix = True 182 | for item in last_e: 183 | if item not in element: 184 | is_prefix = False 185 | break 186 | 187 | if is_prefix: 188 | e_index = s.index(element) 189 | i_index = element.index(last_item) 190 | if i_index == len(element) - 1: 191 | p_s = s[e_index + 1:] 192 | else: 193 | p_s = s[e_index:] 194 | e = element[i_index:] 195 | e[0] = PLACE_HOLDER 196 | p_s[0] = e 197 | break 198 | if len(p_s) != 0: 199 | p_S.append(p_s) 200 | 201 | return p_S 202 | 203 | 204 | def print_patterns(patterns): 205 | for p in patterns: 206 | print("pattern:{0}, support:{1}".format(p.squence, p.support)) 207 | 208 | 209 | if __name__ == "__main__": 210 | S_positive = read("./lib/train_positive_trigram.txt") 211 | patterns_positive = prefixSpan(SquencePattern([], sys.maxsize), S_positive, 50) 212 | # print_patterns(patterns) 显示出所有的频繁项,下面有把频繁项保存在txt文件中 213 | write_file(patterns_positive, "./lib/train_positive_prefixPattern.txt") 214 | squence_support50_dict_positive = frequent_sub(patterns_positive, './lib/train_positive_prefixFrequentSub_sup50.txt') 215 | 216 | patterns_positive = prefixSpan(SquencePattern([], sys.maxsize), S_positive, 25) 217 | squence_support25_dict_positive = frequent_sub(patterns_positive, './lib/train_positive_prefixFrequentSub_sup25.txt') 218 | 219 | S_negative = read("./lib/train_negative_trigram.txt") 220 | # 因为正负数据数量不平衡,所以支持度设置也不一样 221 | patterns_negative = prefixSpan(SquencePattern([], sys.maxsize), S_negative, 100) 222 | write_file(patterns_negative, "./lib/train_negative_prefixPattern.txt") 223 | squence_support100_dict_negative = frequent_sub(patterns_negative, './lib/train_negative_prefixFrequentSub_sup100.txt') 224 | 225 | patterns_negative = prefixSpan(SquencePattern([], sys.maxsize), S_negative, 50) 226 | squence_support50_dict_negative = frequent_sub(patterns_negative, './lib/train_negative_prefixFrequentSub_sup50.txt') 227 | 228 | 229 | # 合并正例和负例的频繁词序列的字典 230 | squence_support_dict = merge_dict(squence_support100_dict_negative, squence_support50_dict_negative, squence_support50_dict_positive, squence_support25_dict_positive) 231 | 232 | squence_support_dist_dict = {} # 计算词典中每个频繁词序列的区分度dist(初始化) 233 | squence_support_dist_dict_filter = {} # 筛选出区分度dist>=0.85的频繁词序列重新组成词典(初始化) 234 | for k,v in squence_support_dict.items(): 235 | if v[1] == 0: # 这里做了一个近似,如果支持度小于50,直接令其支持度为50(负例) 236 | v[1] = 50 237 | if v[3] == 0: # 这里做了一个近似,如果支持度小于25,直接令其支持度为25 238 | v[3] = 25 239 | dist = max(v[1]*0.5,v[3])/(v[1]*0.5+v[3]) # 计算每个频繁词序列的区分度dist(正例) 240 | squence_support_dist_dict.update({k:dist}) 241 | if dist >= 0.85: 242 | squence_support_dist_dict_filter.update({k:dist}) 243 | write_file1(squence_support_dist_dict_filter, "./lib/train_squence_dict.txt") 244 | 245 | 246 | 247 | 248 | 249 | 250 | 251 | 252 | 253 | -------------------------------------------------------------------------------- /README.md: -------------------------------------------------------------------------------- 1 | # TextClassification-MeiTuan-FeatureExtraction-Classifier 2 | 3 | 这里是利用python3.6进行“特征提取+分类器”来实现美团评论的文本二分类问题。在特征提取部分提取了6种特征,分类器选择了python里面的包xgboost和lightGBM分别实现提升树和GBDT(梯度提升决策树)。现在,最终的结果(准确率和AUC)不是特别好,希望通过调节分类器模型和参数最终可以有一个比较好的结果。 4 | 5 | 6 | 其中:
7 | * (1)-(5):数据预处理
8 | * (6)-(12):一层、两层以及双向lstm模型
9 | * (13):分类器
10 | * (14):feature文件夹下的数据文件介绍
11 | * (15):lib文件夹下的数据文件介绍
12 | * (16):model文件夹下的数据文件介绍
13 | * (17):sentiment_dic文件夹下的数据文件介绍
14 | * (18):tool文件夹下的数据文件介绍
15 | 16 | **** 17 | 18 | |Author|manderous| 19 | |---|---| 20 | |E-mail|manderous@foxmail.com| 21 | 22 | **** 23 | 24 | ## 目录 25 | * [数据预处理](#数据预处理) 26 | * (1)pretreatment.py 27 | * (2)bi_tri_gram.py 28 | * (3)word2vec_test.py 29 | * (4)zhwiki_2017_03.sg_50d.word2vec 30 | * (5)PrefixSpan.py 31 | * [特征提取](#特征提取) 32 | * (6)feature_pos.py 33 | * (7)feature_fresq.py 34 | * (8)feature_sentiment.py 35 | * (9)feature_slen.py 36 | * (10)feature_senti_num.py 37 | * (11)feature_enti_num.py 38 | * (12)import_csv.py 39 | * [分类器](#分类器) 40 | * (13)boost_tree.py 41 | * [(14)feature文件夹下的数据文件介绍](#feature文件夹下的数据文件介绍) 42 | * [(15)lib文件夹下的数据文件介绍](#lib文件夹下的数据文件介绍) 43 | * [(16)model文件夹下的数据文件介绍](#model文件夹下的数据文件介绍) 44 | * [(17)sentiment_dic文件夹下的数据文件介绍](#sentiment_dic文件夹下的数据文件介绍) 45 | * [(18)tool文件夹下的数据文件介绍](#tool文件夹下的数据文件介绍) 46 | 47 | **** 48 | 49 | ## 数据预处理 50 | ### pretreatment.py 51 | #### 分词、词性标注、正负文本的划分、训练集测试集的划分(python文件) 52 | 输入:
53 | ``` 54 | ./lib/train.txt:训练集
55 | ./lib/test.txt:测试集
56 | ``` 57 | 输出:
58 | ``` 59 | ./lib/train_positive_cut.txt:训练集,正标签,的分词结果
60 | ./lib/train_positive_pos.txt:训练集,正标签,的词性标注结果
61 | ./lib/train_positive_Wpos.txt:训练集,正标签,的分词和词性标注结果
62 |
63 | ./lib/train_negative_cut.txt:训练集,负标签,的分词结果
64 | ./lib/train_negative_pos.txt:训练集,负标签,的词性标注结果
65 | ./lib/train_negative_Wpos.txt:训练集,负标签,的分词和词性标注结果
66 |
67 | ./lib/train_cut.txt:训练集,的分词结果
68 | ./lib/train_pos.txt':训练集,的词性标注结果
69 | ./lib/train_Wpos.txt:训练集,的分词和词性标注结果
70 | ``` 71 | 72 | ### (2)bi_tri_gram.py 73 | #### 生成bi-gram、tri-gram(python文件) 74 | 输入:
75 | ``` 76 | ./lib/train_positive_cut.txt:训练集,正标签,的分词结果
77 | ./lib/train_negative_cut.txt:训练集,负标签,的分词结果
78 | ``` 79 | 输出:
80 | ``` 81 | ./lib/train_positive_trigram.txt:训练集,正标签,的tri-gram结果
82 | ./lib/train_negative_trigram.txt:训练集,负标签,的tri-gram结果
83 | ``` 84 | 85 | ### (3)word2vec_test.py 86 | #### 导入搜狗词向量语料加载,将积极文本和消极文本的词语生成词向量,保存至文本文件中(python文件) 87 | 输入:
88 | ``` 89 | ./lib/train_positive_cut.txt:训练集,正标签,的分词结果
90 | ./lib/train_negative_cut.txt:训练集,负标签,的分词结果
91 | ``` 92 | 输出:
93 | ``` 94 | ./lib/wordsList.npy:数字索引词语变量
95 | ./lib/wordIndexVector.npy:数字索引词向量变量
96 | ``` 97 | 98 | ### (4)./tool/zhwiki_2017_03.sg_50d.word2vec 99 | #### 搜狗词向量语料(word2vec文件) 100 | 百度云资源:https://pan.baidu.com/s/1C94HXCCWOmX-W4IbajXFyA 101 | 102 | ### (5)PrefixSpan.py 103 | #### 导入搜狗词向量语料加载,将积极文本和消极文本的词语生成词向量,保存至文本文件中(python文件) 104 | 输入:
105 | ``` 106 | ./lib/train_positive_trigram.txt:训练集,正标签,的tri-gram结果
107 | ./lib/train_negative_trigram.txt:训练集,负标签,的tri-gram结果
108 | ``` 109 | 输出:
110 | ``` 111 | ./lib/train_positive_prefixPattern.txt:训练集,正标签,的所以频繁项(支持度50)
112 | ./lib/train_positive_prefixFrequentSub_sup50.txt:训练集,正标签,的所以频繁项(做了一些处理,比如删除中括号,只保留在train_positive_prefixPattern.txt中第一个中括号里面的频繁词序列)(支持度50)
113 | ./lib/train_positive_prefixFrequentSub_sup25.txt:训练集,正标签,的所以频繁项(做了一些处理,比如删除中括号,只保留在train_positive_prefixPattern.txt中第一个中括号里面的频繁词序列)(支持度25)
114 |
115 | ./lib/train_negative_prefixPattern.txt:训练集,负标签,的所以频繁项(支持度100)
116 | ./lib/train_negative_prefixFrequentSub_sup100.txt:训练集,负标签,的所以频繁项(做了一些处理,比如删除中括号,只保留在train_positive_prefixPattern.txt中第一个中括号里面的频繁词序列)(支持度100)
117 | ./lib/train_negative_prefixFrequentSub_sup50.txt:训练集,负标签,的所以频繁项(做了一些处理,比如删除中括号,只保留在train_positive_prefixPattern.txt中第一个中括号里面的频繁词序列)(支持度50)
118 |
119 | ./lib/train_squence_dict.txt:最终得到的训练集的频繁词序列!!!以及对应的区分度dist(这里最终选出的频繁词序列要求支持度dist>=0.85)
120 | ``` 121 | 122 | **** 123 | 124 | ## 特征提取 125 | ### (6)feature_pos.py 126 | #### 词性组合模式的特征(python文件) 127 | jieba词性对照表: 128 | 参考网址: 129 | * 1 jieba分词中所有词性对应字母(词性列表及符号表示) 130 | https://blog.csdn.net/a2099948768/article/details/82216906 131 | * 2 jieba中文分词词性/解释对照表 132 | http://www.niumou.com.cn/183 133 | * 3 重要词性对照: 134 | n/n开头的:名词 ng nl nr ns nt nz
135 | v/v开头的:动词 vd vf vg vi vl vn vs vx vy
136 | a/a开头的:形容词 ad ag al an
137 | zg(部分是副词)/d:副词
138 | uj:助词“的”
139 | * 4 根据佳峰师兄的论文中的词性组合 140 | a + a:1
141 | a + n:2
142 | a + uj + n:3
143 | d/zg + a:4
144 | d/zg + v:5
145 | d + d/zg + a:6
146 | n + a:7
147 | 其它:0
148 | 输入:
149 | ``` 150 | ./lib/train_pos.txt:训练集,的词性标注结果
151 | ``` 152 | 输出:
153 | ``` 154 | ./lib/train_feature_pos.txt:训练集,词性组合模式的特征
155 | ``` 156 | 157 | ### (7)feature_fresq.py 158 | #### 频繁词序列模式的特征(python文件) 159 | 根据PrefixSpan.py文件提取出来的,输出字典变量:squence_support_dist_dict_filter,或者输出文件:train_data_squence_dict.txt
160 | 一如既往 的 好:1
161 | 不错:2
162 | 不错 的:3
163 | 古色古香:4
164 | 味道 不错:5
165 | 很 不错:6
166 | 很 好:7
167 | 很 新鲜:8
168 | 得 恰到好处:9
169 | 恰到好处:10
170 | 新鲜:11
171 | 最:12
172 | 服务:13
173 | 服务态度:14
174 | 烤:15
175 | 的 恰到好处:16
176 | 还:17
177 | 还不错:18
178 | 其它:0
179 | 输入:
180 | ``` 181 | ./lib/train_cut.txt:训练集,的分词结果
182 | ``` 183 | 输出:
184 | ``` 185 | ./lib/train_feature_fresq.txt:训练集,频繁词序列模式的特征
186 | ``` 187 | 188 | ### (8)feature_sentiment.py 189 | #### 情感的特征(基于情感词典的情感分类)(python文件) 190 | 情感得分
191 | 积极:2
192 | 消极:1
193 | 中性:0
194 | 输入:
195 | ``` 196 | ./lib/train_cut.txt:训练集,的分词结果
197 | ./sentiment_dic/deny.txt:否定词典
198 | ./sentiment_dic/positive_sentiment.txt:正面情感词语
199 | ./sentiment_dic/positive_comment.txt:正面评价词语
200 | ./sentiment_dic/negative_sentiment.txt:负面情感词语
201 | ./sentiment_dic/negative_comment.txt:负面评价词语
202 | ./sentiment_dic/degree.txt:程度级别词语(有extreme、very、more、ish、insufficiently、over六个程度等级)
203 | ``` 204 | 输出:
205 | ``` 206 | ./lib/train_feature_sentiment.txt:训练集,情感模式的特征
207 | ``` 208 | 209 | ### (9)feature_slen.py 210 | #### 句子长度的特征(python文件) 211 | 输入:
212 | ``` 213 | ./lib/train_cut.txt:训练集,的分词结果
214 | ``` 215 | 输出:
216 | ``` 217 | ./lib/train_feature_slen.txt:训练集,句子长度的特征
218 | ``` 219 | 220 | ### (10)feature_senti_num.py 221 | #### 情感词的个数(python文件) 222 | 输入:
223 | ``` 224 | ./lib/train_cut.txt:训练集,的分词结果
225 | ./sentiment_dic/positive_sentiment.txt:正面情感词语
226 | ./sentiment_dic/positive_comment.txt:正面评价词语
227 | ./sentiment_dic/negative_sentiment.txt:负面情感词语
228 | ./sentiment_dic/negative_comment.txt:负面评价词语
229 | ``` 230 | 输出:
231 | ``` 232 | ./lib/train_feature_senti_num.txt:训练集,情感次个数的特征
233 | ``` 234 | 235 | ### (11)feature_enti_num.py 236 | #### 实体的个数(python文件) 237 | 在这里,我认为所有的名词都是实体,也就是在jieba词性标注中,被标注为n, ng, nl, nr, ns, nt, nz的词语。 238 | 输入:
239 | ``` 240 | ./lib/train_pos.txt':训练集,的词性标注结果
241 | ``` 242 | 输出:
243 | ``` 244 | ./lib/train_feature_enti_num.txt:训练集,情感次个数的特征
245 | ``` 246 | 247 | ### (12)import_csv.py 248 | #### 将文本所有的特征导出在一个csv文件中(python文件) 249 | 输入:
250 | ``` 251 | ./lib/train.txt:训练集
252 | ./lib/train_feature_pos.txt:训练集,词性组合模式的特征
253 | ./lib/train_feature_fresq.txt:训练集,频繁词序列模式的特征
254 | ./lib/train_feature_sentiment.txt:训练集,情感模式的特征
255 | ./lib/train_feature_slen.txt:训练集,句子长度的特征
256 | ``` 257 | 输出:
258 | ``` 259 | ./feature/train.csv:训练集,所有的特征(特征空间)
260 | ``` 261 | 262 | **** 263 | 264 | ## 分类器 265 | ### (13)boost_tree.py 266 | #### 利用XGBoost和LightGBM对评论进行分类(python文件) 267 | 最后还会显示出XGBoost和LightGBM的损失值。
268 | 输入:
269 | ``` 270 | ./feature/train.csv:训练集,所有的特征(特征空间)
271 | ``` 272 | 输出:
273 | ``` 274 | ./feature/train.svm:训练集(原训练集的80%),表示成稀疏矩阵的形式
275 | ./feature/valid.svm:验证集(原训练集的20%),表示成稀疏矩阵的形式
276 | ./model/model.txt:XGBoost训练出来的模型的可视化
277 | ./model/xgb.dump.raw.txt:LightGBM训练出来的模型的可视化
278 | ``` 279 | 280 | **** 281 | 282 | ### feature文件夹下的数据文件介绍 283 | * 1 train.csv:训练集,所有的特征(特征空间)(import_csv.py生成的 csv文件) 284 | * 2 train.svm:训练集(原训练集的80%),表示成稀疏矩阵的形式(boost_tree.py生成的 svm文件) 285 | * 3 valid.svm:验证集(原训练集的20%),表示成稀疏矩阵的形式(boost_tree.py生成的 svm文件) 286 | 287 | **** 288 | 289 | ### lib文件夹下的数据文件介绍 290 | * 1 train_positive_cut.txt:训练集,正标签,的分词结果(pretreatment.py生成的 txt文件) 291 | * 2 train_positive_pos.txt:训练集,正标签,的词性标注结果(pretreatment.py生成的 txt文件) 292 | * 3 train_positive_Wpos.txt:训练集,正标签,的分词和词性标注结果(pretreatment.py生成的 txt文件) 293 | * 4 train_negative_cut.txt:训练集,负标签,的分词结果(pretreatment.py生成的 txt文件) 294 | * 5 train_negative_pos.txt:训练集,负标签,的词性标注结果(pretreatment.py生成的 txt文件) 295 | * 6 train_negative_Wpos.txt:训练集,负标签,的分词和词性标注结果(pretreatment.py生成的 txt文件) 296 | * 7 train_cut.txt:训练集,的分词结果(pretreatment.py生成的 txt文件) 297 | * 8 train_pos.txt':训练集,的词性标注结果(pretreatment.py生成的 txt文件) 298 | * 9 train_Wpos.txt:训练集,的分词和词性标注结果(pretreatment.py生成的 txt文件) 299 | 300 | * 10 train_positive_trigram.txt:训练集,正标签,的tri-gram结果(bi_tri_gram.py生成的 txt文件) 301 | * 11 train_negative_trigram.txt:训练集,负标签,的tri-gram结果(bi_tri_gram.py生成的 txt文件) 302 | 303 | * 12 wordsList.npy:数字索引词语变量(word2vec_test.py生成的 npy文件) 304 | * 13 wordIndexVector.npy:数字索引词向量变量(word2vec_test.py生成的 npy文件) 305 | 306 | * 14 train_positive_prefixPattern.txt:训练集,正标签,的所以频繁项(支持度50)(PrefixSpan.py生成的 txt文件) 307 | * 15 train_positive_prefixFrequentSub_sup50.txt:训练集,正标签,的所以频繁项(做了一些处理,比如删除中括号,只保留在train_positive_prefixPattern.txt中第一个中括号里面的频繁词序列)(支持度50)(PrefixSpan.py生成的 txt文件) 308 | * 16 train_positive_prefixFrequentSub_sup25.txt:训练集,正标签,的所以频繁项(做了一些处理,比如删除中括号,只保留在train_positive_prefixPattern.txt中第一个中括号里面的频繁词序列)(支持度25)(PrefixSpan.py生成的 txt文件) 309 | 310 | * 17 train_negative_prefixPattern.txt:训练集,负标签,的所以频繁项(支持度100)(PrefixSpan.py生成的 txt文件) 311 | * 18 train_negative_prefixFrequentSub_sup100.txt:训练集,负标签,的所以频繁项(做了一些处理,比如删除中括号,只保留在train_positive_prefixPattern.txt中第一个中括号里面的频繁词序列)(支持度100)(PrefixSpan.py生成的 txt文件) 312 | * 19 train_negative_prefixFrequentSub_sup50.txt:训练集,负标签,的所以频繁项(做了一些处理,比如删除中括号,只保留在train_positive_prefixPattern.txt中第一个中括号里面的频繁词序列)(支持度50)(PrefixSpan.py生成的 txt文件) 313 | 314 | * 20 train_squence_dict.txt:最终得到的训练集的频繁词序列!!!以及对应的区分度dist(这里最终选出的频繁词序列要求支持度dist>=0.85)(PrefixSpan.py生成的 txt文件) 315 | 316 | **** 317 | 318 | ### model文件夹下的数据文件介绍 319 | * 1 model.txt:XGBoost训练出来的模型的可视化(boost_tree.py生成的 txt文件) 320 | * 2 xgb.dump.raw.txt:LightGBM训练出来的模型的可视化(boost_tree.py生成的 txt文件) 321 | 322 | **** 323 | 324 | ### sentiment_dic文件夹下的数据文件介绍 325 | * 1 degree.txt:程度级别词语(中文)(txt文件) 326 | * 2 deny.txt:自己上网搜集的否定词典(txt文件) 327 | * 3 negative_comment.txt:负面评价词语(中文)(txt文件) 328 | * 4 negative_sentiment.txt:负面情感词语(中文)(txt文件) 329 | * 5 positive_comment.txt:正面评价词语(中文)(txt文件) 330 | * 6 positive_sentiment.txt:正面情感词语(中文)(txt文件) 331 | 332 | **** 333 | 334 | ### tool文件夹下的数据文件介绍 335 | 因为tool文件夹中的这个文件需要在百度云中下载,所以在我的github项目里面没有这个文件夹。 336 | * 1 zhwiki_2017_03.sg_50d.word2vec:搜狗词向量语料(word2vec文件) 337 | 338 | ### (end) 339 | -------------------------------------------------------------------------------- /bi_tri_gram.py: -------------------------------------------------------------------------------- 1 | from nltk.util import ngrams 2 | import codecs # 写入txt文件 3 | 4 | # 读取txt文件 5 | def load_file(file_name): 6 | data = [] 7 | with open(file_name, encoding='utf-8') as fin: 8 | for line in fin: 9 | line = line.strip().split() 10 | data.append(line) 11 | return data 12 | 13 | # 写入txt文件 14 | def write_file(data, file_name): 15 | fin = codecs.open(file_name, "w", "UTF-8") 16 | for i in range(len(data)): 17 | for j in range(len(data[i])): 18 | for k in range(len(data[i][j])): 19 | fin.write(str(data[i][j][k])+" ") 20 | fin.write(",") 21 | fin.write("\n") 22 | fin.close() 23 | 24 | 25 | # 生成bigram 26 | def bi_gram(data): 27 | data_bi_gram = [] 28 | for i in range(len(data)): 29 | data_bi_gram.append([]) 30 | data_bigram = ngrams(data[i],2) 31 | for i in data_bigram: 32 | data_bi_gram[-1].append(list(i)) 33 | return data_bi_gram 34 | 35 | 36 | # 生成trigram 37 | def tri_gram(data): 38 | data_tri_gram = [] 39 | for i in range(len(data)): 40 | data_tri_gram.append([]) 41 | if len(data[i]) > 2: 42 | data_trigram = ngrams(data[i],3) 43 | else: 44 | data_trigram = ngrams(data[i],2) 45 | for i in data_trigram: 46 | data_tri_gram[-1].append(list(i)) 47 | return data_tri_gram 48 | 49 | 50 | # 生成bigram,trigram 51 | def bi_tri_gram(data): 52 | data_bi_tri_gram = [] 53 | for i in range(len(data)): 54 | data_bi_tri_gram.append([]) 55 | data_bigram = ngrams(data[i],2) 56 | data_tringram = ngrams(data[i],3) 57 | for i in data_bigram: 58 | data_bi_tri_gram[-1].append(list(i)) 59 | for i in data_tringram: 60 | data_bi_tri_gram[-1].append(list(i)) 61 | return data_bi_tri_gram 62 | 63 | 64 | # 加载正、负文本的分词文件 65 | train_data_positive_cut = load_file('./lib/train_positive_cut.txt') 66 | train_data_negative_cut = load_file('./lib/train_negative_cut.txt') 67 | 68 | # 调用函数,生成文本的bigram、trigram 69 | # train_data_positive_bigram = bi_gram(train_data_positive_cut) 70 | # train_data_positive_bi_trigram = bi_tri_gram(train_data_positive_cut) 71 | train_data_positive_trigram = tri_gram(train_data_positive_cut) 72 | train_data_negative_trigram = tri_gram(train_data_negative_cut) 73 | 74 | # 将生成的bigram、trigram写入txt文件 75 | # write_file(train_data_positive_bigram, './lib/train_data_positive_bigram.txt') 76 | # write_file(train_data_positive_bi_trigram, './lib/train_data_positive_bi_trigram.txt') 77 | write_file(train_data_positive_trigram, './lib/train_positive_trigram.txt') 78 | write_file(train_data_negative_trigram, './lib/train_negative_trigram.txt') 79 | 80 | 81 | 82 | 83 | -------------------------------------------------------------------------------- /boost_tree.py: -------------------------------------------------------------------------------- 1 | import numpy as np 2 | import xgboost as xgb 3 | import lightgbm as lgb 4 | 5 | ''' 6 | 0: 'Sentence', (text) 7 | 1: 'feature_enti_num', (num) 8 | 2: 'feature_fresq', (set) 9 | 3: 'feature_pos', (set) 10 | 4: 'feature_senti_num', (num) 11 | 5: 'feature_sentiment', (cat) 12 | 6: 'feature_slen', (num) 13 | ''' 14 | CAT_FEAT = [5] 15 | NUM_FEAT = [1, 4, 6] 16 | SET_FEAT = [2, 3] 17 | 18 | FEAT_TYPE = {0: 'text', 1: 'num', 2: 'set', 3: 'set', 4: 'num', 5: 'cat', 6: 'num'} 19 | 20 | 21 | # parse a string into fields, skip quotations 22 | def parse_feat(line): 23 | quota = False 24 | j = 0 25 | feats = [] 26 | for i in range(len(line)): 27 | if line[i] == '\"': 28 | quota = not quota 29 | if line[i] == ',' and not quota: 30 | feat = line[j:i] 31 | feats.append(feat) 32 | j = i+1 33 | return feats + [line[j:]] 34 | 35 | 36 | # load a csv file, use parse_feat() to convert format 37 | def load_file(file_name): 38 | data = [] 39 | with open(file_name, 'r') as fin: 40 | print('field_names:', fin.readline().strip().split(',')) 41 | for line in fin: 42 | line = line.strip() 43 | data.append(parse_feat(line)) 44 | return np.array(data) 45 | 46 | def get_feat_name(field, feat_val): 47 | assert field != 'text' 48 | if FEAT_TYPE[field] == 'cat': 49 | return str(field) + ':' + feat_val 50 | elif FEAT_TYPE[field] == 'num': 51 | return str(field) + ':' 52 | elif FEAT_TYPE[field] == 'set': 53 | return [str(field) + ':' + fv for fv in feat_val.split()] 54 | 55 | def build_feat_map(data): 56 | feat_map = {} 57 | for i in range(len(FEAT_TYPE)): 58 | if FEAT_TYPE[i] == 'num': 59 | fn = get_feat_name(i, None) 60 | if fn not in feat_map: 61 | feat_map[fn] = len(feat_map) 62 | continue 63 | elif FEAT_TYPE[i] == 'text': 64 | continue 65 | 66 | feat = data[:, i] 67 | for f in feat: 68 | if FEAT_TYPE[i] == 'cat': 69 | fn = get_feat_name(i, f) 70 | if fn not in feat_map: 71 | feat_map[fn] = len(feat_map) 72 | elif FEAT_TYPE[i] == 'set': 73 | for fn in get_feat_name(i, f): 74 | if fn not in feat_map: 75 | feat_map[fn] = len(feat_map) 76 | return feat_map 77 | 78 | def to_float(x): 79 | if len(x): 80 | return float(x) 81 | return -1 82 | 83 | def get_feat_id_val(field, feat_val): 84 | assert field != 'text' 85 | feat_name = get_feat_name(field, feat_val) 86 | if FEAT_TYPE[field] == 'cat': 87 | return feat_map[feat_name], 1 88 | elif FEAT_TYPE[field] == 'num': 89 | return feat_map[feat_name], to_float(feat_val) 90 | elif FEAT_TYPE[field] == 'set': 91 | return [feat_map[fn] for fn in feat_name], [1] * len(feat_name) 92 | 93 | def to_libsvm(data): 94 | libsvm_data = [] 95 | for d in data: 96 | libsvm_data.append([]) 97 | for i in range(len(FEAT_TYPE)): 98 | if FEAT_TYPE[i] == 'cat' or FEAT_TYPE[i] == 'num': 99 | fv = get_feat_id_val(i, d[i]) 100 | libsvm_data[-1].append(fv) 101 | elif FEAT_TYPE[i] == 'set': 102 | fvs = get_feat_id_val(i, d[i]) 103 | for fv in zip(*fvs): 104 | libsvm_data[-1].append(fv) 105 | return libsvm_data 106 | 107 | 108 | train_data = load_file('./feature/train.csv') 109 | # test_data = load_file('./feature/test.csv') 110 | 111 | train_id, train_label, train_feat = train_data[:, 0], train_data[:, 1], train_data[:, 2:] 112 | # test_id, test_feat = test_data[:, 0], test_data[:, 1:] 113 | 114 | print('train_feat:\n', train_feat[0]) 115 | # print('test_feat:\n', test_feat[0]) 116 | 117 | train_feat[:, 0] = None 118 | # test_feat[:, [1, 6]] = None 119 | 120 | print('train_feat:\n', train_feat[0]) 121 | # print('test_feat:\n', test_feat[0]) 122 | 123 | feat_map = build_feat_map(train_feat) 124 | # feat_map = build_feat_map(np.vstack([train_feat, test_feat])) 125 | 126 | train_data = to_libsvm(train_feat) 127 | # test_data = to_libsvm(test_feat) 128 | 129 | np.random.seed(123) 130 | rnd = np.random.random(len(train_data)) 131 | train_ind = np.where(rnd < 0.8)[0] 132 | valid_ind = np.where(rnd >= 0.8)[0] 133 | 134 | MAX_FEAT = ' %d:0\n' % len(feat_map) 135 | 136 | flag = True 137 | with open('./feature/train.svm', 'w') as fout: 138 | for i in train_ind: 139 | line = train_label[i] 140 | for fv in train_data[i]: 141 | line += ' {}:{}'.format(*fv) 142 | if flag: 143 | line += MAX_FEAT 144 | flag = False 145 | else: 146 | line += '\n' 147 | fout.write(line) 148 | 149 | flag = True 150 | with open('./feature/valid.svm', 'w') as fout: 151 | for i in valid_ind: 152 | line = train_label[i] 153 | for fv in train_data[i]: 154 | line += ' {}:{}'.format(*fv) 155 | if flag: 156 | line += MAX_FEAT 157 | flag = False 158 | else: 159 | line += '\n' 160 | fout.write(line) 161 | 162 | 163 | dtrain = xgb.DMatrix('./feature/train.svm') 164 | dtest = xgb.DMatrix('./feature/valid.svm') 165 | param = { 166 | # learner params 167 | 'booster': 'gbtree', # gbtree ot gblinear 168 | 'nthread': 1, 169 | 'silent':1, 170 | # tree params 171 | 'eta':1, 172 | 'gamma': 0, 173 | 'max_depth':4, 174 | 'subsample': 1, 175 | 'lambda': 1, 176 | 'alpha': 0, 177 | # learning params 178 | 'objective':'binary:logistic', 179 | 'eval_metric': 'error', } 180 | evallist = [(dtrain, 'train'), (dtest, 'eval')] 181 | num_round = 50 182 | bst = xgb.train(param, dtrain, num_round, evallist, early_stopping_rounds=5) 183 | # bst.save_model('./model/xgb.model') 184 | bst.dump_model('./model/xgb.dump.raw.txt') 185 | # bst = xgb.Booster({'nthread': 4}) # init model 186 | # bst.load_model('xgb.model') # load data 187 | 188 | 189 | 190 | dtrain = lgb.Dataset('./feature/train.svm') 191 | dtest = lgb.Dataset('./feature/valid.svm') 192 | param = { 193 | 'objective':'binary', 194 | 'boosting': 'gbdt', 195 | 'num_threads': 1, 196 | 'learning_rate': 1, 197 | 'num_leaves': 31, 198 | 'max_depth': 9, 199 | 'metric': 'binary_error', 200 | 'lambda_l1': 0, 201 | 'lambda_l2': 0, 202 | } 203 | 204 | num_round = 100 205 | bst = lgb.train(param, dtrain, num_round, valid_sets=[dtest], early_stopping_rounds=5) 206 | 207 | bst.save_model('./model/model.txt') 208 | # json_model = bst.dump_model() 209 | # bst = lgb.Booster(model_file='model.txt') -------------------------------------------------------------------------------- /feature_enti_num.py: -------------------------------------------------------------------------------- 1 | import matplotlib.pyplot as plt 2 | import codecs # 写入txt文件 3 | 4 | ''' 5 | import nltk 6 | tokens = nltk.word_tokenize(train_data) #分词 7 | tagged = nltk.pos_tag(tokens) #词性标注 8 | entities = nltk.chunk.ne_chunk(tagged) #命名实体识别 9 | ''' 10 | 11 | 12 | # 读取txt文件 13 | def load_file(file_name): 14 | data = [] # 保存数据 15 | with open(file_name, encoding='utf-8') as fin: 16 | for line in fin: 17 | line = line.strip().split() 18 | data.append(line) 19 | return data 20 | 21 | # 写入txt文件 22 | def write_file(data, file_name): 23 | fin = codecs.open(file_name, "w", "UTF-8") 24 | for i in range(len(data)): 25 | fin.write(str(data[i])+"\n") 26 | fin.close() 27 | 28 | # 画出特征的直方图分布 29 | def figure_attribution(pos_label, label_num): 30 | plt.hist(pos_label, label_num) 31 | plt.xlabel('pos_label') 32 | plt.ylabel('pos_label_num') 33 | # plt.axis([0, 24, 0, 1000]) # 限定坐标的范围 34 | plt.show() 35 | 36 | 37 | # 导入训练集的词性文本 38 | pos = load_file('./lib/train_pos.txt') 39 | 40 | # 统计每句话中的名词(在这里,我认为名词就是实体) 41 | enti_num = [] 42 | for i in range(len(pos)): 43 | num = 0 # 初始化每句话的名词个数 44 | for j in range(len(pos[i])): 45 | spos = pos[i][j] 46 | if spos == 'n': 47 | num += 1 48 | elif spos == 'ng': 49 | num += 1 50 | elif spos == 'nl': 51 | num += 1 52 | elif spos == 'nr': 53 | num += 1 54 | elif spos == 'ns': 55 | num += 1 56 | elif spos == 'nt': 57 | num += 1 58 | elif spos == 'nz': 59 | num += 1 60 | enti_num.append(num) 61 | 62 | # 情感词个数的结果写入文件 63 | write_file(enti_num, './lib/train_feature_enti_num.txt') 64 | 65 | # 画出特征的直方图分布 66 | figure_attribution(enti_num, max(enti_num)) -------------------------------------------------------------------------------- /feature_fresq.py: -------------------------------------------------------------------------------- 1 | import matplotlib.pyplot as plt 2 | import codecs # 写入txt文件 3 | 4 | # 读取txt文件 5 | def load_file(file_name): 6 | data = [] # 保存数据 7 | with open(file_name, encoding='utf-8') as fin: 8 | for line in fin: 9 | line = line.strip().split() 10 | data.append(line) 11 | return data 12 | 13 | # 写入txt文件 14 | def write_file(data, file_name): 15 | fin = codecs.open(file_name, "w", "UTF-8") 16 | for i in range(len(data)): 17 | for j in range(len(data[i])): 18 | fin.write(str(data[i][j])+" ") 19 | fin.write("\n") 20 | fin.close() 21 | 22 | # 构造了7个特征对应的函数 23 | def feature_pos1(cut_row, cut_len, cut_label): 24 | for i in range(cut_len): 25 | if cut_row[i] == '一如既往': 26 | if i+1 < cut_len and cut_row[i+1] == '的': 27 | if i+2 < cut_len and cut_row[i+2] == '好': 28 | cut_label[-1].append(1) 29 | 30 | 31 | def feature_pos2(cut_row, cut_len, cut_label): 32 | for i in range(cut_len): 33 | if cut_row[i] == '不错': 34 | cut_label[-1].append(2) 35 | 36 | def feature_pos3(cut_row, cut_len, cut_label): 37 | for i in range(cut_len): 38 | if cut_row[i] == '不错': 39 | if i+1 < cut_len and cut_row[i+1] == '的': 40 | cut_label[-1].append(3) 41 | 42 | def feature_pos4(cut_row, cut_len, cut_label): 43 | for i in range(cut_len): 44 | if cut_row[i] == '古色古香': 45 | cut_label[-1].append(4) 46 | 47 | def feature_pos5(cut_row, cut_len, cut_label): 48 | for i in range(cut_len): 49 | if cut_row[i] == '味道': 50 | if i+1 < cut_len and cut_row[i+1] == '不错': 51 | cut_label[-1].append(5) 52 | 53 | def feature_pos6(cut_row, cut_len, cut_label): 54 | for i in range(cut_len): 55 | if cut_row[i] == '很': 56 | if i+1 < cut_len and cut_row[i+1] == '不错': 57 | cut_label[-1].append(6) 58 | 59 | def feature_pos7(cut_row, cut_len, cut_label): 60 | for i in range(cut_len): 61 | if cut_row[i] == '很': 62 | if i+1 < cut_len and cut_row[i+1] == '好': 63 | cut_label[-1].append(7) 64 | 65 | def feature_pos8(cut_row, cut_len, cut_label): 66 | for i in range(cut_len): 67 | if cut_row[i] == '很': 68 | if i+1 < cut_len and cut_row[i+1] == '新鲜': 69 | cut_label[-1].append(8) 70 | 71 | def feature_pos9(cut_row, cut_len, cut_label): 72 | for i in range(cut_len): 73 | if cut_row[i] == '得': 74 | if i+1 < cut_len and cut_row[i+1] == '恰到好处': 75 | cut_label[-1].append(9) 76 | 77 | def feature_pos10(cut_row, cut_len, cut_label): 78 | for i in range(cut_len): 79 | if cut_row[i] == '恰到好处': 80 | cut_label[-1].append(10) 81 | 82 | def feature_pos11(cut_row, cut_len, cut_label): 83 | for i in range(cut_len): 84 | if cut_row[i] == '新鲜': 85 | cut_label[-1].append(11) 86 | 87 | def feature_pos12(cut_row, cut_len, cut_label): 88 | for i in range(cut_len): 89 | if cut_row[i] == '最': 90 | cut_label[-1].append(12) 91 | 92 | def feature_pos13(cut_row, cut_len, cut_label): 93 | for i in range(cut_len): 94 | if cut_row[i] == '服务': 95 | cut_label[-1].append(13) 96 | 97 | def feature_pos14(cut_row, cut_len, cut_label): 98 | for i in range(cut_len): 99 | if cut_row[i] == '服务态度': 100 | cut_label[-1].append(14) 101 | 102 | def feature_pos15(cut_row, cut_len, cut_label): 103 | for i in range(cut_len): 104 | if cut_row[i] == '烤': 105 | cut_label[-1].append(15) 106 | 107 | def feature_pos16(cut_row, cut_len, cut_label): 108 | for i in range(cut_len): 109 | if cut_row[i] == '的': 110 | if i+1 < cut_len and cut_row[i+1] == '恰到好处': 111 | cut_label[-1].append(16) 112 | 113 | def feature_pos17(cut_row, cut_len, cut_label): 114 | for i in range(cut_len): 115 | if cut_row[i] == '还': 116 | cut_label[-1].append(17) 117 | 118 | def feature_pos18(cut_row, cut_len, cut_label): 119 | for i in range(cut_len): 120 | if cut_row[i] == '还不错': 121 | cut_label[-1].append(18) 122 | 123 | #多维list转化为1维度list(相当于把列表压平),递归 124 | def getnewList(newlist): 125 | d = [] 126 | for element in newlist: 127 | if not isinstance(element,list): 128 | d.append(element) 129 | else: 130 | d.extend(getnewList(element)) 131 | return d 132 | 133 | 134 | # 画出特征的直方图分布 135 | def figure_attribution(fresq_label, label_num): 136 | plt.hist(fresq_label, label_num) 137 | plt.xlabel('fresq_label') 138 | plt.ylabel('fresq_label_num') 139 | # plt.axis([0, 24, 0, 1000]) # 限定坐标的范围 140 | plt.show() 141 | 142 | def call_feature(cut): 143 | cut_label = [] # 初始化词性组合模式的标签为0 144 | for i in range(len(cut)): 145 | cut_label.append([]) 146 | cut_row = cut[i] # 句子的某一行(词性) 147 | cut_len = len(cut[i]) # 句子的长度(词性) 148 | feature_pos1(cut_row, cut_len, cut_label) 149 | feature_pos2(cut_row, cut_len, cut_label) 150 | feature_pos3(cut_row, cut_len, cut_label) 151 | feature_pos4(cut_row, cut_len, cut_label) 152 | feature_pos5(cut_row, cut_len, cut_label) 153 | feature_pos6(cut_row, cut_len, cut_label) 154 | feature_pos7(cut_row, cut_len, cut_label) 155 | feature_pos8(cut_row, cut_len, cut_label) 156 | feature_pos9(cut_row, cut_len, cut_label) 157 | feature_pos10(cut_row, cut_len, cut_label) 158 | feature_pos11(cut_row, cut_len, cut_label) 159 | feature_pos12(cut_row, cut_len, cut_label) 160 | feature_pos13(cut_row, cut_len, cut_label) 161 | feature_pos14(cut_row, cut_len, cut_label) 162 | feature_pos15(cut_row, cut_len, cut_label) 163 | feature_pos16(cut_row, cut_len, cut_label) 164 | feature_pos17(cut_row, cut_len, cut_label) 165 | feature_pos18(cut_row, cut_len, cut_label) 166 | if len(cut_label[i]) == 0: # 如果一句话不具有以上任何一种频繁词序列模式,则赋值0 167 | cut_label[-1].append(0) 168 | return cut_label 169 | 170 | 171 | cut = load_file('./lib/train_cut.txt') 172 | fresq_label = call_feature(cut) 173 | 174 | # 频繁词序列模式的结果写入文件 175 | write_file(fresq_label, './lib/train_feature_fresq.txt') 176 | 177 | # 画出特征的直方图分布 178 | figure_attribution(getnewList(fresq_label), 18) 179 | # cut_label是频繁词序列模式得到的特征!!! -------------------------------------------------------------------------------- /feature_low_fre.py: -------------------------------------------------------------------------------- 1 | import codecs # 写入txt文件 2 | import matplotlib.pyplot as plt 3 | 4 | # 打开情感词典文件,返回列表 5 | def open_dict(Dict, path = './sentiment_dic/'): 6 | path = path + '%s.txt' %Dict 7 | dictionary = open(path, 'r', encoding='utf-8',errors='ignore') 8 | dict = [] 9 | for word in dictionary: 10 | word = word.strip('\n').strip() 11 | dict.append(word) 12 | return dict 13 | 14 | # 读取txt文件 15 | def load_file(file_name): 16 | data = [] # 保存数据 17 | with open(file_name, encoding='utf-8') as fin: 18 | for line in fin: 19 | line = line.strip().split() 20 | data.append(line) 21 | return data 22 | 23 | # 写入txt文件 24 | def write_file(data, file_name): 25 | fin = codecs.open(file_name, "w", "UTF-8") 26 | for i in range(len(data)): 27 | fin.write(str(data[i])+"\n") 28 | fin.close() 29 | 30 | # 画出特征的直方图分布 31 | def figure_attribution(label, label_num): 32 | plt.hist(label, label_num) 33 | plt.xlabel('label') 34 | plt.ylabel('label_num') 35 | # plt.axis([0, 24, 0, 1000]) # 限定坐标的范围 36 | plt.show() 37 | 38 | # 统计词频 39 | def wordcount(cut): 40 | count_dict = {} 41 | for i in range(len(cut)): 42 | for j in range(len(cut[i])): 43 | word = cut[i][j] 44 | if word in count_dict.keys(): 45 | count_dict[word] += 1 46 | else: 47 | count_dict[word] = 1 48 | #按照词频从高到低排列 49 | count_list=sorted(count_dict.items(),key=lambda x:x[1],reverse=True) 50 | return count_list 51 | # return count_dict 52 | 53 | 54 | # 导入训练集的分词文本 55 | cut = load_file('./lib/train_cut.txt') 56 | 57 | # 统计训练集文本的词频 58 | count_list = wordcount(cut) 59 | 60 | 61 | # 情感词个数的结果写入文件 62 | # write_file(senti_num, './lib/train_feature_senti_num.txt') 63 | 64 | # 画出特征的直方图分布 65 | # figure_attribution(senti_num, max(senti_num)) 66 | -------------------------------------------------------------------------------- /feature_pos.py: -------------------------------------------------------------------------------- 1 | import matplotlib.pyplot as plt 2 | import codecs # 写入txt文件 3 | 4 | # 读取txt文件 5 | def load_file(file_name): 6 | data = [] # 保存数据 7 | with open(file_name, encoding='utf-8') as fin: 8 | for line in fin: 9 | line = line.strip().split() 10 | data.append(line) 11 | return data 12 | 13 | # 写入txt文件 14 | def write_file(data, file_name): 15 | fin = codecs.open(file_name, "w", "UTF-8") 16 | for i in range(len(data)): 17 | for j in range(len(data[i])): 18 | fin.write(str(data[i][j])+" ") 19 | fin.write("\n") 20 | fin.close() 21 | 22 | # 构造了7个特征对应的函数 23 | def feature_pos1(pos_row, pos_len, pos_label): 24 | for i in range(pos_len): 25 | if pos_row[i] == 'a' or \ 26 | pos_row[i] == 'ad' or \ 27 | pos_row[i] == 'ag' or \ 28 | pos_row[i] == 'al' or \ 29 | pos_row[i] == 'an': 30 | if i+1 < pos_len: 31 | if pos_row[i+1] == 'a' or \ 32 | pos_row[i+1] == 'ad' or \ 33 | pos_row[i+1] == 'ag' or \ 34 | pos_row[i+1] == 'al' or \ 35 | pos_row[i+1] == 'an': 36 | pos_label[-1].append(1) 37 | 38 | def feature_pos2(pos_row, pos_len, pos_label): 39 | for i in range(pos_len): 40 | if pos_row[i] == 'a' or \ 41 | pos_row[i] == 'ad' or \ 42 | pos_row[i] == 'ag' or \ 43 | pos_row[i] == 'al' or \ 44 | pos_row[i] == 'an': 45 | if i+1 < pos_len: 46 | if pos_row[i+1] == 'n' or \ 47 | pos_row[i+1] == 'ng' or \ 48 | pos_row[i+1] == 'nl' or \ 49 | pos_row[i+1] == 'nr' or \ 50 | pos_row[i+1] == 'ns' or \ 51 | pos_row[i+1] == 'nt' or \ 52 | pos_row[i+1] == 'nz': 53 | pos_label[-1].append(2) 54 | 55 | def feature_pos3(pos_row, pos_len, pos_label): 56 | for i in range(pos_len): 57 | if pos_row[i] == 'a' or \ 58 | pos_row[i] == 'ad' or \ 59 | pos_row[i] == 'ag' or \ 60 | pos_row[i] == 'al' or \ 61 | pos_row[i] == 'an': 62 | if i+1 < pos_len and pos_row[i+1] == 'uj': 63 | if i+2 < pos_len: 64 | if pos_row[i+2] == 'n' or \ 65 | pos_row[i+2] == 'ng' or \ 66 | pos_row[i+2] == 'nl' or \ 67 | pos_row[i+2] == 'nr' or \ 68 | pos_row[i+2] == 'ns' or \ 69 | pos_row[i+2] == 'nt' or \ 70 | pos_row[i+2] == 'nz': 71 | pos_label[-1].append(3) 72 | 73 | def feature_pos4(pos_row, pos_len, pos_label): 74 | for i in range(pos_len): 75 | if pos_row[i] == 'd' or pos_row[i] == 'zg': 76 | if i+1 < pos_len: 77 | if pos_row[i+1] == 'a' or \ 78 | pos_row[i+1] == 'ad' or \ 79 | pos_row[i+1] == 'ag' or \ 80 | pos_row[i+1] == 'al' or \ 81 | pos_row[i+1] == 'an': 82 | pos_label[-1].append(4) 83 | 84 | # vd vf vg vi vl vn vs vx vy 85 | def feature_pos5(pos_row, pos_len, pos_label): 86 | for i in range(pos_len): 87 | if pos_row[i] == 'd' or pos_row[i] == 'zg': 88 | if i+1 < pos_len: 89 | if pos_row[i+1] == 'v' or \ 90 | pos_row[i+1] == 'vd' or \ 91 | pos_row[i+1] == 'vf' or \ 92 | pos_row[i+1] == 'vg' or \ 93 | pos_row[i+1] == 'vi' or \ 94 | pos_row[i+1] == 'vl' or \ 95 | pos_row[i+1] == 'vn' or \ 96 | pos_row[i+1] == 'vs' or \ 97 | pos_row[i+1] == 'vx' or \ 98 | pos_row[i+1] == 'vy': 99 | pos_label[-1].append(5) 100 | 101 | def feature_pos6(pos_row, pos_len, pos_label): 102 | for i in range(pos_len): 103 | if pos_row[i] == 'd': 104 | if i+1 < pos_len: 105 | if pos_row[i+1] == 'd' or pos_row[i+1] == 'zg': 106 | if i+2 < pos_len: 107 | if pos_row[i+2] == 'a' or \ 108 | pos_row[i+2] == 'ad' or \ 109 | pos_row[i+2] == 'ag' or \ 110 | pos_row[i+2] == 'al' or \ 111 | pos_row[i+2] == 'an': 112 | pos_label[-1].append(6) 113 | 114 | def feature_pos7(pos_row, pos_len, pos_label): 115 | for i in range(pos_len): 116 | if pos_row[i] == 'n' or \ 117 | pos_row[i] == 'ng' or \ 118 | pos_row[i] == 'nl' or \ 119 | pos_row[i] == 'nr' or \ 120 | pos_row[i] == 'ns' or \ 121 | pos_row[i] == 'nt' or \ 122 | pos_row[i] == 'nz': 123 | if i+1 < pos_len: 124 | if pos_row[i+1] == 'a' or \ 125 | pos_row[i+1] == 'ad' or \ 126 | pos_row[i+1] == 'ag' or \ 127 | pos_row[i+1] == 'al' or \ 128 | pos_row[i+1] == 'an': 129 | pos_label[-1].append(7) 130 | 131 | 132 | #多维list转化为1维度list(相当于把列表压平),递归 133 | def getnewList(newlist): 134 | d = [] 135 | for element in newlist: 136 | if not isinstance(element,list): 137 | d.append(element) 138 | else: 139 | d.extend(getnewList(element)) 140 | return d 141 | 142 | 143 | # 画出特征的直方图分布 144 | def figure_attribution(pos_label, label_num): 145 | plt.hist(pos_label, label_num) 146 | plt.xlabel('pos_label') 147 | plt.ylabel('pos_label_num') 148 | # plt.axis([0, 24, 0, 1000]) # 限定坐标的范围 149 | plt.show() 150 | 151 | 152 | def call_feature(pos): 153 | pos_label = [] # 初始化词性组合模式的标签为0 154 | for i in range(len(pos)): 155 | pos_label.append([]) 156 | pos_row = pos[i] # 句子的某一行(词性) 157 | pos_len = len(pos[i]) # 句子的长度(词性) 158 | feature_pos1(pos_row, pos_len, pos_label) 159 | feature_pos2(pos_row, pos_len, pos_label) 160 | feature_pos3(pos_row, pos_len, pos_label) 161 | feature_pos4(pos_row, pos_len, pos_label) 162 | feature_pos5(pos_row, pos_len, pos_label) 163 | feature_pos6(pos_row, pos_len, pos_label) 164 | feature_pos7(pos_row, pos_len, pos_label) 165 | if len(pos_label[i]) == 0: # 如果一句话不具有以上任何一种频繁词序列模式,则赋值0 166 | pos_label[-1].append(0) 167 | return pos_label 168 | 169 | 170 | # 导入训练集的词性文本 171 | pos = load_file('./lib/train_pos.txt') 172 | pos_label = call_feature(pos) 173 | 174 | # 词性组合模式的结果写入文件 175 | write_file(pos_label, './lib/train_feature_pos.txt') 176 | 177 | # 画出特征的直方图分布 178 | figure_attribution(getnewList(pos_label), 7) 179 | # pos_label是词性组合模式得到的特征!!! -------------------------------------------------------------------------------- /feature_senti_num.py: -------------------------------------------------------------------------------- 1 | import codecs # 写入txt文件 2 | import matplotlib.pyplot as plt 3 | 4 | # 打开情感词典文件,返回列表 5 | def open_dict(Dict, path = './sentiment_dic/'): 6 | path = path + '%s.txt' %Dict 7 | dictionary = open(path, 'r', encoding='utf-8',errors='ignore') 8 | dict = [] 9 | for word in dictionary: 10 | word = word.strip('\n').strip() 11 | dict.append(word) 12 | return dict 13 | 14 | # 读取txt文件 15 | def load_file(file_name): 16 | data = [] # 保存数据 17 | with open(file_name, encoding='utf-8') as fin: 18 | for line in fin: 19 | line = line.strip().split() 20 | data.append(line) 21 | return data 22 | 23 | # 写入txt文件 24 | def write_file(data, file_name): 25 | fin = codecs.open(file_name, "w", "UTF-8") 26 | for i in range(len(data)): 27 | fin.write(str(data[i])+"\n") 28 | fin.close() 29 | 30 | # 画出特征的直方图分布 31 | def figure_attribution(label, label_num): 32 | plt.hist(label, label_num) 33 | plt.xlabel('label') 34 | plt.ylabel('label_num') 35 | # plt.axis([0, 24, 0, 1000]) # 限定坐标的范围 36 | plt.show() 37 | 38 | 39 | # 导入训练集的分词文本 40 | cut = load_file('./lib/train_cut.txt') 41 | 42 | # 合并所有的积极情感和消极情感的词典 43 | sentiment_dict = open_dict(Dict='positive_sentiment') + open_dict(Dict='positive_comment') + \ 44 | open_dict(Dict = 'negative_sentiment') + open_dict(Dict='negative_comment') 45 | 46 | # 统计每句话中的情感词 47 | senti_num = [] 48 | for i in range(len(cut)): 49 | num = 0 # 初始化每句话的情感词个数 50 | for j in range(len(cut[i])): 51 | if cut[i][j] in sentiment_dict: 52 | num += 1 53 | senti_num.append(num) 54 | 55 | # 情感词个数的结果写入文件 56 | write_file(senti_num, './lib/train_feature_senti_num.txt') 57 | 58 | # 画出特征的直方图分布 59 | figure_attribution(senti_num, max(senti_num)) 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | -------------------------------------------------------------------------------- /feature_sentiment.py: -------------------------------------------------------------------------------- 1 | #本脚本主要实现了基于python通过已有的情感词典对文本数据做的情感分析的项目目的 2 | import numpy as np 3 | import matplotlib.pyplot as plt 4 | import codecs # 写入txt文件 5 | 6 | # 打开情感词典文件,返回列表 7 | def open_dict(Dict, path = './sentiment_dic/'): 8 | path = path + '%s.txt' %Dict 9 | dictionary = open(path, 'r', encoding='utf-8',errors='ignore') 10 | dict = [] 11 | for word in dictionary: 12 | word = word.strip('\n').strip() 13 | dict.append(word) 14 | return dict 15 | 16 | # 读取txt文件,这里是为了读取分词后的文本 17 | def load_file(file_name): 18 | data = [] # 保存数据 19 | with open(file_name, encoding='utf-8') as fin: 20 | for line in fin: 21 | line = line.strip().split() 22 | data.append(line) 23 | return data 24 | 25 | # 写入txt文件 26 | def write_file(data, file_name): 27 | fin = codecs.open(file_name, "w", "UTF-8") 28 | for i in range(len(data)): 29 | fin.write(str(data[i])+"\n") 30 | fin.close() 31 | 32 | def judgeodd(num): #往情感词前查找否定词,找完全部否定词,若数量为奇数,乘以-1,若数量为偶数,乘以1. 33 | if num % 2 == 0: 34 | return 'even' 35 | else: 36 | return 'odd' 37 | 38 | 39 | def sentiment_score_list(cut): 40 | count1 = [] 41 | count2 = [] 42 | for segtmp in cut: 43 | #print(sen)# 循环遍历每一个评论 44 | #print(segtmp) 45 | i = 0 #记录扫描到的词的位置 46 | a = 0 #记录情感词的位置 47 | poscount = 0 # 积极词的第一次分值 48 | poscount2 = 0 # 积极反转后的分值 49 | poscount3 = 0 # 积极词的最后分值(包括叹号的分值) 50 | negcount = 0 51 | negcount2 = 0 52 | negcount3 = 0 53 | for word in segtmp: 54 | if word in posdict: # 判断词语是否是积极情感词 55 | poscount +=1 56 | c = 0 57 | for w in segtmp[a:i]: # 扫描情感词前的程度词 58 | if w in mostdict: 59 | poscount *= 4.0 60 | elif w in verydict: 61 | poscount *= 3.0 62 | elif w in moredict: 63 | poscount *= 2.0 64 | elif w in ishdict: 65 | poscount *= 0.5 66 | elif w in insuffhdict: 67 | poscount *= 0.3 68 | elif w in deny_word: c+= 1 69 | if judgeodd(c) == 'odd': # 扫描情感词前的否定词数 70 | poscount *= -1.0 71 | poscount2 += poscount 72 | poscount = 0 73 | poscount3 = poscount + poscount2 + poscount3 74 | poscount2 = 0 75 | else: 76 | poscount3 = poscount + poscount2 + poscount3 77 | poscount = 0 78 | a = i+1 79 | elif word in negdict: # 消极情感的分析,与上面一致 80 | negcount += 1 81 | d = 0 82 | for w in segtmp[a:i]: 83 | if w in mostdict: 84 | negcount *= 4.0 85 | elif w in verydict: 86 | negcount *= 3.0 87 | elif w in moredict: 88 | negcount *= 2.0 89 | elif w in ishdict: 90 | negcount *= 0.5 91 | elif w in insuffhdict: 92 | poscount *= 0.3 93 | elif w in degree_word: 94 | d += 1 95 | if judgeodd(d) == 'odd': 96 | negcount *= -1.0 97 | negcount2 += negcount 98 | negcount = 0 99 | negcount3 = negcount + negcount2 + negcount3 100 | negcount2 = 0 101 | else: 102 | negcount3 = negcount + negcount2 + negcount3 103 | negcount = 0 104 | a = i + 1 105 | elif word == '!' or word == '!': # 判断句子是否有感叹号 106 | for w2 in segtmp[::-1]: # 扫描感叹号前的情感词,发现后权值+2,然后退出循环 107 | if w2 in posdict: 108 | poscount3 += 2 109 | elif w2 in negdict: 110 | negcount3 += 2 111 | else: 112 | poscount3 +=0 113 | negcount3 +=0 114 | break 115 | else: 116 | poscount3=0 117 | negcount3=0 118 | i += 1 119 | 120 | # 以下是防止出现负数的情况 121 | pos_count = 0 122 | neg_count = 0 123 | if poscount3 <0 and negcount3 > 0: 124 | neg_count = negcount3 - poscount3 125 | pos_count = 0 126 | elif negcount3 <0 and poscount3 > 0: 127 | pos_count = poscount3 - negcount3 128 | neg_count = 0 129 | elif poscount3 <0 and negcount3 < 0: 130 | neg_count = -pos_count 131 | pos_count = -neg_count 132 | else: 133 | pos_count = poscount3 134 | neg_count = negcount3 135 | count1.append([pos_count,neg_count]) #返回每条评论打分后的列表 136 | #print(count1) 137 | count2.append(count1) 138 | count1=[] 139 | #print(count2) 140 | return count2 #返回所有评论打分后的列表 141 | 142 | def sentiment_score(senti_score_list):#分析完所有评论后,正式对每句评论打情感分 143 | score = [] 144 | sentiment_label = [] 145 | for review in senti_score_list:#senti_score_list 146 | score_array = np.array(review) 147 | Pos = np.sum(score_array[:,0])#积极总分 148 | Neg = np.sum(score_array[:,1])#消极总分 149 | AvgPos = np.mean(score_array[:,0])#积极情感均值 150 | AvgPos = float('%.lf' % AvgPos) 151 | AvgNeg = np.mean(score_array[:, 1])#消极情感均值 152 | AvgNeg = float('%.1f' % AvgNeg) 153 | StdPos = np.std(score_array[:, 0])#积极情感方差 154 | StdPos = float('%.1f' % StdPos) 155 | StdNeg = np.std(score_array[:, 1])#消极情感方差 156 | StdNeg = float('%.1f' % StdNeg) 157 | res=Pos-Neg # 最终情感得分 158 | # 情感得分细节:总得分,积极得分,消极得分,积极情感均值,消极情感均值,积极情感方差,消极情感方差 159 | score.append([res, Pos, Neg, AvgPos, AvgNeg, StdPos, StdNeg]) 160 | if res>0: 161 | sentiment_label.append(2) # 好评 162 | elif res<0: 163 | sentiment_label.append(1) # 差评 164 | else: 165 | sentiment_label.append(0) # 中评 166 | return sentiment_label 167 | 168 | # 画出特征的直方图分布 169 | def figure_attribution(sentiment_label, label_num): 170 | plt.hist(sentiment_label, label_num) 171 | plt.xlabel('sentiment_label') 172 | plt.ylabel('sentiment_label_num') 173 | # plt.axis([0, 24, 0, 1000]) # 限定坐标的范围 174 | plt.show() 175 | 176 | deny_word = open_dict(Dict='deny')#否定词词典 177 | posdict = open_dict(Dict='positive_sentiment') + open_dict(Dict='positive_comment') #积极词典 178 | negdict = open_dict(Dict = 'negative_sentiment') + open_dict(Dict='negative_comment') # 消极词典 179 | degree_word = open_dict(Dict = 'degree')#程度词词典 180 | 181 | #为程度词设置权重 182 | mostdict = degree_word[degree_word.index('extreme')+1: degree_word.index('very')] #权重4,即在情感前乘以3 183 | verydict = degree_word[degree_word.index('very')+1: degree_word.index('more')] #权重3 184 | moredict = degree_word[degree_word.index('more')+1: degree_word.index('ish')]#权重2 185 | ishdict = degree_word[degree_word.index('ish')+1: degree_word.index('insufficiently')]#权重0.5 186 | insuffhdict = degree_word[degree_word.index('insufficiently')+1: degree_word.index('over')]#权重0.3 187 | overdict = degree_word[degree_word.index('over')+1: degree_word.index('last')]#权重-0.5,这个程度词先不管 188 | 189 | 190 | #读取要做情感分析的文本,这里读取的是已经分词后的文本 191 | cut = load_file('./lib/train_cut.txt') 192 | 193 | # 返回每句话的情感标签 194 | sentiment_label = sentiment_score(sentiment_score_list(cut)) 195 | 196 | # 情感模式的结果写入文件 197 | write_file(sentiment_label, './lib/train_feature_sentiment.txt') 198 | 199 | # 画出特征的直方图分布 200 | figure_attribution(sentiment_label, 3) -------------------------------------------------------------------------------- /feature_slen.py: -------------------------------------------------------------------------------- 1 | import codecs # 写入txt文件 2 | import matplotlib.pyplot as plt 3 | 4 | # 读取txt文件 5 | def load_file(file_name): 6 | data = [] # 保存数据 7 | with open(file_name, encoding='utf-8') as fin: 8 | for line in fin: 9 | line = line.strip().split() 10 | data.append(line) 11 | return data 12 | 13 | # 写入txt文件 14 | def write_file(data, file_name): 15 | fin = codecs.open(file_name, "w", "UTF-8") 16 | for i in range(len(data)): 17 | fin.write(str(data[i])+"\n") 18 | fin.close() 19 | 20 | # 画出特征的直方图分布 21 | def figure_attribution(label, label_num): 22 | plt.hist(label, label_num) 23 | plt.xlabel('label') 24 | plt.ylabel('label_num') 25 | # plt.axis([0, 24, 0, 1000]) # 限定坐标的范围 26 | plt.show() 27 | 28 | 29 | # 导入训练集的分词文本 30 | cut = load_file('./lib/train_cut.txt') 31 | 32 | # 统计每句话的长度 33 | sentence_length = [] 34 | for i in range(len(cut)): 35 | sentence_length.append(len(cut[i])) 36 | 37 | # 句子长度的结果写入文件 38 | write_file(sentence_length, './lib/train_feature_slen.txt') 39 | 40 | # 画出特征的直方图分布 41 | figure_attribution(sentence_length, max(sentence_length)) -------------------------------------------------------------------------------- /import_csv.py: -------------------------------------------------------------------------------- 1 | import numpy as np 2 | import pandas as pd 3 | 4 | 5 | # 读取txt文件,并且转成数组类型 6 | # 如果flag是1,会把读取文件的每一行都按空格分割开;如果flag是2,就不分割 7 | def load_file(file_name, flag): 8 | data = [] # 保存数据 9 | with open(file_name, encoding='utf-8') as fin: 10 | for line in fin: 11 | if flag == 1: 12 | line = line.strip().split() 13 | if flag == 2: 14 | line = line.strip() 15 | data.append(line) 16 | return data 17 | # return np.array(data) 18 | 19 | 20 | train = np.array(load_file('./lib/train.txt', 1)) # 因为读取train.txt文件需要把句子和标签分开,所以flag=1 21 | feature_pos = load_file('./lib/train_feature_pos.txt', 2) # 词性组合模式 22 | feature_fresq = load_file('./lib/train_feature_fresq.txt', 2) # 频繁词序列模式 23 | feature_sentiment = load_file('./lib/train_feature_sentiment.txt', 2) # 情感打分 24 | feature_slen = load_file('./lib/train_feature_slen.txt', 2) # 句子长度 25 | feature_senti_num = load_file('./lib/train_feature_senti_num.txt', 2) # 情感词个数 26 | feature_enti_num = load_file('./lib/train_feature_enti_num.txt', 2) # 实体个数 27 | 28 | 29 | #字典中的key值即为csv中列名 30 | dataframe = pd.DataFrame({'Label':train[:,0], 'Sentence':train[:,1], \ 31 | 'feature_pos':feature_pos, 'feature_fresq':feature_fresq, \ 32 | 'feature_sentiment':feature_sentiment, 'feature_slen':feature_slen, \ 33 | 'feature_senti_num':feature_senti_num, 'feature_enti_num':feature_enti_num}) 34 | 35 | #将DataFrame存储为csv,index表示是否显示行名,default=True 36 | dataframe.to_csv("./feature/train.csv", index=True) 37 | 38 | 39 | -------------------------------------------------------------------------------- /lib/train_negative_prefixFrequentSub_sup100.txt: -------------------------------------------------------------------------------- 1 | pattern:超级, support:103 2 | pattern:口感, support:104 3 | pattern:高, support:104 4 | pattern:店里, support:106 5 | pattern:位置, support:108 6 | pattern:有点, support:109 7 | pattern:辣, support:110 8 | pattern:态度, support:110 9 | pattern:得, support:115 10 | pattern:一家, support:116 11 | pattern:新开, support:119 12 | pattern:新开, 的, support:103 13 | pattern:牛肉, support:125 14 | pattern:团购, support:131 15 | pattern:做, support:134 16 | pattern:菜, support:135 17 | pattern:人, support:137 18 | pattern:真的, support:138 19 | pattern:好找, support:143 20 | pattern:可以, support:145 21 | pattern:在, support:150 22 | pattern:店, support:162 23 | pattern:菜品, support:175 24 | pattern:免费, support:197 25 | pattern:口味, support:205 26 | pattern:装修, support:209 27 | pattern:有, support:256 28 | pattern:特别, support:268 29 | pattern:特别, 好, support:146 30 | pattern:感觉, support:275 31 | pattern:多, support:276 32 | pattern:服务, support:286 33 | pattern:服务态度, support:294 34 | pattern:服务态度, 很, support:208 35 | pattern:服务态度, 很, 好, support:183 36 | pattern:服务态度, 好, support:219 37 | pattern:吃, support:366 38 | pattern:好吃, support:371 39 | pattern:非常, support:383 40 | pattern:非常, 好, support:188 41 | pattern:和, support:389 42 | pattern:环境, support:436 43 | pattern:环境, 不错, support:127 44 | pattern:环境, 很, support:155 45 | pattern:还, support:455 46 | pattern:还, 不错, support:381 47 | pattern:是, support:544 48 | pattern:一如既往, support:547 49 | pattern:一如既往, 的, support:453 50 | pattern:一如既往, 的, 好, support:321 51 | pattern:都, support:547 52 | pattern:都, 很, support:125 53 | pattern:都, 不错, support:138 54 | pattern:恰到好处, support:571 55 | pattern:了, support:713 56 | pattern:味道, support:1277 57 | pattern:味道, 很, support:208 58 | pattern:味道, 很, 不错, support:130 59 | pattern:味道, 的, support:219 60 | pattern:味道, 的, 味道, support:126 61 | pattern:味道, 一如既往, support:249 62 | pattern:味道, 一如既往, 的, support:203 63 | pattern:味道, 不错, support:562 64 | pattern:好, support:1559 65 | pattern:很, support:2058 66 | pattern:很, 好找, support:130 67 | pattern:很, 好吃, support:157 68 | pattern:很, 不错, support:387 69 | pattern:很, 好, support:653 70 | pattern:不错, support:2632 71 | pattern:不错, 的, support:306 72 | pattern:的, support:3871 73 | pattern:的, 味道, support:134 74 | pattern:的, 恰到好处, support:149 75 | pattern:的, 好, support:371 76 | -------------------------------------------------------------------------------- /lib/train_negative_prefixFrequentSub_sup50.txt: -------------------------------------------------------------------------------- 1 | pattern:饭, support:50 2 | pattern:原汁原味, support:51 3 | pattern:三文鱼, support:52 4 | pattern:便宜, support:52 5 | pattern:豆腐, support:53 6 | pattern:面包, support:54 7 | pattern:新, support:55 8 | pattern:有种, support:55 9 | pattern:朋友, support:55 10 | pattern:生意, support:55 11 | pattern:芝士, support:56 12 | pattern:风格, support:56 13 | pattern:一个, support:58 14 | pattern:啊, support:58 15 | pattern:要, support:60 16 | pattern:虾, support:60 17 | pattern:类似, support:60 18 | pattern:着, support:60 19 | pattern:烤, support:60 20 | pattern:个, support:60 21 | pattern:真心, support:61 22 | pattern:会, support:63 23 | pattern:蛋糕, support:64 24 | pattern:汤, support:64 25 | pattern:鱼, support:66 26 | pattern:整体, support:66 27 | pattern:总体, support:68 28 | pattern:茶, support:69 29 | pattern:里, support:69 30 | pattern:水果, support:70 31 | pattern:价格, support:70 32 | pattern:挺, support:70 33 | pattern:地方, support:72 34 | pattern:新鲜, support:72 35 | pattern:最, support:72 36 | pattern:饮料, support:72 37 | pattern:很大, support:73 38 | pattern:选择, support:74 39 | pattern:这家, support:74 40 | pattern:回味无穷, support:74 41 | pattern:去, support:76 42 | pattern:东西, support:76 43 | pattern:上, support:76 44 | pattern:火锅, support:77 45 | pattern:推荐, support:77 46 | pattern:到, support:77 47 | pattern:点, support:78 48 | pattern:套餐, support:78 49 | pattern:性价比, support:79 50 | pattern:餐厅, support:83 51 | pattern:爱, support:87 52 | pattern:哦, support:88 53 | pattern:来, support:89 54 | pattern:效果, support:91 55 | pattern:海鲜, support:96 56 | pattern:超级, support:103 57 | pattern:超级, 好, support:55 58 | pattern:口感, support:104 59 | pattern:高, support:104 60 | pattern:店里, support:106 61 | pattern:位置, support:108 62 | pattern:位置, 好找, support:74 63 | pattern:位置, 很, support:81 64 | pattern:位置, 很, 好找, support:72 65 | pattern:有点, support:109 66 | pattern:辣, support:110 67 | pattern:辣, 恰到好处, support:53 68 | pattern:辣, 的, support:72 69 | pattern:辣, 的, 恰到好处, support:50 70 | pattern:态度, support:110 71 | pattern:得, support:115 72 | pattern:一家, support:116 73 | pattern:新开, support:119 74 | pattern:新开, 的, support:103 75 | pattern:牛肉, support:125 76 | pattern:团购, support:131 77 | pattern:团购, 很, support:52 78 | pattern:做, support:134 79 | pattern:做, 的, support:73 80 | pattern:菜, support:135 81 | pattern:人, support:137 82 | pattern:真的, support:138 83 | pattern:好找, support:143 84 | pattern:可以, support:145 85 | pattern:在, support:150 86 | pattern:店, support:162 87 | pattern:菜品, support:175 88 | pattern:菜品, 一如既往, support:53 89 | pattern:菜品, 的, support:55 90 | pattern:免费, support:197 91 | pattern:免费, 的, support:61 92 | pattern:口味, support:205 93 | pattern:口味, 一如既往, support:50 94 | pattern:口味, 不错, support:54 95 | pattern:装修, support:209 96 | pattern:有, support:256 97 | pattern:特别, support:268 98 | pattern:特别, 好, support:146 99 | pattern:感觉, support:275 100 | pattern:感觉, 很, support:66 101 | pattern:多, support:276 102 | pattern:服务, support:286 103 | pattern:服务, 很, support:60 104 | pattern:服务, 好, support:66 105 | pattern:服务态度, support:294 106 | pattern:服务态度, 很, support:208 107 | pattern:服务态度, 很, 好, support:183 108 | pattern:服务态度, 好, support:219 109 | pattern:吃, support:366 110 | pattern:吃, 的, support:62 111 | pattern:好吃, support:371 112 | pattern:非常, support:383 113 | pattern:非常, 好, support:188 114 | pattern:和, support:389 115 | pattern:环境, support:436 116 | pattern:环境, 好, support:67 117 | pattern:环境, 不错, support:127 118 | pattern:环境, 很, support:155 119 | pattern:环境, 很, 好, support:57 120 | pattern:环境, 很, 不错, support:68 121 | pattern:还, support:455 122 | pattern:还, 不错, support:381 123 | pattern:是, support:544 124 | pattern:一如既往, support:547 125 | pattern:一如既往, 的, support:453 126 | pattern:一如既往, 的, 好吃, support:67 127 | pattern:一如既往, 的, 好, support:321 128 | pattern:都, support:547 129 | pattern:都, 是, support:72 130 | pattern:都, 很, support:125 131 | pattern:都, 很, 好, support:59 132 | pattern:都, 不错, support:138 133 | pattern:恰到好处, support:571 134 | pattern:恰到好处, 的, support:61 135 | pattern:了, support:713 136 | pattern:味道, support:1277 137 | pattern:味道, 还, support:51 138 | pattern:味道, 都, support:58 139 | pattern:味道, 好, support:64 140 | pattern:味道, 很, support:208 141 | pattern:味道, 很, 不错, support:130 142 | pattern:味道, 的, support:219 143 | pattern:味道, 的, 不错, support:57 144 | pattern:味道, 的, 味道, support:126 145 | pattern:味道, 的, 味道, 不错, support:57 146 | pattern:味道, 一如既往, support:249 147 | pattern:味道, 一如既往, 的, support:203 148 | pattern:味道, 不错, support:562 149 | pattern:好, support:1559 150 | pattern:好, 的, support:74 151 | pattern:很, support:2058 152 | pattern:很, 好找, support:130 153 | pattern:很, 好吃, support:157 154 | pattern:很, 不错, support:387 155 | pattern:很, 不错, 的, support:54 156 | pattern:很, 好, support:653 157 | pattern:很, 好, 的, support:56 158 | pattern:不错, support:2632 159 | pattern:不错, 的, support:306 160 | pattern:的, support:3871 161 | pattern:的, 一家, support:65 162 | pattern:的, 感觉, support:70 163 | pattern:的, 好吃, support:75 164 | pattern:的, 很, support:78 165 | pattern:的, 不错, support:92 166 | pattern:的, 不错, 的, support:92 167 | pattern:的, 味道, support:134 168 | pattern:的, 味道, 不错, support:57 169 | pattern:的, 恰到好处, support:149 170 | pattern:的, 好, support:371 171 | -------------------------------------------------------------------------------- /lib/train_negative_prefixPattern.txt: -------------------------------------------------------------------------------- 1 | pattern:[['超级']], support:103 2 | pattern:[['口感']], support:104 3 | pattern:[['高']], support:104 4 | pattern:[['店里']], support:106 5 | pattern:[['位置']], support:108 6 | pattern:[['有点']], support:109 7 | pattern:[['辣']], support:110 8 | pattern:[['态度']], support:110 9 | pattern:[['得']], support:115 10 | pattern:[['一家']], support:116 11 | pattern:[['一家'], ['的']], support:101 12 | pattern:[['新开']], support:119 13 | pattern:[['新开', '的']], support:103 14 | pattern:[['牛肉']], support:125 15 | pattern:[['团购']], support:131 16 | pattern:[['做']], support:134 17 | pattern:[['菜']], support:135 18 | pattern:[['人']], support:137 19 | pattern:[['真的']], support:138 20 | pattern:[['真的'], ['真的']], support:107 21 | pattern:[['好找']], support:143 22 | pattern:[['可以']], support:145 23 | pattern:[['可以'], ['可以']], support:112 24 | pattern:[['在']], support:150 25 | pattern:[['在'], ['在']], support:145 26 | pattern:[['店']], support:162 27 | pattern:[['菜品']], support:175 28 | pattern:[['免费']], support:197 29 | pattern:[['免费'], ['免费']], support:119 30 | pattern:[['口味']], support:205 31 | pattern:[['装修']], support:209 32 | pattern:[['有']], support:256 33 | pattern:[['有'], ['的']], support:101 34 | pattern:[['有'], ['有']], support:168 35 | pattern:[['有'], ['有'], ['有']], support:114 36 | pattern:[['特别']], support:268 37 | pattern:[['特别'], ['特别']], support:122 38 | pattern:[['特别', '好']], support:146 39 | pattern:[['感觉']], support:275 40 | pattern:[['多']], support:276 41 | pattern:[['多'], ['多']], support:112 42 | pattern:[['服务']], support:286 43 | pattern:[['服务'], ['服务']], support:102 44 | pattern:[['服务'], ['很']], support:102 45 | pattern:[['服务'], ['好']], support:149 46 | pattern:[['服务态度']], support:294 47 | pattern:[['服务态度', '很']], support:208 48 | pattern:[['服务态度', '很', '好']], support:183 49 | pattern:[['服务态度', '好']], support:219 50 | pattern:[['吃']], support:366 51 | pattern:[['吃'], ['的']], support:160 52 | pattern:[['吃'], ['的'], ['的']], support:109 53 | pattern:[['吃'], ['吃']], support:224 54 | pattern:[['吃'], ['吃'], ['的']], support:105 55 | pattern:[['吃'], ['吃'], ['吃']], support:107 56 | pattern:[['好吃']], support:371 57 | pattern:[['非常']], support:383 58 | pattern:[['非常', '好']], support:188 59 | pattern:[['非常'], ['非常']], support:189 60 | pattern:[['和']], support:389 61 | pattern:[['和'], ['不错']], support:119 62 | pattern:[['和'], ['和']], support:382 63 | pattern:[['和'], ['和'], ['不错']], support:106 64 | pattern:[['和'], ['和'], ['和']], support:182 65 | pattern:[['环境']], support:436 66 | pattern:[['环境'], ['很']], support:124 67 | pattern:[['环境', '不错']], support:127 68 | pattern:[['环境'], ['好']], support:136 69 | pattern:[['环境', '很']], support:155 70 | pattern:[['环境', '很'], ['很']], support:102 71 | pattern:[['环境'], ['环境']], support:159 72 | pattern:[['还']], support:455 73 | pattern:[['还'], ['不错']], support:292 74 | pattern:[['还'], ['还']], support:354 75 | pattern:[['还'], ['还', '不错']], support:284 76 | pattern:[['还', '不错']], support:381 77 | pattern:[['是']], support:544 78 | pattern:[['是'], ['的']], support:362 79 | pattern:[['是'], ['的'], ['的']], support:209 80 | pattern:[['是'], ['的'], ['的'], ['的']], support:107 81 | pattern:[['是'], ['是']], support:456 82 | pattern:[['是'], ['是'], ['的']], support:247 83 | pattern:[['是'], ['是'], ['的'], ['的']], support:130 84 | pattern:[['是'], ['是'], ['是']], support:264 85 | pattern:[['是'], ['是'], ['是'], ['的']], support:131 86 | pattern:[['一如既往']], support:547 87 | pattern:[['一如既往'], ['好']], support:333 88 | pattern:[['一如既往', '的']], support:453 89 | pattern:[['一如既往', '的', '好']], support:321 90 | pattern:[['一如既往', '的'], ['好']], support:326 91 | pattern:[['一如既往', '的'], ['一如既往']], support:431 92 | pattern:[['一如既往', '的'], ['一如既往', '好']], support:313 93 | pattern:[['一如既往', '的'], ['一如既往', '的']], support:431 94 | pattern:[['一如既往', '的'], ['一如既往', '的', '好']], support:313 95 | pattern:[['一如既往', '的'], ['的']], support:453 96 | pattern:[['一如既往', '的'], ['的', '好']], support:321 97 | pattern:[['一如既往'], ['的']], support:458 98 | pattern:[['一如既往'], ['的', '好']], support:321 99 | pattern:[['一如既往'], ['一如既往']], support:467 100 | pattern:[['一如既往'], ['一如既往', '好']], support:271 101 | pattern:[['一如既往'], ['一如既往', '的']], support:433 102 | pattern:[['一如既往'], ['一如既往', '的', '好']], support:313 103 | pattern:[['都']], support:547 104 | pattern:[['都'], ['的']], support:109 105 | pattern:[['都', '很']], support:125 106 | pattern:[['都', '很'], ['都']], support:125 107 | pattern:[['都', '很'], ['都', '很']], support:125 108 | pattern:[['都', '很'], ['很']], support:125 109 | pattern:[['都'], ['很']], support:136 110 | pattern:[['都', '不错']], support:138 111 | pattern:[['都'], ['不错']], support:177 112 | pattern:[['都'], ['都']], support:514 113 | pattern:[['都'], ['都', '很']], support:132 114 | pattern:[['都'], ['都', '不错']], support:132 115 | pattern:[['都'], ['都'], ['都']], support:257 116 | pattern:[['恰到好处']], support:571 117 | pattern:[['了']], support:713 118 | pattern:[['了'], ['的']], support:155 119 | pattern:[['了'], ['的'], ['的']], support:142 120 | pattern:[['了'], ['了']], support:452 121 | pattern:[['了'], ['了'], ['的']], support:153 122 | pattern:[['了'], ['了'], ['的'], ['的']], support:132 123 | pattern:[['了'], ['了'], ['了']], support:227 124 | pattern:[['味道']], support:1277 125 | pattern:[['味道'], ['很']], support:126 126 | pattern:[['味道', '很']], support:208 127 | pattern:[['味道', '很'], ['很']], support:111 128 | pattern:[['味道', '很', '不错']], support:130 129 | pattern:[['味道', '的']], support:219 130 | pattern:[['味道', '的', '味道']], support:126 131 | pattern:[['味道', '的'], ['好']], support:185 132 | pattern:[['味道', '的'], ['一如既往']], support:206 133 | pattern:[['味道', '的'], ['一如既往', '好']], support:167 134 | pattern:[['味道', '的'], ['一如既往', '的']], support:206 135 | pattern:[['味道', '的'], ['一如既往', '的', '好']], support:170 136 | pattern:[['味道', '的'], ['的']], support:219 137 | pattern:[['味道', '的'], ['的', '好']], support:178 138 | pattern:[['味道'], ['一如既往']], support:231 139 | pattern:[['味道'], ['一如既往', '好']], support:166 140 | pattern:[['味道'], ['一如既往', '的']], support:219 141 | pattern:[['味道'], ['一如既往', '的', '好']], support:181 142 | pattern:[['味道', '一如既往']], support:249 143 | pattern:[['味道', '一如既往'], ['好']], support:178 144 | pattern:[['味道', '一如既往', '的']], support:203 145 | pattern:[['味道', '一如既往', '的'], ['好']], support:169 146 | pattern:[['味道', '一如既往', '的'], ['一如既往']], support:203 147 | pattern:[['味道', '一如既往', '的'], ['一如既往', '好']], support:168 148 | pattern:[['味道', '一如既往', '的'], ['一如既往', '的']], support:203 149 | pattern:[['味道', '一如既往', '的'], ['一如既往', '的', '好']], support:168 150 | pattern:[['味道', '一如既往', '的'], ['的']], support:203 151 | pattern:[['味道', '一如既往', '的'], ['的', '好']], support:168 152 | pattern:[['味道', '一如既往'], ['的']], support:212 153 | pattern:[['味道', '一如既往'], ['的', '好']], support:175 154 | pattern:[['味道', '一如既往'], ['一如既往']], support:224 155 | pattern:[['味道', '一如既往'], ['一如既往', '好']], support:166 156 | pattern:[['味道', '一如既往'], ['一如既往', '的']], support:213 157 | pattern:[['味道', '一如既往'], ['一如既往', '的', '好']], support:175 158 | pattern:[['味道'], ['好']], support:262 159 | pattern:[['味道'], ['的']], support:416 160 | pattern:[['味道'], ['的', '味道']], support:126 161 | pattern:[['味道'], ['的', '好']], support:187 162 | pattern:[['味道'], ['不错']], support:418 163 | pattern:[['味道'], ['味道']], support:457 164 | pattern:[['味道'], ['味道'], ['不错']], support:108 165 | pattern:[['味道'], ['味道'], ['味道']], support:150 166 | pattern:[['味道'], ['味道', '不错']], support:265 167 | pattern:[['味道', '不错']], support:562 168 | pattern:[['好']], support:1559 169 | pattern:[['好'], ['很']], support:108 170 | pattern:[['好'], ['很', '好']], support:102 171 | pattern:[['好'], ['的']], support:123 172 | pattern:[['好'], ['好']], support:234 173 | pattern:[['很']], support:2058 174 | pattern:[['很', '好找']], support:130 175 | pattern:[['很'], ['都']], support:130 176 | pattern:[['很'], ['都', '很']], support:125 177 | pattern:[['很', '好吃']], support:157 178 | pattern:[['很'], ['不错']], support:195 179 | pattern:[['很'], ['的']], support:305 180 | pattern:[['很'], ['的'], ['的']], support:116 181 | pattern:[['很', '不错']], support:387 182 | pattern:[['很'], ['好']], support:469 183 | pattern:[['很', '好']], support:653 184 | pattern:[['很', '好'], ['很']], support:103 185 | pattern:[['很', '好'], ['很', '好']], support:102 186 | pattern:[['很', '好'], ['好']], support:124 187 | pattern:[['很'], ['很']], support:1225 188 | pattern:[['很'], ['很'], ['的']], support:159 189 | pattern:[['很'], ['很', '不错']], support:180 190 | pattern:[['很'], ['很'], ['很']], support:231 191 | pattern:[['很'], ['很', '好']], support:447 192 | pattern:[['不错']], support:2632 193 | pattern:[['不错'], ['的']], support:289 194 | pattern:[['不错'], ['的'], ['的']], support:112 195 | pattern:[['不错', '的']], support:306 196 | pattern:[['不错', '的'], ['不错']], support:117 197 | pattern:[['不错', '的'], ['不错', '的']], support:113 198 | pattern:[['不错', '的'], ['的']], support:131 199 | pattern:[['不错'], ['不错']], support:425 200 | pattern:[['不错'], ['不错'], ['的']], support:114 201 | pattern:[['不错'], ['不错'], ['不错']], support:135 202 | pattern:[['不错'], ['不错', '的']], support:257 203 | pattern:[['不错'], ['不错', '的'], ['的']], support:105 204 | pattern:[['的']], support:3871 205 | pattern:[['的'], ['都']], support:100 206 | pattern:[['的'], ['店']], support:102 207 | pattern:[['的'], ['是']], support:107 208 | pattern:[['的'], ['是'], ['是']], support:104 209 | pattern:[['的'], ['好吃']], support:127 210 | pattern:[['的', '味道']], support:134 211 | pattern:[['的', '味道'], ['不错']], support:111 212 | pattern:[['的', '味道'], ['的']], support:130 213 | pattern:[['的', '味道'], ['的', '味道']], support:127 214 | pattern:[['的', '味道'], ['味道']], support:134 215 | pattern:[['的'], ['恰到好处']], support:140 216 | pattern:[['的', '恰到好处']], support:149 217 | pattern:[['的'], ['了']], support:161 218 | pattern:[['的'], ['味道']], support:185 219 | pattern:[['的'], ['味道'], ['味道']], support:115 220 | pattern:[['的'], ['很']], support:244 221 | pattern:[['的'], ['很'], ['很']], support:230 222 | pattern:[['的', '好']], support:371 223 | pattern:[['的'], ['一如既往']], support:433 224 | pattern:[['的'], ['一如既往', '好']], support:308 225 | pattern:[['的'], ['一如既往', '的']], support:432 226 | pattern:[['的'], ['一如既往', '的', '好']], support:313 227 | pattern:[['的'], ['不错']], support:538 228 | pattern:[['的'], ['不错', '的']], support:145 229 | pattern:[['的'], ['好']], support:542 230 | pattern:[['的'], ['的']], support:3148 231 | pattern:[['的'], ['的'], ['是']], support:104 232 | pattern:[['的'], ['的'], ['味道']], support:123 233 | pattern:[['的'], ['的'], ['好']], support:140 234 | pattern:[['的'], ['的', '很']], support:144 235 | pattern:[['的'], ['的', '很'], ['很']], support:144 236 | pattern:[['的'], ['的', '味道']], support:147 237 | pattern:[['的'], ['的', '味道'], ['味道']], support:102 238 | pattern:[['的'], ['的'], ['了']], support:147 239 | pattern:[['的'], ['的', '不错']], support:175 240 | pattern:[['的'], ['的'], ['很']], support:230 241 | pattern:[['的'], ['的'], ['很'], ['很']], support:116 242 | pattern:[['的'], ['的'], ['不错']], support:286 243 | pattern:[['的'], ['的', '好']], support:386 244 | pattern:[['的'], ['的'], ['的']], support:1329 245 | pattern:[['的'], ['的'], ['的'], ['不错']], support:105 246 | pattern:[['的'], ['的'], ['的'], ['的']], support:249 247 | pattern:[['的'], ['的'], ['的'], ['的'], ['的']], support:131 248 | -------------------------------------------------------------------------------- /lib/train_positive_prefixFrequentSub_sup25.txt: -------------------------------------------------------------------------------- 1 | pattern:鲜嫩, support:25 2 | pattern:生, support:25 3 | pattern:处理, support:25 4 | pattern:琳琅满目, support:25 5 | pattern:老师, support:25 6 | pattern:糯, support:26 7 | pattern:超大, support:26 8 | pattern:店, support:26 9 | pattern:调味, support:26 10 | pattern:茶味, support:26 11 | pattern:鸡蛋, support:26 12 | pattern:让, support:27 13 | pattern:龙虾, support:27 14 | pattern:肉, support:27 15 | pattern:配合, support:27 16 | pattern:套餐, support:27 17 | pattern:音乐, support:27 18 | pattern:寿司, support:28 19 | pattern:与, support:28 20 | pattern:确实, support:28 21 | pattern:爽口, support:28 22 | pattern:蚝, support:28 23 | pattern:火锅, support:28 24 | pattern:蟹, support:28 25 | pattern:富丽堂皇, support:28 26 | pattern:实惠, support:29 27 | pattern:着, support:29 28 | pattern:牛腩, support:29 29 | pattern:土豆, support:29 30 | pattern:到, support:29 31 | pattern:炖, support:30 32 | pattern:独特, support:30 33 | pattern:汤汁, support:30 34 | pattern:酱, support:31 35 | pattern:羊肉串, support:31 36 | pattern:还, support:31 37 | pattern:里面, support:31 38 | pattern:在, support:32 39 | pattern:芥末, support:32 40 | pattern:认真, support:32 41 | pattern:装饰, support:32 42 | pattern:地道, support:33 43 | pattern:好喝, support:33 44 | pattern:面条, support:33 45 | pattern:牛舌, support:33 46 | pattern:啊, support:34 47 | pattern:精致, support:34 48 | pattern:别具一格, support:36 49 | pattern:人, support:36 50 | pattern:推荐, support:36 51 | pattern:出乎意料, support:36 52 | pattern:出乎意料, 的, support:26 53 | pattern:店里, support:37 54 | pattern:按摩, support:37 55 | pattern:一家, support:37 56 | pattern:牛蛙, support:38 57 | pattern:酱料, support:38 58 | pattern:口味, support:40 59 | pattern:地, support:40 60 | pattern:豆腐, support:41 61 | pattern:回味无穷, support:41 62 | pattern:蒸, support:41 63 | pattern:蒸, 的, support:34 64 | pattern:配, support:42 65 | pattern:沙拉, support:42 66 | pattern:特色, support:42 67 | pattern:里, support:43 68 | pattern:饭, support:44 69 | pattern:最好, support:44 70 | pattern:最好, 的, support:34 71 | pattern:蛋糕, support:44 72 | pattern:感觉, support:45 73 | pattern:很香, support:45 74 | pattern:刺身, support:46 75 | pattern:方便, support:46 76 | pattern:肝, support:47 77 | pattern:水果, support:48 78 | pattern:上, support:48 79 | pattern:菜, support:48 80 | pattern:鹅, support:48 81 | pattern:鹅, 肝, support:43 82 | pattern:美味, support:49 83 | pattern:鸡, support:49 84 | pattern:米饭, support:49 85 | pattern:鲜美, support:50 86 | pattern:鳗鱼, support:50 87 | pattern:最爱, support:50 88 | pattern:最爱, 的, support:36 89 | pattern:很嫩, support:52 90 | pattern:餐厅, support:53 91 | pattern:货真价实, support:53 92 | pattern:浓郁, support:54 93 | pattern:抹, support:55 94 | pattern:抹, 茶, support:40 95 | pattern:面包, support:58 96 | pattern:正宗, support:58 97 | pattern:鸡肉, support:59 98 | pattern:鱼, support:59 99 | pattern:三文鱼, support:60 100 | pattern:风格, support:60 101 | pattern:超级, support:60 102 | pattern:辣, support:60 103 | pattern:辣, 的, support:40 104 | pattern:辣, 的, 恰到好处, support:34 105 | pattern:干净, support:63 106 | pattern:口感, support:65 107 | pattern:汤, support:69 108 | pattern:咖喱, support:69 109 | pattern:味, support:69 110 | pattern:味, 恰到好处, support:28 111 | pattern:煎, support:70 112 | pattern:煎, 的, support:36 113 | pattern:煎, 的, 恰到好处, support:26 114 | pattern:搭配, support:70 115 | pattern:搭配, 的, support:28 116 | pattern:搭配, 的, 恰到好处, support:26 117 | pattern:茶, support:76 118 | pattern:茶, 的, support:25 119 | pattern:环境, support:77 120 | pattern:挺好吃, support:77 121 | pattern:挺好吃, 的, support:52 122 | pattern:香, support:78 123 | pattern:煮, support:79 124 | pattern:煮, 的, support:56 125 | pattern:煮, 的, 恰到好处, support:51 126 | pattern:芝士, support:81 127 | pattern:真的, support:81 128 | pattern:棒, support:82 129 | pattern:虾, support:83 130 | pattern:不错, support:89 131 | pattern:吃, support:97 132 | pattern:海鲜, support:105 133 | pattern:海鲜, 新鲜, support:32 134 | pattern:海鲜, 很, support:35 135 | pattern:海鲜, 很, 新鲜, support:26 136 | pattern:爱, support:107 137 | pattern:做, support:108 138 | pattern:做, 的, support:79 139 | pattern:嫩, support:109 140 | pattern:有, support:110 141 | pattern:挺, support:125 142 | pattern:了, support:126 143 | pattern:很棒, support:128 144 | pattern:火候, support:128 145 | pattern:火候, 恰到好处, support:97 146 | pattern:入味, support:129 147 | pattern:特别, support:139 148 | pattern:特别, 棒, support:25 149 | pattern:古色古香, support:201 150 | pattern:古色古香, 的, support:55 151 | pattern:牛肉, support:210 152 | pattern:牛肉, 的, support:36 153 | pattern:烤, support:219 154 | pattern:烤, 得, support:61 155 | pattern:烤, 得, 恰到好处, support:55 156 | pattern:烤, 的, support:124 157 | pattern:烤, 的, 恰到好处, support:104 158 | pattern:一如既往, support:221 159 | pattern:一如既往, 的, support:160 160 | pattern:一如既往, 的, 好, support:26 161 | pattern:一如既往, 的, 好吃, support:67 162 | pattern:最, support:226 163 | pattern:最, 好吃, support:83 164 | pattern:最, 好吃, 的, support:51 165 | pattern:最, 爱, support:103 166 | pattern:得, support:237 167 | pattern:得, 恰到好处, support:184 168 | pattern:非常, support:241 169 | pattern:非常, 新鲜, support:26 170 | pattern:是, support:259 171 | pattern:是, 最, support:27 172 | pattern:好, support:272 173 | pattern:好, 好吃, support:63 174 | pattern:都, support:276 175 | pattern:都, 是, support:29 176 | pattern:都, 恰到好处, support:52 177 | pattern:都, 很, support:89 178 | pattern:都, 很, 新鲜, support:31 179 | pattern:味道, support:303 180 | pattern:味道, 好, support:31 181 | pattern:味道, 很, support:42 182 | pattern:味道, 恰到好处, support:80 183 | pattern:装修, support:305 184 | pattern:装修, 挺, support:25 185 | pattern:装修, 风格, support:47 186 | pattern:装修, 古色古香, support:54 187 | pattern:装修, 的, support:74 188 | pattern:装修, 的, 装修, support:31 189 | pattern:装修, 的, 装修, 的, support:26 190 | pattern:装修, 的, 很, support:46 191 | pattern:装修, 很, support:133 192 | pattern:装修, 很, 古色古香, support:28 193 | pattern:新鲜, support:309 194 | pattern:新鲜, 的, support:30 195 | pattern:和, support:319 196 | pattern:好吃, support:441 197 | pattern:好吃, 的, support:70 198 | pattern:很, support:1398 199 | pattern:很, 美味, support:27 200 | pattern:很, 浓郁, support:28 201 | pattern:很, 好, support:28 202 | pattern:很, 香, support:29 203 | pattern:很, 鲜美, support:31 204 | pattern:很, 方便, support:31 205 | pattern:很, 正宗, support:37 206 | pattern:很, 好吃, support:39 207 | pattern:很, 干净, support:41 208 | pattern:很, 嫩, support:43 209 | pattern:很, 有, support:49 210 | pattern:很, 古色古香, support:72 211 | pattern:很, 入味, support:73 212 | pattern:很, 新鲜, support:202 213 | pattern:恰到好处, support:1672 214 | pattern:恰到好处, 的, support:96 215 | pattern:的, support:2446 216 | pattern:的, 最, support:27 217 | pattern:的, 装修, support:31 218 | pattern:的, 装修, 的, support:26 219 | pattern:的, 装修, 的, 装修, support:26 220 | pattern:的, 好, support:35 221 | pattern:的, 火候, support:53 222 | pattern:的, 火候, 恰到好处, support:39 223 | pattern:的, 好吃, support:85 224 | pattern:的, 好吃, 的, support:59 225 | pattern:的, 味道, support:90 226 | pattern:的, 味道, 恰到好处, support:34 227 | pattern:的, 很, support:123 228 | pattern:的, 恰到好处, support:450 229 | pattern:的, 恰到好处, 的, support:73 230 | -------------------------------------------------------------------------------- /lib/train_positive_prefixFrequentSub_sup50.txt: -------------------------------------------------------------------------------- 1 | pattern:鲜美, support:50 2 | pattern:鳗鱼, support:50 3 | pattern:最爱, support:50 4 | pattern:很嫩, support:52 5 | pattern:餐厅, support:53 6 | pattern:货真价实, support:53 7 | pattern:浓郁, support:54 8 | pattern:抹, support:55 9 | pattern:面包, support:58 10 | pattern:正宗, support:58 11 | pattern:鸡肉, support:59 12 | pattern:鱼, support:59 13 | pattern:三文鱼, support:60 14 | pattern:风格, support:60 15 | pattern:超级, support:60 16 | pattern:辣, support:60 17 | pattern:干净, support:63 18 | pattern:口感, support:65 19 | pattern:汤, support:69 20 | pattern:咖喱, support:69 21 | pattern:味, support:69 22 | pattern:煎, support:70 23 | pattern:搭配, support:70 24 | pattern:茶, support:76 25 | pattern:环境, support:77 26 | pattern:挺好吃, support:77 27 | pattern:挺好吃, 的, support:52 28 | pattern:香, support:78 29 | pattern:煮, support:79 30 | pattern:煮, 的, support:56 31 | pattern:煮, 的, 恰到好处, support:51 32 | pattern:芝士, support:81 33 | pattern:真的, support:81 34 | pattern:棒, support:82 35 | pattern:虾, support:83 36 | pattern:不错, support:89 37 | pattern:吃, support:97 38 | pattern:海鲜, support:105 39 | pattern:爱, support:107 40 | pattern:做, support:108 41 | pattern:做, 的, support:79 42 | pattern:嫩, support:109 43 | pattern:有, support:110 44 | pattern:挺, support:125 45 | pattern:了, support:126 46 | pattern:很棒, support:128 47 | pattern:火候, support:128 48 | pattern:火候, 恰到好处, support:97 49 | pattern:入味, support:129 50 | pattern:特别, support:139 51 | pattern:古色古香, support:201 52 | pattern:古色古香, 的, support:55 53 | pattern:牛肉, support:210 54 | pattern:烤, support:219 55 | pattern:烤, 得, support:61 56 | pattern:烤, 得, 恰到好处, support:55 57 | pattern:烤, 的, support:124 58 | pattern:烤, 的, 恰到好处, support:104 59 | pattern:一如既往, support:221 60 | pattern:一如既往, 的, support:160 61 | pattern:一如既往, 的, 好吃, support:67 62 | pattern:最, support:226 63 | pattern:最, 好吃, support:83 64 | pattern:最, 好吃, 的, support:51 65 | pattern:最, 爱, support:103 66 | pattern:得, support:237 67 | pattern:得, 恰到好处, support:184 68 | pattern:非常, support:241 69 | pattern:是, support:259 70 | pattern:好, support:272 71 | pattern:好, 好吃, support:63 72 | pattern:都, support:276 73 | pattern:都, 恰到好处, support:52 74 | pattern:都, 很, support:89 75 | pattern:味道, support:303 76 | pattern:味道, 恰到好处, support:80 77 | pattern:装修, support:305 78 | pattern:装修, 古色古香, support:54 79 | pattern:装修, 的, support:74 80 | pattern:装修, 很, support:133 81 | pattern:新鲜, support:309 82 | pattern:和, support:319 83 | pattern:好吃, support:441 84 | pattern:好吃, 的, support:70 85 | pattern:很, support:1398 86 | pattern:很, 古色古香, support:72 87 | pattern:很, 入味, support:73 88 | pattern:很, 新鲜, support:202 89 | pattern:恰到好处, support:1672 90 | pattern:恰到好处, 的, support:96 91 | pattern:的, support:2446 92 | pattern:的, 火候, support:53 93 | pattern:的, 好吃, support:85 94 | pattern:的, 好吃, 的, support:59 95 | pattern:的, 味道, support:90 96 | pattern:的, 很, support:123 97 | pattern:的, 恰到好处, support:450 98 | pattern:的, 恰到好处, 的, support:73 99 | -------------------------------------------------------------------------------- /lib/train_positive_prefixPattern.txt: -------------------------------------------------------------------------------- 1 | pattern:[['鲜美']], support:50 2 | pattern:[['鳗鱼']], support:50 3 | pattern:[['最爱']], support:50 4 | pattern:[['很嫩']], support:52 5 | pattern:[['餐厅']], support:53 6 | pattern:[['货真价实']], support:53 7 | pattern:[['浓郁']], support:54 8 | pattern:[['抹']], support:55 9 | pattern:[['面包']], support:58 10 | pattern:[['正宗']], support:58 11 | pattern:[['鸡肉']], support:59 12 | pattern:[['鱼']], support:59 13 | pattern:[['三文鱼']], support:60 14 | pattern:[['风格']], support:60 15 | pattern:[['风格'], ['风格']], support:53 16 | pattern:[['超级']], support:60 17 | pattern:[['辣']], support:60 18 | pattern:[['干净']], support:63 19 | pattern:[['口感']], support:65 20 | pattern:[['口感'], ['口感']], support:50 21 | pattern:[['汤']], support:69 22 | pattern:[['咖喱']], support:69 23 | pattern:[['味']], support:69 24 | pattern:[['煎']], support:70 25 | pattern:[['煎'], ['恰到好处']], support:63 26 | pattern:[['煎'], ['煎']], support:67 27 | pattern:[['搭配']], support:70 28 | pattern:[['搭配'], ['恰到好处']], support:51 29 | pattern:[['搭配'], ['搭配']], support:56 30 | pattern:[['茶']], support:76 31 | pattern:[['茶'], ['茶']], support:65 32 | pattern:[['环境']], support:77 33 | pattern:[['挺好吃']], support:77 34 | pattern:[['挺好吃', '的']], support:52 35 | pattern:[['香']], support:78 36 | pattern:[['煮']], support:79 37 | pattern:[['煮', '的']], support:56 38 | pattern:[['煮', '的', '恰到好处']], support:51 39 | pattern:[['煮', '的'], ['煮']], support:54 40 | pattern:[['煮', '的'], ['煮', '恰到好处']], support:51 41 | pattern:[['煮', '的'], ['煮', '的']], support:54 42 | pattern:[['煮', '的'], ['煮', '的', '恰到好处']], support:51 43 | pattern:[['煮', '的'], ['恰到好处']], support:54 44 | pattern:[['煮', '的'], ['的']], support:56 45 | pattern:[['煮', '的'], ['的', '恰到好处']], support:52 46 | pattern:[['煮'], ['的']], support:58 47 | pattern:[['煮'], ['的', '恰到好处']], support:52 48 | pattern:[['煮'], ['恰到好处']], support:73 49 | pattern:[['煮'], ['煮']], support:76 50 | pattern:[['煮'], ['煮', '的']], support:54 51 | pattern:[['煮'], ['煮', '的', '恰到好处']], support:51 52 | pattern:[['芝士']], support:81 53 | pattern:[['真的']], support:81 54 | pattern:[['真的'], ['真的']], support:75 55 | pattern:[['棒']], support:82 56 | pattern:[['虾']], support:83 57 | pattern:[['不错']], support:89 58 | pattern:[['吃']], support:97 59 | pattern:[['吃'], ['吃']], support:76 60 | pattern:[['海鲜']], support:105 61 | pattern:[['爱']], support:107 62 | pattern:[['爱'], ['爱']], support:63 63 | pattern:[['做']], support:108 64 | pattern:[['做', '的']], support:79 65 | pattern:[['做', '的'], ['做']], support:68 66 | pattern:[['做', '的'], ['做'], ['的']], support:50 67 | pattern:[['做', '的'], ['做', '的']], support:68 68 | pattern:[['做', '的'], ['做', '的'], ['的']], support:50 69 | pattern:[['做', '的'], ['的']], support:79 70 | pattern:[['做', '的'], ['的'], ['的']], support:57 71 | pattern:[['做'], ['的']], support:85 72 | pattern:[['做'], ['的'], ['的']], support:71 73 | pattern:[['做'], ['做']], support:89 74 | pattern:[['做'], ['做'], ['的']], support:62 75 | pattern:[['做'], ['做', '的']], support:68 76 | pattern:[['做'], ['做', '的'], ['的']], support:59 77 | pattern:[['嫩']], support:109 78 | pattern:[['有']], support:110 79 | pattern:[['有'], ['很']], support:57 80 | pattern:[['有'], ['很', '有']], support:52 81 | pattern:[['有'], ['有']], support:106 82 | pattern:[['有'], ['有'], ['有']], support:50 83 | pattern:[['挺']], support:125 84 | pattern:[['挺'], ['的']], support:85 85 | pattern:[['挺'], ['挺']], support:116 86 | pattern:[['挺'], ['挺'], ['的']], support:53 87 | pattern:[['挺'], ['挺'], ['挺']], support:57 88 | pattern:[['挺'], ['挺'], ['挺', '的']], support:52 89 | pattern:[['了']], support:126 90 | pattern:[['了'], ['了']], support:64 91 | pattern:[['很棒']], support:128 92 | pattern:[['火候']], support:128 93 | pattern:[['火候'], ['的']], support:64 94 | pattern:[['火候'], ['的', '火候']], support:53 95 | pattern:[['火候', '恰到好处']], support:97 96 | pattern:[['火候'], ['火候']], support:104 97 | pattern:[['火候'], ['火候', '恰到好处']], support:74 98 | pattern:[['火候'], ['恰到好处']], support:104 99 | pattern:[['入味']], support:129 100 | pattern:[['特别']], support:139 101 | pattern:[['特别'], ['特别']], support:110 102 | pattern:[['古色古香']], support:201 103 | pattern:[['古色古香'], ['很']], support:52 104 | pattern:[['古色古香', '的']], support:55 105 | pattern:[['古色古香'], ['的']], support:68 106 | pattern:[['古色古香'], ['古色古香']], support:85 107 | pattern:[['牛肉']], support:210 108 | pattern:[['牛肉'], ['恰到好处']], support:59 109 | pattern:[['牛肉'], ['牛肉']], support:76 110 | pattern:[['牛肉'], ['的']], support:87 111 | pattern:[['牛肉'], ['的'], ['的']], support:51 112 | pattern:[['烤']], support:219 113 | pattern:[['烤', '得']], support:61 114 | pattern:[['烤', '得', '恰到好处']], support:55 115 | pattern:[['烤', '得'], ['恰到好处']], support:57 116 | pattern:[['烤', '得'], ['烤']], support:61 117 | pattern:[['烤', '得'], ['烤', '恰到好处']], support:55 118 | pattern:[['烤', '得'], ['烤', '得']], support:61 119 | pattern:[['烤', '得'], ['烤', '得', '恰到好处']], support:55 120 | pattern:[['烤', '得'], ['得']], support:61 121 | pattern:[['烤', '得'], ['得', '恰到好处']], support:55 122 | pattern:[['烤'], ['得']], support:64 123 | pattern:[['烤'], ['得', '恰到好处']], support:55 124 | pattern:[['烤', '的']], support:124 125 | pattern:[['烤', '的', '恰到好处']], support:104 126 | pattern:[['烤', '的'], ['恰到好处']], support:119 127 | pattern:[['烤', '的'], ['烤']], support:121 128 | pattern:[['烤', '的'], ['烤', '恰到好处']], support:102 129 | pattern:[['烤', '的'], ['烤', '的']], support:121 130 | pattern:[['烤', '的'], ['烤', '的', '恰到好处']], support:102 131 | pattern:[['烤', '的'], ['的']], support:124 132 | pattern:[['烤', '的'], ['的', '恰到好处']], support:104 133 | pattern:[['烤'], ['的']], support:131 134 | pattern:[['烤'], ['的'], ['恰到好处']], support:53 135 | pattern:[['烤'], ['的'], ['的']], support:58 136 | pattern:[['烤'], ['的', '恰到好处']], support:104 137 | pattern:[['烤'], ['恰到好处']], support:185 138 | pattern:[['烤'], ['烤']], support:196 139 | pattern:[['烤'], ['烤'], ['的']], support:56 140 | pattern:[['烤'], ['烤', '得']], support:62 141 | pattern:[['烤'], ['烤', '得', '恰到好处']], support:55 142 | pattern:[['烤'], ['烤'], ['烤']], support:62 143 | pattern:[['烤'], ['烤'], ['恰到好处']], support:71 144 | pattern:[['烤'], ['烤', '恰到好处']], support:111 145 | pattern:[['烤'], ['烤', '的']], support:122 146 | pattern:[['烤'], ['烤', '的'], ['的']], support:52 147 | pattern:[['烤'], ['烤', '的', '恰到好处']], support:102 148 | pattern:[['一如既往']], support:221 149 | pattern:[['一如既往'], ['好吃']], support:130 150 | pattern:[['一如既往', '的']], support:160 151 | pattern:[['一如既往', '的', '好吃']], support:67 152 | pattern:[['一如既往', '的'], ['好吃']], support:96 153 | pattern:[['一如既往', '的'], ['一如既往']], support:150 154 | pattern:[['一如既往', '的'], ['一如既往', '好吃']], support:66 155 | pattern:[['一如既往', '的'], ['一如既往'], ['的']], support:71 156 | pattern:[['一如既往', '的'], ['一如既往', '的']], support:149 157 | pattern:[['一如既往', '的'], ['一如既往', '的', '好吃']], support:65 158 | pattern:[['一如既往', '的'], ['一如既往', '的'], ['的']], support:71 159 | pattern:[['一如既往', '的'], ['的']], support:160 160 | pattern:[['一如既往', '的'], ['的', '好吃']], support:68 161 | pattern:[['一如既往', '的'], ['的'], ['的']], support:76 162 | pattern:[['一如既往'], ['的']], support:169 163 | pattern:[['一如既往'], ['的', '好吃']], support:68 164 | pattern:[['一如既往'], ['的'], ['好吃']], support:86 165 | pattern:[['一如既往'], ['的'], ['一如既往']], support:101 166 | pattern:[['一如既往'], ['的'], ['一如既往', '好吃']], support:51 167 | pattern:[['一如既往'], ['的'], ['一如既往', '的']], support:100 168 | pattern:[['一如既往'], ['的'], ['一如既往', '的', '好吃']], support:50 169 | pattern:[['一如既往'], ['的'], ['的']], support:142 170 | pattern:[['一如既往'], ['的'], ['的', '好吃']], support:64 171 | pattern:[['一如既往'], ['一如既往']], support:200 172 | pattern:[['一如既往'], ['一如既往'], ['好吃']], support:107 173 | pattern:[['一如既往'], ['一如既往'], ['一如既往']], support:126 174 | pattern:[['一如既往'], ['一如既往'], ['一如既往', '好吃']], support:70 175 | pattern:[['一如既往'], ['一如既往'], ['一如既往', '的']], support:102 176 | pattern:[['一如既往'], ['一如既往'], ['一如既往', '的', '好吃']], support:50 177 | pattern:[['一如既往'], ['一如既往'], ['的']], support:140 178 | pattern:[['一如既往'], ['一如既往'], ['的', '好吃']], support:64 179 | pattern:[['一如既往'], ['一如既往', '的']], support:152 180 | pattern:[['一如既往'], ['一如既往', '的', '好吃']], support:65 181 | pattern:[['一如既往'], ['一如既往', '的'], ['好吃']], support:80 182 | pattern:[['一如既往'], ['一如既往', '的'], ['一如既往']], support:100 183 | pattern:[['一如既往'], ['一如既往', '的'], ['一如既往', '好吃']], support:50 184 | pattern:[['一如既往'], ['一如既往', '的'], ['一如既往', '的']], support:100 185 | pattern:[['一如既往'], ['一如既往', '的'], ['一如既往', '的', '好吃']], support:50 186 | pattern:[['一如既往'], ['一如既往', '的'], ['的']], support:137 187 | pattern:[['一如既往'], ['一如既往', '的'], ['的', '好吃']], support:64 188 | pattern:[['最']], support:226 189 | pattern:[['最'], ['好吃']], support:72 190 | pattern:[['最'], ['好吃', '的']], support:51 191 | pattern:[['最'], ['好吃'], ['的']], support:51 192 | pattern:[['最'], ['好吃'], ['好吃']], support:52 193 | pattern:[['最'], ['好吃'], ['好吃', '的']], support:51 194 | pattern:[['最', '好吃']], support:83 195 | pattern:[['最', '好吃', '的']], support:51 196 | pattern:[['最', '好吃'], ['的']], support:51 197 | pattern:[['最', '好吃'], ['最']], support:53 198 | pattern:[['最', '好吃'], ['最', '的']], support:51 199 | pattern:[['最', '好吃'], ['最', '好吃']], support:53 200 | pattern:[['最', '好吃'], ['最', '好吃', '的']], support:51 201 | pattern:[['最', '好吃'], ['好吃']], support:53 202 | pattern:[['最', '好吃'], ['好吃', '的']], support:51 203 | pattern:[['最'], ['爱']], support:96 204 | pattern:[['最'], ['的']], support:102 205 | pattern:[['最'], ['的'], ['的']], support:74 206 | pattern:[['最'], ['的'], ['的'], ['的']], support:52 207 | pattern:[['最', '爱']], support:103 208 | pattern:[['最', '爱'], ['爱']], support:61 209 | pattern:[['最'], ['最']], support:159 210 | pattern:[['最'], ['最'], ['好吃']], support:52 211 | pattern:[['最'], ['最'], ['好吃', '的']], support:51 212 | pattern:[['最'], ['最', '好吃']], support:72 213 | pattern:[['最'], ['最', '好吃', '的']], support:51 214 | pattern:[['最'], ['最', '好吃'], ['的']], support:51 215 | pattern:[['最'], ['最', '好吃'], ['好吃']], support:52 216 | pattern:[['最'], ['最', '好吃'], ['好吃', '的']], support:51 217 | pattern:[['最'], ['最'], ['最']], support:78 218 | pattern:[['最'], ['最'], ['最'], ['的']], support:54 219 | pattern:[['最'], ['最'], ['最', '的']], support:65 220 | pattern:[['最'], ['最'], ['最', '的'], ['的']], support:53 221 | pattern:[['最'], ['最'], ['的']], support:78 222 | pattern:[['最'], ['最'], ['的'], ['的']], support:63 223 | pattern:[['得']], support:237 224 | pattern:[['得'], ['烤']], support:63 225 | pattern:[['得'], ['烤', '恰到好处']], support:55 226 | pattern:[['得'], ['烤', '得']], support:63 227 | pattern:[['得'], ['烤', '得', '恰到好处']], support:55 228 | pattern:[['得', '恰到好处']], support:184 229 | pattern:[['得'], ['恰到好处']], support:193 230 | pattern:[['得'], ['得']], support:235 231 | pattern:[['得'], ['得', '恰到好处']], support:183 232 | pattern:[['非常']], support:241 233 | pattern:[['非常'], ['的']], support:54 234 | pattern:[['非常'], ['非常']], support:195 235 | pattern:[['是']], support:259 236 | pattern:[['是'], ['最']], support:61 237 | pattern:[['是'], ['最'], ['最']], support:58 238 | pattern:[['是'], ['的']], support:174 239 | pattern:[['是'], ['的'], ['的']], support:130 240 | pattern:[['是'], ['的'], ['的'], ['的']], support:81 241 | pattern:[['是'], ['是']], support:234 242 | pattern:[['是'], ['是'], ['最']], support:52 243 | pattern:[['是'], ['是'], ['的']], support:133 244 | pattern:[['是'], ['是'], ['的'], ['的']], support:101 245 | pattern:[['是'], ['是'], ['的'], ['的'], ['的']], support:54 246 | pattern:[['是'], ['是'], ['是']], support:151 247 | pattern:[['是'], ['是'], ['是'], ['的']], support:83 248 | pattern:[['好']], support:272 249 | pattern:[['好'], ['的']], support:61 250 | pattern:[['好', '好吃']], support:63 251 | pattern:[['好'], ['好']], support:155 252 | pattern:[['好'], ['好'], ['好']], support:53 253 | pattern:[['都']], support:276 254 | pattern:[['都', '恰到好处']], support:52 255 | pattern:[['都'], ['的']], support:72 256 | pattern:[['都'], ['恰到好处']], support:81 257 | pattern:[['都', '很']], support:89 258 | pattern:[['都', '很'], ['都']], support:89 259 | pattern:[['都', '很'], ['都', '很']], support:89 260 | pattern:[['都', '很'], ['很']], support:89 261 | pattern:[['都'], ['很']], support:100 262 | pattern:[['都'], ['很'], ['都']], support:65 263 | pattern:[['都'], ['很'], ['都', '很']], support:65 264 | pattern:[['都'], ['很'], ['很']], support:77 265 | pattern:[['都'], ['都']], support:272 266 | pattern:[['都'], ['都', '恰到好处']], support:50 267 | pattern:[['都'], ['都'], ['的']], support:62 268 | pattern:[['都'], ['都'], ['很']], support:77 269 | pattern:[['都'], ['都', '很']], support:91 270 | pattern:[['都'], ['都', '很'], ['都']], support:65 271 | pattern:[['都'], ['都', '很'], ['都', '很']], support:65 272 | pattern:[['都'], ['都', '很'], ['很']], support:70 273 | pattern:[['都'], ['都'], ['都']], support:158 274 | pattern:[['都'], ['都'], ['都', '很']], support:65 275 | pattern:[['味道']], support:303 276 | pattern:[['味道'], ['很']], support:50 277 | pattern:[['味道', '恰到好处']], support:80 278 | pattern:[['味道'], ['恰到好处']], support:88 279 | pattern:[['味道'], ['的']], support:124 280 | pattern:[['味道'], ['的', '味道']], support:92 281 | pattern:[['味道'], ['味道']], support:236 282 | pattern:[['味道'], ['味道', '恰到好处']], support:59 283 | pattern:[['味道'], ['味道'], ['味道']], support:102 284 | pattern:[['装修']], support:305 285 | pattern:[['装修'], ['风格']], support:51 286 | pattern:[['装修', '古色古香']], support:54 287 | pattern:[['装修', '的']], support:74 288 | pattern:[['装修', '的'], ['古色古香']], support:51 289 | pattern:[['装修', '的'], ['装修']], support:56 290 | pattern:[['装修', '的'], ['很']], support:73 291 | pattern:[['装修', '的'], ['很'], ['很']], support:50 292 | pattern:[['装修', '的'], ['的']], support:74 293 | pattern:[['装修'], ['古色古香']], support:115 294 | pattern:[['装修'], ['装修']], support:119 295 | pattern:[['装修'], ['装修'], ['很']], support:58 296 | pattern:[['装修', '很']], support:133 297 | pattern:[['装修', '很'], ['古色古香']], support:54 298 | pattern:[['装修', '很'], ['很']], support:120 299 | pattern:[['装修'], ['的']], support:141 300 | pattern:[['装修'], ['的', '很']], support:57 301 | pattern:[['装修'], ['的'], ['很']], support:58 302 | pattern:[['装修'], ['的'], ['的']], support:61 303 | pattern:[['装修'], ['很']], support:152 304 | pattern:[['装修'], ['很'], ['很']], support:91 305 | pattern:[['新鲜']], support:309 306 | pattern:[['新鲜'], ['新鲜']], support:76 307 | pattern:[['和']], support:319 308 | pattern:[['和'], ['很']], support:56 309 | pattern:[['和'], ['很'], ['很']], support:55 310 | pattern:[['和'], ['都']], support:76 311 | pattern:[['和'], ['都'], ['都']], support:76 312 | pattern:[['和'], ['的']], support:112 313 | pattern:[['和'], ['的'], ['恰到好处']], support:66 314 | pattern:[['和'], ['的'], ['的']], support:100 315 | pattern:[['和'], ['的'], ['的'], ['的']], support:54 316 | pattern:[['和'], ['恰到好处']], support:138 317 | pattern:[['和'], ['和']], support:315 318 | pattern:[['和'], ['和'], ['很']], support:55 319 | pattern:[['和'], ['和'], ['很'], ['很']], support:50 320 | pattern:[['和'], ['和'], ['都']], support:75 321 | pattern:[['和'], ['和'], ['都'], ['都']], support:64 322 | pattern:[['和'], ['和'], ['的']], support:111 323 | pattern:[['和'], ['和'], ['的'], ['恰到好处']], support:66 324 | pattern:[['和'], ['和'], ['的'], ['的']], support:99 325 | pattern:[['和'], ['和'], ['恰到好处']], support:129 326 | pattern:[['和'], ['和'], ['和']], support:158 327 | pattern:[['和'], ['和'], ['和'], ['的']], support:56 328 | pattern:[['和'], ['和'], ['和'], ['恰到好处']], support:57 329 | pattern:[['好吃']], support:441 330 | pattern:[['好吃'], ['最']], support:53 331 | pattern:[['好吃'], ['最', '的']], support:51 332 | pattern:[['好吃'], ['最', '好吃']], support:53 333 | pattern:[['好吃'], ['最', '好吃', '的']], support:51 334 | pattern:[['好吃', '的']], support:70 335 | pattern:[['好吃', '的'], ['的']], support:62 336 | pattern:[['好吃', '的'], ['好吃']], support:64 337 | pattern:[['好吃', '的'], ['好吃', '的']], support:56 338 | pattern:[['好吃'], ['的']], support:100 339 | pattern:[['好吃'], ['的'], ['好吃']], support:63 340 | pattern:[['好吃'], ['的'], ['好吃', '的']], support:55 341 | pattern:[['好吃'], ['的'], ['的']], support:65 342 | pattern:[['好吃'], ['好吃']], support:148 343 | pattern:[['好吃'], ['好吃'], ['的']], support:65 344 | pattern:[['好吃'], ['好吃', '的']], support:68 345 | pattern:[['好吃'], ['好吃', '的'], ['好吃']], support:54 346 | pattern:[['好吃'], ['好吃', '的'], ['好吃', '的']], support:54 347 | pattern:[['好吃'], ['好吃', '的'], ['的']], support:57 348 | pattern:[['好吃'], ['好吃'], ['好吃']], support:84 349 | pattern:[['好吃'], ['好吃'], ['好吃', '的']], support:59 350 | pattern:[['很']], support:1398 351 | pattern:[['很'], ['有']], support:54 352 | pattern:[['很'], ['有'], ['有']], support:52 353 | pattern:[['很'], ['入味']], support:54 354 | pattern:[['很'], ['好吃']], support:57 355 | pattern:[['很', '古色古香']], support:72 356 | pattern:[['很', '入味']], support:73 357 | pattern:[['很'], ['古色古香']], support:93 358 | pattern:[['很'], ['都']], support:93 359 | pattern:[['很'], ['都', '很']], support:90 360 | pattern:[['很'], ['新鲜']], support:126 361 | pattern:[['很', '新鲜']], support:202 362 | pattern:[['很'], ['的']], support:235 363 | pattern:[['很'], ['的'], ['的']], support:84 364 | pattern:[['很'], ['的', '很']], support:131 365 | pattern:[['很'], ['很']], support:1091 366 | pattern:[['很'], ['很'], ['有']], support:52 367 | pattern:[['很'], ['很', '古色古香']], support:57 368 | pattern:[['很'], ['很'], ['的']], support:103 369 | pattern:[['很'], ['很'], ['的'], ['的']], support:74 370 | pattern:[['很'], ['很', '新鲜']], support:122 371 | pattern:[['很'], ['很'], ['很']], support:247 372 | pattern:[['很'], ['很'], ['很'], ['的']], support:53 373 | pattern:[['恰到好处']], support:1672 374 | pattern:[['恰到好处', '的']], support:96 375 | pattern:[['恰到好处', '的'], ['恰到好处']], support:84 376 | pattern:[['恰到好处', '的'], ['恰到好处', '的']], support:70 377 | pattern:[['恰到好处', '的'], ['的']], support:93 378 | pattern:[['恰到好处'], ['的']], support:126 379 | pattern:[['恰到好处'], ['的'], ['恰到好处']], support:62 380 | pattern:[['恰到好处'], ['的'], ['的']], support:78 381 | pattern:[['恰到好处'], ['恰到好处']], support:137 382 | pattern:[['恰到好处'], ['恰到好处'], ['的']], support:69 383 | pattern:[['恰到好处'], ['恰到好处', '的']], support:74 384 | pattern:[['恰到好处'], ['恰到好处', '的'], ['的']], support:62 385 | pattern:[['恰到好处'], ['恰到好处'], ['恰到好处']], support:84 386 | pattern:[['恰到好处'], ['恰到好处'], ['恰到好处', '的']], support:50 387 | pattern:[['的']], support:2446 388 | pattern:[['的'], ['是']], support:50 389 | pattern:[['的', '火候']], support:53 390 | pattern:[['的', '火候'], ['恰到好处']], support:53 391 | pattern:[['的', '火候'], ['的']], support:53 392 | pattern:[['的', '火候'], ['的', '火候']], support:53 393 | pattern:[['的', '火候'], ['火候']], support:53 394 | pattern:[['的'], ['煮']], support:54 395 | pattern:[['的'], ['煮', '的']], support:54 396 | pattern:[['的'], ['煮', '的', '恰到好处']], support:51 397 | pattern:[['的'], ['特别']], support:59 398 | pattern:[['的'], ['火候']], support:60 399 | pattern:[['的'], ['装修']], support:62 400 | pattern:[['的'], ['了']], support:63 401 | pattern:[['的'], ['都']], support:66 402 | pattern:[['的'], ['都'], ['都']], support:66 403 | pattern:[['的'], ['非常']], support:69 404 | pattern:[['的'], ['非常'], ['非常']], support:53 405 | pattern:[['的'], ['做']], support:73 406 | pattern:[['的'], ['做'], ['的']], support:53 407 | pattern:[['的'], ['做', '的']], support:68 408 | pattern:[['的'], ['做', '的'], ['的']], support:52 409 | pattern:[['的'], ['和']], support:80 410 | pattern:[['的'], ['和'], ['和']], support:79 411 | pattern:[['的'], ['和'], ['和'], ['和']], support:71 412 | pattern:[['的', '好吃']], support:85 413 | pattern:[['的', '好吃', '的']], support:59 414 | pattern:[['的', '好吃'], ['的']], support:59 415 | pattern:[['的'], ['古色古香']], support:88 416 | pattern:[['的', '味道']], support:90 417 | pattern:[['的', '味道'], ['的']], support:90 418 | pattern:[['的', '味道'], ['的', '味道']], support:90 419 | pattern:[['的', '味道'], ['味道']], support:90 420 | pattern:[['的'], ['好']], support:98 421 | pattern:[['的'], ['味道']], support:120 422 | pattern:[['的'], ['味道'], ['的']], support:56 423 | pattern:[['的'], ['味道'], ['味道']], support:86 424 | pattern:[['的', '很']], support:123 425 | pattern:[['的', '很'], ['的']], support:123 426 | pattern:[['的', '很'], ['的', '很']], support:123 427 | pattern:[['的', '很'], ['很']], support:123 428 | pattern:[['的', '很'], ['很'], ['很']], support:54 429 | pattern:[['的'], ['烤']], support:128 430 | pattern:[['的'], ['烤', '恰到好处']], support:100 431 | pattern:[['的'], ['烤', '的']], support:122 432 | pattern:[['的'], ['烤', '的', '恰到好处']], support:102 433 | pattern:[['的'], ['一如既往']], support:153 434 | pattern:[['的'], ['一如既往', '好吃']], support:59 435 | pattern:[['的'], ['一如既往'], ['的']], support:84 436 | pattern:[['的'], ['一如既往', '的']], support:149 437 | pattern:[['的'], ['一如既往', '的', '好吃']], support:65 438 | pattern:[['的'], ['一如既往', '的'], ['的']], support:83 439 | pattern:[['的'], ['好吃']], support:213 440 | pattern:[['的'], ['好吃', '的']], support:58 441 | pattern:[['的'], ['好吃'], ['的']], support:58 442 | pattern:[['的'], ['很']], support:332 443 | pattern:[['的'], ['很'], ['的']], support:112 444 | pattern:[['的'], ['很'], ['的', '很']], support:97 445 | pattern:[['的'], ['很'], ['很']], support:308 446 | pattern:[['的'], ['很'], ['很'], ['很']], support:60 447 | pattern:[['的', '恰到好处']], support:450 448 | pattern:[['的', '恰到好处'], ['的']], support:68 449 | pattern:[['的', '恰到好处', '的']], support:73 450 | pattern:[['的'], ['恰到好处']], support:900 451 | pattern:[['的'], ['恰到好处'], ['恰到好处']], support:50 452 | pattern:[['的'], ['恰到好处'], ['的']], support:66 453 | pattern:[['的'], ['恰到好处', '的']], support:72 454 | pattern:[['的'], ['的']], support:2225 455 | pattern:[['的'], ['的'], ['特别']], support:50 456 | pattern:[['的'], ['的'], ['非常']], support:53 457 | pattern:[['的'], ['的', '火候']], support:55 458 | pattern:[['的'], ['的'], ['了']], support:59 459 | pattern:[['的'], ['的'], ['都']], support:66 460 | pattern:[['的'], ['的'], ['都'], ['都']], support:56 461 | pattern:[['的'], ['的'], ['好']], support:74 462 | pattern:[['的'], ['的'], ['和']], support:80 463 | pattern:[['的'], ['的'], ['和'], ['和']], support:77 464 | pattern:[['的'], ['的', '好吃']], support:85 465 | pattern:[['的'], ['的'], ['味道']], support:93 466 | pattern:[['的'], ['的', '味道']], support:95 467 | pattern:[['的'], ['的', '味道'], ['的']], support:55 468 | pattern:[['的'], ['的', '味道'], ['味道']], support:78 469 | pattern:[['的'], ['的'], ['好吃']], support:103 470 | pattern:[['的'], ['的', '很']], support:176 471 | pattern:[['的'], ['的', '很'], ['的']], support:107 472 | pattern:[['的'], ['的', '很'], ['的', '很']], support:97 473 | pattern:[['的'], ['的', '很'], ['很']], support:176 474 | pattern:[['的'], ['的'], ['很']], support:308 475 | pattern:[['的'], ['的'], ['很'], ['很']], support:189 476 | pattern:[['的'], ['的'], ['恰到好处']], support:348 477 | pattern:[['的'], ['的', '恰到好处']], support:533 478 | pattern:[['的'], ['的'], ['的']], support:1075 479 | pattern:[['的'], ['的'], ['的'], ['好吃']], support:50 480 | pattern:[['的'], ['的'], ['的', '味道']], support:51 481 | pattern:[['的'], ['的'], ['的', '好吃']], support:59 482 | pattern:[['的'], ['的'], ['的'], ['很']], support:127 483 | pattern:[['的'], ['的'], ['的'], ['很'], ['很']], support:71 484 | pattern:[['的'], ['的'], ['的', '很']], support:141 485 | pattern:[['的'], ['的'], ['的', '很'], ['很']], support:78 486 | pattern:[['的'], ['的'], ['的', '恰到好处']], support:153 487 | pattern:[['的'], ['的'], ['的'], ['恰到好处']], support:157 488 | pattern:[['的'], ['的'], ['的'], ['的']], support:240 489 | pattern:[['的'], ['的'], ['的'], ['的'], ['恰到好处']], support:50 490 | pattern:[['的'], ['的'], ['的'], ['的', '恰到好处']], support:53 491 | pattern:[['的'], ['的'], ['的'], ['的'], ['的']], support:146 492 | -------------------------------------------------------------------------------- /lib/train_squence_dict.txt: -------------------------------------------------------------------------------- 1 | pattern:服务, dist:0.85119047619 2 | pattern:服务态度, dist:0.854651162791 3 | pattern:还, dist:0.880077369439 4 | pattern:还, 不错, dist:0.883990719258 5 | pattern:一如既往, 的, 好, dist:0.860589812332 6 | pattern:恰到好处, dist:0.854150702427 7 | pattern:味道, 不错, dist:0.918300653595 8 | pattern:很, 不错, dist:0.885583524027 9 | pattern:很, 好, dist:0.92101551481 10 | pattern:不错, dist:0.93665480427 11 | pattern:不错, 的, dist:0.859550561798 12 | pattern:的, 恰到好处, dist:0.857959961868 13 | pattern:烤, dist:0.879518072289 14 | pattern:新鲜, dist:0.895652173913 15 | pattern:最, dist:0.862595419847 16 | pattern:古色古香, dist:0.889380530973 17 | pattern:得, 恰到好处, dist:0.88038277512 18 | pattern:很, 新鲜, dist:0.88986784141 19 | -------------------------------------------------------------------------------- /model/model.txt: -------------------------------------------------------------------------------- 1 | tree 2 | version=v2 3 | num_class=1 4 | num_tree_per_iteration=1 5 | label_index=0 6 | max_feature_idx=32 7 | objective=binary sigmoid:1 8 | feature_names=Column_0 Column_1 Column_2 Column_3 Column_4 Column_5 Column_6 Column_7 Column_8 Column_9 Column_10 Column_11 Column_12 Column_13 Column_14 Column_15 Column_16 Column_17 Column_18 Column_19 Column_20 Column_21 Column_22 Column_23 Column_24 Column_25 Column_26 Column_27 Column_28 Column_29 Column_30 Column_31 Column_32 9 | feature_infos=[0:7] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:1] [0:6] [0:1] [0:1] [0:1] [2:14] none 10 | tree_sizes=2506 2543 2552 2555 2552 2547 2543 11 | 12 | Tree=0 13 | num_leaves=31 14 | num_cat=0 15 | split_feature=3 2 6 13 18 1 31 22 27 0 28 15 31 25 0 31 24 27 11 19 27 15 27 0 27 21 0 4 0 16 16 | split_gain=1672.7 662.476 335.058 296.572 257.955 209.945 165.141 145.247 93.0893 79.7694 69.8833 50.3365 49.0074 46.734 45.9252 34.9812 16.7761 14.0129 12.9446 8.90445 12.1735 8.28578 7.1752 5.11464 4.92162 4.47465 4.099 8.48594 3.30777 3.19911 17 | threshold=1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 3.5000000000000004 1.0000000180025095e-35 1.5000000000000002 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 7.5000000000000009 1.0000000180025095e-35 1.5000000000000002 2.5000000000000004 1.0000000180025095e-35 1.5000000000000002 1.0000000180025095e-35 1.0000000180025095e-35 1.5000000000000002 1.0000000180025095e-35 2.5000000000000004 2.5000000000000004 1.5000000000000002 1.0000000180025095e-35 1.5000000000000002 1.0000000180025095e-35 1.5000000000000002 1.0000000180025095e-35 18 | decision_type=2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 19 | left_child=1 2 3 4 5 11 9 8 13 -2 14 12 18 -7 -9 -11 -10 -3 -1 20 -6 25 -19 -14 -4 26 27 29 -17 -8 20 | right_child=6 17 24 -5 19 7 21 10 16 15 -12 -13 23 -15 -16 28 -18 22 -20 -21 -22 -23 -24 -25 -26 -27 -28 -29 -30 -31 21 | leaf_value=-2.0550189461947905 -1.43359967695186 -2.1238630485802656 1.3324744193585658 1.9337655915343765 -0.46314352002920495 -0.71826729292988867 0.82513904335239108 -1.2573287935892716 0.34715700441359321 -0.13478960358733616 -1.600032030544702 0.48144301777598986 -0.85923101510887101 0.91251519944103365 -0.66282756015982114 0.87470354242320036 -0.42132783139909341 -1.7845300302750768 -0.89245125663168179 1.5977725624548567 1.2674090364743396 2.0520701510719954 -0.84262089434746568 0.32778493198668257 1.9358513750862374 2.0509531566496841 1.6062272322182027 1.6560158430467975 1.3638675475976221 1.4144494497720264 22 | leaf_count=944 107 1747 200 173 26 2914 128 1036 559 166 961 42 27 81 1332 123 165 389 45 154 61 165 40 41 87 73 682 182 125 61 23 | internal_value=0 -0.309936 -0.0524874 -0.127942 -0.184548 -0.248422 1.88562 -0.11418 0.17345 0.879238 -0.435506 -1.10933 -1.19967 0.00871845 -0.240041 1.30051 0.8549 -1.35677 -1.31924 1.9747 1.43311 2.29175 -1.01383 0.539351 2.19826 2.22681 2.19166 2.01251 1.80414 1.69822 24 | internal_count=12836 11024 8848 8561 8388 8147 1812 7048 3719 521 3329 1099 1057 2995 2368 414 724 2176 989 241 87 1291 429 68 287 1126 1053 371 248 189 25 | shrinkage=1 26 | 27 | 28 | Tree=1 29 | num_leaves=31 30 | num_cat=0 31 | split_feature=2 0 7 20 21 31 29 29 19 27 31 27 31 27 31 9 31 31 22 10 31 0 0 27 0 11 21 31 24 31 32 | split_gain=114.803 48.5266 36.7434 34.635 29.9606 26.9151 23.0683 18.7995 17.4169 15.4168 15.2932 12.0685 11.0383 12.1317 14.3242 13.084 8.07905 6.91425 6.83414 6.62709 6.58866 10.4742 5.33016 5.32485 5.17965 5.17898 5.42688 4.80956 4.72427 4.6733 33 | threshold=1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 4.5000000000000009 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.5000000000000002 8.5000000000000018 2.5000000000000004 11.500000000000002 2.5000000000000004 7.5000000000000009 1.0000000180025095e-35 5.5000000000000009 2.5000000000000004 1.0000000180025095e-35 1.0000000180025095e-35 5.5000000000000009 2.5000000000000004 2.5000000000000004 1.5000000000000002 2.5000000000000004 1.0000000180025095e-35 1.0000000180025095e-35 5.5000000000000009 1.0000000180025095e-35 3.5000000000000004 34 | decision_type=2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 35 | left_child=1 8 3 4 7 6 -5 18 17 28 11 20 13 15 -15 -9 -4 -1 -3 -19 23 -22 -7 -6 -11 26 -26 -20 -2 -8 36 | right_child=9 2 16 5 10 22 29 12 -10 24 -12 -13 -14 14 -16 -17 -18 19 27 -21 21 -23 -24 -25 25 -27 -28 -29 -30 -31 37 | leaf_value=-1.072787817473303 -0.99143030324820647 -0.58301498931364892 -1.0533906648917402 0.57553047205342522 0.34668252739656358 0.51937105807709505 -0.45846102736128586 -0.050869127262312297 -1.2148470169001131 -0.56891188427912098 -0.61880657916297133 1.6229148458709972 -1.3071510236995709 0.90513099342250936 -0.099481208336353391 -0.8047535232902987 -0.19475151409256594 -0.23805065166435288 -0.10177182020897647 -1.2772456598100361 -0.50612807977557017 0.40951014753595427 0.94921090720815615 0.89562210588321467 0.97602095546759693 -1.2098072280005219 -0.2328265837454141 -0.47120193870363308 0.32635563936740086 0.012058618257987454 38 | leaf_count=89 1718 405 399 222 591 439 268 4994 169 305 81 41 33 157 146 232 110 481 682 62 108 133 189 101 49 20 61 363 29 159 39 | internal_value=0 -0.0597912 -0.0159528 0.00921915 -0.0511479 0.334795 0.0234401 -0.110746 -0.625012 -0.81592 0.287014 0.362811 -0.0514284 -0.0428279 0.406317 -0.0694361 -0.819104 -0.415534 -0.36151 -0.3144 0.316216 0.00506864 0.648413 0.423047 -0.367423 0.0828826 0.309904 -0.233897 -0.969555 -0.278643 40 | internal_count=12836 10654 9853 9344 8067 1277 649 7012 801 2182 1055 974 5562 5529 303 5226 509 632 1450 543 933 241 628 692 435 130 110 1045 1747 427 41 | shrinkage=1 42 | 43 | 44 | Tree=2 45 | num_leaves=31 46 | num_cat=0 47 | split_feature=2 31 31 25 19 0 8 23 10 26 31 9 31 0 31 24 20 24 1 24 27 0 15 27 31 26 3 0 4 27 48 | split_gain=24.8262 12.6623 21.4841 11.4282 10.5548 10.4549 7.66577 7.36499 7.36913 6.13696 6.66623 5.7936 16.253 5.13747 6.19751 4.95007 4.7082 6.20012 4.6244 4.37831 6.66809 4.37316 4.24535 4.14792 4.84689 4.08009 3.92112 6.49702 3.81669 3.61685 49 | threshold=1.0000000180025095e-35 3.5000000000000004 6.5000000000000009 1.0000000180025095e-35 1.0000000180025095e-35 2.5000000000000004 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 4.5000000000000009 1.0000000180025095e-35 4.5000000000000009 4.5000000000000009 9.5000000000000018 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 3.5000000000000004 1.5000000000000002 1.0000000180025095e-35 1.5000000000000002 5.5000000000000009 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 2.5000000000000004 50 | decision_type=2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 51 | left_child=1 6 7 4 23 19 16 8 9 11 -11 15 -13 29 -15 22 17 26 -17 20 25 -19 -3 24 -2 28 27 -1 -4 -7 52 | right_child=3 2 5 -5 -6 13 -8 -9 -10 10 -12 12 -14 14 -16 18 -18 21 -20 -21 -22 -23 -24 -25 -26 -27 -28 -29 -30 -31 53 | leaf_value=-0.67349032755458926 -0.84517582340787911 0.15644005186322876 -0.50042817977061227 1.629711881441342 0.9398979959210193 -0.14965875338958282 -1.0663700819369211 -0.3774201185991547 -0.74439049070234486 -1.1903881994668726 0.036517745979831519 -1.0583263561454659 1.9034316995745442 0.045189168725435734 1.0065819474815956 0.55985258913896407 0.06126216725013884 -0.080278576859951267 -0.22186881207374839 0.20894594351269716 0.88922308742772593 -1.1627299087656517 0.61086077494217328 -0.34056537690887184 -0.062368686198472217 0.55700865437479896 -0.00090272375185887152 -0.17791252746562625 0.48212965908394456 0.26601808634637619 54 | leaf_count=279 1528 4628 758 25 47 879 183 155 125 60 62 202 26 123 55 76 457 27 258 63 21 59 170 378 204 22 519 1285 29 133 55 | internal_value=0 -0.0278934 0.0215249 -0.501287 -0.546784 -0.17728 -0.167066 0.101064 0.116926 0.126035 -0.442469 0.13765 -0.533056 -0.0353251 0.337486 0.147134 -0.149397 -0.196634 -0.117614 -0.366977 -0.412725 -0.794134 0.167952 -0.6083 -0.748095 -0.445993 -0.169785 -0.23256 -0.473092 -0.0973796 56 | internal_count=12836 10654 7845 2182 2157 2083 2809 5762 5607 5482 122 5360 228 1190 178 5132 2626 2169 334 893 830 86 4798 2110 1732 809 2083 1564 787 1012 57 | shrinkage=1 58 | 59 | 60 | Tree=3 61 | num_leaves=31 62 | num_cat=0 63 | split_feature=8 2 31 31 1 0 30 13 7 31 0 27 21 19 25 31 10 11 24 0 31 0 28 31 20 22 31 31 0 31 64 | split_gain=6.71021 4.85772 4.30692 3.76561 5.83757 4.38595 6.56774 5.79834 5.18061 4.60596 3.95081 3.83341 3.27985 5.31947 4.96405 4.68151 3.10336 2.75141 2.27144 2.23361 2.19412 2.98619 2.31141 3.59664 2.16553 2.05352 2.22162 2.21449 2.16622 2.00491 65 | threshold=1.0000000180025095e-35 1.0000000180025095e-35 3.5000000000000004 9.5000000000000018 1.0000000180025095e-35 2.5000000000000004 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 5.5000000000000009 5.5000000000000009 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 2.5000000000000004 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 3.5000000000000004 4.5000000000000009 3.5000000000000004 1.0000000180025095e-35 8.5000000000000018 1.0000000180025095e-35 1.0000000180025095e-35 7.5000000000000009 6.5000000000000009 2.5000000000000004 7.5000000000000009 66 | decision_type=2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 67 | left_child=1 3 24 5 -5 7 10 8 12 -10 20 -6 14 15 16 -14 -1 18 19 25 21 -7 23 -22 -3 26 27 -4 -28 -24 68 | right_child=-2 2 17 4 11 6 -8 -9 9 -11 -12 -13 13 -15 -16 -17 -18 -19 -20 -21 22 -23 29 -25 -26 -27 28 -29 -30 -31 69 | leaf_value=-0.048873450666162804 -0.95761440885089855 -0.88910411123100086 0.032679373816888659 0.27657927105347768 0.43388862563259956 0.39415154675555086 -0.6774180080658786 0.69756570568118559 -0.96548280206818371 0.086429634737766561 -0.75375299716225685 -0.54161936766310248 0.89194540635156194 1.159286185871004 0.4514820222712036 0.039076045783276919 -0.68164654114375478 -0.67812174120880564 0.56391902889373602 -0.68919638312496889 0.19732327262213731 -0.50033632245286841 -0.18133569231222604 -0.12305895545147537 -0.21558073172611611 -0.57369287918420897 -1.0017323774632108 0.71582547703130339 0.34805465971922328 0.30236984337079675 70 | leaf_count=6707 240 550 656 97 30 256 57 104 270 65 29 198 30 27 96 693 137 228 57 76 1056 20 265 217 339 158 28 56 20 74 71 | internal_value=0 -0.0211186 -0.262226 -0.01023 -0.258069 -0.00164773 0.0958663 -0.0279332 -0.033863 -0.570496 0.119244 -0.442338 -0.0266418 0.111768 -0.0446056 0.0782576 -0.0531757 -0.124023 -0.0398946 -0.113305 0.132077 0.323298 0.0990613 0.141 -0.652006 -0.0284151 0.0661624 0.175535 -0.532429 -0.0869003 72 | internal_count=12836 12596 2168 10428 325 10103 1974 8129 8025 335 1917 228 7690 750 6940 723 6844 1279 1051 994 1888 276 1612 1273 889 918 760 712 48 339 73 | shrinkage=1 74 | 75 | 76 | Tree=4 77 | num_leaves=31 78 | num_cat=0 79 | split_feature=4 31 0 27 3 22 0 9 9 19 30 20 19 31 0 16 27 31 7 31 14 31 15 31 31 17 22 31 0 0 80 | split_gain=2.95349 2.09107 7.61079 5.71605 10.8131 2.69255 2.15869 8.36049 5.97966 5.80797 5.80534 5.60773 5.34924 6.07975 10.7853 5.21571 3.80563 4.25929 5.11087 3.64466 3.17517 5.0602 2.7163 2.5368 2.52847 2.51108 2.50341 2.45734 3.11318 2.24878 81 | threshold=1.0000000180025095e-35 2.5000000000000004 1.5000000000000002 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.5000000000000002 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 9.5000000000000018 3.5000000000000004 1.0000000180025095e-35 1.0000000180025095e-35 5.5000000000000009 1.0000000180025095e-35 4.5000000000000009 1.0000000180025095e-35 5.5000000000000009 1.0000000180025095e-35 6.5000000000000009 5.5000000000000009 1.0000000180025095e-35 1.0000000180025095e-35 4.5000000000000009 1.0000000180025095e-35 1.0000000180025095e-35 82 | decision_type=2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 83 | left_child=1 2 3 5 -5 -1 7 9 12 10 16 27 15 19 -15 20 23 18 -18 -14 22 -22 26 -3 -12 -19 -8 28 -11 -29 84 | right_child=-2 6 -4 4 -6 -7 8 -9 -10 11 24 -13 13 14 -16 -17 17 25 -20 -21 21 -23 -24 -25 -26 -27 -28 29 -30 -31 85 | leaf_value=0.28588926412019627 0.20548196811039632 -0.20694232236917057 -1.0671229395897599 -0.99840180448308158 0.039275536682173359 1.3872347254614692 -0.08025632049054908 -1.1111376959092034 1.1779891993825276 -0.67965403273145197 0.80032049833917773 0.68332053844162055 0.76126504060950584 -0.93889503707649657 0.84407935256935107 0.75814809036338493 0.091246042855297013 -0.22235392419757691 -1.0497793995849904 0.22767372979825046 2.7705739827444456 0.11349945407609044 -0.66966149335001335 0.70036274319917913 -0.11753440550808683 1.3446014439697709 0.028781679993167247 0.28130271193786566 -0.10105890402259009 -0.52753342111862278 86 | leaf_count=48 529 615 57 201 179 35 2813 232 26 136 67 35 81 64 27 67 2701 422 316 458 48 26 50 35 22 22 2872 29 404 219 87 | internal_value=0 -0.0174247 -0.178527 -0.0673055 -0.212563 0.507656 -0.00997688 -0.0537394 0.0196359 -0.0419781 0.0059506 -0.22424 0.0144398 0.217877 -0.36383 -0.0121458 -0.0130797 0.0316094 0.0777117 0.309307 -0.0198865 0.958419 -0.0236342 -0.180157 0.585434 -0.198135 -0.0187605 -0.268875 -0.171226 -0.4596 88 | internal_count=12836 12307 520 463 380 83 11787 5255 6532 5023 4200 823 6506 630 91 5876 4111 3461 3017 539 5809 74 5735 650 89 444 5685 788 540 248 89 | shrinkage=1 90 | 91 | 92 | Tree=5 93 | num_leaves=31 94 | num_cat=0 95 | split_feature=14 2 0 31 27 22 22 3 0 9 3 0 31 31 0 0 27 21 29 25 25 0 31 11 30 0 31 31 27 20 96 | split_gain=8.0797 1.41833 1.49682 2.90015 1.4793 5.37403 3.69211 3.40794 3.11617 3.066 3.34189 3.06452 3.36994 2.58858 7.43189 3.74184 2.58506 2.57085 2.99114 4.64915 2.58018 2.11639 1.94118 1.84212 1.82033 1.7451 1.58627 1.50993 2.13683 1.8482 97 | threshold=1.0000000180025095e-35 1.0000000180025095e-35 4.5000000000000009 9.5000000000000018 1.5000000000000002 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 7.5000000000000009 4.5000000000000009 1.5000000000000002 1.5000000000000002 2.5000000000000004 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 2.5000000000000004 4.5000000000000009 1.0000000180025095e-35 1.0000000180025095e-35 1.5000000000000002 4.5000000000000009 3.5000000000000004 1.0000000180025095e-35 1.0000000180025095e-35 98 | decision_type=2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 99 | left_child=1 4 3 -3 6 17 7 22 -8 10 13 -12 -13 15 16 -7 -15 20 -19 -20 24 -16 27 -10 26 -9 -6 -1 -29 -30 100 | right_child=-2 2 -4 -5 5 9 8 25 23 -11 11 12 -14 14 21 -17 -18 18 19 -21 -22 -23 -24 -25 -26 -27 -28 28 29 -31 101 | leaf_value=0.03170035808869482 -0.69079099725543081 -0.15557901433712443 0.6584285825803281 -1.5172651190139466 -0.4732035534280104 -0.13200299260800519 -0.37087600824375072 0.97649659497508845 -0.051930789941908723 -0.49814575141268291 0.46446902268315321 -0.42423664243607362 0.28306546409253325 1.0350819297896348 0.35321660509050085 0.54929060437939448 0.34448358446026622 -0.7045863156101434 0.35626138341077834 -0.92078073431480623 0.4083801502362065 0.051075837726934935 0.085436828272078033 -0.70617404378735527 0.38969919256714836 0.19971802263131966 -0.14513079221986447 0.05558167529924643 -0.29694188840460278 -0.0089717072398676524 102 | leaf_count=1296 329 1804 24 25 88 210 340 40 3923 240 57 169 77 115 237 57 41 27 209 23 45 250 1551 23 29 58 649 263 319 318 103 | internal_value=0 -0.00841308 -0.163634 -0.195601 -0.0032152 0.0500899 -0.0195305 0.034081 -0.0724102 0.161177 0.183521 -0.0728149 -0.213296 0.248287 0.325001 0.0383019 0.811718 -0.0712727 0.156315 0.244554 -0.130571 0.195265 0.0242746 -0.0564861 -0.16225 0.571455 -0.185357 -0.0256981 -0.10096 -0.191221 104 | internal_count=12836 12507 1853 1829 10654 2523 8131 3845 4286 1453 1213 303 246 910 643 267 156 1070 259 232 811 487 3747 3946 766 98 737 2196 900 637 105 | shrinkage=1 106 | 107 | 108 | Tree=6 109 | num_leaves=31 110 | num_cat=0 111 | split_feature=5 22 8 31 0 0 12 31 31 24 0 20 31 0 28 31 27 31 7 10 14 27 17 31 0 27 1 27 27 17 112 | split_gain=1.88932 2.56327 1.04426 0.934031 0.85097 0.696562 0.663971 2.22751 0.798063 0.700531 5.2877 3.34037 2.92166 1.53369 1.13783 1.11071 1.87414 1.06014 1.0239 1.0768 0.860488 1.73991 1.28486 1.6205 0.745665 0.905978 0.664893 0.61309 0.477053 0.437942 113 | threshold=1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 3.5000000000000004 5.5000000000000009 1.5000000000000002 1.0000000180025095e-35 4.5000000000000009 6.5000000000000009 1.0000000180025095e-35 1.5000000000000002 1.0000000180025095e-35 5.5000000000000009 4.5000000000000009 1.0000000180025095e-35 8.5000000000000018 1.5000000000000002 3.5000000000000004 1.0000000180025095e-35 1.0000000180025095e-35 1.0000000180025095e-35 1.5000000000000002 1.0000000180025095e-35 5.5000000000000009 1.0000000180025095e-35 1.5000000000000002 1.0000000180025095e-35 1.5000000000000002 1.5000000000000002 1.0000000180025095e-35 114 | decision_type=2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 115 | left_child=2 -2 4 -3 6 -4 9 -8 -9 18 12 13 17 14 -12 16 -13 -11 20 24 22 29 26 -24 -20 -26 -1 -5 -19 -22 116 | right_child=1 3 5 27 -6 -7 7 8 -10 10 11 15 -14 -15 -16 -17 -18 28 19 -21 21 -23 23 -25 25 -27 -28 -29 -30 -31 117 | leaf_value=0.036860401016981056 1.1150567535245364 -0.004703486242172295 -1.047725186830176 0.51228452616816034 0.34103373588574293 -0.090328537949230028 -1.0217366267459043 -0.18693358372592297 0.78207185396005563 0.1437791693515631 -0.32375026928689593 0.030703883589016368 -0.27068788599881771 -0.89951870914315168 -0.0048903627427402578 -0.24403738854710949 0.82255401883839063 0.46061406832327284 -1.1616515905485312 -1.1114029011344582 -0.41204483113273793 0.49364247162752961 -0.44581570934906301 0.65729035813041847 -0.28145438266364625 0.38497862049267345 -0.0114951691308038 -0.0476015464035454 0.83083709727774957 -1.1033428580219313 118 | leaf_count=3925 28 84 210 52 46 30 230 73 22 37 337 36 33 20 94 21 37 48 22 64 255 24 107 92 237 37 6519 33 49 34 119 | internal_value=0 0.245146 -0.00843234 0.146559 -0.00740326 -0.593286 -0.00881333 -0.332832 0.180313 -0.00762542 -0.0830963 -0.19998 0.311052 -0.292768 -0.257699 0.206688 0.356528 0.502364 -0.00222484 -0.28086 6.61776e-05 -0.286743 0.00195207 0.410373 -0.181744 -0.116627 -3.84114e-05 0.376574 0.652019 -0.501282 120 | internal_count=12836 197 12639 169 12399 240 12353 325 95 12028 712 545 167 451 431 94 73 134 11316 360 10956 313 10643 199 296 274 10444 85 97 289 121 | shrinkage=1 122 | 123 | 124 | end of trees 125 | 126 | feature importances: 127 | Column_31=48 128 | Column_0=35 129 | Column_27=23 130 | Column_22=8 131 | Column_24=7 132 | Column_19=6 133 | Column_20=6 134 | Column_2=5 135 | Column_3=5 136 | Column_9=5 137 | Column_21=5 138 | Column_25=5 139 | Column_1=4 140 | Column_7=4 141 | Column_10=4 142 | Column_11=4 143 | Column_15=4 144 | Column_4=3 145 | Column_8=3 146 | Column_14=3 147 | Column_17=3 148 | Column_28=3 149 | Column_29=3 150 | Column_30=3 151 | Column_13=2 152 | Column_16=2 153 | Column_26=2 154 | Column_5=1 155 | Column_6=1 156 | Column_12=1 157 | Column_18=1 158 | Column_23=1 159 | 160 | parameters: 161 | [boosting: gbdt] 162 | [objective: binary] 163 | [metric: binary_error] 164 | [tree_learner: serial] 165 | [device_type: cpu] 166 | [data: ] 167 | [valid: ] 168 | [num_iterations: 100] 169 | [learning_rate: 1] 170 | [num_leaves: 31] 171 | [num_threads: 1] 172 | [max_depth: 9] 173 | [min_data_in_leaf: 20] 174 | [min_sum_hessian_in_leaf: 0.001] 175 | [bagging_fraction: 1] 176 | [bagging_freq: 0] 177 | [bagging_seed: 3] 178 | [feature_fraction: 1] 179 | [feature_fraction_seed: 2] 180 | [early_stopping_round: 0] 181 | [max_delta_step: 0] 182 | [lambda_l1: 0] 183 | [lambda_l2: 0] 184 | [min_gain_to_split: 0] 185 | [drop_rate: 0.1] 186 | [max_drop: 50] 187 | [skip_drop: 0.5] 188 | [xgboost_dart_mode: 0] 189 | [uniform_drop: 0] 190 | [drop_seed: 4] 191 | [top_rate: 0.2] 192 | [other_rate: 0.1] 193 | [min_data_per_group: 100] 194 | [max_cat_threshold: 32] 195 | [cat_l2: 10] 196 | [cat_smooth: 10] 197 | [max_cat_to_onehot: 4] 198 | [top_k: 20] 199 | [monotone_constraints: ] 200 | [feature_contri: ] 201 | [forcedsplits_filename: ] 202 | [refit_decay_rate: 0.9] 203 | [verbosity: 1] 204 | [max_bin: 255] 205 | [min_data_in_bin: 3] 206 | [bin_construct_sample_cnt: 200000] 207 | [histogram_pool_size: -1] 208 | [data_random_seed: 1] 209 | [output_model: LightGBM_model.txt] 210 | [snapshot_freq: -1] 211 | [input_model: ] 212 | [output_result: LightGBM_predict_result.txt] 213 | [initscore_filename: ] 214 | [valid_data_initscores: ] 215 | [pre_partition: 0] 216 | [enable_bundle: 1] 217 | [max_conflict_rate: 0] 218 | [is_enable_sparse: 1] 219 | [sparse_threshold: 0.8] 220 | [use_missing: 1] 221 | [zero_as_missing: 0] 222 | [two_round: 0] 223 | [save_binary: 0] 224 | [enable_load_from_binary_file: 1] 225 | [header: 0] 226 | [label_column: ] 227 | [weight_column: ] 228 | [group_column: ] 229 | [ignore_column: ] 230 | [categorical_feature: ] 231 | [predict_raw_score: 0] 232 | [predict_leaf_index: 0] 233 | [predict_contrib: 0] 234 | [num_iteration_predict: -1] 235 | [pred_early_stop: 0] 236 | [pred_early_stop_freq: 10] 237 | [pred_early_stop_margin: 10] 238 | [convert_model_language: ] 239 | [convert_model: gbdt_prediction.cpp] 240 | [num_class: 1] 241 | [is_unbalance: 0] 242 | [scale_pos_weight: 1] 243 | [sigmoid: 1] 244 | [boost_from_average: 1] 245 | [reg_sqrt: 0] 246 | [alpha: 0.9] 247 | [fair_c: 1] 248 | [poisson_max_delta_step: 0.7] 249 | [tweedie_variance_power: 1.5] 250 | [max_position: 20] 251 | [label_gain: ] 252 | [metric_freq: 1] 253 | [is_provide_training_metric: 0] 254 | [eval_at: ] 255 | [num_machines: 1] 256 | [local_listen_port: 12400] 257 | [time_out: 120] 258 | [machine_list_filename: ] 259 | [machines: ] 260 | [gpu_platform_id: -1] 261 | [gpu_device_id: -1] 262 | [gpu_use_dp: 0] 263 | 264 | end of parameters 265 | 266 | pandas_categorical:null 267 | -------------------------------------------------------------------------------- /model/xgb.dump.raw.txt: -------------------------------------------------------------------------------- 1 | booster[0]: 2 | 0:[f3<-9.53674e-007] yes=1,no=2,missing=1 3 | 1:[f2<-9.53674e-007] yes=3,no=4,missing=3 4 | 3:[f6<-9.53674e-007] yes=7,no=8,missing=7 5 | 7:[f13<-9.53674e-007] yes=15,no=16,missing=15 6 | 15:leaf=-0.821735 7 | 16:leaf=1.63842 8 | 8:[f31<3.5] yes=17,no=18,missing=17 9 | 17:leaf=0.964286 10 | 18:leaf=1.45355 11 | 4:[f6<-9.53674e-007] yes=9,no=10,missing=9 12 | 9:[f27<2.5] yes=19,no=20,missing=19 13 | 19:leaf=-1.88956 14 | 20:leaf=-0.790698 15 | 10:leaf=1 16 | 2:[f31<3.5] yes=5,no=6,missing=5 17 | 5:[f0<0.5] yes=11,no=12,missing=11 18 | 11:[f28<-9.53674e-007] yes=21,no=22,missing=21 19 | 21:leaf=-1.49206 20 | 22:leaf=-0.923077 21 | 12:[f31<2.5] yes=23,no=24,missing=23 22 | 23:leaf=-0.164706 23 | 24:leaf=0.936508 24 | 6:[f10<-9.53674e-007] yes=13,no=14,missing=13 25 | 13:[f15<-9.53674e-007] yes=25,no=26,missing=25 26 | 25:leaf=1.33215 27 | 26:leaf=1.73965 28 | 14:leaf=-0.5 29 | booster[1]: 30 | 0:[f18<-9.53674e-007] yes=1,no=2,missing=1 31 | 1:[f2<-9.53674e-007] yes=3,no=4,missing=3 32 | 3:[f7<-9.53674e-007] yes=7,no=8,missing=7 33 | 7:[f22<-9.53674e-007] yes=13,no=14,missing=13 34 | 13:leaf=0.314021 35 | 14:leaf=-0.224416 36 | 8:[f31<7.5] yes=15,no=16,missing=15 37 | 15:leaf=-1.33295 38 | 16:leaf=0.615335 39 | 4:[f27<1.5] yes=9,no=10,missing=9 40 | 9:[f24<-9.53674e-007] yes=17,no=18,missing=17 41 | 17:leaf=-1.03867 42 | 18:leaf=0.0446815 43 | 10:[f0<2.5] yes=19,no=20,missing=19 44 | 19:leaf=-0.530085 45 | 20:leaf=0.0885103 46 | 2:[f23<-9.53674e-007] yes=5,no=6,missing=5 47 | 5:[f29<-9.53674e-007] yes=11,no=12,missing=11 48 | 11:[f0<2.5] yes=21,no=22,missing=21 49 | 21:leaf=-0.255734 50 | 22:leaf=0.714835 51 | 12:[f31<11.5] yes=23,no=24,missing=23 52 | 23:leaf=2.36027 53 | 24:leaf=0.0737543 54 | 6:leaf=0.0864305 55 | booster[2]: 56 | 0:[f0<1.5] yes=1,no=2,missing=1 57 | 1:[f25<-9.53674e-007] yes=3,no=4,missing=3 58 | 3:[f3<-9.53674e-007] yes=7,no=8,missing=7 59 | 7:[f1<-9.53674e-007] yes=15,no=16,missing=15 60 | 15:leaf=-0.833785 61 | 16:leaf=-0.308235 62 | 8:[f4<-9.53674e-007] yes=17,no=18,missing=17 63 | 17:leaf=0.0309599 64 | 18:leaf=0.441062 65 | 4:[f31<6.5] yes=9,no=10,missing=9 66 | 9:[f31<4.5] yes=19,no=20,missing=19 67 | 19:leaf=0.810088 68 | 20:leaf=1.89812 69 | 10:leaf=-0.28343 70 | 2:[f29<-9.53674e-007] yes=5,no=6,missing=5 71 | 5:[f20<-9.53674e-007] yes=11,no=12,missing=11 72 | 11:[f21<-9.53674e-007] yes=21,no=22,missing=21 73 | 21:leaf=-0.577434 74 | 22:leaf=-0.0028292 75 | 12:[f31<3.5] yes=23,no=24,missing=23 76 | 23:leaf=-0.156102 77 | 24:leaf=0.856824 78 | 6:[f2<-9.53674e-007] yes=13,no=14,missing=13 79 | 13:[f27<1.5] yes=25,no=26,missing=25 80 | 25:leaf=0.231247 81 | 26:leaf=0.618416 82 | 14:[f27<1.5] yes=27,no=28,missing=27 83 | 27:leaf=-0.705093 84 | 28:leaf=-0.00610159 85 | booster[3]: 86 | 0:[f0<0.5] yes=1,no=2,missing=1 87 | 1:[f20<-9.53674e-007] yes=3,no=4,missing=3 88 | 3:[f27<1.5] yes=7,no=8,missing=7 89 | 7:[f19<-9.53674e-007] yes=15,no=16,missing=15 90 | 15:leaf=-0.678991 91 | 16:leaf=-1.18221 92 | 8:[f31<3.5] yes=17,no=18,missing=17 93 | 17:leaf=-0.452843 94 | 18:leaf=-0.0122485 95 | 4:[f10<-9.53674e-007] yes=9,no=10,missing=9 96 | 9:[f29<-9.53674e-007] yes=19,no=20,missing=19 97 | 19:leaf=-0.12872 98 | 20:leaf=0.424762 99 | 10:leaf=-1.03684 100 | 2:[f8<-9.53674e-007] yes=5,no=6,missing=5 101 | 5:[f31<6.5] yes=11,no=12,missing=11 102 | 11:[f9<-9.53674e-007] yes=21,no=22,missing=21 103 | 21:leaf=0.0983527 104 | 22:leaf=-0.936762 105 | 12:[f20<-9.53674e-007] yes=23,no=24,missing=23 106 | 23:leaf=-0.253504 107 | 24:leaf=0.23708 108 | 6:[f31<6.5] yes=13,no=14,missing=13 109 | 13:leaf=-1.16213 110 | 14:leaf=-0.294644 111 | booster[4]: 112 | 0:[f27<2.5] yes=1,no=2,missing=1 113 | 1:[f15<-9.53674e-007] yes=3,no=4,missing=3 114 | 3:[f7<-9.53674e-007] yes=7,no=8,missing=7 115 | 7:[f13<-9.53674e-007] yes=15,no=16,missing=15 116 | 15:leaf=-0.0529392 117 | 16:leaf=0.772912 118 | 8:[f31<5.5] yes=17,no=18,missing=17 119 | 17:leaf=-0.95063 120 | 18:leaf=-0.336567 121 | 4:[f31<7.5] yes=9,no=10,missing=9 122 | 9:[f3<-9.53674e-007] yes=19,no=20,missing=19 123 | 19:leaf=1.55243 124 | 20:leaf=0.615241 125 | 10:leaf=-0.536299 126 | 2:[f31<7.5] yes=5,no=6,missing=5 127 | 5:[f10<-9.53674e-007] yes=11,no=12,missing=11 128 | 11:[f18<-9.53674e-007] yes=21,no=22,missing=21 129 | 21:leaf=1.06691 130 | 22:leaf=-0.260892 131 | 12:leaf=-0.513161 132 | 6:[f22<-9.53674e-007] yes=13,no=14,missing=13 133 | 13:[f31<8.5] yes=23,no=24,missing=23 134 | 23:leaf=0.345343 135 | 24:leaf=-0.45714 136 | 14:[f1<-9.53674e-007] yes=25,no=26,missing=25 137 | 25:leaf=0.795905 138 | 26:leaf=0.0597556 139 | booster[5]: 140 | 0:[f0<2.5] yes=1,no=2,missing=1 141 | 1:[f10<-9.53674e-007] yes=3,no=4,missing=3 142 | 3:[f27<1.5] yes=7,no=8,missing=7 143 | 7:[f3<-9.53674e-007] yes=15,no=16,missing=15 144 | 15:leaf=-0.126376 145 | 16:leaf=0.151212 146 | 8:[f21<-9.53674e-007] yes=17,no=18,missing=17 147 | 17:leaf=0.0587987 148 | 18:leaf=0.68416 149 | 4:[f21<-9.53674e-007] yes=9,no=10,missing=9 150 | 9:[f31<7.5] yes=19,no=20,missing=19 151 | 19:leaf=-1.01924 152 | 20:leaf=-0.0633188 153 | 10:leaf=0 154 | 2:[f24<-9.53674e-007] yes=5,no=6,missing=5 155 | 5:[f25<-9.53674e-007] yes=11,no=12,missing=11 156 | 11:[f2<-9.53674e-007] yes=21,no=22,missing=21 157 | 21:leaf=0.216265 158 | 22:leaf=-0.321342 159 | 12:leaf=1.41876 160 | 6:[f21<-9.53674e-007] yes=13,no=14,missing=13 161 | 13:[f1<-9.53674e-007] yes=23,no=24,missing=23 162 | 23:leaf=0.179113 163 | 24:leaf=-0.593337 164 | 14:[f30<-9.53674e-007] yes=25,no=26,missing=25 165 | 25:leaf=0.209776 166 | 26:leaf=-0.800748 167 | booster[6]: 168 | 0:[f20<-9.53674e-007] yes=1,no=2,missing=1 169 | 1:[f24<-9.53674e-007] yes=3,no=4,missing=3 170 | 3:[f23<-9.53674e-007] yes=7,no=8,missing=7 171 | 7:[f2<-9.53674e-007] yes=15,no=16,missing=15 172 | 15:leaf=0.0173922 173 | 16:leaf=-0.39285 174 | 8:[f27<2.5] yes=17,no=18,missing=17 175 | 17:leaf=-0.423076 176 | 18:leaf=0.322943 177 | 4:[f0<1.5] yes=9,no=10,missing=9 178 | 9:[f31<3.5] yes=19,no=20,missing=19 179 | 19:leaf=-0.101153 180 | 20:leaf=0.258696 181 | 10:[f0<2.5] yes=21,no=22,missing=21 182 | 21:leaf=-0.734043 183 | 22:leaf=-0.174865 184 | 2:[f0<1.5] yes=5,no=6,missing=5 185 | 5:[f29<-9.53674e-007] yes=11,no=12,missing=11 186 | 11:[f31<5.5] yes=23,no=24,missing=23 187 | 23:leaf=0.801589 188 | 24:leaf=-0.109166 189 | 12:[f31<3.5] yes=25,no=26,missing=25 190 | 25:leaf=-0.201747 191 | 26:leaf=0.488246 192 | 6:[f31<4.5] yes=13,no=14,missing=13 193 | 13:[f28<-9.53674e-007] yes=27,no=28,missing=27 194 | 27:leaf=-0.487416 195 | 28:leaf=-0.0367897 196 | 14:[f10<-9.53674e-007] yes=29,no=30,missing=29 197 | 29:leaf=0.0894192 198 | 30:leaf=-0.898212 199 | booster[7]: 200 | 0:[f21<-9.53674e-007] yes=1,no=2,missing=1 201 | 1:[f27<0.5] yes=3,no=4,missing=3 202 | 3:[f31<8.5] yes=7,no=8,missing=7 203 | 7:[f0<1.5] yes=15,no=16,missing=15 204 | 15:leaf=-0.339847 205 | 16:leaf=-0.141733 206 | 8:[f22<-9.53674e-007] yes=17,no=18,missing=17 207 | 17:leaf=0.793061 208 | 18:leaf=0.0578814 209 | 4:[f31<2.5] yes=9,no=10,missing=9 210 | 9:[f3<-9.53674e-007] yes=19,no=20,missing=19 211 | 19:leaf=-1.05684 212 | 20:leaf=-0.035109 213 | 10:[f8<-9.53674e-007] yes=21,no=22,missing=21 214 | 21:leaf=0.0281911 215 | 22:leaf=-0.868101 216 | 2:[f0<1.5] yes=5,no=6,missing=5 217 | 5:[f2<-9.53674e-007] yes=11,no=12,missing=11 218 | 11:[f27<1.5] yes=23,no=24,missing=23 219 | 23:leaf=0.427309 220 | 24:leaf=1.1673 221 | 12:[f31<3.5] yes=25,no=26,missing=25 222 | 25:leaf=-0.725163 223 | 26:leaf=0.0699187 224 | 6:[f31<8.5] yes=13,no=14,missing=13 225 | 13:[f31<3.5] yes=27,no=28,missing=27 226 | 27:leaf=-0.214998 227 | 28:leaf=0.1541 228 | 14:[f2<-9.53674e-007] yes=29,no=30,missing=29 229 | 29:leaf=-0.430892 230 | 30:leaf=0.300681 231 | booster[8]: 232 | 0:[f31<10.5] yes=1,no=2,missing=1 233 | 1:[f7<-9.53674e-007] yes=3,no=4,missing=3 234 | 3:[f25<-9.53674e-007] yes=7,no=8,missing=7 235 | 7:[f5<-9.53674e-007] yes=15,no=16,missing=15 236 | 15:leaf=-0.00766696 237 | 16:leaf=0.315451 238 | 8:[f0<1.5] yes=17,no=18,missing=17 239 | 17:leaf=-0.0340331 240 | 18:leaf=0.797249 241 | 4:[f24<-9.53674e-007] yes=9,no=10,missing=9 242 | 9:[f19<-9.53674e-007] yes=19,no=20,missing=19 243 | 19:leaf=-0.527685 244 | 20:leaf=-0.241811 245 | 10:[f31<8.5] yes=21,no=22,missing=21 246 | 21:leaf=0.546652 247 | 22:leaf=-0.314251 248 | 2:[f0<4.5] yes=5,no=6,missing=5 249 | 5:[f20<-9.53674e-007] yes=11,no=12,missing=11 250 | 11:[f0<3.5] yes=23,no=24,missing=23 251 | 23:leaf=-0.916697 252 | 24:leaf=-0.383964 253 | 12:[f2<-9.53674e-007] yes=25,no=26,missing=25 254 | 25:leaf=0.248193 255 | 26:leaf=-0.324032 256 | 6:[f22<-9.53674e-007] yes=13,no=14,missing=13 257 | 13:leaf=1.44253 258 | 14:leaf=-0.386791 259 | booster[9]: 260 | 0:[f9<-9.53674e-007] yes=1,no=2,missing=1 261 | 1:[f31<5.5] yes=3,no=4,missing=3 262 | 3:[f2<-9.53674e-007] yes=7,no=8,missing=7 263 | 7:[f13<-9.53674e-007] yes=13,no=14,missing=13 264 | 13:leaf=0.0433643 265 | 14:leaf=0.65465 266 | 8:[f20<-9.53674e-007] yes=15,no=16,missing=15 267 | 15:leaf=-0.558606 268 | 16:leaf=-0.0501384 269 | 4:[f17<-9.53674e-007] yes=9,no=10,missing=9 270 | 9:[f16<-9.53674e-007] yes=17,no=18,missing=17 271 | 17:leaf=-0.0776021 272 | 18:leaf=0.552179 273 | 10:[f23<-9.53674e-007] yes=19,no=20,missing=19 274 | 19:leaf=1.88839 275 | 20:leaf=0.00354584 276 | 2:[f31<4.5] yes=5,no=6,missing=5 277 | 5:leaf=-0.983435 278 | 6:[f0<1.5] yes=11,no=12,missing=11 279 | 11:[f22<-9.53674e-007] yes=21,no=22,missing=21 280 | 21:leaf=0.703799 281 | 22:leaf=-0.573726 282 | 12:[f0<2.5] yes=23,no=24,missing=23 283 | 23:leaf=1.06149 284 | 24:leaf=0.139718 285 | booster[10]: 286 | 0:[f11<-9.53674e-007] yes=1,no=2,missing=1 287 | 1:[f31<3.5] yes=3,no=4,missing=3 288 | 3:[f18<-9.53674e-007] yes=7,no=8,missing=7 289 | 7:[f19<-9.53674e-007] yes=15,no=16,missing=15 290 | 15:leaf=-0.0376201 291 | 16:leaf=-0.303873 292 | 8:leaf=0.630718 293 | 4:[f19<-9.53674e-007] yes=9,no=10,missing=9 294 | 9:[f31<11.5] yes=17,no=18,missing=17 295 | 17:leaf=0.012662 296 | 18:leaf=-0.788187 297 | 10:[f31<9.5] yes=19,no=20,missing=19 298 | 19:leaf=0.144924 299 | 20:leaf=-0.339938 300 | 2:[f2<-9.53674e-007] yes=5,no=6,missing=5 301 | 5:[f20<-9.53674e-007] yes=11,no=12,missing=11 302 | 11:[f27<0.5] yes=21,no=22,missing=21 303 | 21:leaf=-0.850763 304 | 22:leaf=0.119742 305 | 12:[f31<5.5] yes=23,no=24,missing=23 306 | 23:leaf=-0.0298949 307 | 24:leaf=1.23398 308 | 6:[f31<5.5] yes=13,no=14,missing=13 309 | 13:[f27<1.5] yes=25,no=26,missing=25 310 | 25:leaf=-0.664988 311 | 26:leaf=0.183825 312 | 14:leaf=-0.99024 313 | booster[11]: 314 | 0:[f27<3.5] yes=1,no=2,missing=1 315 | 1:[f27<2.5] yes=3,no=4,missing=3 316 | 3:[f8<-9.53674e-007] yes=7,no=8,missing=7 317 | 7:[f9<-9.53674e-007] yes=13,no=14,missing=13 318 | 13:leaf=0.00388098 319 | 14:leaf=-0.402797 320 | 8:leaf=-0.788359 321 | 4:[f21<-9.53674e-007] yes=9,no=10,missing=9 322 | 9:[f23<-9.53674e-007] yes=15,no=16,missing=15 323 | 15:leaf=-0.242939 324 | 16:leaf=0.570836 325 | 10:[f24<-9.53674e-007] yes=17,no=18,missing=17 326 | 17:leaf=-0.248544 327 | 18:leaf=0.64505 328 | 2:[f20<-9.53674e-007] yes=5,no=6,missing=5 329 | 5:[f0<3.5] yes=11,no=12,missing=11 330 | 11:[f27<4.5] yes=19,no=20,missing=19 331 | 19:leaf=0.954944 332 | 20:leaf=0.0403577 333 | 12:leaf=-0.195032 334 | 6:leaf=-1.59441 335 | booster[12]: 336 | 0:[f0<4.5] yes=1,no=2,missing=1 337 | 1:[f17<-9.53674e-007] yes=3,no=4,missing=3 338 | 3:[f14<-9.53674e-007] yes=7,no=8,missing=7 339 | 7:[f31<6.5] yes=15,no=16,missing=15 340 | 15:leaf=0.00857334 341 | 16:leaf=-0.0585062 342 | 8:[f31<3.5] yes=17,no=18,missing=17 343 | 17:leaf=-0.461265 344 | 18:leaf=1.04763 345 | 4:[f20<-9.53674e-007] yes=9,no=10,missing=9 346 | 9:[f0<1.5] yes=19,no=20,missing=19 347 | 19:leaf=0.220695 348 | 20:leaf=-0.304324 349 | 10:leaf=-0.642145 350 | 2:[f31<7.5] yes=5,no=6,missing=5 351 | 5:[f0<5.5] yes=11,no=12,missing=11 352 | 11:[f27<0.5] yes=21,no=22,missing=21 353 | 21:leaf=-0.995081 354 | 22:leaf=0.254432 355 | 12:leaf=-1.23996 356 | 6:[f31<9.5] yes=13,no=14,missing=13 357 | 13:[f29<-9.53674e-007] yes=23,no=24,missing=23 358 | 23:leaf=0.776009 359 | 24:leaf=-0.0701542 360 | 14:[f28<-9.53674e-007] yes=25,no=26,missing=25 361 | 25:leaf=0.93862 362 | 26:leaf=-0.41759 363 | booster[13]: 364 | 0:[f26<-9.53674e-007] yes=1,no=2,missing=1 365 | 1:[f20<-9.53674e-007] yes=3,no=4,missing=3 366 | 3:[f0<6.5] yes=7,no=8,missing=7 367 | 7:[f12<-9.53674e-007] yes=15,no=16,missing=15 368 | 15:leaf=-0.00735334 369 | 16:leaf=-0.35686 370 | 8:leaf=-0.663981 371 | 4:[f10<-9.53674e-007] yes=9,no=10,missing=9 372 | 9:[f0<3.5] yes=17,no=18,missing=17 373 | 17:leaf=0.0434706 374 | 18:leaf=0.390639 375 | 10:[f31<5.5] yes=19,no=20,missing=19 376 | 19:leaf=-0.780065 377 | 20:leaf=-0.0684597 378 | 2:[f31<4.5] yes=5,no=6,missing=5 379 | 5:[f29<-9.53674e-007] yes=11,no=12,missing=11 380 | 11:leaf=-0.388065 381 | 12:leaf=-1.30039 382 | 6:[f1<-9.53674e-007] yes=13,no=14,missing=13 383 | 13:[f31<6.5] yes=21,no=22,missing=21 384 | 21:leaf=-0.794325 385 | 22:leaf=0.156165 386 | 14:[f24<-9.53674e-007] yes=23,no=24,missing=23 387 | 23:leaf=0.42538 388 | 24:leaf=-0.488206 389 | -------------------------------------------------------------------------------- /pretreatment.py: -------------------------------------------------------------------------------- 1 | import numpy as np 2 | import jieba # 分词 3 | import jieba.posseg as psg # 词性标注 4 | import codecs # 写入txt文件 5 | 6 | # jieba.load_userdict("百度分词词库.txt") # 可以扩展jieba分词的词库 7 | 8 | ''' 9 | # 测试数据 10 | import linecache # 读取文件中的某一行 11 | file_name = 'train.txt' 12 | linecache.getline(file_name, 1) # 读取文件中的某一行 13 | a = linecache.getline(file_name, 1).strip().split() 14 | a[0] = int(a[0]) 15 | b = [[x.word,x.flag] for x in psg.cut(a[1])] 16 | c = [x for x in jieba.cut(a[1])] 17 | ''' 18 | 19 | # 读取txt文件,并且转成数组类型 20 | def load_file(file_name): 21 | data = [] # 保存数据 22 | with open(file_name, encoding='utf-8') as fin: 23 | for line in fin: 24 | line = line.strip().split() 25 | data.append(line) 26 | return np.array(data) 27 | 28 | # 分词与词性标注 29 | def cut_pos_file(data): 30 | data_cut = [] # 保存分词结果 31 | data_w_pos = [] # 保存分词与词性标注结果 32 | data_pos = [] # 仅保存词性标注结果 33 | for i in range(len(data)): 34 | data_cut.append([]) 35 | data_w_pos.append([]) 36 | data_pos.append([]) 37 | [data_cut[-1].append(x) for x in jieba.cut(data[i])] 38 | for x in psg.cut(data[i]): 39 | data_pos[-1].append(x.flag) 40 | data_w_pos[-1].append([x.word,x.flag]) 41 | return data_cut, data_pos, data_w_pos 42 | 43 | # 写入txt文件 44 | def write_file(data, file_name): 45 | fin = codecs.open(file_name, "w", "UTF-8") 46 | for i in range(len(data)): 47 | for j in range(len(data[i])): 48 | fin.write(str(data[i][j])+" ") 49 | fin.write("\n") 50 | fin.close() 51 | 52 | 53 | train = load_file('./lib/train.txt') 54 | train_data = train[:,1] 55 | train_label = np.array([int(x) for x in train[:,0]]) # 将字符串数组转换成整型数组 56 | train_data_positive = train_data[train_label == 1] # 提取标签等于1的训练数据 57 | train_data_negative = train_data[train_label ==0] # 提取标签等于0的训练数据 58 | train_cut, train_pos, train_Wpos = cut_pos_file(train_data) 59 | train_positive_cut, train_positive_pos, train_positive_Wpos = cut_pos_file(train_data_positive) 60 | train_negative_cut, train_negative_pos, train_negative_Wpos = cut_pos_file(train_data_negative) 61 | 62 | write_file(train_cut, './lib/train_cut.txt') 63 | write_file(train_pos, './lib/train_pos.txt') 64 | write_file(train_Wpos, './lib/train_Wpos.txt') 65 | 66 | write_file(train_positive_cut, './lib/train_positive_cut.txt') 67 | write_file(train_positive_pos, './lib/train_positive_pos.txt') 68 | write_file(train_positive_Wpos, './lib/train_positive_Wpos.txt') 69 | 70 | write_file(train_negative_cut, './lib/train_negative_cut.txt') 71 | write_file(train_negative_pos, './lib/train_negative_pos.txt') 72 | write_file(train_negative_Wpos, './lib/train_negative_Wpos.txt') 73 | 74 | 75 | 76 | test = load_file('./lib/test.txt') 77 | test_data = test[:,1] 78 | test_label = np.array([int(x) for x in test[:,0]]) # 将字符串数组转换成整型数组 79 | # 提取标签等于1的测试数据,主要用于频繁词序列挖掘,计算词序列的正负类区分度 80 | test_data_positive = test_data[test_label == 1] 81 | test_data_negative = test_data[test_label ==0] # 提取标签等于0的测试数据 82 | test_cut, test_pos, test_Wpos = cut_pos_file(test_data) 83 | test_positive_cut, test_positive_pos, test_positive_Wpos = cut_pos_file(test_data_positive) 84 | test_negative_cut, test_negative_pos, test_negative_Wpos = cut_pos_file(test_data_negative) 85 | -------------------------------------------------------------------------------- /sentiment_dic/#README.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/manderous/TextClassification-MeiTuan-FeatureExtraction-Classifier/c3d444f187dcb56f0e87f8facaf9117e5a4deef1/sentiment_dic/#README.txt -------------------------------------------------------------------------------- /sentiment_dic/degree.txt: -------------------------------------------------------------------------------- 1 | extreme 2 | 百分之百 3 | 倍加 4 | 备至 5 | 不得了 6 | 不堪 7 | 不可开交 8 | 不亦乐乎 9 | 不折不扣 10 | 彻头彻尾 11 | 充分 12 | 到头 13 | 地地道道 14 | 非常 15 | 极 16 | 极度 17 | 极端 18 | 极其 19 | 极为 20 | 截然 21 | 尽 22 | 惊人地 23 | 绝 24 | 绝顶 25 | 绝对 26 | 绝对化 27 | 刻骨 28 | 酷 29 | 满 30 | 满贯 31 | 满心 32 | 莫大 33 | 奇 34 | 入骨 35 | 甚为 36 | 十二分 37 | 十分 38 | 十足 39 | 死 40 | 滔天 41 | 痛 42 | 透 43 | 完全 44 | 完完全全 45 | 万 46 | 万般 47 | 万分 48 | 万万 49 | 无比 50 | 无度 51 | 无可估量 52 | 无以复加 53 | 无以伦比 54 | 要命 55 | 要死 56 | 已极 57 | 已甚 58 | 异常 59 | 逾常 60 | 贼 61 | 之极 62 | 之至 63 | 至极 64 | 卓绝 65 | 最为 66 | 佼佼 67 | 郅 68 | 綦 69 | 齁 70 | 最 71 | very 72 | 不过 73 | 不少 74 | 不胜 75 | 惨 76 | 沉 77 | 沉沉 78 | 出奇 79 | 大为 80 | 多 81 | 多多 82 | 多加 83 | 多么 84 | 分外 85 | 格外 86 | 够瞧的 87 | 够戗 88 | 好 89 | 好不 90 | 何等 91 | 很 92 | 很是 93 | 坏 94 | 可 95 | 老 96 | 老大 97 | 良 98 | 颇 99 | 颇为 100 | 甚 101 | 实在 102 | 太 103 | 太甚 104 | 特 105 | 特别 106 | 尤 107 | 尤其 108 | 尤为 109 | 尤以 110 | 远 111 | 着实 112 | 曷 113 | 碜 114 | more 115 | 大不了 116 | 多 117 | 更 118 | 更加 119 | 更进一步 120 | 更为 121 | 还 122 | 还要 123 | 较 124 | 较比 125 | 较为 126 | 进一步 127 | 那般 128 | 那么 129 | 那样 130 | 强 131 | 如斯 132 | 益 133 | 益发 134 | 尤甚 135 | 逾 136 | 愈 137 | 愈 ... 愈 138 | 愈发 139 | 愈加 140 | 愈来愈 141 | 愈益 142 | 远远 143 | 越 ... 越 144 | 越发 145 | 越加 146 | 越来越 147 | 越是 148 | 这般 149 | 这样 150 | 足 151 | 足足 152 | ish 153 | 点点滴滴 154 | 多多少少 155 | 怪 156 | 好生 157 | 还 158 | 或多或少 159 | 略 160 | 略加 161 | 略略 162 | 略微 163 | 略为 164 | 蛮 165 | 稍 166 | 稍稍 167 | 稍微 168 | 稍为 169 | 稍许 170 | 挺 171 | 未免 172 | 相当 173 | 些 174 | 些微 175 | 些小 176 | 一点 177 | 一点儿 178 | 一些 179 | 有点 180 | 有点儿 181 | 有些 182 | insufficiently 183 | 半点 184 | 不大 185 | 不丁点儿 186 | 不甚 187 | 不怎么 188 | 聊 189 | 没怎么 190 | 轻度 191 | 弱 192 | 丝毫 193 | 微 194 | 相对 195 | over 196 | 不为过 197 | 超 198 | 超额 199 | 超外差 200 | 超微结构 201 | 超物质 202 | 出头 203 | 多 204 | 浮 205 | 过 206 | 过度 207 | 过分 208 | 过火 209 | 过劲 210 | 过了头 211 | 过猛 212 | 过热 213 | 过甚 214 | 过头 215 | 过于 216 | 过逾 217 | 何止 218 | 何啻 219 | 开外 220 | 苦 221 | 老 222 | 偏 223 | 强 224 | 溢 225 | 忒 226 | last 227 | 228 | 229 | -------------------------------------------------------------------------------- /sentiment_dic/deny.txt: -------------------------------------------------------------------------------- 1 | 不 2 | 非 3 | 无 4 | 未 5 | 不曾 6 | 没 7 | 没有 8 | 请勿 9 | 不用 10 | 无须 11 | 并非 12 | 毫无 13 | 决不 14 | 休想 15 | 永不 16 | 不要 17 | 未尝 18 | 未曾 19 | 毋 20 | 莫 21 | 从不 22 | 从未 23 | 从未有过 24 | 尚未 25 | 一无 26 | 并未 27 | 尚无 28 | 从来不 29 | 从没 30 | 绝非 31 | 远非 32 | 切莫 33 | 永不 34 | 休想 35 | 绝不 36 | 毫不 37 | 不必 38 | 禁止 39 | 忌 40 | 拒绝 41 | 杜绝 42 | 否 43 | 弗 44 | 木有 45 | 甭 46 | 勿 47 | 不 48 | 没 49 | 无 50 | 非 51 | 莫 52 | 弗 53 | 毋 54 | 勿 55 | 未 56 | 否 57 | 别 58 | 無 59 | 休 -------------------------------------------------------------------------------- /sentiment_dic/negative_comment.txt: -------------------------------------------------------------------------------- 1 | 僄 2 | 啰啰唆唆 3 | 啰啰嗦嗦 4 | 啰里啰唆 5 | 啰里啰嗦 6 | 啰唆 7 | 啰嗦 8 | 噲 9 | 奓着头发 10 | 婞 11 | 婞直 12 | 崒 13 | 弇陋 14 | 惛 15 | 惼 16 | 梼昧 17 | 獪 18 | 瘆 19 | 瘆得慌 20 | 哀鸿遍野 21 | 矮 22 | 碍难 23 | 碍眼 24 | 爱搭不理 25 | 爱理不理 26 | 暗 27 | 暗暗 28 | 暗沉沉 29 | 暗淡 30 | 暗地 31 | 暗地里 32 | 暗黑 33 | 暗里 34 | 暗昧 35 | 暗弱 36 | 暗无天日 37 | 暗下 38 | 暗中 39 | 暗自 40 | 暗朦 41 | 岸然 42 | 肮里肮脏 43 | 肮脏 44 | 昂贵 45 | 凹凸 46 | 凹凸不平 47 | 傲 48 | 傲岸 49 | 傲慢 50 | 八面玲珑 51 | 跋扈 52 | 霸道 53 | 霸气 54 | 白 55 | 白白 56 | 白痴般 57 | 白搭 58 | 白忙 59 | 白忙活儿 60 | 白衣苍狗 61 | 白云苍狗 62 | 百孔千疮 63 | 败坏 64 | 稗 65 | 板 66 | 板板六十四 67 | 板滞 68 | 半半拉拉 69 | 半路出家 70 | 半新不旧 71 | 半真半假 72 | 薄 73 | 薄情 74 | 薄弱 75 | 薄幸 76 | 保残守缺 77 | 保守 78 | 抱残守缺 79 | 暴 80 | 暴烈 81 | 暴虐 82 | 暴躁 83 | 暴戾 84 | 暴戾恣睢 85 | 爆炸性 86 | 悲惨 87 | 悲观 88 | 悲观地 89 | 悲剧 90 | 悲凉 91 | 卑 92 | 卑鄙 93 | 卑鄙无耻 94 | 卑贱 95 | 卑劣 96 | 卑陋 97 | 卑怯 98 | 卑俗 99 | 卑琐 100 | 卑微 101 | 卑污 102 | 卑下 103 | 卑猥 104 | 背地 105 | 背地里 106 | 背光 107 | 背后 108 | 背悔 109 | 背静 110 | 背靠背 111 | 背理 112 | 背令 113 | 背人 114 | 背时 115 | 背阴 116 | 被动 117 | 被动式 118 | 被动性 119 | 本本主义 120 | 笨 121 | 笨手笨脚 122 | 笨头笨脑 123 | 笨重 124 | 笨拙 125 | 比肩接踵 126 | 鄙 127 | 鄙贱 128 | 鄙吝 129 | 鄙陋 130 | 鄙俗 131 | 鄙俚 132 | 蔽塞 133 | 闭塞 134 | 必修 135 | 变化不定 136 | 变化多端 137 | 变化万千 138 | 变化无常 139 | 变化无穷 140 | 变幻不定 141 | 变幻莫测 142 | 变幻无常 143 | 变态 144 | 变相 145 | 表里不一 146 | 憋拗 147 | 别别扭扭 148 | 别扭 149 | 别有用心 150 | 冰冷 151 | 冰炭不相容 152 | 秉性剌戾 153 | 病病歪歪 154 | 病弱 155 | 病态 156 | 病歪歪 157 | 病殃殃 158 | 病恹恹 159 | 波谲云诡 160 | 驳杂 161 | 捕风捉影 162 | 不爱交际 163 | 不便 164 | 不辨菽麦 165 | 不才 166 | 不成材 167 | 不成功 168 | 不成话 169 | 不成器 170 | 不成熟 171 | 不成体统 172 | 不成样子 173 | 不打紧 174 | 不大重要 175 | 不当 176 | 不到黄河心不死 177 | 不道德 178 | 不得当 179 | 不得劲 180 | 不得了 181 | 不得体 182 | 不登大雅之堂 183 | 不等 184 | 不端 185 | 不对 186 | 不对茬儿 187 | 不对称 188 | 不对付 189 | 不对劲 190 | 不对头 191 | 不发达 192 | 不法 193 | 不方便 194 | 不分青红皂白 195 | 不分皂白 196 | 不负责任 197 | 不干不净 198 | 不更事 199 | 不公 200 | 不公正 201 | 不共戴天 202 | 不够格 203 | 不够完善 204 | 不够意思 205 | 不关痛痒 206 | 不管三七二十一 207 | 不管用 208 | 不光彩 209 | 不光明 210 | 不规则 211 | 不轨 212 | 不好吃 213 | 不好看 214 | 不好客 215 | 不好卖 216 | 不好使 217 | 不好听 218 | 不好用 219 | 不和 220 | 不和蔼 221 | 不和谐 222 | 不合法 223 | 不合格 224 | 不合理 225 | 不合逻辑 226 | 不合情理 227 | 不合时令 228 | 不合时宜 229 | 不合适 230 | 不合算 231 | 不合宜 232 | 不合语法 233 | 不划算 234 | 不济 235 | 不济事 236 | 不俭省 237 | 不健康 238 | 不洁 239 | 不谨慎 240 | 不近情理 241 | 不近人情 242 | 不尽 243 | 不尽如人意 244 | 不精确 245 | 不敬 246 | 不绝如缕 247 | 不均匀 248 | 不开化 249 | 不堪入耳 250 | 不堪入目 251 | 不堪设想 252 | 不堪一击 253 | 不堪造就 254 | 不科学 255 | 不可爱 256 | 不可补救 257 | 不可读 258 | 不可告人 259 | 不可更新 260 | 不可恢复 261 | 不可降解 262 | 不可接受 263 | 不可救药 264 | 不可理喻 265 | 不可逆转 266 | 不可容忍 267 | 不可收拾 268 | 不可挽回 269 | 不可行 270 | 不可一世 271 | 不可逾越 272 | 不客气 273 | 不宽容 274 | 不郎不秀 275 | 不冷不热 276 | 不理智 277 | 不礼貌 278 | 不利 279 | 不利于健康 280 | 不力 281 | 不良 282 | 不灵敏 283 | 不灵巧 284 | 不流行 285 | 不伦不类 286 | 不美观 287 | 不妙 288 | 不民主 289 | 不明不白 290 | 不明显 291 | 不明智 292 | 不名一文 293 | 不名誉 294 | 不能解救 295 | 不能容忍 296 | 不宁 297 | 不努力 298 | 不平 299 | 不平等 300 | 不平衡 301 | 不起眼 302 | 不起眼儿 303 | 不巧 304 | 不切实际 305 | 不清不白 306 | 不清不楚 307 | 不清楚 308 | 不清洁 309 | 不确切 310 | 不仁 311 | 不仁不义 312 | 不人道 313 | 不三不四 314 | 不善 315 | 不善交际 316 | 不善交谈 317 | 不甚重要 318 | 不慎 319 | 不胜 320 | 不是味儿 321 | 不是滋味儿 322 | 不适当 323 | 不适宜 324 | 不适应 325 | 不适于居住 326 | 不受欢迎 327 | 不熟练 328 | 不疼不痒 329 | 不体面 330 | 不痛不痒 331 | 不透明 332 | 不透气 333 | 不妥 334 | 不为人知 335 | 不卫生 336 | 不文明 337 | 不文雅 338 | 不稳定 339 | 不问青红皂白 340 | 不问三七二十一 341 | 不问是非情由 342 | 不显眼 343 | 不现实 344 | 不相适应 345 | 不祥 346 | 不详 347 | 不详尽 348 | 不像话 349 | 不消化 350 | 不孝 351 | 不肖 352 | 不协调 353 | 不兴 354 | 不行 355 | 不幸 356 | 不修边幅 357 | 不学无术 358 | 不逊 359 | 不雅 360 | 不雅观 361 | 不雅致 362 | 不要紧 363 | 不一致 364 | 不宜 365 | 不宜居住 366 | 不宜说出口 367 | 不易 368 | 不友好 369 | 不友善 370 | 不择手段 371 | 不真诚 372 | 不真实 373 | 不贞洁 374 | 不正常 375 | 不正当 376 | 不正派 377 | 不正直 378 | 不值得羡慕 379 | 不值一文 380 | 不中用 381 | 不重要 382 | 不周 383 | 不周到 384 | 不注意 385 | 不着边际 386 | 不着调 387 | 不足道 388 | 不足挂齿 389 | 不足轻重 390 | 不足取 391 | 不足为外人道 392 | 不足为训 393 | 不羁 394 | 不稂不莠 395 | 不虔诚 396 | 才疏学浅 397 | 财迷心窍 398 | 残 399 | 残败 400 | 残暴 401 | 残毒 402 | 残酷 403 | 残酷无情 404 | 残虐 405 | 残破 406 | 残破不全 407 | 残缺 408 | 残缺不全 409 | 残忍 410 | 残损 411 | 惨 412 | 惨不忍睹 413 | 惨淡 414 | 惨毒 415 | 惨绝人寰 416 | 惨苦 417 | 惨厉 418 | 惨烈 419 | 惨痛 420 | 惨无人道 421 | 苍白 422 | 苍白无力 423 | 苍凉 424 | 苍茫 425 | 操切 426 | 糙 427 | 草 428 | 草草 429 | 草荒 430 | 草率 431 | 草木皆兵 432 | 策略 433 | 策略性 434 | 差 435 | 差点儿 436 | 差劲 437 | 差可 438 | 豺狼成性 439 | 豺狼当道 440 | 缠手 441 | 颤颤巍巍 442 | 颤颤悠悠 443 | 颤巍巍 444 | 猖 445 | 猖狂 446 | 长长短短 447 | 长篇大论 448 | 长篇累牍 449 | 长线 450 | 超标 451 | 超常 452 | 超然 453 | 超重 454 | 朝不保夕 455 | 朝不谋夕 456 | 朝秦暮楚 457 | 朝三暮四 458 | 潮 459 | 吵吵闹闹 460 | 吵人 461 | 沉闷 462 | 沉痛 463 | 沉滞 464 | 陈 465 | 陈腐 466 | 陈旧 467 | 成事不足,败事有余 468 | 逞性 469 | 逞性子 470 | 吃不开 471 | 吃劲 472 | 吃力 473 | 吃重 474 | 痴 475 | 痴痴 476 | 痴呆 477 | 痴呆呆 478 | 痴傻 479 | 痴愚 480 | 迟钝 481 | 侈 482 | 侈靡 483 | 侈糜 484 | 赤地千里 485 | 赤裸裸淫秽 486 | 赤贫 487 | 充满危机 488 | 冲昏头脑 489 | 丑 490 | 丑恶 491 | 丑陋 492 | 臭 493 | 臭不可闻 494 | 臭哄哄 495 | 臭烘烘 496 | 臭名远扬 497 | 臭名昭彰 498 | 臭名昭著 499 | 臭气冲天 500 | 臭气熏天 501 | 臭味 502 | 初出茅庐 503 | 出手阔气 504 | 触目惊心 505 | 穿不出去 506 | 穿不得 507 | 串秧儿 508 | 疮痍满目 509 | 蠢 510 | 蠢笨 511 | 蠢头蠢脑 512 | 刺鼻 513 | 刺耳 514 | 刺眼 515 | 次 516 | 次等 517 | 从动 518 | 从心所欲 519 | 从严 520 | 从重 521 | 粗 522 | 粗暴 523 | 粗笨 524 | 粗鄙 525 | 粗糙 526 | 粗放 527 | 粗拉 528 | 粗里粗气 529 | 粗劣 530 | 粗陋 531 | 粗鲁 532 | 粗率 533 | 粗蛮 534 | 粗莽 535 | 粗浅 536 | 粗涩 537 | 粗手笨脚 538 | 粗疏 539 | 粗俗 540 | 粗线条 541 | 粗心 542 | 粗心大意 543 | 粗野 544 | 粗枝大叶 545 | 粗制滥造 546 | 粗重 547 | 粗拙 548 | 粗犷 549 | 促狭 550 | 脆弱 551 | 村气 552 | 村野 553 | 寸草不生 554 | 错 555 | 错乱 556 | 错误 557 | 错误百出 558 | 错杂 559 | 错综 560 | 错综复杂 561 | 大 562 | 大错而特错 563 | 大错特错 564 | 大大咧咧 565 | 大而笨拙 566 | 大而化之 567 | 大而无当 568 | 大海捞针 569 | 大面额 570 | 大谬不然 571 | 大手大脚 572 | 大肆 573 | 大摇大摆 574 | 大意 575 | 大咧咧 576 | 呆 577 | 呆板 578 | 呆笨 579 | 呆痴 580 | 呆呆 581 | 呆钝 582 | 呆气 583 | 呆傻 584 | 呆头呆脑 585 | 歹 586 | 歹毒 587 | 带有敌意 588 | 殆 589 | 怠惰 590 | 单 591 | 单薄 592 | 单调 593 | 单调枯燥 594 | 单弱 595 | 胆怯 596 | 胆小 597 | 胆小怕事 598 | 胆小如鼠 599 | 淡 600 | 淡薄 601 | 淡淡 602 | 淡而无味 603 | 淡漠 604 | 淡然 605 | 诞 606 | 荡 607 | 刀光剑影 608 | 蹈常袭故 609 | 倒胃口 610 | 道德败坏 611 | 道貌岸然 612 | 德行 613 | 德性 614 | 得寸进尺 615 | 得陇望蜀 616 | 得鱼忘筌 617 | 灯红酒绿 618 | 灯火阑珊 619 | 等而下之 620 | 等外 621 | 等因奉此 622 | 低 623 | 低卑 624 | 低标准 625 | 低层 626 | 低档 627 | 低等 628 | 低端 629 | 低级 630 | 低贱 631 | 低劣 632 | 低迷 633 | 低能 634 | 低人一等 635 | 低三下四 636 | 低声下气 637 | 低俗 638 | 低下 639 | 低效 640 | 低效能 641 | 低值 642 | 低智 643 | 低质 644 | 滴里嘟噜 645 | 敌对 646 | 地位低下 647 | 地下 648 | 地狱般 649 | 颠倒 650 | 颠连 651 | 颠三倒四 652 | 凋敝 653 | 刁 654 | 刁恶 655 | 刁悍 656 | 刁滑 657 | 刁赖 658 | 刁蛮 659 | 刁钻 660 | 刁钻古怪 661 | 吊儿郎当 662 | 调皮 663 | 鼎沸 664 | 丢魂 665 | 丢脸 666 | 丢三落四 667 | 东倒西歪 668 | 冬烘 669 | 动荡 670 | 动荡不安 671 | 动魄惊心 672 | 动作迟顿 673 | 毒 674 | 毒辣 675 | 独裁 676 | 独断 677 | 度量小 678 | 短浅 679 | 短视 680 | 钝 681 | 多变 682 | 多病 683 | 多事 684 | 多义 685 | 多余 686 | 惰 687 | 惰性 688 | 讹 689 | 恶 690 | 恶毒 691 | 恶贯满盈 692 | 恶狠狠 693 | 恶劣 694 | 恶煞煞 695 | 恶心 696 | 恶浊 697 | 饿殍遍野 698 | 耳生 699 | 二把刀 700 | 二手 701 | 二五眼 702 | 发狂 703 | 发腻 704 | 发育不全 705 | 乏 706 | 乏味 707 | 翻手为云,覆手为雨 708 | 翻云覆雨 709 | 繁复 710 | 繁乱 711 | 繁难 712 | 繁冗 713 | 繁琐 714 | 繁芜 715 | 繁杂 716 | 繁重 717 | 繁缛 718 | 烦 719 | 烦难 720 | 烦冗 721 | 烦琐 722 | 烦嚣 723 | 反 724 | 反常 725 | 反对称 726 | 反反复复 727 | 反复无常 728 | 反面 729 | 反叛 730 | 反社会 731 | 犯有罪行 732 | 饭桶 733 | 泛 734 | 泛泛 735 | 放诞 736 | 放荡 737 | 放荡不羁 738 | 放浪 739 | 放肆 740 | 放纵 741 | 菲 742 | 菲薄 743 | 非 744 | 非法 745 | 非分 746 | 非婚生 747 | 非礼 748 | 非人 749 | 非生产性 750 | 非正常 751 | 非正统 752 | 非正义 753 | 废 754 | 废弛 755 | 废旧 756 | 废物 757 | 沸沸扬扬 758 | 费 759 | 费工夫 760 | 费功夫 761 | 费劲 762 | 费力 763 | 费时 764 | 费事 765 | 纷 766 | 纷繁 767 | 纷乱 768 | 纷扰 769 | 纷杂 770 | 封闭 771 | 封闭式 772 | 封闭型 773 | 封建 774 | 锋芒毕露 775 | 风吹日晒 776 | 风刀霜剑 777 | 风风火火 778 | 风流 779 | 风骚 780 | 风声鹤唳 781 | 风雨飘摇 782 | 疯疯癫癫 783 | 疯狂 784 | 疯狂般 785 | 疯癫癫 786 | 否 787 | 否定 788 | 肤泛 789 | 肤皮潦草 790 | 肤浅 791 | 浮 792 | 浮泛 793 | 浮光掠影 794 | 浮滑 795 | 浮皮蹭痒 796 | 浮漂 797 | 浮浅 798 | 浮躁 799 | 浮噪 800 | 腐败 801 | 腐败堕落 802 | 腐臭 803 | 腐恶 804 | 腐化 805 | 腐化堕落 806 | 腐旧 807 | 腐烂 808 | 腐朽 809 | 腐朽没落 810 | 覆雨翻云 811 | 复 812 | 复合 813 | 复合式 814 | 复合型 815 | 复杂 816 | 复杂多变 817 | 傅会 818 | 负 819 | 负面 820 | 富余 821 | 附会 822 | 嘎 823 | 该死 824 | 概念化 825 | 干 826 | 干巴 827 | 干巴巴 828 | 干瘪 829 | 干瘪瘪 830 | 干干巴巴 831 | 干燥 832 | 赶尽杀绝 833 | 刚愎 834 | 刚愎自用 835 | 高昂 836 | 高傲 837 | 高不成,低不就 838 | 高不成低不就 839 | 高成本 840 | 高价 841 | 高价位 842 | 高难 843 | 高难度 844 | 高压 845 | 疙疙瘩瘩 846 | 疙里疙瘩 847 | 隔靴搔痒 848 | 勾心斗角 849 | 苟且 850 | 狗眼看人 851 | 垢 852 | 够呛 853 | 够戗 854 | 孤 855 | 孤傲 856 | 孤傲不群 857 | 孤单 858 | 孤单单 859 | 孤独 860 | 孤孤单单 861 | 孤寡 862 | 孤寂 863 | 孤立 864 | 孤立无援 865 | 孤零零 866 | 孤陋寡闻 867 | 孤僻 868 | 古怪 869 | 古旧 870 | 古里古怪 871 | 固定不变 872 | 固执 873 | 寡 874 | 寡淡 875 | 寡断 876 | 寡了叭叽 877 | 寡情 878 | 寡味 879 | 寡言 880 | 寡言少语 881 | 挂漏 882 | 挂名 883 | 挂一漏万 884 | 乖谬 885 | 乖僻 886 | 乖张 887 | 乖剌 888 | 乖戾 889 | 怪里怪气 890 | 怪僻 891 | 官僚 892 | 官僚主义 893 | 光怪陆离 894 | 鬼 895 | 鬼鬼祟祟 896 | 鬼计多端 897 | 鬼头鬼脑 898 | 诡 899 | 诡计多端 900 | 诡秘 901 | 诡诈 902 | 诡谲 903 | 贵 904 | 过当 905 | 过分简单化 906 | 过分拥挤 907 | 过河拆桥 908 | 过了气 909 | 过气 910 | 过桥抽板 911 | 过时 912 | 哈喇 913 | 孩子气 914 | 海底捞月 915 | 海底捞针 916 | 害 917 | 骇人听闻 918 | 憨 919 | 含含糊糊 920 | 含含混混 921 | 含糊 922 | 含糊不清 923 | 含糊其辞 924 | 含糊其词 925 | 含混 926 | 含混不清 927 | 含蓄 928 | 涵蓄 929 | 寒 930 | 寒苦 931 | 寒素 932 | 寒酸 933 | 寒微 934 | 寒伧 935 | 寒碜 936 | 悍 937 | 悍然 938 | 豪 939 | 豪侈 940 | 豪横 941 | 豪强 942 | 豪奢 943 | 毫不客气 944 | 毫不留情 945 | 毫无价值 946 | 毫无目标 947 | 毫无意义 948 | 毫无用处 949 | 好不容易 950 | 好容易 951 | 好事多磨 952 | 黑 953 | 黑暗 954 | 黑沉沉 955 | 黑灯瞎火 956 | 黑洞洞 957 | 黑咕隆咚 958 | 黑乎乎 959 | 黑茫茫 960 | 黑蒙蒙 961 | 黑漆寥光 962 | 黑漆漆 963 | 黑森森 964 | 黑心 965 | 黑心肠 966 | 黑黝黝 967 | 黑黢黢 968 | 狠 969 | 狠毒 970 | 狠劲 971 | 狠心 972 | 横 973 | 横暴 974 | 横加 975 | 横蛮无理 976 | 横七竖八 977 | 哄然 978 | 猴 979 | 后患无穷 980 | 后进 981 | 呼幺喝六 982 | 胡 983 | 胡里胡涂 984 | 胡乱 985 | 胡子拉茬 986 | 胡子拉碴 987 | 糊糊涂涂 988 | 糊里糊涂 989 | 糊涂 990 | 虎踞龙蟠 991 | 虎头蛇尾 992 | 花 993 | 花插着 994 | 花搭着 995 | 花花搭搭 996 | 花里胡哨 997 | 花钱浪费 998 | 花拳绣腿 999 | 花天酒地 1000 | 花心 1001 | 哗然 1002 | 华 1003 | 华而不实 1004 | 猾 1005 | 滑 1006 | 滑头 1007 | 滑头滑脑 1008 | 怀着恶意 1009 | 坏 1010 | 坏脾气 1011 | 坏人当道 1012 | 幻 1013 | 幻异 1014 | 荒 1015 | 荒诞 1016 | 荒诞不经 1017 | 荒诞派 1018 | 荒诞无稽 1019 | 荒废 1020 | 荒寂 1021 | 荒凉 1022 | 荒乱 1023 | 荒落 1024 | 荒谬 1025 | 荒谬绝伦 1026 | 荒漠 1027 | 荒僻 1028 | 荒弃 1029 | 荒疏 1030 | 荒唐 1031 | 荒唐无稽 1032 | 荒无人烟 1033 | 荒芜 1034 | 荒淫 1035 | 荒淫无耻 1036 | 荒淫无度 1037 | 荒瘠 1038 | 黄色 1039 | 晃晃悠悠 1040 | 晃悠悠 1041 | 恍恍惚惚 1042 | 恍惚 1043 | 谎 1044 | 灰暗 1045 | 灰沉沉 1046 | 灰溜溜 1047 | 灰茫茫 1048 | 灰蒙蒙 1049 | 灰色 1050 | 灰头灰脸 1051 | 灰头土脸 1052 | 灰秃秃 1053 | 灰朦朦 1054 | 慧黠 1055 | 晦 1056 | 晦暗 1057 | 晦涩 1058 | 晦冥 1059 | 晦暝 1060 | 秽 1061 | 秽恶 1062 | 秽乱 1063 | 秽土 1064 | 秽亵 1065 | 会来事 1066 | 昏 1067 | 昏暗 1068 | 昏沉 1069 | 昏黑 1070 | 昏乱 1071 | 昏昧 1072 | 昏天黑地 1073 | 昏头昏脑 1074 | 昏庸 1075 | 昏愦 1076 | 昏聩 1077 | 婚外 1078 | 浑 1079 | 浑浑噩噩 1080 | 浑头浑脑 1081 | 浑浊 1082 | 浑噩 1083 | 混 1084 | 混合 1085 | 混混沌沌 1086 | 混交 1087 | 混乱 1088 | 混淆不清 1089 | 混血 1090 | 混账 1091 | 混浊 1092 | 混沌 1093 | 活动 1094 | 火暴 1095 | 火爆 1096 | 祸不单行 1097 | 祸从天降 1098 | 机变 1099 | 机械 1100 | 机械式 1101 | 机械性 1102 | 畸 1103 | 畸轻畸重 1104 | 畸形 1105 | 积满灰尘 1106 | 积重难返 1107 | 鸡零狗碎 1108 | 鸡毛蒜皮 1109 | 鸡犬不留 1110 | 鸡犬不宁 1111 | 棘手 1112 | 急不可待 1113 | 急功近利 1114 | 急切 1115 | 急性子 1116 | 急于 1117 | 急躁 1118 | 疾言厉色 1119 | 挤 1120 | 挤巴 1121 | 挤得水泄不通 1122 | 挤得要命 1123 | 挤挤插插 1124 | 挤满 1125 | 寂 1126 | 寂寥 1127 | 寂寞 1128 | 忌刻 1129 | 夹七夹八 1130 | 家长式 1131 | 家贫如洗 1132 | 家徒壁立 1133 | 家徒四壁 1134 | 假 1135 | 假冒 1136 | 假模假式 1137 | 假仁假义 1138 | 假想 1139 | 假惺惺 1140 | 假意 1141 | 假造 1142 | 假正经 1143 | 假装神圣 1144 | 价高 1145 | 价格不菲 1146 | 价格高昂 1147 | 架空 1148 | 尖刻 1149 | 尖酸 1150 | 尖酸刻薄 1151 | 尖嘴薄舌 1152 | 尖嘴猴腮 1153 | 间不容发 1154 | 间杂 1155 | 肩摩毂击 1156 | 艰 1157 | 艰巨 1158 | 艰苦 1159 | 艰苦卓绝 1160 | 艰难 1161 | 艰难曲折 1162 | 艰难险阻 1163 | 艰涩 1164 | 艰深 1165 | 艰危 1166 | 艰辛 1167 | 奸 1168 | 奸刁 1169 | 奸恶 1170 | 奸猾 1171 | 奸险 1172 | 奸邪 1173 | 奸诈 1174 | 奸佞 1175 | 简单 1176 | 简陋 1177 | 简慢 1178 | 贱 1179 | 见不得人 1180 | 见风使舵 1181 | 见风转舵 1182 | 见识短浅 1183 | 见异思迁 1184 | 剑拔弩张 1185 | 僵 1186 | 僵化 1187 | 僵硬 1188 | 胶柱鼓瑟 1189 | 浇薄 1190 | 浇漓 1191 | 骄 1192 | 骄傲 1193 | 骄傲自满 1194 | 骄横 1195 | 骄慢 1196 | 骄气 1197 | 骄人 1198 | 骄奢淫逸 1199 | 骄纵 1200 | 骄矜 1201 | 娇 1202 | 娇痴 1203 | 娇贵 1204 | 娇憨 1205 | 娇嫩 1206 | 娇气 1207 | 娇弱 1208 | 娇生惯养 1209 | 矫情 1210 | 矫情造作 1211 | 矫揉造作 1212 | 侥 1213 | 狡 1214 | 狡猾 1215 | 狡计多端 1216 | 狡兔三窟 1217 | 狡诈 1218 | 狡狯 1219 | 狡黠 1220 | 揭不开锅 1221 | 竭蹶 1222 | 洁身自好 1223 | 结结巴巴 1224 | 斤斤计较 1225 | 金刚努目 1226 | 紧 1227 | 紧巴 1228 | 紧巴巴 1229 | 近视 1230 | 荆棘载途 1231 | 惊爆 1232 | 惊人 1233 | 惊天动地 1234 | 惊险 1235 | 精力枯竭 1236 | 精神不振 1237 | 精神溜号 1238 | 经济拮据 1239 | 经验不足 1240 | 静僻 1241 | 净余 1242 | 窘 1243 | 窘促 1244 | 窘急 1245 | 窘困 1246 | 窘迫 1247 | 窘涩 1248 | 旧 1249 | 旧式 1250 | 拘 1251 | 拘礼 1252 | 拘执 1253 | 狙 1254 | 拒人于千里之外 1255 | 剧毒 1256 | 倔 1257 | 倔强 1258 | 倔头倔脑 1259 | 倔犟 1260 | 绝 1261 | 绝情 1262 | 峻 1263 | 开小差 1264 | 坎坷 1265 | 坎坷不平 1266 | 看风使舵 1267 | 糠 1268 | 亢 1269 | 靠不住 1270 | 苛 1271 | 苛刻 1272 | 磕磕绊绊 1273 | 磕头碰脑 1274 | 可悲 1275 | 可鄙 1276 | 可怖 1277 | 可耻 1278 | 可恶 1279 | 可骇 1280 | 可恨 1281 | 可惊 1282 | 可怜 1283 | 可怕 1284 | 可叹 1285 | 可有可无 1286 | 可憎 1287 | 刻板 1288 | 刻薄 1289 | 刻毒 1290 | 刻舟求剑 1291 | 坑坑洼洼 1292 | 坑洼 1293 | 坑洼不平 1294 | 空 1295 | 空洞 1296 | 空洞洞 1297 | 空洞无聊 1298 | 空洞无物 1299 | 空乏 1300 | 空泛 1301 | 空幻 1302 | 空空洞洞 1303 | 空落落 1304 | 空头 1305 | 空虚 1306 | 空中楼阁 1307 | 恐怖 1308 | 抠 1309 | 抠门儿 1310 | 抠搜 1311 | 抠唆 1312 | 口蜜腹剑 1313 | 口是心非 1314 | 口头上 1315 | 枯 1316 | 枯寂 1317 | 枯涩 1318 | 枯燥 1319 | 枯燥乏味 1320 | 枯燥无味 1321 | 枯槁 1322 | 苦 1323 | 苦不唧 1324 | 苦口 1325 | 苦苦 1326 | 苦涩 1327 | 酷 1328 | 酷烈 1329 | 酷虐 1330 | 夸诞 1331 | 狂 1332 | 狂傲 1333 | 狂暴 1334 | 狂荡 1335 | 狂妄 1336 | 狂妄自大 1337 | 狂躁 1338 | 狂悖 1339 | 狂恣 1340 | 困顿 1341 | 困窘 1342 | 困苦 1343 | 困难 1344 | 困难重重 1345 | 困人 1346 | 阔绰 1347 | 阔气 1348 | 拉忽 1349 | 拉拉杂杂 1350 | 拉杂 1351 | 辣 1352 | 辣手 1353 | 来路不明 1354 | 来之不易 1355 | 赖 1356 | 赖皮 1357 | 懒 1358 | 懒到极点 1359 | 懒惰 1360 | 懒散 1361 | 烂 1362 | 滥 1363 | 狼狈 1364 | 狼狈不堪 1365 | 狼籍 1366 | 狼藉 1367 | 狼心狗肺 1368 | 浪 1369 | 浪荡 1370 | 劳而无功 1371 | 老 1372 | 老大难 1373 | 老掉牙 1374 | 老赶 1375 | 老虎屁股摸不得 1376 | 老奸巨猾 1377 | 老奸巨滑 1378 | 老辣 1379 | 老派 1380 | 老气 1381 | 老气横秋 1382 | 老弱病残 1383 | 老实 1384 | 老式 1385 | 老朽 1386 | 累卵 1387 | 累赘 1388 | 累牍连篇 1389 | 肋脦 1390 | 冷 1391 | 冷冰冰 1392 | 冷淡 1393 | 冷峻 1394 | 冷酷 1395 | 冷酷无情 1396 | 冷冷 1397 | 冷冷清清 1398 | 冷厉 1399 | 冷落 1400 | 冷门 1401 | 冷漠 1402 | 冷峭 1403 | 冷清 1404 | 冷清清 1405 | 冷若冰霜 1406 | 冷销 1407 | 冷血 1408 | 冷噤 1409 | 离索 1410 | 离题 1411 | 离心离德 1412 | 理亏 1413 | 理屈 1414 | 理屈词穷 1415 | 理由不充分 1416 | 里出外进 1417 | 厉 1418 | 厉害 1419 | 厉声 1420 | 利令智昏 1421 | 利已 1422 | 利欲熏心 1423 | 哩哩啦啦 1424 | 哩哩罗罗 1425 | 哩溜歪斜 1426 | 连篇累牍 1427 | 良莠不齐 1428 | 两面光 1429 | 两面三刀 1430 | 寥 1431 | 寥寂 1432 | 潦草 1433 | 了不得 1434 | 了不起 1435 | 烈 1436 | 烈性子 1437 | 劣 1438 | 劣等 1439 | 劣质 1440 | 劣中之劣 1441 | 鳞状 1442 | 凛 1443 | 凛凛 1444 | 凛然 1445 | 吝 1446 | 吝啬 1447 | 零 1448 | 零丁 1449 | 零零散散 1450 | 零零碎碎 1451 | 零乱 1452 | 零落 1453 | 零七八碎 1454 | 零散 1455 | 零碎 1456 | 零星 1457 | 伶仃 1458 | 凌乱 1459 | 凌杂 1460 | 令人不安 1461 | 令人齿冷 1462 | 令人恶心 1463 | 令人发指 1464 | 令人费解 1465 | 令人寒心 1466 | 令人敬畏 1467 | 令人困倦 1468 | 令人毛骨悚然 1469 | 令人恼火 1470 | 令人疲倦 1471 | 令人生气 1472 | 令人生厌 1473 | 令人讨厌 1474 | 令人厌恶 1475 | 令人厌倦 1476 | 令人遗憾 1477 | 令人折断腰 1478 | 令人窒息 1479 | 令人作呕 1480 | 溜号 1481 | 流里流气 1482 | 流气 1483 | 六亲不认 1484 | 娄 1485 | 漏洞百出 1486 | 陋 1487 | 鲁 1488 | 鲁钝 1489 | 鲁莽 1490 | 碌 1491 | 碌碌 1492 | 碌碌无为 1493 | 驴唇不对马嘴 1494 | 率 1495 | 率尔 1496 | 率然 1497 | 乱 1498 | 乱成一团 1499 | 乱纷纷 1500 | 乱哄哄 1501 | 乱烘烘 1502 | 乱乎 1503 | 乱了营 1504 | 乱乱哄哄 1505 | 乱虐并生 1506 | 乱蓬蓬 1507 | 乱七八糟 1508 | 乱套 1509 | 乱腾 1510 | 乱腾腾 1511 | 乱杂 1512 | 乱糟糟 1513 | 乱真 1514 | 乱嘈嘈 1515 | 落后 1516 | 落落寡合 1517 | 落寞 1518 | 落市 1519 | 落俗套 1520 | 落套 1521 | 落拓 1522 | 落伍 1523 | 麻 1524 | 麻痹 1525 | 麻烦 1526 | 麻麻黑 1527 | 麻木 1528 | 麻木不仁 1529 | 马虎 1530 | 马马虎虎 1531 | 埋汰 1532 | 卖不掉 1533 | 卖不动 1534 | 蛮 1535 | 蛮不讲理 1536 | 蛮悍 1537 | 蛮横 1538 | 蛮横无理 1539 | 蛮荒 1540 | 满 1541 | 满脸横肉 1542 | 满目疮痍 1543 | 漫 1544 | 漫不经心 1545 | 漫不经意 1546 | 漫无边际 1547 | 漫无目标 1548 | 漫无目的 1549 | 漫漶 1550 | 谩 1551 | 茫 1552 | 茫茫 1553 | 茫茫然 1554 | 盲目 1555 | 盲人瞎马 1556 | 莽 1557 | 莽苍 1558 | 莽莽苍苍 1559 | 莽莽撞撞 1560 | 莽撞 1561 | 猫哭老鼠 1562 | 毛 1563 | 毛糙 1564 | 毛毛躁躁 1565 | 毛手毛脚 1566 | 毛头毛脑 1567 | 毛躁 1568 | 冒 1569 | 冒牌 1570 | 冒失 1571 | 冒险 1572 | 冒有风险 1573 | 貌似强大 1574 | 貌似真实的 1575 | 贸贸然 1576 | 贸然 1577 | 没边儿 1578 | 没出息 1579 | 没骨头 1580 | 没关系 1581 | 没好气 1582 | 没见过世面 1583 | 没教养 1584 | 没劲 1585 | 没理 1586 | 没礼貌 1587 | 没良心 1588 | 没两下子 1589 | 没轻没重 1590 | 没什么了不得 1591 | 没什么了不起 1592 | 没受过教育 1593 | 没头没脑 1594 | 没头脑 1595 | 没味 1596 | 没心没肺 1597 | 没心眼儿 1598 | 没意思 1599 | 没用 1600 | 没有教养 1601 | 没有礼貌 1602 | 没有头脑 1603 | 没有学问 1604 | 没有勇气 1605 | 媚俗 1606 | 闷 1607 | 闷气 1608 | 蒙昧 1609 | 蒙蒙 1610 | 蒙蒙胧胧 1611 | 蒙胧 1612 | 孟浪 1613 | 靡丽 1614 | 靡靡 1615 | 糜 1616 | 糜烂 1617 | 迷濛 1618 | 迷宫般 1619 | 迷糊 1620 | 迷离 1621 | 迷离扑朔 1622 | 迷离倘恍 1623 | 迷漫 1624 | 迷茫 1625 | 迷蒙 1626 | 迷蒙蒙 1627 | 迷迷糊糊 1628 | 迷迷茫茫 1629 | 迷迷蒙蒙 1630 | 迷迷怔怔 1631 | 弥天 1632 | 米珠薪桂 1633 | 秘 1634 | 秘密 1635 | 密 1636 | 密不透风 1637 | 绵里藏针 1638 | 绵软 1639 | 勉勉强强 1640 | 勉强 1641 | 面呈病色 1642 | 面黄肌瘦 1643 | 面目可憎 1644 | 面目狰狞 1645 | 面色蜡黄 1646 | 面生 1647 | 面无表情 1648 | 藐小 1649 | 渺 1650 | 渺茫 1651 | 渺渺 1652 | 渺然 1653 | 渺若烟云 1654 | 渺小 1655 | 灭绝人性 1656 | 明哲保身 1657 | 名不副实 1658 | 名过其实 1659 | 名义 1660 | 名义上 1661 | 名誉扫地 1662 | 命苦 1663 | 谬 1664 | 模糊 1665 | 模糊不清 1666 | 模棱两可 1667 | 摩肩接踵 1668 | 魔鬼般 1669 | 魔怔 1670 | 莫须有 1671 | 墨 1672 | 漠 1673 | 漠不关心 1674 | 漠漠 1675 | 漠然 1676 | 寞 1677 | 陌生 1678 | 暮气 1679 | 暮气沉沉 1680 | 暮色苍茫 1681 | 幕后 1682 | 木 1683 | 木雕泥塑 1684 | 木头木脑 1685 | 木讷 1686 | 目不识丁 1687 | 目光短浅 1688 | 目光如豆 1689 | 目光凶狠 1690 | 目空一切 1691 | 目无余子 1692 | 目中无人 1693 | 拿腔拿调 1694 | 拿腔作势 1695 | 奶声奶气 1696 | 男盗女娼 1697 | 难 1698 | 难吃 1699 | 难看 1700 | 难人 1701 | 难上加难 1702 | 难上难 1703 | 难说话 1704 | 难听 1705 | 难闻 1706 | 难相处 1707 | 难驯服 1708 | 难以 1709 | 难以沟通 1710 | 囊空如洗 1711 | 囊中羞涩 1712 | 闹 1713 | 闹得慌 1714 | 闹哄哄 1715 | 闹闹哄哄 1716 | 闹闹嚷嚷 1717 | 闹嚷嚷 1718 | 嫩 1719 | 泥沙俱下 1720 | 你死我活 1721 | 匿名 1722 | 腻 1723 | 腻人 1724 | 逆 1725 | 逆耳 1726 | 蔫不唧儿 1727 | 蔫儿坏 1728 | 蔫头耷脑 1729 | 拈轻怕重 1730 | 年久失修 1731 | 鸟尽弓藏 1732 | 狞 1733 | 狞恶 1734 | 凝滞 1735 | 泞 1736 | 牛 1737 | 牛气 1738 | 扭扭捏捏 1739 | 奴颜婢膝 1740 | 虐 1741 | 懦 1742 | 懦怯 1743 | 懦弱 1744 | 盘根错节 1745 | 盘陁 1746 | 庞杂 1747 | 旁若无人 1748 | 配不上 1749 | 蓬乱 1750 | 蓬散 1751 | 蓬首垢面 1752 | 蓬头垢面 1753 | 蓬头散发 1754 | 脾气暴 1755 | 脾气爆躁 1756 | 脾气坏 1757 | 脾气火暴 1758 | 脾气急躁 1759 | 皮 1760 | 皮毛 1761 | 皮相 1762 | 僻 1763 | 僻静 1764 | 偏 1765 | 偏激 1766 | 偏颇 1767 | 偏听偏信 1768 | 偏狭 1769 | 偏斜 1770 | 偏心 1771 | 偏心眼 1772 | 片断 1773 | 片面 1774 | 骗人 1775 | 漂浮 1776 | 贫 1777 | 贫寒 1778 | 贫苦 1779 | 贫困 1780 | 贫穷 1781 | 贫瘠 1782 | 平白 1783 | 平白无故 1784 | 平淡 1785 | 平淡无奇 1786 | 平淡无味 1787 | 平铺直叙 1788 | 平铺直序 1789 | 凭白无故 1790 | 凭空 1791 | 坡 1792 | 泼 1793 | 泼辣 1794 | 婆婆妈妈 1795 | 破 1796 | 破败 1797 | 破坏性 1798 | 破旧 1799 | 破烂不堪 1800 | 破陋 1801 | 扑朔迷离 1802 | 铺张 1803 | 铺张浪费 1804 | 欺诈性 1805 | 七零八落 1806 | 凄 1807 | 凄惨 1808 | 凄楚 1809 | 凄寒 1810 | 凄寂 1811 | 凄苦 1812 | 凄冷 1813 | 凄厉 1814 | 凄凉 1815 | 凄迷 1816 | 凄怆 1817 | 漆黑 1818 | 漆黑一团 1819 | 其貌不扬 1820 | 奇丑无比 1821 | 奇形怪状 1822 | 崎 1823 | 崎岖 1824 | 崎岖不平 1825 | 起绉 1826 | 起褶子 1827 | 岂有此理 1828 | 气粗 1829 | 气闷 1830 | 气盛 1831 | 气势汹汹 1832 | 气壮如牛 1833 | 千变万化 1834 | 千疮百孔 1835 | 千金一掷 1836 | 千钧一发 1837 | 千篇一律 1838 | 前呼后拥 1839 | 潜 1840 | 浅 1841 | 浅薄 1842 | 浅尝辄止 1843 | 浅陋 1844 | 欠妥 1845 | 欠完善 1846 | 欠周到 1847 | 强 1848 | 强暴 1849 | 强横 1850 | 强行 1851 | 强制 1852 | 强制性 1853 | 巧 1854 | 巧黠 1855 | 翘尾巴 1856 | 峭 1857 | 峭直 1858 | 怯 1859 | 怯懦 1860 | 怯然 1861 | 怯弱 1862 | 怯生生 1863 | 窃 1864 | 禽兽不如 1865 | 轻 1866 | 轻薄 1867 | 轻淡 1868 | 轻浮 1869 | 轻贱 1870 | 轻狂 1871 | 轻率 1872 | 轻描淡写 1873 | 轻易 1874 | 轻佻 1875 | 倾斜 1876 | 清淡 1877 | 清高 1878 | 清寒 1879 | 清苦 1880 | 清冷 1881 | 清贫 1882 | 穷 1883 | 穷乏 1884 | 穷极潦倒 1885 | 穷苦 1886 | 穷困 1887 | 穷困潦倒 1888 | 穷奢极侈 1889 | 穷奢极欲 1890 | 穷酸 1891 | 穷途潦倒 1892 | 穷途末路 1893 | 穷凶极恶 1894 | 穷匮 1895 | 囚首垢面 1896 | 区区 1897 | 曲曲折折 1898 | 曲折 1899 | 屈才 1900 | 屈理 1901 | 犬牙交错 1902 | 缺 1903 | 缺德 1904 | 缺乏才智 1905 | 缺乏教养 1906 | 缺乏绅士风度 1907 | 缺乏幽默 1908 | 缺心眼 1909 | 缺心眼儿 1910 | 群魔乱舞 1911 | 攘攘 1912 | 扰扰 1913 | 绕脖子 1914 | 人不为己,天诛地灭 1915 | 人不知,鬼不觉 1916 | 人声鼎沸 1917 | 人声嘈杂 1918 | 人头攒动 1919 | 人为财死,鸟为食亡 1920 | 任重道远 1921 | 任纵 1922 | 认死理 1923 | 认死理儿 1924 | 冗 1925 | 冗长 1926 | 冗余 1927 | 冗赘 1928 | 柔弱 1929 | 肉 1930 | 肉了叭叽 1931 | 肉麻 1932 | 如临大敌 1933 | 如临深渊 1934 | 如履薄冰 1935 | 乳臭未干 1936 | 软 1937 | 软绵绵 1938 | 软弱 1939 | 软弱无力 1940 | 若明若暗 1941 | 若隐若现 1942 | 弱 1943 | 弱不禁风 1944 | 弱不胜衣 1945 | 弱势 1946 | 弱小 1947 | 弱智 1948 | 三天打鱼两天晒网 1949 | 散 1950 | 散乱 1951 | 散漫 1952 | 嗓子不好 1953 | 丧尽天良 1954 | 丧心病狂 1955 | 骚 1956 | 骚乱性 1957 | 色厉内荏 1958 | 色迷迷 1959 | 色情 1960 | 涩 1961 | 涩苦 1962 | 涩滞 1963 | 森 1964 | 杀气腾腾 1965 | 杀人不见血 1966 | 杀人不眨眼 1967 | 杀人如麻 1968 | 傻 1969 | 傻呵呵 1970 | 傻乎乎 1971 | 傻里瓜唧 1972 | 傻里傻气 1973 | 傻头傻脑 1974 | 山南海北 1975 | 山穷水尽 1976 | 闪烁 1977 | 伤风败俗 1978 | 伤脑筋 1979 | 伤天害理 1980 | 伤心惨目 1981 | 少不更事 1982 | 奢 1983 | 奢侈 1984 | 奢华 1985 | 奢靡 1986 | 奢糜 1987 | 蛇蝎心肠 1988 | 涉世不深 1989 | 身无分文 1990 | 深重 1991 | 神不知,鬼不觉 1992 | 神不知鬼不觉 1993 | 神秘 1994 | 神气活现 1995 | 神气十足 1996 | 神神秘秘 1997 | 神志委靡 1998 | 声名狼藉 1999 | 声色俱厉 2000 | 生 2001 | 生拉硬拽 2002 | 生涩 2003 | 生疏 2004 | 生硬 2005 | 盛气凌人 2006 | 剩余 2007 | 失常 2008 | 失当 2009 | 失检 2010 | 失礼 2011 | 失落 2012 | 失去理性 2013 | 失神 2014 | 失慎 2015 | 失实 2016 | 失宜 2017 | 十恶不赦 2018 | 十室九空 2019 | 什 2020 | 什锦 2021 | 食而不化 2022 | 食而不知其味 2023 | 食古不化 2024 | 实属不易 2025 | 使不得 2026 | 使人疲劳 2027 | 世故 2028 | 世情冷暖 2029 | 世俗 2030 | 世态炎凉 2031 | 誓不两立 2032 | 势不两立 2033 | 势利 2034 | 势利眼 2035 | 嗜杀成性 2036 | 嗜血 2037 | 嗜血成性 2038 | 恃才傲物 2039 | 手脚不干净 2040 | 手紧 2041 | 手生 2042 | 手头紧 2043 | 手无缚鸡之力 2044 | 守旧 2045 | 守株待兔 2046 | 瘦 2047 | 瘦弱 2048 | 输理 2049 | 疏忽 2050 | 疏懒 2051 | 疏松 2052 | 书生气 2053 | 鼠胆 2054 | 鼠目寸光 2055 | 数不上 2056 | 数不着 2057 | 衰弱 2058 | 衰颓 2059 | 水火不相容 2060 | 水泄不通 2061 | 水性杨花 2062 | 水中捞月 2063 | 瞬息万变 2064 | 说不过去 2065 | 说来话长 2066 | 斯文扫地 2067 | 私 2068 | 私底下 2069 | 私密 2070 | 私下 2071 | 私下里 2072 | 私自 2073 | 死 2074 | 死板 2075 | 死板板 2076 | 死沉沉 2077 | 死脑筋 2078 | 死气沉沉 2079 | 死去活来 2080 | 死死 2081 | 死心塌地 2082 | 死心眼 2083 | 死心眼儿 2084 | 死性 2085 | 死一般 2086 | 死硬 2087 | 死有余辜 2088 | 肆 2089 | 肆无忌惮 2090 | 肆意 2091 | 四大皆空 2092 | 四面楚歌 2093 | 似 2094 | 似乎 2095 | 似是而非 2096 | 松垮 2097 | 松垮垮 2098 | 松散 2099 | 松散散 2100 | 松松垮垮 2101 | 耸人听闻 2102 | 酥 2103 | 酥软 2104 | 酥松 2105 | 俗 2106 | 俗气 2107 | 素不相识 2108 | 素昧平生 2109 | 肃 2110 | 肃杀 2111 | 酸 2112 | 酸不溜丢 2113 | 酸臭 2114 | 酸刻 2115 | 酸溜溜 2116 | 酸涩 2117 | 随便 2118 | 随风倒 2119 | 随风使舵 2120 | 随风转舵 2121 | 随随便便 2122 | 随心所欲 2123 | 碎 2124 | 祟 2125 | 损 2126 | 损人利己 2127 | 琐 2128 | 琐碎 2129 | 琐细 2130 | 琐屑 2131 | 索 2132 | 索然 2133 | 索然乏味 2134 | 索然寡味 2135 | 索然无味 2136 | 所谓 2137 | 太随便 2138 | 太虚 2139 | 贪 2140 | 贪得无厌 2141 | 贪婪 2142 | 贪心 2143 | 贪心不足 2144 | 瘫软 2145 | 谈何容易 2146 | 唐突 2147 | 烫手 2148 | 淘 2149 | 淘气 2150 | 淘神 2151 | 讨厌 2152 | 特困 2153 | 特贫 2154 | 体力不支 2155 | 体弱 2156 | 体衰 2157 | 天昏地暗 2158 | 天南地北 2159 | 天南海北 2160 | 天真 2161 | 恬淡 2162 | 腆 2163 | 挑逗性 2164 | 铁杆儿 2165 | 铁公鸡一毛不拔 2166 | 铁石心肠 2167 | 铁血 2168 | 听天由命 2169 | 偷 2170 | 偷工减料 2171 | 偷偷 2172 | 偷偷摸摸 2173 | 投机 2174 | 头脑空虚 2175 | 头痛 2176 | 秃 2177 | 徒 2178 | 徒劳 2179 | 徒劳无功 2180 | 徒劳无益 2181 | 徒然 2182 | 土 2183 | 土得掉渣 2184 | 土里土气 2185 | 土气 2186 | 土俗 2187 | 土头土脑 2188 | 兔死狗烹 2189 | 兔子不吃窝边草 2190 | 兔子尾巴长不了 2191 | 颓 2192 | 颓败 2193 | 颓废 2194 | 蜕化 2195 | 蜕化变质 2196 | 退化 2197 | 拖泥带水 2198 | 拖沓 2199 | 歪 2200 | 歪歪扭扭 2201 | 歪斜 2202 | 外面儿光 2203 | 外行 2204 | 顽 2205 | 顽钝 2206 | 顽梗 2207 | 顽固 2208 | 顽劣 2209 | 顽皮 2210 | 完全不重要 2211 | 万恶 2212 | 万花筒似 2213 | 万马齐喑 2214 | 万难 2215 | 枉 2216 | 枉费心机 2217 | 枉然 2218 | 望梅止渴 2219 | 忘恩负义 2220 | 忘情 2221 | 妄 2222 | 妄自尊大 2223 | 威 2224 | 威厉 2225 | 微不足道 2226 | 微贱 2227 | 微茫 2228 | 微末 2229 | 危殆 2230 | 危机四伏 2231 | 危机重重 2232 | 危急 2233 | 危如累卵 2234 | 危亡 2235 | 危险 2236 | 危在旦夕 2237 | 唯利是图 2238 | 唯我独尊 2239 | 惟利是图 2240 | 惟我独尊 2241 | 为人作嫁 2242 | 为人作嫁衣裳 2243 | 为所欲为 2244 | 萎靡不振 2245 | 委靡不振 2246 | 委琐 2247 | 伪 2248 | 伪善 2249 | 伪造 2250 | 未便 2251 | 未成熟 2252 | 未归类 2253 | 未揭露 2254 | 未老先衰 2255 | 未列计划 2256 | 未受过教育 2257 | 味道不好 2258 | 味同嚼蜡 2259 | 畏怯 2260 | 畏首畏尾 2261 | 文不对题 2262 | 文弱 2263 | 文恬武嬉 2264 | 紊 2265 | 紊乱 2266 | 问道于盲 2267 | 窝囊 2268 | 乌沉沉 2269 | 乌灯黑火 2270 | 乌洞洞 2271 | 乌七八糟 2272 | 乌漆墨黑 2273 | 乌涂 2274 | 乌托邦 2275 | 乌压压 2276 | 乌烟瘴气 2277 | 污 2278 | 污秽 2279 | 污七八糟 2280 | 污浊 2281 | 无伴 2282 | 无表情 2283 | 无补 2284 | 无补于事 2285 | 无常 2286 | 无诚意 2287 | 无道德观念 2288 | 无的放矢 2289 | 无动于衷 2290 | 无度 2291 | 无端 2292 | 无端端 2293 | 无法无天 2294 | 无根据 2295 | 无故 2296 | 无关大局 2297 | 无关宏旨 2298 | 无关紧要 2299 | 无关痛痒 2300 | 无光 2301 | 无光泽 2302 | 无规 2303 | 无涵养 2304 | 无稽 2305 | 无济于事 2306 | 无计划 2307 | 无记名 2308 | 无纪律 2309 | 无价值 2310 | 无教养 2311 | 无节制 2312 | 无可无不可 2313 | 无口才 2314 | 无赖 2315 | 无理 2316 | 无礼 2317 | 无力 2318 | 无聊 2319 | 无眉目 2320 | 无目的 2321 | 无能 2322 | 无能为力 2323 | 无凭无据 2324 | 无情 2325 | 无情无义 2326 | 无人过问 2327 | 无人问津 2328 | 无伤大雅 2329 | 无生气 2330 | 无实效 2331 | 无实质 2332 | 无所帮助 2333 | 无所不用其极 2334 | 无特色 2335 | 无望 2336 | 无味 2337 | 无谓 2338 | 无吸引力 2339 | 无限制 2340 | 无效 2341 | 无依无靠 2342 | 无意义 2343 | 无益 2344 | 无用 2345 | 无原则 2346 | 无缘无故 2347 | 无证据 2348 | 无知 2349 | 无中生有 2350 | 无助 2351 | 无足轻重 2352 | 芜 2353 | 芜杂 2354 | 武断 2355 | 雾里看花 2356 | 误 2357 | 误诊 2358 | 稀里糊涂 2359 | 稀松 2360 | 稀松平常 2361 | 喜新厌旧 2362 | 细 2363 | 细碎 2364 | 细小 2365 | 瞎 2366 | 下 2367 | 下乘 2368 | 下道儿 2369 | 下等 2370 | 下贱 2371 | 下流 2372 | 下品 2373 | 下三烂 2374 | 下三滥 2375 | 下作 2376 | 吓人 2377 | 纤弱 2378 | 险 2379 | 险毒 2380 | 险恶 2381 | 险峻 2382 | 险峭 2383 | 险象环生 2384 | 险要 2385 | 险诈 2386 | 险阻 2387 | 现行 2388 | 羡余 2389 | 香艳 2390 | 享乐 2391 | 向上倾斜 2392 | 向下倾斜 2393 | 象征性 2394 | 萧 2395 | 萧然 2396 | 萧瑟 2397 | 萧森 2398 | 萧疏 2399 | 萧索 2400 | 萧条 2401 | 萧飒 2402 | 嚣杂 2403 | 嚣张 2404 | 消极 2405 | 小 2406 | 小肚鸡肠 2407 | 小儿科 2408 | 小家子气 2409 | 小家子相 2410 | 小里小气 2411 | 小气 2412 | 小手小脚 2413 | 小小不言 2414 | 小心眼 2415 | 小心眼儿 2416 | 笑里藏刀 2417 | 效率很差 2418 | 携贰 2419 | 邪 2420 | 邪恶 2421 | 斜 2422 | 斜体 2423 | 斜歪 2424 | 卸磨杀驴 2425 | 懈怠 2426 | 辛 2427 | 辛苦 2428 | 辛酸 2429 | 辛辛苦苦 2430 | 心不在焉 2431 | 心粗 2432 | 心地狭窄 2433 | 心毒 2434 | 心浮 2435 | 心黑手辣 2436 | 心狠 2437 | 心狠手辣 2438 | 心口不一 2439 | 心切 2440 | 心如蛇蝎 2441 | 心如铁石 2442 | 心胸狭隘 2443 | 心胸狭窄 2444 | 心眼儿小 2445 | 心眼儿窄 2446 | 心眼小 2447 | 心猿意马 2448 | 星星点点 2449 | 腥 2450 | 腥臭 2451 | 腥臊 2452 | 腥膻 2453 | 形单影只 2454 | 形格势禁 2455 | 形同路人 2456 | 形同虚设 2457 | 形影相吊 2458 | 行不通 2459 | 行为不端 2460 | 行为不检 2461 | 性格内向 2462 | 性急 2463 | 性情急躁 2464 | 凶 2465 | 凶巴巴 2466 | 凶暴 2467 | 凶残 2468 | 凶毒 2469 | 凶恶 2470 | 凶悍 2471 | 凶狠 2472 | 凶横 2473 | 凶狂 2474 | 凶蛮 2475 | 凶猛 2476 | 凶煞 2477 | 凶顽 2478 | 凶险 2479 | 凶戾 2480 | 胸无城府 2481 | 胸无点墨 2482 | 熊 2483 | 虚 2484 | 虚诞 2485 | 虚浮 2486 | 虚幻 2487 | 虚假 2488 | 虚空 2489 | 虚夸 2490 | 虚拟 2491 | 虚荣 2492 | 虚弱 2493 | 虚设 2494 | 虚妄 2495 | 虚伪 2496 | 虚无 2497 | 虚无飘渺 2498 | 虚无缥缈 2499 | 虚虚实实 2500 | 虚有其表 2501 | 虚诈 2502 | 絮 2503 | 絮叨 2504 | 絮聒 2505 | 喧 2506 | 喧天 2507 | 喧嚣 2508 | 喧杂 2509 | 喧噪 2510 | 悬 2511 | 悬乎 2512 | 悬空 2513 | 玄 2514 | 学究气 2515 | 学识浅薄 2516 | 学识谫陋 2517 | 雪上加霜 2518 | 血淋淋 2519 | 血腥 2520 | 血雨腥风 2521 | 牙碜 2522 | 亚 2523 | 烟雾弥漫 2524 | 烟雾腾腾 2525 | 严 2526 | 严加 2527 | 严峻 2528 | 严苛 2529 | 严酷 2530 | 严冷 2531 | 严厉 2532 | 严肃 2533 | 严重 2534 | 言不由衷 2535 | 言之无物 2536 | 眼巴巴 2537 | 眼光短浅 2538 | 眼皮子高 2539 | 眼皮子浅 2540 | 眼生 2541 | 衍 2542 | 扬长 2543 | 羊质虎皮 2544 | 阳奉阴违 2545 | 妖 2546 | 妖里妖气 2547 | 摇摇晃晃 2548 | 摇摇欲坠 2549 | 要不得 2550 | 野 2551 | 野鸡 2552 | 野蛮 2553 | 叶公好龙 2554 | 夜郎自大 2555 | 一把死拿 2556 | 一暴十寒 2557 | 一波三折 2558 | 一不小心 2559 | 一场空 2560 | 一成不变 2561 | 一触即溃 2562 | 一发千钧 2563 | 一锅粥 2564 | 一脸横肉 2565 | 一脸稚气 2566 | 一毛不拔 2567 | 一偏 2568 | 一贫如洗 2569 | 一钱不值 2570 | 一仍旧贯 2571 | 一手遮天 2572 | 一塌糊涂 2573 | 一团乱麻 2574 | 一团漆黑 2575 | 一团糟 2576 | 一文不名 2577 | 一文不值 2578 | 一窝蜂 2579 | 一无可取 2580 | 一无是处 2581 | 一无所长 2582 | 一无所有 2583 | 一言堂 2584 | 一掷千金 2585 | 依违 2586 | 依稀 2587 | 衣衫不整 2588 | 颐指气使 2589 | 疑难 2590 | 倚老卖老 2591 | 以怨报德 2592 | 易变 2593 | 易怒 2594 | 臆 2595 | 意马心猿 2596 | 义正词严 2597 | 溢价 2598 | 异常 2599 | 异形 2600 | 荫 2601 | 因循守旧 2602 | 殷 2603 | 殷切 2604 | 阴 2605 | 阴暗 2606 | 阴沉 2607 | 阴沉沉 2608 | 阴毒 2609 | 阴恶 2610 | 阴晦 2611 | 阴冷 2612 | 阴凄 2613 | 阴森 2614 | 阴森森 2615 | 阴损 2616 | 阴险 2617 | 阴险毒辣 2618 | 阴性 2619 | 阴阳怪气 2620 | 淫 2621 | 淫荡 2622 | 淫秽 2623 | 淫贱 2624 | 淫乱 2625 | 淫靡 2626 | 淫邪 2627 | 淫逸 2628 | 淫亵 2629 | 淫猥 2630 | 引起反感 2631 | 隐 2632 | 隐晦 2633 | 隐秘 2634 | 隐然 2635 | 隐身 2636 | 隐形 2637 | 隐性 2638 | 隐隐 2639 | 隐隐绰绰 2640 | 隐隐约约 2641 | 隐约 2642 | 应名儿 2643 | 影影绰绰 2644 | 硬 2645 | 硬气 2646 | 硬生生 2647 | 硬性 2648 | 拥挤 2649 | 拥挤不堪 2650 | 庸 2651 | 庸碌 2652 | 庸俗 2653 | 庸庸碌碌 2654 | 用不着 2655 | 幽 2656 | 幽暗 2657 | 幽晦 2658 | 幽幽 2659 | 幽冥 2660 | 幽黯 2661 | 优柔 2662 | 优柔寡断 2663 | 悠谬 2664 | 犹犹豫豫 2665 | 犹豫不决 2666 | 犹豫不前 2667 | 油 2668 | 油乎乎 2669 | 油滑 2670 | 油腻 2671 | 油腻腻 2672 | 油头滑脑 2673 | 油汪汪 2674 | 油脂麻花 2675 | 油渍渍 2676 | 有碍观瞻 2677 | 有弊 2678 | 有点旧 2679 | 有毒 2680 | 有毒性 2681 | 有害 2682 | 有名无实 2683 | 有难度 2684 | 有伤风化 2685 | 有失检点 2686 | 有失偏颇 2687 | 有失身分 2688 | 有始无终 2689 | 有恃无恐 2690 | 有头无尾 2691 | 有一搭没一搭 2692 | 有义务 2693 | 有罪 2694 | 幼稚 2695 | 迂 2696 | 迂腐 2697 | 迂阔 2698 | 迂拙 2699 | 于事无补 2700 | 愚 2701 | 愚笨 2702 | 愚不可及 2703 | 愚痴 2704 | 愚蠢 2705 | 愚钝 2706 | 愚陋 2707 | 愚鲁 2708 | 愚昧 2709 | 愚昧无知 2710 | 愚蒙 2711 | 愚傻 2712 | 愚顽 2713 | 愚妄 2714 | 愚拙 2715 | 余剩 2716 | 逾分 2717 | 鱼龙混杂 2718 | 鱼游釜中 2719 | 与虎谋皮 2720 | 与世隔绝 2721 | 与世无争 2722 | 语无伦次 2723 | 语焉不详 2724 | 羽毛未丰 2725 | 欲壑难填 2726 | 原始 2727 | 圆 2728 | 圆滑 2729 | 约略 2730 | 越轨 2731 | 越礼 2732 | 云遮雾障 2733 | 云谲波诡 2734 | 蕴藉 2735 | 晕头转向 2736 | 杂 2737 | 杂草丛生 2738 | 杂乱 2739 | 杂乱无章 2740 | 杂牌 2741 | 杂七杂八 2742 | 杂遝 2743 | 杂沓 2744 | 灾难性 2745 | 在困难中 2746 | 脏 2747 | 脏乎乎 2748 | 脏乱 2749 | 脏乱差 2750 | 脏兮兮 2751 | 糟 2752 | 糟糕 2753 | 凿空 2754 | 凿死理儿 2755 | 躁 2756 | 躁急 2757 | 躁狂 2758 | 造次 2759 | 造作 2760 | 贼 2761 | 贼溜溜 2762 | 贼眉鼠眼 2763 | 贼去关门 2764 | 贼头贼脑 2765 | 扎手 2766 | 轧 2767 | 窄 2768 | 张冠李戴 2769 | 张狂 2770 | 招致不幸 2771 | 照本宣科 2772 | 狰狞 2773 | 正色 2774 | 正颜厉色 2775 | 枝蔓 2776 | 支离 2777 | 支离破碎 2778 | 直呆呆 2779 | 直瞪瞪 2780 | 直盯盯 2781 | 直勾勾 2782 | 直愣愣 2783 | 执迷不悟 2784 | 执拗 2785 | 趾高气扬 2786 | 只顾自身利益 2787 | 只听楼梯响,不见人下来 2788 | 纸上谈兵 2789 | 纸醉金迷 2790 | 志大才疏 2791 | 智障 2792 | 稚气 2793 | 质次价高 2794 | 质量差 2795 | 滞 2796 | 滞背 2797 | 滞钝 2798 | 滞涩 2799 | 滞销 2800 | 窒闷 2801 | 重 2802 | 重沓 2803 | 众叛亲离 2804 | 皱 2805 | 皱巴 2806 | 皱巴巴 2807 | 皱皱巴巴 2808 | 竹篮打水 2809 | 竹篮子打水 2810 | 竹篮子打水一场空 2811 | 煮豆燃萁 2812 | 主观 2813 | 主观上 2814 | 讆 2815 | 专横 2816 | 专横跋扈 2817 | 专制 2818 | 转移性 2819 | 装备不良 2820 | 装模作样 2821 | 装腔 2822 | 装腔作势 2823 | 装相 2824 | 装样子 2825 | 赘 2826 | 赘余 2827 | 捉襟见肘 2828 | 捉摸不定 2829 | 拙 2830 | 拙笨 2831 | 拙劣 2832 | 着三不着两 2833 | 浊 2834 | 子虚 2835 | 子虚乌有 2836 | 自傲 2837 | 自大 2838 | 自负 2839 | 自高自大 2840 | 自豪 2841 | 自命不凡 2842 | 自命清高 2843 | 自恃 2844 | 自私 2845 | 自私自利 2846 | 自相矛盾 2847 | 纵恣 2848 | 走神 2849 | 走油 2850 | 嘴尖 2851 | 醉翁之意不在酒 2852 | 最差 2853 | 最坏 2854 | 罪不容诛 2855 | 罪大恶极 2856 | 罪恶 2857 | 罪恶多端 2858 | 罪恶深重 2859 | 罪恶滔天 2860 | 罪恶昭彰 2861 | 罪恶昭著 2862 | 罪该万死 2863 | 罪孽深重 2864 | 左 2865 | 做作 2866 | 作势 2867 | 坐而论道 2868 | 坐井观天 2869 | 兀突 2870 | 孬 2871 | 噩 2872 | 卮 2873 | 孛 2874 | 啬 2875 | 啬刻 2876 | 厝火积薪 2877 | 赝 2878 | 剌 2879 | 剌戾 2880 | 剽悍 2881 | 罔 2882 | 伧 2883 | 伧俗 2884 | 佶屈聱牙 2885 | 侉 2886 | 佻 2887 | 俚 2888 | 俚俗 2889 | 倜然 2890 | 倥 2891 | 倥侗 2892 | 倥偬 2893 | 倨 2894 | 倨傲 2895 | 傥 2896 | 僭 2897 | 儇 2898 | 巽 2899 | 亵 2900 | 羸弱 2901 | 跅弛 2902 | 跅驰 2903 | 冥 2904 | 冥顽 2905 | 冥顽不化 2906 | 冥顽不灵 2907 | 冥冥 2908 | 讷 2909 | 诎 2910 | 诘屈聱牙 2911 | 谫 2912 | 谫陋 2913 | 谲 2914 | 谲诈 2915 | 阢 2916 | 阽 2917 | 刍 2918 | 堙 2919 | 艽 2920 | 芴 2921 | 苴 2922 | 茕 2923 | 茕茕 2924 | 茕茕孑立 2925 | 茕茕孑立,形影相吊 2926 | 荏 2927 | 荏弱 2928 | 萋迷 2929 | 迍邅 2930 | 瞢 2931 | 拗 2932 | 拮据 2933 | 吆三喝四 2934 | 吆五喝六 2935 | 咄咄逼人 2936 | 哙 2937 | 哝 2938 | 啷 2939 | 嗲 2940 | 嗲声嗲气 2941 | 嘈 2942 | 嘈杂 2943 | 嘀里嘟噜 2944 | 岌岌 2945 | 岌岌不可终日 2946 | 岌岌可危 2947 | 嶙峋 2948 | 嶙嶙 2949 | 犷 2950 | 犷悍 2951 | 狃 2952 | 狎 2953 | 狎昵 2954 | 狯 2955 | 狷 2956 | 狷急 2957 | 猥 2958 | 猥鄙 2959 | 猥贱 2960 | 猥劣 2961 | 猥陋 2962 | 猥琐 2963 | 猥亵 2964 | 獐头鼠目 2965 | 獠 2966 | 舛 2967 | 馀 2968 | 廪 2969 | 忉 2970 | 忮 2971 | 忸忸怩怩 2972 | 忸怩作态 2973 | 怊 2974 | 恹 2975 | 恹恹 2976 | 悖 2977 | 悖晦 2978 | 悖谬 2979 | 悖逆 2980 | 悖妄 2981 | 悭 2982 | 悭吝 2983 | 悱 2984 | 愦 2985 | 愣 2986 | 愣头愣脑 2987 | 愀然 2988 | 愎 2989 | 慵懒 2990 | 懵 2991 | 懵懂 2992 | 懵里懵懂 2993 | 懵懵懂懂 2994 | 阙陋 2995 | 阙略 2996 | 湎 2997 | 溲 2998 | 溷浊 2999 | 滂 3000 | 澹然 3001 | 蹇 3002 | 遴 3003 | 邋里邋遢 3004 | 邋遢 3005 | 邋邋遢遢 3006 | 孱 3007 | 孱弱 3008 | 羼 3009 | 娆 3010 | 媸 3011 | 孑 3012 | 孑然 3013 | 孑然一身 3014 | 孑身 3015 | 驽 3016 | 驽钝 3017 | 骈枝 3018 | 绌 3019 | 缈 3020 | 缛 3021 | 缥缈 3022 | 缭乱 3023 | 幺麽 3024 | 杌 3025 | 桀 3026 | 桀骜不驯 3027 | 棼 3028 | 槁 3029 | 轫 3030 | 辁 3031 | 暧 3032 | 暧昧 3033 | 暝 3034 | 犟 3035 | 毵毵 3036 | 虢 3037 | 朦 3038 | 朦胧 3039 | 朦朦胧胧 3040 | 臊 3041 | 膻 3042 | 膻气 3043 | 膻腥 3044 | 熹微 3045 | 戾 3046 | 恝 3047 | 恝然 3048 | 恣 3049 | 恣肆 3050 | 恣意 3051 | 憝 3052 | 戆 3053 | 戆头戆脑 3054 | 沓 3055 | 硗 3056 | 硗薄 3057 | 硗瘠 3058 | 碜 3059 | 睨 3060 | 瞀 3061 | 瞑 3062 | 瞽 3063 | 锱铢必较 3064 | 鸷 3065 | 鸷悍 3066 | 疣赘 3067 | 瘠 3068 | 瘠薄 3069 | 癃 3070 | 癫狂 3071 | 窈冥 3072 | 窭 3073 | 窳 3074 | 窳败 3075 | 窳惰 3076 | 窳劣 3077 | 褊 3078 | 褊急 3079 | 褊狭 3080 | 褶 3081 | 矜 3082 | 矜持 3083 | 矜夸 3084 | 聒 3085 | 聒噪 3086 | 颛 3087 | 颛蒙 3088 | 颟顸 3089 | 蚍蜉撼大树 3090 | 蚍蜉撼树 3091 | 蚩 3092 | 蜻蜓点水 3093 | 笃 3094 | 箪食瓢饮 3095 | 趄 3096 | 蹩脚 3097 | 霭霭 3098 | 龃 3099 | 龃龉 3100 | 龉 3101 | 龌 3102 | 龌龊 3103 | 鲰 3104 | 饕 3105 | 黝 3106 | 黝暗 3107 | 黝黯 3108 | 黠 3109 | 黠慧 3110 | 黢 3111 | 黢黑 3112 | 黩 3113 | 黪 3114 | 黯 3115 | 黯淡 3116 | 黯然 3117 | -------------------------------------------------------------------------------- /sentiment_dic/negative_sentiment.txt: -------------------------------------------------------------------------------- 1 | 傒倖 2 | 忷 3 | 恟 4 | 懆懆 5 | 搥胸顿足 6 | 哀 7 | 哀哀切切 8 | 哀愁 9 | 哀怜 10 | 哀悯 11 | 哀戚 12 | 哀凄 13 | 哀切 14 | 哀伤 15 | 哀痛 16 | 哀痛欲绝 17 | 哀怨 18 | 哀恸 19 | 哀矜 20 | 傲视 21 | 懊 22 | 懊恨 23 | 懊悔 24 | 懊恼 25 | 懊丧 26 | 百无聊赖 27 | 败兴 28 | 板 29 | 板脸 30 | 板面孔 31 | 板起脸 32 | 板着脸 33 | 板着面孔 34 | 半信半疑 35 | 包涵 36 | 包容 37 | 褒贬 38 | 睖睁 39 | 薄 40 | 抱不平 41 | 抱憾 42 | 抱憾终身 43 | 抱恨 44 | 抱恨终生 45 | 抱恨终天 46 | 抱疚 47 | 抱愧 48 | 抱歉 49 | 抱怨 50 | 暴跳 51 | 暴跳如雷 52 | 杯弓蛇影 53 | 悲 54 | 悲哀 55 | 悲愁 56 | 悲观失望 57 | 悲悯 58 | 悲戚 59 | 悲凄 60 | 悲切 61 | 悲切切 62 | 悲伤 63 | 悲酸 64 | 悲天悯人 65 | 悲痛 66 | 悲痛欲绝 67 | 悲怆 68 | 悲恸 69 | 悲恻 70 | 背包袱 71 | 绷 72 | 绷脸 73 | 绷着脸 74 | 鼻酸 75 | 鄙 76 | 鄙薄 77 | 鄙贱 78 | 鄙弃 79 | 鄙视 80 | 鄙夷 81 | 鞭挞 82 | 贬斥 83 | 变脸 84 | 变色 85 | 变心 86 | 表示坏情感 87 | 憋 88 | 憋得慌 89 | 憋闷 90 | 憋气 91 | 憋屈 92 | 憋着一肚子气 93 | 勃然大怒 94 | 驳难 95 | 驳议 96 | 不待见 97 | 不甘 98 | 不甘心 99 | 不顾 100 | 不过意 101 | 不寒而栗 102 | 不好过 103 | 不好意思 104 | 不快 105 | 不落忍 106 | 不满 107 | 不满意 108 | 不满足 109 | 不念旧恶 110 | 不平 111 | 不容 112 | 不是味儿 113 | 不是滋味 114 | 不是滋味儿 115 | 不爽 116 | 不死心 117 | 不同意 118 | 不闻不问 119 | 不屑 120 | 不屑一顾 121 | 不屑于 122 | 不以为然 123 | 不愿 124 | 不愿意 125 | 不悦 126 | 不赞成 127 | 不赞同 128 | 不忠 129 | 不忠诚 130 | 怖 131 | 猜忌 132 | 猜嫌 133 | 猜疑 134 | 惭 135 | 惭惶 136 | 惭愧 137 | 惨痛 138 | 仓皇失措 139 | 藏奸 140 | 操心 141 | 诧 142 | 诧异 143 | 诧愕 144 | 嘲骂 145 | 嘲谑 146 | 沉闷 147 | 沉痛 148 | 沉吟 149 | 沉郁 150 | 沉重 151 | 诚惶诚恐 152 | 吃不准 153 | 吃错药 154 | 吃后悔药 155 | 痴愣 156 | 持异议 157 | 迟疑 158 | 迟疑不决 159 | 耻骂 160 | 斥 161 | 斥骂 162 | 斥责 163 | 踌躇 164 | 踌躇不决 165 | 踌躇不前 166 | 愁 167 | 愁惨 168 | 愁肠百结 169 | 愁眉不展 170 | 愁眉紧锁 171 | 愁眉苦脸 172 | 愁眉锁眼 173 | 愁闷 174 | 愁容满面 175 | 仇恨 176 | 仇视 177 | 臭骂 178 | 出气 179 | 出神 180 | 吹胡子瞪眼 181 | 捶胸顿足 182 | 垂怜 183 | 垂头丧气 184 | 戳壁脚 185 | 戳脊梁骨 186 | 刺打 187 | 蹿火 188 | 错愕 189 | 打骂 190 | 打入冷宫 191 | 打入十八层地狱 192 | 打问号 193 | 打怵 194 | 打憷 195 | 大吃一惊 196 | 大跌眼镜 197 | 大动肝火 198 | 大发雷霆 199 | 大惊失色 200 | 大骂 201 | 大失所望 202 | 呆 203 | 呆若木鸡 204 | 呆怔 205 | 呆滞 206 | 呆住 207 | 呆愣愣 208 | 贷 209 | 担惊受怕 210 | 担心 211 | 担忧 212 | 胆颤心惊 213 | 胆寒 214 | 胆战心惊 215 | 惮 216 | 当紧 217 | 当头棒喝 218 | 得饶人处且饶人 219 | 等不及 220 | 等闲视之 221 | 瞪眼 222 | 低沉 223 | 低落 224 | 敌视 225 | 惦 226 | 惦挂 227 | 惦记 228 | 惦念 229 | 掉魂 230 | 掉以轻心 231 | 跌眼镜 232 | 动肝火 233 | 动火 234 | 动怒 235 | 动气 236 | 动摇 237 | 恫 238 | 斗 239 | 斗争 240 | 堵 241 | 堵得慌 242 | 堵心 243 | 断肠 244 | 断魂 245 | 顿生疑窦 246 | 顿足捶胸 247 | 多虑 248 | 多有微词 249 | 恶 250 | 恶骂 251 | 扼腕 252 | 耳热 253 | 发愁 254 | 发呆 255 | 发狠 256 | 发火 257 | 发急 258 | 发牢骚 259 | 发毛 260 | 发怒 261 | 发脾气 262 | 发怔 263 | 发指 264 | 发作 265 | 发怵 266 | 发愣 267 | 发憷 268 | 发飙 269 | 翻然悔悟 270 | 烦 271 | 烦愁 272 | 烦闷 273 | 烦恼 274 | 烦腻 275 | 烦扰 276 | 烦神 277 | 烦厌 278 | 烦忧 279 | 烦躁 280 | 反唇相讥 281 | 反感 282 | 犯愁 283 | 犯急 284 | 犯难 285 | 犯疑心病 286 | 犯怵 287 | 犯憷 288 | 非常悲哀 289 | 非难 290 | 非议 291 | 费精神 292 | 费神 293 | 忿忿 294 | 忿忿不平 295 | 忿忿然 296 | 忿恨 297 | 忿怒 298 | 忿恚 299 | 忿懑 300 | 愤愤 301 | 愤愤不平 302 | 愤愤然 303 | 愤恨 304 | 愤怒 305 | 愤世嫉俗 306 | 愤懑 307 | 讽 308 | 讽刺 309 | 付之一笑 310 | 负疚 311 | 负气 312 | 肝肠寸断 313 | 感伤 314 | 给 ... 当头棒喝 315 | 给 ... 一点颜色看看 316 | 攻击 317 | 骨鲠在喉 318 | 顾忌 319 | 顾虑 320 | 顾虑重重 321 | 顾念 322 | 寡欢 323 | 挂 324 | 挂怀 325 | 挂火 326 | 挂记 327 | 挂虑 328 | 挂念 329 | 挂牵 330 | 挂心 331 | 怪 332 | 怪罪 333 | 光火 334 | 过不去 335 | 过分操心 336 | 过虑 337 | 过意不去 338 | 害怕 339 | 害羞 340 | 害臊 341 | 骇 342 | 骇怪 343 | 骇惧 344 | 骇怕 345 | 骇然失色 346 | 骇异 347 | 骇愕 348 | 含悲 349 | 含愤 350 | 含恨 351 | 含怒 352 | 含沙射影 353 | 含羞 354 | 含怨 355 | 涵容 356 | 寒 357 | 寒心 358 | 憾 359 | 悍然不顾 360 | 汗颜 361 | 毫不在乎 362 | 呵 363 | 呵斥 364 | 呵责 365 | 呵叱 366 | 喝斥 367 | 喝叱 368 | 恨 369 | 恨入骨髓 370 | 恨铁不成钢 371 | 恨之入骨 372 | 红脸 373 | 红眼 374 | 猴儿急 375 | 后顾之忧 376 | 后悔 377 | 后悔莫及 378 | 后怕 379 | 忽略 380 | 忽视 381 | 狐疑不决 382 | 虎着脸 383 | 怀恨 384 | 怀恨在心 385 | 怀疑 386 | 坏情 387 | 患 388 | 荒 389 | 荒废 390 | 慌恐 391 | 皇皇 392 | 惶 393 | 惶惶 394 | 惶惶不安 395 | 惶惶不可终日 396 | 惶惶然 397 | 惶惑 398 | 惶惧 399 | 惶恐 400 | 惶恐不安 401 | 惶然 402 | 惶然不安 403 | 惶悚 404 | 惶遽 405 | 灰溜溜 406 | 灰头灰脸 407 | 灰头土脸 408 | 灰心 409 | 灰心丧气 410 | 回头 411 | 悔 412 | 悔不当初 413 | 悔不该 414 | 悔恨 415 | 悔悟 416 | 悔之不及 417 | 悔之晚矣 418 | 悔之无及 419 | 魂不附体 420 | 魂飞魄散 421 | 魂飞天外 422 | 火 423 | 火急火燎 424 | 火冒三丈 425 | 火烧火燎 426 | 火头上 427 | 饥不择食 428 | 激愤 429 | 讥嘲 430 | 讥刺 431 | 讥讽 432 | 讥讪 433 | 讥诮 434 | 鸡蛋里挑骨头 435 | 极度悲哀 436 | 极度悲伤 437 | 急 438 | 急巴巴 439 | 急急巴巴 440 | 急死 441 | 急眼 442 | 疾 443 | 嫉恨 444 | 悸栗 445 | 忌 446 | 忌惮 447 | 忌恨 448 | 见怪 449 | 见罪 450 | 将心比心 451 | 将信将疑 452 | 焦愁 453 | 焦急 454 | 焦虑 455 | 焦心 456 | 焦炙 457 | 焦灼 458 | 娇羞 459 | 教训 460 | 叫苦 461 | 叫苦不迭 462 | 叫苦连天 463 | 叫骂 464 | 叫嚣 465 | 解气 466 | 借古讽今 467 | 介怀 468 | 介意 469 | 进退两难 470 | 进退维谷 471 | 惊 472 | 惊怖 473 | 惊诧 474 | 惊呆 475 | 惊怪 476 | 惊骇 477 | 惊慌 478 | 惊慌失措 479 | 惊惶 480 | 惊惧 481 | 惊恐 482 | 惊怕 483 | 惊奇 484 | 惊奇不已 485 | 惊叹 486 | 惊讶 487 | 惊疑 488 | 惊异 489 | 惊悚 490 | 惊愕 491 | 窘 492 | 窘迫 493 | 揪心 494 | 疚愧 495 | 拘束 496 | 举棋不定 497 | 沮 498 | 沮丧 499 | 惧 500 | 惧怕 501 | 眷顾 502 | 觉得自己理亏 503 | 绝望 504 | 开炮 505 | 看扁 506 | 看不惯 507 | 看不开 508 | 看不起 509 | 看不上 510 | 看不上眼 511 | 看不顺眼 512 | 看淡 513 | 看低 514 | 看轻 515 | 抗议 516 | 苛察 517 | 苛责 518 | 可怜 519 | 可惜 520 | 恐 521 | 恐慌 522 | 恐惧 523 | 口诛笔伐 524 | 哭丧着脸 525 | 哭笑不得 526 | 苦闷 527 | 苦恼 528 | 苦涩 529 | 宽贷 530 | 宽假 531 | 宽免 532 | 宽赦 533 | 宽恕 534 | 宽宥 535 | 狂怒 536 | 亏心 537 | 愧 538 | 愧对 539 | 愧汗 540 | 愧恨 541 | 愧悔 542 | 愧疚 543 | 愧怍 544 | 愧恧 545 | 愧赧 546 | 困窘 547 | 困迫 548 | 拉不下脸 549 | 拉不下脸来 550 | 拉长个脸 551 | 拉下脸 552 | 拉下脸来 553 | 来火 554 | 来气 555 | 赖 556 | 懒得 557 | 懒洋洋 558 | 劳神 559 | 老羞成怒 560 | 冷嘲热讽 561 | 冷淡 562 | 怜 563 | 怜悯 564 | 怜惜 565 | 怜恤 566 | 脸红脖子粗 567 | 脸红耳热 568 | 脸皮薄 569 | 脸上下不来 570 | 凉 571 | 两难 572 | 亮红灯 573 | 谅 574 | 谅解 575 | 虑 576 | 乱 577 | 乱了方寸 578 | 骂 579 | 骂不绝口 580 | 骂大街 581 | 骂得狗血淋头 582 | 骂得狗血喷头 583 | 骂街 584 | 骂骂咧咧 585 | 骂娘 586 | 骂人 587 | 埋没 588 | 埋汰 589 | 埋怨 590 | 满不在乎 591 | 满脸愁雾 592 | 漫骂 593 | 谩骂 594 | 毛骨悚然 595 | 冒火 596 | 没个好脸 597 | 没精打采 598 | 没意思 599 | 没有好脸 600 | 闷 601 | 闷沉沉 602 | 闷闷 603 | 闷闷不乐 604 | 闷郁 605 | 面斥 606 | 面带怒色 607 | 面带嗔色 608 | 面面相觑 609 | 面如死灰 610 | 面如土色 611 | 面无人色 612 | 面有愧色 613 | 面有难色 614 | 面有愠色 615 | 藐视 616 | 蔑 617 | 蔑视 618 | 民怨沸腾 619 | 悯 620 | 鸣不平 621 | 鸣冤叫屈 622 | 摸不准 623 | 磨不开 624 | 抹不开 625 | 漠然视之 626 | 漠然置之 627 | 漠视 628 | 木然 629 | 目瞪口呆 630 | 纳罕 631 | 难 632 | 难过 633 | 难堪 634 | 难受 635 | 难为情 636 | 恼 637 | 恼恨 638 | 恼火 639 | 恼怒 640 | 恼羞成怒 641 | 闹脾气 642 | 闹情绪 643 | 闹性子 644 | 馁 645 | 内疚 646 | 腻 647 | 腻烦 648 | 腻歪 649 | 腻味 650 | 捏把汗 651 | 捏一把汗 652 | 怒 653 | 怒不可遏 654 | 怒斥 655 | 怒冲冲 656 | 怒发冲冠 657 | 怒喝 658 | 怒火冲天 659 | 怒火中烧 660 | 怒骂 661 | 怒目 662 | 怒气冲冲 663 | 怒气冲天 664 | 怒形于色 665 | 怒叱 666 | 怕 667 | 怕生 668 | 怕羞 669 | 拍案而起 670 | 排揎 671 | 徘徊 672 | 派不是 673 | 旁敲侧击 674 | 抨 675 | 抨击 676 | 批 677 | 批斗 678 | 苶 679 | 皮里阳秋 680 | 屁滚尿流 681 | 偏废 682 | 品头论足 683 | 评头论足 684 | 评头品足 685 | 颇有微词 686 | 破口大骂 687 | 魄散魂飞 688 | 迫不及待 689 | 戚戚 690 | 戚然 691 | 七窍生烟 692 | 凄惶 693 | 凄切 694 | 凄然 695 | 凄酸 696 | 凄婉 697 | 凄怨 698 | 凄恻 699 | 歧视 700 | 骑虎难下 701 | 起疑心 702 | 气 703 | 气昂昂 704 | 气不忿 705 | 气不过 706 | 气不平 707 | 气冲冲 708 | 气冲牛斗 709 | 气短 710 | 气忿 711 | 气忿忿 712 | 气愤 713 | 气愤愤 714 | 气鼓鼓 715 | 气狠狠 716 | 气哼哼 717 | 气呼呼 718 | 气乎乎 719 | 气急败坏 720 | 气恼 721 | 气馁 722 | 气头上 723 | 气汹汹 724 | 牵念 725 | 迁怒 726 | 谴 727 | 谴责 728 | 歉然 729 | 歉甚 730 | 瞧不起 731 | 瞧不上 732 | 瞧不上眼 733 | 切齿 734 | 切齿痛恨 735 | 怯 736 | 怯阵 737 | 轻 738 | 轻忽 739 | 轻看 740 | 轻蔑 741 | 轻视 742 | 清算 743 | 穷极无聊 744 | 饶 745 | 饶人 746 | 饶恕 747 | 惹气 748 | 人身攻击 749 | 忍让 750 | 柔肠百结 751 | 柔肠寸断 752 | 如泣如诉 753 | 如丧考妣 754 | 如鲠在喉 755 | 辱骂 756 | 撒气 757 | 三心二意 758 | 丧胆 759 | 丧魂落魄 760 | 丧气 761 | 丧志 762 | 扫兴 763 | 杀气 764 | 傻眼 765 | 伤 766 | 伤悲 767 | 伤怀 768 | 伤神 769 | 伤心 770 | 慑 771 | 申斥 772 | 申讨 773 | 申饬 774 | 深恶痛绝 775 | 深以为异 776 | 声讨 777 | 生恐 778 | 生怕 779 | 生气 780 | 生疑 781 | 失悔 782 | 失节 783 | 失神 784 | 失望 785 | 失意 786 | 使性子 787 | 示不满 788 | 示不同意 789 | 示怒 790 | 势成骑虎 791 | 视同儿戏 792 | 视同蝼蚁 793 | 首鼠两端 794 | 受窘 795 | 疏 796 | 数落 797 | 数说 798 | 恕 799 | 恕宥 800 | 说 801 | 说不 802 | 说风凉话 803 | 说怪话 804 | 酸 805 | 酸楚 806 | 酸溜溜 807 | 缩头缩脑 808 | 谈虎色变 809 | 讨 810 | 讨厌 811 | 提心吊胆 812 | 啼笑皆非 813 | 体谅 814 | 体念 815 | 体惜 816 | 体恤 817 | 天怒人怨 818 | 挑刺儿 819 | 挑毛病 820 | 同病相怜 821 | 同情 822 | 痛 823 | 痛不欲生 824 | 痛斥 825 | 痛恶 826 | 痛恨 827 | 痛骂 828 | 痛惜 829 | 痛心 830 | 痛心疾首 831 | 痛责 832 | 投诉 833 | 兔死狐悲 834 | 颓 835 | 颓废 836 | 颓靡 837 | 颓然 838 | 颓丧 839 | 颓唐 840 | 唾骂 841 | 挖苦 842 | 玩 843 | 玩忽 844 | 玩世不恭 845 | 惋 846 | 惋惜 847 | 万箭穿心 848 | 万念俱灰 849 | 往心里去 850 | 望而生畏 851 | 微愠 852 | 唯恐 853 | 惟恐 854 | 为难 855 | 萎靡 856 | 委决不下 857 | 委靡 858 | 委屈 859 | 委罪 860 | 畏 861 | 畏忌 862 | 畏惧 863 | 畏葸 864 | 闻风丧胆 865 | 问心有愧 866 | 窝火 867 | 窝囊 868 | 窝气 869 | 窝心 870 | 无地自容 871 | 无精打采 872 | 无聊 873 | 无名火起 874 | 无视 875 | 无所谓 876 | 无心 877 | 无意 878 | 物伤其类 879 | 惜 880 | 系 881 | 系念 882 | 戏侮 883 | 下不来台 884 | 下不了台 885 | 衔恨 886 | 衔冤 887 | 嫌 888 | 嫌恶 889 | 嫌弃 890 | 嫌厌 891 | 嫌憎 892 | 想不开 893 | 向 ... 问罪 894 | 向隅 895 | 向隅而泣 896 | 消沉 897 | 小看 898 | 小瞧 899 | 小视 900 | 笑骂 901 | 泄劲 902 | 泄气 903 | 心胆俱裂 904 | 心烦 905 | 心烦意乱 906 | 心寒 907 | 心灰意懒 908 | 心灰意冷 909 | 心急 910 | 心急火燎 911 | 心急如焚 912 | 心急如火 913 | 心焦 914 | 心焦如焚 915 | 心惊胆颤 916 | 心惊胆战 917 | 心惊肉跳 918 | 心里堵得慌 919 | 心情沉重 920 | 心如刀割 921 | 心如刀绞 922 | 心如死灰 923 | 心酸 924 | 心碎 925 | 心疼 926 | 心痛 927 | 心虚 928 | 心绪沉落 929 | 心有余悸 930 | 杏眼圆睁 931 | 羞 932 | 羞惭 933 | 羞答答 934 | 羞恶 935 | 羞窘 936 | 羞愧 937 | 羞怯 938 | 羞人 939 | 羞人答答 940 | 羞涩 941 | 羞羞答答 942 | 羞于 943 | 羞臊 944 | 羞赧 945 | 虚惊 946 | 嘘 947 | 恤 948 | 絮烦 949 | 悬 950 | 悬念 951 | 悬系 952 | 悬心 953 | 训斥 954 | 训戒 955 | 训诫 956 | 讶 957 | 讶然 958 | 讶然失色 959 | 讶异 960 | 厌 961 | 厌恶 962 | 厌烦 963 | 厌恨 964 | 厌倦 965 | 厌腻 966 | 厌气 967 | 厌弃 968 | 摇摆 969 | 要紧 970 | 一怒之下 971 | 一气之下 972 | 一怔 973 | 遗憾 974 | 疑 975 | 疑惑 976 | 疑忌 977 | 疑虑 978 | 疑虑重重 979 | 疑神疑鬼 980 | 抑郁 981 | 抑郁寡欢 982 | 意意思思 983 | 义愤 984 | 义愤填膺 985 | 异 986 | 阴郁 987 | 引咎 988 | 引咎自责 989 | 隐忧 990 | 幽忧 991 | 忧 992 | 忧愁 993 | 忧烦 994 | 忧愤 995 | 忧惧 996 | 忧虑 997 | 忧闷 998 | 忧伤 999 | 忧思 1000 | 忧心 1001 | 忧心如焚 1002 | 忧心忡忡 1003 | 忧郁 1004 | 忧怨 1005 | 忧悒 1006 | 犹疑 1007 | 犹豫 1008 | 油煎火燎 1009 | 游移 1010 | 有愧 1011 | 于心有愧 1012 | 虞 1013 | 郁 1014 | 郁闷 1015 | 郁郁不乐 1016 | 郁郁寡欢 1017 | 欲哭无泪 1018 | 詟 1019 | 原 1020 | 原谅 1021 | 原宥 1022 | 怨 1023 | 怨恨 1024 | 怨悔 1025 | 怨声载道 1026 | 怨天尤人 1027 | 在乎 1028 | 糟心 1029 | 责 1030 | 责备 1031 | 责斥 1032 | 责怪 1033 | 责骂 1034 | 责难 1035 | 责怨 1036 | 憎 1037 | 憎恶 1038 | 憎恨 1039 | 咋舌 1040 | 炸 1041 | 瞻前顾后 1042 | 战兢兢 1043 | 战战兢兢 1044 | 张口结舌 1045 | 找茬 1046 | 找茬儿 1047 | 找碴 1048 | 找碴儿 1049 | 找岔子 1050 | 针砭 1051 | 震 1052 | 震惊 1053 | 震怒 1054 | 震悚 1055 | 睁一眼闭一眼 1056 | 睁一只眼闭一只眼 1057 | 睁只眼闭只眼 1058 | 怔 1059 | 怔神儿 1060 | 怔怔 1061 | 怔住 1062 | 怔忪 1063 | 直眉瞪眼 1064 | 指斥 1065 | 指鸡骂狗 1066 | 指桑骂槐 1067 | 指责 1068 | 指摘 1069 | 置疑 1070 | 置于脑后 1071 | 置之不顾 1072 | 置之不理 1073 | 置之度外 1074 | 置之脑后 1075 | 质疑 1076 | 滞呆 1077 | 周恤 1078 | 咒 1079 | 咒骂 1080 | 咒诅 1081 | 抓瞎 1082 | 椎心泣血 1083 | 追悔 1084 | 追悔莫及 1085 | 着急 1086 | 着忙 1087 | 自暴自弃 1088 | 自惭形秽 1089 | 自咎 1090 | 自疚 1091 | 自馁 1092 | 自怨自艾 1093 | 自责 1094 | 诅 1095 | 诅骂 1096 | 诅咒 1097 | 左右两难 1098 | 左右为难 1099 | 做贼心虚 1100 | 作难 1101 | 作色 1102 | 倥 1103 | 讪讪 1104 | 诃 1105 | 诘 1106 | 诟 1107 | 诟病 1108 | 诮 1109 | 诶 1110 | 谇 1111 | 谪 1112 | 矍 1113 | 芴 1114 | 菀 1115 | 葸 1116 | 奚落 1117 | 奚幸 1118 | 尴尬 1119 | 挹 1120 | 掎 1121 | 掊 1122 | 掊击 1123 | 摭 1124 | 撸 1125 | 撺 1126 | 叱 1127 | 叱骂 1128 | 叱责 1129 | 哓 1130 | 呲 1131 | 啧有烦言 1132 | 嗔 1133 | 嗔斥 1134 | 嗔怪 1135 | 嗔怒 1136 | 嗤之以鼻 1137 | 嘀咕 1138 | 噍 1139 | 彷 1140 | 彷徨 1141 | 忏 1142 | 忏悔 1143 | 怃 1144 | 怄 1145 | 怄气 1146 | 忡 1147 | 怅 1148 | 怅恨 1149 | 怅然 1150 | 怅然若失 1151 | 怅怅 1152 | 怅惘 1153 | 怆 1154 | 怆怳 1155 | 怆恍 1156 | 怆然 1157 | 怆恻 1158 | 忪 1159 | 忸 1160 | 忸怩 1161 | 怵 1162 | 怵然 1163 | 怵头 1164 | 怛 1165 | 怏 1166 | 怏然 1167 | 怏然不悦 1168 | 怏怏 1169 | 怏怏不乐 1170 | 怍 1171 | 怫 1172 | 怫然 1173 | 怫然不悦 1174 | 怫然作色 1175 | 恸 1176 | 恻 1177 | 恻然 1178 | 恻隐 1179 | 恂 1180 | 悚 1181 | 悚然 1182 | 悒 1183 | 悒闷 1184 | 悒郁 1185 | 悒郁寡欢 1186 | 悒悒不乐 1187 | 悛 1188 | 悻然 1189 | 悻悻 1190 | 悻悻然 1191 | 惝恍 1192 | 惘 1193 | 惘然 1194 | 惘然若失 1195 | 惆 1196 | 惆怅 1197 | 愠 1198 | 愠怒 1199 | 愕 1200 | 愕然 1201 | 愣 1202 | 愣神儿 1203 | 愣怔 1204 | 愣怔怔 1205 | 愣住 1206 | 惴 1207 | 愀 1208 | 慊 1209 | 憷 1210 | 憷头 1211 | 懔 1212 | 忝 1213 | 闵 1214 | 渎 1215 | 宥 1216 | 骞 1217 | 娆 1218 | 嬉笑怒骂 1219 | 槁木死灰 1220 | 殚 1221 | 轸 1222 | 戟指 1223 | 腼腆 1224 | 膈应 1225 | 臊 1226 | 恝置 1227 | 恚 1228 | 恚愤 1229 | 恚恨 1230 | 恚怒 1231 | 恧 1232 | 愍 1233 | 憝 1234 | 懑 1235 | 瞠目结舌 1236 | 瞠然 1237 | 詈 1238 | 詈骂 1239 | 瘅 1240 | 竦 1241 | 矜 1242 | 赧 1243 | 赧然 1244 | 赧颜 1245 | 踟 1246 | 踟躇 1247 | 踟蹰 1248 | 踟蹰不前 1249 | 蹰 1250 | 觖 1251 | 觖望 1252 | 訾议 1253 | 黯然神伤 1254 | 黯然销魂 1255 | -------------------------------------------------------------------------------- /sentiment_dic/positive_sentiment.txt: -------------------------------------------------------------------------------- 1 | 噲 2 | 媢 3 | 媢嫉 4 | 忺 5 | 爱 6 | 爱不忍释 7 | 爱不释手 8 | 爱宠 9 | 爱戴 10 | 爱抚 11 | 爱好 12 | 爱护 13 | 爱怜 14 | 爱恋 15 | 爱慕 16 | 爱上 17 | 爱屋及乌 18 | 爱惜 19 | 安 20 | 昂扬 21 | 巴 22 | 巴不得 23 | 巴望 24 | 摆好 25 | 拜 26 | 拜拜 27 | 拜服 28 | 拜贺 29 | 拜谒 30 | 褒 31 | 褒奖 32 | 褒扬 33 | 睎 34 | 表扬 35 | 表彰 36 | 并重 37 | 补台 38 | 不看僧面看佛面 39 | 不愧 40 | 不胜欣忭 41 | 不惜 42 | 不厌 43 | 睬 44 | 采纳 45 | 参拜 46 | 参谒 47 | 侧重 48 | 馋 49 | 畅快 50 | 唱喏 51 | 倡 52 | 朝拜 53 | 朝思暮想 54 | 撑台面 55 | 撑腰 56 | 称 57 | 称道 58 | 称快 59 | 称赏 60 | 称颂 61 | 称叹 62 | 称羡 63 | 称谢 64 | 称心 65 | 称心如意 66 | 称心如愿 67 | 称许 68 | 称誉 69 | 称愿 70 | 称赞 71 | 承 72 | 承蒙 73 | 承情 74 | 承望 75 | 承应 76 | 骋怀 77 | 吃醋 78 | 痴 79 | 痴恋 80 | 痴迷 81 | 痴情 82 | 痴心不改 83 | 痴心妄想 84 | 驰念 85 | 驰思 86 | 崇 87 | 崇拜 88 | 崇敬 89 | 崇尚 90 | 崇仰 91 | 宠 92 | 宠爱 93 | 宠幸 94 | 酬谢 95 | 踌躇满志 96 | 出迎 97 | 垂爱 98 | 垂念 99 | 垂青 100 | 垂涎 101 | 垂涎三尺 102 | 垂涎欲滴 103 | 春风得意 104 | 春风满面 105 | 醋意大发 106 | 措意 107 | 答礼 108 | 答谢 109 | 答应 110 | 打千 111 | 大快人心 112 | 大喜过望 113 | 戴 114 | 胆敢 115 | 弹冠相庆 116 | 当真 117 | 当之无愧 118 | 倒向 119 | 道贺 120 | 道谢 121 | 得意 122 | 得意忘形 123 | 点头 124 | 点头称是 125 | 点头哈腰 126 | 电贺 127 | 奠祭 128 | 吊祭 129 | 盯紧 130 | 盯住 131 | 顶礼 132 | 顶礼膜拜 133 | 抖 134 | 睹物思人 135 | 妒 136 | 妒恨 137 | 妒火中烧 138 | 妒嫉 139 | 妒忌 140 | 妒羡 141 | 多留个心眼儿 142 | 堕入爱河 143 | 堕入情网 144 | 额手称庆 145 | 反哺 146 | 放胆 147 | 放在心上 148 | 费心 149 | 封禅 150 | 疯魔 151 | 奉 152 | 奉若神明 153 | 奉迎 154 | 俯允 155 | 甘 156 | 甘心 157 | 甘心情愿 158 | 甘愿 159 | 感 160 | 感恩 161 | 感恩戴德 162 | 感激 163 | 感激不尽 164 | 感激涕零 165 | 感同身受 166 | 感谢 167 | 感兴趣 168 | 敢 169 | 高看 170 | 高山仰止 171 | 高兴 172 | 歌颂 173 | 给 ... 留面子 174 | 给脸 175 | 给面子 176 | 恭而敬之 177 | 恭贺 178 | 恭敬 179 | 恭维 180 | 恭喜 181 | 恭祝 182 | 供奉 183 | 公祭 184 | 拱手 185 | 顾 186 | 顾及 187 | 顾盼自雄 188 | 顾全 189 | 顾惜 190 | 挂牵 191 | 关爱 192 | 关怀 193 | 关怀备至 194 | 关切 195 | 关心 196 | 关照 197 | 关注 198 | 管 199 | 贯注 200 | 鬼迷心窍 201 | 跪拜 202 | 跪叩 203 | 过 204 | 过奖 205 | 过问 206 | 过誉 207 | 哈 208 | 酣畅 209 | 豪情满怀 210 | 好 211 | 好奇 212 | 好情 213 | 喝彩 214 | 合掌 215 | 贺 216 | 狠抓 217 | 恨不得 218 | 恨不能 219 | 横心 220 | 厚望 221 | 怀 222 | 怀恋 223 | 怀念 224 | 怀想 225 | 欢 226 | 欢畅 227 | 欢欢喜喜 228 | 欢快 229 | 欢乐 230 | 欢闹 231 | 欢声雷动 232 | 欢腾 233 | 欢天喜地 234 | 欢慰 235 | 欢喜 236 | 欢欣 237 | 欢欣鼓舞 238 | 欢迎 239 | 欢愉 240 | 欢娱 241 | 欢悦 242 | 欢忭 243 | 还礼 244 | 回敬 245 | 回礼 246 | 魂牵梦系 247 | 魂牵梦萦 248 | 豁朗 249 | 稽首 250 | 极热心 251 | 集中 252 | 集注 253 | 急 254 | 嫉 255 | 嫉妒 256 | 冀 257 | 冀求 258 | 冀望 259 | 祭 260 | 祭拜 261 | 祭奠 262 | 祭扫 263 | 祭祀 264 | 记挂 265 | 忌 266 | 忌妒 267 | 嘉 268 | 嘉奖 269 | 嘉许 270 | 夹道欢迎 271 | 兼顾 272 | 检点 273 | 见爱 274 | 见义勇为 275 | 奖 276 | 奖励 277 | 奖赏 278 | 奖掖 279 | 讲 280 | 讲究 281 | 讲求 282 | 交口称誉 283 | 交口称赞 284 | 叫好 285 | 叫绝 286 | 接受 287 | 皆大欢喜 288 | 尽 289 | 尽孝 290 | 尽忠 291 | 惊喜 292 | 景仰 293 | 敬 294 | 敬爱 295 | 敬奉 296 | 敬服 297 | 敬贺 298 | 敬礼 299 | 敬慕 300 | 敬佩 301 | 敬若神明 302 | 敬畏 303 | 敬仰 304 | 敬重 305 | 敬祝 306 | 竟敢 307 | 鞠躬 308 | 聚焦 309 | 聚精会神 310 | 眷爱 311 | 眷恋 312 | 眷念 313 | 开绿灯 314 | 开心 315 | 看车 316 | 看得起 317 | 看得上 318 | 看得上眼 319 | 看上 320 | 看上眼 321 | 看在 322 | 看中 323 | 看重 324 | 考究 325 | 磕头 326 | 渴慕 327 | 渴念 328 | 渴盼 329 | 渴求 330 | 渴望 331 | 渴想 332 | 肯 333 | 肯定 334 | 肯于 335 | 口角春风 336 | 酷爱 337 | 酷好 338 | 夸 339 | 夸奖 340 | 夸赞 341 | 快 342 | 快活 343 | 快乐 344 | 快慰 345 | 快意 346 | 宽畅 347 | 宽松 348 | 狂喜 349 | 狂想 350 | 来神 351 | 乐 352 | 乐不可支 353 | 乐颠颠 354 | 乐呵呵 355 | 乐乐呵呵 356 | 乐陶陶 357 | 乐意 358 | 乐悠悠 359 | 乐于 360 | 乐滋滋 361 | 理会 362 | 理直气壮 363 | 礼赞 364 | 立项 365 | 力主 366 | 怜爱 367 | 恋 368 | 恋爱 369 | 恋恋不舍 370 | 领情 371 | 留个心眼儿 372 | 留神 373 | 留心 374 | 留意 375 | 论功行赏 376 | 买账 377 | 满 378 | 满怀豪情 379 | 满怀激情 380 | 满面春风 381 | 满心欢喜 382 | 满意 383 | 满足 384 | 眉飞色舞 385 | 美 386 | 美言 387 | 美滋滋 388 | 梦魂萦绕 389 | 梦寐以求 390 | 梦想 391 | 迷 392 | 迷恋 393 | 迷上 394 | 面有喜色 395 | 鸣谢 396 | 谬奖 397 | 膜拜 398 | 默认 399 | 默许 400 | 慕 401 | 慕名 402 | 溺爱 403 | 念 404 | 拍案叫绝 405 | 拍手称快 406 | 拍手叫好 407 | 盼 408 | 盼念 409 | 盼望 410 | 佩 411 | 佩服 412 | 捧场 413 | 批准 414 | 偏爱 415 | 偏宠 416 | 偏好 417 | 偏重 418 | 飘飘然 419 | 飘飘欲仙 420 | 迫切需要 421 | 普天同庆 422 | 期 423 | 期待 424 | 期盼 425 | 期望 426 | 祈盼 427 | 起敬 428 | 企 429 | 企慕 430 | 企盼 431 | 企望 432 | 器重 433 | 牵肠挂肚 434 | 牵挂 435 | 千恩万谢 436 | 敲边鼓 437 | 瞧得起 438 | 瞧得上眼 439 | 翘盼 440 | 翘企 441 | 翘望 442 | 钦 443 | 钦佩 444 | 亲热 445 | 亲热亲热 446 | 轻快 447 | 倾慕 448 | 倾向 449 | 倾心 450 | 情有独钟 451 | 情愿 452 | 庆 453 | 庆贺 454 | 庆幸 455 | 庆祝 456 | 圈定 457 | 饶有兴趣 458 | 热心 459 | 人心大快 460 | 认 461 | 认可 462 | 认了 463 | 认命 464 | 日有所思 465 | 融融 466 | 容 467 | 容许 468 | 如痴如狂 469 | 如痴如醉 470 | 如获至宝 471 | 如意 472 | 如愿以偿 473 | 如醉如痴 474 | 入迷 475 | 入魔 476 | 入神 477 | 赏 478 | 赏识 479 | 赏赉 480 | 尚 481 | 烧高香 482 | 奢望 483 | 申谢 484 | 伸张 485 | 神魂颠倒 486 | 神往 487 | 甚感欢慰 488 | 盛赞 489 | 施礼 490 | 十分满意 491 | 示好 492 | 示同意 493 | 示喜 494 | 释放善意 495 | 手舞足蹈 496 | 首肯 497 | 守候 498 | 守岁 499 | 舒畅 500 | 舒服 501 | 舒坦 502 | 属望 503 | 属意 504 | 树碑立传 505 | 爽 506 | 爽快 507 | 爽心 508 | 爽怡 509 | 说好 510 | 说好话 511 | 说妥 512 | 说项 513 | 思 514 | 思恋 515 | 思慕 516 | 思念 517 | 松心 518 | 颂 519 | 颂扬 520 | 颂赞 521 | 送往迎来 522 | 随心 523 | 遂心 524 | 遂意 525 | 抬爱 526 | 抬举 527 | 贪 528 | 贪恋 529 | 贪图 530 | 叹 531 | 叹服 532 | 叹赏 533 | 叹为观止 534 | 叹羡 535 | 陶然 536 | 陶陶 537 | 陶醉 538 | 特许 539 | 疼 540 | 疼爱 541 | 疼惜 542 | 提倡 543 | 甜丝丝 544 | 甜滋滋 545 | 挑三拣四 546 | 挑眼 547 | 通过 548 | 通融 549 | 同意 550 | 吐口 551 | 吐气扬眉 552 | 推 553 | 推崇 554 | 推戴 555 | 推许 556 | 推重 557 | 推尊 558 | 望 559 | 望眼欲穿 560 | 忘乎所以 561 | 妄想 562 | 维护 563 | 畏 564 | 温存 565 | 问心无愧 566 | 无愧 567 | 嘻嘻哈哈 568 | 稀罕 569 | 希 570 | 希罕 571 | 希冀 572 | 希图 573 | 希望 574 | 惜 575 | 喜 576 | 喜爱 577 | 喜不自禁 578 | 喜不自胜 579 | 喜冲冲 580 | 喜出望外 581 | 喜好 582 | 喜欢 583 | 喜乐 584 | 喜眉笑眼 585 | 喜气洋洋 586 | 喜上眉梢 587 | 喜上心头 588 | 喜兴 589 | 喜形于色 590 | 喜幸 591 | 喜洋洋 592 | 喜吟吟 593 | 喜盈盈 594 | 喜悦 595 | 喜滋滋 596 | 喜孜孜 597 | 显扬 598 | 羡 599 | 羡慕 600 | 相中 601 | 想 602 | 想念 603 | 想望 604 | 向 605 | 向 ... 倾斜 606 | 向往 607 | 向着 608 | 销魂 609 | 消魂 610 | 孝敬 611 | 孝顺 612 | 写意 613 | 谢 614 | 谢天谢地 615 | 谢谢 616 | 欣 617 | 欣赏 618 | 欣慰 619 | 欣喜 620 | 欣喜若狂 621 | 欣羡 622 | 欣幸 623 | 忻 624 | 心驰神往 625 | 心荡神驰 626 | 心甘 627 | 心甘情愿 628 | 心花怒放 629 | 心旷神怡 630 | 心满意足 631 | 心疼 632 | 心向 633 | 心醉 634 | 兴高采烈 635 | 行礼 636 | 需 637 | 需要 638 | 许 639 | 许可 640 | 轩然 641 | 悬红 642 | 悬赏 643 | 眼馋 644 | 眼红 645 | 眼热 646 | 艳羡 647 | 扬眉吐气 648 | 扬扬 649 | 扬扬得意 650 | 扬扬自得 651 | 洋洋得意 652 | 洋洋自得 653 | 仰 654 | 仰慕 655 | 摇头摆尾 656 | 摇头晃脑 657 | 要 658 | 夜有所梦 659 | 一往情深 660 | 揖 661 | 依依不舍 662 | 依允 663 | 以期 664 | 以求 665 | 意欲 666 | 溢美 667 | 引颈企待 668 | 引领 669 | 应 670 | 应承 671 | 应下 672 | 应许 673 | 应允 674 | 应准 675 | 迎 676 | 迎候 677 | 迎接 678 | 迎来 679 | 迎迓 680 | 拥 681 | 拥戴 682 | 拥护 683 | 咏赞 684 | 用 685 | 用心良苦 686 | 有心 687 | 有意 688 | 俞允 689 | 愉 690 | 愉快 691 | 愉悦 692 | 欲 693 | 誉 694 | 愿 695 | 愿意 696 | 跃跃欲试 697 | 悦 698 | 悦服 699 | 允 700 | 允许 701 | 允准 702 | 在乎 703 | 在心 704 | 在意 705 | 赞 706 | 赞成 707 | 赞服 708 | 赞美 709 | 赞慕 710 | 赞佩 711 | 赞赏 712 | 赞颂 713 | 赞叹 714 | 赞同 715 | 赞羡 716 | 赞许 717 | 赞扬 718 | 赞誉 719 | 沾沾自喜 720 | 照准 721 | 折服 722 | 珍 723 | 珍爱 724 | 珍视 725 | 珍惜 726 | 珍重 727 | 正中下怀 728 | 支持 729 | 知冷知热 730 | 知冷着热 731 | 知足 732 | 指靠 733 | 指望 734 | 志愿 735 | 挚爱 736 | 致贺 737 | 致敬 738 | 致谢 739 | 中意 740 | 钟 741 | 钟爱 742 | 钟情 743 | 重 744 | 重视 745 | 重在 746 | 瞩目 747 | 瞩望 748 | 主持 749 | 注 750 | 注意 751 | 注重 752 | 祝 753 | 祝福 754 | 祝贺 755 | 祝颂 756 | 祝愿 757 | 抓 758 | 抓紧 759 | 准 760 | 准许 761 | 准予 762 | 着迷 763 | 着想 764 | 着眼 765 | 着眼于 766 | 自得 767 | 自得其乐 768 | 自告奋勇 769 | 自满 770 | 自鸣得意 771 | 自认 772 | 自愿 773 | 自足 774 | 宗仰 775 | 醉心 776 | 尊 777 | 尊崇 778 | 尊敬 779 | 尊重 780 | 傧 781 | 佥同 782 | 跂望 783 | 讴歌 784 | 谒 785 | 哿 786 | 埽 787 | 萦念 788 | 揄扬 789 | 叩 790 | 叩拜 791 | 叩首 792 | 叩头 793 | 哙 794 | 啧啧称羡 795 | 啧啧称赞 796 | 喁 797 | 嗟 798 | 醊 799 | 徼 800 | 夤 801 | 饫 802 | 廑 803 | 忮 804 | 忭 805 | 忭跃 806 | 怏然自足 807 | 怿 808 | 怡然自得 809 | 恺 810 | 悚 811 | 惬 812 | 惬意 813 | 慊 814 | 憧憬 815 | 迓 816 | 嬖 817 | 绻 818 | 觊 819 | 觊觎 820 | 犒 821 | 犒劳 822 | 犒赏 823 | 胪 824 | 歆 825 | 歆慕 826 | 歆羡 827 | 祀 828 | 祗 829 | 眄 830 | 顒 831 | 锺 832 | 鹄望 833 | 翊戴 834 | 裣衽 835 | 酹 836 | 雩 837 | -------------------------------------------------------------------------------- /word2vec_test.py: -------------------------------------------------------------------------------- 1 | import gensim 2 | import numpy as np 3 | 4 | word_vectors=gensim.models.KeyedVectors.load_word2vec_format('./tool/zhwiki_2017_03.sg_50d.word2vec',binary=False) 5 | vocab = word_vectors.wv.vocab 6 | print ('搜狗词向量语料加载,成功!') 7 | 8 | '''显示所有词向量,并其存储在变量中''' 9 | wordVectors = {} 10 | wordsList = [] 11 | wordIndexVector = [] 12 | for word in vocab: 13 | wordVectors[word] = word_vectors[word] # 词语索引词向量(形式:dictionary) 14 | wordsList.append(word) # 数字索引词语(形式:list) 15 | wordIndexVector.append(word_vectors[word]) # 数字索引词向量(形式:list) 16 | 17 | 18 | # 搜索文件,增加原本词向量库中没有的词语的向量和索引 19 | def add_words(file_name): 20 | with open(file_name, "r", encoding='utf-8') as f: 21 | for line in f.readlines(): 22 | row_words = line.split() 23 | for word in row_words: 24 | if word not in wordsList: 25 | wordsList.append(word) 26 | wordIndexVector.append(np.random.uniform(-1,1,size=50)) 27 | 28 | 29 | file_name_positive = './lib/train_positive_cut.txt' 30 | file_name_negtive = './lib/train_negative_cut.txt' 31 | add_words(file_name_positive) 32 | print ('积极文本词语遍历,成功!') 33 | add_words(file_name_negtive) 34 | print ('消极文本词语遍历,成功!') 35 | 36 | 37 | '''以npy文件格式保存变量,在下一个文件夹lstm中使用以下这两个变量''' 38 | # 以npy文件格式存储变量(变量会以矩阵array形式保存,在下一次加载load该变量时,若是需要其它形式的变量,则需要转换变量形式) 39 | np.save('./lib/wordsList.npy', wordsList) # 保存数字索引词语变量 40 | print ('wordsList.npy保存,成功!') 41 | np.save('./lib/wordIndexVector.npy', wordIndexVector) # 保存数字索引词向量变量 42 | print ('wordIndexVector.npy保存,成功!') 43 | --------------------------------------------------------------------------------