├── image
    └── demo.png
├── train.py
├── wiki_to_txt.py
├── segmentation.py
├── main.py
├── README.md
└── stopwords.txt


/image/demo.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Alex-CHUN-YU/Word2vec/HEAD/image/demo.png


--------------------------------------------------------------------------------
/train.py:
--------------------------------------------------------------------------------
 1 | # -*- coding: utf-8 -*-
 2 | __author__ = "ALEX-CHUN-YU (P76064538@mail.ncku.edu.tw)"
 3 | import warnings
 4 | warnings.filterwarnings(action = 'ignore', category = UserWarning, module = 'gensim')
 5 | from gensim.models import word2vec
 6 | 
 7 | # 主要透過 gensim 訓練成 model 並供使用
 8 | class Train(object):
 9 | 
10 | 	def __init__(self):
11 | 		pass
12 | 
13 | 	# 可參考 https://radimrehurek.com/gensim/models/word2vec.html 更多運用
14 | 	def train(self):
15 | 		print("訓練中...(喝個咖啡吧^0^)")
16 | 		# Load file
17 | 		sentence = word2vec.Text8Corpus("segmentation.txt")
18 | 		# Setting degree and Produce Model(Train)
19 | 		model = word2vec.Word2Vec(sentence, size = 300, window = 10, min_count = 5, workers = 4, sg = 1)
20 | 		# Save model 
21 | 		model.wv.save_word2vec_format(u"wiki300.model.bin", binary = True)
22 | 		print("model 已儲存完畢")
23 | 
24 | if __name__ == "__main__":
25 | 	t = Train()
26 | 	# 訓練(shallow semantic space)
27 | 	t.train()
28 | 


--------------------------------------------------------------------------------
/wiki_to_txt.py:
--------------------------------------------------------------------------------
 1 | # -*- coding: utf-8 -*-
 2 | __author__ = "ALEX-CHUN-YU (P76064538@mail.ncku.edu.tw)"
 3 | import logging
 4 | import sys
 5 | import warnings
 6 | warnings.filterwarnings(action ='ignore', category = UserWarning, module = 'gensim')
 7 | from gensim.corpora import WikiCorpus
 8 | 
 9 | # 將 wiki 資料集載下後進行 xml convert to txt 
10 | class Wiki_to_txt(object):
11 | 
12 | 	def __init__(self):
13 | 		# 用默認 Formatter 為日誌系統建立一個 StreamHandler ，設置基礎配置並加到 root logger 中
14 | 		logging.basicConfig(format = '%(asctime)s : %(levelname)s : %(message)s', level = logging.INFO)
15 | 
16 | 	# 使用方法 https://radimrehurek.com/gensim/corpora/wikicorpus.html
17 | 	def set_wiki_to_txt(self, wiki_data_path = None):
18 | 		if wiki_data_path == None:
19 | 			# 系統下參數
20 | 			if len(sys.argv) != 2:
21 | 				print("Please Usage: python3 " + sys.argv[0] + " wiki_data_path")
22 | 				exit()
23 | 			else:
24 | 				wiki_corpus = WikiCorpus(sys.argv[1], dictionary = {})
25 | 		else:
26 | 			wiki_corpus = WikiCorpus(wiki_data_path, dictionary = {})
27 | 		# wiki.xml convert to wiki.txt
28 | 		with open("wiki_text.txt", 'w', encoding = 'utf-8') as output:
29 | 			text_count = 0
30 | 			for text in wiki_corpus.get_texts():
31 | 				# save use string(gensim)
32 | 				output.write(' '.join(text) + '\n')
33 | 				text_count += 1
34 | 				if text_count % 10000 == 0:
35 | 					logging.info("目前已處理 %d 篇文章" % text_count)
36 | 			print("轉檔完畢!")
37 | 			
38 | if __name__ == "__main__":
39 | 	wiki_to_txt = Wiki_to_txt()
40 | 	# 將 wiki xml 轉換成 wiki txt
41 | 	wiki_to_txt.set_wiki_to_txt()
42 | 


--------------------------------------------------------------------------------
/segmentation.py:
--------------------------------------------------------------------------------
 1 | # -*- coding: utf-8 -*-
 2 | __author__ = "ALEX-CHUN-YU (P76064538@mail.ncku.edu.tw)"
 3 | import jieba
 4 | import logging
 5 | from hanziconv import HanziConv
 6 | 
 7 | # 進行斷詞並過濾 stopword
 8 | class Segmentation(object):
 9 | 
10 | 	def __init__(self):
11 | 		# 用默認 Formatter 為日誌系統建立一個 StreamHandler ，設置基礎配置並加到 root logger 中
12 | 		logging.basicConfig(format = "%(asctime)s : %(levelname)s : %(message)s", level = logging.INFO)
13 | 		self.stopwordset = set()
14 | 		
15 | 	# 讀取 stopword 辭典，並存到 stopwordset
16 | 	def set_stopword(self):
17 | 		with open("stopwords.txt", "r", encoding = "utf-8") as stopwords:
18 | 			for stopword in stopwords:
19 | 				self.stopwordset.add(stopword.strip('\n'))
20 | 		#print(self.stopwordset)
21 | 		print("StopWord Set 已儲存!")
22 | 	
23 | 	# 簡 to 繁
24 | 	def simplified_to_traditional(self):
25 | 		logging.info("等待中..(簡 to 繁)")
26 | 		traditional = open("traditional.txt", "w", encoding = "utf-8")
27 | 		with open("wiki_text.txt", "r", encoding = "utf-8") as simplified:
28 | 			for s in simplified:
29 | 				traditional.write(HanziConv.toTraditional(s))
30 | 		print("成功簡體轉繁體!")
31 | 		traditional.close()
32 | 	
33 | 	# 斷詞(Segmentation)並過濾掉停用詞(Stop Word)
34 | 	def segmentation(self):
35 | 		logging.info("等待中..(jieba 斷詞，並過濾停用詞)")
36 | 		segmentation = open("segmentation.txt", "w", encoding = "utf-8")
37 | 		with open("traditional.txt", "r", encoding = "utf-8") as Corpus:
38 | 			for sentence in Corpus:
39 | 				sentence = sentence.strip("\n")
40 | 				pos = jieba.cut(sentence, cut_all = False)
41 | 				for term in pos:
42 | 					if term not in self.stopwordset:
43 | 						segmentation.write(term + " ")
44 | 		print("jieba 斷詞完畢，並已完成過濾停用詞!")
45 | 		segmentation.close()
46 | 
47 | if __name__ == "__main__":
48 | 	segmentation = Segmentation()
49 | 	# 讀取停用詞辭典
50 | 	segmentation.set_stopword()
51 | 	# data 進行簡體轉繁體
52 | 	segmentation.simplified_to_traditional()
53 | 	# 進行 jieba 斷詞同步過濾停用詞，並產生辭典
54 | 	segmentation.segmentation()


--------------------------------------------------------------------------------
/main.py:
--------------------------------------------------------------------------------
 1 | # -*- coding: utf-8 -*-
 2 | __author__ = "ALEX-CHUN-YU (P76064538@mail.ncku.edu.tw)"
 3 | import warnings
 4 | warnings.filterwarnings(action = 'ignore', category = UserWarning, module = 'gensim')
 5 | from gensim.models.keyedvectors import KeyedVectors
 6 | '''# 一次處理完畢
 7 | from wiki_to_txt import Wiki_to_txt
 8 | from segmentation import Segmentation
 9 | from train import Train
10 | '''
11 | 
12 | # 載入 model 並去運用
13 | def main():
14 | 	
15 | 	'''# 一次處理完畢
16 | 	wiki_to_txt = Wiki_to_txt()
17 | 	# 將 wiki xml 轉換成 wiki txt
18 | 	wiki_to_txt.set_wiki_to_txt("zhwiki-latest-pages-articles.xml.bz2")
19 | 	segmentation = Segmentation()
20 | 	# 讀取停用詞辭典
21 | 	segmentation.set_stopword()
22 | 	# data 進行簡體轉繁體
23 | 	segmentation.simplified_to_traditional()
24 | 	# 進行 jieba 斷詞同步過濾停用詞，並產生辭典
25 | 	segmentation.segmentation()
26 | 	t = Train()
27 | 	# 訓練(shallow semantic space)
28 | 	t.train()
29 | 	'''
30 | 	# 可參考 https://radimrehurek.com/gensim/models/word2vec.html 更多運用
31 | 	# How to use bin(model)?
32 | 	word_vectors = KeyedVectors.load_word2vec_format("wiki300.model.bin", binary = True)
33 | 	print("\n1.輸入一個詞彙會找出前5名相似")
34 | 	print("2.輸入兩個詞彙會算出兩者之間相似度")
35 | 	print("3.輸入三個詞彙爸爸之於老公,如媽媽之於老婆")
36 | 	while True:
37 | 		try:
38 | 			query = input("\n輸入格式( Ex: 爸爸,媽媽,....註:最多三個詞彙)\n")
39 | 			query_list = query.split(",")
40 | 			if len(query_list) == 1:
41 | 				print("詞彙相似詞前 5 排序")
42 | 				res = word_vectors.most_similar(query_list[0], topn = 5)
43 | 				for item in res:
44 | 					print(item[0] + "," + str(item[1]))
45 | 			elif len(query_list) == 2:
46 | 				print("計算兩個詞彙間 Cosine 相似度")
47 | 				res = word_vectors.similarity(query_list[0], query_list[1])
48 | 				print(res)
49 | 			else:
50 | 				print("%s之於%s，如%s之於" % (query_list[0], query_list[1], query_list[2]))
51 | 				res = word_vectors.most_similar(positive = [query_list[0], query_list[1]], negative = [query_list[2]], topn = 5)
52 | 				for item in res:
53 | 					print(item[0] + "," + str(item[1]))
54 | 		except Exception as e:
55 | 			print("Error:" + repr(e))
56 | 
57 | if __name__ == "__main__":
58 |     main()
59 | 


--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
 1 | # Word2Vec
 2 | Word2vec 是基於非監督式學習，訓練集建議越大越好，語料涵蓋的越全面，訓練出來的結果相對比較好，當然也有可能 garbage input 進而得到 garbage output ，由於檔案所使用的資料集較大，所以每個過程中都請耐心等候。(ps: word2vec 如果把每種字當成一個維度，假設總共有 4000 個總字，那麼向量就會有 4000 維度。故可透過它來降低維度)</br></br>
 3 | 
 4 | ![demo](https://github.com/Alex-CHUN-YU/Word2vec/blob/master/image/demo.png)</br></br>
 5 | WiKi簡介:</br>
 6 | Word2vec is a group of related models that are used to produce word embeddings. These models are shallow, two-layer neural networks that are trained to reconstruct linguistic contexts of words. Word2vec takes as its input a large corpus of text and produces a vector space, typically of several hundred dimensions, with each unique word in the corpus being assigned a corresponding vector in the space. Word vectors are positioned in the vector space such that words that share common contexts in the corpus are located in close proximity to one another in the space.</br></br>
 7 | 
 8 | By the way :</br>
 9 | Skip-gram: works well with small amount of the training data, represents well even rare words or phrases.</br>
10 | CBOW: several times faster to train than the skip-gram, slightly better accuracy for the frequent words.
11 | 
12 | ## 使用方式
13 | Input:</br>
14 | ```
15 | 1.download wiki data(請參考資料集)
16 | 2.進入 Word2Vec 資料夾
17 | 3.執行 python wiki_to_txt.py zhwiki-latest-pages-articles.xml.bz2(wiki xml 轉換成 wiki text)
18 | 4.執行 python segmentation.py(簡體轉繁體，在進行斷詞並同步過濾停用詞，由於檔案較大故斷詞較久)
19 | 5.執行 python train.py(訓練並產生 model ，時間上也會比較久)
20 | 5.執行 python main.py(使用 Model，輸入詞彙)
21 | 註:如果在 Windows cmd 下執行 python 時有編碼問題請下以下指令:chcp 65001(使用utf-8)
22 | ```
23 | Output:</br>
24 | ```
25 | 1.輸入一個詞彙會找出前5名相似
26 | 2.輸入兩個詞彙會算出兩者之間相似度
27 | 3.輸入三個詞彙爸爸之於老公,如媽媽之於老婆
28 | 
29 | 輸入格式( Ex: 爸爸,媽媽,....註:最多三個詞彙)
30 | 老師
31 | 詞彙相似詞前 5 排序
32 | 班導,0.6360481977462769
33 | 班導師,0.6360464096069336
34 | 代課,0.6358826160430908
35 | 級任,0.6271134614944458
36 | 班主任,0.6270170211791992
37 | 
38 | 輸入格式( Ex: 爸爸,媽媽,....註:最多三個詞彙)
39 | 爸爸,媽媽
40 | 計算兩個詞彙間 Cosine 相似度
41 | 0.780765200371
42 | 
43 | 輸入格式( Ex: 爸爸,媽媽,....註:最多三個詞彙)
44 | 爸爸,老公,媽媽
45 | 爸爸之於老公，如媽媽之於
46 | 老婆,0.5401346683502197
47 | 蠢萌,0.5245970487594604
48 | 夠秤,0.5059393048286438
49 | 駁命,0.4888317286968231
50 | 孔爵,0.4857243597507477
51 | ```
52 | 
53 | ## 資料集(wiki data)
54 | ```
55 | 主要以 pages-articles.xml.bz2 結尾之檔案類型，這邊使用 zhwiki-latest-pages-articles.xml.bz2。
56 | ```
57 | * 維基資料集:</br>
58 | https://zh.wikipedia.org/wiki/Wikipedia:%E6%95%B0%E6%8D%AE%E5%BA%93%E4%B8%8B%E8%BD%BD</br>
59 | * zhwiki-latest-pages-articles.xml.bz2 下載網址:</br>
60 | https://drive.google.com/file/d/0B4rlWa2S_JMBUmlMSG5IRVRMbnc/view?usp=sharing </br>
61 | * 程式參考網址:</br>
62 | https://radimrehurek.com/gensim/corpora/wikicorpus.html</br>
63 | https://radimrehurek.com/gensim/models/word2vec.html</br>
64 | ## 開發環境
65 | Python 3.5.2</br>
66 | pip install gensim</br>
67 | pip install jieba</br>
68 | pip install hanziconv</br>
69 | [note: if your gensim can't install, please check your os then install correct gensim version.](https://blog.csdn.net/dalangzhonghangxing/article/details/78191593)</br>
70 | 


--------------------------------------------------------------------------------
/stopwords.txt:
--------------------------------------------------------------------------------
   1 | ,
   2 | ?
   3 | 、
   4 | 。
   5 | “
   6 | ”
   7 | 《
   8 | 》
   9 | ！
  10 | ，
  11 | ：
  12 | ；
  13 | ？
  14 | 人民
  15 | 末##末
  16 | 啊
  17 | 阿
  18 | 哎
  19 | 哎呀
  20 | 哎喲
  21 | 唉
  22 | 俺
  23 | 俺們
  24 | 按
  25 | 按照
  26 | 吧
  27 | 吧噠
  28 | 把
  29 | 罷了
  30 | 被
  31 | 本
  32 | 本著
  33 | 比
  34 | 比方
  35 | 比如
  36 | 鄙人
  37 | 彼
  38 | 彼此
  39 | 邊
  40 | 別
  41 | 別的
  42 | 別說
  43 | 並
  44 | 並且
  45 | 不比
  46 | 不成
  47 | 不單
  48 | 不但
  49 | 不獨
  50 | 不管
  51 | 不光
  52 | 不過
  53 | 不僅
  54 | 不拘
  55 | 不論
  56 | 不怕
  57 | 不然
  58 | 不如
  59 | 不特
  60 | 不惟
  61 | 不問
  62 | 不只
  63 | 朝
  64 | 朝著
  65 | 趁
  66 | 趁著
  67 | 乘
  68 | 衝
  69 | 除
  70 | 除此之外
  71 | 除非
  72 | 除了
  73 | 此
  74 | 此間
  75 | 此外
  76 | 從
  77 | 從而
  78 | 打
  79 | 待
  80 | 但
  81 | 但是
  82 | 當
  83 | 當著
  84 | 到
  85 | 得
  86 | 的
  87 | 的話
  88 | 等
  89 | 等等
  90 | 地
  91 | 第
  92 | 叮咚
  93 | 對
  94 | 對於
  95 | 多
  96 | 多少
  97 | 而
  98 | 而況
  99 | 而且
 100 | 而是
 101 | 而外
 102 | 而言
 103 | 而已
 104 | 爾後
 105 | 反過來
 106 | 反過來說
 107 | 反之
 108 | 非但
 109 | 非徒
 110 | 否則
 111 | 嘎
 112 | 嘎登
 113 | 該
 114 | 趕
 115 | 個
 116 | 各
 117 | 各個
 118 | 各位
 119 | 各種
 120 | 各自
 121 | 給
 122 | 根據
 123 | 跟
 124 | 故
 125 | 故此
 126 | 固然
 127 | 關於
 128 | 管
 129 | 歸
 130 | 果然
 131 | 果真
 132 | 過
 133 | 哈
 134 | 哈哈
 135 | 呵
 136 | 和
 137 | 何
 138 | 何處
 139 | 何況
 140 | 何時
 141 | 嘿
 142 | 哼
 143 | 哼唷
 144 | 呼哧
 145 | 乎
 146 | 譁
 147 | 還是
 148 | 還有
 149 | 換句話說
 150 | 換言之
 151 | 或
 152 | 或是
 153 | 或者
 154 | 極了
 155 | 及
 156 | 及其
 157 | 及至
 158 | 即
 159 | 即便
 160 | 即或
 161 | 即令
 162 | 即若
 163 | 即使
 164 | 幾
 165 | 幾時
 166 | 己
 167 | 既
 168 | 既然
 169 | 既是
 170 | 繼而
 171 | 加之
 172 | 假如
 173 | 假若
 174 | 假使
 175 | 鑑於
 176 | 將
 177 | 較
 178 | 較之
 179 | 叫
 180 | 接著
 181 | 結果
 182 | 借
 183 | 緊接著
 184 | 進而
 185 | 盡
 186 | 儘管
 187 | 經
 188 | 經過
 189 | 就
 190 | 就是
 191 | 就是說
 192 | 據
 193 | 具體地說
 194 | 具體說來
 195 | 開始
 196 | 開外
 197 | 靠
 198 | 咳
 199 | 可
 200 | 可見
 201 | 可是
 202 | 可以
 203 | 況且
 204 | 啦
 205 | 來
 206 | 來著
 207 | 離
 208 | 例如
 209 | 哩
 210 | 連
 211 | 連同
 212 | 兩者
 213 | 了
 214 | 臨
 215 | 另
 216 | 另外
 217 | 另一方面
 218 | 論
 219 | 嘛
 220 | 嗎
 221 | 慢說
 222 | 漫說
 223 | 冒
 224 | 麼
 225 | 每
 226 | 每當
 227 | 們
 228 | 莫若
 229 | 某
 230 | 某個
 231 | 某些
 232 | 拿
 233 | 哪
 234 | 哪邊
 235 | 哪兒
 236 | 哪個
 237 | 哪裡
 238 | 哪年
 239 | 哪怕
 240 | 哪天
 241 | 哪些
 242 | 哪樣
 243 | 那
 244 | 那邊
 245 | 那兒
 246 | 那個
 247 | 那會兒
 248 | 那裡
 249 | 那麼
 250 | 那麼些
 251 | 那麼樣
 252 | 那時
 253 | 那些
 254 | 那樣
 255 | 乃
 256 | 乃至
 257 | 呢
 258 | 能
 259 | 你
 260 | 你們
 261 | 您
 262 | 寧
 263 | 寧可
 264 | 寧肯
 265 | 寧願
 266 | 哦
 267 | 嘔
 268 | 啪達
 269 | 旁人
 270 | 呸
 271 | 憑
 272 | 憑藉
 273 | 其
 274 | 其次
 275 | 其二
 276 | 其他
 277 | 其它
 278 | 其一
 279 | 其餘
 280 | 其中
 281 | 起
 282 | 起見
 283 | 豈但
 284 | 恰恰相反
 285 | 前後
 286 | 前者
 287 | 且
 288 | 然而
 289 | 然後
 290 | 然則
 291 | 讓
 292 | 人家
 293 | 任
 294 | 任何
 295 | 任憑
 296 | 如
 297 | 如此
 298 | 如果
 299 | 如何
 300 | 如其
 301 | 如若
 302 | 如上所述
 303 | 若
 304 | 若非
 305 | 若是
 306 | 啥
 307 | 上下
 308 | 尚且
 309 | 設若
 310 | 設使
 311 | 甚而
 312 | 甚麼
 313 | 甚至
 314 | 省得
 315 | 時候
 316 | 什麼
 317 | 什麼樣
 318 | 使得
 319 | 是
 320 | 是的
 321 | 首先
 322 | 誰
 323 | 誰知
 324 | 順
 325 | 順著
 326 | 似的
 327 | 雖
 328 | 雖然
 329 | 雖說
 330 | 雖則
 331 | 隨
 332 | 隨著
 333 | 所
 334 | 所以
 335 | 他
 336 | 他們
 337 | 他人
 338 | 它
 339 | 它們
 340 | 她
 341 | 她們
 342 | 倘
 343 | 倘或
 344 | 倘然
 345 | 倘若
 346 | 倘使
 347 | 騰
 348 | 替
 349 | 通過
 350 | 同
 351 | 同時
 352 | 哇
 353 | 萬一
 354 | 往
 355 | 望
 356 | 為
 357 | 為何
 358 | 為了
 359 | 為什麼
 360 | 為著
 361 | 喂
 362 | 嗡嗡
 363 | 我
 364 | 我們
 365 | 嗚
 366 | 嗚呼
 367 | 烏乎
 368 | 無論
 369 | 無寧
 370 | 毋寧
 371 | 嘻
 372 | 嚇
 373 | 相對而言
 374 | 像
 375 | 向
 376 | 向著
 377 | 噓
 378 | 呀
 379 | 焉
 380 | 沿
 381 | 沿著
 382 | 要
 383 | 要不
 384 | 要不然
 385 | 要不是
 386 | 要麼
 387 | 要是
 388 | 也
 389 | 也罷
 390 | 也好
 391 | 一
 392 | 一般
 393 | 一旦
 394 | 一方面
 395 | 一來
 396 | 一切
 397 | 一樣
 398 | 一則
 399 | 依
 400 | 依照
 401 | 矣
 402 | 以
 403 | 以便
 404 | 以及
 405 | 以免
 406 | 以至
 407 | 以至於
 408 | 以致
 409 | 抑或
 410 | 因
 411 | 因此
 412 | 因而
 413 | 因為
 414 | 喲
 415 | 用
 416 | 由
 417 | 由此可見
 418 | 由於
 419 | 有
 420 | 有的
 421 | 有關
 422 | 有些
 423 | 又
 424 | 於
 425 | 於是
 426 | 於是乎
 427 | 與
 428 | 與此同時
 429 | 與否
 430 | 與其
 431 | 越是
 432 | 云云
 433 | 哉
 434 | 再說
 435 | 再者
 436 | 在
 437 | 在下
 438 | 咱
 439 | 咱們
 440 | 則
 441 | 怎
 442 | 怎麼
 443 | 怎麼辦
 444 | 怎麼樣
 445 | 怎樣
 446 | 咋
 447 | 照
 448 | 照著
 449 | 者
 450 | 這
 451 | 這邊
 452 | 這兒
 453 | 這個
 454 | 這會兒
 455 | 這就是說
 456 | 這裡
 457 | 這麼
 458 | 這麼點兒
 459 | 這麼些
 460 | 這麼樣
 461 | 這時
 462 | 這些
 463 | 這樣
 464 | 正如
 465 | 吱
 466 | 之
 467 | 之類
 468 | 之所以
 469 | 之一
 470 | 只是
 471 | 只限
 472 | 只要
 473 | 只有
 474 | 至
 475 | 至於
 476 | 諸位
 477 | 著
 478 | 著呢
 479 | 自
 480 | 自從
 481 | 自個兒
 482 | 自各兒
 483 | 自己
 484 | 自家
 485 | 自身
 486 | 綜上所述
 487 | 總的來看
 488 | 總的來說
 489 | 總的說來
 490 | 總而言之
 491 | 總之
 492 | 縱
 493 | 縱令
 494 | 縱然
 495 | 縱使
 496 | 遵照
 497 | 作為
 498 | 兮
 499 | 呃
 500 | 唄
 501 | 咚
 502 | 咦
 503 | 喏
 504 | 啐
 505 | 喔唷
 506 | 嗬
 507 | 嗯
 508 | 噯
 509 | ~
 510 | !
 511 | .
 512 | :
 513 | "
 514 | '
 515 | (
 516 | )
 517 | *
 518 | A
 519 | 白
 520 | 社會主義
 521 | --
 522 | ..
 523 | >>
 524 |  [
 525 |  ]
 526 | 
 527 | <
 528 | >
 529 | /
 530 | \
 531 | |
 532 | -
 533 | _
 534 | +
 535 | =
 536 | &
 537 | ^
 538 | %
 539 | #
 540 | @
 541 | `
 542 | ;
 543 | $
 544 | （
 545 | ）
 546 | ——
 547 | —
 548 | ￥
 549 | ·
 550 | ...
 551 | ‘
 552 | ’
 553 | 〉
 554 | 〈
 555 | …
 556 | 　
 557 | 0
 558 | 1
 559 | 2
 560 | 3
 561 | 4
 562 | 5
 563 | 6
 564 | 7
 565 | 8
 566 | 9
 567 | ０
 568 | １
 569 | ２
 570 | ３
 571 | ４
 572 | ５
 573 | ６
 574 | ７
 575 | ８
 576 | ９
 577 | 二
 578 | 三
 579 | 四
 580 | 五
 581 | 六
 582 | 七
 583 | 八
 584 | 九
 585 | 零
 586 | ＞
 587 | ＜
 588 | ＠
 589 | ＃
 590 | ＄
 591 | ％
 592 | ︿
 593 | ＆
 594 | ＊
 595 | ＋
 596 | ～
 597 | ｜
 598 | ［
 599 | ］
 600 | ｛
 601 | ｝
 602 | 啊哈
 603 | 啊呀
 604 | 啊喲
 605 | 挨次
 606 | 挨個
 607 | 挨家挨戶
 608 | 挨門挨戶
 609 | 挨門逐戶
 610 | 挨著
 611 | 按理
 612 | 按期
 613 | 按時
 614 | 按說
 615 | 暗地裡
 616 | 暗中
 617 | 暗自
 618 | 昂然
 619 | 八成
 620 | 白白
 621 | 半
 622 | 梆
 623 | 保管
 624 | 保險
 625 | 飽
 626 | 背地裡
 627 | 背靠背
 628 | 倍感
 629 | 倍加
 630 | 本人
 631 | 本身
 632 | 甭
 633 | 比起
 634 | 比如說
 635 | 比照
 636 | 畢竟
 637 | 必
 638 | 必定
 639 | 必將
 640 | 必須
 641 | 便
 642 | 別人
 643 | 並非
 644 | 並肩
 645 | 並沒
 646 | 並沒有
 647 | 並排
 648 | 並無
 649 | 勃然
 650 | 不
 651 | 不必
 652 | 不常
 653 | 不大
 654 | 不但...而且
 655 | 不得
 656 | 不得不
 657 | 不得了
 658 | 不得已
 659 | 不迭
 660 | 不定
 661 | 不對
 662 | 不妨
 663 | 不管怎樣
 664 | 不會
 665 | 不僅...而且
 666 | 不僅僅
 667 | 不僅僅是
 668 | 不經意
 669 | 不可開交
 670 | 不可抗拒
 671 | 不力
 672 | 不了
 673 | 不料
 674 | 不滿
 675 | 不免
 676 | 不能不
 677 | 不起
 678 | 不巧
 679 | 不然的話
 680 | 不日
 681 | 不少
 682 | 不勝
 683 | 不時
 684 | 不是
 685 | 不同
 686 | 不能
 687 | 不要
 688 | 不外
 689 | 不外乎
 690 | 不下
 691 | 不限
 692 | 不消
 693 | 不已
 694 | 不亦樂乎
 695 | 不由得
 696 | 不再
 697 | 不擇手段
 698 | 不怎麼
 699 | 不曾
 700 | 不知不覺
 701 | 不止
 702 | 不止一次
 703 | 不至於
 704 | 才
 705 | 才能
 706 | 策略地
 707 | 差不多
 708 | 差一點
 709 | 常
 710 | 常常
 711 | 常言道
 712 | 常言說
 713 | 常言說得好
 714 | 長此下去
 715 | 長話短說
 716 | 長期以來
 717 | 長線
 718 | 敞開兒
 719 | 徹夜
 720 | 陳年
 721 | 趁便
 722 | 趁機
 723 | 趁熱
 724 | 趁勢
 725 | 趁早
 726 | 成年
 727 | 成年累月
 728 | 成心
 729 | 乘機
 730 | 乘勝
 731 | 乘勢
 732 | 乘隙
 733 | 乘虛
 734 | 誠然
 735 | 遲早
 736 | 充分
 737 | 充其極
 738 | 充其量
 739 | 抽冷子
 740 | 臭
 741 | 初
 742 | 出
 743 | 出來
 744 | 出去
 745 | 除此
 746 | 除此而外
 747 | 除此以外
 748 | 除開
 749 | 除去
 750 | 除卻
 751 | 除外
 752 | 處處
 753 | 川流不息
 754 | 傳
 755 | 傳說
 756 | 傳聞
 757 | 串行
 758 | 純
 759 | 純粹
 760 | 此後
 761 | 此中
 762 | 次第
 763 | 匆匆
 764 | 從不
 765 | 從此
 766 | 從此以後
 767 | 從古到今
 768 | 從古至今
 769 | 從今以後
 770 | 從寬
 771 | 從來
 772 | 從輕
 773 | 從速
 774 | 從頭
 775 | 從未
 776 | 從無到有
 777 | 從小
 778 | 從新
 779 | 從嚴
 780 | 從優
 781 | 從早到晚
 782 | 從中
 783 | 從重
 784 | 湊巧
 785 | 粗
 786 | 存心
 787 | 達旦
 788 | 打從
 789 | 打開天窗說亮話
 790 | 大
 791 | 大不了
 792 | 大大
 793 | 大抵
 794 | 大都
 795 | 大多
 796 | 大凡
 797 | 大概
 798 | 大家
 799 | 大舉
 800 | 大略
 801 | 大面兒上
 802 | 大事
 803 | 大體
 804 | 大體上
 805 | 大約
 806 | 大張旗鼓
 807 | 大致
 808 | 呆呆地
 809 | 帶
 810 | 殆
 811 | 待到
 812 | 單
 813 | 單純
 814 | 單單
 815 | 但願
 816 | 彈指之間
 817 | 當場
 818 | 當兒
 819 | 當即
 820 | 當口兒
 821 | 當然
 822 | 當庭
 823 | 當頭
 824 | 當下
 825 | 當真
 826 | 當中
 827 | 倒不如
 828 | 倒不如說
 829 | 倒是
 830 | 到處
 831 | 到底
 832 | 到了兒
 833 | 到目前為止
 834 | 到頭
 835 | 到頭來
 836 | 得起
 837 | 得天獨厚
 838 | 的確
 839 | 等到
 840 | 叮噹
 841 | 頂多
 842 | 定
 843 | 動不動
 844 | 動輒
 845 | 陡然
 846 | 都
 847 | 獨
 848 | 獨自
 849 | 斷然
 850 | 頓時
 851 | 多次
 852 | 多多
 853 | 多多少少
 854 | 多多益善
 855 | 多虧
 856 | 多年來
 857 | 多年前
 858 | 而後
 859 | 而論
 860 | 而又
 861 | 爾等
 862 | 二話不說
 863 | 二話沒說
 864 | 反倒
 865 | 反倒是
 866 | 反而
 867 | 反手
 868 | 反之亦然
 869 | 反之則
 870 | 方
 871 | 方才
 872 | 方能
 873 | 放量
 874 | 非常
 875 | 非得
 876 | 分期
 877 | 分期分批
 878 | 分頭
 879 | 奮勇
 880 | 憤然
 881 | 風雨無阻
 882 | 逢
 883 | 弗
 884 | 甫
 885 | 嘎嘎
 886 | 該當
 887 | 概
 888 | 趕快
 889 | 趕早不趕晚
 890 | 敢
 891 | 敢情
 892 | 敢於
 893 | 剛
 894 | 剛才
 895 | 剛好
 896 | 剛巧
 897 | 高低
 898 | 格外
 899 | 隔日
 900 | 隔夜
 901 | 個人
 902 | 各式
 903 | 更
 904 | 更加
 905 | 更進一步
 906 | 更為
 907 | 公然
 908 | 共
 909 | 共總
 910 | 夠瞧的
 911 | 姑且
 912 | 古來
 913 | 故而
 914 | 故意
 915 | 固
 916 | 怪
 917 | 怪不得
 918 | 慣常
 919 | 光
 920 | 光是
 921 | 歸根到底
 922 | 歸根結底
 923 | 過於
 924 | 毫不
 925 | 毫無
 926 | 毫無保留地
 927 | 毫無例外
 928 | 好在
 929 | 何必
 930 | 何嘗
 931 | 何妨
 932 | 何苦
 933 | 何樂而不為
 934 | 何須
 935 | 何止
 936 | 很
 937 | 很多
 938 | 很少
 939 | 轟然
 940 | 後來
 941 | 呼啦
 942 | 忽地
 943 | 忽然
 944 | 互
 945 | 互相
 946 | 嘩啦
 947 | 話說
 948 | 還
 949 | 恍然
 950 | 會
 951 | 豁然
 952 | 活
 953 | 夥同
 954 | 或多或少
 955 | 或許
 956 | 基本
 957 | 基本上
 958 | 基於
 959 | 極
 960 | 極大
 961 | 極度
 962 | 極端
 963 | 極力
 964 | 極其
 965 | 極為
 966 | 急匆匆
 967 | 即將
 968 | 即刻
 969 | 即是說
 970 | 幾度
 971 | 幾番
 972 | 幾乎
 973 | 幾經
 974 | 既...又
 975 | 繼之
 976 | 加上
 977 | 加以
 978 | 間或
 979 | 簡而言之
 980 | 簡言之
 981 | 簡直
 982 | 見
 983 | 將才
 984 | 將近
 985 | 將要
 986 | 交口
 987 | 較比
 988 | 較為
 989 | 接連不斷
 990 | 接下來
 991 | 皆可
 992 | 截然
 993 | 截至
 994 | 藉以
 995 | 藉此
 996 | 藉以
 997 | 屆時
 998 | 僅
 999 | 僅僅
1000 | 謹
1001 | 進來
1002 | 進去
1003 | 近
1004 | 近幾年來
1005 | 近來
1006 | 近年來
1007 | 儘管如此
1008 | 儘可能
1009 | 儘快
1010 | 儘量
1011 | 盡然
1012 | 盡如人意
1013 | 盡心竭力
1014 | 盡心盡力
1015 | 儘早
1016 | 精光
1017 | 經常
1018 | 竟
1019 | 竟然
1020 | 究竟
1021 | 就此
1022 | 就地
1023 | 就算
1024 | 居然
1025 | 局外
1026 | 舉凡
1027 | 據稱
1028 | 據此
1029 | 據實
1030 | 據說
1031 | 據我所知
1032 | 據悉
1033 | 具體來說
1034 | 決不
1035 | 決非
1036 | 絕
1037 | 絕不
1038 | 絕頂
1039 | 絕對
1040 | 絕非
1041 | 均
1042 | 喀
1043 | 看
1044 | 看來
1045 | 看起來
1046 | 看上去
1047 | 看樣子
1048 | 可好
1049 | 可能
1050 | 恐怕
1051 | 快
1052 | 快要
1053 | 來不及
1054 | 來得及
1055 | 來講
1056 | 來看
1057 | 攔腰
1058 | 牢牢
1059 | 老
1060 | 老大
1061 | 老老實實
1062 | 老是
1063 | 累次
1064 | 累年
1065 | 理當
1066 | 理該
1067 | 理應
1068 | 歷
1069 | 立
1070 | 立地
1071 | 立刻
1072 | 立馬
1073 | 立時
1074 | 聯袂
1075 | 連連
1076 | 連日
1077 | 連日來
1078 | 連聲
1079 | 連袂
1080 | 臨到
1081 | 另方面
1082 | 另行
1083 | 另一個
1084 | 路經
1085 | 屢
1086 | 屢次
1087 | 屢次三番
1088 | 屢屢
1089 | 縷縷
1090 | 率爾
1091 | 率然
1092 | 略
1093 | 略加
1094 | 略微
1095 | 略為
1096 | 論說
1097 | 馬上
1098 | 蠻
1099 | 滿
1100 | 沒
1101 | 沒有
1102 | 每逢
1103 | 每每
1104 | 每時每刻
1105 | 猛然
1106 | 猛然間
1107 | 莫
1108 | 莫不
1109 | 莫非
1110 | 莫如
1111 | 默默地
1112 | 默然
1113 | 吶
1114 | 那末
1115 | 奈
1116 | 難道
1117 | 難得
1118 | 難怪
1119 | 難說
1120 | 內
1121 | 年復一年
1122 | 凝神
1123 | 偶而
1124 | 偶爾
1125 | 怕
1126 | 砰
1127 | 碰巧
1128 | 譬如
1129 | 偏偏
1130 | 乒
1131 | 平素
1132 | 頗
1133 | 迫於
1134 | 撲通
1135 | 其後
1136 | 其實
1137 | 奇
1138 | 齊
1139 | 起初
1140 | 起來
1141 | 起首
1142 | 起頭
1143 | 起先
1144 | 豈
1145 | 豈非
1146 | 豈止
1147 | 迄
1148 | 恰逢
1149 | 恰好
1150 | 恰恰
1151 | 恰巧
1152 | 恰如
1153 | 恰似
1154 | 千
1155 | 千萬
1156 | 千萬千萬
1157 | 切
1158 | 切不可
1159 | 切莫
1160 | 切切
1161 | 切勿
1162 | 竊
1163 | 親口
1164 | 親身
1165 | 親手
1166 | 親眼
1167 | 親自
1168 | 頃
1169 | 頃刻
1170 | 頃刻間
1171 | 頃刻之間
1172 | 請勿
1173 | 窮年累月
1174 | 取道
1175 | 去
1176 | 權時
1177 | 全都
1178 | 全力
1179 | 全年
1180 | 全然
1181 | 全身心
1182 | 然
1183 | 人人
1184 | 仍
1185 | 仍舊
1186 | 仍然
1187 | 日復一日
1188 | 日見
1189 | 日漸
1190 | 日益
1191 | 日臻
1192 | 如常
1193 | 如此等等
1194 | 如次
1195 | 如今
1196 | 如期
1197 | 如前所述
1198 | 如上
1199 | 如下
1200 | 汝
1201 | 三番兩次
1202 | 三番五次
1203 | 三天兩頭
1204 | 瑟瑟
1205 | 沙沙
1206 | 上
1207 | 上來
1208 | 上去
1209 | 


--------------------------------------------------------------------------------