├── textrank ├── textrank4zh │ ├── __init__.py │ ├── __init__.pyc │ ├── Segmentation.pyc │ ├── TextRank4Keyword.pyc │ ├── Segmentation.py │ └── TextRank4Keyword.py ├── text │ ├── 04.txt │ ├── 03.txt │ ├── 01.txt │ ├── 02.txt │ └── 05.txt ├── testRank.py ├── README.md └── stopword.txt ├── README.md └── LDA ├── lda_demo.py ├── text └── 05.txt └── stopword.txt /textrank/textrank4zh/__init__.py: -------------------------------------------------------------------------------- 1 | from TextRank4Keyword import TextRank4Keyword 2 | -------------------------------------------------------------------------------- /textrank/textrank4zh/__init__.pyc: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/demoyhui/KeywordExtraction/HEAD/textrank/textrank4zh/__init__.pyc -------------------------------------------------------------------------------- /textrank/textrank4zh/Segmentation.pyc: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/demoyhui/KeywordExtraction/HEAD/textrank/textrank4zh/Segmentation.pyc -------------------------------------------------------------------------------- /textrank/textrank4zh/TextRank4Keyword.pyc: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/demoyhui/KeywordExtraction/HEAD/textrank/textrank4zh/TextRank4Keyword.pyc -------------------------------------------------------------------------------- /README.md: -------------------------------------------------------------------------------- 1 | # KeywordExtraction 2 | 3 | 4 | 环境  python2.7 ubuntu 5 | 6 | 7 | 1.LDA是基于LDA算法实现的关键字提取 8 | 9 | 10 | 2.TextRank是基于textRank算法实现的关键字提取 11 | -------------------------------------------------------------------------------- /textrank/text/04.txt: -------------------------------------------------------------------------------- 1 | 京菜擅长烤、爆、烧、焖、涮,听起来豪爽,吃起来痛快。北京烤鸭是来京游玩必食的美味;西四缸瓦市一家名叫砂锅居的老店所烧的砂锅白肉名满京城,相传他们用的原汤已有二三百年历史;涮羊肉是最受北京人欢迎的冬令美食,其中阳坊涮肉连锁店以价格便宜,味道正宗而倍受青睐。可以以半份起卖,在全市有许多分店。除此之外,还有东来顺、又一顺、能仁居的涮羊肉名气也很大。 2 | 北京风味小吃有600多年历史,包括汉民风味小吃、回民风味小吃和宫廷风味小吃等300多种。 3 | 北京的各大饭店历来是名厨荟萃,如北京饭店的谭家菜、建国饭店的法式西餐都是别处不易享用到的佳肴;北京还有正宗的法式、美式、意式、俄式餐厅和日本料理、韩国烧烤以及越南、印尼、泰国风味的菜馆。若为省时实惠,还可以光顾街头小店,这里不乏北京特有的包子、饺子、面条及家常炒菜,当然,环境就不如大餐馆讲究了。 4 | 东直门内大街原是北京最富特色的餐饮一条街,大街南北两侧云集了各种风味的餐馆,多为24小时营业。但现在因为拆迁,这条路上的餐饮店多已搬迁。 -------------------------------------------------------------------------------- /textrank/testRank.py: -------------------------------------------------------------------------------- 1 | #-*- encoding:utf-8 -*- 2 | import jieba 3 | import sys 4 | reload(sys) 5 | sys.setdefaultencoding('utf-8') 6 | 7 | import codecs 8 | from textrank4zh import TextRank4Keyword 9 | text = codecs.open('./text/05.txt', 'r', 'utf-8').read() 10 | tr4w = TextRank4Keyword(stop_words_file='./stopword.txt') # 导入停止词 11 | 12 | #使用词性过滤,文本小写,窗口为2 13 | tr4w.train(text=text, speech_tag_filter=False, lower=True, window=2) 14 | 15 | print '关键词:' 16 | # 20个关键词且每个的长度最小为1 17 | print '/'.join(tr4w.get_keywords(10, word_min_len=2)) 18 | 19 | 20 | 21 | 22 | -------------------------------------------------------------------------------- /textrank/text/03.txt: -------------------------------------------------------------------------------- 1 | 据BI消息,Netflix 正准备在本月上线其最新的原创剧集《马可波罗》。而据纽约时报报道,《马可波罗》第一季 10 集的总投资高达 9000 万美元,这不仅创下了 Netflix 的最高电视剧投资记录,在全球电视剧制作成本的排名中也是数一数二的,仅次于 HBO 原创的《权利的游戏》。 2 | 3 | 《马可波罗》在意大利、哈萨克斯坦、马来西亚等多国取景拍摄,数百名演员来自多个国家,电视剧把传奇冒险、战争、武术、性诱惑、政治阴谋等元素都融了进去,看起来会包含不少大家喜闻乐见的题材。Netflix 也为《马可波罗》的播出制定了庞大的市场营销计划。比如,Netflix 将携主要演员参加巴西的圣地亚哥国际动漫展,另外也会在墨西哥的一个大型购物中心展示《马可波罗》演出所用的服装和道具。 4 | 5 | Netflix 怎么会如此大手笔?毫无疑问 Netflix 对这部剧寄予了重望——Netflix 的海外市场。Netflix 现在已经进入全球 50 多个国家和地区,付费订户高达 5000 万人。由于在美国本土的增长开始下滑,寻求海外增长机会成为 Netflix 的当务之急。除了四处购买电影电视剧的全球版权等海外市场豪赌,Netflix 在影视内容上也有一场豪赌——鸿篇巨制的《马可波罗》。此剧由独立片商威斯坦公司制作,Netflix 掌握全球版权,将从 12 月 12 日开始在 Netflix 面向全球订户提供点播。 6 | 7 | Netflix 早期靠《纸牌屋》和《女子监狱》等原创剧一鸣惊人,但可惜的是,Netflix 并没有掌握《纸牌屋》等剧的海外版权。比如在德国和法国,观众可以在电视频道上收看该剧。不过,《纸牌屋》的成功仍然帮助 Netflix 提升了知名度。目前,Netflix 正在筹拍中的原创剧有不少,《马可波罗》成功与否可以在一定程度上验证 Netflix 的原创剧战略是否在海外市场是否有效。 8 | 9 | 不过,一些媒体行业分析师预测,Netflix 的国际化将会遇到各国本地视频网站的狙击。此外 HBO 也是其最强劲的竞争对手。众所周知,HBO 在国际化方面已经先行一步。比如在中国市场,HBO 就刚刚与腾讯视频签订了独家播放权。而迄今为止,Netflix 尚未在亚洲任何一个国家展开业务。 10 | -------------------------------------------------------------------------------- /textrank/text/01.txt: -------------------------------------------------------------------------------- 1 | 中新网北京12月1日电(记者 张曦) 30日晚,高圆圆和赵又廷在京举行答谢宴,诸多明星现身捧场,其中包括张杰(微博)、谢娜(微博)夫妇、何炅(微博)、蔡康永(微博)、徐克、张凯丽、黄轩(微博)等。 2 | 3 | 30日中午,有媒体曝光高圆圆和赵又廷现身台北桃园机场的照片,照片中两人小动作不断,尽显恩爱。事实上,夫妻俩此行是回女方老家北京举办答谢宴。 4 | 5 | 群星捧场 谢娜张杰亮相 6 | 7 | 当晚不到7点,两人十指紧扣率先抵达酒店。这间酒店位于北京东三环,里面摆放很多雕塑,文艺气息十足。 8 | 9 | 高圆圆身穿粉色外套,看到大批记者在场露出娇羞神色,赵又廷则戴着鸭舌帽,十分淡定,两人快步走进电梯,未接受媒体采访。 10 | 11 | 随后,谢娜、何炅也一前一后到场庆贺,并对一对新人表示恭喜。接着蔡康永满脸笑容现身,他直言:“我没有参加台湾婚礼,所以这次觉得蛮开心。” 12 | 13 | 曾与赵又廷合作《狄仁杰之神都龙王》的导演徐克则携女助理亮相,面对媒体的长枪短炮,他只大呼“恭喜!恭喜!” 14 | 15 | 作为高圆圆的好友,黄轩虽然拍杂志收工较晚,但也赶过来参加答谢宴。问到给新人带什么礼物,他大方拉开外套,展示藏在包里厚厚的红包,并笑言:“封红包吧!”但不愿透露具体数额。 16 | 17 | 值得一提的是,当晚10点,张杰压轴抵达酒店,他戴着黑色口罩,透露因刚下飞机所以未和妻子谢娜同行。虽然他没有接受采访,但在进电梯后大方向媒体挥手致意。 18 | 19 | 《我们结婚吧》主创捧场 20 | 21 | 黄海波(微博)获释仍未出席 22 | 23 | 在电视剧《咱们结婚吧》里,饰演高圆圆母亲的张凯丽,当晚身穿黄色大衣出席,但只待了一个小时就匆忙离去。 24 | 25 | 同样有份参演该剧,并扮演高圆圆男闺蜜的大左(微信号:dazuozone) 也到场助阵,28日,他已在台湾参加两人的盛大婚礼。大左30日晚接受采访时直言当时场面感人,“每个人都哭得稀里哗啦,晚上是吴宗宪(微博)(微信号:wushowzongxian) 主持,现场欢声笑语,讲了好多不能播的事,新人都非常开心”。 26 | 27 | 最令人关注的是在这部剧里和高圆圆出演夫妻的黄海波。巧合的是,他刚好于30日收容教育期满,解除收容教育。 28 | 29 | 答谢宴细节 30 | 31 | 宾客近百人,获赠礼物 32 | 33 | 记者了解到,出席高圆圆、赵又廷答谢宴的宾客近百人,其中不少都是女方的高中同学。 34 | 35 | 答谢宴位于酒店地下一层,现场安保森严,大批媒体只好在酒店大堂等待。期间有工作人员上来送上喜糖,代两位新人向媒体问好。 36 | 37 | 记者注意到,虽然答谢宴于晚上8点开始,但从9点开始就陆续有宾客离开,每个宾客都手持礼物,有宾客大方展示礼盒,只见礼盒上印有两只正在接吻的烫金兔子,不过工作人员迅速赶来,拒绝宾客继续展示。 -------------------------------------------------------------------------------- /textrank/text/02.txt: -------------------------------------------------------------------------------- 1 | 如何在美国把贪官送进监狱—— 2 | 法律用美国的:被用来修理黑帮的美国联邦法律也能“顺便”对付中国贪官 3 | 4 | 在美国起诉中国贪官,不可能适用中国自己的法律。所以,必须得搞清楚外逃贪官触犯美国法律的证据。贪官明明是在中国国内贪腐,还能触犯到美国的法律?没错。 5 | 6 | 有先例可循。1994年—2001年,原中国银行开平支行三任行长许超凡、余振东和许国俊勾结贪污、挪用了4.85亿美元巨资。他们都逃向了美国。后来,余振东和二许分别在美国被起诉。以“二许案”为例,这两个巨贪触犯了多项美国联邦刑法,首当其冲的是《反勒索及受贿组织法》。该法律是美国在上个世纪70年代通过的,当时的立意是对付各种黑帮。由于黑帮犯罪常常是一套完整的步骤,所以这个法案把有组织犯罪作为一条完整的“产业链”做考虑。具体来说,二许在中国国内贪污后,后续有一系列涉及到美国的行为——通过各种办法洗钱;把赃款转移到美国;为转移非法所得开设空壳公司……这三个人用了拉斯维加斯的赌场洗钱。所以,最后都是在拉斯维加斯所在的内华达州被美联邦法院审判。 7 | 8 | 除了“有组织犯罪”相关法条外,洗钱、伪造签证等贪官可能涉及到的触及美国法律行为都能被提起控诉。这里的美国法律主要指的是美国联邦法律,而不是州法律,所以这些贪官也是被联邦警察给抓获的。 9 | 10 | 总之,在国内的贪污行为是“上游”,中国的检察官们没可能因为这些发生在中国的“上游”事件要求美国法院给中国贪官定罪;而美国法官也不可能运用中国的法律来做判决。不过,把赃款和人转移出去这个“下游”过程是有很大部分是在美国发生的,可能触犯到各种美国法律。严格说起来,要想在美国对贪官们治罪,那么得找到他们的贪污关联行为触犯到美国法律的证据。 11 | 在美国坐牢的贪官许超凡和许国俊曾经通过拉斯维加斯的赌场洗钱在美国坐牢的贪官许超凡和许国俊曾经通过拉斯维加斯的赌场洗钱 12 | 一般也在美国蹲监狱:美国法律对付中国贪官并不手软,他们可能被判得很重 13 | 14 | 既然是运用美国法律判的,也得在美国服刑。而大家会担心,会不会“有组织犯罪”等罪名对付中国贪官太过温和、间接,对他们下手轻呢?其实不会。还是说“二许案”,他们一个判25年,另一个是22年。因为所涉及的犯罪基本在美国都是重罪。2009年,法制日报的报道《中行开平案八年追诉始末》分析道,“‘二许’此次在美国所获刑期,均已经超出我国刑法有期徒刑的最高量刑标准。” 15 | 16 | 在二许坐满牢之后,他们面临着被美国驱逐出境。他们都是通过欺诈的手段获得了美国的签证。 17 | 不过也有办法把贪官“换回”中国坐牢:中、美和嫌犯三方达成协议 18 | 余振东被遣返回中国后被判处12年有期徒刑。余振东被遣返回中国后被判处12年有期徒刑。 19 | 20 | 前文提到的余振东案里,余在美国被判入监144个月,但他现在处于中国的监狱中。这又是怎么回事呢?原来,余振东表示自愿接受遣返。余振东向美国方面递交《递解出境司法命令和放弃听证约定申请书》,承认自己在美所犯罪行应导致递解出境的法律后果,并且明确指定中国为其递解出境的接收国。当然,这种“自愿”是有前提条件的。因为中国也向美国的司法机关作出承诺,余振东在中国国内被宣判的刑期不会长于美国。而也因为余振东的自愿认罪,美国司法机关对他的判罚从轻。 21 | 还可以追究共同犯罪的贪官家属刑责:贪官的家属倘若一起触犯了美国法律,也得受罚 22 | 贪官背后往往有“贪内助”,而参与了犯罪的贪官家属也可能在美国被起诉贪官背后往往有“贪内助”,而参与了犯罪的贪官家属也可能在美国被起诉 23 | 24 | “二许案”中一共有四个人被追究刑责。因为,两个贪官的太太也没少参与触犯到美国法律的洗钱等行为。她们分别被判处监禁8年。除了大家能够想到的洗钱等常规动作外,这两对巨贪夫妻很“奇葩”的一点是,两位妻子先通过和美国人假结婚获得了美国公民资格。没有后顾之忧,真丈夫们开始疯狂地转移资金。等到逃跑时候,男人们也运用了假结婚的方式。所以在“二许案”的指控中,有一项是“护照、签证欺诈”。 25 | 要做到以上这些,重要的还是中国官方的努力,争取美国的积极合作 26 | 27 | 看起来,好像动用美国的司法体系来追究中国贪官的刑责并不难,也只需要美国方面的努力。那么,这是一条追诉逃美贪官的康庄大道?当然不是这样的。否则不会在2009年“二许案”宣判之后,暂时没有再出现过这样的案例。余振东案和“二许案”在当年都轰动一时,关系重大。因此是被当作大案要案在办。其时,恰逢中国和美国签署了《刑事司法互助协定》不久。所以这三个金融系统大蛀虫首当其冲被起诉了——几个巨贪被美国联邦警察逮捕就是中方努力的结果。中国也向美方提供了大量的证据,证明钱财是非法所得。找出财产转移链、挖出洗钱的细节……种种犯罪事实都需要经过繁琐的查证。另一方面,美国办案子也需要付出大量的司法成本,所以不能希冀美国的司法部门多么主动地去发现中国外逃贪官。 28 | 29 | 当然,时代在前行。随着国内反腐的高涨,海外追逃也越来越得到重视。这次外交部条约法律司司长徐宏的发言,也给了大家一个期许。 30 | 美国司法部关于“二许案”的通告美国司法部关于“二许案”的通告 31 | 如何在美国打官司,向贪官要回钱—— 32 | 拿着刑事判决的结果来打民事官司追款相对容易 33 | 34 | 对于民事诉讼追赃,《联合国反腐败公约》里有制度支持。而相对容易的一种形式就是拿着刑事判决去追赃。刑事判决对于财产的非法性是强有力的证明。所以,“二许案”后,中国银行在美国当地提起诉讼,追回了一些财产。 35 | 36 | 尽管“二许案”的许多赃款并没有转移到美国,而是在加拿大,美国的这份刑事判决也有助于“苦主”在加拿大追偿。就在今年11月24日,加拿大的大不列颠哥伦比亚BC省法院正式开庭审理中国银行向许超凡妻子和母亲追赃的民事诉讼。 37 | 38 | 一些学者认为,中国国内的刑事判决也是有助于发起民事诉讼法追赃的。不过一个现实是,中国的刑法不允许“缺席审判”,贪官不到位就没法动了,因此许多学者也提出中国应该建立起相关的制度来。 39 | 不管刑事,直接打民事官司也可以,就是费时、费力、费钱 40 | 41 | 民事诉讼相对于刑事诉讼来说要容易得多。所以被认为是一个非常好的向外逃贪官追责的路径。追回贪官的赃款,既挽回损失,还能够断了贪官的财源。 42 | 43 | 当然,以上都是最理想的说法。实际情况难多了。所以公开报道的海外成功追赃的民事诉讼案例真是屈指可数。在美国,目前唯一公开的一起是前述的中国银行向“二许”追赃。但是情况特殊,并且真正的大头在加拿大,所以参考性不强。倒是有一起不在美国,在澳大利亚的民事诉讼追赃可以做参考。被诉方是原北京市城乡建设集团副总经理李化学。只是过程非常艰辛曲折,为了顺利起诉,中方不得不聘请了一名当地律师。付出和回报存疑。办案人员彭唯良检察官的原话是:“在国外打官司,经济上必须有坚强的后盾来支持。另外,由于语言上的障碍,有些我们想通过律师要达到的目的,律师不太了解,返工的次数比较多。” 44 | 45 | 当然,这里需要说明的一点是,民事诉讼的主体也不宜是中国政府,而是具体的单位。所以在北京城乡集团的案子里,尽管检察官们为民事诉讼付出了大量的努力,但还得找来单位做原告。 46 | 目前经验看,最省事、有效的是争取到美国司法部的最大限度合作 47 | 陈水扁用非法所得在美国购买的房产陈水扁用非法所得在美国购买的房产 48 | 49 | 说一个台湾地区的例子。陈水扁弊案爆发后,被美国司法部发现,陈家用“不法所得”在美国购买了两处房产。后来,由美国司法部出面进行没收。美国司法部也需要向法院提出诉讼。这其实是属于美国的一个“腐败政府国家资产追回”计划。这个案子最后的结果是,法院支持了美国司法部的请求,陈家房产被拍卖。而根据相关法律,拍卖所得美国是有权分得一部分的。 50 | 51 | 由美国司法部出面提起诉讼,恐怕是最好的办法了。而这需要两点:第一,还是追赃国的申请和完整的证据;第二,则涉及到一个积极性问题。对追缴财产进行分享也是国际上一个比较流行的做法,可以大限度地调动赃款流向国的积极性。不失为一个参考。 52 | 结语 53 | 看来,在美国起诉贪官确实可行。但是,不管是追人还是追钱,都存在一个和美国的紧密合作问题,不然也是白搭。 54 | -------------------------------------------------------------------------------- /textrank/README.md: -------------------------------------------------------------------------------- 1 | #TextRank4ZH 2 | ----- 3 | 4 | TextRank算法可以用来从文本中提取关键词和摘要(重要的句子)。TextRank4ZH是针对中文文本的TextRank算法的python算法实现。 5 | 6 | 7 | ##安装 8 | 9 | 本程序使用python 2.7测试没有问题,暂时不兼容python 3。 10 | 11 | 先确定已经有jieba、numpy、networkx这三个库。可以使用`pip`安装: 12 | 13 | ``` 14 | $ sudo pip install numpy 15 | $ sudo pip install jieba 16 | $ sudo pip install networkx 17 | ``` 18 | 19 | 关于库版本,以下作为参考: 20 | 21 | ``` 22 | $ pip show jieba 23 | --- 24 | Name: jieba 25 | Version: 0.35 26 | Location: /usr/local/lib/python2.7/dist-packages 27 | Requires: 28 | $ pip show numpy 29 | --- 30 | Name: numpy 31 | Version: 1.7.1 32 | Location: /usr/lib/python2.7/dist-packages 33 | Requires: 34 | $ pip show networkx 35 | --- 36 | Name: networkx 37 | Version: 1.9.1 38 | Location: /usr/local/lib/python2.7/dist-packages 39 | Requires: decorator 40 | 41 | ``` 42 | 43 | 另外,请确保安装最新版本的jieba分词,TextRank4ZH需要新版本jieba提供的词性标注功能。 44 | 45 | ``` 46 | $ sudo pip install jieba --upgrade 47 | ``` 48 | 49 | TextRank4ZH暂不支持使用easy_install、pip来安装,使用者可以将`textrank4zh`拷贝到项目目录,或者环境变量`PYTHONPATH`指向的目录中。 50 | 51 | ##目录结构 52 | 53 | ``` 54 | ├── LICENSE #许可证 55 | ├── README.md #使用说明 56 | ├── stopword.data #停止词词典 57 | ├── test.py #测试 58 | ├── text #存放测试所需要的文本 59 | │   ├── 01.txt 60 | │   ├── 02.txt 61 | │   ├── 03.txt 62 | │   ├── 04.txt 63 | │   └── 05.txt 64 | └── textrank4zh #!main 65 | ├── __init__.py 66 | ├── Segmentation.py 67 | ├── TextRank4Keyword.py 68 | └── TextRank4Sentence.py 69 | ``` 70 | 71 | ##原理 72 | 73 | TextRank的详细原理请参考: 74 | 75 | > Mihalcea R, Tarau P. TextRank: Bringing order into texts[C]. Association for Computational Linguistics, 2004. 76 | 77 | ###关键词提取 78 | 将原文本拆分为句子,在每个句子中过滤掉停用词(可选),并只保留指定词性的单词(可选)。由此可以得到句子的集合和单词的集合。 79 | 80 | 每个单词作为pagerank中的一个节点。设定窗口大小为k,假设一个句子依次由下面的单词组成: 81 | ``` 82 | w1, w2, w3, w4, w5, ..., wn 83 | ``` 84 | `w1, w2, ..., wk`、`w2, w3, ...,wk+1`、`w3, w4, ...,wk+2`等都是一个窗口。在一个窗口中的任两个单词对应的节点之间存在一个无向无权的边。 85 | 86 | 基于上面构成图,可以计算出每个单词节点的重要性。最重要的若干单词可以作为关键词。 87 | 88 | 89 | ###关键短语提取 90 | 参照[关键词提取](#关键词提取)提取出若干关键词。若原文本中存在若干个关键词相邻的情况,那么这些关键词可以构成一个关键词组。 91 | 92 | 例如,在一篇介绍`支持向量机`的文章中,可以找到关键词`支持`、`向量`、`机`,通过关键词组提取,可以得到`支持向量机`。 93 | 94 | ###摘要生成 95 | 将每个句子看成图中的一个节点,若两个句子之间有相似性,认为对应的两个节点之间有一个无向有权边,权值是相似度。 96 | 97 | 通过pagerank算法计算得到的重要性最高的若干句子可以当作摘要。 98 | 99 | 100 | 101 | 102 | 103 | ##测试 104 | 105 | `test.py`提供了使用的示例: 106 | ``` 107 | #-*- encoding:utf-8 -*- 108 | 109 | import codecs 110 | from textrank4zh import TextRank4Keyword, TextRank4Sentence 111 | 112 | text = codecs.open('./text/01.txt', 'r', 'utf-8').read() 113 | tr4w = TextRank4Keyword(stop_words_file='./stopword.data') # 导入停止词 114 | 115 | #使用词性过滤,文本小写,窗口为2 116 | tr4w.train(text=text, speech_tag_filter=True, lower=True, window=2) 117 | 118 | print '关键词:' 119 | # 20个关键词且每个的长度最小为1 120 | print '/'.join(tr4w.get_keywords(20, word_min_len=1)) 121 | 122 | print '关键短语:' 123 | # 20个关键词去构造短语,短语在原文本中出现次数最少为2 124 | print '/'.join(tr4w.get_keyphrases(keywords_num=20, min_occur_num= 2)) 125 | 126 | tr4s = TextRank4Sentence(stop_words_file='./stopword.data') 127 | 128 | # 使用词性过滤,文本小写,使用words_all_filters生成句子之间的相似性 129 | tr4s.train(text=text, speech_tag_filter=True, lower=True, source = 'all_filters') 130 | 131 | print '摘要:' 132 | print '\n'.join(tr4s.get_key_sentences(num=3)) # 重要性最高的三个句子 133 | ``` 134 | 135 | 得到的关键词: 136 | ``` 137 | 媒体/高圆圆/微/宾客/赵又廷/答谢/谢娜/现身/记者/新人/北京/博/展示/捧场/礼物/张杰/当晚/戴/酒店/外套 138 | ``` 139 | 得到的关键短语: 140 | ``` 141 | 微博 142 | ``` 143 | 144 | 得到的摘要: 145 | ``` 146 | 中新网北京12月1日电(记者 张曦) 30日晚,高圆圆和赵又廷在京举行答谢宴,诸多明星现身捧场,其中包括张杰(微博)、谢娜(微博)夫妇、何炅(微博)、蔡康永(微博)、徐克、张凯丽、黄轩(微博)等 147 | 高圆圆身穿粉色外套,看到大批记者在场露出娇羞神色,赵又廷则戴着鸭舌帽,十分淡定,两人快步走进电梯,未接受媒体采访 148 | 记者了解到,出席高圆圆、赵又廷答谢宴的宾客近百人,其中不少都是女方的高中同学 149 | ``` 150 | 151 | ##使用说明 152 | 153 | 类TextRank4Keyword、TextRank4Sentence在处理一段文本时会将文本拆分成4种格式: 154 | 155 | **sentences:**由句子组成的列表。 156 | 157 | **words_no_filter:**对sentences中每个句子分词而得到的两级列表。 158 | 159 | **words_no_stop_words:**去掉words_no_filter中的停止词而得到的两级列表。 160 | 161 | **words_all_filters:**保留words_no_stop_words中指定词性的单词而得到的两级列表。 162 | 163 | 例如,对于: 164 | ``` 165 | 这间酒店位于北京东三环,里面摆放很多雕塑,文艺气息十足。答谢宴于晚上8点开始。 166 | ``` 167 | 对类TextRank4Sentence,在`speech_tag_filter=True, lower=True, source = 'all_filters'`时, 168 | 169 | sentences: 170 | ``` 171 | ['这间酒店位于北京东三环,里面摆放很多雕塑,文艺气息十足', 172 | '答谢宴于晚上8点开始'] 173 | ``` 174 | 175 | words_no_filter: 176 | ``` 177 | [ 178 | [ '这', '间, '酒店, '位于, '北京, '东三环, '里面, '摆放, '很多, '雕塑, '文艺, '气息, '十足'], 179 | [ '答谢', '宴于, '晚上, '8, '点, '开始' ] 180 | ] 181 | ``` 182 | 183 | words_no_stop_words: 184 | ``` 185 | [ 186 | [ '间', '酒店, '位于, '北京, '东三环, '里面, '摆放, '很多, '雕塑, '文艺, '气息, '十足' ], 187 | [ '答谢', '宴于, '晚上, '8, '点' ] 188 | ] 189 | ``` 190 | words_all_filters: 191 | 192 | ``` 193 | [ 194 | [ '酒店', '位于, '北京, '东三环, '摆放, '雕塑, '文艺, '气息' ], 195 | [ '答谢', '宴于, '晚上' ] 196 | ] 197 | ``` 198 | 199 | 类TextRank4Keyword位于`textrank4zh/TextRank4Keyword.py`中,类TextRank4Sentence位于`textrank4zh/TextRank4Sentence.py`中,**类的实现、函数的参数请参考源码注释。** 200 | 201 | 202 | 203 | 204 | 205 | 206 | 207 | 208 | 209 | 210 | -------------------------------------------------------------------------------- /LDA/lda_demo.py: -------------------------------------------------------------------------------- 1 | #coding:utf-8 2 | import numpy as np 3 | import lda 4 | #import lda.datasets 5 | import jieba 6 | import codecs 7 | import sys 8 | reload(sys) 9 | sys.setdefaultencoding('utf-8') 10 | 11 | class LDA_Demo(): 12 | def __init__(self, topics=2): 13 | self.n_topic = topics 14 | self.corpus = None 15 | self.vocab = None 16 | self.ppCountMatrix = None 17 | self.stop_words = None 18 | self.model = None 19 | 20 | def loadCorpusFromFile(self, fn): 21 | # 中文分词 22 | f = open(fn, 'r') 23 | text = f.readlines() 24 | text = r' '.join(text) 25 | 26 | seg_generator = jieba.cut(text,cut_all=False) 27 | seg_list = [i for i in seg_generator if i not in self.stop_words] 28 | seg_list = r' '.join(seg_list) 29 | # 切割统计所有出现的词纳入词典 30 | print seg_list 31 | seglist = seg_list.split(" ") 32 | self.vocab = [] 33 | for word in seglist: 34 | if (word != u' ' and word not in self.vocab): 35 | self.vocab.append(word) 36 | 37 | CountMatrix = [] 38 | f.seek(0, 0) 39 | # 统计每个文档中出现的词频 40 | for line in f: 41 | # 置零 42 | count = np.zeros(len(self.vocab),dtype=np.int) 43 | text = line.strip() 44 | # 但还是要先分词 45 | seg_generator = jieba.cut(text) 46 | seg_list = [i for i in seg_generator if i not in self.stop_words] 47 | seg_list = r' '.join(seg_list) 48 | seglist = seg_list.split(" ") 49 | # 查询词典中的词出现的词频 50 | for word in seglist: 51 | if word in self.vocab: 52 | count[self.vocab.index(word)] += 1 53 | CountMatrix.append(count) 54 | f.close() 55 | #self.ppCountMatrix = (len(CountMatrix), len(self.vocab)) 56 | self.ppCountMatrix = np.array(CountMatrix) 57 | #print self.ppCountMatrix 58 | 59 | print "load corpus from %s success!"%fn 60 | 61 | def setStopWords(self, word_list): 62 | self.stop_words = word_list 63 | 64 | def fitModel(self, n_iter = 1500, _alpha = 0.1, _eta = 0.01): 65 | self.model = lda.LDA(n_topics=self.n_topic, n_iter=n_iter, alpha=_alpha, eta= _eta, random_state= 1) 66 | self.model.fit(self.ppCountMatrix) 67 | 68 | def printTopic_Word(self, n_top_word = 8): 69 | for i, topic_dist in enumerate(self.model.topic_word_): 70 | topic_words = np.array(self.vocab)[np.argsort(topic_dist)][:-(n_top_word + 1):-1] 71 | 72 | print "Topic:",i,"\t", 73 | for word in topic_words: 74 | print word, 75 | print 76 | 77 | def printDoc_Topic(self): 78 | for i in range(len(self.ppCountMatrix)): 79 | print ("Doc %d:((top topic:%s) topic distribution:%s)"%(i, self.model.doc_topic_[i].argmax(),self.model.doc_topic_[i])) 80 | 81 | def printVocabulary(self): 82 | print "vocabulary:" 83 | for word in self.vocab: 84 | print word, 85 | print 86 | 87 | def saveVocabulary(self, fn): 88 | f = codecs.open(fn, 'w', 'utf-8') 89 | for word in self.vocab: 90 | f.write("%s\n"%word) 91 | f.close() 92 | 93 | def saveTopic_Words(self, fn, n_top_word = -1): 94 | if n_top_word==-1: 95 | n_top_word = len(self.vocab) 96 | f = codecs.open(fn, 'w', 'utf-8') 97 | for i, topic_dist in enumerate(self.model.topic_word_): 98 | topic_words = np.array(self.vocab)[np.argsort(topic_dist)][:-(n_top_word + 1):-1] 99 | f.write( "Topic:%d\t"%i) 100 | for word in topic_words: 101 | f.write("%s "%word) 102 | f.write("\n") 103 | f.close() 104 | 105 | def saveDoc_Topic(self, fn): 106 | f = codecs.open(fn, 'w', 'utf-8') 107 | for i in range(len(self.ppCountMatrix)): 108 | f.write("Doc %d:((top topic:%s) topic distribution:%s)\n" % (i, self.model.doc_topic_[i].argmax(), self.model.doc_topic_[i])) 109 | f.close() 110 | 111 | 112 | if __name__ == '__main__': 113 | # word_all = [] 114 | # with open('E:\mining\SMPCUP2017TASK1DATASET\\SMPCUP2017_TrainingData_Task1.TXT') as lines: 115 | # for line in lines: 116 | # for i in range(1,6): 117 | # word = line.split('\001')[i] 118 | # if i == 5: 119 | # word = word.strip('\n') 120 | # if len(word) > 6 and word not in word_all: 121 | # word_all.append(word) 122 | # for word in word_all: 123 | # jieba.add_word(word) 124 | stop_word=[] 125 | with open('./stopword.txt','r') as files: 126 | for file in files: 127 | file = file.strip('\r\n') 128 | stop_word.append(file) 129 | print stop_word 130 | _lda = LDA_Demo(topics=3) 131 | _lda.setStopWords(stop_word) 132 | _lda.loadCorpusFromFile(r'./text/05.txt') 133 | _lda.fitModel() 134 | _lda.printTopic_Word(n_top_word=10) 135 | _lda.printDoc_Topic() 136 | _lda.printVocabulary() 137 | 138 | 139 | 140 | 141 | -------------------------------------------------------------------------------- /LDA/text/05.txt: -------------------------------------------------------------------------------- 1 | 网络服务器虚拟化【转自】引子接触网络虚拟化纯属偶然。作为研究院微博五毛小分队的成员,撰出一条微博是每天的任务。那天无意中抓取了一条新闻:xsigo公司推出了业界第一个数据中心网络全虚拟化解决方案。巧的是xsigo公司的方案是基于infiniband技术的,而我最近的项目使我对infiniband略懂,所以就重点关注了一下。这一关注不要紧,才发现里面水很深。不管是传统it豪强还是网络巨人都对这一领域虎视眈眈,谋篇定局,更有无数的创业者们在此展开深耕。 抱着对技术要略懂的心态,我入水一探究竟。这篇博文算是对我这次涉水的总结,网络虚拟化发展到现在牵涉的技术非常多,每种技术都可以单独写一篇文章来介绍,限于我的精力和知识水平只能给大家做个整体的简单介绍,不足之处还请各位批评指正。如果读者对某种技术感兴趣可以搜索相关资料做更详细的了解。什么是网络虚拟化首先我们需要明确一个问题,什么是网络虚拟化,网络虚拟化简单来讲是指把逻辑网络从底层的物理网络分离开来。这个概念产生的比较久了,vlan,vpn, vpls等都可以归为网络虚拟化的技术。近年来,云计算的浪潮席卷it界。几乎所有的it基础构架都在朝着云的方向发展。在云计算的发展中,虚拟化技术一直是重要的推动因素。作为基础构架,服务器和存储的虚拟化已经发展的有声有色,而同作为基础构架的网络却还是一直沿用老的套路。在这种环境下,网络确实期待一次变革,使之更加符合云计算和互联网发展的需求。云计算的大环境下,网络虚拟化的定义没有变,但是其包含的内容却大大增加了。云计算环境下的网络虚拟化需要解决端到端的问题,笔者将其归纳为三个部分:(一)第一部分是服务器内部。随着越来越多的服务器被虚拟化,网络已经延伸到hypervisor内部,网络通信的端已经从以前的服务器变成了运行在服务器中的虚拟机,数据包从虚拟机的虚拟网卡流出,通过hypervisor内部的虚拟交换机,在经过服务器的物理网卡流出到上联交换机。在整个过程中,虚拟交换机,网卡的i/o问题以及虚拟机的网络接入都是研究的重点。(二)第二部分是服务器到网络的连接。10gb以太网 和infiniband等技术的发展使一根连接线上承载的带宽越来越高。为了简化,通过一种连接技术聚合互联网络和存储网络成为了一个趋势。(三)第三部分是网络交换,需要将物理网络和逻辑网络有效的分离,满足云计算多租户,按需服务的特性,同时具有高度的扩展性。下面我就围绕这三个方面来讲述网络虚拟化中的一些主要技术和标准。服务器内部i/o虚拟化多个虚拟机共享服务器中的物理网卡,需要一种机制既能保证i/o的效率,又要保证多个虚拟机对用物理网卡共享使用。i/o虚拟化的出现就是为了解决这类问题。i/o虚拟化包括了从cpu到设备的一揽子解决方案。从cpu的角度看,要解决虚拟机访问物理网卡等i/o设备的性能问题,能做的就是直接支持虚拟机内存到物理网卡的dma操作。intel的 vt-d技术及 amd 的iommu技术通过dmaremapping 机制来解决这个问题。dmaremapping机制主要解决了两个问题,一方面为每个vm创建了一个dma保护域并实现了安全的隔离,另一方面提供一种机制是将虚拟机的guestphysical address翻译为物理机的hostphysical address。从虚拟机对网卡等设备访问角度看,传统虚拟化的方案是虚拟机通过hypervisor来共享的访问一个物理网卡,hypervisor需要处理多虚拟机对设备的并发访问和隔离等。这样hypervisor容易行成一个性能瓶颈。为了提高性能,一种 做法是虚拟机绕过hypervisor直接操作物理网卡,这种做法通常称作pcipass through,vmware,xen和kvm都支持这种技术。但这种做法的问题是虚拟机通常需要独占一个pci插槽,不是一个完整的解决方案,成本较高且扩展性不足。 另一种做法是设备如网卡直接对上层操作系统或hypervisor提供虚拟化的功能,一个以太网卡可以对上层软件提供多个独立的虚拟的pcie设备并提供虚拟通道来实现并发的访问。这种方法也是业界主流的做法和发展方向,目前已经形成了标准,主要包括sr-iov(singleroot io virtualization)和mr-iov(multi-rootio virtualization)。这方面的技术在网上已有很好的文章来做介绍,推荐想进一步了解的同学读一读:虚拟接入在传统的服务器虚拟化方案中,从虚拟机的虚拟网卡发出的数据包在经过服务器的物理网卡传送到外部网络的上联交换机后,虚拟机的标识信息被屏蔽掉了,上联交换机只能感知从某个服务器的物理网卡流出的所有流量而无法感知服务器内某个虚拟机的流量,这样就不能从传统网络设备层面来保证qos和安全隔离。虚拟接入要解决的问题是要把虚拟机的网络流量纳入传统网络交换设备的管理之中,需要对虚拟机的流量做标识。在解决虚拟接入的问题时,思科和惠普分别提出了自己的解决方案。思科的是vn-tag, 惠普的方案是vepa(virtualethernet port aggregator)。为了制定下一代网络接入的话语权,思科和惠普这两个巨头在各自的方案上都毫不让步,纷纷将自己的方案提交为标准,分别为802.1qbh和802.1qbg。关于虚拟接入也有一篇很好的文章来介绍,想深入了解的可以看看:网络连接网络连接技术一直都在追求更高的带宽中发展。比如infiniband和10gb以太网。在传统的企业级数据中心it构架中,服务器到存储网络和互联网络的连接是异构和分开的。存储网络用光纤,互联网用以太网线(iscsi虽然能够在ip层上跑scsi,但是性能与光纤比还是差的很远)。数据中心连接技术的发展趋势是用一种连接线将数据中心存储网络和互联网络聚合起来,使服务器可以灵活的配置网络端口,简化it部署。以太网上的fcoe技术和infiniband技术本身都使这种趋势成为可能。infinibandinfiniband 技术产生于上个世纪末,是由compaq、、、、、和七家公司共同研究发展的高速先进的i/o标准。最初的命名为systemi/o,1999年10月,正式改名为infiniband。infiniband是一种长缆线的连接方式,具有高速、低延迟的传输特性。基于infiniband技术的网卡的单端口带宽可达20gbps,最初主要用在高性能计算系统中,近年来随着设备成本的下降,infiniband也逐渐被用到企业数据中心。为了发挥infiniband设备的性能,需要一整套的软件栈来驱动和使用,这其中最著名的就是ofed(openfabrics enterprise distribution) ,它基于infiniband设备实现了rdma(remote direct memoryaccess).rdma的最主要的特点就是零拷贝和旁路操作系统,数据直接在设备和应用程序内存之间传递,这种传递不需要cpu的干预和上下文切换。ofed还实现了一系列的其它软件栈:ipoib(ip over infiniband), srp(scsi rdma protocol)等,这就为infiniband聚合存储网络和互联网络提供了基础。ofed由openfabrics联盟负责开发。openfabrics最初叫做openib,从2006年开始openib在infiniband之外也开始支持以太网,业务做的大了名字也从openib改为openfabrics。ofed现已经被主流的linux发行版本支持,并被整合到微软的windowsserver中。图1ofed 软件栈fcoe就在大家认为infiniband就是数据中心连接技术的未来时,10gb以太网的出现让人看到了其它选择,以太网的发展好像从来未有上限,目前它的性能已经接近infiniband(详见),而从现有网络逐渐升级到10gb以太网也更易为用户所接受。fcoe的出现则为数据中心互联网络和存储网络的聚合提供了另一种可能。fcoe是将光纤信道直接映射到以太网线上,这样光纤信道就成了以太网线上除了互联网网络协议之外的另一种网络协议。fcoe能够很容易的和传统光纤网络上运行的软件和管理工具相整合,因而能够代替光纤连接存储网络。虽然出现的晚,但fcoe发展极其迅猛。与infiniband技术需要采用全新的链路相比,企业it们更愿意升级已有的以太网。在两者性能接近的情况下,采用fcoe方案乎性价比更高。网络交换在这一层面上要解决的问题则是要对现有的互联网络进行升级,使之满足新业务的需求,网络虚拟化则是这一变革的重要方向。在这一方向上目前有两种做法,一种是在原有的基础设施上添加新的协议来解决新的问题;另一种则完全推倒重来,希望设计出一种新的网络交换模型。当虚拟数据中心开始普及后,虚拟数据中心本身的一些特性带来对网络新的需求。物理机的位置一般是相对固定的,虚拟化方案的一个很大的特性在于虚拟机可以迁移。当虚拟机的迁移发生在不同网络,不同数据中心之间时,对网络产生了新的要求,比如需要保证虚拟机的ip在迁移前后不发生改变,需要保证虚拟机内运行在第二层(链路层)的应用程序也在迁移后仍可以跨越网络和数据中心进行通信等等。在这方面,cisco连续推出了otv,lisp和vxlan等一系列解决方案。otvotv的全称叫做overlaytransport virtualization。通过扩展链路层网络,它可以使局域网跨越数据中心。很多应用需要使用广播和本地链路多播。通过扩展链路层网络,otv技术能够跨地域的处理广播流和多播,这使得这些应用所在的虚拟机在数据中心之间迁移后仍然能够正常工作。otv扩展了链路层网络实际上也扩展了其相关的ip子网,需要ip路由同样的做改变,这就引出了新的问题,这个问题就由lisp来解决了。lisplisp的全称是locator/id separation protocol。传统的网络地址ip蕴含了两个含义,一个是你是谁(id),另一个是你在哪里(locator)。这样带来的一个问题就是如果你的位置变了(locator变了),ip必须跟着变化。lisp的目标是将id和locator分开,再通过维护一个映射系统将两者关联。这样虚拟机和服务器在网络不同位置进行迁移时可以保持相同的ip地址。图2otv和lisp的应用vxlanvxlan的目的是在云计算环境中创建更多的逻辑网络。在云计算的多租户环境中,租户都需要一个逻辑网络,并且与其它逻辑网络能够进行很好的隔离。在传统网络中,逻辑网络的隔离是通过vlan技术来解决的。不幸的是在ieee802.1q标准中,vlan的标识号只有12位,这就限制了在一定范围内虚拟网络最多只能扩展到4k个vlans。为了解决这个问题,思科联合vmware在今年推出了vxlan技术,通过macin user datagram protocol(mac-in-udp)封装技术,加入了一个24位的段标识符。用udp的多播代替广播,将数据包限定在目标网段内。vxlan技术极大的扩充了云计算环境中所能支持的逻辑网络的数量,同时通过逻辑段可以将逻辑网络扩展到不同的子网内,使虚拟机能够在不同的子网间做迁移。图3vxlan 帧式图4 通过vxlan来扩展网络nvgre对于云计算环境中的下一代网络,各大it厂商们都不想随便就丢掉话语权,就在cisco推出vxlan不久,microsoft就联合intel, hp dell 提出了标准。nvgre的全称是networkvirtualization using generic routing encapsulation。它和vxlan解决相同的问题,只是用了稍微不同的方式,使用gre (generic routing encapsulation) key的低24位作为网络租户的标识符。前面我们讲的都是在原有的基础设施上添加新的协议来解决新出现的问题,而近年来softwaredefined networking (sdn) 的兴起则期待从根本上改变目前的网络交换模式。sdn中最著名的就是openflow。openflow0penflow论坛起源于的“clean slate”计划,开始主要是为了设计一种新的互联网实验环境。在目前的实验网上没有实际足够多的用户或者足够大的网络拓扑来测试新协议的性能和功能,最好的方法是将运行新协议的实验网络嵌入实际运营的网络,利用实际的网络环境来检验新协议的可行性和存在的问题。openflow的切入点是目前已有的互联网上的交换设备。无论是交换机还是路由器,最核心的信息都保存在flowtable里面,这些flowtable用来实现诸如转发、统计、过滤等各种功能。虽然不同生产厂家有不同式的flowtable,但可以抽取出绝大多数switch和router都有的一些通用的功能。openflow试图提出一种通用的flowtable设计,能被所有厂家的设备所支持。通过控制flowtable能够实现网络流量的分区,将网络流量划分为不同的数据流,这些数据流能被归于不同的组且相互隔离,能够按照需要来处理和控制。更重要的是flowtable支持远程的访问和控制。openflow的flowtable中每一个entry支持3个部分:规则,操作与状态。规则是用来定义flow;操作就是转发、丢弃等行为;状态部分则是主要用来做流量的统计。有了openflow,我们可以在正常运行的网络中自己定义一些特殊的规则,通过定义不同的flowentry让符合规则的流量按照我们的需求走任意的路径,可以达到把物理网络切成若干不同的虚拟逻辑网络目的。所以,openflow将传统的互联网改造成为了动态可变的软件定义互联网(softwaredefined networking )。openflow的发展异常迅猛,就连cisco如今也开始拥抱openflow。总结网络虚拟化当前it发展最热门的方向之一,是云计算基础架构的核心技术。网络虚拟化涉及的面非常的广,本文也只根据笔者的认识做了粗浅的介绍。备注在网络虚拟化方面不仅很多大公司在抢占话语权,很多初创公司也在努力开拓机会,这里把我所知道的中小公司稍微做下总结,供大家参考:nicira:专注于openflow的神秘公司。:提供基于openflow的网络虚拟化解决方案juniper networks:支持openflowopen vswitch: 一个开源的虚拟switch,它是一个软件switch能运行在hypervisor里, 目前已是的缺省switch。contextream:借鉴grid的思想,通过dht(distributed hash table)在传统的网络之上建立一个虚拟的抽象的网络,解决云主机服务提供商们在网络灵活性,多租户和扩展性方面的挑战。embrane: 提供一种on-demand的虚拟化网络服务,比如服务的负载均衡,防火墙,vpn。xsigo:提供基于infiniband技术的数据中心全虚拟化方案。nextio:提供基于pcie技术 的i/o虚拟化产品。 2 | -------------------------------------------------------------------------------- /textrank/text/05.txt: -------------------------------------------------------------------------------- 1 | 网络服务器虚拟化【转自】引子接触网络虚拟化纯属偶然。作为研究院微博五毛小分队的成员,撰出一条微博是每天的任务。那天无意中抓取了一条新闻:xsigo公司推出了业界第一个数据中心网络全虚拟化解决方案。巧的是xsigo公司的方案是基于infiniband技术的,而我最近的项目使我对infiniband略懂,所以就重点关注了一下。这一关注不要紧,才发现里面水很深。不管是传统it豪强还是网络巨人都对这一领域虎视眈眈,谋篇定局,更有无数的创业者们在此展开深耕。 抱着对技术要略懂的心态,我入水一探究竟。这篇博文算是对我这次涉水的总结,网络虚拟化发展到现在牵涉的技术非常多,每种技术都可以单独写一篇文章来介绍,限于我的精力和知识水平只能给大家做个整体的简单介绍,不足之处还请各位批评指正。如果读者对某种技术感兴趣可以搜索相关资料做更详细的了解。什么是网络虚拟化首先我们需要明确一个问题,什么是网络虚拟化,网络虚拟化简单来讲是指把逻辑网络从底层的物理网络分离开来。这个概念产生的比较久了,vlan,vpn, vpls等都可以归为网络虚拟化的技术。近年来,云计算的浪潮席卷it界。几乎所有的it基础构架都在朝着云的方向发展。在云计算的发展中,虚拟化技术一直是重要的推动因素。作为基础构架,服务器和存储的虚拟化已经发展的有声有色,而同作为基础构架的网络却还是一直沿用老的套路。在这种环境下,网络确实期待一次变革,使之更加符合云计算和互联网发展的需求。云计算的大环境下,网络虚拟化的定义没有变,但是其包含的内容却大大增加了。云计算环境下的网络虚拟化需要解决端到端的问题,笔者将其归纳为三个部分:(一)第一部分是服务器内部。随着越来越多的服务器被虚拟化,网络已经延伸到hypervisor内部,网络通信的端已经从以前的服务器变成了运行在服务器中的虚拟机,数据包从虚拟机的虚拟网卡流出,通过hypervisor内部的虚拟交换机,在经过服务器的物理网卡流出到上联交换机。在整个过程中,虚拟交换机,网卡的i/o问题以及虚拟机的网络接入都是研究的重点。(二)第二部分是服务器到网络的连接。10gb以太网 和infiniband等技术的发展使一根连接线上承载的带宽越来越高。为了简化,通过一种连接技术聚合互联网络和存储网络成为了一个趋势。(三)第三部分是网络交换,需要将物理网络和逻辑网络有效的分离,满足云计算多租户,按需服务的特性,同时具有高度的扩展性。下面我就围绕这三个方面来讲述网络虚拟化中的一些主要技术和标准。服务器内部i/o虚拟化多个虚拟机共享服务器中的物理网卡,需要一种机制既能保证i/o的效率,又要保证多个虚拟机对用物理网卡共享使用。i/o虚拟化的出现就是为了解决这类问题。i/o虚拟化包括了从cpu到设备的一揽子解决方案。从cpu的角度看,要解决虚拟机访问物理网卡等i/o设备的性能问题,能做的就是直接支持虚拟机内存到物理网卡的dma操作。intel的 vt-d技术及 amd 的iommu技术通过dmaremapping 机制来解决这个问题。dmaremapping机制主要解决了两个问题,一方面为每个vm创建了一个dma保护域并实现了安全的隔离,另一方面提供一种机制是将虚拟机的guestphysical address翻译为物理机的hostphysical address。从虚拟机对网卡等设备访问角度看,传统虚拟化的方案是虚拟机通过hypervisor来共享的访问一个物理网卡,hypervisor需要处理多虚拟机对设备的并发访问和隔离等。这样hypervisor容易行成一个性能瓶颈。为了提高性能,一种 做法是虚拟机绕过hypervisor直接操作物理网卡,这种做法通常称作pcipass through,vmware,xen和kvm都支持这种技术。但这种做法的问题是虚拟机通常需要独占一个pci插槽,不是一个完整的解决方案,成本较高且扩展性不足。 另一种做法是设备如网卡直接对上层操作系统或hypervisor提供虚拟化的功能,一个以太网卡可以对上层软件提供多个独立的虚拟的pcie设备并提供虚拟通道来实现并发的访问。这种方法也是业界主流的做法和发展方向,目前已经形成了标准,主要包括sr-iov(singleroot io virtualization)和mr-iov(multi-rootio virtualization)。这方面的技术在网上已有很好的文章来做介绍,推荐想进一步了解的同学读一读:虚拟接入在传统的服务器虚拟化方案中,从虚拟机的虚拟网卡发出的数据包在经过服务器的物理网卡传送到外部网络的上联交换机后,虚拟机的标识信息被屏蔽掉了,上联交换机只能感知从某个服务器的物理网卡流出的所有流量而无法感知服务器内某个虚拟机的流量,这样就不能从传统网络设备层面来保证qos和安全隔离。虚拟接入要解决的问题是要把虚拟机的网络流量纳入传统网络交换设备的管理之中,需要对虚拟机的流量做标识。在解决虚拟接入的问题时,思科和惠普分别提出了自己的解决方案。思科的是vn-tag, 惠普的方案是vepa(virtualethernet port aggregator)。为了制定下一代网络接入的话语权,思科和惠普这两个巨头在各自的方案上都毫不让步,纷纷将自己的方案提交为标准,分别为802.1qbh和802.1qbg。关于虚拟接入也有一篇很好的文章来介绍,想深入了解的可以看看:网络连接网络连接技术一直都在追求更高的带宽中发展。比如infiniband和10gb以太网。在传统的企业级数据中心it构架中,服务器到存储网络和互联网络的连接是异构和分开的。存储网络用光纤,互联网用以太网线(iscsi虽然能够在ip层上跑scsi,但是性能与光纤比还是差的很远)。数据中心连接技术的发展趋势是用一种连接线将数据中心存储网络和互联网络聚合起来,使服务器可以灵活的配置网络端口,简化it部署。以太网上的fcoe技术和infiniband技术本身都使这种趋势成为可能。infinibandinfiniband 技术产生于上个世纪末,是由compaq、、、、、和七家公司共同研究发展的高速先进的i/o标准。最初的命名为systemi/o,1999年10月,正式改名为infiniband。infiniband是一种长缆线的连接方式,具有高速、低延迟的传输特性。基于infiniband技术的网卡的单端口带宽可达20gbps,最初主要用在高性能计算系统中,近年来随着设备成本的下降,infiniband也逐渐被用到企业数据中心。为了发挥infiniband设备的性能,需要一整套的软件栈来驱动和使用,这其中最著名的就是ofed(openfabrics enterprise distribution) ,它基于infiniband设备实现了rdma(remote direct memoryaccess).rdma的最主要的特点就是零拷贝和旁路操作系统,数据直接在设备和应用程序内存之间传递,这种传递不需要cpu的干预和上下文切换。ofed还实现了一系列的其它软件栈:ipoib(ip over infiniband), srp(scsi rdma protocol)等,这就为infiniband聚合存储网络和互联网络提供了基础。ofed由openfabrics联盟负责开发。openfabrics最初叫做openib,从2006年开始openib在infiniband之外也开始支持以太网,业务做的大了名字也从openib改为openfabrics。ofed现已经被主流的linux发行版本支持,并被整合到微软的windowsserver中。图1ofed 软件栈fcoe就在大家认为infiniband就是数据中心连接技术的未来时,10gb以太网的出现让人看到了其它选择,以太网的发展好像从来未有上限,目前它的性能已经接近infiniband(详见),而从现有网络逐渐升级到10gb以太网也更易为用户所接受。fcoe的出现则为数据中心互联网络和存储网络的聚合提供了另一种可能。fcoe是将光纤信道直接映射到以太网线上,这样光纤信道就成了以太网线上除了互联网网络协议之外的另一种网络协议。fcoe能够很容易的和传统光纤网络上运行的软件和管理工具相整合,因而能够代替光纤连接存储网络。虽然出现的晚,但fcoe发展极其迅猛。与infiniband技术需要采用全新的链路相比,企业it们更愿意升级已有的以太网。在两者性能接近的情况下,采用fcoe方案乎性价比更高。网络交换在这一层面上要解决的问题则是要对现有的互联网络进行升级,使之满足新业务的需求,网络虚拟化则是这一变革的重要方向。在这一方向上目前有两种做法,一种是在原有的基础设施上添加新的协议来解决新的问题;另一种则完全推倒重来,希望设计出一种新的网络交换模型。当虚拟数据中心开始普及后,虚拟数据中心本身的一些特性带来对网络新的需求。物理机的位置一般是相对固定的,虚拟化方案的一个很大的特性在于虚拟机可以迁移。当虚拟机的迁移发生在不同网络,不同数据中心之间时,对网络产生了新的要求,比如需要保证虚拟机的ip在迁移前后不发生改变,需要保证虚拟机内运行在第二层(链路层)的应用程序也在迁移后仍可以跨越网络和数据中心进行通信等等。在这方面,cisco连续推出了otv,lisp和vxlan等一系列解决方案。otvotv的全称叫做overlaytransport virtualization。通过扩展链路层网络,它可以使局域网跨越数据中心。很多应用需要使用广播和本地链路多播。通过扩展链路层网络,otv技术能够跨地域的处理广播流和多播,这使得这些应用所在的虚拟机在数据中心之间迁移后仍然能够正常工作。otv扩展了链路层网络实际上也扩展了其相关的ip子网,需要ip路由同样的做改变,这就引出了新的问题,这个问题就由lisp来解决了。lisplisp的全称是locator/id separation protocol。传统的网络地址ip蕴含了两个含义,一个是你是谁(id),另一个是你在哪里(locator)。这样带来的一个问题就是如果你的位置变了(locator变了),ip必须跟着变化。lisp的目标是将id和locator分开,再通过维护一个映射系统将两者关联。这样虚拟机和服务器在网络不同位置进行迁移时可以保持相同的ip地址。图2otv和lisp的应用vxlanvxlan的目的是在云计算环境中创建更多的逻辑网络。在云计算的多租户环境中,租户都需要一个逻辑网络,并且与其它逻辑网络能够进行很好的隔离。在传统网络中,逻辑网络的隔离是通过vlan技术来解决的。不幸的是在ieee802.1q标准中,vlan的标识号只有12位,这就限制了在一定范围内虚拟网络最多只能扩展到4k个vlans。为了解决这个问题,思科联合vmware在今年推出了vxlan技术,通过macin user datagram protocol(mac-in-udp)封装技术,加入了一个24位的段标识符。用udp的多播代替广播,将数据包限定在目标网段内。vxlan技术极大的扩充了云计算环境中所能支持的逻辑网络的数量,同时通过逻辑段可以将逻辑网络扩展到不同的子网内,使虚拟机能够在不同的子网间做迁移。图3vxlan 帧式图4 通过vxlan来扩展网络nvgre对于云计算环境中的下一代网络,各大it厂商们都不想随便就丢掉话语权,就在cisco推出vxlan不久,microsoft就联合intel, hp dell 提出了标准。nvgre的全称是networkvirtualization using generic routing encapsulation。它和vxlan解决相同的问题,只是用了稍微不同的方式,使用gre (generic routing encapsulation) key的低24位作为网络租户的标识符。前面我们讲的都是在原有的基础设施上添加新的协议来解决新出现的问题,而近年来softwaredefined networking (sdn) 的兴起则期待从根本上改变目前的网络交换模式。sdn中最著名的就是openflow。openflow0penflow论坛起源于的“clean slate”计划,开始主要是为了设计一种新的互联网实验环境。在目前的实验网上没有实际足够多的用户或者足够大的网络拓扑来测试新协议的性能和功能,最好的方法是将运行新协议的实验网络嵌入实际运营的网络,利用实际的网络环境来检验新协议的可行性和存在的问题。openflow的切入点是目前已有的互联网上的交换设备。无论是交换机还是路由器,最核心的信息都保存在flowtable里面,这些flowtable用来实现诸如转发、统计、过滤等各种功能。虽然不同生产厂家有不同式的flowtable,但可以抽取出绝大多数switch和router都有的一些通用的功能。openflow试图提出一种通用的flowtable设计,能被所有厂家的设备所支持。通过控制flowtable能够实现网络流量的分区,将网络流量划分为不同的数据流,这些数据流能被归于不同的组且相互隔离,能够按照需要来处理和控制。更重要的是flowtable支持远程的访问和控制。openflow的flowtable中每一个entry支持3个部分:规则,操作与状态。规则是用来定义flow;操作就是转发、丢弃等行为;状态部分则是主要用来做流量的统计。有了openflow,我们可以在正常运行的网络中自己定义一些特殊的规则,通过定义不同的flowentry让符合规则的流量按照我们的需求走任意的路径,可以达到把物理网络切成若干不同的虚拟逻辑网络目的。所以,openflow将传统的互联网改造成为了动态可变的软件定义互联网(softwaredefined networking )。openflow的发展异常迅猛,就连cisco如今也开始拥抱openflow。总结网络虚拟化当前it发展最热门的方向之一,是云计算基础架构的核心技术。网络虚拟化涉及的面非常的广,本文也只根据笔者的认识做了粗浅的介绍。备注在网络虚拟化方面不仅很多大公司在抢占话语权,很多初创公司也在努力开拓机会,这里把我所知道的中小公司稍微做下总结,供大家参考:nicira:专注于openflow的神秘公司。:提供基于openflow的网络虚拟化解决方案juniper networks:支持openflowopen vswitch: 一个开源的虚拟switch,它是一个软件switch能运行在hypervisor里, 目前已是的缺省switch。contextream:借鉴grid的思想,通过dht(distributed hash table)在传统的网络之上建立一个虚拟的抽象的网络,解决云主机服务提供商们在网络灵活性,多租户和扩展性方面的挑战。embrane: 提供一种on-demand的虚拟化网络服务,比如服务的负载均衡,防火墙,vpn。xsigo:提供基于infiniband技术的数据中心全虚拟化方案。nextio:提供基于pcie技术 的i/o虚拟化产品。 2 | -------------------------------------------------------------------------------- /textrank/textrank4zh/Segmentation.py: -------------------------------------------------------------------------------- 1 | #-*- encoding:utf-8 -*- 2 | 3 | import jieba.posseg as pseg 4 | import jieba 5 | import codecs 6 | 7 | class WordSegmentation(object): 8 | ''' 分词 ''' 9 | 10 | def __init__(self, stop_words_file = None): 11 | ''' 12 | stop_words_file: 保存停止词的文件路径,每行一个停止次 13 | ''' 14 | 15 | word_all = [] 16 | # with open('E:\mining\SMPCUP2017TASK1DATASET\\SMPCUP2017_TrainingData_Task1.TXT') as lines: 17 | # for line in lines: 18 | # for i in range(1,6): 19 | # word = line.split('\001')[i] 20 | # if i == 5: 21 | # word = word.strip('\n') 22 | # if len(word) > 6 and word not in word_all: 23 | # word_all.append(word) 24 | # for word in word_all: 25 | # jieba.add_word(word) 26 | self.default_speech_tag_filter = ['an', 'i', 'j', 'l', 'n', 'nr', 'nrfg', 'ns', 'nt', 'nz', 27 | 't', 'v', 'vd', 'vn', 'eng'] 28 | self.stop_tokens = ",。!?:;“”\"/\\`!#%^&*()_+-={}[]|;:'‘’<>?,.~·—「;:《》()、― ―".decode('utf-8') 29 | self.stop_words = set() 30 | if type(stop_words_file) is str: 31 | for word in codecs.open(stop_words_file, 'r', 'utf-8', 'ignore'): 32 | self.stop_words.add(word.strip()) 33 | 34 | def segment(self, text, lower = True, with_stop_words = True, speech_tag_filter = False): 35 | ''' 36 | speech_tag_filter: 若为bool变量且为True,则使用默认的self.default_speech_tag_filter过滤, 37 | 若为list类型,则使用speech_tag_filter过滤 38 | 否则,不过滤 39 | with_stop_words: 若为True,则利用停止词集合来过滤(去掉停止词),否则什么都不做 40 | 41 | lower = True: 是否将单词小写(针对英文) 42 | ''' 43 | 44 | jieba_result = pseg.cut(text) 45 | 46 | if type(speech_tag_filter) == bool and speech_tag_filter == True: 47 | jieba_result = [w.word for w in jieba_result if w.flag in self.default_speech_tag_filter] 48 | elif type(speech_tag_filter) == list: 49 | jieba_result = [w.word for w in jieba_result if w.flag in speech_tag_filter] 50 | else: 51 | jieba_result = [w.word for w in jieba_result] 52 | 53 | if lower: 54 | jieba_result = [word.lower() for word in jieba_result] 55 | 56 | if with_stop_words: 57 | res = [word.strip() for word in jieba_result 58 | if word.strip() not in self.stop_tokens 59 | and word.strip() not in self.stop_words 60 | and len(word.strip()) > 0] 61 | else: 62 | res = [word.strip() for word in jieba_result 63 | if word.strip() not in self.stop_tokens 64 | and len(word.strip()) > 0] 65 | 66 | return res 67 | 68 | def segment_sentences(self, sentences, lower = True, with_stop_words = True, speech_tag_filter=False): 69 | ''' 70 | 将列表sequences中的每个句子转换为由单词构成的列表。 71 | 72 | sequences:列表,每个元素是一个句子(字符串类型) 73 | ''' 74 | 75 | res = [] 76 | for sentence in sentences: 77 | res.append(self.segment(text=sentence, 78 | lower=lower, 79 | with_stop_words=with_stop_words, 80 | speech_tag_filter=speech_tag_filter)) 81 | return res 82 | 83 | class SentenceSegmentation(object): 84 | ''' 分句 ''' 85 | 86 | def __init__(self, delimiters='?!;?!。;…\n'): 87 | ''' 88 | delimiters: 用来拆分句子 89 | ''' 90 | self.delimiters = unicode(delimiters) 91 | 92 | 93 | def __split(self, text, delimiters): 94 | res = [unicode(text)] 95 | for sep in delimiters: 96 | text, res = res, [] 97 | for seq in text: 98 | res += seq.split(sep) 99 | res = [s.strip() for s in res if len(s.strip()) > 0] 100 | return res 101 | 102 | def segment(self, text): 103 | return self.__split(text, self.delimiters) 104 | 105 | class Segmentation(object): 106 | 107 | def __init__(self, stop_words_file = None, delimiters='?!;?!。;…\n'): 108 | ''' 109 | stop_words_file: 停止词文件 110 | delimiters: 用来拆分句子 111 | ''' 112 | self.ws = WordSegmentation(stop_words_file) 113 | self.ss = SentenceSegmentation(delimiters) 114 | 115 | def segment(self, text, lower = False, speech_tag_filter = True): 116 | sentences = self.ss.segment(text) 117 | words_no_filter = self.ws.segment_sentences(sentences=sentences, 118 | lower = lower, 119 | with_stop_words = False, 120 | speech_tag_filter = False) 121 | words_no_stop_words = self.ws.segment_sentences(sentences=sentences, 122 | lower = lower, 123 | with_stop_words = True, 124 | speech_tag_filter = False) 125 | 126 | words_all_filters = self.ws.segment_sentences(sentences=sentences, 127 | lower = lower, 128 | with_stop_words = True, 129 | speech_tag_filter = speech_tag_filter) 130 | 131 | return sentences, words_no_filter, words_no_stop_words, words_all_filters 132 | 133 | 134 | 135 | if __name__ == '__main__': 136 | 137 | ss = SentenceSegmentation() 138 | seg = Segmentation(stop_words_file='../stopword.data') 139 | text = codecs.open('../text/01.txt', 'r', 'utf-8', 'ignore').read() 140 | text = "视频里,我们的杰宝热情地用英文和全场观众打招呼并清唱了一段《Heal The World》。我们的世界充满了未知数。" 141 | sentences, words_no_filter, words_no_stop_words, words_all_filters = seg.segment(text=text, 142 | lower=True, 143 | speech_tag_filter=True) 144 | for s in sentences: 145 | print s 146 | 147 | print 148 | for ss in words_no_filter: 149 | print ' '.join(ss) 150 | 151 | print 152 | for ss in words_no_stop_words: 153 | print '/'.join(ss) 154 | 155 | print 156 | for ss in words_all_filters: 157 | print '%'.join(ss) 158 | -------------------------------------------------------------------------------- /textrank/textrank4zh/TextRank4Keyword.py: -------------------------------------------------------------------------------- 1 | #-*- encoding:utf-8 -*- 2 | import networkx as nx 3 | from Segmentation import Segmentation 4 | import numpy as np 5 | 6 | class TextRank4Keyword(object): 7 | 8 | def __init__(self, stop_words_file = None, delimiters = '?!;?!。;…\n'): 9 | ''' 10 | `stop_words_file`:默认值为None,此时内部停止词表为空;可以设置为文件路径(字符串),将从停止词文件中提取停止词。 11 | `delimiters`:默认值是`'?!;?!。;…\n'`,用来将文本拆分为句子。 12 | 13 | self.words_no_filter:对sentences中每个句子分词而得到的两级列表。 14 | self.words_no_stop_words:去掉words_no_filter中的停止词而得到的两级列表。 15 | self.words_all_filters:保留words_no_stop_words中指定词性的单词而得到的两级列表。 16 | ''' 17 | self.text = '' 18 | self.keywords = [] 19 | 20 | self.seg = Segmentation(stop_words_file=stop_words_file, delimiters=delimiters) 21 | 22 | self.words_no_filter = None # 2维列表 23 | self.words_no_stop_words = None 24 | self.words_all_filters = None 25 | 26 | self.word_index = {} 27 | self.index_word = {} 28 | self.graph = None 29 | 30 | def train(self, text, window = 2, lower = False, speech_tag_filter=True, 31 | vertex_source = 'all_filters', 32 | edge_source = 'no_stop_words'): 33 | ''' 34 | `text`:文本内容,字符串。 35 | `window`:窗口大小,int,用来构造单词之间的边。默认值为2。 36 | `lower`:是否将文本转换为小写。默认为False。 37 | `speech_tag_filter`:若值为True,将调用内部的词性列表来过滤生成words_all_filters。 38 | 若值为False,words_all_filters与words_no_stop_words相同。 39 | `vertex_source`:选择使用words_no_filter, words_no_stop_words, words_all_filters中的哪一个来构造pagerank对应的图中的节点。 40 | 默认值为`'all_filters'`,可选值为`'no_filter', 'no_stop_words', 'all_filters'`。关键词也来自`vertex_source`。 41 | `edge_source`:选择使用words_no_filter, words_no_stop_words, words_all_filters中的哪一个来构造pagerank对应的图中的节点之间的边。 42 | 默认值为`'no_stop_words'`,可选值为`'no_filter', 'no_stop_words', 'all_filters'`。边的构造要结合`window`参数。 43 | ''' 44 | 45 | self.text = text 46 | self.word_index = {} 47 | self.index_word = {} 48 | self.keywords = [] 49 | self.graph = None 50 | self.words_copy = [] 51 | 52 | (_, self.words_no_filter, self.words_no_stop_words, self.words_all_filters) = self.seg.segment(text=text, 53 | lower=lower, 54 | speech_tag_filter=speech_tag_filter) 55 | 56 | if vertex_source == 'no_filter': 57 | vertex_source = self.words_no_filter 58 | elif vertex_source == 'no_stop_words': 59 | vertex_source = self.words_no_stop_words 60 | else: 61 | vertex_source = self.words_all_filters 62 | 63 | if edge_source == 'no_filter': 64 | edge_source = self.words_no_filter 65 | elif vertex_source == 'all_filters': 66 | edge_source = self.words_all_filters 67 | else: 68 | edge_source = self.words_no_stop_words 69 | 70 | for words in vertex_source: 71 | for word in words: 72 | self.words_copy.append(word) 73 | #print self.words_copy 74 | index = 0 75 | for words in vertex_source: 76 | for word in words: 77 | #print word 78 | if not self.word_index.has_key(word): 79 | #print word 80 | self.word_index[word] = index 81 | self.index_word[index] = word 82 | index += 1 83 | 84 | 85 | words_number = index # 单词数量 86 | print index 87 | self.graph = np.zeros((words_number, words_number)) 88 | 89 | for word_list in edge_source: 90 | for w1, w2 in self.combine(word_list, window): 91 | if not self.word_index.has_key(w1): 92 | continue 93 | if not self.word_index.has_key(w2): 94 | continue 95 | index1 = self.word_index[w1] 96 | index2 = self.word_index[w2] 97 | self.graph[index1][index2] = 1.0 98 | self.graph[index2][index1] = 1.0 99 | 100 | # for x in xrange(words_number): 101 | # row_sum = np.sum(self.graph[x, :]) 102 | # if row_sum > 0: 103 | # self.graph[x, :] = self.graph[x, :] / row_sum 104 | 105 | nx_graph = nx.from_numpy_matrix(self.graph) 106 | scores = nx.pagerank(nx_graph) # this is a dict 107 | for word in scores: 108 | #print word,scores[word],self.words_copy.count(word) 109 | scores[word]=scores[word]*self.words_copy.count(self.index_word[word]) 110 | sorted_scores = sorted(scores.items(), key = lambda item: item[1], reverse=True) 111 | #print sorted_scores 112 | for index, _ in sorted_scores: 113 | self.keywords.append(self.index_word[index]) 114 | print self.index_word[index],_ 115 | 116 | 117 | 118 | def combine(self, word_list, window = 2): 119 | ''' 120 | 构造在window下的单词组合,用来构造单词之间的边。使用了生成器。 121 | word_list: 由单词组成的列表。 122 | windows:窗口大小。 123 | ''' 124 | window = int(window) 125 | if window < 2: window = 2 126 | for x in xrange(1, window): 127 | if x >= len(word_list): 128 | break 129 | word_list2 = word_list[x:] 130 | res = zip(word_list, word_list2) 131 | for r in res: 132 | yield r 133 | 134 | def get_keywords(self, num = 6, word_min_len = 1): 135 | ''' 136 | 获取最重要的num个长度大于等于word_min_len的关键词。 137 | 返回关键词列表。 138 | ''' 139 | result = [] 140 | count = 0 141 | for word in self.keywords: 142 | if count >= num: 143 | break 144 | if len(word) >= word_min_len: 145 | result.append(word) 146 | count += 1 147 | return result 148 | 149 | def get_keyphrases(self, keywords_num = 12, min_occur_num = 2): 150 | ''' 151 | 获取关键短语。 152 | 获取 keywords_num 个关键词构造在可能出现的短语,要求这个短语在原文本中至少出现的次数为min_occur_num。 153 | 返回关键短语的列表。 154 | ''' 155 | keywords_set = set(self.get_keywords(num=keywords_num, word_min_len = 1)) 156 | 157 | keyphrases = set() 158 | one = [] 159 | for sentence_list in self.words_no_filter: 160 | for word in sentence_list: 161 | # print '/'.join(one) 162 | # print word 163 | if word in keywords_set: 164 | one.append(word) 165 | else: 166 | if len(one)>1: 167 | keyphrases.add(''.join(one)) 168 | one = [] 169 | continue 170 | one = [] 171 | 172 | return [phrase for phrase in keyphrases 173 | if self.text.count(phrase) >= min_occur_num] 174 | 175 | 176 | if __name__ == '__main__': 177 | import codecs 178 | text = codecs.open('../text/02.txt', 'r', 'utf-8').read() 179 | 180 | # text = "坏人" 181 | tr4w = TextRank4Keyword(stop_words_file='../stopword.data') 182 | tr4w.train(text=text, speech_tag_filter=True, lower=True, window=2) 183 | 184 | for word in tr4w.get_keywords(10, word_min_len=2): 185 | print word 186 | 187 | print '---' 188 | 189 | for phrase in tr4w.get_keyphrases(keywords_num=20, min_occur_num= 2): 190 | print phrase 191 | 192 | 193 | 194 | -------------------------------------------------------------------------------- /LDA/stopword.txt: -------------------------------------------------------------------------------- 1 | , 2 | ? 3 | 、 4 | 。 5 | “ 6 | ” 7 | 《 8 | 》 9 | ! 10 | , 11 | : 12 | ; 13 | ? 14 | 人民 15 | 末##末 16 | 啊 17 | 阿 18 | 哎 19 | 哎呀 20 | 哎哟 21 | 唉 22 | 俺 23 | 俺们 24 | 按 25 | 按照 26 | 吧 27 | 吧哒 28 | 把 29 | 罢了 30 | 被 31 | 本 32 | 本着 33 | 比 34 | 比方 35 | 比如 36 | 鄙人 37 | 彼 38 | 彼此 39 | 边 40 | 别 41 | 别的 42 | 别说 43 | 并 44 | 并且 45 | 不比 46 | 不成 47 | 不单 48 | 不但 49 | 不独 50 | 不管 51 | 不光 52 | 不过 53 | 不仅 54 | 不拘 55 | 不论 56 | 不怕 57 | 不然 58 | 不如 59 | 不特 60 | 不惟 61 | 不问 62 | 不只 63 | 朝 64 | 朝着 65 | 趁 66 | 趁着 67 | 乘 68 | 冲 69 | 除 70 | 除此之外 71 | 除非 72 | 除了 73 | 此 74 | 此间 75 | 此外 76 | 从 77 | 从而 78 | 打 79 | 待 80 | 但 81 | 但是 82 | 当 83 | 当着 84 | 到 85 | 得 86 | 的 87 | 的话 88 | 等 89 | 等等 90 | 地 91 | 第 92 | 叮咚 93 | 对 94 | 对于 95 | 多 96 | 多少 97 | 而 98 | 而况 99 | 而且 100 | 而是 101 | 而外 102 | 而言 103 | 而已 104 | 尔后 105 | 反过来 106 | 反过来说 107 | 反之 108 | 非但 109 | 非徒 110 | 否则 111 | 嘎 112 | 嘎登 113 | 该 114 | 赶 115 | 个 116 | 各 117 | 各个 118 | 各位 119 | 各种 120 | 各自 121 | 给 122 | 根据 123 | 跟 124 | 故 125 | 故此 126 | 固然 127 | 关于 128 | 管 129 | 归 130 | 果然 131 | 果真 132 | 过 133 | 哈 134 | 哈哈 135 | 呵 136 | 和 137 | 何 138 | 何处 139 | 何况 140 | 何时 141 | 嘿 142 | 哼 143 | 哼唷 144 | 呼哧 145 | 乎 146 | 哗 147 | 还是 148 | 还有 149 | 换句话说 150 | 换言之 151 | 或 152 | 或是 153 | 或者 154 | 极了 155 | 及 156 | 及其 157 | 及至 158 | 即 159 | 即便 160 | 即或 161 | 即令 162 | 即若 163 | 即使 164 | 几 165 | 几时 166 | 己 167 | 既 168 | 既然 169 | 既是 170 | 继而 171 | 加之 172 | 假如 173 | 假若 174 | 假使 175 | 鉴于 176 | 将 177 | 较 178 | 较之 179 | 叫 180 | 接着 181 | 结果 182 | 借 183 | 紧接着 184 | 进而 185 | 尽 186 | 尽管 187 | 经 188 | 经过 189 | 就 190 | 就是 191 | 就是说 192 | 据 193 | 具体地说 194 | 具体说来 195 | 开始 196 | 开外 197 | 靠 198 | 咳 199 | 可 200 | 可见 201 | 可是 202 | 可以 203 | 况且 204 | 啦 205 | 来 206 | 来着 207 | 离 208 | 例如 209 | 哩 210 | 连 211 | 连同 212 | 两者 213 | 了 214 | 临 215 | 另 216 | 另外 217 | 另一方面 218 | 论 219 | 嘛 220 | 吗 221 | 慢说 222 | 漫说 223 | 冒 224 | 么 225 | 每 226 | 每当 227 | 们 228 | 莫若 229 | 某 230 | 某个 231 | 某些 232 | 拿 233 | 哪 234 | 哪边 235 | 哪儿 236 | 哪个 237 | 哪里 238 | 哪年 239 | 哪怕 240 | 哪天 241 | 哪些 242 | 哪样 243 | 那 244 | 那边 245 | 那儿 246 | 那个 247 | 那会儿 248 | 那里 249 | 那么 250 | 那么些 251 | 那么样 252 | 那时 253 | 那些 254 | 那样 255 | 乃 256 | 乃至 257 | 呢 258 | 能 259 | 你 260 | 你们 261 | 您 262 | 宁 263 | 宁可 264 | 宁肯 265 | 宁愿 266 | 哦 267 | 呕 268 | 啪达 269 | 旁人 270 | 呸 271 | 凭 272 | 凭借 273 | 其 274 | 其次 275 | 其二 276 | 其他 277 | 其它 278 | 其一 279 | 其余 280 | 其中 281 | 起 282 | 起见 283 | 岂但 284 | 恰恰相反 285 | 前后 286 | 前者 287 | 且 288 | 然而 289 | 然后 290 | 然则 291 | 让 292 | 人家 293 | 任 294 | 任何 295 | 任凭 296 | 如 297 | 如此 298 | 如果 299 | 如何 300 | 如其 301 | 如若 302 | 如上所述 303 | 若 304 | 若非 305 | 若是 306 | 啥 307 | 上下 308 | 尚且 309 | 设若 310 | 设使 311 | 甚而 312 | 甚么 313 | 甚至 314 | 省得 315 | 时候 316 | 什么 317 | 什么样 318 | 使得 319 | 是 320 | 是的 321 | 首先 322 | 谁 323 | 谁知 324 | 顺 325 | 顺着 326 | 似的 327 | 虽 328 | 虽然 329 | 虽说 330 | 虽则 331 | 随 332 | 随着 333 | 所 334 | 所以 335 | 他 336 | 他们 337 | 他人 338 | 它 339 | 它们 340 | 她 341 | 她们 342 | 倘 343 | 倘或 344 | 倘然 345 | 倘若 346 | 倘使 347 | 腾 348 | 替 349 | 通过 350 | 同 351 | 同时 352 | 哇 353 | 万一 354 | 往 355 | 望 356 | 为 357 | 为何 358 | 为了 359 | 为什么 360 | 为着 361 | 喂 362 | 嗡嗡 363 | 我 364 | 我们 365 | 呜 366 | 呜呼 367 | 乌乎 368 | 无论 369 | 无宁 370 | 毋宁 371 | 嘻 372 | 吓 373 | 相对而言 374 | 像 375 | 向 376 | 向着 377 | 嘘 378 | 呀 379 | 焉 380 | 沿 381 | 沿着 382 | 要 383 | 要不 384 | 要不然 385 | 要不是 386 | 要么 387 | 要是 388 | 也 389 | 也罢 390 | 也好 391 | 一 392 | 一般 393 | 一旦 394 | 一方面 395 | 一来 396 | 一切 397 | 一样 398 | 一则 399 | 依 400 | 依照 401 | 矣 402 | 以 403 | 以便 404 | 以及 405 | 以免 406 | 以至 407 | 以至于 408 | 以致 409 | 抑或 410 | 因 411 | 因此 412 | 因而 413 | 因为 414 | 哟 415 | 用 416 | 由 417 | 由此可见 418 | 由于 419 | 有 420 | 有的 421 | 有关 422 | 有些 423 | 又 424 | 于 425 | 于是 426 | 于是乎 427 | 与 428 | 与此同时 429 | 与否 430 | 与其 431 | 越是 432 | 云云 433 | 哉 434 | 再说 435 | 再者 436 | 在 437 | 在下 438 | 咱 439 | 咱们 440 | 则 441 | 怎 442 | 怎么 443 | 怎么办 444 | 怎么样 445 | 怎样 446 | 咋 447 | 照 448 | 照着 449 | 者 450 | 这 451 | 这边 452 | 这儿 453 | 这个 454 | 这会儿 455 | 这就是说 456 | 这里 457 | 这么 458 | 这么点儿 459 | 这么些 460 | 这么样 461 | 这时 462 | 这些 463 | 这样 464 | 正如 465 | 吱 466 | 之 467 | 之类 468 | 之所以 469 | 之一 470 | 只是 471 | 只限 472 | 只要 473 | 只有 474 | 至 475 | 至于 476 | 诸位 477 | 着 478 | 着呢 479 | 自 480 | 自从 481 | 自个儿 482 | 自各儿 483 | 自己 484 | 自家 485 | 自身 486 | 综上所述 487 | 总的来看 488 | 总的来说 489 | 总的说来 490 | 总而言之 491 | 总之 492 | 纵 493 | 纵令 494 | 纵然 495 | 纵使 496 | 遵照 497 | 作为 498 | 兮 499 | 呃 500 | 呗 501 | 咚 502 | 咦 503 | 喏 504 | 啐 505 | 喔唷 506 | 嗬 507 | 嗯 508 | 嗳 509 | ~ 510 | ! 511 | . 512 | : 513 | " 514 | ' 515 | ( 516 | ) 517 | * 518 | A 519 | 白 520 | 社会主义 521 | -- 522 | .. 523 | >> 524 | [ 525 | ] 526 | 527 | < 528 | > 529 | / 530 | \ 531 | | 532 | - 533 | _ 534 | + 535 | = 536 | & 537 | ^ 538 | % 539 | # 540 | @ 541 | ` 542 | ; 543 | $ 544 | ( 545 | ) 546 | —— 547 | — 548 | ¥ 549 | · 550 | ... 551 | ‘ 552 | ’ 553 | 〉 554 | 〈 555 | … 556 |   557 | 0 558 | 1 559 | 2 560 | 3 561 | 4 562 | 5 563 | 6 564 | 7 565 | 8 566 | 9 567 | 0 568 | 1 569 | 2 570 | 3 571 | 4 572 | 5 573 | 6 574 | 7 575 | 8 576 | 9 577 | 二 578 | 三 579 | 四 580 | 五 581 | 六 582 | 七 583 | 八 584 | 九 585 | 零 586 | > 587 | < 588 | @ 589 | # 590 | $ 591 | % 592 | ︿ 593 | & 594 | * 595 | + 596 | ~ 597 | | 598 | [ 599 | ] 600 | { 601 | } 602 | 啊哈 603 | 啊呀 604 | 啊哟 605 | 挨次 606 | 挨个 607 | 挨家挨户 608 | 挨门挨户 609 | 挨门逐户 610 | 挨着 611 | 按理 612 | 按期 613 | 按时 614 | 按说 615 | 暗地里 616 | 暗中 617 | 暗自 618 | 昂然 619 | 八成 620 | 白白 621 | 半 622 | 梆 623 | 保管 624 | 保险 625 | 饱 626 | 背地里 627 | 背靠背 628 | 倍感 629 | 倍加 630 | 本人 631 | 本身 632 | 甭 633 | 比起 634 | 比如说 635 | 比照 636 | 毕竟 637 | 必 638 | 必定 639 | 必将 640 | 必须 641 | 便 642 | 别人 643 | 并非 644 | 并肩 645 | 并没 646 | 并没有 647 | 并排 648 | 并无 649 | 勃然 650 | 不 651 | 不必 652 | 不常 653 | 不大 654 | 不但...而且 655 | 不得 656 | 不得不 657 | 不得了 658 | 不得已 659 | 不迭 660 | 不定 661 | 不对 662 | 不妨 663 | 不管怎样 664 | 不会 665 | 不仅...而且 666 | 不仅仅 667 | 不仅仅是 668 | 不经意 669 | 不可开交 670 | 不可抗拒 671 | 不力 672 | 不了 673 | 不料 674 | 不满 675 | 不免 676 | 不能不 677 | 不起 678 | 不巧 679 | 不然的话 680 | 不日 681 | 不少 682 | 不胜 683 | 不时 684 | 不是 685 | 不同 686 | 不能 687 | 不要 688 | 不外 689 | 不外乎 690 | 不下 691 | 不限 692 | 不消 693 | 不已 694 | 不亦乐乎 695 | 不由得 696 | 不再 697 | 不择手段 698 | 不怎么 699 | 不曾 700 | 不知不觉 701 | 不止 702 | 不止一次 703 | 不至于 704 | 才 705 | 才能 706 | 策略地 707 | 差不多 708 | 差一点 709 | 常 710 | 常常 711 | 常言道 712 | 常言说 713 | 常言说得好 714 | 长此下去 715 | 长话短说 716 | 长期以来 717 | 长线 718 | 敞开儿 719 | 彻夜 720 | 陈年 721 | 趁便 722 | 趁机 723 | 趁热 724 | 趁势 725 | 趁早 726 | 成年 727 | 成年累月 728 | 成心 729 | 乘机 730 | 乘胜 731 | 乘势 732 | 乘隙 733 | 乘虚 734 | 诚然 735 | 迟早 736 | 充分 737 | 充其极 738 | 充其量 739 | 抽冷子 740 | 臭 741 | 初 742 | 出 743 | 出来 744 | 出去 745 | 除此 746 | 除此而外 747 | 除此以外 748 | 除开 749 | 除去 750 | 除却 751 | 除外 752 | 处处 753 | 川流不息 754 | 传 755 | 传说 756 | 传闻 757 | 串行 758 | 纯 759 | 纯粹 760 | 此后 761 | 此中 762 | 次第 763 | 匆匆 764 | 从不 765 | 从此 766 | 从此以后 767 | 从古到今 768 | 从古至今 769 | 从今以后 770 | 从宽 771 | 从来 772 | 从轻 773 | 从速 774 | 从头 775 | 从未 776 | 从无到有 777 | 从小 778 | 从新 779 | 从严 780 | 从优 781 | 从早到晚 782 | 从中 783 | 从重 784 | 凑巧 785 | 粗 786 | 存心 787 | 达旦 788 | 打从 789 | 打开天窗说亮话 790 | 大 791 | 大不了 792 | 大大 793 | 大抵 794 | 大都 795 | 大多 796 | 大凡 797 | 大概 798 | 大家 799 | 大举 800 | 大略 801 | 大面儿上 802 | 大事 803 | 大体 804 | 大体上 805 | 大约 806 | 大张旗鼓 807 | 大致 808 | 呆呆地 809 | 带 810 | 殆 811 | 待到 812 | 单 813 | 单纯 814 | 单单 815 | 但愿 816 | 弹指之间 817 | 当场 818 | 当儿 819 | 当即 820 | 当口儿 821 | 当然 822 | 当庭 823 | 当头 824 | 当下 825 | 当真 826 | 当中 827 | 倒不如 828 | 倒不如说 829 | 倒是 830 | 到处 831 | 到底 832 | 到了儿 833 | 到目前为止 834 | 到头 835 | 到头来 836 | 得起 837 | 得天独厚 838 | 的确 839 | 等到 840 | 叮当 841 | 顶多 842 | 定 843 | 动不动 844 | 动辄 845 | 陡然 846 | 都 847 | 独 848 | 独自 849 | 断然 850 | 顿时 851 | 多次 852 | 多多 853 | 多多少少 854 | 多多益善 855 | 多亏 856 | 多年来 857 | 多年前 858 | 而后 859 | 而论 860 | 而又 861 | 尔等 862 | 二话不说 863 | 二话没说 864 | 反倒 865 | 反倒是 866 | 反而 867 | 反手 868 | 反之亦然 869 | 反之则 870 | 方 871 | 方才 872 | 方能 873 | 放量 874 | 非常 875 | 非得 876 | 分期 877 | 分期分批 878 | 分头 879 | 奋勇 880 | 愤然 881 | 风雨无阻 882 | 逢 883 | 弗 884 | 甫 885 | 嘎嘎 886 | 该当 887 | 概 888 | 赶快 889 | 赶早不赶晚 890 | 敢 891 | 敢情 892 | 敢于 893 | 刚 894 | 刚才 895 | 刚好 896 | 刚巧 897 | 高低 898 | 格外 899 | 隔日 900 | 隔夜 901 | 个人 902 | 各式 903 | 更 904 | 更加 905 | 更进一步 906 | 更为 907 | 公然 908 | 共 909 | 共总 910 | 够瞧的 911 | 姑且 912 | 古来 913 | 故而 914 | 故意 915 | 固 916 | 怪 917 | 怪不得 918 | 惯常 919 | 光 920 | 光是 921 | 归根到底 922 | 归根结底 923 | 过于 924 | 毫不 925 | 毫无 926 | 毫无保留地 927 | 毫无例外 928 | 好在 929 | 何必 930 | 何尝 931 | 何妨 932 | 何苦 933 | 何乐而不为 934 | 何须 935 | 何止 936 | 很 937 | 很多 938 | 很少 939 | 轰然 940 | 后来 941 | 呼啦 942 | 忽地 943 | 忽然 944 | 互 945 | 互相 946 | 哗啦 947 | 话说 948 | 还 949 | 恍然 950 | 会 951 | 豁然 952 | 活 953 | 伙同 954 | 或多或少 955 | 或许 956 | 基本 957 | 基本上 958 | 基于 959 | 极 960 | 极大 961 | 极度 962 | 极端 963 | 极力 964 | 极其 965 | 极为 966 | 急匆匆 967 | 即将 968 | 即刻 969 | 即是说 970 | 几度 971 | 几番 972 | 几乎 973 | 几经 974 | 既...又 975 | 继之 976 | 加上 977 | 加以 978 | 间或 979 | 简而言之 980 | 简言之 981 | 简直 982 | 见 983 | 将才 984 | 将近 985 | 将要 986 | 交口 987 | 较比 988 | 较为 989 | 接连不断 990 | 接下来 991 | 皆可 992 | 截然 993 | 截至 994 | 藉以 995 | 借此 996 | 借以 997 | 届时 998 | 仅 999 | 仅仅 1000 | 谨 1001 | 进来 1002 | 进去 1003 | 近 1004 | 近几年来 1005 | 近来 1006 | 近年来 1007 | 尽管如此 1008 | 尽可能 1009 | 尽快 1010 | 尽量 1011 | 尽然 1012 | 尽如人意 1013 | 尽心竭力 1014 | 尽心尽力 1015 | 尽早 1016 | 精光 1017 | 经常 1018 | 竟 1019 | 竟然 1020 | 究竟 1021 | 就此 1022 | 就地 1023 | 就算 1024 | 居然 1025 | 局外 1026 | 举凡 1027 | 据称 1028 | 据此 1029 | 据实 1030 | 据说 1031 | 据我所知 1032 | 据悉 1033 | 具体来说 1034 | 决不 1035 | 决非 1036 | 绝 1037 | 绝不 1038 | 绝顶 1039 | 绝对 1040 | 绝非 1041 | 均 1042 | 喀 1043 | 看 1044 | 看来 1045 | 看起来 1046 | 看上去 1047 | 看样子 1048 | 可好 1049 | 可能 1050 | 恐怕 1051 | 快 1052 | 快要 1053 | 来不及 1054 | 来得及 1055 | 来讲 1056 | 来看 1057 | 拦腰 1058 | 牢牢 1059 | 老 1060 | 老大 1061 | 老老实实 1062 | 老是 1063 | 累次 1064 | 累年 1065 | 理当 1066 | 理该 1067 | 理应 1068 | 历 1069 | 立 1070 | 立地 1071 | 立刻 1072 | 立马 1073 | 立时 1074 | 联袂 1075 | 连连 1076 | 连日 1077 | 连日来 1078 | 连声 1079 | 连袂 1080 | 临到 1081 | 另方面 1082 | 另行 1083 | 另一个 1084 | 路经 1085 | 屡 1086 | 屡次 1087 | 屡次三番 1088 | 屡屡 1089 | 缕缕 1090 | 率尔 1091 | 率然 1092 | 略 1093 | 略加 1094 | 略微 1095 | 略为 1096 | 论说 1097 | 马上 1098 | 蛮 1099 | 满 1100 | 没 1101 | 没有 1102 | 每逢 1103 | 每每 1104 | 每时每刻 1105 | 猛然 1106 | 猛然间 1107 | 莫 1108 | 莫不 1109 | 莫非 1110 | 莫如 1111 | 默默地 1112 | 默然 1113 | 呐 1114 | 那末 1115 | 奈 1116 | 难道 1117 | 难得 1118 | 难怪 1119 | 难说 1120 | 内 1121 | 年复一年 1122 | 凝神 1123 | 偶而 1124 | 偶尔 1125 | 怕 1126 | 砰 1127 | 碰巧 1128 | 譬如 1129 | 偏偏 1130 | 乒 1131 | 平素 1132 | 颇 1133 | 迫于 1134 | 扑通 1135 | 其后 1136 | 其实 1137 | 奇 1138 | 齐 1139 | 起初 1140 | 起来 1141 | 起首 1142 | 起头 1143 | 起先 1144 | 岂 1145 | 岂非 1146 | 岂止 1147 | 迄 1148 | 恰逢 1149 | 恰好 1150 | 恰恰 1151 | 恰巧 1152 | 恰如 1153 | 恰似 1154 | 千 1155 | 千万 1156 | 千万千万 1157 | 切 1158 | 切不可 1159 | 切莫 1160 | 切切 1161 | 切勿 1162 | 窃 1163 | 亲口 1164 | 亲身 1165 | 亲手 1166 | 亲眼 1167 | 亲自 1168 | 顷 1169 | 顷刻 1170 | 顷刻间 1171 | 顷刻之间 1172 | 请勿 1173 | 穷年累月 1174 | 取道 1175 | 去 1176 | 权时 1177 | 全都 1178 | 全力 1179 | 全年 1180 | 全然 1181 | 全身心 1182 | 然 1183 | 人人 1184 | 仍 1185 | 仍旧 1186 | 仍然 1187 | 日复一日 1188 | 日见 1189 | 日渐 1190 | 日益 1191 | 日臻 1192 | 如常 1193 | 如此等等 1194 | 如次 1195 | 如今 1196 | 如期 1197 | 如前所述 1198 | 如上 1199 | 如下 1200 | 汝 1201 | 三番两次 1202 | 三番五次 1203 | 三天两头 1204 | 瑟瑟 1205 | 沙沙 1206 | 上 1207 | 上来 1208 | 上去 1209 | aboard 1210 | about 1211 | above 1212 | according 1213 | according to 1214 | across 1215 | afore 1216 | after 1217 | afterwards 1218 | again 1219 | against 1220 | agin 1221 | all 1222 | almost 1223 | alone 1224 | along 1225 | alongside 1226 | already 1227 | also 1228 | although 1229 | always 1230 | am 1231 | amid 1232 | amidst 1233 | among 1234 | amongst 1235 | amoungst 1236 | amount 1237 | an 1238 | and 1239 | anent 1240 | another 1241 | any 1242 | anyhow 1243 | anyone 1244 | anything 1245 | anyway 1246 | anywhere 1247 | approximately 1248 | are 1249 | around 1250 | as 1251 | asked 1252 | aslant 1253 | astride 1254 | at 1255 | athwart 1256 | back 1257 | bar 1258 | be 1259 | became 1260 | because 1261 | because of 1262 | become 1263 | becomes 1264 | becoming 1265 | been 1266 | before 1267 | beforehand 1268 | behind 1269 | being 1270 | below 1271 | beneath 1272 | beside 1273 | besides 1274 | between 1275 | betwixt 1276 | beyond 1277 | bill 1278 | both 1279 | bottom 1280 | but 1281 | by 1282 | call 1283 | called 1284 | can 1285 | cannot 1286 | cant 1287 | circa 1288 | co 1289 | computer 1290 | con 1291 | could 1292 | couldnt 1293 | cry 1294 | currently 1295 | dare 1296 | de 1297 | describe 1298 | despite 1299 | detail 1300 | did 1301 | do 1302 | does 1303 | done 1304 | down 1305 | dr 1306 | due 1307 | due to 1308 | during 1309 | e.g., 1310 | each 1311 | earlier 1312 | eg 1313 | eight 1314 | either 1315 | eleven 1316 | else 1317 | elsewhere 1318 | empty 1319 | enough 1320 | ere 1321 | etc 1322 | even 1323 | eventually 1324 | ever 1325 | every 1326 | everyone 1327 | everything 1328 | everywhere 1329 | except 1330 | few 1331 | fifteen 1332 | fify 1333 | fill 1334 | find 1335 | fire 1336 | first 1337 | five 1338 | for 1339 | former 1340 | formerly 1341 | forty 1342 | found 1343 | four 1344 | from 1345 | front 1346 | full 1347 | further 1348 | get 1349 | give 1350 | go 1351 | had 1352 | has 1353 | hasnt 1354 | have 1355 | he 1356 | hence 1357 | her 1358 | here 1359 | hereafter 1360 | hereby 1361 | herein 1362 | hereupon 1363 | hers 1364 | herself 1365 | him 1366 | himself 1367 | his 1368 | how 1369 | however 1370 | hundred 1371 | i 1372 | ie 1373 | if 1374 | in 1375 | inc 1376 | indeed 1377 | inside 1378 | instead 1379 | interest 1380 | into 1381 | is 1382 | it 1383 | its 1384 | itself 1385 | just 1386 | keep 1387 | last 1388 | latter 1389 | latterly 1390 | least 1391 | less 1392 | like 1393 | ltd 1394 | made 1395 | major 1396 | many 1397 | may 1398 | maybe 1399 | me 1400 | meanwhile 1401 | mid 1402 | midst 1403 | might 1404 | mill 1405 | mine 1406 | minus 1407 | more 1408 | moreover 1409 | most 1410 | mostly 1411 | move 1412 | mr 1413 | mrs 1414 | ms 1415 | much 1416 | must 1417 | my 1418 | myself 1419 | name 1420 | namely 1421 | near 1422 | need 1423 | neither 1424 | net 1425 | never 1426 | nevertheless 1427 | next 1428 | nigh 1429 | nigher 1430 | nighest 1431 | nine 1432 | no 1433 | nobody 1434 | none 1435 | noone 1436 | nor 1437 | not 1438 | nothing 1439 | notwithstanding 1440 | now 1441 | nowhere 1442 | of 1443 | off 1444 | often 1445 | on 1446 | on to 1447 | once 1448 | one 1449 | only 1450 | onto 1451 | or 1452 | other 1453 | others 1454 | otherwise 1455 | ought 1456 | our 1457 | ours 1458 | ourselves 1459 | out 1460 | out of 1461 | outside 1462 | over 1463 | own 1464 | part 1465 | partly 1466 | past 1467 | pending 1468 | per 1469 | perhaps 1470 | please 1471 | plus 1472 | prior 1473 | put 1474 | qua 1475 | rather 1476 | re 1477 | regarding 1478 | round 1479 | same 1480 | sans 1481 | save 1482 | see 1483 | seem 1484 | seemed 1485 | seeming 1486 | seems 1487 | separately 1488 | serious 1489 | seven 1490 | several 1491 | shall 1492 | she 1493 | should 1494 | show 1495 | side 1496 | similarly 1497 | since 1498 | sincere 1499 | six 1500 | sixty 1501 | so 1502 | some 1503 | somehow 1504 | someone 1505 | something 1506 | sometime 1507 | sometimes 1508 | somewhere 1509 | still 1510 | such 1511 | system 1512 | take 1513 | ten 1514 | than 1515 | that 1516 | the 1517 | their 1518 | theirs 1519 | them 1520 | themselves 1521 | then 1522 | thence 1523 | there 1524 | thereafter 1525 | thereby 1526 | therefore 1527 | therein 1528 | thereupon 1529 | these 1530 | they 1531 | thick 1532 | thin 1533 | third 1534 | this 1535 | those 1536 | though 1537 | three 1538 | through 1539 | throughout 1540 | thru 1541 | thus 1542 | till 1543 | to 1544 | together 1545 | too 1546 | top 1547 | toward 1548 | towards 1549 | twelve 1550 | twenty 1551 | two 1552 | un 1553 | under 1554 | underneath 1555 | unless 1556 | unlike 1557 | until 1558 | unto 1559 | up 1560 | upon 1561 | us 1562 | versus 1563 | very 1564 | via 1565 | vice 1566 | volume 1567 | was 1568 | we 1569 | well 1570 | were 1571 | what 1572 | whatever 1573 | whats 1574 | when 1575 | whence 1576 | whenever 1577 | where 1578 | whereafter 1579 | whereas 1580 | whereby 1581 | wherein 1582 | whereupon 1583 | wherever 1584 | whether 1585 | which 1586 | while 1587 | whither 1588 | who 1589 | whoever 1590 | whole 1591 | whom 1592 | whose 1593 | why 1594 | will 1595 | with 1596 | within 1597 | without 1598 | would 1599 | yesterday 1600 | yet 1601 | you 1602 | your 1603 | yours 1604 | yourself 1605 | yourselves 1606 | { 1607 | } 1608 | ¡ 1609 | ¦ 1610 | « 1611 | ­ 1612 | ¯ 1613 | ´ 1614 | ¸ 1615 | » 1616 | ¿ 1617 | ˇ 1618 | ˉ 1619 | ˊ 1620 | ˋ 1621 | ˜ 1622 | ‐ 1623 | —  1624 | ― 1625 | ‖ 1626 | • 1627 | ‹ 1628 | › 1629 | ∕ 1630 | 「 1631 | 」 1632 | 『 1633 | 』 1634 | 【 1635 | 】 1636 | 〔 1637 | 〕 1638 | 〖 1639 | 〗 1640 | 〝 1641 | 〞 1642 | 一些 1643 | 一何 1644 | 一转眼 1645 | 下 1646 | 不尽 1647 | 不尽然 1648 | 不若 1649 | 与其说 1650 | 且不说 1651 | 且说 1652 | 个别 1653 | 为止 1654 | 为此 1655 | 乃至于 1656 | 二来 1657 | 云尔 1658 | 些 1659 | 亦 1660 | 人 1661 | 人们 1662 | 今 1663 | 介于 1664 | 以上 1665 | 以为 1666 | 以故 1667 | 以期 1668 | 以来 1669 | 但凡 1670 | 何以 1671 | 余外 1672 | 使 1673 | 依据 1674 | 便于 1675 | 傥然 1676 | 儿 1677 | 先不先 1678 | 全体 1679 | 全部 1680 | 兼之 1681 | 再其次 1682 | 再则 1683 | 再有 1684 | 再者说 1685 | 凡 1686 | 凡是 1687 | 出于 1688 | 分别 1689 | 则甚 1690 | 别处 1691 | 别是 1692 | 别管 1693 | 前此 1694 | 即如 1695 | 却 1696 | 又及 1697 | 受到 1698 | 另悉 1699 | 只 1700 | 只当 1701 | 只怕 1702 | 只消 1703 | 后 1704 | 后者 1705 | 向使 1706 | 呵呵 1707 | 咧 1708 | 唯有 1709 | 啷当 1710 | 喽 1711 | 嗡 1712 | 嘿嘿 1713 | 因了 1714 | 因着 1715 | 在于 1716 | 处在 1717 | 多么 1718 | 好 1719 | 如同 1720 | 如是 1721 | 始而 1722 | 孰料 1723 | 孰知 1724 | 对待 1725 | 对方 1726 | 对比 1727 | 小 1728 | 尔 1729 | 尔尔 1730 | 就是了 1731 | 就要 1732 | 已 1733 | 已矣 1734 | 巴 1735 | 巴巴 1736 | 庶乎 1737 | 庶几 1738 | 归齐 1739 | 当地 1740 | 彼时 1741 | 得了 1742 | 怎奈 1743 | 惟其 1744 | 或则 1745 | 或曰 1746 | 所在 1747 | 所幸 1748 | 所有 1749 | 无 1750 | 既往 1751 | 是以 1752 | 曾 1753 | 替代 1754 | 最 1755 | 有及 1756 | 有时 1757 | 本地 1758 | 来自 1759 | 来说 1760 | 某某 1761 | 欤 1762 | 正值 1763 | 正巧 1764 | 正是 1765 | 此地 1766 | 此处 1767 | 此时 1768 | 此次 1769 | 比及 1770 | 没奈何 1771 | 犹且 1772 | 犹自 1773 | 甚且 1774 | 甚或 1775 | 甚至于 1776 | 用来 1777 | 由是 1778 | 由此 1779 | 直到 1780 | 眨眼 1781 | 矣乎 1782 | 矣哉 1783 | 竟而 1784 | 类如 1785 | 继后 1786 | 能否 1787 | 自后 1788 | 自打 1789 | 至今 1790 | 至若 1791 | 致 1792 | 般的 1793 | 若夫 1794 | 若果 1795 | 莫不然 1796 | 譬喻 1797 | 许多 1798 | 设或 1799 | 诚如 1800 | 说来 1801 | 诸 1802 | 诸如 1803 | 谁人 1804 | 谁料 1805 | 贼死 1806 | 赖以 1807 | 距 1808 | 还要 1809 | 这一来 1810 | 这次 1811 | 这般 1812 | 逐步 1813 | 遵循 1814 | 那般 1815 | 针对 1816 | 随后 1817 | 随时 1818 | 难道说 1819 | 非特 1820 | 非独 1821 | ︰ 1822 | ︳ 1823 | ︴ 1824 | ︵ 1825 | ︶ 1826 | ︷ 1827 | ︸ 1828 | ︹ 1829 | ︺ 1830 | ︻ 1831 | ︼ 1832 | ︽ 1833 | ︾ 1834 | ﹀ 1835 | ﹁ 1836 | ﹂ 1837 | ﹃ 1838 | ﹄ 1839 | ﹉ 1840 | ﹊ 1841 | ﹋ 1842 | ﹌ 1843 | ﹍ 1844 | ﹎ 1845 | ﹏ 1846 | ﹐ 1847 | ﹑ 1848 | ﹔ 1849 | ﹕ 1850 | ﹖ 1851 | ﹝ 1852 | ﹞ 1853 | ﹟ 1854 | ﹠ 1855 | ﹡ 1856 | ﹢ 1857 | ﹤ 1858 | ﹦ 1859 | ﹨ 1860 | ﹩ 1861 | ﹪ 1862 | ﹫ 1863 | " 1864 | ' 1865 | _ 1866 |  ̄ 1867 |   1868 | ! 1869 | , 1870 | ...... 1871 | ................... 1872 | ./ 1873 | .一 1874 | .数 1875 | .日 1876 | // 1877 | :// 1878 | :: 1879 | Lex 1880 | [ 1881 | ] 1882 | exp 1883 | sub 1884 | sup 1885 | ~~~~ 1886 | × 1887 | ××× 1888 | Δ 1889 | Ψ 1890 | γ 1891 | μ 1892 | φ 1893 | φ. 1894 | В 1895 | ——— 1896 | ’‘ 1897 | ”, 1898 | …… 1899 | …………………………………………………③ 1900 | ′∈ 1901 | ′| 1902 | ℃ 1903 | Ⅲ 1904 | ↑ 1905 | → 1906 | ∈[ 1907 | ∪φ∈ 1908 | ≈ 1909 | ① 1910 | ② 1911 | ②c 1912 | ③ 1913 | ③] 1914 | ④ 1915 | ⑤ 1916 | ⑥ 1917 | ⑦ 1918 | ⑧ 1919 | ⑨ 1920 | ⑩ 1921 | ── 1922 | ■ 1923 | ▲ 1924 | 》), 1925 | 〕〔 1926 | ㈧ 1927 | 一. 1928 | 一一 1929 | 一下 1930 | 一个 1931 | 一则通过 1932 | 一天 1933 | 一定 1934 | 一时 1935 | 一次 1936 | 一片 1937 | 一番 1938 | 一直 1939 | 一致 1940 | 一起 1941 | 一边 1942 | 一面 1943 | 上升 1944 | 上述 1945 | 上面 1946 | 下列 1947 | 下去 1948 | 下来 1949 | 下面 1950 | 不一 1951 | 不久 1952 | 不变 1953 | 不可 1954 | 不够 1955 | 不敢 1956 | 不断 1957 | 不足 1958 | 专门 1959 | 严格 1960 | 严重 1961 | 中小 1962 | 中间 1963 | 丰富 1964 | 为主 1965 | 为什麽 1966 | 主张 1967 | 主要 1968 | 举行 1969 | 之前 1970 | 之后 1971 | 之後 1972 | 也就是说 1973 | 也是 1974 | 了解 1975 | 争取 1976 | 产生 1977 | 什麽 1978 | 今后 1979 | 今天 1980 | 今年 1981 | 今後 1982 | 从事 1983 | 他是 1984 | 他的 1985 | 代替 1986 | 以下 1987 | 以前 1988 | 以后 1989 | 以外 1990 | 以後 1991 | 任务 1992 | 企图 1993 | 伟大 1994 | 似乎 1995 | 你是 1996 | 你的 1997 | 使用 1998 | 依靠 1999 | 促进 2000 | 保持 2001 | 做到 2002 | 允许 2003 | 元/吨 2004 | 先后 2005 | 先後 2006 | 先生 2007 | 全面 2008 | 共同 2009 | 具体 2010 | 具有 2011 | 再 2012 | 再次 2013 | 决定 2014 | 准备 2015 | 出现 2016 | 前进 2017 | 前面 2018 | 加入 2019 | 加强 2020 | 十分 2021 | 却不 2022 | 原来 2023 | 及时 2024 | 双方 2025 | 反应 2026 | 反映 2027 | 取得 2028 | 变成 2029 | 叫做 2030 | 召开 2031 | 各人 2032 | 各地 2033 | 各级 2034 | 合理 2035 | 同一 2036 | 同样 2037 | 后面 2038 | 周围 2039 | 坚决 2040 | 坚持 2041 | 处理 2042 | 复杂 2043 | 多数 2044 | 大力 2045 | 大多数 2046 | 大批 2047 | 大量 2048 | 失去 2049 | 她是 2050 | 她的 2051 | 好的 2052 | 好象 2053 | 存在 2054 | 它们的 2055 | 它是 2056 | 它的 2057 | 安全 2058 | 完全 2059 | 完成 2060 | 实现 2061 | 实际 2062 | 宣布 2063 | 容易 2064 | 密切 2065 | 对应 2066 | 少数 2067 | 尤其 2068 | 属于 2069 | 左右 2070 | 巨大 2071 | 巩固 2072 | 已经 2073 | 帮助 2074 | 并不 2075 | 并不是 2076 | 广大 2077 | 广泛 2078 | 应当 2079 | 应用 2080 | 应该 2081 | 开展 2082 | 引起 2083 | 强烈 2084 | 强调 2085 | 当前 2086 | 当时 2087 | 形成 2088 | 彻底 2089 | 往往 2090 | 後来 2091 | 後面 2092 | 得出 2093 | 得到 2094 | 心里 2095 | 必然 2096 | 必要 2097 | 怎麽 2098 | 总是 2099 | 总结 2100 | 您们 2101 | 您是 2102 | 意思 2103 | 愿意 2104 | 成为 2105 | 我是 2106 | 我的 2107 | 战斗 2108 | 所谓 2109 | 扩大 2110 | 掌握 2111 | 接著 2112 | 数/ 2113 | 整个 2114 | 方便 2115 | 方面 2116 | 无法 2117 | 明显 2118 | 明确 2119 | 是不是 2120 | 是否 2121 | 显然 2122 | 显著 2123 | 普通 2124 | 普遍 2125 | 曾经 2126 | 最后 2127 | 最大 2128 | 最好 2129 | 最後 2130 | 最近 2131 | 最高 2132 | 有利 2133 | 有力 2134 | 有所 2135 | 有效 2136 | 有点 2137 | 有的是 2138 | 有着 2139 | 有著 2140 | 构成 2141 | 根本 2142 | 欢迎 2143 | 正在 2144 | 正常 2145 | 每个 2146 | 每天 2147 | 每年 2148 | 比较 2149 | 注意 2150 | 深入 2151 | 清楚 2152 | 满足 2153 | 然後 2154 | 特别是 2155 | 特殊 2156 | 特点 2157 | 现代 2158 | 现在 2159 | 目前 2160 | 直接 2161 | 相似 2162 | 相信 2163 | 相反 2164 | 相同 2165 | 相对 2166 | 相应 2167 | 相当 2168 | 相等 2169 | 看出 2170 | 看到 2171 | 看看 2172 | 看见 2173 | 真是 2174 | 真正 2175 | 知道 2176 | 确定 2177 | 种 2178 | 积极 2179 | 移动 2180 | 突出 2181 | 突然 2182 | 立即 2183 | 第二 2184 | 练习 2185 | 组成 2186 | 结合 2187 | 继续 2188 | 维持 2189 | 考虑 2190 | 联系 2191 | 能够 2192 | 良好 2193 | 若果 2194 | 范围 2195 | 获得 2196 | 行为 2197 | 行动 2198 | 表明 2199 | 表示 2200 | 要求 2201 | 规定 2202 | 觉得 2203 | 认为 2204 | 认真 2205 | 认识 2206 | 说明 2207 | 说说 2208 | 转动 2209 | 转变 2210 | 转贴 2211 | 达到 2212 | 迅速 2213 | 过去 2214 | 过来 2215 | 运用 2216 | 这点 2217 | 这种 2218 | 这麽 2219 | 进入 2220 | 进步 2221 | 进行 2222 | 适应 2223 | 适当 2224 | 适用 2225 | 逐渐 2226 | 通常 2227 | 造成 2228 | 遇到 2229 | 遭到 2230 | 避免 2231 | 那麽 2232 | 部分 2233 | 采取 2234 | 里面 2235 | 重大 2236 | 重新 2237 | 重要 2238 | 问题 2239 | 防止 2240 | 附近 2241 | 限制 2242 | 随著 2243 | 集中 2244 | 需要 2245 | 高兴 2246 | )÷(1- 2247 | )、 2248 | +ξ 2249 | ++ 2250 | ,也 2251 | - 2252 | -β 2253 | -- 2254 | -[*]- 2255 | . 2256 | / 2257 | 0:2 2258 | 1. 2259 | 12% 2260 | 2.3% 2261 | 5:0 2262 | <± 2263 | <Δ 2264 | <λ 2265 | <φ 2266 | << 2267 | = 2268 | =″ 2269 | =☆ 2270 | =( 2271 | =- 2272 | =[ 2273 | ={ 2274 | >λ 2275 | A 2276 | LI 2277 | R.L. 2278 | ZXFITL 2279 | [①①] 2280 | [①②] 2281 | [①③] 2282 | [①④] 2283 | [①⑤] 2284 | [①⑥] 2285 | [①⑦] 2286 | [①⑧] 2287 | [①⑨] 2288 | [①A] 2289 | [①B] 2290 | [①C] 2291 | [①D] 2292 | [①E] 2293 | [①] 2294 | [①a] 2295 | [①c] 2296 | [①d] 2297 | [①e] 2298 | [①f] 2299 | [①g] 2300 | [①h] 2301 | [①i] 2302 | [①o] 2303 | [② 2304 | [②①] 2305 | [②②] 2306 | [②③] 2307 | [②④ 2308 | [②⑤] 2309 | [②⑥] 2310 | [②⑦] 2311 | [②⑧] 2312 | [②⑩] 2313 | [②B] 2314 | [②G] 2315 | [②] 2316 | [②a] 2317 | [②b] 2318 | [②c] 2319 | [②d] 2320 | [②e] 2321 | [②f] 2322 | [②g] 2323 | [②h] 2324 | [②i] 2325 | [②j] 2326 | [③①] 2327 | [③⑩] 2328 | [③F] 2329 | [③] 2330 | [③a] 2331 | [③b] 2332 | [③c] 2333 | [③d] 2334 | [③e] 2335 | [③g] 2336 | [③h] 2337 | [④] 2338 | [④a] 2339 | [④b] 2340 | [④c] 2341 | [④d] 2342 | [④e] 2343 | [⑤] 2344 | [⑤]] 2345 | [⑤a] 2346 | [⑤b] 2347 | [⑤d] 2348 | [⑤e] 2349 | [⑤f] 2350 | [⑥] 2351 | [⑦] 2352 | [⑧] 2353 | [⑨] 2354 | [⑩] 2355 | [*] 2356 | [- 2357 | [] 2358 | ]∧′=[ 2359 | ][ 2360 | a] 2361 | b] 2362 | c] 2363 | e] 2364 | f] 2365 | ng昉 2366 | {- 2367 | }> 2368 | ~± 2369 | ~+ 2370 | $ 2371 | -- 2372 |  2373 | 2374 | a 2375 | The 2376 | B 2377 | C 2378 | D 2379 | E 2380 | F 2381 | G 2382 | H 2383 | I 2384 | J 2385 | K 2386 | L 2387 | M 2388 | N 2389 | O 2390 | P 2391 | Q 2392 | R 2393 | S 2394 | T 2395 | U 2396 | V 2397 | W 2398 | X 2399 | Y 2400 | Z 2401 | b 2402 | c 2403 | d 2404 | e 2405 | f 2406 | g 2407 | h 2408 | j 2409 | k 2410 | l 2411 | m 2412 | n 2413 | o 2414 | p 2415 | q 2416 | r 2417 | s 2418 | t 2419 | u 2420 | v 2421 | w 2422 | x 2423 | y 2424 | z 2425 | 进一步 2426 | 包括 2427 | 不错 2428 | 之间 2429 | 未能 2430 | 间接 2431 | 值得 2432 | 第一 2433 | 第三 2434 | 第四 2435 | 第五 2436 | 听到 2437 | 未尝 2438 | 写到 2439 | 读到 2440 | 处于 2441 | 一流 2442 | 二流 2443 | 三流 2444 | 只能 2445 | 采用 2446 | 那种 2447 | 之中 2448 | 也许 2449 | 传来 2450 | 分明 2451 | 不过如此 2452 | 一方 2453 | 一跃 2454 | 实际上 2455 | 一点 2456 | 两点 2457 | 三点 2458 | 提出 2459 | 历来 2460 | 善于 2461 | 一部分 2462 | 大部分 2463 | 消失 2464 | 支持 2465 | 生成 2466 | 代表 2467 | 保证 2468 | 减少 2469 | 增多 2470 | 结构 2471 | 综合 2472 | 方法 2473 | 关系 2474 | 相互 2475 | 特别 2476 | 单位 2477 | 组合 2478 | 作用 2479 | 正确 2480 | 本文 2481 | 导致 2482 | 基础 2483 | 改变 2484 | 变化 2485 | 目的 2486 | 发现 2487 | 带来 2488 | 形式 2489 | 影响 2490 | 研究 2491 | 工作 2492 | 分析 2493 | 过程 2494 | 文献 2495 | 作者 2496 | 原文 2497 | 出处 2498 | 主义 2499 | 学报 2500 | 十 2501 | 壹 2502 | 贰 2503 | 叁 2504 | 肆 2505 | 伍 2506 | 陆 2507 | 柒 2508 | 捌 2509 | 玖 2510 | 拾 2511 | 佰 2512 | 仟 2513 | 万 2514 | 人民 2515 | ——— 2516 | ℃ 2517 | . 2518 | -- 2519 | ,也 2520 | [②B] 2521 | 1. 2522 | -- 2523 | ’‘ 2524 | ××× 2525 | 0:2 2526 | [②c] 2527 | ∈[ 2528 | ]∧′=[ 2529 | .日 2530 | 5:0 2531 | [⑨] 2532 | ? 2533 | × 2534 | exp 2535 | Lex 2536 | ≈ 2537 | ㈧ 2538 | 打开天窗说亮话 2539 | able 2540 | accordingly 2541 | actually 2542 | ain't 2543 | allow 2544 | allows 2545 | anybody 2546 | anyways 2547 | apart 2548 | appear 2549 | appreciate 2550 | appropriate 2551 | aren't 2552 | a's 2553 | aside 2554 | ask 2555 | asking 2556 | associated 2557 | available 2558 | away 2559 | awfully 2560 | believe 2561 | best 2562 | better 2563 | brief 2564 | came 2565 | can't 2566 | cause 2567 | causes 2568 | certain 2569 | certainly 2570 | changes 2571 | clearly 2572 | c'mon 2573 | com 2574 | come 2575 | comes 2576 | concerning 2577 | consequently 2578 | consider 2579 | considering 2580 | contain 2581 | containing 2582 | contains 2583 | corresponding 2584 | couldn't 2585 | course 2586 | c's 2587 | definitely 2588 | described 2589 | didn't 2590 | different 2591 | doesn't 2592 | doing 2593 | don't 2594 | downwards 2595 | edu 2596 | entirely 2597 | especially 2598 | et 2599 | everybody 2600 | ex 2601 | exactly 2602 | example 2603 | far 2604 | fifth 2605 | followed 2606 | following 2607 | follows 2608 | forth 2609 | furthermore 2610 | gets 2611 | getting 2612 | given 2613 | gives 2614 | goes 2615 | going 2616 | gone 2617 | got 2618 | gotten 2619 | greetings 2620 | hadn't 2621 | happens 2622 | hardly 2623 | hasn't 2624 | haven't 2625 | having 2626 | hello 2627 | help 2628 | here's 2629 | he's 2630 | hi 2631 | hither 2632 | hopefully 2633 | howbeit 2634 | i'd 2635 | ignored 2636 | i'll 2637 | i'm 2638 | immediate 2639 | inasmuch 2640 | indicate 2641 | indicated 2642 | indicates 2643 | inner 2644 | insofar 2645 | inward 2646 | isn't 2647 | it'd 2648 | it'll 2649 | it's 2650 | i've 2651 | keeps 2652 | kept 2653 | know 2654 | known 2655 | knows 2656 | lately 2657 | later 2658 | lest 2659 | let 2660 | let's 2661 | liked 2662 | likely 2663 | little 2664 | look 2665 | looking 2666 | looks 2667 | mainly 2668 | mean 2669 | merely 2670 | nd 2671 | nearly 2672 | necessary 2673 | needs 2674 | new 2675 | non 2676 | normally 2677 | novel 2678 | obviously 2679 | oh 2680 | ok 2681 | okay 2682 | old 2683 | ones 2684 | overall 2685 | particular 2686 | particularly 2687 | placed 2688 | possible 2689 | presumably 2690 | probably 2691 | provides 2692 | que 2693 | quite 2694 | qv 2695 | rd 2696 | really 2697 | reasonably 2698 | regardless 2699 | regards 2700 | relatively 2701 | respectively 2702 | right 2703 | said 2704 | saw 2705 | say 2706 | saying 2707 | says 2708 | second 2709 | secondly 2710 | seeing 2711 | seen 2712 | self 2713 | selves 2714 | sensible 2715 | sent 2716 | seriously 2717 | shouldn't 2718 | somebody 2719 | somewhat 2720 | soon 2721 | sorry 2722 | specified 2723 | specify 2724 | specifying 2725 | sure 2726 | taken 2727 | tell 2728 | tends 2729 | th 2730 | thank 2731 | thanks 2732 | thanx 2733 | thats 2734 | that's 2735 | theres 2736 | there's 2737 | they'd 2738 | they'll 2739 | they're 2740 | they've 2741 | think 2742 | thorough 2743 | thoroughly 2744 | took 2745 | tried 2746 | tries 2747 | truly 2748 | try 2749 | trying 2750 | t's 2751 | twice 2752 | unfortunately 2753 | unlikely 2754 | use 2755 | used 2756 | useful 2757 | uses 2758 | using 2759 | usually 2760 | value 2761 | various 2762 | viz 2763 | vs 2764 | want 2765 | wants 2766 | wasn't 2767 | way 2768 | we'd 2769 | welcome 2770 | we'll 2771 | went 2772 | we're 2773 | weren't 2774 | we've 2775 | what's 2776 | where's 2777 | who's 2778 | willing 2779 | wish 2780 | wonder 2781 | won't 2782 | wouldn't 2783 | yes 2784 | you'd 2785 | you'll 2786 | you're 2787 | you've 2788 | zero 2789 | zt 2790 | ZT 2791 | zz 2792 | ZZ -------------------------------------------------------------------------------- /textrank/stopword.txt: -------------------------------------------------------------------------------- 1 | , 2 | ? 3 | 、 4 | 。 5 | “ 6 | ” 7 | 《 8 | 》 9 | ! 10 | , 11 | : 12 | ; 13 | ? 14 | 人民 15 | 末##末 16 | 啊 17 | 阿 18 | 哎 19 | 哎呀 20 | 哎哟 21 | 唉 22 | 俺 23 | 俺们 24 | 按 25 | 按照 26 | 吧 27 | 吧哒 28 | 把 29 | 罢了 30 | 被 31 | 本 32 | 本着 33 | 比 34 | 比方 35 | 比如 36 | 鄙人 37 | 彼 38 | 彼此 39 | 边 40 | 别 41 | 别的 42 | 别说 43 | 并 44 | 并且 45 | 不比 46 | 不成 47 | 不单 48 | 不但 49 | 不独 50 | 不管 51 | 不光 52 | 不过 53 | 不仅 54 | 不拘 55 | 不论 56 | 不怕 57 | 不然 58 | 不如 59 | 不特 60 | 不惟 61 | 不问 62 | 不只 63 | 朝 64 | 朝着 65 | 趁 66 | 趁着 67 | 乘 68 | 冲 69 | 除 70 | 除此之外 71 | 除非 72 | 除了 73 | 此 74 | 此间 75 | 此外 76 | 从 77 | 从而 78 | 打 79 | 待 80 | 但 81 | 但是 82 | 当 83 | 当着 84 | 到 85 | 得 86 | 的 87 | 的话 88 | 等 89 | 等等 90 | 地 91 | 第 92 | 叮咚 93 | 对 94 | 对于 95 | 多 96 | 多少 97 | 而 98 | 而况 99 | 而且 100 | 而是 101 | 而外 102 | 而言 103 | 而已 104 | 尔后 105 | 反过来 106 | 反过来说 107 | 反之 108 | 非但 109 | 非徒 110 | 否则 111 | 嘎 112 | 嘎登 113 | 该 114 | 赶 115 | 个 116 | 各 117 | 各个 118 | 各位 119 | 各种 120 | 各自 121 | 给 122 | 根据 123 | 跟 124 | 故 125 | 故此 126 | 固然 127 | 关于 128 | 管 129 | 归 130 | 果然 131 | 果真 132 | 过 133 | 哈 134 | 哈哈 135 | 呵 136 | 和 137 | 何 138 | 何处 139 | 何况 140 | 何时 141 | 嘿 142 | 哼 143 | 哼唷 144 | 呼哧 145 | 乎 146 | 哗 147 | 还是 148 | 还有 149 | 换句话说 150 | 换言之 151 | 或 152 | 或是 153 | 或者 154 | 极了 155 | 及 156 | 及其 157 | 及至 158 | 即 159 | 即便 160 | 即或 161 | 即令 162 | 即若 163 | 即使 164 | 几 165 | 几时 166 | 己 167 | 既 168 | 既然 169 | 既是 170 | 继而 171 | 加之 172 | 假如 173 | 假若 174 | 假使 175 | 鉴于 176 | 将 177 | 较 178 | 较之 179 | 叫 180 | 接着 181 | 结果 182 | 借 183 | 紧接着 184 | 进而 185 | 尽 186 | 尽管 187 | 经 188 | 经过 189 | 就 190 | 就是 191 | 就是说 192 | 据 193 | 具体地说 194 | 具体说来 195 | 开始 196 | 开外 197 | 靠 198 | 咳 199 | 可 200 | 可见 201 | 可是 202 | 可以 203 | 况且 204 | 啦 205 | 来 206 | 来着 207 | 离 208 | 例如 209 | 哩 210 | 连 211 | 连同 212 | 两者 213 | 了 214 | 临 215 | 另 216 | 另外 217 | 另一方面 218 | 论 219 | 嘛 220 | 吗 221 | 慢说 222 | 漫说 223 | 冒 224 | 么 225 | 每 226 | 每当 227 | 们 228 | 莫若 229 | 某 230 | 某个 231 | 某些 232 | 拿 233 | 哪 234 | 哪边 235 | 哪儿 236 | 哪个 237 | 哪里 238 | 哪年 239 | 哪怕 240 | 哪天 241 | 哪些 242 | 哪样 243 | 那 244 | 那边 245 | 那儿 246 | 那个 247 | 那会儿 248 | 那里 249 | 那么 250 | 那么些 251 | 那么样 252 | 那时 253 | 那些 254 | 那样 255 | 乃 256 | 乃至 257 | 呢 258 | 能 259 | 你 260 | 你们 261 | 您 262 | 宁 263 | 宁可 264 | 宁肯 265 | 宁愿 266 | 哦 267 | 呕 268 | 啪达 269 | 旁人 270 | 呸 271 | 凭 272 | 凭借 273 | 其 274 | 其次 275 | 其二 276 | 其他 277 | 其它 278 | 其一 279 | 其余 280 | 其中 281 | 起 282 | 起见 283 | 岂但 284 | 恰恰相反 285 | 前后 286 | 前者 287 | 且 288 | 然而 289 | 然后 290 | 然则 291 | 让 292 | 人家 293 | 任 294 | 任何 295 | 任凭 296 | 如 297 | 如此 298 | 如果 299 | 如何 300 | 如其 301 | 如若 302 | 如上所述 303 | 若 304 | 若非 305 | 若是 306 | 啥 307 | 上下 308 | 尚且 309 | 设若 310 | 设使 311 | 甚而 312 | 甚么 313 | 甚至 314 | 省得 315 | 时候 316 | 什么 317 | 什么样 318 | 使得 319 | 是 320 | 是的 321 | 首先 322 | 谁 323 | 谁知 324 | 顺 325 | 顺着 326 | 似的 327 | 虽 328 | 虽然 329 | 虽说 330 | 虽则 331 | 随 332 | 随着 333 | 所 334 | 所以 335 | 他 336 | 他们 337 | 他人 338 | 它 339 | 它们 340 | 她 341 | 她们 342 | 倘 343 | 倘或 344 | 倘然 345 | 倘若 346 | 倘使 347 | 腾 348 | 替 349 | 通过 350 | 同 351 | 同时 352 | 哇 353 | 万一 354 | 往 355 | 望 356 | 为 357 | 为何 358 | 为了 359 | 为什么 360 | 为着 361 | 喂 362 | 嗡嗡 363 | 我 364 | 我们 365 | 呜 366 | 呜呼 367 | 乌乎 368 | 无论 369 | 无宁 370 | 毋宁 371 | 嘻 372 | 吓 373 | 相对而言 374 | 像 375 | 向 376 | 向着 377 | 嘘 378 | 呀 379 | 焉 380 | 沿 381 | 沿着 382 | 要 383 | 要不 384 | 要不然 385 | 要不是 386 | 要么 387 | 要是 388 | 也 389 | 也罢 390 | 也好 391 | 一 392 | 一般 393 | 一旦 394 | 一方面 395 | 一来 396 | 一切 397 | 一样 398 | 一则 399 | 依 400 | 依照 401 | 矣 402 | 以 403 | 以便 404 | 以及 405 | 以免 406 | 以至 407 | 以至于 408 | 以致 409 | 抑或 410 | 因 411 | 因此 412 | 因而 413 | 因为 414 | 哟 415 | 用 416 | 由 417 | 由此可见 418 | 由于 419 | 有 420 | 有的 421 | 有关 422 | 有些 423 | 又 424 | 于 425 | 于是 426 | 于是乎 427 | 与 428 | 与此同时 429 | 与否 430 | 与其 431 | 越是 432 | 云云 433 | 哉 434 | 再说 435 | 再者 436 | 在 437 | 在下 438 | 咱 439 | 咱们 440 | 则 441 | 怎 442 | 怎么 443 | 怎么办 444 | 怎么样 445 | 怎样 446 | 咋 447 | 照 448 | 照着 449 | 者 450 | 这 451 | 这边 452 | 这儿 453 | 这个 454 | 这会儿 455 | 这就是说 456 | 这里 457 | 这么 458 | 这么点儿 459 | 这么些 460 | 这么样 461 | 这时 462 | 这些 463 | 这样 464 | 正如 465 | 吱 466 | 之 467 | 之类 468 | 之所以 469 | 之一 470 | 只是 471 | 只限 472 | 只要 473 | 只有 474 | 至 475 | 至于 476 | 诸位 477 | 着 478 | 着呢 479 | 自 480 | 自从 481 | 自个儿 482 | 自各儿 483 | 自己 484 | 自家 485 | 自身 486 | 综上所述 487 | 总的来看 488 | 总的来说 489 | 总的说来 490 | 总而言之 491 | 总之 492 | 纵 493 | 纵令 494 | 纵然 495 | 纵使 496 | 遵照 497 | 作为 498 | 兮 499 | 呃 500 | 呗 501 | 咚 502 | 咦 503 | 喏 504 | 啐 505 | 喔唷 506 | 嗬 507 | 嗯 508 | 嗳 509 | ~ 510 | ! 511 | . 512 | : 513 | " 514 | ' 515 | ( 516 | ) 517 | * 518 | A 519 | 白 520 | 社会主义 521 | -- 522 | .. 523 | >> 524 | [ 525 | ] 526 | 527 | < 528 | > 529 | / 530 | \ 531 | | 532 | - 533 | _ 534 | + 535 | = 536 | & 537 | ^ 538 | % 539 | # 540 | @ 541 | ` 542 | ; 543 | $ 544 | ( 545 | ) 546 | —— 547 | — 548 | ¥ 549 | · 550 | ... 551 | ‘ 552 | ’ 553 | 〉 554 | 〈 555 | … 556 |   557 | 0 558 | 1 559 | 2 560 | 3 561 | 4 562 | 5 563 | 6 564 | 7 565 | 8 566 | 9 567 | 0 568 | 1 569 | 2 570 | 3 571 | 4 572 | 5 573 | 6 574 | 7 575 | 8 576 | 9 577 | 二 578 | 三 579 | 四 580 | 五 581 | 六 582 | 七 583 | 八 584 | 九 585 | 零 586 | > 587 | < 588 | @ 589 | # 590 | $ 591 | % 592 | ︿ 593 | & 594 | * 595 | + 596 | ~ 597 | | 598 | [ 599 | ] 600 | { 601 | } 602 | 啊哈 603 | 啊呀 604 | 啊哟 605 | 挨次 606 | 挨个 607 | 挨家挨户 608 | 挨门挨户 609 | 挨门逐户 610 | 挨着 611 | 按理 612 | 按期 613 | 按时 614 | 按说 615 | 暗地里 616 | 暗中 617 | 暗自 618 | 昂然 619 | 八成 620 | 白白 621 | 半 622 | 梆 623 | 保管 624 | 保险 625 | 饱 626 | 背地里 627 | 背靠背 628 | 倍感 629 | 倍加 630 | 本人 631 | 本身 632 | 甭 633 | 比起 634 | 比如说 635 | 比照 636 | 毕竟 637 | 必 638 | 必定 639 | 必将 640 | 必须 641 | 便 642 | 别人 643 | 并非 644 | 并肩 645 | 并没 646 | 并没有 647 | 并排 648 | 并无 649 | 勃然 650 | 不 651 | 不必 652 | 不常 653 | 不大 654 | 不但...而且 655 | 不得 656 | 不得不 657 | 不得了 658 | 不得已 659 | 不迭 660 | 不定 661 | 不对 662 | 不妨 663 | 不管怎样 664 | 不会 665 | 不仅...而且 666 | 不仅仅 667 | 不仅仅是 668 | 不经意 669 | 不可开交 670 | 不可抗拒 671 | 不力 672 | 不了 673 | 不料 674 | 不满 675 | 不免 676 | 不能不 677 | 不起 678 | 不巧 679 | 不然的话 680 | 不日 681 | 不少 682 | 不胜 683 | 不时 684 | 不是 685 | 不同 686 | 不能 687 | 不要 688 | 不外 689 | 不外乎 690 | 不下 691 | 不限 692 | 不消 693 | 不已 694 | 不亦乐乎 695 | 不由得 696 | 不再 697 | 不择手段 698 | 不怎么 699 | 不曾 700 | 不知不觉 701 | 不止 702 | 不止一次 703 | 不至于 704 | 才 705 | 才能 706 | 策略地 707 | 差不多 708 | 差一点 709 | 常 710 | 常常 711 | 常言道 712 | 常言说 713 | 常言说得好 714 | 长此下去 715 | 长话短说 716 | 长期以来 717 | 长线 718 | 敞开儿 719 | 彻夜 720 | 陈年 721 | 趁便 722 | 趁机 723 | 趁热 724 | 趁势 725 | 趁早 726 | 成年 727 | 成年累月 728 | 成心 729 | 乘机 730 | 乘胜 731 | 乘势 732 | 乘隙 733 | 乘虚 734 | 诚然 735 | 迟早 736 | 充分 737 | 充其极 738 | 充其量 739 | 抽冷子 740 | 臭 741 | 初 742 | 出 743 | 出来 744 | 出去 745 | 除此 746 | 除此而外 747 | 除此以外 748 | 除开 749 | 除去 750 | 除却 751 | 除外 752 | 处处 753 | 川流不息 754 | 传 755 | 传说 756 | 传闻 757 | 串行 758 | 纯 759 | 纯粹 760 | 此后 761 | 此中 762 | 次第 763 | 匆匆 764 | 从不 765 | 从此 766 | 从此以后 767 | 从古到今 768 | 从古至今 769 | 从今以后 770 | 从宽 771 | 从来 772 | 从轻 773 | 从速 774 | 从头 775 | 从未 776 | 从无到有 777 | 从小 778 | 从新 779 | 从严 780 | 从优 781 | 从早到晚 782 | 从中 783 | 从重 784 | 凑巧 785 | 粗 786 | 存心 787 | 达旦 788 | 打从 789 | 打开天窗说亮话 790 | 大 791 | 大不了 792 | 大大 793 | 大抵 794 | 大都 795 | 大多 796 | 大凡 797 | 大概 798 | 大家 799 | 大举 800 | 大略 801 | 大面儿上 802 | 大事 803 | 大体 804 | 大体上 805 | 大约 806 | 大张旗鼓 807 | 大致 808 | 呆呆地 809 | 带 810 | 殆 811 | 待到 812 | 单 813 | 单纯 814 | 单单 815 | 但愿 816 | 弹指之间 817 | 当场 818 | 当儿 819 | 当即 820 | 当口儿 821 | 当然 822 | 当庭 823 | 当头 824 | 当下 825 | 当真 826 | 当中 827 | 倒不如 828 | 倒不如说 829 | 倒是 830 | 到处 831 | 到底 832 | 到了儿 833 | 到目前为止 834 | 到头 835 | 到头来 836 | 得起 837 | 得天独厚 838 | 的确 839 | 等到 840 | 叮当 841 | 顶多 842 | 定 843 | 动不动 844 | 动辄 845 | 陡然 846 | 都 847 | 独 848 | 独自 849 | 断然 850 | 顿时 851 | 多次 852 | 多多 853 | 多多少少 854 | 多多益善 855 | 多亏 856 | 多年来 857 | 多年前 858 | 而后 859 | 而论 860 | 而又 861 | 尔等 862 | 二话不说 863 | 二话没说 864 | 反倒 865 | 反倒是 866 | 反而 867 | 反手 868 | 反之亦然 869 | 反之则 870 | 方 871 | 方才 872 | 方能 873 | 放量 874 | 非常 875 | 非得 876 | 分期 877 | 分期分批 878 | 分头 879 | 奋勇 880 | 愤然 881 | 风雨无阻 882 | 逢 883 | 弗 884 | 甫 885 | 嘎嘎 886 | 该当 887 | 概 888 | 赶快 889 | 赶早不赶晚 890 | 敢 891 | 敢情 892 | 敢于 893 | 刚 894 | 刚才 895 | 刚好 896 | 刚巧 897 | 高低 898 | 格外 899 | 隔日 900 | 隔夜 901 | 个人 902 | 各式 903 | 更 904 | 更加 905 | 更进一步 906 | 更为 907 | 公然 908 | 共 909 | 共总 910 | 够瞧的 911 | 姑且 912 | 古来 913 | 故而 914 | 故意 915 | 固 916 | 怪 917 | 怪不得 918 | 惯常 919 | 光 920 | 光是 921 | 归根到底 922 | 归根结底 923 | 过于 924 | 毫不 925 | 毫无 926 | 毫无保留地 927 | 毫无例外 928 | 好在 929 | 何必 930 | 何尝 931 | 何妨 932 | 何苦 933 | 何乐而不为 934 | 何须 935 | 何止 936 | 很 937 | 很多 938 | 很少 939 | 轰然 940 | 后来 941 | 呼啦 942 | 忽地 943 | 忽然 944 | 互 945 | 互相 946 | 哗啦 947 | 话说 948 | 还 949 | 恍然 950 | 会 951 | 豁然 952 | 活 953 | 伙同 954 | 或多或少 955 | 或许 956 | 基本 957 | 基本上 958 | 基于 959 | 极 960 | 极大 961 | 极度 962 | 极端 963 | 极力 964 | 极其 965 | 极为 966 | 急匆匆 967 | 即将 968 | 即刻 969 | 即是说 970 | 几度 971 | 几番 972 | 几乎 973 | 几经 974 | 既...又 975 | 继之 976 | 加上 977 | 加以 978 | 间或 979 | 简而言之 980 | 简言之 981 | 简直 982 | 见 983 | 将才 984 | 将近 985 | 将要 986 | 交口 987 | 较比 988 | 较为 989 | 接连不断 990 | 接下来 991 | 皆可 992 | 截然 993 | 截至 994 | 藉以 995 | 借此 996 | 借以 997 | 届时 998 | 仅 999 | 仅仅 1000 | 谨 1001 | 进来 1002 | 进去 1003 | 近 1004 | 近几年来 1005 | 近来 1006 | 近年来 1007 | 尽管如此 1008 | 尽可能 1009 | 尽快 1010 | 尽量 1011 | 尽然 1012 | 尽如人意 1013 | 尽心竭力 1014 | 尽心尽力 1015 | 尽早 1016 | 精光 1017 | 经常 1018 | 竟 1019 | 竟然 1020 | 究竟 1021 | 就此 1022 | 就地 1023 | 就算 1024 | 居然 1025 | 局外 1026 | 举凡 1027 | 据称 1028 | 据此 1029 | 据实 1030 | 据说 1031 | 据我所知 1032 | 据悉 1033 | 具体来说 1034 | 决不 1035 | 决非 1036 | 绝 1037 | 绝不 1038 | 绝顶 1039 | 绝对 1040 | 绝非 1041 | 均 1042 | 喀 1043 | 看 1044 | 看来 1045 | 看起来 1046 | 看上去 1047 | 看样子 1048 | 可好 1049 | 可能 1050 | 恐怕 1051 | 快 1052 | 快要 1053 | 来不及 1054 | 来得及 1055 | 来讲 1056 | 来看 1057 | 拦腰 1058 | 牢牢 1059 | 老 1060 | 老大 1061 | 老老实实 1062 | 老是 1063 | 累次 1064 | 累年 1065 | 理当 1066 | 理该 1067 | 理应 1068 | 历 1069 | 立 1070 | 立地 1071 | 立刻 1072 | 立马 1073 | 立时 1074 | 联袂 1075 | 连连 1076 | 连日 1077 | 连日来 1078 | 连声 1079 | 连袂 1080 | 临到 1081 | 另方面 1082 | 另行 1083 | 另一个 1084 | 路经 1085 | 屡 1086 | 屡次 1087 | 屡次三番 1088 | 屡屡 1089 | 缕缕 1090 | 率尔 1091 | 率然 1092 | 略 1093 | 略加 1094 | 略微 1095 | 略为 1096 | 论说 1097 | 马上 1098 | 蛮 1099 | 满 1100 | 没 1101 | 没有 1102 | 每逢 1103 | 每每 1104 | 每时每刻 1105 | 猛然 1106 | 猛然间 1107 | 莫 1108 | 莫不 1109 | 莫非 1110 | 莫如 1111 | 默默地 1112 | 默然 1113 | 呐 1114 | 那末 1115 | 奈 1116 | 难道 1117 | 难得 1118 | 难怪 1119 | 难说 1120 | 内 1121 | 年复一年 1122 | 凝神 1123 | 偶而 1124 | 偶尔 1125 | 怕 1126 | 砰 1127 | 碰巧 1128 | 譬如 1129 | 偏偏 1130 | 乒 1131 | 平素 1132 | 颇 1133 | 迫于 1134 | 扑通 1135 | 其后 1136 | 其实 1137 | 奇 1138 | 齐 1139 | 起初 1140 | 起来 1141 | 起首 1142 | 起头 1143 | 起先 1144 | 岂 1145 | 岂非 1146 | 岂止 1147 | 迄 1148 | 恰逢 1149 | 恰好 1150 | 恰恰 1151 | 恰巧 1152 | 恰如 1153 | 恰似 1154 | 千 1155 | 千万 1156 | 千万千万 1157 | 切 1158 | 切不可 1159 | 切莫 1160 | 切切 1161 | 切勿 1162 | 窃 1163 | 亲口 1164 | 亲身 1165 | 亲手 1166 | 亲眼 1167 | 亲自 1168 | 顷 1169 | 顷刻 1170 | 顷刻间 1171 | 顷刻之间 1172 | 请勿 1173 | 穷年累月 1174 | 取道 1175 | 去 1176 | 权时 1177 | 全都 1178 | 全力 1179 | 全年 1180 | 全然 1181 | 全身心 1182 | 然 1183 | 人人 1184 | 仍 1185 | 仍旧 1186 | 仍然 1187 | 日复一日 1188 | 日见 1189 | 日渐 1190 | 日益 1191 | 日臻 1192 | 如常 1193 | 如此等等 1194 | 如次 1195 | 如今 1196 | 如期 1197 | 如前所述 1198 | 如上 1199 | 如下 1200 | 汝 1201 | 三番两次 1202 | 三番五次 1203 | 三天两头 1204 | 瑟瑟 1205 | 沙沙 1206 | 上 1207 | 上来 1208 | 上去 1209 | aboard 1210 | about 1211 | above 1212 | according 1213 | according to 1214 | across 1215 | afore 1216 | after 1217 | afterwards 1218 | again 1219 | against 1220 | agin 1221 | all 1222 | almost 1223 | alone 1224 | along 1225 | alongside 1226 | already 1227 | also 1228 | although 1229 | always 1230 | am 1231 | amid 1232 | amidst 1233 | among 1234 | amongst 1235 | amoungst 1236 | amount 1237 | an 1238 | and 1239 | anent 1240 | another 1241 | any 1242 | anyhow 1243 | anyone 1244 | anything 1245 | anyway 1246 | anywhere 1247 | approximately 1248 | are 1249 | around 1250 | as 1251 | asked 1252 | aslant 1253 | astride 1254 | at 1255 | athwart 1256 | back 1257 | bar 1258 | be 1259 | became 1260 | because 1261 | because of 1262 | become 1263 | becomes 1264 | becoming 1265 | been 1266 | before 1267 | beforehand 1268 | behind 1269 | being 1270 | below 1271 | beneath 1272 | beside 1273 | besides 1274 | between 1275 | betwixt 1276 | beyond 1277 | bill 1278 | both 1279 | bottom 1280 | but 1281 | by 1282 | call 1283 | called 1284 | can 1285 | cannot 1286 | cant 1287 | circa 1288 | co 1289 | computer 1290 | con 1291 | could 1292 | couldnt 1293 | cry 1294 | currently 1295 | dare 1296 | de 1297 | describe 1298 | despite 1299 | detail 1300 | did 1301 | do 1302 | does 1303 | done 1304 | down 1305 | dr 1306 | due 1307 | due to 1308 | during 1309 | e.g., 1310 | each 1311 | earlier 1312 | eg 1313 | eight 1314 | either 1315 | eleven 1316 | else 1317 | elsewhere 1318 | empty 1319 | enough 1320 | ere 1321 | etc 1322 | even 1323 | eventually 1324 | ever 1325 | every 1326 | everyone 1327 | everything 1328 | everywhere 1329 | except 1330 | few 1331 | fifteen 1332 | fify 1333 | fill 1334 | find 1335 | fire 1336 | first 1337 | five 1338 | for 1339 | former 1340 | formerly 1341 | forty 1342 | found 1343 | four 1344 | from 1345 | front 1346 | full 1347 | further 1348 | get 1349 | give 1350 | go 1351 | had 1352 | has 1353 | hasnt 1354 | have 1355 | he 1356 | hence 1357 | her 1358 | here 1359 | hereafter 1360 | hereby 1361 | herein 1362 | hereupon 1363 | hers 1364 | herself 1365 | him 1366 | himself 1367 | his 1368 | how 1369 | however 1370 | hundred 1371 | i 1372 | ie 1373 | if 1374 | in 1375 | inc 1376 | indeed 1377 | inside 1378 | instead 1379 | interest 1380 | into 1381 | is 1382 | it 1383 | its 1384 | itself 1385 | just 1386 | keep 1387 | last 1388 | latter 1389 | latterly 1390 | least 1391 | less 1392 | like 1393 | ltd 1394 | made 1395 | major 1396 | many 1397 | may 1398 | maybe 1399 | me 1400 | meanwhile 1401 | mid 1402 | midst 1403 | might 1404 | mill 1405 | mine 1406 | minus 1407 | more 1408 | moreover 1409 | most 1410 | mostly 1411 | move 1412 | mr 1413 | mrs 1414 | ms 1415 | much 1416 | must 1417 | my 1418 | myself 1419 | name 1420 | namely 1421 | near 1422 | need 1423 | neither 1424 | net 1425 | never 1426 | nevertheless 1427 | next 1428 | nigh 1429 | nigher 1430 | nighest 1431 | nine 1432 | no 1433 | nobody 1434 | none 1435 | noone 1436 | nor 1437 | not 1438 | nothing 1439 | notwithstanding 1440 | now 1441 | nowhere 1442 | of 1443 | off 1444 | often 1445 | on 1446 | on to 1447 | once 1448 | one 1449 | only 1450 | onto 1451 | or 1452 | other 1453 | others 1454 | otherwise 1455 | ought 1456 | our 1457 | ours 1458 | ourselves 1459 | out 1460 | out of 1461 | outside 1462 | over 1463 | own 1464 | part 1465 | partly 1466 | past 1467 | pending 1468 | per 1469 | perhaps 1470 | please 1471 | plus 1472 | prior 1473 | put 1474 | qua 1475 | rather 1476 | re 1477 | regarding 1478 | round 1479 | same 1480 | sans 1481 | save 1482 | see 1483 | seem 1484 | seemed 1485 | seeming 1486 | seems 1487 | separately 1488 | serious 1489 | seven 1490 | several 1491 | shall 1492 | she 1493 | should 1494 | show 1495 | side 1496 | similarly 1497 | since 1498 | sincere 1499 | six 1500 | sixty 1501 | so 1502 | some 1503 | somehow 1504 | someone 1505 | something 1506 | sometime 1507 | sometimes 1508 | somewhere 1509 | still 1510 | such 1511 | system 1512 | take 1513 | ten 1514 | than 1515 | that 1516 | the 1517 | their 1518 | theirs 1519 | them 1520 | themselves 1521 | then 1522 | thence 1523 | there 1524 | thereafter 1525 | thereby 1526 | therefore 1527 | therein 1528 | thereupon 1529 | these 1530 | they 1531 | thick 1532 | thin 1533 | third 1534 | this 1535 | those 1536 | though 1537 | three 1538 | through 1539 | throughout 1540 | thru 1541 | thus 1542 | till 1543 | to 1544 | together 1545 | too 1546 | top 1547 | toward 1548 | towards 1549 | twelve 1550 | twenty 1551 | two 1552 | un 1553 | under 1554 | underneath 1555 | unless 1556 | unlike 1557 | until 1558 | unto 1559 | up 1560 | upon 1561 | us 1562 | versus 1563 | very 1564 | via 1565 | vice 1566 | volume 1567 | was 1568 | we 1569 | well 1570 | were 1571 | what 1572 | whatever 1573 | whats 1574 | when 1575 | whence 1576 | whenever 1577 | where 1578 | whereafter 1579 | whereas 1580 | whereby 1581 | wherein 1582 | whereupon 1583 | wherever 1584 | whether 1585 | which 1586 | while 1587 | whither 1588 | who 1589 | whoever 1590 | whole 1591 | whom 1592 | whose 1593 | why 1594 | will 1595 | with 1596 | within 1597 | without 1598 | would 1599 | yesterday 1600 | yet 1601 | you 1602 | your 1603 | yours 1604 | yourself 1605 | yourselves 1606 | { 1607 | } 1608 | ¡ 1609 | ¦ 1610 | « 1611 | ­ 1612 | ¯ 1613 | ´ 1614 | ¸ 1615 | » 1616 | ¿ 1617 | ˇ 1618 | ˉ 1619 | ˊ 1620 | ˋ 1621 | ˜ 1622 | ‐ 1623 | —  1624 | ― 1625 | ‖ 1626 | • 1627 | ‹ 1628 | › 1629 | ∕ 1630 | 「 1631 | 」 1632 | 『 1633 | 』 1634 | 【 1635 | 】 1636 | 〔 1637 | 〕 1638 | 〖 1639 | 〗 1640 | 〝 1641 | 〞 1642 | 一些 1643 | 一何 1644 | 一转眼 1645 | 下 1646 | 不尽 1647 | 不尽然 1648 | 不若 1649 | 与其说 1650 | 且不说 1651 | 且说 1652 | 个别 1653 | 为止 1654 | 为此 1655 | 乃至于 1656 | 二来 1657 | 云尔 1658 | 些 1659 | 亦 1660 | 人 1661 | 人们 1662 | 今 1663 | 介于 1664 | 以上 1665 | 以为 1666 | 以故 1667 | 以期 1668 | 以来 1669 | 但凡 1670 | 何以 1671 | 余外 1672 | 使 1673 | 依据 1674 | 便于 1675 | 傥然 1676 | 儿 1677 | 先不先 1678 | 全体 1679 | 全部 1680 | 兼之 1681 | 再其次 1682 | 再则 1683 | 再有 1684 | 再者说 1685 | 凡 1686 | 凡是 1687 | 出于 1688 | 分别 1689 | 则甚 1690 | 别处 1691 | 别是 1692 | 别管 1693 | 前此 1694 | 即如 1695 | 却 1696 | 又及 1697 | 受到 1698 | 另悉 1699 | 只 1700 | 只当 1701 | 只怕 1702 | 只消 1703 | 后 1704 | 后者 1705 | 向使 1706 | 呵呵 1707 | 咧 1708 | 唯有 1709 | 啷当 1710 | 喽 1711 | 嗡 1712 | 嘿嘿 1713 | 因了 1714 | 因着 1715 | 在于 1716 | 处在 1717 | 多么 1718 | 好 1719 | 如同 1720 | 如是 1721 | 始而 1722 | 孰料 1723 | 孰知 1724 | 对待 1725 | 对方 1726 | 对比 1727 | 小 1728 | 尔 1729 | 尔尔 1730 | 就是了 1731 | 就要 1732 | 已 1733 | 已矣 1734 | 巴 1735 | 巴巴 1736 | 庶乎 1737 | 庶几 1738 | 归齐 1739 | 当地 1740 | 彼时 1741 | 得了 1742 | 怎奈 1743 | 惟其 1744 | 或则 1745 | 或曰 1746 | 所在 1747 | 所幸 1748 | 所有 1749 | 无 1750 | 既往 1751 | 是以 1752 | 曾 1753 | 替代 1754 | 最 1755 | 有及 1756 | 有时 1757 | 本地 1758 | 来自 1759 | 来说 1760 | 某某 1761 | 欤 1762 | 正值 1763 | 正巧 1764 | 正是 1765 | 此地 1766 | 此处 1767 | 此时 1768 | 此次 1769 | 比及 1770 | 没奈何 1771 | 犹且 1772 | 犹自 1773 | 甚且 1774 | 甚或 1775 | 甚至于 1776 | 用来 1777 | 由是 1778 | 由此 1779 | 直到 1780 | 眨眼 1781 | 矣乎 1782 | 矣哉 1783 | 竟而 1784 | 类如 1785 | 继后 1786 | 能否 1787 | 自后 1788 | 自打 1789 | 至今 1790 | 至若 1791 | 致 1792 | 般的 1793 | 若夫 1794 | 若果 1795 | 莫不然 1796 | 譬喻 1797 | 许多 1798 | 设或 1799 | 诚如 1800 | 说来 1801 | 诸 1802 | 诸如 1803 | 谁人 1804 | 谁料 1805 | 贼死 1806 | 赖以 1807 | 距 1808 | 还要 1809 | 这一来 1810 | 这次 1811 | 这般 1812 | 逐步 1813 | 遵循 1814 | 那般 1815 | 针对 1816 | 随后 1817 | 随时 1818 | 难道说 1819 | 非特 1820 | 非独 1821 | ︰ 1822 | ︳ 1823 | ︴ 1824 | ︵ 1825 | ︶ 1826 | ︷ 1827 | ︸ 1828 | ︹ 1829 | ︺ 1830 | ︻ 1831 | ︼ 1832 | ︽ 1833 | ︾ 1834 | ﹀ 1835 | ﹁ 1836 | ﹂ 1837 | ﹃ 1838 | ﹄ 1839 | ﹉ 1840 | ﹊ 1841 | ﹋ 1842 | ﹌ 1843 | ﹍ 1844 | ﹎ 1845 | ﹏ 1846 | ﹐ 1847 | ﹑ 1848 | ﹔ 1849 | ﹕ 1850 | ﹖ 1851 | ﹝ 1852 | ﹞ 1853 | ﹟ 1854 | ﹠ 1855 | ﹡ 1856 | ﹢ 1857 | ﹤ 1858 | ﹦ 1859 | ﹨ 1860 | ﹩ 1861 | ﹪ 1862 | ﹫ 1863 | " 1864 | ' 1865 | _ 1866 |  ̄ 1867 |   1868 | ! 1869 | , 1870 | ...... 1871 | ................... 1872 | ./ 1873 | .一 1874 | .数 1875 | .日 1876 | // 1877 | :// 1878 | :: 1879 | Lex 1880 | [ 1881 | ] 1882 | exp 1883 | sub 1884 | sup 1885 | ~~~~ 1886 | × 1887 | ××× 1888 | Δ 1889 | Ψ 1890 | γ 1891 | μ 1892 | φ 1893 | φ. 1894 | В 1895 | ——— 1896 | ’‘ 1897 | ”, 1898 | …… 1899 | …………………………………………………③ 1900 | ′∈ 1901 | ′| 1902 | ℃ 1903 | Ⅲ 1904 | ↑ 1905 | → 1906 | ∈[ 1907 | ∪φ∈ 1908 | ≈ 1909 | ① 1910 | ② 1911 | ②c 1912 | ③ 1913 | ③] 1914 | ④ 1915 | ⑤ 1916 | ⑥ 1917 | ⑦ 1918 | ⑧ 1919 | ⑨ 1920 | ⑩ 1921 | ── 1922 | ■ 1923 | ▲ 1924 | 》), 1925 | 〕〔 1926 | ㈧ 1927 | 一. 1928 | 一一 1929 | 一下 1930 | 一个 1931 | 一则通过 1932 | 一天 1933 | 一定 1934 | 一时 1935 | 一次 1936 | 一片 1937 | 一番 1938 | 一直 1939 | 一致 1940 | 一起 1941 | 一边 1942 | 一面 1943 | 上升 1944 | 上述 1945 | 上面 1946 | 下列 1947 | 下去 1948 | 下来 1949 | 下面 1950 | 不一 1951 | 不久 1952 | 不变 1953 | 不可 1954 | 不够 1955 | 不敢 1956 | 不断 1957 | 不足 1958 | 专门 1959 | 严格 1960 | 严重 1961 | 中小 1962 | 中间 1963 | 丰富 1964 | 为主 1965 | 为什麽 1966 | 主张 1967 | 主要 1968 | 举行 1969 | 之前 1970 | 之后 1971 | 之後 1972 | 也就是说 1973 | 也是 1974 | 了解 1975 | 争取 1976 | 产生 1977 | 什麽 1978 | 今后 1979 | 今天 1980 | 今年 1981 | 今後 1982 | 从事 1983 | 他是 1984 | 他的 1985 | 代替 1986 | 以下 1987 | 以前 1988 | 以后 1989 | 以外 1990 | 以後 1991 | 任务 1992 | 企图 1993 | 伟大 1994 | 似乎 1995 | 你是 1996 | 你的 1997 | 使用 1998 | 依靠 1999 | 促进 2000 | 保持 2001 | 做到 2002 | 允许 2003 | 元/吨 2004 | 先后 2005 | 先後 2006 | 先生 2007 | 全面 2008 | 共同 2009 | 具体 2010 | 具有 2011 | 再 2012 | 再次 2013 | 决定 2014 | 准备 2015 | 出现 2016 | 前进 2017 | 前面 2018 | 加入 2019 | 加强 2020 | 十分 2021 | 却不 2022 | 原来 2023 | 及时 2024 | 双方 2025 | 反应 2026 | 反映 2027 | 取得 2028 | 变成 2029 | 叫做 2030 | 召开 2031 | 各人 2032 | 各地 2033 | 各级 2034 | 合理 2035 | 同一 2036 | 同样 2037 | 后面 2038 | 周围 2039 | 坚决 2040 | 坚持 2041 | 处理 2042 | 复杂 2043 | 多数 2044 | 大力 2045 | 大多数 2046 | 大批 2047 | 大量 2048 | 失去 2049 | 她是 2050 | 她的 2051 | 好的 2052 | 好象 2053 | 存在 2054 | 它们的 2055 | 它是 2056 | 它的 2057 | 安全 2058 | 完全 2059 | 完成 2060 | 实现 2061 | 实际 2062 | 宣布 2063 | 容易 2064 | 密切 2065 | 对应 2066 | 少数 2067 | 尤其 2068 | 属于 2069 | 左右 2070 | 巨大 2071 | 巩固 2072 | 已经 2073 | 帮助 2074 | 并不 2075 | 并不是 2076 | 广大 2077 | 广泛 2078 | 应当 2079 | 应用 2080 | 应该 2081 | 开展 2082 | 引起 2083 | 强烈 2084 | 强调 2085 | 当前 2086 | 当时 2087 | 形成 2088 | 彻底 2089 | 往往 2090 | 後来 2091 | 後面 2092 | 得出 2093 | 得到 2094 | 心里 2095 | 必然 2096 | 必要 2097 | 怎麽 2098 | 总是 2099 | 总结 2100 | 您们 2101 | 您是 2102 | 意思 2103 | 愿意 2104 | 成为 2105 | 我是 2106 | 我的 2107 | 战斗 2108 | 所谓 2109 | 扩大 2110 | 掌握 2111 | 接著 2112 | 数/ 2113 | 整个 2114 | 方便 2115 | 方面 2116 | 无法 2117 | 明显 2118 | 明确 2119 | 是不是 2120 | 是否 2121 | 显然 2122 | 显著 2123 | 普通 2124 | 普遍 2125 | 曾经 2126 | 最后 2127 | 最大 2128 | 最好 2129 | 最後 2130 | 最近 2131 | 最高 2132 | 有利 2133 | 有力 2134 | 有所 2135 | 有效 2136 | 有点 2137 | 有的是 2138 | 有着 2139 | 有著 2140 | 构成 2141 | 根本 2142 | 欢迎 2143 | 正在 2144 | 正常 2145 | 每个 2146 | 每天 2147 | 每年 2148 | 比较 2149 | 注意 2150 | 深入 2151 | 清楚 2152 | 满足 2153 | 然後 2154 | 特别是 2155 | 特殊 2156 | 特点 2157 | 现代 2158 | 现在 2159 | 目前 2160 | 直接 2161 | 相似 2162 | 相信 2163 | 相反 2164 | 相同 2165 | 相对 2166 | 相应 2167 | 相当 2168 | 相等 2169 | 看出 2170 | 看到 2171 | 看看 2172 | 看见 2173 | 真是 2174 | 真正 2175 | 知道 2176 | 确定 2177 | 种 2178 | 积极 2179 | 移动 2180 | 突出 2181 | 突然 2182 | 立即 2183 | 第二 2184 | 练习 2185 | 组成 2186 | 结合 2187 | 继续 2188 | 维持 2189 | 考虑 2190 | 联系 2191 | 能够 2192 | 良好 2193 | 若果 2194 | 范围 2195 | 获得 2196 | 行为 2197 | 行动 2198 | 表明 2199 | 表示 2200 | 要求 2201 | 规定 2202 | 觉得 2203 | 认为 2204 | 认真 2205 | 认识 2206 | 说明 2207 | 说说 2208 | 转动 2209 | 转变 2210 | 转贴 2211 | 达到 2212 | 迅速 2213 | 过去 2214 | 过来 2215 | 运用 2216 | 这点 2217 | 这种 2218 | 这麽 2219 | 进入 2220 | 进步 2221 | 进行 2222 | 适应 2223 | 适当 2224 | 适用 2225 | 逐渐 2226 | 通常 2227 | 造成 2228 | 遇到 2229 | 遭到 2230 | 避免 2231 | 那麽 2232 | 部分 2233 | 采取 2234 | 里面 2235 | 重大 2236 | 重新 2237 | 重要 2238 | 问题 2239 | 防止 2240 | 附近 2241 | 限制 2242 | 随著 2243 | 集中 2244 | 需要 2245 | 高兴 2246 | )÷(1- 2247 | )、 2248 | +ξ 2249 | ++ 2250 | ,也 2251 | - 2252 | -β 2253 | -- 2254 | -[*]- 2255 | . 2256 | / 2257 | 0:2 2258 | 1. 2259 | 12% 2260 | 2.3% 2261 | 5:0 2262 | <± 2263 | <Δ 2264 | <λ 2265 | <φ 2266 | << 2267 | = 2268 | =″ 2269 | =☆ 2270 | =( 2271 | =- 2272 | =[ 2273 | ={ 2274 | >λ 2275 | A 2276 | LI 2277 | R.L. 2278 | ZXFITL 2279 | [①①] 2280 | [①②] 2281 | [①③] 2282 | [①④] 2283 | [①⑤] 2284 | [①⑥] 2285 | [①⑦] 2286 | [①⑧] 2287 | [①⑨] 2288 | [①A] 2289 | [①B] 2290 | [①C] 2291 | [①D] 2292 | [①E] 2293 | [①] 2294 | [①a] 2295 | [①c] 2296 | [①d] 2297 | [①e] 2298 | [①f] 2299 | [①g] 2300 | [①h] 2301 | [①i] 2302 | [①o] 2303 | [② 2304 | [②①] 2305 | [②②] 2306 | [②③] 2307 | [②④ 2308 | [②⑤] 2309 | [②⑥] 2310 | [②⑦] 2311 | [②⑧] 2312 | [②⑩] 2313 | [②B] 2314 | [②G] 2315 | [②] 2316 | [②a] 2317 | [②b] 2318 | [②c] 2319 | [②d] 2320 | [②e] 2321 | [②f] 2322 | [②g] 2323 | [②h] 2324 | [②i] 2325 | [②j] 2326 | [③①] 2327 | [③⑩] 2328 | [③F] 2329 | [③] 2330 | [③a] 2331 | [③b] 2332 | [③c] 2333 | [③d] 2334 | [③e] 2335 | [③g] 2336 | [③h] 2337 | [④] 2338 | [④a] 2339 | [④b] 2340 | [④c] 2341 | [④d] 2342 | [④e] 2343 | [⑤] 2344 | [⑤]] 2345 | [⑤a] 2346 | [⑤b] 2347 | [⑤d] 2348 | [⑤e] 2349 | [⑤f] 2350 | [⑥] 2351 | [⑦] 2352 | [⑧] 2353 | [⑨] 2354 | [⑩] 2355 | [*] 2356 | [- 2357 | [] 2358 | ]∧′=[ 2359 | ][ 2360 | a] 2361 | b] 2362 | c] 2363 | e] 2364 | f] 2365 | ng昉 2366 | {- 2367 | }> 2368 | ~± 2369 | ~+ 2370 | $ 2371 | -- 2372 |  2373 | 2374 | a 2375 | The 2376 | B 2377 | C 2378 | D 2379 | E 2380 | F 2381 | G 2382 | H 2383 | I 2384 | J 2385 | K 2386 | L 2387 | M 2388 | N 2389 | O 2390 | P 2391 | Q 2392 | R 2393 | S 2394 | T 2395 | U 2396 | V 2397 | W 2398 | X 2399 | Y 2400 | Z 2401 | b 2402 | c 2403 | d 2404 | e 2405 | f 2406 | g 2407 | h 2408 | j 2409 | k 2410 | l 2411 | m 2412 | n 2413 | o 2414 | p 2415 | q 2416 | r 2417 | s 2418 | t 2419 | u 2420 | v 2421 | w 2422 | x 2423 | y 2424 | z 2425 | 进一步 2426 | 包括 2427 | 不错 2428 | 之间 2429 | 未能 2430 | 间接 2431 | 值得 2432 | 第一 2433 | 第三 2434 | 第四 2435 | 第五 2436 | 听到 2437 | 未尝 2438 | 写到 2439 | 读到 2440 | 处于 2441 | 一流 2442 | 二流 2443 | 三流 2444 | 只能 2445 | 采用 2446 | 那种 2447 | 之中 2448 | 也许 2449 | 传来 2450 | 分明 2451 | 不过如此 2452 | 一方 2453 | 一跃 2454 | 实际上 2455 | 一点 2456 | 两点 2457 | 三点 2458 | 提出 2459 | 历来 2460 | 善于 2461 | 一部分 2462 | 大部分 2463 | 消失 2464 | 支持 2465 | 生成 2466 | 代表 2467 | 保证 2468 | 减少 2469 | 增多 2470 | 结构 2471 | 综合 2472 | 方法 2473 | 关系 2474 | 相互 2475 | 特别 2476 | 单位 2477 | 组合 2478 | 作用 2479 | 正确 2480 | 本文 2481 | 导致 2482 | 基础 2483 | 改变 2484 | 变化 2485 | 目的 2486 | 发现 2487 | 带来 2488 | 形式 2489 | 影响 2490 | 研究 2491 | 工作 2492 | 分析 2493 | 过程 2494 | 文献 2495 | 作者 2496 | 原文 2497 | 出处 2498 | 主义 2499 | 学报 2500 | 十 2501 | 壹 2502 | 贰 2503 | 叁 2504 | 肆 2505 | 伍 2506 | 陆 2507 | 柒 2508 | 捌 2509 | 玖 2510 | 拾 2511 | 佰 2512 | 仟 2513 | 万 2514 | 人民 2515 | ——— 2516 | ℃ 2517 | . 2518 | -- 2519 | ,也 2520 | [②B] 2521 | 1. 2522 | -- 2523 | ’‘ 2524 | ××× 2525 | 0:2 2526 | [②c] 2527 | ∈[ 2528 | ]∧′=[ 2529 | .日 2530 | 5:0 2531 | [⑨] 2532 | ? 2533 | × 2534 | exp 2535 | Lex 2536 | ≈ 2537 | ㈧ 2538 | 打开天窗说亮话 2539 | able 2540 | accordingly 2541 | actually 2542 | ain't 2543 | allow 2544 | allows 2545 | anybody 2546 | anyways 2547 | apart 2548 | appear 2549 | appreciate 2550 | appropriate 2551 | aren't 2552 | a's 2553 | aside 2554 | ask 2555 | asking 2556 | associated 2557 | available 2558 | away 2559 | awfully 2560 | believe 2561 | best 2562 | better 2563 | brief 2564 | came 2565 | can't 2566 | cause 2567 | causes 2568 | certain 2569 | certainly 2570 | changes 2571 | clearly 2572 | c'mon 2573 | com 2574 | come 2575 | comes 2576 | concerning 2577 | consequently 2578 | consider 2579 | considering 2580 | contain 2581 | containing 2582 | contains 2583 | corresponding 2584 | couldn't 2585 | course 2586 | c's 2587 | definitely 2588 | described 2589 | didn't 2590 | different 2591 | doesn't 2592 | doing 2593 | don't 2594 | downwards 2595 | edu 2596 | entirely 2597 | especially 2598 | et 2599 | everybody 2600 | ex 2601 | exactly 2602 | example 2603 | far 2604 | fifth 2605 | followed 2606 | following 2607 | follows 2608 | forth 2609 | furthermore 2610 | gets 2611 | getting 2612 | given 2613 | gives 2614 | goes 2615 | going 2616 | gone 2617 | got 2618 | gotten 2619 | greetings 2620 | hadn't 2621 | happens 2622 | hardly 2623 | hasn't 2624 | haven't 2625 | having 2626 | hello 2627 | help 2628 | here's 2629 | he's 2630 | hi 2631 | hither 2632 | hopefully 2633 | howbeit 2634 | i'd 2635 | ignored 2636 | i'll 2637 | i'm 2638 | immediate 2639 | inasmuch 2640 | indicate 2641 | indicated 2642 | indicates 2643 | inner 2644 | insofar 2645 | inward 2646 | isn't 2647 | it'd 2648 | it'll 2649 | it's 2650 | i've 2651 | keeps 2652 | kept 2653 | know 2654 | known 2655 | knows 2656 | lately 2657 | later 2658 | lest 2659 | let 2660 | let's 2661 | liked 2662 | likely 2663 | little 2664 | look 2665 | looking 2666 | looks 2667 | mainly 2668 | mean 2669 | merely 2670 | nd 2671 | nearly 2672 | necessary 2673 | needs 2674 | new 2675 | non 2676 | normally 2677 | novel 2678 | obviously 2679 | oh 2680 | ok 2681 | okay 2682 | old 2683 | ones 2684 | overall 2685 | particular 2686 | particularly 2687 | placed 2688 | possible 2689 | presumably 2690 | probably 2691 | provides 2692 | que 2693 | quite 2694 | qv 2695 | rd 2696 | really 2697 | reasonably 2698 | regardless 2699 | regards 2700 | relatively 2701 | respectively 2702 | right 2703 | said 2704 | saw 2705 | say 2706 | saying 2707 | says 2708 | second 2709 | secondly 2710 | seeing 2711 | seen 2712 | self 2713 | selves 2714 | sensible 2715 | sent 2716 | seriously 2717 | shouldn't 2718 | somebody 2719 | somewhat 2720 | soon 2721 | sorry 2722 | specified 2723 | specify 2724 | specifying 2725 | sure 2726 | taken 2727 | tell 2728 | tends 2729 | th 2730 | thank 2731 | thanks 2732 | thanx 2733 | thats 2734 | that's 2735 | theres 2736 | there's 2737 | they'd 2738 | they'll 2739 | they're 2740 | they've 2741 | think 2742 | thorough 2743 | thoroughly 2744 | took 2745 | tried 2746 | tries 2747 | truly 2748 | try 2749 | trying 2750 | t's 2751 | twice 2752 | unfortunately 2753 | unlikely 2754 | use 2755 | used 2756 | useful 2757 | uses 2758 | using 2759 | usually 2760 | value 2761 | various 2762 | viz 2763 | vs 2764 | want 2765 | wants 2766 | wasn't 2767 | way 2768 | we'd 2769 | welcome 2770 | we'll 2771 | went 2772 | we're 2773 | weren't 2774 | we've 2775 | what's 2776 | where's 2777 | who's 2778 | willing 2779 | wish 2780 | wonder 2781 | won't 2782 | wouldn't 2783 | yes 2784 | you'd 2785 | you'll 2786 | you're 2787 | you've 2788 | zero 2789 | zt 2790 | ZT 2791 | zz 2792 | ZZ --------------------------------------------------------------------------------