├── .gitignore ├── .idea ├── .name ├── dictionaries │ └── zkwi.xml ├── encodings.xml ├── misc.xml ├── modules.xml ├── vcs.xml ├── web.iml └── workspace.xml ├── .travis.yml ├── Procfile ├── README.md ├── app.py ├── requirements.txt ├── runtime.txt ├── static ├── favicon.ico ├── index.html └── testdata │ ├── data.txt │ ├── data1.txt │ ├── data2.txt │ ├── data3.txt │ ├── data4.txt │ ├── rujia1.txt │ ├── rujia2.txt │ ├── rujia3.txt │ ├── test.json │ ├── test1.json │ ├── test2.json │ ├── test3.json │ ├── test4.json │ ├── test5.json │ └── test6.json ├── test.py └── textsummary.py /.gitignore: -------------------------------------------------------------------------------- 1 | __pycache__/ -------------------------------------------------------------------------------- /.idea/.name: -------------------------------------------------------------------------------- 1 | web -------------------------------------------------------------------------------- /.idea/dictionaries/zkwi.xml: -------------------------------------------------------------------------------- 1 | 2 | 3 | -------------------------------------------------------------------------------- /.idea/encodings.xml: -------------------------------------------------------------------------------- 1 | 2 | 3 | 4 | 5 | 6 | -------------------------------------------------------------------------------- /.idea/misc.xml: -------------------------------------------------------------------------------- 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | Buildout 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 40 | 41 | 42 | 43 | 44 | 45 | -------------------------------------------------------------------------------- /.idea/modules.xml: -------------------------------------------------------------------------------- 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | -------------------------------------------------------------------------------- /.idea/vcs.xml: -------------------------------------------------------------------------------- 1 | 2 | 3 | 4 | 5 | 6 | -------------------------------------------------------------------------------- /.idea/web.iml: -------------------------------------------------------------------------------- 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 15 | 16 | 17 | 19 | -------------------------------------------------------------------------------- /.idea/workspace.xml: -------------------------------------------------------------------------------- 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 | 126 | 127 | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 137 | 138 | 139 | 140 | 141 | 148 | 149 | 150 | 157 | 158 | 159 | 186 | 187 | 188 | 189 | 190 | true 191 | 192 | 193 | 198 | 199 | 200 | 201 | 202 | 203 | 204 | 205 | 206 | 207 | 208 | 209 | 210 | 211 | 212 | 213 | 214 | 215 | 216 | 217 | 218 | 219 | 220 | 221 | 222 | 223 | 224 | 225 | 226 | 227 | 228 | 231 | 232 | 233 | 234 | 237 | 238 | 241 | 242 | 243 | 244 | 245 | 246 | 247 | 248 | 249 | 250 | 251 | 252 | 253 | 254 | 255 | 256 | 257 | 258 | 259 | 260 | 261 | 262 | 263 | 264 | 265 | 266 | 267 | 268 | 269 | 270 | 271 | 272 | 273 | 274 | 275 | 276 | 277 | 278 | 279 | 280 | 281 | 282 | 283 | 284 | 303 | 304 | 305 | 306 | 307 | 320 | 321 | 334 | 335 | 352 | 353 | 354 | 355 | 356 | 357 | 358 | 359 | 360 | 361 | 362 | 363 | 364 | 365 | 366 | 367 | 386 | 387 | 406 | 407 | 428 | 429 | 451 | 452 | 476 | 477 | 494 | 495 | 512 | 513 | 514 | 515 | 516 | 517 | 518 | 519 | C:\Users\zkwi\AppData\Roaming\Subversion 520 | 521 | 522 | 523 | 524 | 1458123432728 525 | 532 | 533 | 1458710985274 534 | 538 | 539 | 1458711128446 540 | 544 | 545 | 1458713003752 546 | 550 | 551 | 1458713306011 552 | 556 | 557 | 1458723894106 558 | 562 | 563 | 1458724321853 564 | 568 | 569 | 1458724713035 570 | 574 | 575 | 1458725857484 576 | 580 | 581 | 1458726117631 582 | 586 | 587 | 1458727063309 588 | 592 | 593 | 1458727637206 594 | 598 | 599 | 1458728326528 600 | 604 | 605 | 1458728605905 606 | 610 | 611 | 1458729406860 612 | 616 | 617 | 1458730065023 618 | 622 | 623 | 1458730346759 624 | 628 | 629 | 1458730665878 630 | 634 | 635 | 1458730904064 636 | 640 | 641 | 1458731071697 642 | 646 | 647 | 1458731247000 648 | 652 | 653 | 1458734723894 654 | 658 | 659 | 1458736197357 660 | 664 | 665 | 1458736417427 666 | 670 | 671 | 1458736467806 672 | 676 | 677 | 1458736813201 678 | 682 | 683 | 1458736921000 684 | 688 | 689 | 1458738137383 690 | 694 | 695 | 1460039737080 696 | 700 | 701 | 1460041051867 702 | 706 | 707 | 1460096356432 708 | 712 | 713 | 1460096958519 714 | 718 | 719 | 1460099521293 720 | 724 | 725 | 1460100265126 726 | 730 | 731 | 1460100388854 732 | 736 | 737 | 1460106511369 738 | 742 | 743 | 1460905573195 744 | 748 | 749 | 1461766244763 750 | 754 | 755 | 1461766284329 756 | 760 | 761 | 1461767867892 762 | 766 | 767 | 1461815122623 768 | 772 | 773 | 1464533706642 774 | 778 | 779 | 1464534480204 780 | 784 | 785 | 1464534945485 786 | 790 | 793 | 794 | 796 | 797 | 798 | 799 | 800 | 801 | 802 | 803 | 804 | 805 | 806 | 807 | 808 | 809 | 810 | 811 | 812 | 813 | 814 | 815 | 816 | 817 | 818 | 819 | 820 | 821 | 822 | 823 | 824 | 825 | 826 | 827 | 828 | 829 | 830 | 831 | 832 | 835 | 838 | 839 | 840 | 842 | 843 | 844 | 845 | 846 | 847 | 848 | 849 | 850 | 851 | 852 | 853 | 854 | 855 | 856 | 857 | 858 | 859 | 860 | 861 | 862 | 863 | 864 | 865 | 866 | 867 | 868 | 870 | 871 | 872 | 874 | 875 | 876 | 877 | 878 | 879 | 880 | 881 | 882 | 883 | 884 | 885 | 886 | 887 | 888 | 889 | 890 | 891 | 892 | 893 | 894 | 895 | 896 | 897 | 898 | 899 | 900 | 901 | 902 | 903 | 904 | 905 | 906 | 907 | 908 | 909 | 910 | 911 | 912 | 913 | 914 | 915 | 916 | 917 | 918 | 919 | 920 | 921 | 922 | 923 | 924 | 925 | 926 | 927 | 928 | 929 | 930 | 931 | 932 | 933 | 934 | 935 | 936 | 937 | 938 | 939 | 940 | 941 | 942 | 943 | 944 | 945 | 946 | 947 | 948 | 949 | 950 | 951 | 952 | 953 | 954 | 955 | 956 | 957 | 958 | 959 | 960 | 961 | 962 | 963 | 964 | 965 | 966 | 967 | 968 | 969 | 970 | 971 | 972 | 973 | 974 | 975 | 976 | 977 | 978 | 979 | 980 | 981 | 982 | 983 | 984 | 985 | 986 | 987 | 988 | 989 | 990 | 991 | 992 | 993 | 994 | 995 | 996 | 997 | 998 | 999 | 1000 | 1001 | 1002 | 1003 | 1004 | 1005 | 1006 | 1007 | 1008 | 1009 | 1010 | 1011 | 1012 | 1013 | 1014 | 1015 | 1016 | 1017 | 1018 | 1019 | 1020 | 1021 | 1022 | 1023 | 1024 | 1025 | 1026 | 1027 | 1028 | 1029 | 1030 | 1031 | 1032 | 1033 | 1034 | 1035 | 1036 | 1037 | 1038 | 1039 | 1040 | 1041 | 1042 | 1043 | 1044 | 1045 | 1046 | 1047 | 1048 | 1049 | 1050 | 1051 | 1052 | 1053 | 1054 | 1055 | 1056 | 1057 | 1058 | 1059 | 1060 | 1061 | 1062 | 1063 | 1064 | 1065 | 1066 | 1067 | 1068 | 1069 | 1070 | 1071 | 1072 | 1073 | 1074 | 1075 | 1076 | 1077 | 1078 | 1079 | 1080 | 1081 | 1082 | 1083 | 1084 | 1085 | 1086 | 1087 | 1088 | 1089 | 1090 | 1091 | 1092 | 1093 | 1094 | 1095 | 1096 | 1097 | 1098 | 1099 | 1100 | 1101 | 1102 | 1103 | 1104 | 1105 | 1106 | 1107 | 1108 | 1109 | 1110 | 1111 | 1112 | 1113 | 1114 | 1115 | 1116 | 1117 | 1118 | 1119 | 1120 | 1121 | 1122 | 1123 | 1124 | 1125 | 1126 | 1127 | 1128 | 1129 | 1130 | 1131 | 1132 | 1133 | 1134 | 1135 | 1136 | 1137 | 1138 | 1139 | 1140 | 1141 | 1142 | 1143 | 1144 | 1145 | 1146 | 1147 | 1148 | 1149 | 1150 | 1151 | 1152 | 1153 | 1154 | 1155 | 1156 | 1157 | 1158 | 1159 | 1160 | 1161 | 1162 | 1163 | 1164 | 1165 | 1166 | 1167 | 1168 | 1169 | 1170 | 1171 | 1172 | 1173 | 1174 | 1175 | 1176 | 1177 | 1178 | 1179 | 1180 | 1181 | 1182 | 1183 | 1184 | 1185 | 1186 | 1187 | 1188 | 1189 | 1190 | 1191 | 1192 | 1193 | 1194 | 1195 | 1196 | 1197 | 1198 | 1199 | 1200 | 1201 | 1202 | 1203 | 1204 | 1205 | 1206 | 1207 | 1208 | 1209 | 1210 | 1211 | 1212 | 1213 | 1214 | 1215 | 1216 | -------------------------------------------------------------------------------- /.travis.yml: -------------------------------------------------------------------------------- 1 | language: python 2 | python: 3 | - "3.5" 4 | install: 5 | - pip install flask 6 | - pip install jieba 7 | script: 8 | - python test.py -------------------------------------------------------------------------------- /Procfile: -------------------------------------------------------------------------------- 1 | web: python app.py -------------------------------------------------------------------------------- /README.md: -------------------------------------------------------------------------------- 1 | [![Build Status](https://travis-ci.org/zkwi/textSummary.svg?branch=master)](https://travis-ci.org/zkwi/textSummary) 2 | # textSummary 3 | 网页内容摘要智能抽取技术实现 [演示地址](http://textsummary.herokuapp.com/) 4 | 5 | -------------------------------------------------------------------------------- /app.py: -------------------------------------------------------------------------------- 1 | import os 2 | from flask import Flask, request 3 | import json 4 | from textsummary import TextSummary 5 | app = Flask(__name__) 6 | 7 | @app.route('/api/CalcSummary/', methods=['GET', 'POST']) 8 | def CalcSummary(): 9 | data = request.data 10 | data = data.decode(encoding="utf-8") 11 | content = json.loads(data) 12 | text = content['text'] 13 | title = content['title'] 14 | textsummary = TextSummary() 15 | textsummary.SetText(title, text) 16 | summary = textsummary.CalcSummary() 17 | print(summary) 18 | return json.dumps(summary) 19 | 20 | @app.route('/') 21 | def index(): 22 | # 直接返回静态文件 23 | return app.send_static_file("index.html") 24 | if __name__ == '__main__': 25 | # app.run(debug=True) 26 | port = int(os.environ.get("PORT", "5000")) 27 | app.run(host='0.0.0.0', port=port,debug=True) -------------------------------------------------------------------------------- /requirements.txt: -------------------------------------------------------------------------------- 1 | Flask 2 | jieba -------------------------------------------------------------------------------- /runtime.txt: -------------------------------------------------------------------------------- 1 | python-3.5.1 -------------------------------------------------------------------------------- /static/favicon.ico: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/zkwi/textSummary/af5429a494ce653c5f1f6f3b5bab24bdbfce6a3b/static/favicon.ico -------------------------------------------------------------------------------- /static/index.html: -------------------------------------------------------------------------------- 1 | 2 | 3 | 4 | 文档摘要生成 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 |
17 |
18 |
19 |
20 |
21 |

输入正文

22 |
23 |
24 |
25 | 标题: 26 |
正文: 27 |
28 |
29 |
30 |
31 |
32 |
33 |
34 |
35 |

摘要

36 |
37 |
38 | 摘要: 39 |
    40 | 41 |
42 |
43 |
44 |
45 |
46 |
47 | 48 | 72 | -------------------------------------------------------------------------------- /static/testdata/data.txt: -------------------------------------------------------------------------------- 1 | 10月20日,国家主席习近平在伦敦白金汉宫出席英国女王伊利莎白二世举行的欢迎晚宴。新华社记者 鞠鹏 摄 2 | 3 |   国际在线专稿:中国国家主席习近平携夫人彭丽媛正在英国进行国事访问,由于这是中国国家元首十年来首次对英国进行国事访问,英国媒体对习近平夫妇的关注和讨论热度不断升温。不少媒体都在试图还原二人的生平,而他们的个人魅力也给英国媒体留下了深刻印象。 4 | 5 |   英国广播公司:习近平是中国人民的领导人,经常深入基层,体察民情。他用平实的话语告诫大学生,青年时期树立价值观非常重要,这就像穿衣服扣扣子一样,如果第一粒扣子扣错了,剩余的扣子都会扣错。所以,人生的扣子从一开始就要扣好。他曾在小餐馆排队买饭,不仅自己支付饭费,还跟民众一起用餐。他曾经不戴口罩深入棚户区视察,这让外界觉得普通人能够忍受的环境他也能忍受。总之,他不想让民众觉得自己遥不可及。 6 | 7 |   《每日快报》:习近平夫妇二人早期的成长历程都充满了艰辛。习近平早在青少年时代就离开在北京的父母,前往偏远的山区接受贫下中农的“再教育”。他推小车,建大坝,每天的粮食配给量很低,还要睡在“稻草铺成的床上”,但“逆境中的一切都有助于他日后性格的形成”。而彭丽媛年少时也经历过波折,但她最后却成为一名解放军少将。 8 | 9 |   文章进一步指出,习近平夫妇打破了西方对中国领导人夫妇的刻板印象。首先,二者非常亲民,因此更为人们所了解。习近平经常深入基层,走到人民群众中间,甚至到普通的小吃店享用简单的午餐。在爱尔兰,习近平曾一展球技,足球在他的脚上上下翻飞。彭丽媛则一改以往中国领导人夫人默默无闻的形象,大方地在各种外交场合“助夫君一臂之力”。她已成为国际舞台上的一位明星:她是世界卫生组织“抗击结核病和艾滋病”亲善大使,是联合国教科文组织“促进女童和妇女教育特使”,还是中国控烟形象大使。 10 | 11 |   其次,习近平夫妇在形象上非常现代、与时俱进。习近平在公开场合总是穿着笔挺的西装,而她的夫人彭丽媛仪态举止典雅端庄,两人给中国赋予了崭新的形象。这或许意味着“在中国的政治层面上,二人也会带来全新的变化”。 12 | 13 |   《每日邮报》:中国“第一夫人”彭丽媛访问英国首日连换三套服装,“惊艳全场”。在参加女王的欢迎仪式时,彭丽媛身穿白色裙子套装,搭配叶子形状的胸针,简洁大方,高贵典雅。20日下午,当习近平在英国议会发表演讲时,彭丽媛身穿深灰印花长衣外套,并搭配了一条浅灰丝巾。而当晚上的国宴开始时,彭丽媛换上了中长袖的深蓝色长裙晚礼服,腰间配了一条白色的腰带,再搭配白色珍珠耳钉和白色手包,气场十足。 14 | 15 |   报道还介绍了彭丽媛的背景,称她由于是歌唱家出身,所以习惯于暴露在镁光灯下,并时常“为过于严肃的政治舞台带来一抹亮色”。由于出生于盛产牡丹的中国山东菏泽市,彭丽媛出道时曾被称为“牡丹仙子”。凭借出色的嗓音与刻苦的努力,在23岁时,她就成为了中国家喻户晓的歌唱明星。 16 | 17 |   《每日电讯报》:作为中国的“第一夫人”,彭丽媛以她的迷人气质和优雅魅力征服了海内外。她致力于在各种场合推广中国文化,也积极投身于抗击艾滋病等公益事业。上个月习近平对美国进行国事访问期间,彭丽媛访问了茱莉亚学院,并亲自向学生们示范了民族唱法。去年3月,她陪同美国第一夫人米歇尔·奥巴马及其母亲和两个女儿参观了故宫。当年夏天,她又邀请前来参加南京青奥会的外国首脑夫人体验苏州刺绣。她在用自身的行动传播中国文化,人们从她的着装和思想上也能感受到中国文化的魅力。 18 | 19 |   《镜报》:在国际舞台上,彭丽媛所享有的声望绝不逊于英国的凯特王妃,但是很多英国人并不熟悉彭丽媛的生平。这位中国的“第一夫人”是一位在逆境中冉冉升起的明星。虽然年少时经历过一些波折,但由于在歌唱方面天资聪颖,加上勤奋刻苦,她在艺术之路上取得了巨大的成功。1983年,彭丽媛凭借在春晚上演唱的歌曲一炮走红,开始为广大观众所熟知。1986年,她经朋友介绍与习近平相识。一年后,二人便结了婚。 20 | 21 |   2013年习近平当选国家主席,彭丽媛的角色发生了变化。她开始淡出舞台,转而将重心放在公益活动上。她是多个国际组织的“大使”、“公使”,还成为了中国女性的“时尚代表”。她在2015年《福布斯》杂志评选的“全球最具影响力的女性”排行榜中位列第68位。 (杨欢 渠鸿儒) -------------------------------------------------------------------------------- /static/testdata/data1.txt: -------------------------------------------------------------------------------- 1 | (原标题:习近平同代表委员共商国是纪实) 2 | “十三五”,开局!全面建成小康社会进入倒计时。 3 | 4 | 3月的北京,亿万中华儿女的智慧和力量又一次在这里汇聚。 5 | 6 | 连日来,中共中央总书记、国家主席、中央军委主席习近平分别参加十二届全国人大四次会议上海、黑龙江、湖南、青海、解放军代表团审议,看望出席全国政协十二届四次会议的民建、工商联委员并参加联组会讨论,同代表委员们坦诚交流、共商国是,发出向着全面建成小康社会进军的号令。 7 | 8 | 向人民作出庄严承诺 9 | 10 | 对于来自湘西的苗族女代表郭建群来说,3月8日这一天不仅是节日,更是个让她终生难忘的日子。 11 | 12 | 上午9时,习近平总书记来到湖南代表团参加审议,听取了她的发言并同她亲切交流。 13 | 14 | 这是郭建群第二次见到习近平。2013年11月3日,习近平考察湘西土家族苗族自治州十八洞村时,作为州长的郭建群当面聆听了总书记关于精准扶贫的要求。 15 | 16 | 发言时,郭建群动情地说:“两年多来,我们牢记您的嘱托,按照精准扶贫要求去做,十八洞村的百姓收入增加了,村容村貌变化了,村民笑容多了、求发展愿望强了,连大龄男青年解决‘脱单’问题也容易了……” 17 | 18 | 习近平微笑着问她,去年村里有多少人娶媳妇? 19 | 20 | “7个。”郭建群答道。总书记满意地点头。 21 | 22 | 当得知全州还有50万贫困人口时,习近平问,条件比十八洞村还差的有多少?郭建群说,十八洞村的条件算中等的。习近平追问,不如它的有多少?“接近一半。”郭建群答。 23 | 24 | 全面小康,突出的短板在农村贫困人口脱贫。而打赢这场硬仗,最根本的方法是精准。 25 | 26 | 习近平勉励大家发扬湖南人吃得苦、霸得蛮、扎硬寨、打硬仗的优良传统,坚决打赢脱贫攻坚战。 27 | 28 | 今年全国两会上,习近平多次强调,要把脱贫攻坚作为“十三五”时期的头等大事来抓。 29 | 30 | 参加青海代表团审议时,西宁市回族中学高级教师拜秀花代表的发言引起习近平的关注。 31 | 32 | 拜秀花告诉总书记,这次来出席大会前,她专门对几个农牧区的学校进行了调研,发现变化是明显的。但是,乡村教师整体素质不高问题依然突出,特别是汉语和民族语言双语教师力量薄弱。 33 | 34 | 习近平指出:“扶贫先扶智,要更加注重教育脱贫,着力解决教育资源均等化问题,不能让贫困人口的子女输在起跑线上,要阻断贫困代际传递。” 35 | 36 | “‘十三五’时期是脱贫攻坚啃硬骨头、攻城拔寨的时期。” 37 | 38 | “必须横下一条心,加大力度,加快速度,加紧进度,齐心协力打赢脱贫攻坚战。” 39 | 40 | “确保到2020年现行标准下农村牧区贫困人口全部脱贫,贫困县全部摘帽,绝不落下一个贫困地区一个贫困群众。” 41 | 42 | 总书记一句句坚定的话语,令代表们倍感振奋,深知重担在肩。 43 | 44 | 脱贫攻坚时不我待,必须扎实推进。 45 | 46 | 呼应代表们的意见建议,习近平深刻指出打赢脱贫攻坚战必须注意把握好的问题。 47 | 48 | ——扶贫不能搞盆景。不能有的地方锦上添花,有的地方还是一贫如洗,依然如故,形成反差。不可复制、不可推广是不行的。这反而有副作用。 49 | 50 | ——脱贫和高标准的小康是两码事。我们不是一劳永逸,毕其功于一役。相对贫困、相对落后、相对差距将长期存在。要实事求是,求真务实,踏踏实实做这个事,不能搞数字游戏。考核要有正确导向,起到促进作用。 51 | 52 | ——要注重提高脱贫效果的可持续性。不能这几年集中力量打歼灭战,过了几年又返贫了。 53 | 54 | ——要把投身脱贫攻坚第一线作为促进干部成长的过程,作为考核识别、培养选用干部的重要渠道。 55 | 56 | ——抓工作不能狗熊掰棒子,我去过的每个地方我都抓反馈。有关部门都派人去看过,有的打招呼,有的不打招呼,看到是在认真抓落实,这很好。要坚持以民为本,民有所想所求,我们就要帮助他们,为他们服务。 57 | 58 | …… 59 | 60 | 坚定不移的决心,求真务实的态度。 61 | 62 | 这是中国共产党人向人民作出的庄严承诺。 63 | 64 | 引领发展全局深刻变革 65 | 66 | 创新,是习近平每年参加上海代表团审议时必讲的话题。 67 | 68 | 3月5日下午,他来到上海代表团参加审议,进一步指出,新发展理念是方向、是钥匙,首要的就是创新。 69 | 70 | 杨雄代表介绍了上海自贸试验区和科技创新中心建设的成果及思考;金东寒代表结合高校工作实践对强化产学研相结合的协同创新提出意见建议;朱志远代表结合政府工作报告,就推动科教融合发展,把创新推动发展落到实处作审议发言…… 71 | 72 | 习近平仔细倾听,时而伏案笔记,时而询问交流。 73 | 74 | 他强调,自由贸易试验区建设的核心任务是制度创新。科技创新中心建设则要瞄准世界科技前沿,全面提升自主创新能力,力争在基础科技领域作出大的创新、在关键核心技术领域取得大的突破。 75 | 76 | 当得知上海将获得过诺贝尔奖的国外专家留在上海长期工作,习近平说,要以更加开放的视野引进和集聚人才,加快集聚一批站在行业科技前沿、具有国际视野的领军人才。 77 | 78 | “志士惜年,贤人惜日,圣人惜时”,习近平语重心长地说,中国真正成为一个科技强国可能是两个五年、三个五年、四个五年,甚至是三十年、五十年。但我们必须把握时机,找对了创新驱动发展这条路,就要保持定力,一以贯之,锲而不舍地走下去。 79 | 80 | 创新是引领发展的第一动力,实施创新驱动发展战略是我国发展的迫切要求。 81 | 82 | “创新能力是一支军队的核心竞争力,也是生成和提高战斗力的加速器。”习近平在出席解放军代表团全体会议时强调,攻克制约我军建设和改革的突出矛盾,需要以创新的思路办法攻坚破难。 83 | 84 | 习近平曾说:“发展理念搞对了,目标任务就好定了,政策举措也就跟着好定了。” 85 | 86 | 党的十八届五中全会鲜明提出创新、协调、绿色、开放、共享的发展理念,这是关系我国发展全局的一场深刻变革,也犹如一条红线,贯穿于习近平的“两会时间”。 87 | 88 | 在参加青海代表团审议时,习近平与贵德县河阴镇大史家村党委书记毕生忠代表有一段长达20分钟的对话,给人留下深刻印象。 89 | 90 | “贵德县在什么地方?”习近平问。 91 | 92 | “在西宁市的南端,离西宁76公里……”,毕生忠讲述了这几年村子发生的巨变,高兴地对习近平说:“我们那里的老百姓把你,怎么说,喜欢的不得了!”略带紧张却充满感情的一句话,赢得了全场掌声。 93 | 94 | “您讲过民族团结是生命线。我们村有6个民族。平常磕磕碰碰的事也会发生,但都不是民族问题。村里成立了‘调矛’小组,有问题都能解决。” 95 | 96 | “你说的是调解矛盾小组吧?” 97 | 98 | “调矛小组,我们那里就是这么简称的。” 99 | 100 | 会场上又是一阵笑声。 101 | 102 | “我们以前有个大型砖瓦厂,现在停办了,政府引导我们建了新型的建材企业,环保可持续发展。”毕生忠接着说。 103 | 104 | “青海的砖瓦生产是过剩还是平衡?”习近平问省里负责同志。 105 | 106 | 省委书记骆惠宁代表介绍说,过去有一批实心砖企业,现在全部转型…… 107 | 108 | 毕生忠接过话茬说,现在搞的是加气混凝土砌块,就是把火电厂的粉煤灰二次利用,技术含量比较高。 109 | 110 | “政府给你们补贴了吗?” 111 | 112 | “企业转型的时候,政府给了100多万元,建厂贷款600多万元又给了贴息。现在村里的养老、医疗参合都是我们集体企业代缴。” 113 | 114 | “你们现在都种什么庄稼?” 115 | 116 | “粮食这两年卖不上钱,政府动员我们种优质饲草,给牧区牛羊育肥。” 117 | 118 | “去年牛羊肉价格降了吧?” 119 | 120 | “2014年一斤羊肉能卖到23块钱,去年只卖到15、6块钱。现在我们办精加工,法式羊排牛排,规模化经营,市场化运作。”“这两年新农村建设,生活条件比城里说不上好,但也差不到哪去。”…… 121 | 122 | 一问一答间将协调发展理念诠释得淋漓尽致,给人以启示。 123 | 124 | 生态环境保护、绿色发展理念是习近平同代表委员们深入交流的又一个重要话题。 125 | 126 | 在黑龙江代表团,陆昊代表介绍说,扎龙、三江、珍宝岛湿地已经成为旅游热点。总书记叮嘱,一定要保护好湿地。 127 | 128 | 在湖南代表团,习近平关心土壤重金属污染治理情况,详细了解治理镉超标技术的特点、成本和治理周期,强调农产品绿色安全无小事。 129 | 130 | 在青海代表团,习近平询问推进中国三江源国家公园体制试点的情况,强调要保护好三江源,保护好“中华水塔”,确保“一江清水向东流”。 131 | 132 | 同代表委员们商议“一带一路”建设,强调把我国的边远地区建设成为辐射国际的中心地带;倾听来自老少边穷地区代表反映的意见建议,强调全面建成小康社会就是人人共享的小康,这是中国特色社会主义政治制度的本质体现…… 133 | 134 | 创新、协调、绿色、开放、共享,新发展理念就在这样的交流碰撞中生动具体起来,愈发深入人心。 135 | 136 | 努力形成发展新动能 137 | 138 | 7日上午9时,人民大会堂东大厅,灯光璀璨,80多名代表济济一堂。习近平来到这里参加黑龙江代表团审议。 139 | 140 | 东北地区经济发展,习近平倾注了大量心血。 141 | 142 | 继2013年到辽宁代表团、2015年到吉林代表团,习近平今年把除自己所在代表团外“下团”的第一站,选在了黑龙江。 143 | 144 | 去年7月,习近平在长春主持召开部分省区党委主要负责同志座谈会指出:“振兴东北老工业基地已到了滚石上山、爬坡过坎的关键阶段。”12月,主持召开中共中央政治局会议,审议通过《关于全面振兴东北地区等老工业基地的若干意见》,为东北振兴提供了重要遵循。 145 | 146 | 明确了发展目标,确立了新发展理念,实现发展新跨越的动力又在哪里? 147 | 148 | 会场上,代表们发言踊跃,谈了很多基层一线的真实情况,既充满忧患意识、问题导向,又表达出振兴发展的必胜信心。 149 | 150 | 来自鹤岗的武凤呈代表指出了全省4大煤城面临的6大挑战:资源枯竭、产业单一、经济总量在全省占比下降、财力拮据、人才匮乏、就业艰难。 151 | 152 | 国企老职工王波代表分析了黑龙江省发展机器人产业等的比较优势,建议国家将一些重大项目、重点工程、重要平台布局在黑龙江。 153 | 154 | 习近平高度重视大家的意见建议,要求到会的有关部门做认真研究。 155 | 156 | 他指出,对国有企业发展,政府的作用更多体现在支持、扶持、杠杆作用,但没有现成的“金娃娃”摆在那里。这种情况下,国有企业要“借东风”,激发内生动力,在竞争中增强实力。 157 | 158 | 4个月前,习近平主持召开中央财经领导小组第十一次会议,首次提出“着力加强供给侧结构性改革”的重大论断。 159 | 160 | 这一次,在参加湖南代表团审议时,习近平从湖南经济社会发展说开去,强调“推进供给侧结构性改革是一场硬仗”。 161 | 162 | “要把握好‘加法’和‘减法’、当前和长远、力度和节奏、主要矛盾和次要矛盾、政府和市场的关系。” 163 | 164 | “我国农业主要矛盾已经由总量不足转变为结构性矛盾,解决这一矛盾的根本出路在于推进农业供给侧结构性改革,提高农业综合效益和竞争力。” 165 | 166 | …… 167 | 168 | 内涵不断丰富,指向日益明晰,认识更加深入。湖南代表团詹纯新代表在发言中说:“今天不忍痛转型,明天就会面临更大痛苦。” 169 | 170 | 面对经济下行压力加大,转换发展动能尤显迫切。 171 | 172 | 如何更好发挥民营企业在形成发展新动能中的特殊作用,习近平念兹在兹。 173 | 174 | 在习近平的经济思想和发展思路中,坚持公有制为主体、多种所有制经济共同发展,这一点从未动摇。 175 | 176 | 3月4日下午,习近平专程看望参加政协会议的民建、工商联委员并参加联组会。听取了10位委员发言后,习近平讲了话,用“两个毫不动摇”“三个没有变”,释放出支持非公有制经济发展的重要信号。 177 | 178 | “希望广大非公有制经济人士准确把握我国经济发展大势,提振发展信心,在‘一带一路’建设、京津冀协同发展、长江经济带发展等方面做大文章,在新常态下有新作为。” 179 | 180 | 总书记的嘱托,让很多民营企业家深受鼓舞。 181 | 182 | 王文彪委员深有感触地说,总书记给民营经济吃了定心丸,注入了强心剂。现在经济有一些困难,但不能因此停步不前,这就是民营企业的韧劲。 183 | 184 | 为全面建成小康社会掌舵领航 185 | 186 | “紧摇桨来掌稳舵,双手赢得丰收年。” 187 | 188 | 一首《乌苏里船歌》,半个世纪,传唱不衰。如今,赫哲族群众正和全国人民一道,疾步前行,奔向全面小康。 189 | 190 | 在黑龙江代表团,赫哲族“80后”代表刘蕾对总书记说,在兴边富民工程等政策帮扶下,我们的生活就像歌中唱的那样,走上了幸福路。这路越走越宽广。 191 | 192 | 习近平亲切地说,这首歌早就耳熟能详,还会哼唱。歌中描绘的就是中华民族大家庭和睦团结的美好景象。 193 | 194 | 一位代表对刘蕾说,等习总书记到咱们黑龙江考察的时候,就请你唱一曲《乌苏里船歌》吧。“行!”刘蕾爽快地答应。 195 | 196 | “中国号”巨轮乘风破浪,行稳致远。 197 | 198 | 人民在这里看到,领航者的勇气担当,实现梦想的坚强保障。 199 | 200 | ——中国是中国共产党领导的社会主义国家,这是我们的特色也是本质。 201 | 202 | ——要想办法调动制造业工人、农民工的积极性,把工人阶级主人翁的地位体现出来。这是社会主义的本质要求。 203 | 204 | ——新型政商关系,概括起来说就是“亲”、“清”两个字。 205 | 206 | ——要提高领导干部运用法治思维和法治方式开展工作、解决问题、推动发展的能力,积极培育社会主义法治文化,引导广大群众自觉守法、遇事找法、解决问题靠法,让依法办事蔚然成风。 207 | 208 | ——要保护作风正派、锐意进取的干部,真正把那些想干事、能干事、敢担当、善作为的优秀干部选拔到各级领导班子中来。 209 | 210 | ——两岸关系和平发展成果需要两岸同胞共同维护,开创共同美好未来需要两岸同胞共同努力,实现中华民族伟大复兴需要两岸同胞携起手来同心干。 211 | 212 | ——推进政治建军、改革强军、依法治军,加强军队建设和军事斗争准备,确保如期实现国防和军队现代化建设“三步走”发展战略第二步目标。 213 | 214 | …… 215 | 216 | 党的主张、人民的意愿、国家的意志,汇聚在中国特色社会主义生动实践中,凝结成一往无前的磅礴力量,向着全面建成小康社会的美好明天,向着中华民族伟大复兴更加灿烂的未来,前进! 217 | 218 | 来源:新华社 -------------------------------------------------------------------------------- /static/testdata/data2.txt: -------------------------------------------------------------------------------- 1 | “当你老了,头发白了,睡意昏沉……”这首改编自叶芝诗作的歌曲,在被广泛传唱的同时也总会让人不由联想“养老”这个沉重话题。 2 | 3 | 全国老龄办原常务副主任陈传书今年已62岁,在他看来,尽管多年前就已成为战略研究课题,但老龄化程度仍然超过预期。 4 | 5 | 比陈传书年长一岁的王晓初曾任人社部副部长,他认为随着老龄化加剧,养老金虽有压力但总有解决办法。 6 | 7 | 对于备受关注的延迟退休问题,王晓初说,改革不会损害大多数人的利益,与其现在“争吵”不如在今年征求意见方案出台后再尽情讨论。 8 | 9 | 过去一年时间来,异地养老模式受到人们的普遍关注,对于异地养老施行的可行性也出现了不同的声音和意见。全国人大代表、全国老龄办原常务副主任陈传书在接受北京青年报记者采访时表示,对于异地养老模式,应以市场来进行调节,把选择服务的权利交给老人。目前社会程度已经超过了最初进行战略研究时的预期。 10 | 11 | 关键词 12 | 13 | 老龄化 14 | 15 | 现在的老龄化程度超过预期 16 | 17 | 北青报:您曾经在全国老龄委工作过很长一段时间,每个时期工作重点应该是不一样的吧? 18 | 19 | 陈传书:虽然以前国家对人口老龄化问题的认识还不是很深,但我们那段时期工作重点主要就集中于组织研究应对人口老龄化的战略。有20多个国家机关、400多名专家参与其中,持续了四年多时间。很多当时的战略都转化为现在的政策了,比如延迟退休、生育问题,在研究时都有提到。 20 | 21 | 北青报:在进行战略研究时,是否已经预料到了现在老龄化的程度? 22 | 23 | 陈传书:虽然当时做了预测,但最近两年人口老龄化程度发展仍要快于预期。当时估计的生育率在1.8%左右,但目前每年的生育人数确实要低于这个数字。 24 | 25 | 北青报:您认为超过预测程度的原因在哪里? 26 | 27 | 陈传书:这主要是因为对生育率估计偏高以及城镇化发展速度快有关。在城镇化发展过程中,较好的医疗条件使预期寿命得以延长,同时因工作、生活压力等方面的原因,城市人口的生育率较低。 28 | 29 | 养老模式 30 | 31 | 异地养老应靠市场进行调节 32 | 33 | 北青报:“老年产业”这个词在这几年越来越多地被提起,这和以往我们的养老模式有哪些区别? 34 | 35 | 陈传书:相比以往由政府主动、偏重于福利性质的老龄事业,组成养老产业的更多是养老服务业的市场化机构。而随着养老保障制度的完善,以及市场机制的发展,养老产业所占比重越来越大。 36 | 37 | 北青报:目前我国老年产业发展的程度如何? 38 | 39 | 陈传书:从目前中国整个养老产业的发展来看,这还是个新生事物。制约养老产业发展的因素是老年人支付能力的问题。目前一些老年人是有消费欲望的,但缺少支付能力。对于养老产业自身来说,也需要注意“适销对路”的问题,从养老服务的档次、布局来分析老年人的基本需求。 40 | 41 | 北青报:过去一年里,异地养老模式被人们广泛关注,但在具体施行上,似乎还有一些社保政策需要完善。 42 | 43 | 陈传书:这就涉及到了异地接续的问题,目前政府方面也明确了会逐步进行解决。比如一些原本户籍在当地的老人才能享有的福利政策,对于异地养老的群体,可以由居住的年限来决定是否享有。一般对老年人来说,最大的问题还是异地就医报销。在实现全国统筹后,这个问题可能会得到解决。 44 | 45 | 北青报:以京冀两地为例,河北地区计划推进当地养老设施的建设,而北京的有关部门也计划制定引导中心城区老年人入住非核心功能区养老机构的方案,在您看来“异地养老”模式该如何推进? 46 | 47 | 陈传书:对于“异地养老”模式还是应以市场来进行调节,把选择服务的权利交给老人。随着养老服务体系规范化,政府应由“补机构”向“补人头”转变,也就是将补贴发给作为服务对象的老年人,以此来解决支付能力不足的问题。通过货币化的方式把钱补给老人,至于选择在哪里养老,根据个人情况自己决定。 48 | 49 | 养老金缺口 50 | 51 | 控制抚养比解决养老金缺口 52 | 53 | 北青报:目前从一些省份公布的数据来看,未来几年内养老金的缺口可能达到上千亿元,这么一个庞大的数字,是否真的会对养老金的发放产生很大的影响? 54 | 55 | 陈传书:养老保障制度的可持续性,主要还是看制度内的抚养比是多少。我们之前在做战略研究时,提出的目标是在2030年之前将抚养比控制在2:1,这个比例也被看做人口老龄化的危机时点。目前的缺口可能只是暂时现象。 56 | 57 | 北青报:有些地区寄希望于尽早实现职工基础养老金全国统筹,这样的想法是否可行? 58 | 59 | 陈传书:控制好制度内的抚养比仍是首要的问题。这就好比所有鸡蛋装到一个篮子里,不解决这些问题,统筹以后问题会更集中。 60 | 61 | 北青报:那么您认为有效控制制度内抚养比的办法是什么? 62 | 63 | 陈传书:一是延迟领取养老金的时间。比如在日本,60岁退休也要在65岁开始领取养老金。这也有日本传统做法和文化在里面,单位在退休时会发给两年的工资。就目前我国延迟退休的做法来看,因涉及青年人就业问题,每一年延迟几个月是有一定效果的。但我们预测2020年之后,人口老龄化的高峰就将到来,单靠这个还是不够的。 64 | 65 | 还可以尝试扩大养老金制度的覆盖面,比如随着城镇化的进程,将外来务工者也吸收进城镇职工养老保险范围之中。这就需要解决正规化就业的问题,同时户籍制度的逐步放开也有利于于此。 66 | 67 | 全国人大代表、全国人大外事委员会副主任委员、人社部原副部长王晓初15日告诉北京青年报记者,随着老龄化加剧,养老金的确有压力,但是国家对这样一项民生领域肯定会很重视,肯定会有解决的办法。王晓初说,前几年自己说过延迟退休是大趋势被很多网友骂,今年延迟退休征求意见方案将出台,现在大家对此的认识趋于理性。 68 | 69 | 养老金来源 70 | 71 | 目前不用担心养老金不够用 72 | 73 | 北青报:经常有舆论对养老金的来源表示担心。 74 | 75 | 王晓初:养老金来源是明确的,这么多年都有来源。比如说所有参加养老保险的都交钱,这是最主要的来源,另外就是财政也会有一定的补贴,前一段中央也明确国有资本也有的要到养老金中来。我们从来没有认为养老金来源是一个不可解决的问题。 76 | 77 | 北青报:随着时间推移,会出现缺口吗? 78 | 79 | 王晓初:现在还在扩大参保人数,有新人要进来,不是没有人进来,另外一方面,国家财政要做补贴。此外,我们讲延迟退休,一定程度上就是要缓解老龄化带来的抚养比提高的压力,肯定可以起到一定作用。当然,这需要多方面想办法,目前为止多方面算下来不用担心。 80 | 81 | 北青报:随着老龄化加剧,抚养比更高,怎么解决这个矛盾? 82 | 83 | 王晓初:当然会有压力。现在就有压力,再往后走,特别是老龄化程度高的地方,压力更大,比如上海,财政给包括养老在内的社会保险的补贴数额相当大,那里实行了一段自愿的延迟退休,因为抚养比特别高,确实财政有压力。但就我们全国来讲,远没有到那个程度。就是发展到2050年代,老龄化、抚养比达到一个峰值,比现在压力大,但还没到上海的水平。这事儿对我们来讲有压力,但总有解决办法。 84 | 85 | 养老靠谁“养老靠自己”理解上有偏差 86 | 87 | 北青报:社会上流传着一个说法,说以前宣传的是政府来养老,后来成了政府帮养老,后来成了养老靠自己。 88 | 89 | 王晓初:退休金制度是财政保障,养老金制度是共济保障。这是完全不同的两套制度,两种可比性不大。从财政资金直接保障转到社会保障上来,是社会管理制度的重大变革,这也是经济制度决定的。 90 | 91 | 我们从计划经济到市场经济转变,市场经济条件下不可能靠财政来解决社会保障领域的所有问题,还要发挥市场机制和作用。不能设想经济体制是市场经济,养老还是计划经济体制的,那样是不配套的,问题和矛盾会更多。 92 | 93 | 北青报:可能有些人对共济的理解有偏差? 94 | 95 | 王晓初:共济这个概念当中,现在国家并不是没有投入,机关事业单位工资都是国家给的,贫困人口参加社会保险国家是有救济的,替你支付,社保补贴大量是用于这个。此外,不可能说个人支多少拿多少,如果每个人投进去多少钱,就要拿到多少,那就没有共济了,那就成存款储蓄了。每人都拿回自己这一份,那保险就失去意义了。 96 | 97 | 延迟退休 98 | 99 | 改革不会损害大多数人的利益 100 | 101 | 北青报:延迟退休是近年来社会一个热点话题。 102 | 103 | 王晓初:我也有同学朋友见面问我,包括这几天有代表问我这个问题,能感觉到大家对这个的关心。作为一项大的改革来讲,总的成果不能损害大多数人的利益,否则大家都反对,改革没法推进。但是不否认在其中个别群体个别人的利益会受到一定程度的损害,这个是完全可能的。 104 | 105 | 延迟退休已经争论多年,三中全会最后拍板肯定要做,渐进式的延迟退休,按照这个思路在做具体方案。方案很快要出,方案讨论好了,对大家都有用,也关系到每一个人,在方案之外讨论半天也解决不了问题。 106 | 107 | 北青报:对于延迟退休的不同意见你也有所体会吧? 108 | 109 | 王晓初:前两年我有一次说过延迟退休是大趋势,有个认识的人见我说网上有骂你的,我不知道,上网去查了一下,真是这样。当时炒得很厉害,我觉得可以理解,希望延迟退休的和不希望延迟退休的是不同的群体,而且不希望的这个群体人数相对更多,但这是必然的一个大趋势。 110 | 111 | 北青报:延迟退休遇到的反对声音相对比较广泛,怎么看这问题? 112 | 113 | 王晓初:这里有个问题,现在有一种社会风气不是鼓励大家多劳动,而是不干活白拿钱,少劳动多拿钱。这样的情况下讨论延迟退休,那就会出现你尽量让我少干活,多拿点钱的观点。是不是存在的舆论就是正确的,我觉得未必。 114 | 115 | 北青报:你认为这样的争论在近年来有何变化? 116 | 117 | 王晓初:今年网上炒这事儿的少多了,去年还多一点,大家不再那么关注了,网民没有更多特别激烈的反应,大家逐步能够理性对待这些问题。本组文/本报记者 李泽伟 -------------------------------------------------------------------------------- /static/testdata/data3.txt: -------------------------------------------------------------------------------- 1 | 参考消息网3月16日报道 外媒称,在汉学家的世界中,阿兰·佩尔菲特的“当中国觉醒”的著名论断现在被“当中国老去”所替代。老龄化的现象已经出现并构成了巨大挑战。大多数专家都认为,挑战相当严峻,因为中国在富起来之前就已经衰老。 2 | 3 | 据法国《费加罗报》3月15日报道称,法国国家人口研究所研究员、中国人口研究问题专家伊莎贝尔·阿塔内在最新的著作《精疲力竭的中国》中深入剖析了这一人口变化转折。 4 | 5 | 一谈到中国,数字的规模就会让人头晕。据统计,2030年中国人口将达到峰值,即14.5亿人。阿塔内强调,自此开始,亚洲巨人将每年减少500万人口。根据预测,中国到世纪末的人口将不到10亿,甚至根据联合国的一项最低假说是6亿人。作者认为,性别比失衡以及比德国、日本和韩国还要快的老龄化节奏都导致中国的情况是“世界独一无二的”。 6 | 7 | 报道称,人口结构的新阶段对经济和社会的影响深刻而巨大。它已经在一些人们起初根本想不到的不同寻常的领域展现影响。墓地就是一个问题。中国在领土面积上是全球第三大国,但是它仍旧缺墓地,包括缺乏放置骨灰瓮的地方。阿塔内写道,每年这方面用地达30多平方公里,相当于巴黎市区面积的三分之一。 8 | 9 | 报道称,接下来还是数字。中国80岁以上人口已经达到2000万(截至2014年底应为2400万--本网注)!如何照顾他们?除了冰冷的数字,阿塔内在书中还给出了很多农村退休者和“三明治世代”(同时照顾父母和孩子的人)的鲜活例证。 10 | 11 | 报道称,中国能否对这一挑战?去年10月,独生子女政策的终结就是一个具有极强象征性的初步回应。阿塔内认为,这一措施还完全不足以解决老龄化问题。但她也表示,过去的经验证明中国知道如何面对难以克服的问题。 -------------------------------------------------------------------------------- /static/testdata/data4.txt: -------------------------------------------------------------------------------- 1 | (原标题:美国国会挺台入国际刑警组织 呼吁奥巴马尽快签署法案) 2 | 【环球时报】 3 | 美国众议院14日晚通过支持台湾参与国际刑警组织法案,并呼吁奥巴马尽快签署法案。对此,上海台湾研究所常务副所长倪永杰15日对《环球时报》称,大陆对台湾加入国际组织的立场很明确,即必须坚持一个中国原则,通过两岸协商做出合情合理的安排,不能由其他第三方外力来干预。 4 | 5 | 据台湾“中央社”15日报道,美国众议院于美东时间14日晚间以记名投票方式,以381票赞成0票反对,全数支持通过参议院版本的法案,支持台湾以观察员身份参与国际刑警组织。参议院于8日以一致同意方式,通过由加德纳与卡登联名提出的第2426号法案,支持台湾以观察员身份参与国际刑警组织。参众两院协调完成立法程序,依据条文,美国国务卿将提出协助台湾参与国际刑警组织的策略,90天内向国会提出非机密性报告,法案将送白宫,奥巴马签署后,正式生效成为具有约束力的法律。 6 | 7 | 1984年9月,第53届国际刑警组织年会表决通过接纳中国加入。中国坚持中华人民共和国是唯一合法政府,台湾可以“中国台湾地区警察组织”的名义留在组织内,但不能派团长,无表决权。表决后,台湾代表团发表“抗议”声明,全体退出会场。 8 | 9 | 上海台湾研究所常务副所长倪永杰15日接受《环球时报》采访称,美国国会这样做是想向美国政府施压。美国政府应恪守一个中国政策和中美三个联合公报的原则,不得干涉中国内政,尤其是在当前形势下,不要向即将上台的民进党释放错误信号。倪永杰建议,中国全国人大和外交部应该发声,谴责美国国会的做法,敦促美国政府严肃谨慎面对该议题。 -------------------------------------------------------------------------------- /static/testdata/rujia1.txt: -------------------------------------------------------------------------------- 1 |   酒店道歉称努力改正 当事人表示“太失望”   2 | 3 |   南都讯 从前日起,一名女生挑动了整个网络的神经。网友@@弯弯_2016发微博称,自己在北京望京798和颐酒店深夜遭遇劫持,并得到朝阳警方证实。随后,该话题在网上产生巨大反响。话题“和颐酒店女生遇袭”,截至昨晚阅读量已达16 .6亿次,讨论数204 .7万条。 4 | 5 |   针对网上质疑当事人的身份,南都记者调查发现其曾就职于浙江某媒体,从事广告相关工作,现已离职。 6 | 7 |   当事人微博引发关注 8 | 9 |   4月5日凌晨,@@弯弯_ 2016发微博称,自己通过携程预订的如家旗下和颐酒店(望京798店),4月3日晚上十一点在她回酒店时遭遇陌生男子尾随及强行拖拽,险遭劫持。弯弯上传的监控视频显示,一名酒店保安在她呼救后赶到旁边,全程在场但并没有给予任何帮助,直到一名路过的女房客拉住弯弯的手,才使得她未被拖入楼道,随着房客纷纷开门围观,欲实施“劫持”的男子逃走。当晚,北京警方通过官微证实此事,并称已介入调查。 10 | 11 |   昨天凌晨,如家酒店集团官方微博回应称,立即调查此事,并正在积极配合警方调查,希望与当事人取得联系。该微博后来被删除。与此同时,携程也发布了回应,携程旅行网官方微博建议客人及时报警,如有需要,携程会配合警方调查。 12 | 13 |   当事人弯弯称,在与如家方面电话沟通时曾提出4点要求:1、修改公告中不实之处;2、公开道歉,给个解释和交代,以及事后处理;3、酒店内部清查;4、酒店管理上有严重漏洞,如果再发生相关案件有什么样的应对措施。然而,这些要求未获立即回应。 14 | 15 |   如家致歉称努力改正 16 | 17 |   昨日16时左右,如家集团召开了有关此事的发布会。 18 | 19 |   和颐品牌北京地区总经理刘红妮、北京望京798和颐酒店总经理宣读了一份来自酒店的声明,声明指北京望京798和颐酒店在事件处理中确实存在安保管理方面、顾客服务不到位的问题,酒店管理、服务人员在对顾客的关注和处理问题的效率等问题上存在缺失。 20 | 21 |   刘红妮还表示,如家酒店集团将对望京798和颐酒店进行整改,追究酒店管理人员责任,并加强全国酒店出入人员核查、各区域监控、巡查检查和服务工作的力量,在今后的管理和服务中,各酒店也将以此为戒,全力提供安全、舒适的消费环境。“对此事当事人深深致歉,对网络各种传言,警方会有一个调查结果。” 22 | 23 |   对此,当事人弯弯发微博表示:“太失望。”而在昨晚,如家集团CEO孙坚对南都记者回应:“没有任何理由,只有努力改正!” 24 | 25 |   报导南都记者获悉,当事人弯弯今年27岁,浙江丽水人,目前生活在杭州。曾就职于浙江某媒体,工作曾与广告业务有关,现已离职,在某企业就职。 -------------------------------------------------------------------------------- /static/testdata/rujia2.txt: -------------------------------------------------------------------------------- 1 |   华西记者现场追踪和颐酒店女生遇袭:酒店承认管理有瑕疵,承诺整改 2 | 3 |   “我们都害怕成为和颐酒店遇袭的女生” 4 | 5 |   不是每一个被侵犯的女生都“有幸”遇到一个不那么冷漠的路人,不是每一个事件都能“有幸”成为被刷屏的热点,拿什么安抚公众的恐惧不安? 6 | 7 |   我们需要勇敢的朝阳群众,需要路见不平一声吼的路人,需要不渣的酒店,更需要一求助就有回应的救济途径来消除我们的不安。 8 | 9 |   “这年头,没点功夫还不配出门了是吧” 10 | 11 |   “这件事跟女生本人是否与犯罪嫌疑人是情侣关系,犯罪嫌疑人是否醉酒毫无关系。他俩就算在酒店开房过结婚纪念日,在女性明显反抗的情况下,酒店都有义务保护住客安全,警方都应及时立案。别一出事就让女孩子多小心,然后传播防狼十八式什么的。我们来到这个世界上,不是为了跟歹徒搏斗的。这年头,没点功夫还不配出门了是吧?!” 12 | 13 |   4月5日,微博话题“和颐酒店女生遇袭”的话题迅速在微博上引爆,登上这个负面头条的除了如家,还有于今日宣布收购如家的首旅酒店(600258,股吧)。此话题引爆同一天,首旅酒店发布公告,宣布4月1日已完成对如家酒店的收购,且如家酒店集团美国存托股份已停止交易。 14 | 15 |   4月6日一早,当事和颐酒店方面召集媒体欲做出回应,华西都市报记者于上午10:30左右到达望京798和颐酒店,在现场苦苦守候了5个小时,和颐酒店相关负责人才出现做出回应。 16 | 17 |   事件回顾女孩单独入住和颐酒店遇袭 18 | 19 |   4月3日晚10:50左右,来北京出差的@“弯弯”独自来到望京798和颐酒店,办理入住后前往房间。没想到却在出电梯后遭到陌生男子强行拖拽施暴。该网友在微博中写道“当时我房卡一下没找到,然后走出电梯到过道上找房卡。这个男的就过来问我你在哪个房间的?我说干嘛我又不认识你,他就开始强行拖我走。并且用力掐我的脖子和脸颊不让我呼救。本来我想下楼逃跑,他拉着我的头发把我往楼梯通道拖,幸好我坐在地上不方便他拉才延长了被救的时间。” 20 | 21 |   “弯弯”在微博中称,该男子27岁左右,身穿黑色皮衣,牛仔裤,瓜子脸,“看得出来非常清醒。”在拖拽过程中,“弯弯”不停地尝试呼救,不过和颐酒店工作人员认为是“夫妻俩吵架”并未上前制止,所幸当“弯弯”快要被拖去没有视频监控的楼梯间时,一位女房客察觉危险拉住了“弯弯”。其后陆续有人打电话到前台、从房间内走出来围观阻拦。“弯弯”才最终脱险。 22 | 23 |   如家回应 24 | 25 |   承认管理瑕疵追究管理人员责任 26 | 27 |   4月6日,本报记者在和颐酒店媒体发布会现场发回报道,早上10点多,40多位记者被挨个登记身份证等信息后,由和颐工作人员带进二楼会议室发布会厅等候官方做出回应。12点40分左右,工作人员以“领导指示”为由把记者们带回酒店一楼大堂,面对记者“领导什么时候来?发布会还开不开?”等询问,工作人员均表示不知道。 28 | 29 |   这样被“带来带去”五个小时后,“姗姗来迟”的和颐酒店相关负责人终于露面,但是整个回应过程非常简短,核心内容仅4分钟左右,也并未给予记者提问的机会。下午3:40左右,如家发布最新的官方声明:承认管理有瑕疵,对当事人和公众道歉,将对望京798和颐酒店做出整改,追究酒店管理人员责任。并加强全国酒店出入人员的检查、各区域的监控、巡视检查和服务工作质量。 30 | 31 |   遇袭女子 32 | 33 |   酒店道歉后发微博称“太失望” 34 | 35 |   遇袭女子@弯弯_2016 6日下午一点多发布最新微博称“如家方面说会在晚上8点前给到一个满意的答复。”但记者从今天早上一直试图联系遇袭女子,但女子一直不接电话,不回短信,微博私信也无回复。在和颐酒店发布道歉声明后,她又发布一条新微博:“太失望”。 36 | 37 |   携程回应 38 | 39 |   小卡片属于酒店私下行为 40 | 41 |   4月6日一早本报记者在和颐酒店等候发布会时询问一位女房客,她表示在微信上看了这事,问起来才晓得自己住的酒店就是事发酒店,一脸惊恐。并且此房客表示,早上起来,还看到房间有塞小卡片。 42 | 43 |   通过携程预订房间的“弯弯”在微博中称,“这家酒店在派出所有卖淫案底,为何一个有卖淫案底的酒店还有营业资格,没有停业整顿,并且还能在携程上预订?”对此,记者联系了携程的媒体发言人,对方称,对于“弯弯”女士的事件,携程会全力配合警方调查。“携程会对入住酒店进行营业执照等工商资质做依法审核,酒店有小卡片或者案底,属于酒店的私下作为。” 44 | 45 |   首旅回应正在开会讨论 46 | 47 |   “女生遇袭”事件中,倒霉的不仅是“弯弯”,还有刚刚和如家“结婚”的首旅酒店。 48 | 49 |   4月1日,在美国纳斯达克上市近10年的如家酒店退市。同时,如家成为首旅酒店控股子公司,如家酒店集团的美国存托股份已停止交易,目前正在办理后续退市事宜。事件发生后,首旅酒店工作人员在接受媒体采访时称,公司正在开会讨论该事情,有结果了会披露。 50 | 51 |   有网友调侃,“完成交割、美国退市后立刻遇到这事件,这次受重创的应该是首旅。本来首旅可以凭借中概股回归+如家资产注入股价上涨一波的,现在估计悬了。”对此,浙商证券的郑建超认为:“和颐事件对首旅的影响要看如家的股份在首旅中的比重,虽然影响比较恶劣,但长期来看影响不大。并且首旅目前处于停牌状态,股价是否受影响,等到复盘看吧。” 52 | 53 |   成都和颐回应:安保措施没问题 54 | 55 |   女网友在北京和颐酒店遭袭事件仍在发酵。6日,记者了解到,成都市区总共有5家和颐酒店,通过询问得知,五家全部为加盟店。对于网上发酵的对酒店安全的质疑,有4家酒店表示,已经增强了安保人员的数量和巡逻频率,另一家酒店则表示,目前的安保力量已经足够。 56 | 57 |   当日下午2点左右,记者来到一环路东五段附近的和颐酒店。不时有行人在酒店门口驻足观望。这里的大堂经理沈先生说,这两日的客流量并没有发生明显变化。不过,发生了这样的事,一定程度伤害了和颐酒店的信誉。 58 | 59 |   他说,酒店自从新闻曝光后便加强了安保措施。“每天晚上都会安排人值班到晚上12点,12点后虽然回房休息但也处于随时待命状态。”除此之外,安保人员的巡逻频率也由原来的1小时一次,变为半个小时巡查一次。 60 | 61 |   记者又随后电话采访了一家和颐酒店,对方客服表示,酒店的安保人员已经足够,不需要加强安保措施。“我们酒店和物管方面都配有安保力量。” 62 | 63 |   六大疑点 64 | 65 |   酒店遇袭疑点重重 嫌疑人何时归案 66 | 67 |   1弯弯怎么录下视频? 68 | 69 |   弯弯上传的视频,是警察调取酒店监控录像时被弯弯翻拍的,那么警方为什么愿意让她翻拍这段视频?各地警方在很多公共事件中,对视频是非常珍惜的,一般以案件为由暂不公布。办案民警或许应该解释一下,这视频是怎么回事,可否由警方严肃地再公布一次? 70 | 71 |   2和颐酒店是否涉黄? 72 | 73 |   目前有传言猜测,穿皮衣的打人男子是色情服务公司的看场者,弯弯在找房卡的过程中被他误以为是外来的抢生意者。而酒店多处找到的小卡片已足够让人产生涉黄想象。这种涉黄,是酒店自己所为,还是外包经营行为,甚至散客自发所为,有待酒店自行澄清。 74 | 75 |   3爆炸式传播为何发生? 76 | 77 |   弯弯发微博的账号是专门为这件事情而注册的,但她新账号(理论上粉丝为0)第一条视频分享,得到了7万多个转发。而且是在4月5日00: 06——微博的非活跃时间。当晚8点10分的那条加了标签“#和颐酒店女生遇袭##卖淫窝点案底酒店#”的视频重发,得到了超百万次的转发。应该说这种活跃度和影响力,超出了史上所有大V。视频中的男子所为,确实令人发指,而弯弯确实楚楚可怜,观其微博,文字简省有力,长微博也制作得很精致,这些都有利于引起广泛关注,但百万级的转发数量还是很惊人,它超乎想象,也令人疑惑:究竟是什么样的外力让这条微博被推得这么高? 78 | 79 |   4企业合并与事件有关吗? 80 | 81 |   4月5日,首旅酒店发布公告,如家与首旅酒店完成合并,如家成为首旅酒店控股子公司。如家将从美国退市。按照中国旅游饭店业协会发布的排名,这是一项第14吞并第1的交易。巧的是,弯弯曝光如家旗下的和颐酒店,也是在4月5日。这种巧合,让不少网友产生联想。 82 | 83 |   5皮衣男打电话说了什么? 84 | 85 |   皮衣男揪住弯弯纠缠了多次,其间皮衣男曾打电话(不止一次)。男子打电话究竟说了什么?关于这个部分,弯弯在微博上没有详细说过。现场的酒店员工身份已经确认,作为在场者和员工,他有责任出来提供证言,以重述现场,也希望当时走过来的住客能够提供证言。 86 | 87 |   6皮衣男去哪儿了? 88 | 89 |   6日下午高度形式化的记者会结束后,有记者问现场基层工作人员,“他(皮衣男)怎么进去的”,对方答道“我哪儿知道”。事情不应该这样草率,酒店方面不仅有义务回答皮衣男是怎么进去的,更有义务回答,他是不是酒店的住客,以及他去哪儿了。现场警察问得好:“这人(皮衣男)在不在你们这儿住,你们看不出来吗?”这个问题还可以问下去:这人是你们的员工吗,如果是,早点真相大白吧,如果不是,请协助警方,别再让打人拖人的皮衣男跑了! 90 | 91 |   向谁追责 92 | 93 |   女生酒店遇袭 能唤醒装睡的安保义务吗 94 | 95 |   和颐酒店女生遭劫事件,又一次暴露了国内酒店在安保执行效果上与法规要求和顾客诉求之间的鸿沟。 96 | 97 |   十多年前,最高法曾发布《关于审理人身损害赔偿案件适用法律若干问题的解释》,确立了住宿、餐饮、娱乐等公共场所需承担合理限度范围内安全保障义务责任。2010年7月开始施行的侵权责任法将这条司法解释上升到了国家层面的法律,规定宾馆、商场因未尽安保义务而造成人身伤害,要承担侵权责任;如果第三人的行为造成他人损害的,由第三人承担侵权责任;未尽到安全保障义务的宾馆商场则要承担补充责任。这些条款已经从法律层面确立了酒店的安保义务,但在司法实践中并未形成裁量的统一性,也没有产生建立在这种统一性之上的震慑力。 98 | 99 |   观察近些年来一些偶然进入舆论视线的宾馆纠纷,基本上都处于个案个判的情况,依赖于当地具体情况、法官的自由裁量、甚至酒店与涉事顾客之间的私下协议和沟通,罕见能够厘清违反安保义务构成要件的典型案例。司法实践缺乏震慑力就会导致规则不确定,而行业规则不确定的直接后果就是,在事实上鼓励酒店宾馆将安保看做一种抽象的义务,习惯于等出了事儿再去想办法“平事儿”。 100 | 101 |   和颐酒店遇袭姑娘的遭遇曝光后,在愤怒谴责之外,酒店遇袭时如何自救也成为了公众讨论焦点。其中有一条办法说,一旦被劫持,要大肆破坏酒店财物,“唐三彩景泰蓝青花瓷摆设、大玻璃大镜子使劲砸,然后经理服务员和清洁工就不会让人把你拖走了。”这个建议想来令人心里发凉,它隐含的话语是:在酒店的价值排序中,财物要远比顾客值钱得多。不要指望酒店为你的生命安全担负义务,它只关心能否在与你的短期契约中实现权利最大化。 102 | 103 |   这种出现在酒店却不限于酒店经营的狭隘功利主义,与“不论一个人处于什么角色,只要人身权和生命权遭到威胁,就必须无条件救助”的现代人权概念形成了直接的对冲。 -------------------------------------------------------------------------------- /static/testdata/rujia3.txt: -------------------------------------------------------------------------------- 1 |   央广网北京4月7日消息(记者王逸群)据中国之声《新闻晚高峰》报道,北京望京798和颐酒店女子遇袭事件这几天持续发酵。今天下午2点多,女当事人弯弯发布微博称,如家方面与其做了进一步的沟通,并且提出了包括“如家方面承认集团的管理有严重错误”“承认和颐酒店安保工作有严重问题”等要求。此外,她还表示,没有接受也不接受任何形式的经济赔偿,仅仅希望如家对旗下所有酒店提出相应具体的整改措施。截至到发稿前,如家方面以及警方尚未发布进一步消息。 2 |   据了解,从该事件最初在微博曝光之后,迅速得到了网友的广泛关注,关键词搜索以及话题讨论数,都呈现爆发式增长。其速度之快,让不少人都感到惊讶。之后,各方媒体迅速跟进报道,也推动了事件的进一步发展。那么,该事件从最开始,为何能够迅速占领头条,并且得到网友的广泛关注?有网友推测,其背后会不会是一场有策划的炒作?真相到底如何? 3 |   4月5日,网民@弯弯_2016 的微博用户,在凌晨时分发布了一条自己在北京望京798和颐酒店遇袭的视频。截止到目前为止,微博话题#和颐酒店女生遇袭#总阅读量已超过20亿,有230万网友参与讨论,而4月4日才注册的微博账号@弯弯_2016,目前关注粉丝数已经达到了24万多。 4 |   事件发生后,微博上除了明星的转发和声援,包括伟大的安妮、屌絲打分蜻蜓隊長、王尼玛、作业本等众多知名微博博主均跟进关注。长期研究媒体数据挖掘以及网络舆情的清华大学教授沈阳认为,该事件之所以短时间内引起如此广泛关注,有多方面综合原因。除了民生类舆情本身火爆等因素,网络舆论中尤其是商业性网红、段子手的传播起到了很大推动作用。 5 |   沈阳说,在整个舆论的生成过程当中,我们舆论的关键节点,从原来的微博“大V”等,逐步让位给了段子手、营销号和网红。他们在舆论场中的话语权有所增强,同时这一类舆论的关键节点商业性很强。所以一旦遇到非敏感的时政话题,这一类账号会大量跟进,造成网络舆论的热炒。 6 |   在微指数上以“和颐酒店”为关键词搜索,可以看到该关键词从4月4日搜索量开始呈爆发式增长,截止到今天(7号)中午,已经接近220万次。而对搜索人群进行属性画像时,可以发现关注此热点的女性明显高出男性近4倍(女性占比约76%,男性占比约24%)。 7 |   沈阳教授指出,该事件中,包括女性安全、酒店涉黄等话题点交叉重合,公众的参与度很高。这个事件还拥有非常多的话题点,是一个拥有交叉话语重火力分布的场域,在这个事件中包括了女生安全、报警之后出警的迟缓,还有酒店的发布会尴尬场景——这种不太适应当下受众心理的发布会,以及整个事件是不是会出现反转的情况等等,存在太多的话题的切入点和吐槽的位置。近期,女性的话题大家普遍比较关注,整个社会完成代际更替之后,女生相关的话题会受到大家更高的关注度。所以女性的安全问题可以说是一个全民的话题,能够触发我们这个时代大家内心深层次的共鸣。 8 |   而就在昨天的采访现场,多位自称是关注妇女权益保护工作的志愿者,手持宣传单来到涉事酒店,呼吁大家关注公共空间内的妇女安全问题,并就涉事酒店提出若干点质疑。 9 |   志愿者说:“我们希望如家酒店集团能够考虑以下几个问题。1:贵公司是否有保安制度,能够保障消费者的人身安全权利。2:贵公司有无对工作人员进行相关公共暴力事件应急措施的培训。” 10 |   而根据清博大数据平台发布的调查数据,截止到今天中午,微信公众号中,已经有超过4500篇有关该事件的文章,阅读数超过了1100万。各类自媒体发布的文章,从“女生遇到危险如何自救”,到“事件背后真相分析”等等,都具有很高的阅读数。 11 |   沈阳教授表示,该事件会产生爆发式传播,也和该事件存在很多蹊跷点,使得事件充满了悬疑和议论空间不无关系。 12 |   除了对酒店的谴责等问题,网友热议最多的,也是比较特别的话题,就是“这是不是一个营销炒作?”根据@法晚壹现场的调查显示,近万名参与调查的网友中,有4.8%的网友认为“事件有人在后做推手,或为炒作”。 13 |   昨天下午,如家方面召开新闻发布会公开道歉,并且承认酒店在安全保卫等方面存在问题。但是这场发布会仅仅持续了5分钟左右,并且没有设置提问环节,酒店的道歉也被网友和弯弯指责为:没有诚意。那么涉事酒店是否应当承担相应的法律责任? 14 |   北京建豪律师事务所律师周雷指出,女当事人“弯弯”既然已经办理了入住手续,因此和酒店之间已经形成了事实上的合同关系。 15 |   上海市海华永泰律师事务所高级合伙人严嫣律师分析,因为涉事女子与酒店存在合同关系,因此酒店方有提供安全保障的义务,但是酒店在这方面的处理明显存在义务缺失。 16 |   严嫣认为,基于这个合同关系,酒店作为经营者和服务方是有安全保障的义务的。根据最高人民法院《关于审理人身损害赔偿案件适用法律若干问题的解释》,酒店至少要在硬件和软件方面做好工作。小姑娘的遭遇是在宾馆的走廊里面,她的呼救是有服务人员关注到的,但是相关工作人员和安保人员没有及时到位,这是软件服务不到位导致的安全保障义务的缺失。 17 |   上海市海上律师事务所律师刘晔认为,从目前掌握的信息来看,酒店想要证明在履行合同中尽到了相关义务,几乎不可能。 18 |   刘晔说,因为履行合同义务是由履行义务的一方承担举证责任,也就是说,酒店要证明在女子遭遇劫持的时候酒店尽到了安全保障义务,但显然目前酒店是证明不了这一点的。对于现在这个劫持事件,酒店很难证明自己尽到了安全保障义务,因此还是有责任的。 19 |   山西省太原市某经济型酒店前台经理周先生有十几年的从业经历。他透露,不同类型的酒店,都有不同的安全管理制度,但是想要做到安保工作滴水不漏,几乎是不可能的。白天保安有时候在停车场,楼层只有值班经理与客房经理,不是说只有一家酒店,现在很多酒店都控制不住外来访客。有的访客可以直接跟着在住客人就上楼了,这种情况很多情况下是避免不了的。 20 |   严嫣律师指出,从以上角度分析,涉事女子可以提出侵权赔偿,向酒店要求人身和精神损害赔偿。而对于视频中男子的行为,严嫣律师认为或己涉嫌劫持,最终结果需要警方在核实相关情况后给予定性。 -------------------------------------------------------------------------------- /static/testdata/test.json: -------------------------------------------------------------------------------- 1 | { 2 | "text": "  酒店道歉称努力改正 当事人表示“太失望”  \n\n  南都讯 从前日起,一名女生挑动了整个网络的神经。网友@@弯弯_2016发微博称,自己在北京望京798和颐酒店深夜遭遇劫持,并得到朝阳警方证实。随后,该话题在网上产生巨大反响。话题“和颐酒店女生遇袭”,截至昨晚阅读量已达16 .6亿次,讨论数204 .7万条。\n\n  针对网上质疑当事人的身份,南都记者调查发现其曾就职于浙江某媒体,从事广告相关工作,现已离职。\n\n  当事人微博引发关注\n\n  4月5日凌晨,@@弯弯_ 2016发微博称,自己通过携程预订的如家旗下和颐酒店(望京798店),4月3日晚上十一点在她回酒店时遭遇陌生男子尾随及强行拖拽,险遭劫持。弯弯上传的监控视频显示,一名酒店保安在她呼救后赶到旁边,全程在场但并没有给予任何帮助,直到一名路过的女房客拉住弯弯的手,才使得她未被拖入楼道,随着房客纷纷开门围观,欲实施“劫持”的男子逃走。当晚,北京警方通过官微证实此事,并称已介入调查。\n\n  昨天凌晨,如家酒店集团官方微博回应称,立即调查此事,并正在积极配合警方调查,希望与当事人取得联系。该微博后来被删除。与此同时,携程也发布了回应,携程旅行网官方微博建议客人及时报警,如有需要,携程会配合警方调查。\n\n  当事人弯弯称,在与如家方面电话沟通时曾提出4点要求:1、修改公告中不实之处;2、公开道歉,给个解释和交代,以及事后处理;3、酒店内部清查;4、酒店管理上有严重漏洞,如果再发生相关案件有什么样的应对措施。然而,这些要求未获立即回应。\n\n  如家致歉称努力改正\n\n  昨日16时左右,如家集团召开了有关此事的发布会。\n\n  和颐品牌北京地区总经理刘红妮、北京望京798和颐酒店总经理宣读了一份来自酒店的声明,声明指北京望京798和颐酒店在事件处理中确实存在安保管理方面、顾客服务不到位的问题,酒店管理、服务人员在对顾客的关注和处理问题的效率等问题上存在缺失。\n\n  刘红妮还表示,如家酒店集团将对望京798和颐酒店进行整改,追究酒店管理人员责任,并加强全国酒店出入人员核查、各区域监控、巡查检查和服务工作的力量,在今后的管理和服务中,各酒店也将以此为戒,全力提供安全、舒适的消费环境。“对此事当事人深深致歉,对网络各种传言,警方会有一个调查结果。”\n\n  对此,当事人弯弯发微博表示:“太失望。”而在昨晚,如家集团CEO孙坚对南都记者回应:“没有任何理由,只有努力改正!”\n\n  南都记者获悉,当事人弯弯今年27岁,浙江丽水人,目前生活在杭州。曾就职于浙江某媒体,工作曾与广告业务有关,现已离职,在某企业就职。", 3 | "title": "如家道歉遇袭事件称努力改正 当事人曾就职浙江某媒体" 4 | } -------------------------------------------------------------------------------- /static/testdata/test1.json: -------------------------------------------------------------------------------- 1 | { 2 | "text": "(原标题:习近平同巴基斯坦总统侯赛因互致贺电 庆祝中巴建交65周年)\n\n 新华社北京5月21日电 国家主席习近平同巴基斯坦总统马姆努恩·侯赛因21日就中巴建交65周年互致贺电。\n\n 习近平在贺电中说,中国和巴基斯坦是全天候战略合作伙伴。建交65年来,中巴关系经受住了国际风云变幻和各自国内情况变化的考验,不断向前发展。近年来,中巴关系保持强劲发展势头,两国全方位务实合作和人文交流取得积极进展。中国视巴基斯坦为推进“一带一路”建设的重要伙伴,中巴经济走廊的建设将为打造中巴命运共同体奠定坚实基础。我高度重视中巴关系,愿同你一道努力,开创中巴关系更加美好的未来。\n\n 侯赛因在贺电中说,65年来,中国一直都是巴基斯坦的“铁哥们”、坚定的朋友和值得信赖的伙伴。两国伙伴关系建立在相互尊重、相互信任和共同价值观的基础上,源远流长、不断发展。值此巴中建交65周年之际,我们回顾过去,展望未来,深信两国友谊历久弥新,前景广阔。作为两个拥有古老文明的现代国家的领导人,我们有责任让两国友好世代相传。\n\n 同日,巴基斯坦总理谢里夫也向习近平主席发来贺电。", 3 | "title": "习近平同巴基斯坦总统就中巴建交65周年互致贺电" 4 | } -------------------------------------------------------------------------------- /static/testdata/test2.json: -------------------------------------------------------------------------------- 1 | { 2 | "text": "(原标题:李克强对全国普通高等学校毕业生就业创业工作电视电话会议作出重要批示)\n\n 央视网消息(新闻联播):全国普通高等学校毕业生就业创业工作电视电话会议5月20日在北京召开。中共中央政治局常委、国务院总理李克强作出重要批示。\n\n批示指出:高校毕业生是国家的宝贵财富。近年来,各地区、各部门、各高校主动作为,千方百计促就业扶创业,高校毕业生就业一直保持较高水平,成绩来之不易。今年经济下行压力仍然较大,高校毕业生人数再创历史新高,各级政府一定要把促进毕业生就业创业作为当前十分重要而紧迫的任务,措施想得更实,工作抓得更紧。要进一步实施大学生就业创业促进计划,加强就业市场供需衔接和精准帮扶,多方拓宽就业渠道;进一步深入推进简政放权和商事制度改革,为广大毕业生投身创业创新清障减负,以创业带动就业;进一步加快发展新经济,不断催生新技术、新产业、新业态、新模式,创造更多适合高素质年轻群体的就业岗位。各方面同心协力,确保今年高校毕业生就业水平不降低,为完成全年经济社会发展目标任务作出新贡献。\n\n中共中央政治局委员、国务院副总理刘延东,中共中央政治局委员、国务院副总理马凯出席会议并讲话。", 3 | "title": "李克强对高校毕业生就业创业会议作出重要批示" 4 | } -------------------------------------------------------------------------------- /static/testdata/test3.json: -------------------------------------------------------------------------------- 1 | { 2 | "text": " 新华社北京5月20日电 人民日报5月21日评论员文章:两岸关系和平发展的政治基础必须维护\n\n  台湾当局新领导人的“5·20讲话”,虽然提及要继续推动两岸关系和平稳定发展,但对“九二共识”的核心意涵刻意回避,对两岸关系根本性质态度模糊。在必须明确接受两岸关系和平发展的政治基础这道必答题面前,她交出了一份没有完成的答卷。\n\n  过去8年来,两岸关系实现和平发展,关键在于两岸双方坚持体现两岸同属一中核心意涵的“九二共识”。“九二共识”经两岸双方明确授权认可、两岸领导人共同确认。它表明大陆与台湾同属一个中国,两岸关系不是国与国关系,不是“一中一台”。“九二共识”明确界定了两岸关系的根本性质,是两岸关系和平发展的政治基础。在涉及两岸关系根本性质的原则问题上,我们的底线是清晰的,立场是坚定的,没有任何模糊和妥协的空间。\n\n  两岸关系和平发展的成果,不是从天上掉下来的。“九二共识”是两岸双方建立政治互信、实现良性互动的前提和基础。国台办与台湾陆委会建立联系沟通机制,海协会与台湾海基会恢复协商谈判机制,两岸签署了23项协议,推进了两岸经济合作及各领域交流,减少了双方在对外事务上的摩擦和内耗,成就有目共睹。当前,要和平不要冲突,要交流不要隔绝,要协商合作不要零和对抗,已成为两岸主流民意。广大台湾民众迫切要求发展经济,改善民生,不希望两岸关系和平发展的良好局面因台湾政局变动而改变。台湾当局新领导人要“维持现状”,要继承和扩大两岸关系和平发展成果,就必须对两岸关系的性质这一根本问题作出明确回答。只有确认体现一个中国原则的政治基础,两岸关系制度化交往才能得以延续,两岸关系和平发展成果才不会得而复失。台湾当局新领导人必须完成没有完成的答卷。\n\n  对台湾当局新领导人,我们不仅看她怎么说,还要看她怎么做。是把两岸关系拉得更近,还是推得更远?是以民众的福祉和利益为依归,回到“九二共识”所体现的一个中国原则基础上来,继续走两岸关系和平发展的光明大道,还是一边高喊“维持现状”,一边明里暗里推行“两国论”、“一边一国”、“去中国化”等形形色色的“台独”分裂主张,重走挑起台海紧张动荡的老路?不同道路的选择攸关两岸关系的前景、攸关两岸同胞切身利益、攸关台海地区和平稳定。台湾当局如何以实际行动作出回答,两岸人民拭目以待。\n\n  今年以来,台湾岛内“台独”势力蠢蠢欲动,“去中国化”动作频频,各种“台独”苗头不断滋生。两岸人民对此要密切关注、保持高度警惕。在维护国家主权和领土完整这一原则问题上,我们的态度始终如一,立场从未改变,意志坚如磐石。十一年前,全国人大高票通过《反分裂国家法》,为遏制“台独”分裂、争取和平统一前景提供了坚强法律保障。今天,《反分裂国家法》依然是遏制“台独”强有力的法律武器。正如中共中央台办、国务院台办负责人发表的谈话中所说:“我们捍卫国家主权和领土完整决心未变,能力更强,将坚决遏制任何形式的‘台独’分裂行径和图谋。”“台独”势力如果误判形势、铤而走险、逾越底线,下场必定是可悲的!\n\n  当前,台海局势严峻复杂,但两岸关系的主导权牢牢掌握在我们手中。我们对台大政方针是明确的、一贯的,不因台湾政局变动而变动。我们将坚持“九二共识”的政治基础,坚决反对“台独”,坚定维护一个中国原则,继续努力推进两岸关系和平发展,推进两岸各领域的交流合作,促进两岸同胞的利益福祉,拉近两岸的心灵距离,共同构建命运共同体。没有任何力量能够阻挡两岸同胞携手实现中华民族的伟大复兴。", 3 | "title": "人民日报评论员:两岸关系和平发展的政治基础必须维护" 4 | } -------------------------------------------------------------------------------- /static/testdata/test4.json: -------------------------------------------------------------------------------- 1 | { 2 | "text": "  商务部贸易救济调查局负责人就美国做出普碳和合金钢板反倾销反补贴调查损害初裁发表谈话\n\n  美国华盛顿时间5月20日,美国国际贸易委员会发布公告,认定进口自韩国、法国、日本、意大利、巴西、中国等12个国家或地区的普碳和合金钢板对美国内产业构成实质损害。商务部贸易救济调查局负责人对此发表谈话。\n\n  该负责人表示,在过去的三十年多间,美国已对来自30余个国家或地区的该进口产品发起了近百起调查,并在绝大多数调查案件中采取了限制措施。其中,美国对中国普碳钢板的反倾销措施已经执行了20年,税率为128.59%。按照美方统计,2015年我对美出口涉案产品仅6.6万吨、7026万美元,占美该产品进口总量和总金额的比重为6%和8%。据中国业界反映,中国对美出口的涉案产品大部分是模具钢和扁钢产品,美国内目前不生产此类产品,我涉案产品没有对美国国内产业构成实质损害。\n\n  该负责人强调,美国近期连续对国外钢铁产品采取贸易救济措施,是一种不审慎的行为,这一举动无助于从根本上解决美钢铁企业面临的问题,过度的贸易保护才是导致美钢铁产业经营亏损等问题的根本原因。由于美国对国内钢铁产业持续三十多年的保护和补贴行为,扭曲了美国国内钢铁竞争市场,使钢铁企业失去了加大投资和改进工艺的动力,导致产品竞争力不断下降。\n\n  该负责人指出,面对当前世界经济增长乏力、需求不振造成的全球钢铁产业经营困难、产能过剩等问题,各国应加强合作、协同应对,遵守世界贸易组织规则,积极推动贸易自由化,而不是频繁采取以邻为壑的贸易保护措施。\n\n  该负责人强调,中方将继续鼓励和支持中国企业依法进行应诉,密切关注该案进展,并坚决利用世贸组织规则维护中国钢铁企业的正当权益。", 3 | "title": "商务部:过度贸易保护是美钢铁业亏损的根本原因" 4 | } -------------------------------------------------------------------------------- /static/testdata/test5.json: -------------------------------------------------------------------------------- 1 | { 2 | "text": "  原标题:奥巴马签署法案 美国联邦法律全面删除辱华字眼\n\n  中国侨网5月21日电 据美国《侨报》报道,5月20日,由国会众议员孟昭文提出的将带有侮辱色彩的“Oriental”(东方人)一词从联邦法律中去除,用“Asian Americans”(亚裔)取而代之的法案由总统奥巴马签署,正式成为联邦法律。\n\n  孟昭文表示,“Oriental”字眼不应该出现在联邦法律中,许多美国人也许都没有意识到这个词带有贬意。\n\n  去年晚些时候,孟昭文在做常规立法研究的时候发现,在美国法典第42篇中出现“Oriental”字样。美国法典第42篇涵盖公共卫生、社会福利与公民权利的联邦法律,“Oriental”字样出现在其中两条法律中。\n\n  孟昭文因此提出法案,将“Oriental”字眼从在联邦法律中删除。该法案在2015年12月2日于联邦众议院获得通过,作为“北美能源安全 与基础设施法案”的一部分。联邦众议院于2016年2月29日再次通过孟昭文提出的法案。之后,联邦参议院于5月9日通过了该法案,得到总共为76名共同 提案人的支持,其中包括51名国会亚太裔小组成员。\n\n  奥巴马总统签署此法案意味着孟昭文去除“Oriental”字样的努力最终取得了成功。早在2009年,孟昭文担任纽约州众议员时她就成功通过法案,在纽约州官方文件中去除“Oriental”字样。\n\n  孟昭文表示,这个法案正式成为联邦法律意味着美国亚裔群体的不断成长。这也同时表明,当亚裔群体能力增长时,美国政府与社会也会采取行动应对这成长。这个法案的制定与通过具有历史意义,并且相信未来在亚裔社区将取得更重要的成就。(王伊琳)", 3 | "title": "奥巴马签署法案 美国联邦法律删除辱华字眼" 4 | } -------------------------------------------------------------------------------- /static/testdata/test6.json: -------------------------------------------------------------------------------- 1 | { 2 | "text": " 新浪科技讯 5月20日下午消息,汽车之家股权转让事件再起波澜,据消息人士爆料,由于签订企业股权转让合同或协议后,没有在规定时间内向税务部门备案,近日,国家税务监管部门已正式向汽车之家发函质询,并要求其携带相关材料前往税务机关备案。\n\n  新浪科技就此向汽车之家进行了求证,对方确认了该消息,称确已收到了通知函。\n\n  该问题出现的主要原因是,VIE结构企业涉及复杂的税务流程和监管措施。目前我国税收监管框架主要针对股息、技术服务费和股权转让三项收入进行重点避税监管。\n\n  针对股权转让收入,政府部门出台了包括《国家税务总局关于加强非居民企业股权转让所得企业所得税管理的通知》(国税函[2009]698 号)、《国家税务总局关于非居民企业间接转让财产企业所得税若干问题的公告》(国家税务总局公告2015 年第7 号)。\n\n  根据国家税务总局公告2015 年第7 号文件的规定,间接转让中国应税财产的交易双方和筹划方,以及被间接转让股权的中国居民企业,自签订境外企业股权转让合同或协议之日起30日内,应按照主管税务机关要求提供股权转让合同或协议、境外企业及直接或间接持有中国应税财产的下属企业的财务报表等资料进行备案。\n\n  澳洲电讯于4月15日发布公告,转让汽车之家47.7%股份予平安信托,并签订具有法律约束力的股权转让协议,至今已超过30天。这意味着包括澳洲电讯,未来不仅可能需要补缴税款,甚至还将承担未按规定备案的罚息。\n\n  自698号文发布以来,已有众多境外PE间接转让中国境内公司股权的行为被追缴企业所得税。此前,高盛通过离岸公司转让其间接持有的双汇股权,因为太高调引起了国家税务总局的注意,被要求补缴4.2亿所得税,被认为是一起比较典型的非居民企业通过境外企业间接转让国内企业股权而需在中国纳税的案例。\n\n  这并非汽车之家股权交易首次面临政策风险,5月11日,有消息称汽车之家公众股东已正式向商务部提交书面实名举报信,举报平安信托涉嫌违反商务部《反垄断法》 。\n\n  对于上述所说的税务申报问题,新浪科技询问了澳电方面,对方表示不予置评。不过有相关知情人士表示,该问题不会成为澳电和平安信托股权交割的障碍,“股权交割结束才会涉及缴税问题,而且如果涉及税务问题,协议里也已经写明会由澳电承担。”(李根)", 3 | "title": "汽车之家股权交易一波未平一波又起:税务监管部门介入" 4 | } -------------------------------------------------------------------------------- /test.py: -------------------------------------------------------------------------------- 1 | from textsummary import TextSummary 2 | 3 | text = open("static/testdata/rujia1.txt", encoding="utf-8").read() 4 | title = "如家道歉遇袭事件称努力改正 当事人曾就职浙江某媒体" 5 | textsummary = TextSummary() 6 | textsummary.SetText(title, text) 7 | summary = textsummary.CalcSummary() 8 | print(summary) 9 | 10 | text = open("static/testdata/rujia2.txt", encoding="utf-8").read() 11 | title = "女生如家遇袭事件发酵 如家承认管理有瑕疵" 12 | textsummary = TextSummary() 13 | textsummary.SetText(title, text) 14 | summary = textsummary.CalcSummary() 15 | print(summary) 16 | 17 | text = open("static/testdata/rujia3.txt", encoding="utf-8").read() 18 | title = "如家发布会仅5分钟不设提问环节被指没诚意 专家:难辞其咎" 19 | textsummary = TextSummary() 20 | textsummary.SetText(title, text) 21 | summary = textsummary.CalcSummary() 22 | print(summary) -------------------------------------------------------------------------------- /textsummary.py: -------------------------------------------------------------------------------- 1 | #encoding=utf-8 2 | import jieba.analyse 3 | import jieba.posseg 4 | 5 | class TextSummary: 6 | text = "" 7 | title = "" 8 | keywords = list() 9 | sentences = list() 10 | summary = list() 11 | 12 | def SetText(self, title, text): 13 | self.title = title 14 | self.text = text 15 | 16 | def __SplitSentence(self): 17 | # 通过换行符对文档进行分段 18 | sections = self.text.split("\n") 19 | for section in sections: 20 | if section == "": 21 | sections.remove(section) 22 | 23 | # 通过分割符对每个段落进行分句 24 | for i in range(len(sections)): 25 | section = sections[i] 26 | text = "" 27 | k = 0 28 | for j in range(len(section)): 29 | char = section[j] 30 | text = text + char 31 | if char in ["!", "。", "?"] or j == len(section)-1: 32 | text = text.strip() 33 | sentence = dict() 34 | sentence["text"] = text 35 | sentence["pos"] = dict() 36 | sentence["pos"]["x"] = i 37 | sentence["pos"]["y"] = k 38 | # 将处理结果加入self.sentences 39 | self.sentences.append(sentence) 40 | text = "" 41 | k = k + 1 42 | 43 | for sentence in self.sentences: 44 | sentence["text"] = sentence["text"].strip() 45 | if sentence["text"] == "": 46 | self.sentences.remove(sentence) 47 | 48 | # 对文章位置进行标注,通过mark列表,标注出是否是第一段、尾段、第一句、最后一句 49 | lastpos = dict() 50 | lastpos["x"] = 0 51 | lastpos["y"] = 0 52 | lastpos["mark"] = list() 53 | for sentence in self.sentences: 54 | pos = sentence["pos"] 55 | pos["mark"] = list() 56 | if pos["x"] == 0: 57 | pos["mark"].append("FIRSTSECTION") 58 | if pos["y"] == 0: 59 | pos["mark"].append("FIRSTSENTENCE") 60 | lastpos["mark"].append("LASTSENTENCE") 61 | if pos["x"] == self.sentences[len(self.sentences)-1]["pos"]["x"]: 62 | pos["mark"].append("LASTSECTION") 63 | lastpos = pos 64 | lastpos["mark"].append("LASTSENTENCE") 65 | 66 | def __CalcKeywords(self): 67 | # 计算tf-idfs,取出排名靠前的20个词 68 | words_best = list() 69 | words_best = words_best + jieba.analyse.extract_tags(self.text, topK=20) 70 | # 提取第一段的关键词 71 | parts = self.text.lstrip().split("\n") 72 | firstpart = "" 73 | if len(parts) >= 1: 74 | firstpart = parts[0] 75 | words_best = words_best + jieba.analyse.extract_tags(firstpart, topK=5) 76 | # 提取title中的关键词 77 | words_best = words_best + jieba.analyse.extract_tags(self.title, topK=3) 78 | # 将结果合并成一个句子,并进行分词 79 | text = "" 80 | for w in words_best: 81 | text = text + " " + w 82 | # 计算词性,提取名词和动词 83 | words = jieba.posseg.cut(text) 84 | keywords = list() 85 | for w in words: 86 | flag = w.flag 87 | word = w.word 88 | if flag.find('n') >= 0 or flag.find('v') >= 0: 89 | if len(word) > 1: 90 | keywords.append(word) 91 | # 保留前20个关键词 92 | keywords = jieba.analyse.extract_tags(" ".join(keywords), topK=20) 93 | keywords = list(set(keywords)) 94 | self.keywords = keywords 95 | 96 | def __CalcSentenceWeightByKeywords(self): 97 | # 计算句子的关键词权重 98 | for sentence in self.sentences: 99 | sentence["weightKeywords"] = 0 100 | for keyword in self.keywords: 101 | for sentence in self.sentences: 102 | if sentence["text"].find(keyword) >= 0: 103 | sentence["weightKeywords"] = sentence["weightKeywords"] + 1 104 | 105 | def __CalcSentenceWeightByPos(self): 106 | # 计算句子的位置权重 107 | for sentence in self.sentences: 108 | mark = sentence["pos"]["mark"] 109 | weightPos = 0 110 | if "FIRSTSECTION" in mark: 111 | weightPos = weightPos + 2 112 | if "FIRSTSENTENCE" in mark: 113 | weightPos = weightPos + 2 114 | if "LASTSENTENCE" in mark: 115 | weightPos = weightPos + 1 116 | if "LASTSECTION" in mark: 117 | weightPos = weightPos + 1 118 | sentence["weightPos"] = weightPos 119 | 120 | def __CalcSentenceWeightByCueWords(self): 121 | # 计算句子的线索词权重 122 | index = ["总之", "总而言之", "报导", "新华社", "报道"] 123 | for sentence in self.sentences: 124 | sentence["weightCueWords"] = 0 125 | for i in index: 126 | for sentence in self.sentences: 127 | if sentence["text"].find(i) >= 0: 128 | sentence["weightCueWords"] = 1 129 | 130 | def __CalcSentenceWeight(self): 131 | self.__CalcSentenceWeightByPos() 132 | self.__CalcSentenceWeightByCueWords() 133 | self.__CalcSentenceWeightByKeywords() 134 | for sentence in self.sentences: 135 | sentence["weight"] = sentence["weightPos"] + 2 * sentence["weightCueWords"] + sentence["weightKeywords"] 136 | 137 | def CalcSummary(self, ratio=0.1): 138 | # 清空变量 139 | self.keywords = list() 140 | self.sentences = list() 141 | self.summary = list() 142 | 143 | # 调用方法,分别计算关键词、分句,计算权重 144 | self.__CalcKeywords() 145 | self.__SplitSentence() 146 | self.__CalcSentenceWeight() 147 | 148 | # 对句子的权重值进行排序 149 | self.sentences = sorted(self.sentences, key=lambda k: k['weight'], reverse=True) 150 | 151 | # 根据排序结果,取排名占前X%的句子作为摘要 152 | # print(len(self.sentences)) 153 | for i in range(len(self.sentences)): 154 | if i < ratio * len(self.sentences): 155 | sentence = self.sentences[i] 156 | self.summary.append(sentence["text"]) 157 | 158 | return self.summary 159 | 160 | 161 | --------------------------------------------------------------------------------