(.*?)

') 7 | end = data.find(r'

') 8 | print(data[start:end]) 9 | -------------------------------------------------------------------------------- /第3章-正则表达式爬虫/chapter03_15.py: -------------------------------------------------------------------------------- 1 | import re 2 | import urllib.request 3 | 4 | url = "http://www.eastmountyxz.com/" 5 | content = urllib.request.urlopen(url).read() 6 | data = content.decode('utf-8') 7 | 8 | start = data.find(r'

') 9 | end = data.find(r'

(.*?)

', page, re.M|re.S) #摘要 18 | print(t3[0]) 19 | -------------------------------------------------------------------------------- /第3章-正则表达式爬虫/chapter03_16.py: -------------------------------------------------------------------------------- 1 | #coding:utf-8 2 | import re 3 | import urllib.request 4 | 5 | url = "http://www.eastmountyxz.com/" 6 | content = urllib.request.urlopen(url).read() 7 | data = content.decode('utf-8') 8 | 9 | #爬取标题 10 | title = re.findall(r'(.*?)', data) 11 | print(title[0]) 12 | 13 | #爬取图片地址 14 | urls = re.findall(r'src="(.*?)"', data) 15 | for url in urls: 16 | print(url) 17 | 18 | #爬取内容 19 | start = data.find(r'

') 20 | end = data.find(r'

(.*?)

') 32 | end = data.find(r'

(.*?)

', page, re.M|re.S) #摘要 40 | print(t3[0]) 41 | 42 | 43 | -------------------------------------------------------------------------------- /第3章-正则表达式爬虫/chapter03_17.py: -------------------------------------------------------------------------------- 1 | # -*- coding:utf-8 -*- 2 | import urllib.request 3 | 4 | url = 'https://www.baidu.com/img/PCtm_d9c8750bed0b3c7d089fa7d55720d6cf.png' 5 | local = 'baidu.png' 6 | urllib.request.urlretrieve(url, local) 7 | -------------------------------------------------------------------------------- /第3章-正则表达式爬虫/test.html: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/eastmountyxz/Book1-Python-DataCrawl/6d5259371a60a8fa5f4dd1c40673a9704414c8c8/第3章-正则表达式爬虫/test.html -------------------------------------------------------------------------------- /第4章-BeautifulSoup基础知识/test01.py: -------------------------------------------------------------------------------- 1 | # coding=utf-8 2 | from bs4 import BeautifulSoup 3 | 4 | #HTML源码 5 | html = """ 6 | 7 | 8 | BeautifulSoup技术 9 | 10 | 11 |

静夜思

12 |

18 |

27 |

...

28 | """ 29 | 30 | #按照标准的缩进格式的结构输出 31 | soup = BeautifulSoup(html) 32 | print(soup.prettify()) 33 | -------------------------------------------------------------------------------- /第4章-BeautifulSoup基础知识/test02.py: -------------------------------------------------------------------------------- 1 | # coding=utf-8 2 | from bs4 import BeautifulSoup 3 | 4 | #创建本地文件soup对象 5 | soup = BeautifulSoup(open('test04_01.html'), "html.parser") 6 | 7 | #获取标题 8 | title = soup.title 9 | print('标题:', title) 10 | 11 | #获取标题 12 | head = soup.head 13 | print('头部:', head) 14 | 15 | #获取a标签 16 | ta = soup.a 17 | print('超链接内容:', ta) 18 | 19 | #获取p标签 20 | tp = soup.p 21 | print('段落内容:', tp) 22 | 23 | #从文档中找到的所有标签链接 24 | for a in soup.find_all('a'): 25 | print(a) 26 | 27 | #获取的超链接 28 | for link in soup.find_all('a'): 29 | print(link.get('href')) 30 | 31 | print(soup.title) 32 | # BeautifulSoup技术 33 | print(soup.head) 34 | # BeautifulSoup技术 35 | print(soup.p) 36 | #

静夜思

37 | print(soup.a) 38 | # 杜甫 39 | 40 | print(soup.name) 41 | #[document] 42 | print(soup.head.name) 43 | #head 44 | print(soup.title.name) 45 | #title 46 | -------------------------------------------------------------------------------- /第4章-BeautifulSoup基础知识/test03.py: -------------------------------------------------------------------------------- 1 | # coding=utf-8 2 | from bs4 import BeautifulSoup 3 | soup = BeautifulSoup('Eastmount',"html.parser") 4 | tag = soup.b 5 | print(tag) 6 | print(type(tag)) 7 | 8 | #Name 9 | print(tag.name) 10 | print(tag.string) 11 | 12 | #Attributes 13 | print(tag.attrs) 14 | print(tag['class']) 15 | print(tag.get('id')) 16 | 17 | #修改属性增加属性name 18 | tag['class'] = 'abc' 19 | tag['id'] = '1' 20 | tag['name'] = '2' 21 | print(tag) 22 | 23 | #删除属性 24 | del tag['class'] 25 | del tag['name'] 26 | print(tag) 27 | print(tag['class']) 28 | #KeyError: 'class' 29 | -------------------------------------------------------------------------------- /第4章-BeautifulSoup基础知识/test04.py: -------------------------------------------------------------------------------- 1 | from bs4 import BeautifulSoup 2 | soup = BeautifulSoup(open('test04_01.html'), "html.parser") 3 | tag = soup.title 4 | print(type(tag.string)) 5 | # 6 | 7 | unicode_string = tag.string 8 | print(unicode_string) 9 | #BeautifulSoup技术 10 | print(type(unicode_string)) 11 | # 12 | 13 | markup = "" 14 | soup = BeautifulSoup(markup, "html.parser") 15 | comment = soup.b.string 16 | print(type(comment)) 17 | # 18 | print(comment) 19 | # This is a comment code. 20 | -------------------------------------------------------------------------------- /第4章-BeautifulSoup基础知识/test04_01.html: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/eastmountyxz/Book1-Python-DataCrawl/6d5259371a60a8fa5f4dd1c40673a9704414c8c8/第4章-BeautifulSoup基础知识/test04_01.html -------------------------------------------------------------------------------- /第4章-BeautifulSoup基础知识/test05.py: -------------------------------------------------------------------------------- 1 | # coding=utf-8 2 | from bs4 import BeautifulSoup 3 | soup = BeautifulSoup(open('test04_01.html'), "html.parser") 4 | print(soup.head.contents) 5 | #['\n', BeautifulSoup技术, '\n'] 6 | 7 | print(soup.head.contents[1]) 8 | #BeautifulSoup技术 9 | 10 | for child in soup.descendants: 11 | print(child) 12 | 13 | for content in soup.stripped_strings: 14 | print(content) 15 | 16 | #搜索文档树 17 | urls = soup.find_all('a') 18 | for u in urls: 19 | print(u) 20 | -------------------------------------------------------------------------------- /第4章-BeautifulSoup基础知识/test06.py: -------------------------------------------------------------------------------- 1 | # -*- coding: utf-8 -*- 2 | import re 3 | import urllib.request 4 | from bs4 import BeautifulSoup 5 | 6 | url = "http://www.eastmountyxz.com/" 7 | page = urllib.request.urlopen(url) 8 | soup = BeautifulSoup(page, "html.parser") 9 | essay0 = soup.find_all(attrs={"class":"essay"}) 10 | for tag in essay0: 11 | print(tag) 12 | print('') #换行 13 | print(tag.a) 14 | print(tag.find("a").get_text()) 15 | print(tag.find("a").attrs['href']) 16 | content = tag.find("p").get_text() 17 | print(content.replace(' ','')) 18 | print('--------------------------\n') 19 | 20 | #整理输出 21 | i = 1 22 | while i<=3: 23 | num = "essay" + str(i) 24 | essay = soup.find_all(attrs={"class":num}) 25 | for tag in essay: 26 | print(tag.find("a").get_text()) 27 | print(tag.find("a").attrs['href']) 28 | content = tag.find("p").get_text() 29 | print(content.replace(' ','')) 30 | i += 1 31 | print('') 32 | -------------------------------------------------------------------------------- /第5章-BS爬取豆瓣电影/Result_Douban.txt: -------------------------------------------------------------------------------- 1 | 1 2 | [中文名称]肖申克的救赎 3 | [网页链接]https://movie.douban.com/subject/1292052/ 4 | [影评]希望让人自由。 5 | 2 6 | [中文名称]霸王别姬 7 | [网页链接]https://movie.douban.com/subject/1291546/ 8 | [影评]风华绝代。 9 | 3 10 | [中文名称]阿甘正传 11 | [网页链接]https://movie.douban.com/subject/1292720/ 12 | [影评]一部美国近现代史。 13 | 4 14 | [中文名称]这个杀手不太冷 15 | [网页链接]https://movie.douban.com/subject/1295644/ 16 | [影评]怪蜀黍和小萝莉不得不说的故事。 17 | 5 18 | [中文名称]泰坦尼克号 19 | [网页链接]https://movie.douban.com/subject/1292722/ 20 | [影评]失去的才是永恒的。 21 | 6 22 | [中文名称]美丽人生 23 | [网页链接]https://movie.douban.com/subject/1292063/ 24 | [影评]最美的谎言。 25 | 7 26 | [中文名称]千与千寻 27 | [网页链接]https://movie.douban.com/subject/1291561/ 28 | [影评]最好的宫崎骏，最好的久石让。 29 | 8 30 | [中文名称]辛德勒的名单 31 | [网页链接]https://movie.douban.com/subject/1295124/ 32 | [影评]拯救一个人，就是拯救整个世界。 33 | 9 34 | [中文名称]盗梦空间 35 | [网页链接]https://movie.douban.com/subject/3541415/ 36 | [影评]诺兰给了我们一场无法盗取的梦。 37 | 10 38 | [中文名称]忠犬八公的故事 39 | [网页链接]https://movie.douban.com/subject/3011091/ 40 | [影评]永远都不能忘记你所爱的人。 41 | 11 42 | [中文名称]星际穿越 43 | [网页链接]https://movie.douban.com/subject/1889243/ 44 | [影评]爱是一种力量，让我们超越时空感知它的存在。 45 | 12 46 | [中文名称]海上钢琴师 47 | [网页链接]https://movie.douban.com/subject/1292001/ 48 | [影评]每个人都要走一条自己坚定了的路，就算是粉身碎骨。 49 | 13 50 | [中文名称]楚门的世界 51 | [网页链接]https://movie.douban.com/subject/1292064/ 52 | [影评]如果再也不能见到你，祝你早安，午安，晚安。 53 | 14 54 | [中文名称]三傻大闹宝莱坞 55 | [网页链接]https://movie.douban.com/subject/3793023/ 56 | [影评]英俊版憨豆，高情商版谢耳朵。 57 | 15 58 | [中文名称]机器人总动员 59 | [网页链接]https://movie.douban.com/subject/2131459/ 60 | [影评]小瓦力，大人生。 61 | 16 62 | [中文名称]放牛班的春天 63 | [网页链接]https://movie.douban.com/subject/1291549/ 64 | [影评]天籁一般的童声，是最接近上帝的存在。 65 | 17 66 | [中文名称]大话西游之大圣娶亲 67 | [网页链接]https://movie.douban.com/subject/1292213/ 68 | [影评]一生所爱。 69 | 18 70 | [中文名称]疯狂动物城 71 | [网页链接]https://movie.douban.com/subject/25662329/ 72 | [影评]迪士尼给我们营造的乌托邦就是这样，永远善良勇敢，永远出乎意料。 73 | 19 74 | [中文名称]无间道 75 | [网页链接]https://movie.douban.com/subject/1307914/ 76 | [影评]香港电影史上永不过时的杰作。 77 | 20 78 | [中文名称]熔炉 79 | [网页链接]https://movie.douban.com/subject/5912992/ 80 | [影评]我们一路奋战不是为了改变世界，而是为了不让世界改变我们。 81 | 21 82 | [中文名称]教父 83 | [网页链接]https://movie.douban.com/subject/1291841/ 84 | [影评]千万不要记恨你的对手，这样会让你失去理智。 85 | 22 86 | [中文名称]当幸福来敲门 87 | [网页链接]https://movie.douban.com/subject/1849031/ 88 | [影评]平民励志片。 89 | 23 90 | [中文名称]龙猫 91 | [网页链接]https://movie.douban.com/subject/1291560/ 92 | [影评]人人心中都有个龙猫，童年就永远不会消失。 93 | 24 94 | [中文名称]怦然心动 95 | [网页链接]https://movie.douban.com/subject/3319755/ 96 | [影评]真正的幸福是来自内心深处。 97 | 25 98 | [中文名称]控方证人 99 | [网页链接]https://movie.douban.com/subject/1296141/ 100 | [影评]比利·怀德满分作品。 101 | 102 | 103 | 26 104 | [中文名称]触不可及 105 | [网页链接]https://movie.douban.com/subject/6786002/ 106 | [影评]满满温情的高雅喜剧。 107 | 27 108 | [中文名称]蝙蝠侠：黑暗骑士 109 | [网页链接]https://movie.douban.com/subject/1851857/ 110 | [影评]无尽的黑暗。 111 | 28 112 | [中文名称]末代皇帝 113 | [网页链接]https://movie.douban.com/subject/1293172/ 114 | [影评]“不要跟我比惨，我比你更惨”再适合这部电影不过了。 115 | 29 116 | [中文名称]活着 117 | [网页链接]https://movie.douban.com/subject/1292365/ 118 | [影评]张艺谋最好的电影。 119 | 30 120 | [中文名称]寻梦环游记 121 | [网页链接]https://movie.douban.com/subject/20495023/ 122 | [影评]死亡不是真的逝去，遗忘才是永恒的消亡。 123 | 31 124 | [中文名称]何以为家 125 | [网页链接]https://movie.douban.com/subject/30170448/ 126 | [影评]凝视卑弱生命，用电影改变命运。 127 | 32 128 | [中文名称]乱世佳人 129 | [网页链接]https://movie.douban.com/subject/1300267/ 130 | [影评]Tomorrow is another day. 131 | 33 132 | [中文名称]指环王3：王者无敌 133 | [网页链接]https://movie.douban.com/subject/1291552/ 134 | [影评]史诗的终章。 135 | 34 136 | [中文名称]哈利·波特与魔法石 137 | [网页链接]https://movie.douban.com/subject/1295038/ 138 | [影评]童话世界的开端。 139 | 35 140 | [中文名称]飞屋环游记 141 | [网页链接]https://movie.douban.com/subject/2129039/ 142 | [影评]最后那些最无聊的事情，才是最值得怀念的。 143 | 36 144 | [中文名称]摔跤吧！爸爸 145 | [网页链接]https://movie.douban.com/subject/26387939/ 146 | [影评]你不是在为你一个人战斗，你要让千千万万的女性看到女生并不是只能相夫教子。 147 | 37 148 | [中文名称]素媛 149 | [网页链接]https://movie.douban.com/subject/21937452/ 150 | [影评]受过伤害的人总是笑得最开心，因为他们不愿意让身边的人承受一样的痛苦。 151 | 38 152 | [中文名称]少年派的奇幻漂流 153 | [网页链接]https://movie.douban.com/subject/1929463/ 154 | [影评]瑰丽壮观、无人能及的冒险之旅。 155 | 39 156 | [中文名称]十二怒汉 157 | [网页链接]https://movie.douban.com/subject/1293182/ 158 | [影评]1957年的理想主义。 159 | 40 160 | [中文名称]哈尔的移动城堡 161 | [网页链接]https://movie.douban.com/subject/1308807/ 162 | [影评]带着心爱的人在天空飞翔。 163 | 41 164 | [中文名称]鬼子来了 165 | [网页链接]https://movie.douban.com/subject/1291858/ 166 | [影评]对敌人的仁慈，就是对自己残忍。 167 | 42 168 | [中文名称]天空之城 169 | [网页链接]https://movie.douban.com/subject/1291583/ 170 | [影评]对天空的追逐，永不停止。 171 | 43 172 | [中文名称]大话西游之月光宝盒 173 | [网页链接]https://movie.douban.com/subject/1299398/ 174 | [影评]旷古烁今。 175 | 44 176 | [中文名称]我不是药神 177 | [网页链接]https://movie.douban.com/subject/26752088/ 178 | [影评]对我们国家而言，这样的电影多一部是一部。 179 | 45 180 | [中文名称]闻香识女人 181 | [网页链接]https://movie.douban.com/subject/1298624/ 182 | [影评]史上最美的探戈。 183 | 46 184 | [中文名称]罗马假日 185 | [网页链接]https://movie.douban.com/subject/1293839/ 186 | [影评]爱情哪怕只有一天。 187 | 47 188 | [中文名称]天堂电影院 189 | [网页链接]https://movie.douban.com/subject/1291828/ 190 | [影评]那些吻戏，那些青春，都在影院的黑暗里被泪水冲刷得无比清晰。 191 | 48 192 | [中文名称]辩护人 193 | [网页链接]https://movie.douban.com/subject/21937445/ 194 | [影评]电影的现实意义大过电影本身。 195 | 49 196 | [中文名称]猫鼠游戏 197 | [网页链接]https://movie.douban.com/subject/1305487/ 198 | [影评]骗子大师和执著警探的你追我跑故事。 199 | 50 200 | [中文名称]大闹天宫 201 | [网页链接]https://movie.douban.com/subject/1418019/ 202 | [影评]经典之作，历久弥新。 203 | 204 | 205 | 51 206 | [中文名称]搏击俱乐部 207 | [网页链接]https://movie.douban.com/subject/1292000/ 208 | [影评]邪恶与平庸蛰伏于同一个母体，在特定的时间互相对峙。 209 | 52 210 | [中文名称]教父2 211 | [网页链接]https://movie.douban.com/subject/1299131/ 212 | [影评]优雅的孤独。 213 | 53 214 | [中文名称]狮子王 215 | [网页链接]https://movie.douban.com/subject/1301753/ 216 | [影评]动物版《哈姆雷特》。 217 | 54 218 | [中文名称]指环王2：双塔奇兵 219 | [网页链接]https://movie.douban.com/subject/1291572/ 220 | [影评]承前启后的史诗篇章。 221 | 55 222 | [中文名称]死亡诗社 223 | [网页链接]https://movie.douban.com/subject/1291548/ 224 | [影评]当一个死水般的体制内出现一个活跃的变数时，所有的腐臭都站在了光明的对面。 225 | 56 226 | [中文名称]钢琴家 227 | [网页链接]https://movie.douban.com/subject/1296736/ 228 | [影评]音乐能化解仇恨。 229 | 57 230 | [中文名称]黑客帝国 231 | [网页链接]https://movie.douban.com/subject/1291843/ 232 | [影评]视觉革命。 233 | 58 234 | [中文名称]指环王1：魔戒再现 235 | [网页链接]https://movie.douban.com/subject/1291571/ 236 | [影评]传说的开始。 237 | 59 238 | [中文名称]饮食男女 239 | [网页链接]https://movie.douban.com/subject/1291818/ 240 | [影评]人生不能像做菜，把所有的料都准备好了才下锅。 241 | 60 242 | [中文名称]窃听风暴 243 | [网页链接]https://movie.douban.com/subject/1900841/ 244 | [影评]别样人生。 245 | 61 246 | [中文名称]美丽心灵 247 | [网页链接]https://movie.douban.com/subject/1306029/ 248 | [影评]爱是一切逻辑和原由。 249 | 62 250 | [中文名称]让子弹飞 251 | [网页链接]https://movie.douban.com/subject/3742360/ 252 | [影评]你给我翻译翻译，神马叫做TMD的惊喜。 253 | 63 254 | [中文名称]绿皮书 255 | [网页链接]https://movie.douban.com/subject/27060077/ 256 | [影评]去除成见，需要勇气。 257 | 64 258 | [中文名称]两杆大烟枪 259 | [网页链接]https://movie.douban.com/subject/1293350/ 260 | [影评]4个臭皮匠顶个诸葛亮，盖·里奇果然不是盖的。 261 | 65 262 | [中文名称]本杰明·巴顿奇事 263 | [网页链接]https://movie.douban.com/subject/1485260/ 264 | [影评]在时间之河里感受溺水之苦。 265 | 66 266 | [中文名称]海蒂和爷爷 267 | [网页链接]https://movie.douban.com/subject/25958717/ 268 | [影评]如果生活中有什么使你感到快乐，那就去做吧！不要管别人说什么。 269 | 67 270 | [中文名称]飞越疯人院 271 | [网页链接]https://movie.douban.com/subject/1292224/ 272 | [影评]自由万岁。 273 | 68 274 | [中文名称]看不见的客人 275 | [网页链接]https://movie.douban.com/subject/26580232/ 276 | [影评]你以为你以为的就是你以为的。 277 | 69 278 | [中文名称]西西里的美丽传说 279 | [网页链接]https://movie.douban.com/subject/1292402/ 280 | [影评]美丽无罪。 281 | 70 282 | [中文名称]拯救大兵瑞恩 283 | [网页链接]https://movie.douban.com/subject/1292849/ 284 | [影评]美利坚精神输出大片No1. 285 | 71 286 | [中文名称]穿条纹睡衣的男孩 287 | [网页链接]https://movie.douban.com/subject/3008247/ 288 | [影评]尽管有些不切实际的幻想，这部电影依旧是一部感人肺腑的佳作。 289 | 72 290 | [中文名称]小鞋子 291 | [网页链接]https://movie.douban.com/subject/1303021/ 292 | [影评]奔跑的孩子是天使。 293 | 73 294 | [中文名称]音乐之声 295 | [网页链接]https://movie.douban.com/subject/1294408/ 296 | [影评]用音乐化解仇恨，让歌声串起美好。 297 | 74 298 | [中文名称]情书 299 | [网页链接]https://movie.douban.com/subject/1292220/ 300 | [影评]暗恋的极致。 301 | 75 302 | [中文名称]海豚湾 303 | [网页链接]https://movie.douban.com/subject/3442220/ 304 | [影评]海豚的微笑，是世界上最高明的伪装。 305 | 306 | 307 | 76 308 | [中文名称]美国往事 309 | [网页链接]https://movie.douban.com/subject/1292262/ 310 | [影评]往事如烟，无处祭奠。 311 | 77 312 | [中文名称]致命魔术 313 | [网页链接]https://movie.douban.com/subject/1780330/ 314 | [影评]孪生蝙蝠侠大战克隆金刚狼。 315 | 78 316 | [中文名称]沉默的羔羊 317 | [网页链接]https://movie.douban.com/subject/1293544/ 318 | [影评]安东尼·霍普金斯的顶级表演。 319 | 79 320 | [中文名称]禁闭岛 321 | [网页链接]https://movie.douban.com/subject/2334904/ 322 | [影评]昔日翩翩少年，今日大腹便便。 323 | 80 324 | [中文名称]低俗小说 325 | [网页链接]https://movie.douban.com/subject/1291832/ 326 | [影评]故事的高级讲法。 327 | 81 328 | [中文名称]蝴蝶效应 329 | [网页链接]https://movie.douban.com/subject/1292343/ 330 | [影评]人的命运被自己瞬间的抉择改变。 331 | 82 332 | [中文名称]七宗罪 333 | [网页链接]https://movie.douban.com/subject/1292223/ 334 | [影评]警察抓小偷，老鼠玩死猫。 335 | 83 336 | [中文名称]心灵捕手 337 | [网页链接]https://movie.douban.com/subject/1292656/ 338 | [影评]人生中应该拥有这样的一段豁然开朗。 339 | 84 340 | [中文名称]布达佩斯大饭店 341 | [网页链接]https://movie.douban.com/subject/11525673/ 342 | [影评]小清新的故事里注入了大历史的情怀。 343 | 85 344 | [中文名称]春光乍泄 345 | [网页链接]https://movie.douban.com/subject/1292679/ 346 | [影评]爱情纠缠，男女一致。 347 | 86 348 | [中文名称]摩登时代 349 | [网页链接]https://movie.douban.com/subject/1294371/ 350 | [影评]大时代中的人生，小人物的悲喜。 351 | 87 352 | [中文名称]哈利·波特与死亡圣器(下) 353 | [网页链接]https://movie.douban.com/subject/3011235/ 354 | [影评]10年的完美句点。 355 | 88 356 | [中文名称]被嫌弃的松子的一生 357 | [网页链接]https://movie.douban.com/subject/1787291/ 358 | [影评]以戏谑来戏谑戏谑。 359 | 89 360 | [中文名称]阿凡达 361 | [网页链接]https://movie.douban.com/subject/1652587/ 362 | [影评]绝对意义上的美轮美奂。 363 | 90 364 | [中文名称]喜剧之王 365 | [网页链接]https://movie.douban.com/subject/1302425/ 366 | [影评]我是一个演员。 367 | 91 368 | [中文名称]致命ID 369 | [网页链接]https://movie.douban.com/subject/1297192/ 370 | [影评]最不可能的那个人永远是最可能的。 371 | 92 372 | [中文名称]剪刀手爱德华 373 | [网页链接]https://movie.douban.com/subject/1292370/ 374 | [影评]浪漫忧郁的成人童话。 375 | 93 376 | [中文名称]勇敢的心 377 | [网页链接]https://movie.douban.com/subject/1294639/ 378 | [影评]史诗大片的典范。 379 | 94 380 | [中文名称]杀人回忆 381 | [网页链接]https://movie.douban.com/subject/1300299/ 382 | [影评]关于连环杀人悬案的集体回忆。 383 | 95 384 | [中文名称]加勒比海盗 385 | [网页链接]https://movie.douban.com/subject/1298070/ 386 | [影评]约翰尼·德普的独角戏。 387 | 96 388 | [中文名称]狩猎 389 | [网页链接]https://movie.douban.com/subject/6985810/ 390 | [影评]人言可畏。 391 | 97 392 | [中文名称]请以你的名字呼唤我 393 | [网页链接]https://movie.douban.com/subject/26799731/ 394 | [影评]沉醉在电影的情感和视听氛围中无法自拔。 395 | 98 396 | [中文名称]天使爱美丽 397 | [网页链接]https://movie.douban.com/subject/1292215/ 398 | [影评]法式小清新。 399 | 99 400 | [中文名称]断背山 401 | [网页链接]https://movie.douban.com/subject/1418834/ 402 | [影评]每个人心中都有一座断背山。 403 | 100 404 | [中文名称]红辣椒 405 | [网页链接]https://movie.douban.com/subject/1865703/ 406 | [影评]梦的勾结。 407 | 408 | 409 | 101 410 | [中文名称]7号房的礼物 411 | [网页链接]https://movie.douban.com/subject/10777687/ 412 | [影评]《我是山姆》的《美丽人生》。 413 | 102 414 | [中文名称]幽灵公主 415 | [网页链接]https://movie.douban.com/subject/1297359/ 416 | [影评]人与自然的战争史诗。 417 | 103 418 | [中文名称]小森林夏秋篇 419 | [网页链接]https://movie.douban.com/subject/25814705/ 420 | [影评]那些静得只能听见呼吸的日子里，你明白孤独即生活。 421 | 104 422 | [中文名称]阳光灿烂的日子 423 | [网页链接]https://movie.douban.com/subject/1291875/ 424 | [影评]一场华丽的意淫。 425 | 105 426 | [中文名称]第六感 427 | [网页链接]https://movie.douban.com/subject/1297630/ 428 | [影评]深入内心的恐怖，出人意料的结局。 429 | 106 430 | [中文名称]重庆森林 431 | [网页链接]https://movie.douban.com/subject/1291999/ 432 | [影评]寂寞没有期限。 433 | 107 434 | [中文名称]唐伯虎点秋香 435 | [网页链接]https://movie.douban.com/subject/1306249/ 436 | [影评]华太师是黄霑，吴镇宇四大才子之一。 437 | 108 438 | [中文名称]小森林冬春篇 439 | [网页链接]https://movie.douban.com/subject/25814707/ 440 | [影评]尊敬他人，尊敬你生活的这片土地，明白孤独是人生的常态。 441 | 109 442 | [中文名称]入殓师 443 | [网页链接]https://movie.douban.com/subject/2149806/ 444 | [影评]死可能是一道门，逝去并不是终结，而是超越，走向下一程。 445 | 110 446 | [中文名称]超脱 447 | [网页链接]https://movie.douban.com/subject/5322596/ 448 | [影评]穷尽一生，我们要学会的，不过是彼此拥抱。 449 | 111 450 | [中文名称]爱在黎明破晓前 451 | [网页链接]https://movie.douban.com/subject/1296339/ 452 | [影评]缘分是个连绵词，最美不过一瞬。 453 | 112 454 | [中文名称]消失的爱人 455 | [网页链接]https://movie.douban.com/subject/21318488/ 456 | [影评]年度最佳date movie。 457 | 113 458 | [中文名称]一一 459 | [网页链接]https://movie.douban.com/subject/1292434/ 460 | [影评]我们都曾经是一一。 461 | 114 462 | [中文名称]菊次郎的夏天 463 | [网页链接]https://movie.douban.com/subject/1293359/ 464 | [影评]从没见过那么流氓的温柔，从没见过那么温柔的流氓。 465 | 115 466 | [中文名称]蝙蝠侠：黑暗骑士崛起 467 | [网页链接]https://movie.douban.com/subject/3395373/ 468 | [影评]诺兰就是保证。 469 | 116 470 | [中文名称]侧耳倾听 471 | [网页链接]https://movie.douban.com/subject/1297052/ 472 | [影评]少女情怀总是诗。 473 | 117 474 | [中文名称]功夫 475 | [网页链接]https://movie.douban.com/subject/1291543/ 476 | [影评]警恶惩奸，维护世界和平这个任务就交给你了，好吗？ 477 | 118 478 | [中文名称]倩女幽魂 479 | [网页链接]https://movie.douban.com/subject/1297447/ 480 | [影评]两张绝世的脸。 481 | 119 482 | [中文名称]无人知晓 483 | [网页链接]https://movie.douban.com/subject/1292337/ 484 | [影评]我的平常生活就是他人的幸福。 485 | 120 486 | [中文名称]超能陆战队 487 | [网页链接]https://movie.douban.com/subject/11026735/ 488 | [影评]Balalala~~~ 489 | 121 490 | [中文名称]人生果实 491 | [网页链接]https://movie.douban.com/subject/26874505/ 492 | [影评]土壤没有落叶不会肥沃，没有了你就不算人生。 493 | 122 494 | [中文名称]萤火之森 495 | [网页链接]https://movie.douban.com/subject/5989818/ 496 | [影评]触不到的恋人。 497 | 123 498 | [中文名称]甜蜜蜜 499 | [网页链接]https://movie.douban.com/subject/1305164/ 500 | [影评]相逢只要一瞬间，等待却像是一辈子。 501 | 124 502 | [中文名称]借东西的小人阿莉埃蒂 503 | [网页链接]https://movie.douban.com/subject/4202302/ 504 | [影评]曾经的那段美好会沉淀为一辈子的记忆。 505 | 125 506 | [中文名称]玛丽和马克思 507 | [网页链接]https://movie.douban.com/subject/3072124/ 508 | [影评]你是我最好的朋友，你是我唯一的朋友。 509 | 510 | 511 | 126 512 | [中文名称]爱在日落黄昏时 513 | [网页链接]https://movie.douban.com/subject/1291990/ 514 | [影评]九年后的重逢是世俗和责任的交叠，没了悸动和青涩，沧桑而温暖。 515 | 127 516 | [中文名称]驯龙高手 517 | [网页链接]https://movie.douban.com/subject/2353023/ 518 | [影评]和谐的生活离不开摸头与被摸头。 519 | 128 520 | [中文名称]完美的世界 521 | [网页链接]https://movie.douban.com/subject/1300992/ 522 | [影评]坏人的好总是比好人的好来得更感人。 523 | 129 524 | [中文名称]幸福终点站 525 | [网页链接]https://movie.douban.com/subject/1292274/ 526 | [影评]有时候幸福需要等一等。 527 | 130 528 | [中文名称]告白 529 | [网页链接]https://movie.douban.com/subject/4268598/ 530 | [影评]没有一人完全善，也没有一人完全恶。 531 | 131 532 | [中文名称]哈利·波特与阿兹卡班的囚徒 533 | [网页链接]https://movie.douban.com/subject/1291544/ 534 | [影评]不一样的导演，不一样的哈利·波特。 535 | 132 536 | [中文名称]大鱼 537 | [网页链接]https://movie.douban.com/subject/1291545/ 538 | [影评]抱着梦想而活着的人是幸福的，怀抱梦想而死去的人是不朽的。 539 | 133 540 | [中文名称]阳光姐妹淘 541 | [网页链接]https://movie.douban.com/subject/4917726/ 542 | [影评]再多各自牛逼的时光，也比不上一起傻逼的岁月。 543 | 134 544 | [中文名称]射雕英雄传之东成西就 545 | [网页链接]https://movie.douban.com/subject/1316510/ 546 | [影评]百看不厌。 547 | 135 548 | [中文名称]恐怖直播 549 | [网页链接]https://movie.douban.com/subject/21360417/ 550 | [影评]恐怖分子的“秋菊打官司”。 551 | 136 552 | [中文名称]天书奇谭 553 | [网页链接]https://movie.douban.com/subject/1428581/ 554 | [影评]传奇的年代，醉人的童话。 555 | 137 556 | [中文名称]怪兽电力公司 557 | [网页链接]https://movie.douban.com/subject/1291579/ 558 | [影评]不要给它起名字，起了名字就有感情了。 559 | 138 560 | [中文名称]神偷奶爸 561 | [网页链接]https://movie.douban.com/subject/3287562/ 562 | [影评]Mr. I Don't Care其实也有Care的时候。 563 | 139 564 | [中文名称]玩具总动员3 565 | [网页链接]https://movie.douban.com/subject/1858711/ 566 | [影评]跨度十五年的欢乐与泪水。 567 | 140 568 | [中文名称]傲慢与偏见 569 | [网页链接]https://movie.douban.com/subject/1418200/ 570 | [影评]爱是摈弃傲慢与偏见之后的曙光。 571 | 141 572 | [中文名称]哈利·波特与密室 573 | [网页链接]https://movie.douban.com/subject/1296996/ 574 | [影评]魔法的密室之门已打开... 575 | 142 576 | [中文名称]时空恋旅人 577 | [网页链接]https://movie.douban.com/subject/10577869/ 578 | [影评]把每天当作最后一天般珍惜度过，积极拥抱生活，就是幸福。 579 | 143 580 | [中文名称]教父3 581 | [网页链接]https://movie.douban.com/subject/1294240/ 582 | [影评]任何信念的力量，都无法改变命运。 583 | 144 584 | [中文名称]釜山行 585 | [网页链接]https://movie.douban.com/subject/25986180/ 586 | [影评]揭露人性的丧尸题材力作。 587 | 145 588 | [中文名称]血战钢锯岭 589 | [网页链接]https://movie.douban.com/subject/26325320/ 590 | [影评]优秀的战争片不会美化战场，不会粉饰死亡，不会矮化敌人，不会无视常识，最重要的，不会宣扬战争。 591 | 146 592 | [中文名称]哪吒闹海 593 | [网页链接]https://movie.douban.com/subject/1307315/ 594 | [影评]想你时你在闹海。 595 | 147 596 | [中文名称]被解救的姜戈 597 | [网页链接]https://movie.douban.com/subject/6307447/ 598 | [影评]热血沸腾，那个低俗、性感的无耻混蛋又来了。 599 | 148 600 | [中文名称]七武士 601 | [网页链接]https://movie.douban.com/subject/1295399/ 602 | [影评]时代悲歌。 603 | 149 604 | [中文名称]一个叫欧维的男人决定去死 605 | [网页链接]https://movie.douban.com/subject/26628357/ 606 | [影评]惠及一生的美丽。 607 | 150 608 | [中文名称]喜宴 609 | [网页链接]https://movie.douban.com/subject/1303037/ 610 | [影评]中国家庭的喜怒哀乐忍。 611 | 612 | 613 | 151 614 | [中文名称]电锯惊魂 615 | [网页链接]https://movie.douban.com/subject/1417598/ 616 | [影评]真相就在眼前。 617 | 152 618 | [中文名称]风之谷 619 | [网页链接]https://movie.douban.com/subject/1291585/ 620 | [影评]动画片的圣经。 621 | 153 622 | [中文名称]我是山姆 623 | [网页链接]https://movie.douban.com/subject/1306861/ 624 | [影评]爱并不需要智商。 625 | 154 626 | [中文名称]头号玩家 627 | [网页链接]https://movie.douban.com/subject/4920389/ 628 | [影评]写给影迷，动漫迷和游戏迷的一封情书。 629 | 155 630 | [中文名称]英雄本色 631 | [网页链接]https://movie.douban.com/subject/1297574/ 632 | [影评]英雄泪短，兄弟情长。 633 | 156 634 | [中文名称]上帝之城 635 | [网页链接]https://movie.douban.com/subject/1292208/ 636 | [影评]被上帝抛弃了的上帝之城。 637 | 157 638 | [中文名称]谍影重重3 639 | [网页链接]https://movie.douban.com/subject/1578507/ 640 | [影评]像吃了苏打饼一样干脆的电影。 641 | 158 642 | [中文名称]疯狂原始人 643 | [网页链接]https://movie.douban.com/subject/1907966/ 644 | [影评]老少皆宜，这就是好莱坞动画的魅力。 645 | 159 646 | [中文名称]未麻的部屋 647 | [网页链接]https://movie.douban.com/subject/1395091/ 648 | [影评]好的剧本是，就算你猜到了结局也猜不到全部。 649 | 160 650 | [中文名称]卢旺达饭店 651 | [网页链接]https://movie.douban.com/subject/1291822/ 652 | [影评]当这个世界闭上双眼，他却敞开了怀抱。 653 | 161 654 | [中文名称]纵横四海 655 | [网页链接]https://movie.douban.com/subject/1295409/ 656 | [影评]香港浪漫主义警匪动作片的巅峰之作。 657 | 162 658 | [中文名称]三块广告牌 659 | [网页链接]https://movie.douban.com/subject/26611804/ 660 | [影评]怼天怼地，你走后，她与世界为敌。 661 | 163 662 | [中文名称]岁月神偷 663 | [网页链接]https://movie.douban.com/subject/3792799/ 664 | [影评]岁月流逝，来日可追。 665 | 164 666 | [中文名称]花样年华 667 | [网页链接]https://movie.douban.com/subject/1291557/ 668 | [影评]偷情本没有这样美。 669 | 165 670 | [中文名称]达拉斯买家俱乐部 671 | [网页链接]https://movie.douban.com/subject/1793929/ 672 | [影评]Jared Leto的腿比女人还美！ 673 | 166 674 | [中文名称]心迷宫 675 | [网页链接]https://movie.douban.com/subject/25917973/ 676 | [影评]荒诞讽刺，千奇百巧，抽丝剥茧，百转千回。 677 | 167 678 | [中文名称]模仿游戏 679 | [网页链接]https://movie.douban.com/subject/10463953/ 680 | [影评]他给机器起名“克里斯托弗”，因为这是他初恋的名字。 681 | 168 682 | [中文名称]黑客帝国3：矩阵革命 683 | [网页链接]https://movie.douban.com/subject/1302467/ 684 | [影评]不得不说，《黑客帝国》系列是商业片与科幻、哲学完美结合的典范。 685 | 169 686 | [中文名称]记忆碎片 687 | [网页链接]https://movie.douban.com/subject/1304447/ 688 | [影评]一个针管引发的血案。 689 | 170 690 | [中文名称]新世界 691 | [网页链接]https://movie.douban.com/subject/10437779/ 692 | [影评]要做就做得狠一点，这样才能活下去。 693 | 171 694 | [中文名称]头脑特工队 695 | [网页链接]https://movie.douban.com/subject/10533913/ 696 | [影评]愿我们都不用长大，每一座城堡都能永远存在。 697 | 172 698 | [中文名称]你的名字。 699 | [网页链接]https://movie.douban.com/subject/26683290/ 700 | [影评]穿越错位的时空，仰望陨落的星辰，你没留下你的名字，我却无法忘记那句“我爱你”。 701 | 173 702 | [中文名称]荒蛮故事 703 | [网页链接]https://movie.douban.com/subject/24750126/ 704 | [影评]始于荒诞，止于更荒诞。 705 | 174 706 | [中文名称]忠犬八公物语 707 | [网页链接]https://movie.douban.com/subject/1959195/ 708 | [影评]养狗三日，便会对你终其一生。 709 | 175 710 | [中文名称]真爱至上 711 | [网页链接]https://movie.douban.com/subject/1292401/ 712 | [影评]爱，是个动词。 713 | 714 | 715 | 176 716 | [中文名称]爆裂鼓手 717 | [网页链接]https://movie.douban.com/subject/25773932/ 718 | [影评]这个世界从不善待努力的人，努力了也不一定会成功，但是知道自己在努力，就是活下去的动力。 719 | 177 720 | [中文名称]贫民窟的百万富翁 721 | [网页链接]https://movie.douban.com/subject/2209573/ 722 | [影评]上帝之城+猜火车+阿甘正传+开心辞典=山寨富翁 723 | 178 724 | [中文名称]萤火虫之墓 725 | [网页链接]https://movie.douban.com/subject/1293318/ 726 | [影评]幸福是生生不息，却难以触及的远。 727 | 179 728 | [中文名称]东邪西毒 729 | [网页链接]https://movie.douban.com/subject/1292328/ 730 | [影评]电影诗。 731 | 180 732 | [中文名称]海街日记 733 | [网页链接]https://movie.douban.com/subject/25895901/ 734 | [影评]是枝裕和的家庭习作。 735 | 181 736 | [中文名称]黑天鹅 737 | [网页链接]https://movie.douban.com/subject/1978709/ 738 | [影评]黑暗之美。 739 | 182 740 | [中文名称]惊魂记 741 | [网页链接]https://movie.douban.com/subject/1293181/ 742 | [影评]故事的反转与反转，分裂电影的始祖。 743 | 183 744 | [中文名称]无敌破坏王 745 | [网页链接]https://movie.douban.com/subject/6534248/ 746 | [影评]迪士尼和皮克斯拿错剧本的产物。 747 | 184 748 | [中文名称]你看起来好像很好吃 749 | [网页链接]https://movie.douban.com/subject/4848115/ 750 | [影评]感情不分食草或者食肉。 751 | 185 752 | [中文名称]冰川时代 753 | [网页链接]https://movie.douban.com/subject/1291578/ 754 | [影评]松鼠才是角儿。 755 | 186 756 | [中文名称]小偷家族 757 | [网页链接]https://movie.douban.com/subject/27622447/ 758 | [影评]我们组成了家。 759 | 187 760 | [中文名称]雨人 761 | [网页链接]https://movie.douban.com/subject/1291870/ 762 | [影评]生活在自己的世界里，也可以让周围的人显得可笑和渺小。 763 | 188 764 | [中文名称]绿里奇迹 765 | [网页链接]https://movie.douban.com/subject/1300374/ 766 | [影评]天使暂时离开。 767 | 189 768 | [中文名称]恋恋笔记本 769 | [网页链接]https://movie.douban.com/subject/1309163/ 770 | [影评]爱情没有那么多借口，如果不能圆满，只能说明爱的不够。 771 | 190 772 | [中文名称]寄生虫 773 | [网页链接]https://movie.douban.com/subject/27010768/ 774 | 191 775 | [中文名称]爱在午夜降临前 776 | [网页链接]https://movie.douban.com/subject/10808442/ 777 | [影评]所谓爱情，就是话唠一路，都不会心生腻烦，彼此嫌弃。 778 | 192 779 | [中文名称]哈利·波特与火焰杯 780 | [网页链接]https://movie.douban.com/subject/1309055/ 781 | 193 782 | [中文名称]疯狂的石头 783 | [网页链接]https://movie.douban.com/subject/1862151/ 784 | [影评]中国版《两杆大烟枪》。 785 | 194 786 | [中文名称]恐怖游轮 787 | [网页链接]https://movie.douban.com/subject/3011051/ 788 | [影评]不要企图在重复中寻找已经失去的爱。 789 | 195 790 | [中文名称]奇迹男孩 791 | [网页链接]https://movie.douban.com/subject/26787574/ 792 | [影评]世界不完美，爱会有奇迹。 793 | 196 794 | [中文名称]雨中曲 795 | [网页链接]https://movie.douban.com/subject/1293460/ 796 | [影评]骨灰级歌舞片。 797 | 197 798 | [中文名称]魔女宅急便 799 | [网页链接]https://movie.douban.com/subject/1307811/ 800 | [影评]宫崎骏的电影总让人感觉世界是美好的，阳光明媚的。 801 | 198 802 | [中文名称]二十二 803 | [网页链接]https://movie.douban.com/subject/26430107/ 804 | [影评]有一些东西不应该被遗忘。 805 | 199 806 | [中文名称]海边的曼彻斯特 807 | [网页链接]https://movie.douban.com/subject/25980443/ 808 | [影评]我们都有权利不与自己的过去和解。 809 | 200 810 | [中文名称]房间 811 | [网页链接]https://movie.douban.com/subject/25724855/ 812 | [影评]被偷走的岁月，被伤害的生命，被禁锢的灵魂，终将被希望和善意救赎。 813 | 814 | 815 | 201 816 | [中文名称]虎口脱险 817 | [网页链接]https://movie.douban.com/subject/1296909/ 818 | [影评]永远看不腻的喜剧。 819 | 202 820 | [中文名称]九品芝麻官 821 | [网页链接]https://movie.douban.com/subject/1297518/ 822 | 203 823 | [中文名称]人工智能 824 | [网页链接]https://movie.douban.com/subject/1302827/ 825 | [影评]对爱的执着，可以超越一切。 826 | 204 827 | [中文名称]2001太空漫游 828 | [网页链接]https://movie.douban.com/subject/1292226/ 829 | [影评]现代科幻电影的开山之作，最伟大导演的最伟大影片。 830 | 205 831 | [中文名称]可可西里 832 | [网页链接]https://movie.douban.com/subject/1308857/ 833 | [影评]坚硬的信仰。 834 | 206 835 | [中文名称]色，戒 836 | [网页链接]https://movie.douban.com/subject/1828115/ 837 | [影评]假戏真情，爱欲深海 838 | 207 839 | [中文名称]罗生门 840 | [网页链接]https://movie.douban.com/subject/1291879/ 841 | [影评]人生的N种可能性。 842 | 208 843 | [中文名称]城市之光 844 | [网页链接]https://movie.douban.com/subject/1293908/ 845 | [影评]永远的小人物，伟大的卓别林。 846 | 209 847 | [中文名称]终结者2：审判日 848 | [网页链接]https://movie.douban.com/subject/1291844/ 849 | [影评]少见的超越首部的续集，动作片中的经典。 850 | 210 851 | [中文名称]初恋这件小事 852 | [网页链接]https://movie.douban.com/subject/4739952/ 853 | [影评]黑小鸭速效美白记。 854 | 211 855 | [中文名称]魂断蓝桥 856 | [网页链接]https://movie.douban.com/subject/1293964/ 857 | [影评]中国式内在的美国电影。 858 | 212 859 | [中文名称]牯岭街少年杀人事件 860 | [网页链接]https://movie.douban.com/subject/1292329/ 861 | [影评]弱者送给弱者的一刀。 862 | 213 863 | [中文名称]遗愿清单 864 | [网页链接]https://movie.douban.com/subject/1867345/ 865 | [影评]用剩余不多的时间，去燃烧整个生命。 866 | 214 867 | [中文名称]大佛普拉斯 868 | [网页链接]https://movie.douban.com/subject/27059130/ 869 | [影评]人们可以登上月球，却永远无法探索人们内心的宇宙。 870 | 215 871 | [中文名称]波西米亚狂想曲 872 | [网页链接]https://movie.douban.com/subject/5300054/ 873 | 216 874 | [中文名称]新龙门客栈 875 | [网页链接]https://movie.douban.com/subject/1292287/ 876 | [影评]嬉笑怒骂，调风动月。 877 | 217 878 | [中文名称]源代码 879 | [网页链接]https://movie.douban.com/subject/3075287/ 880 | [影评]邓肯·琼斯继《月球》之后再度奉献出一部精彩绝伦的科幻佳作。 881 | 218 882 | [中文名称]青蛇 883 | [网页链接]https://movie.douban.com/subject/1303394/ 884 | [影评]人生如此，浮生如斯。谁人言，花彼岸，此生情长意短。谁都是不懂爱的罢了。 885 | 219 886 | [中文名称]海洋 887 | [网页链接]https://movie.douban.com/subject/3443389/ 888 | [影评]大海啊，不全是水。 889 | 220 890 | [中文名称]燃情岁月 891 | [网页链接]https://movie.douban.com/subject/1295865/ 892 | [影评]传奇，不是每个人都可以拥有。 893 | 221 894 | [中文名称]无耻混蛋 895 | [网页链接]https://movie.douban.com/subject/1438652/ 896 | [影评]昆汀同学越来越变态了，比北野武还杜琪峰。 897 | 222 898 | [中文名称]疯狂的麦克斯4：狂暴之路 899 | [网页链接]https://movie.douban.com/subject/3592854/ 900 | [影评]“多么美好的一天！”轰轰轰砰咚，啪哒哒哒轰隆隆，磅~ 901 | 223 902 | [中文名称]血钻 903 | [网页链接]https://movie.douban.com/subject/1428175/ 904 | [影评]每个美丽事物背后都是滴血的现实。 905 | 224 906 | [中文名称]步履不停 907 | [网页链接]https://movie.douban.com/subject/2222996/ 908 | [影评]日本的家庭电影已经是世界巅峰了，步履不停是巅峰中的佳作。 909 | 225 910 | [中文名称]穿越时空的少女 911 | [网页链接]https://movie.douban.com/subject/1937946/ 912 | [影评]爱上未来的你。 913 | 914 | 915 | 226 916 | [中文名称]谍影重重2 917 | [网页链接]https://movie.douban.com/subject/1308767/ 918 | [影评]谁说王家卫镜头很晃？ 919 | 227 920 | [中文名称]阿飞正传 921 | [网页链接]https://movie.douban.com/subject/1305690/ 922 | [影评]王家卫是一种风格，张国荣是一个代表。 923 | 228 924 | [中文名称]彗星来的那一夜 925 | [网页链接]https://movie.douban.com/subject/25807345/ 926 | [影评]小成本大魅力。 927 | 229 928 | [中文名称]地球上的星星 929 | [网页链接]https://movie.douban.com/subject/2363506/ 930 | [影评]天使保护事件始末。 931 | 230 932 | [中文名称]完美陌生人 933 | [网页链接]https://movie.douban.com/subject/26614893/ 934 | [影评]来啊，互相伤害啊！ 935 | 231 936 | [中文名称]战争之王 937 | [网页链接]https://movie.douban.com/subject/1419936/ 938 | [影评]做一颗让别人需要你的棋子。 939 | 232 940 | [中文名称]谍影重重 941 | [网页链接]https://movie.douban.com/subject/1304102/ 942 | [影评]哗啦啦啦啦，天在下雨，哗啦啦啦啦，云在哭泣……找自己。 943 | 233 944 | [中文名称]香水 945 | [网页链接]https://movie.douban.com/subject/1760622/ 946 | [影评]一个单凭体香达到高潮的男人。 947 | 234 948 | [中文名称]东京教父 949 | [网页链接]https://movie.douban.com/subject/1310177/ 950 | 235 951 | [中文名称]东京物语 952 | [网页链接]https://movie.douban.com/subject/1291568/ 953 | [影评]东京那么大，如果有一天走失了，恐怕一辈子不能再相见。 954 | 236 955 | [中文名称]千钧一发 956 | [网页链接]https://movie.douban.com/subject/1300117/ 957 | [影评]一部能引人思考的科幻励志片。 958 | 237 959 | [中文名称]朗读者 960 | [网页链接]https://movie.douban.com/subject/2213597/ 961 | [影评]当爱情跨越年龄的界限，它似乎能变得更久远一点，成为一种责任，一种水到渠成的相濡以沫。 962 | 238 963 | [中文名称]无间道2 964 | [网页链接]https://movie.douban.com/subject/1307106/ 965 | 239 966 | [中文名称]再次出发之纽约遇见你 967 | [网页链接]https://movie.douban.com/subject/6874403/ 968 | [影评]爱我就给我看你的播放列表。 969 | 240 970 | [中文名称]驴得水 971 | [网页链接]https://movie.douban.com/subject/25921812/ 972 | [影评]过去的如果就让它过去了，未来只会越来越糟！ 973 | 241 974 | [中文名称]黑客帝国2：重装上阵 975 | [网页链接]https://movie.douban.com/subject/1304141/ 976 | [影评]一个精彩的世界观正在缓缓建立。 977 | 242 978 | [中文名称]崖上的波妞 979 | [网页链接]https://movie.douban.com/subject/1959877/ 980 | 243 981 | [中文名称]猜火车 982 | [网页链接]https://movie.douban.com/subject/1292528/ 983 | [影评]不可猜的青春迷笛。 984 | 244 985 | [中文名称]我爱你 986 | [网页链接]https://movie.douban.com/subject/5908478/ 987 | [影评]你要相信，这世上真的有爱存在，不管在什么年纪 988 | 245 989 | [中文名称]浪潮 990 | [网页链接]https://movie.douban.com/subject/2297265/ 991 | [影评]世界离独裁只有五天。 992 | 246 993 | [中文名称]聚焦 994 | [网页链接]https://movie.douban.com/subject/25954475/ 995 | [影评]新闻人的理性求真。 996 | 247 997 | [中文名称]小萝莉的猴神大叔 998 | [网页链接]https://movie.douban.com/subject/26393561/ 999 | [影评]宝莱坞的萝莉与大叔。 1000 | 248 1001 | [中文名称]追随 1002 | [网页链接]https://movie.douban.com/subject/1397546/ 1003 | [影评]诺兰的牛逼来源于内心散发出的恐惧。 1004 | 249 1005 | [中文名称]黑鹰坠落 1006 | [网页链接]https://movie.douban.com/subject/1291824/ 1007 | [影评]还原真实而残酷的战争。 1008 | 250 1009 | [中文名称]网络谜踪 1010 | [网页链接]https://movie.douban.com/subject/27615441/ 1011 | 1012 | 1013 | -------------------------------------------------------------------------------- /第5章-BS爬取豆瓣电影/chapter05_01.py: -------------------------------------------------------------------------------- 1 | # -*- coding:utf-8 -*- 2 | # By:Eastmount CSDN 3 | import urllib.request 4 | import re 5 | from bs4 import BeautifulSoup 6 | 7 | # 爬虫函数 8 | def crawl(url, headers): 9 | page = urllib.request.Request(url, headers=headers) 10 | page = urllib.request.urlopen(page) 11 | contents = page.read() 12 | #print(contents) 13 | 14 | soup = BeautifulSoup(contents, "html.parser") 15 | print('豆瓣电影250: 序号 \t影片名\t 评分 \t评价人数') 16 | for tag in soup.find_all(attrs={"class":"item"}): 17 | content = tag.get_text() 18 | content = content.replace('\n','') #删除多余换行 19 | #print(content, '\n') 20 | 21 | for tag in soup.find_all(attrs={"class":"item"}): 22 | title = tag.find_all(attrs={"class":"title"}) #电影名称 23 | info = tag.find(attrs={"class":"star"}).get_text() #爬取评分和评论数 24 | print(title[0]) 25 | print(info.replace('\n','')) 26 | 27 | # 主函数 28 | if __name__ == '__main__': 29 | url = 'http://movie.douban.com/top250?format=text' 30 | headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) \ 31 | AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'} 32 | crawl(url, headers) 33 | -------------------------------------------------------------------------------- /第5章-BS爬取豆瓣电影/chapter05_02.py: -------------------------------------------------------------------------------- 1 | # -*- coding: utf-8 -*- 2 | # By:Eastmount CSDN 3 | import urllib.request 4 | import re 5 | from bs4 import BeautifulSoup 6 | import codecs 7 | 8 | #-------------------------------------爬虫函数------------------------------------- 9 | def crawl(url, headers): 10 | page = urllib.request.Request(url, headers=headers) 11 | page = urllib.request.urlopen(page) 12 | contents = page.read() 13 | 14 | soup = BeautifulSoup(contents, "html.parser") 15 | infofile.write("") 16 | print('爬取豆瓣电影250: \n') 17 | 18 | for tag in soup.find_all(attrs={"class":"item"}): 19 | #爬取序号 20 | num = tag.find('em').get_text() 21 | print(num) 22 | infofile.write(num + "\r\n") 23 | 24 | #电影名称 25 | name = tag.find_all(attrs={"class":"title"}) 26 | zwname = name[0].get_text() 27 | print('[中文名称]', zwname) 28 | infofile.write("[中文名称]" + zwname + "\r\n") 29 | 30 | #网页链接 31 | url_movie = tag.find(attrs={"class":"hd"}).a 32 | urls = url_movie.attrs['href'] 33 | print('[网页链接]', urls) 34 | infofile.write("[网页链接]" + urls + "\r\n") 35 | 36 | #爬取评分和评论数 37 | info = tag.find(attrs={"class":"star"}).get_text() 38 | info = info.replace('\n',' ') 39 | info = info.lstrip() 40 | print('[评分评论]', info) 41 | 42 | #获取评语 43 | info = tag.find(attrs={"class":"inq"}) 44 | if(info): #避免没有影评调用get_text()报错 45 | content = info.get_text() 46 | print('[影评]', content) 47 | infofile.write(u"[影评]" + content + "\r\n") 48 | print('') 49 | 50 | #-------------------------------------主函数------------------------------------- 51 | if __name__ == '__main__': 52 | #存储文件 53 | infofile = codecs.open("Result_Douban.txt", 'a', 'utf-8') 54 | 55 | #消息头 56 | headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) \ 57 | AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'} 58 | 59 | #翻页 60 | i = 0 61 | while i<10: 62 | print('页码', (i+1)) 63 | num = i*25 #每次显示25部 URL序号按25增加 64 | url = 'https://movie.douban.com/top250?start=' + str(num) + '&filter=' 65 | crawl(url, headers) 66 | infofile.write("\r\n\r\n") 67 | i = i + 1 68 | infofile.close() 69 | -------------------------------------------------------------------------------- /第5章-BS爬取豆瓣电影/chapter05_03.py: -------------------------------------------------------------------------------- 1 | # -*- coding: utf-8 -*- 2 | # By:Eastmount CSDN 3 | import urllib.request 4 | import re 5 | from bs4 import BeautifulSoup 6 | import codecs 7 | 8 | #-----------------------------------爬取详细信息------------------------------------- 9 | def getInfo(url, headers): 10 | page = urllib.request.Request(url, headers=headers) 11 | page = urllib.request.urlopen(page) 12 | content = page.read() 13 | soup = BeautifulSoup(content, "html.parser") 14 | 15 | #电影简介 16 | print('电影简介:') 17 | info = soup.find(attrs={"id":"info"}) 18 | print(info.get_text()) 19 | other = soup.find(attrs={"class":"related-info"}).get_text() 20 | print(other.replace('\n','').replace(' ','')) 21 | 22 | #评论 23 | print('\n评论信息:') 24 | for tag in soup.find_all(attrs={"id":"hot-comments"}): 25 | for comment in tag.find_all(attrs={"class":"comment-item"}): 26 | com = comment.find("p").get_text() 27 | print(com.replace('\n','').replace(' ','')) 28 | print("\n\n\n----------------------------------------------------------------") 29 | 30 | #-------------------------------------爬虫函数------------------------------------- 31 | def crawl(url, headers): 32 | page = urllib.request.Request(url, headers=headers) 33 | page = urllib.request.urlopen(page) 34 | contents = page.read() 35 | soup = BeautifulSoup(contents, "html.parser") 36 | 37 | for tag in soup.find_all(attrs={"class":"item"}): 38 | #爬取序号 39 | num = tag.find('em').get_text() 40 | print(num) 41 | 42 | #电影名称 43 | name = tag.find_all(attrs={"class":"title"}) 44 | zwname = name[0].get_text() 45 | print('[中文名称]', zwname) 46 | 47 | #网页链接 48 | url_movie = tag.find(attrs={"class":"hd"}).a 49 | urls = url_movie.attrs['href'] 50 | print('[网页链接]', urls) 51 | 52 | #爬取评分和评论数 53 | info = tag.find(attrs={"class":"star"}).get_text() 54 | info = info.replace('\n',' ') 55 | info = info.lstrip() 56 | 57 | #正则表达式获取数字 58 | mode = re.compile(r'\d+\.?\d*') 59 | i = 0 60 | for n in mode.findall(info): 61 | if i==0: 62 | print('[电影分数]', n) 63 | elif i==1: 64 | print('[电影评论]', n) 65 | i = i + 1 66 | 67 | #获取评语 68 | getInfo(urls, headers) 69 | 70 | #-------------------------------------主函数------------------------------------- 71 | if __name__ == '__main__': 72 | #消息头 73 | headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) \ 74 | AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'} 75 | 76 | #翻页 77 | i = 0 78 | while i<10: 79 | print('页码', (i+1)) 80 | num = i*25 #每次显示25部 URL序号按25增加 81 | url = 'https://movie.douban.com/top250?start=' + str(num) + '&filter=' 82 | crawl(url, headers) 83 | i = i + 1 84 | break 85 | -------------------------------------------------------------------------------- /第6章-Python数据库知识/MySQL_python-1.2.5-cp27-none-win_amd64.whl: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/eastmountyxz/Book1-Python-DataCrawl/6d5259371a60a8fa5f4dd1c40673a9704414c8c8/第6章-Python数据库知识/MySQL_python-1.2.5-cp27-none-win_amd64.whl -------------------------------------------------------------------------------- /第6章-Python数据库知识/chapter06_01.py: -------------------------------------------------------------------------------- 1 | import MySQLdb 2 | conn = MySQLdb.connect(host='localhost', db='bookmanage', user='root', 3 | passwd='123456', port=3306, charset='utf8') 4 | -------------------------------------------------------------------------------- /第6章-Python数据库知识/chapter06_02.py: -------------------------------------------------------------------------------- 1 | import MySQLdb 2 | 3 | try: 4 | conn=MySQLdb.connect(host='localhost',user='root', 5 | passwd='123456',port=3306) 6 | cur=conn.cursor() 7 | res = cur.execute('show databases') 8 | print(res) 9 | for data in cur.fetchall(): 10 | print('%s' % data) 11 | cur.close() 12 | conn.close() 13 | except MySQLdb.Error as e: 14 | print("Mysql Error %d: %s" % (e.args[0], e.args[1])) 15 | -------------------------------------------------------------------------------- /第6章-Python数据库知识/chapter06_03.py: -------------------------------------------------------------------------------- 1 | # coding:utf-8 2 | # By：Eastmount CSDN 3 | import MySQLdb 4 | 5 | try: 6 | conn = MySQLdb.connect(host='localhost',user='root',passwd='123456', 7 | port=3306, db='bookmanage', charset='utf8') 8 | cur = conn.cursor() 9 | res = cur.execute('select * from books') 10 | print('表中包含', res, u'条数据\n') 11 | for data in cur.fetchall(): 12 | print('%s %s %s %s' % data) 13 | cur.close() 14 | conn.close() 15 | 16 | except MySQLdb.Error as e: 17 | print("Mysql Error %d: %s" % (e.args[0], e.args[1])) 18 | -------------------------------------------------------------------------------- /第6章-Python数据库知识/chapter06_04.py: -------------------------------------------------------------------------------- 1 | # coding:utf-8 2 | # By：Eastmount CSDN 3 | import MySQLdb 4 | 5 | try: 6 | conn = MySQLdb.connect(host='localhost',user='root',passwd='123456', 7 | port=3306, db='bookmanage', charset='utf8') 8 | cur = conn.cursor() 9 | sql = '''create table student(id int not null primary key auto_increment, 10 | name char(30) not null, 11 | sex char(20) not null 12 | )''' 13 | cur.execute(sql) 14 | 15 | #查看表 16 | print('插入后包含表:') 17 | cur.execute('show tables') 18 | for data in cur.fetchall(): 19 | print('%s' % data) 20 | cur.close() 21 | conn.commit() 22 | conn.close() 23 | 24 | except MySQLdb.Error as e: 25 | print("Mysql Error %d: %s" % (e.args[0], e.args[1])) 26 | -------------------------------------------------------------------------------- /第6章-Python数据库知识/chapter06_05.py: -------------------------------------------------------------------------------- 1 | # coding:utf-8 2 | # By：Eastmount CSDN 3 | import MySQLdb 4 | 5 | try: 6 | conn=MySQLdb.connect(host='localhost',user='root',passwd='123456', 7 | port=3306, db='bookmanage', charset='utf8') 8 | cur=conn.cursor() 9 | 10 | #插入数据 11 | sql = '''insert into student values(%s, %s, %s)''' 12 | cur.execute(sql, ('3', 'xiaoyang', '男')) 13 | 14 | #查看数据 15 | print('\n插入数据:') 16 | cur.execute('select * from student') 17 | for data in cur.fetchall(): 18 | print('%s %s %s' % data) 19 | cur.close() 20 | conn.commit() 21 | conn.close() 22 | except MySQLdb.Error as e: 23 | print("Mysql Error %d: %s" % (e.args[0], e.args[1])) 24 | -------------------------------------------------------------------------------- /第6章-Python数据库知识/chapter06_06.py: -------------------------------------------------------------------------------- 1 | #-*- coding:utf-8 -*- 2 | # By：Eastmount CSDN 3 | import sqlite3 4 | 5 | #连接数据库：如果数据库不存在则创建 6 | conn = sqlite3.connect('test6.db') 7 | cur = conn.cursor() 8 | print('数据库创建成功.\n') 9 | 10 | #创建表 PEOPLE(编号,姓名,年龄,公司,薪水) 11 | cur.execute('''CREATE TABLE PEOPLE 12 | (ID INT PRIMARY KEY NOT NULL, 13 | NAME TEXT NOT NULL, 14 | AGE INT NOT NULL, 15 | COMPANY CHAR(50), 16 | SALARY REAL); 17 | ''') 18 | print("PEOPLE表创建成功.\n") 19 | conn.commit() 20 | 21 | #插入数据 22 | cur.execute("INSERT INTO PEOPLE (ID,NAME,AGE,COMPANY,SALARY) \ 23 | VALUES (1, '小杨', 26, '华为', 10000.00 )"); 24 | cur.execute("INSERT INTO PEOPLE (ID,NAME,AGE,COMPANY,SALARY) \ 25 | VALUES (2, '小颜', 26, '百度', 8800.00 )"); 26 | cur.execute("INSERT INTO PEOPLE (ID,NAME,AGE,COMPANY,SALARY) \ 27 | VALUES (3, '小红', 28, '腾讯', 9800.00 )"); 28 | conn.commit() 29 | print("数据插入成功.\n") 30 | 31 | #查询操作 32 | cursor = cur.execute("SELECT id, name, age, company, salary from PEOPLE") 33 | print("数据查询成功.") 34 | print("序号", "姓名", "年龄", "公司", "薪水") 35 | for row in cursor: 36 | print(row[0], row[1], row[2], row[3], row[4]) 37 | print('') 38 | 39 | #更新操作 40 | cur.execute("UPDATE PEOPLE set COMPANY = '华为' where ID=2") 41 | conn.commit() 42 | print("数据更新成功.") 43 | cursor = cur.execute("SELECT id, name, company from PEOPLE") 44 | for row in cursor: 45 | print(row[0], row[1], row[2]) 46 | print('') 47 | 48 | #删除操作 49 | cur.execute("DELETE from PEOPLE where COMPANY='华为';") 50 | conn.commit() 51 | print("数据删除成功.") 52 | cursor = cur.execute("SELECT id, name, company from PEOPLE") 53 | for row in cursor: 54 | print(row[0], row[1], row[2]) 55 | print('') 56 | 57 | #关闭连接 58 | conn.close() 59 | -------------------------------------------------------------------------------- /第6章-Python数据库知识/mysqlclient-1.4.6-cp37-cp37m-win32.whl: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/eastmountyxz/Book1-Python-DataCrawl/6d5259371a60a8fa5f4dd1c40673a9704414c8c8/第6章-Python数据库知识/mysqlclient-1.4.6-cp37-cp37m-win32.whl -------------------------------------------------------------------------------- /第6章-Python数据库知识/mysqlclient-1.4.6-cp37-cp37m-win_amd64.whl: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/eastmountyxz/Book1-Python-DataCrawl/6d5259371a60a8fa5f4dd1c40673a9704414c8c8/第6章-Python数据库知识/mysqlclient-1.4.6-cp37-cp37m-win_amd64.whl -------------------------------------------------------------------------------- /第6章-Python数据库知识/test6.db: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/eastmountyxz/Book1-Python-DataCrawl/6d5259371a60a8fa5f4dd1c40673a9704414c8c8/第6章-Python数据库知识/test6.db --------------------------------------------------------------------------------