├── .DS_Store ├── .idea ├── .gitignore ├── inspectionProfiles │ └── profiles_settings.xml ├── misc.xml ├── modules.xml ├── sentiment_classification_pytorch.iml └── vcs.xml ├── .ignore ├── __pycache__ ├── configs.cpython-37.pyc ├── datasets.cpython-37.pyc └── models.cpython-37.pyc ├── configs.py ├── data ├── .DS_Store ├── dict ├── hit_stopword └── weibo_senti_100k.csv ├── datasets.py ├── models.py ├── process └── data_precess.py └── train.py /.DS_Store: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/WAng91An/sentiment_classification_pytorch/44cf0e51917c176e58662906f9a52cf0813a380c/.DS_Store -------------------------------------------------------------------------------- /.idea/.gitignore: -------------------------------------------------------------------------------- 1 | # Default ignored files 2 | /shelf/ 3 | /workspace.xml 4 | # Datasource local storage ignored files 5 | /dataSources/ 6 | /dataSources.local.xml 7 | # Editor-based HTTP Client requests 8 | /httpRequests/ 9 | -------------------------------------------------------------------------------- /.idea/inspectionProfiles/profiles_settings.xml: -------------------------------------------------------------------------------- 1 | 2 | 3 | 6 | -------------------------------------------------------------------------------- /.idea/misc.xml: -------------------------------------------------------------------------------- 1 | 2 | 3 | 4 | 6 | 7 | -------------------------------------------------------------------------------- /.idea/modules.xml: -------------------------------------------------------------------------------- 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | -------------------------------------------------------------------------------- /.idea/sentiment_classification_pytorch.iml: -------------------------------------------------------------------------------- 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 11 | -------------------------------------------------------------------------------- /.idea/vcs.xml: -------------------------------------------------------------------------------- 1 | 2 | 3 | 4 | 5 | 6 | -------------------------------------------------------------------------------- /.ignore: -------------------------------------------------------------------------------- 1 | .idea 2 | .DS_Store -------------------------------------------------------------------------------- /__pycache__/configs.cpython-37.pyc: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/WAng91An/sentiment_classification_pytorch/44cf0e51917c176e58662906f9a52cf0813a380c/__pycache__/configs.cpython-37.pyc -------------------------------------------------------------------------------- /__pycache__/datasets.cpython-37.pyc: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/WAng91An/sentiment_classification_pytorch/44cf0e51917c176e58662906f9a52cf0813a380c/__pycache__/datasets.cpython-37.pyc -------------------------------------------------------------------------------- /__pycache__/models.cpython-37.pyc: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/WAng91An/sentiment_classification_pytorch/44cf0e51917c176e58662906f9a52cf0813a380c/__pycache__/models.cpython-37.pyc -------------------------------------------------------------------------------- /configs.py: -------------------------------------------------------------------------------- 1 | import torch 2 | class Config(): 3 | def __init__(self): 4 | ''' 5 | self.embeding = nn.Embedding(config.n_vocab, 6 | config.embed_size, 7 | padding_idx=config.n_vocab - 1) 8 | self.lstm = nn.LSTM(config.embed_size, 9 | config.hidden_size, 10 | config.num_layers, 11 | bidirectional=True, batch_first=True, 12 | dropout=config.dropout) 13 | self.maxpool = nn.MaxPool1d(config.pad_size) 14 | self.fc = nn.Linear(config.hidden_size * 2 + config.embed_size, 15 | config.num_classes) 16 | self.softmax = nn.Softmax(dim=1) 17 | ''' 18 | self.n_vocab = 1002 19 | self.embed_size = 256 20 | self.hidden_size = 256 21 | self.num_layers = 5 22 | self.dropout = 0.8 23 | self.num_classes = 2 24 | self.pad_size = 32 25 | self.batch_size = 256 26 | self.is_shuffle = True 27 | self.learn_rate = 0.001 28 | self.num_epochs = 100 29 | self.devices = torch.device('cuda' if torch.cuda.is_available() else 'cpu') -------------------------------------------------------------------------------- /data/.DS_Store: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/WAng91An/sentiment_classification_pytorch/44cf0e51917c176e58662906f9a52cf0813a380c/data/.DS_Store -------------------------------------------------------------------------------- /data/dict: -------------------------------------------------------------------------------- 1 | 泪,0 2 | 嘻嘻,1 3 | 都,2 4 | 爱,3 5 | 抓狂,4 6 | 鼓掌,5 7 | 不,6 8 | 好,7 9 | 回复,8 10 | 怒,9 11 | 去,10 12 | 人,11 13 | 衰,12 14 | 还,13 15 | 晕,14 16 | 说,15 17 | 吃,16 18 | 太,17 19 | 偷笑,18 20 | 很,19 21 | 看,20 22 | !,21 23 | 小,22 24 | 微博,23 25 | 没,24 26 | 想,25 27 | 上,26 28 | http,27 29 | cn,28 30 | t,29 31 | 北京,30 32 | 开心,31 33 | 可爱,32 34 | 今天,33 35 | 大家,34 36 | 大,35 37 | 会,36 38 | 没有,37 39 | 做,38 40 | 心,39 41 | 不是,40 42 | 中国,41 43 | 转发,42 44 | 最,43 45 | 现在,44 46 | 中,45 47 | 再,46 48 | 喜欢,47 49 | 知道,48 50 | 汗,49 51 | 真,50 52 | 赞,51 53 | 谢谢,52 54 | 才,53 55 | 月,54 56 | 真的,55 57 | 蜡烛,56 58 | ",57 59 | 朋友,58 60 | 里,59 61 | 下,60 62 | 看到,61 63 | 给力,62 64 | 已经,63 65 | 请,64 66 | 一起,65 67 | 走,66 68 | 酒店,67 69 | 更,68 70 | 旅游,69 71 | 美食,70 72 | 馋嘴,71 73 | 威武,72 74 | 老,73 75 | good,74 76 | 围观,75 77 | 一下,76 78 | 哈哈哈,77 79 | 老师,78 80 | 年,79 81 | 后,80 82 | 快,81 83 | 买,82 84 | 一定,83 85 | 不能,84 86 | 呵呵,85 87 | 不要,86 88 | 孩子,87 89 | 吃惊,88 90 | ―,89 91 | 亲亲,90 92 | 2,91 93 | 花心,92 94 | 转,93 95 | 觉得,94 96 | 起来,95 97 | 点,96 98 | 时间,97 99 | 失望,98 100 | 感谢,99 101 | 悲伤,100 102 | 生活,101 103 | 酷,102 104 | 带,103 105 | 希望,104 106 | 支持,105 107 | 真是,106 108 | 拍,107 109 | 幸福,108 110 | 新,109 111 | 找,110 112 | 1,111 113 | 上海,112 114 | 出来,113 115 | 终于,114 116 | 明天,115 117 | 世界,116 118 | 不错,117 119 | 欢迎,118 120 | 可怜,119 121 | 快乐,120 122 | 死,121 123 | 这是,122 124 | 期待,123 125 | 活动,124 126 | 发现,125 127 | 不会,126 128 | 感觉,127 129 | 日,128 130 | 笑,129 131 | 应该,130 132 | 3,131 133 | 只,132 134 | 完,133 135 | 最后,134 136 | 必须,135 137 | 看看,136 138 | 儿,137 139 | 时,138 140 | 关注,139 141 | 妈妈,140 142 | 一天,141 143 | 抱抱,142 144 | 家,143 145 | 挖,144 146 | 伤心,145 147 | 天,146 148 | 一次,147 149 | 怒骂,148 150 | 晚上,149 151 | 以后,150 152 | 同学,151 153 | 好吃,152 154 | 旅行,153 155 | 事,154 156 | 话,155 157 | 鼻屎,156 158 | 回来,157 159 | 5,158 160 | 亲,159 161 | 照片,160 162 | 小时,161 163 | 喝,162 164 | 回家,163 165 | 很多,164 166 | 蛋糕,165 167 | 钱,166 168 | 耶,167 169 | 滴,168 170 | 继续,169 171 | 手机,170 172 | V,171 173 | 这种,172 174 | 感动,173 175 | 地方,174 176 | 准备,175 177 | 餐厅,176 178 | 听,177 179 | 送,178 180 | 问题,179 181 | 号,180 182 | 出,181 183 | 其实,182 184 | 今晚,183 185 | 居然,184 186 | 求,185 187 | 前,186 188 | 工作,187 189 | 加油,188 190 | 恭喜,189 191 | 美,190 192 | 咖啡,191 193 | 猫,192 194 | 4,193 195 | 有点,194 196 | 思考,195 197 | 玩,196 198 | 10,197 199 | 分享,198 200 | 东西,199 201 | 最近,200 202 | 推荐,201 203 | 需要,202 204 | 原来,203 205 | 是不是,204 206 | 非常,205 207 | 害羞,206 208 | 我要,207 209 | 每天,208 210 | 周末,209 211 | 哭,210 212 | 写,211 213 | 特别,212 214 | 网,213 215 | 超级,214 216 | 睡,215 217 | 菜,216 218 | 兔子,217 219 | 官方,218 220 | 问,219 221 | 店,220 222 | 话筒,221 223 | 7,222 224 | 两个,223 225 | 张,224 226 | 8,225 227 | 元,226 228 | 昨天,227 229 | 电影,228 230 | 委屈,229 231 | 睡觉,230 232 | 已,231 233 | 却,232 234 | 王,233 235 | 懂,234 236 | 穿,235 237 | 只能,236 238 | 牛,237 239 | 逼,238 240 | 记得,239 241 | 高,240 242 | 公司,241 243 | 味道,242 244 | 看来,243 245 | 礼物,244 246 | 人生,245 247 | 美女,246 248 | 男人,247 249 | 机会,248 250 | 开,249 251 | 鄙视,250 252 | 女人,251 253 | 下次,252 254 | 见,253 255 | 童鞋,254 256 | 新浪,255 257 | 生病,256 258 | 摄影,257 259 | 刚,258 260 | 有人,259 261 | 哥,260 262 | 6,261 263 | 木有,262 264 | 吃货,263 265 | 妈,264 266 | 节目,265 267 | 可能,266 268 | 演员,267 269 | 赶紧,268 270 | 太阳,269 271 | 行,270 272 | 心情,271 273 | 回,272 274 | 无,273 275 | 帮,274 276 | 真心,275 277 | 下午,276 278 | 祝,277 279 | 所有,278 280 | 好好,279 281 | 飞机,280 282 | 挺,281 283 | 努力,282 284 | 女,283 285 | 花,284 286 | 微,285 287 | 美丽,286 288 | 喵,287 289 | 先生,288 290 | 突然,289 291 | 先,290 292 | 成,291 293 | 全球,292 294 | 参加,293 295 | 总,294 296 | 告诉,295 297 | 不到,296 298 | 坐,297 299 | 直接,298 300 | 亲们,299 301 | 2012,300 302 | 李,301 303 | 爱心,302 304 | 肉,303 305 | 吃饭,304 306 | 现场,305 307 | 相声,306 308 | 看着,307 309 | 今年,308 310 | 可惜,309 311 | 早,310 312 | 绝对,311 313 | 好像,312 314 | 电话,313 315 | 永远,314 316 | 厦门,315 317 | 笑哈哈,316 318 | 辛苦,317 319 | 不了,318 320 | 路上,319 321 | 跑,320 322 | 小伙伴,321 323 | 围脖,322 324 | 实在,323 325 | 香港,324 326 | 估计,325 327 | 国际,326 328 | 小姐,327 329 | 男,328 330 | 住,329 331 | 天天,330 332 | 姐姐,331 333 | 9,332 334 | 以为,333 335 | 神马,334 336 | 阳光,335 337 | 奥特曼,336 338 | 饿,337 339 | 30,338 340 | 竟然,339 341 | 亲爱,340 342 | 几天,341 343 | 发,342 344 | 米,343 345 | 一点,344 346 | 时尚,345 347 | 一种,346 348 | 确实,347 349 | 还要,348 350 | 一句,349 351 | 日本,350 352 | 车,351 353 | 黑,352 354 | 上班,353 355 | 早上,354 356 | 创意,355 357 | 音乐,356 358 | 祝福,357 359 | 容易,358 360 | 文化,359 361 | 20,360 362 | 美好,361 363 | 城市,362 364 | 学习,363 365 | 几个,364 366 | 体验,365 367 | 漂亮,366 368 | 收到,367 369 | 故事,368 370 | 姑娘,369 371 | 杂志,370 372 | 不用,371 373 | 哈哈哈哈,372 374 | 第一,373 375 | 鱼,374 376 | 注意,375 377 | 到底,376 378 | 「,377 379 | 干,378 380 | 第一次,379 381 | 搞,380 382 | 我家,381 383 | 事情,382 384 | 不好,383 385 | 享受,384 386 | 不想,385 387 | 天下,386 388 | 肯定,387 389 | 精彩,388 390 | 每次,389 391 | 2013,390 392 | 宝宝,391 393 | 咯,392 394 | 免费,393 395 | 好多,394 396 | 找到,395 397 | 12,396 398 | 熊猫,397 399 | 粉丝,398 400 | 握手,399 401 | 欢乐,400 402 | 小编,401 403 | 站,402 404 | 健康,403 405 | 这次,404 406 | 爸爸,405 407 | 美国,406 408 | 一年,407 409 | 越来越,408 410 | 生日快乐,409 411 | 国家,410 412 | 日子,411 413 | 新闻,412 414 | 卖,413 415 | 图,414 416 | 岁,415 417 | 视频,416 418 | 正,417 419 | 天气,418 420 | 老板,419 421 | 马上,420 422 | 别人,421 423 | 台湾,422 424 | 过来,423 425 | 噢,424 426 | 事儿,425 427 | 相信,426 428 | 人民,427 429 | 梦想,428 430 | 传递,429 431 | 微信,430 432 | 路,431 433 | ....,432 434 | 中午,433 435 | 最好,434 436 | 一张,435 437 | 想起,436 438 | 嘻哈,437 439 | 出门,438 440 | 摄影师,439 441 | 之后,440 442 | 成功,441 443 | 不行,442 444 | 11,443 445 | 图片,444 446 | 看见,445 447 | 媒体,446 448 | 广州,447 449 | 正在,448 450 | 好看,449 451 | 重要,450 452 | 狗,451 453 | 完全,452 454 | 疯,453 455 | 茶,454 456 | 美味,455 457 | 广告,456 458 | 小小,457 459 | 姐,458 460 | 社会,459 461 | 字,460 462 | 尼玛,461 463 | 早安,462 464 | 水,463 465 | 之前,464 466 | ..,465 467 | 过去,466 468 | 昨晚,467 469 | 二,468 470 | 飞,469 471 | 南京,470 472 | 喔,471 473 | 总是,472 474 | 宝贝,473 475 | 青年,474 476 | 胖,475 477 | 服务,476 478 | 难道,477 479 | 导演,478 480 | 减肥,479 481 | 名字,480 482 | 就要,481 483 | 陪,482 484 | 爱情,483 485 | 长,484 486 | 俩,485 487 | 生命,486 488 | 猪,487 489 | 机场,488 490 | 谱,489 491 | 子,490 492 | 值得,491 493 | 加,492 494 | 分,493 495 | 地址,494 496 | 杨,495 497 | 设计,496 498 | 自由,497 499 | 疑问,498 500 | 成为,499 501 | 经典,500 502 | 达,501 503 | 浮云,502 504 | 情况,503 505 | 少,504 506 | 刚刚,505 507 | 结束,506 508 | 才能,507 509 | 吐,508 510 | 梦,509 511 | 儿子,510 512 | 兄弟,511 513 | 三,512 514 | 出现,513 515 | 衣服,514 516 | 包袱,515 517 | 鬼,516 518 | 私信,517 519 | 刘,518 520 | 适合,519 521 | 比较,520 522 | 以前,521 523 | 黑线,522 524 | 兔,523 525 | 家里,524 526 | 道,525 527 | 偶,526 528 | 里面,527 529 | 忙,528 530 | 书,529 531 | 搞笑,530 532 | 擦,531 533 | 想要,532 534 | 2011,533 535 | 获得,534 536 | 据说,535 537 | 声音,536 538 | 变成,537 539 | 评论,538 540 | 陈,539 541 | 火锅,540 542 | 表示,541 543 | 有没有,542 544 | 啊啊啊,543 545 | 温暖,544 546 | 喽,545 547 | 哼哼,546 548 | 放,547 549 | 老公,548 550 | 怕,549 551 | 成都,550 552 | 记者,551 553 | 选择,552 554 | 直播,553 555 | 白,554 556 | 丢,555 557 | 深圳,556 558 | 一只,557 559 | 领导,558 560 | 忘,559 561 | 感受,560 562 | 饭,561 563 | 内,562 564 | 越,563 565 | 不敢,564 566 | 简单,565 567 | 够,566 568 | 一路,567 569 | 脸,568 570 | 催,569 571 | 铺,570 572 | 手,571 573 | 敢,572 574 | 换,573 575 | 品牌,574 576 | 错过,575 577 | 超,576 578 | 当然,577 579 | 疼,578 580 | 旅游局,579 581 | 三个,580 582 | 抢,581 583 | 晚,582 584 | 遇到,583 585 | 天津,584 586 | 傻,585 587 | 生日,586 588 | 唱,587 589 | 身边,588 590 | 再次,589 591 | 认识,590 592 | 100,591 593 | 小心,592 594 | 同事,593 595 | 心里,594 596 | 重庆,595 597 | 当时,596 598 | 微风,597 599 | 地铁,598 600 | A,599 601 | 今日,600 602 | 坚持,601 603 | 鸟,602 604 | 不同,603 605 | 律师,604 606 | 大师,605 607 | 黄,606 608 | 来自,607 609 | 君,608 610 | 弱,609 611 | 无法,610 612 | 卫视,611 613 | 新疆,612 614 | 全,613 615 | 生,614 616 | 两天,615 617 | 雪,616 618 | 冷,617 619 | 包,618 620 | 感冒,619 621 | 试试,620 622 | 肿,621 623 | 多多,622 624 | 晚安,623 625 | 明白,624 626 | 帅,625 627 | 一位,626 628 | 还好,627 629 | 羡慕,628 630 | 假期,629 631 | 想到,630 632 | 不知,631 633 | 拉,632 634 | 风,633 635 | 分钟,634 636 | 杭州,635 637 | 意思,636 638 | 严重,637 639 | 讲,638 640 | 曾,639 641 | 版,640 642 | 度假,641 643 | 红,642 644 | 夏天,643 645 | 每个,644 646 | 台,645 647 | 眼睛,646 648 | 掉,647 649 | 发生,648 650 | 嗨,649 651 | 15,650 652 | 真正,651 653 | 青春,652 654 | 游,653 655 | 本来,654 656 | 进行,655 657 | o,656 658 | 鲜花,657 659 | 厉害,658 660 | 做鬼脸,659 661 | 倒,660 662 | 胖子,661 663 | 回去,662 664 | 学,663 665 | 惊喜,664 666 | 口味,665 667 | 狗狗,666 668 | 在家,667 669 | 算,668 670 | de,669 671 | 神,670 672 | 哥哥,671 673 | 笑星,672 674 | 当年,673 675 | 医院,674 676 | 曾经,675 677 | 右,676 678 | 酒,677 679 | 作家,678 680 | 头,679 681 | 艺术,680 682 | 参与,681 683 | 0,682 684 | 累,683 685 | 浪漫,684 686 | 时代,685 687 | 早餐,686 688 | 我会,687 689 | 自然,688 690 | 貌似,689 691 | 作品,690 692 | 星座,691 693 | DJ,692 694 | 海南,693 695 | 三亚,694 696 | 身体,695 697 | 一条,696 698 | 弄,697 699 | 经常,698 700 | 要求,699 701 | 悲,700 702 | 目前,701 703 | 休息,702 704 | 中心,703 705 | 可怕,704 706 | 动物,705 707 | 汽车,706 708 | 右边,707 709 | 呦,708 710 | 完美,709 711 | 有木有,710 712 | 简直,711 713 | 高兴,712 714 | 个人,713 715 | 左,714 716 | 建议,715 717 | 节奏,716 718 | 瞬间,717 719 | 时光,718 720 | 度,719 721 | 熊,720 722 | 明星,721 723 | 阴险,722 724 | 新鲜,723 725 | 瘦,724 726 | 18,725 727 | 提前,726 728 | 这位,727 729 | 变,728 730 | 恨,729 731 | 专业,730 732 | 伤不起,731 733 | 苹果,732 734 | 面,733 735 | 老婆,734 736 | 纠结,735 737 | 晒,736 738 | 毛,737 739 | 最大,738 740 | 产品,739 741 | 样子,740 742 | 帮忙,741 743 | 婚礼,742 744 | 拍照,743 745 | 香,744 746 | 干杯,745 747 | 见到,746 748 | 餐饮,747 749 | 金,748 750 | 决定,749 751 | 有个,750 752 | 出去,751 753 | 雨,752 754 | 马,753 755 | 戳,754 756 | 精选,755 757 | 次,756 758 | 周,757 759 | 人们,758 760 | 扩散,759 761 | 听说,760 762 | 精神,761 763 | 叔叔,762 764 | 一家,763 765 | 计划,764 766 | 丶,765 767 | 政府,766 768 | 全国,767 769 | 玫瑰,768 770 | 难,769 771 | 万,770 772 | 历史,771 773 | 加班,772 774 | 得意,773 775 | 之旅,774 776 | 今儿,775 777 | 坏,776 778 | 微笑,777 779 | 报名,778 780 | 主持人,779 781 | ---,780 782 | 下去,781 783 | 全部,782 784 | 安全,783 785 | 行者,784 786 | 带来,785 787 | 拍摄,786 788 | 力,787 789 | 闹,788 790 | 父母,789 791 | 平安,790 792 | 空间,791 793 | B,792 794 | 约,793 795 | 疯狂,794 796 | 特,795 797 | 出发,796 798 | 司机,797 799 | 收,798 800 | 热,799 801 | 煮,800 802 | 下来,801 803 | 去年,802 804 | 小米,803 805 | 年轻,804 806 | 不够,805 807 | 腿,806 808 | 下班,807 809 | 一份,808 810 | 提供,809 811 | 女儿,810 812 | 激动,811 813 | 小时候,812 814 | 忘记,813 815 | 韩国,814 816 | 月亮,815 817 | 听到,816 818 | 东方,817 819 | 幸运,818 820 | 厨房,819 821 | 办,820 822 | 起床,821 823 | 春天,822 824 | 泰国,823 825 | 哒,824 826 | 好友,825 827 | 风景,826 828 | 好人,827 829 | M,828 830 | 顶,829 831 | 00,830 832 | 嘿嘿,831 833 | 冬天,832 834 | 医生,833 835 | 小朋友,834 836 | 干嘛,835 837 | 抱,836 838 | 大叔,837 839 | 愿意,838 840 | 汤,839 841 | 是否,840 842 | 真相,841 843 | 编辑,842 844 | 去过,843 845 | 家人,844 846 | 教育,845 847 | 旁边,846 848 | 依然,847 849 | 怀念,848 850 | 贴,849 851 | 百度,850 852 | 得到,851 853 | 方式,852 854 | 师傅,853 855 | 躺,854 856 | 基本,855 857 | 懒人,856 858 | 回到,857 859 | 包子,858 860 | 为啥,859 861 | 行动,860 862 | .....,861 863 | 说话,862 864 | 信息,863 865 | 老人,864 866 | 祝贺,865 867 | 歌,866 868 | 电脑,867 869 | 恐怖,868 870 | 淘宝,869 871 | 天使,870 872 | 下雨,871 873 | 一场,872 874 | 发布,873 875 | __,874 876 | 鸡,875 877 | 不让,876 878 | 教,877 879 | 婺源,878 880 | 海,879 881 | 天空,880 882 | 回忆,881 883 | 互联网,882 884 | 不少,883 885 | 想念,884 886 | 讨厌,885 887 | 文艺,886 888 | 尤其,887 889 | 差,888 890 | 刚才,889 891 | 传说,890 892 | 巧克力,891 893 | Q,892 894 | 挤眼,893 895 | ^,894 896 | 社长,895 897 | 名,896 898 | 便宜,897 899 | 泡,898 900 | 大学,899 901 | 错,900 902 | 火,901 903 | 歌手,902 904 | 电视,903 905 | 排行榜,904 906 | BTV,905 907 | 价格,906 908 | 过年,907 909 | 80,908 910 | ##,909 911 | 组织,910 912 | 非,911 913 | 未来,912 914 | 等待,913 915 | 秀,914 916 | 出版,915 917 | 中奖,916 918 | 萌,917 919 | 妹妹,918 920 | 环境,919 921 | 晚餐,920 922 | 大哥,921 923 | 演出,922 924 | 点儿,923 925 | 更好,924 926 | 即将,925 927 | 能量,926 928 | v,927 929 | 联系,928 930 | 附近,929 931 | 骂,930 932 | 重,931 933 | 传媒,932 934 | 代表,933 935 | 警察,934 936 | 2014,935 937 | 办法,936 938 | 集团,937 939 | 天堂,938 940 | 眼泪,939 941 | 看过,940 942 | 消息,941 943 | 提醒,942 944 | 央视,943 945 | 进,944 946 | 糖,945 947 | 原因,946 948 | 帅哥,947 949 | 后面,948 950 | 女孩,949 951 | 开车,950 952 | 云南,951 953 | 猜,952 954 | 乐,953 955 | 传统,954 956 | 不吃,955 957 | 结婚,956 958 | 精品,957 959 | 特色,958 960 | 同意,959 961 | 多谢,960 962 | 天涯,961 963 | 空气,962 964 | 舒服,963 965 | 后来,964 966 | 海鲜,965 967 | 使用,966 968 | 50,967 969 | 愉快,968 970 | 定制,969 971 | 影响,970 972 | 团,971 973 | 一边,972 974 | 好玩,973 975 | 半天,974 976 | 爹,975 977 | 属于,976 978 | 京城,977 979 | 有福,978 980 | 呆,979 981 | 抓,980 982 | 学校,981 983 | 整个,982 984 | 多年,983 985 | 失眠,984 986 | 辣,985 987 | 安排,986 988 | 形象,987 989 | 明年,988 990 | 了解,989 991 | 系列,990 992 | 电台,991 993 | 一生,992 994 | 网友,993 995 | C,994 996 | 13,995 997 | 打开,996 998 | 企业,997 999 | 主题,998 1000 | 山东,999 1001 | ,1000 1002 | ,1001 1003 | -------------------------------------------------------------------------------- /data/hit_stopword: -------------------------------------------------------------------------------- 1 | ~ 2 | … 3 | _ 4 | ——— 5 | 》), 6 | )÷(1- 7 | ”, 8 | )、 9 | =( 10 | : 11 | → 12 | ℃ 13 | & 14 | * 15 | 一一 16 | ~~~~ 17 | ’ 18 | . 19 | 『 20 | .一 21 | ./ 22 | -- 23 | 』 24 | =″ 25 | 【 26 | [*] 27 | }> 28 | [⑤]] 29 | [①D] 30 | c] 31 | ng昉 32 | * 33 | // 34 | [ 35 | ] 36 | [②e] 37 | [②g] 38 | ={ 39 | } 40 | ,也 41 | ‘ 42 | A 43 | [①⑥] 44 | [②B] 45 | [①a] 46 | [④a] 47 | [①③] 48 | [③h] 49 | ③] 50 | 1. 51 | -- 52 | [②b] 53 | ’‘ 54 | ××× 55 | [①⑧] 56 | 0:2 57 | =[ 58 | [⑤b] 59 | [②c] 60 | [④b] 61 | [②③] 62 | [③a] 63 | [④c] 64 | [①⑤] 65 | [①⑦] 66 | [①g] 67 | ∈[ 68 | [①⑨] 69 | [①④] 70 | [①c] 71 | [②f] 72 | [②⑧] 73 | [②①] 74 | [①C] 75 | [③c] 76 | [③g] 77 | [②⑤] 78 | [②②] 79 | 一. 80 | [①h] 81 | .数 82 | [] 83 | [①B] 84 | 数/ 85 | [①i] 86 | [③e] 87 | [①①] 88 | [④d] 89 | [④e] 90 | [③b] 91 | [⑤a] 92 | [①A] 93 | [②⑧] 94 | [②⑦] 95 | [①d] 96 | [②j] 97 | 〕〔 98 | ][ 99 | :// 100 | ′∈ 101 | [②④ 102 | [⑤e] 103 | 12% 104 | b] 105 | ... 106 | ................... 107 | …………………………………………………③ 108 | ZXFITL 109 | [③F] 110 | 」 111 | [①o] 112 | ]∧′=[ 113 | ∪φ∈ 114 | ′| 115 | {- 116 | ②c 117 | } 118 | [③①] 119 | R.L. 120 | [①E] 121 | Ψ 122 | -[*]- 123 | ↑ 124 | .日 125 | [②d] 126 | [② 127 | [②⑦] 128 | [②②] 129 | [③e] 130 | [①i] 131 | [①B] 132 | [①h] 133 | [①d] 134 | [①g] 135 | [①②] 136 | [②a] 137 | f] 138 | [⑩] 139 | a] 140 | [①e] 141 | [②h] 142 | [②⑥] 143 | [③d] 144 | [②⑩] 145 | e] 146 | 〉 147 | 】 148 | 元/吨 149 | [②⑩] 150 | 2.3% 151 | 5:0 152 | [①] 153 | :: 154 | [②] 155 | [③] 156 | [④] 157 | [⑤] 158 | [⑥] 159 | [⑦] 160 | [⑧] 161 | [⑨] 162 | …… 163 | —— 164 | ? 165 | 、 166 | 。 167 | “ 168 | ” 169 | 《 170 | 》 171 | ! 172 | , 173 | : 174 | ; 175 | ? 176 | . 177 | , 178 | . 179 | ' 180 | ? 181 | · 182 | ——— 183 | ── 184 | ? 185 | — 186 | < 187 | > 188 | ( 189 | ) 190 | 〔 191 | 〕 192 | [ 193 | ] 194 | ( 195 | ) 196 | - 197 | + 198 | ~ 199 | × 200 | / 201 | / 202 | ① 203 | ② 204 | ③ 205 | ④ 206 | ⑤ 207 | ⑥ 208 | ⑦ 209 | ⑧ 210 | ⑨ 211 | ⑩ 212 | Ⅲ 213 | В 214 | " 215 | ; 216 | # 217 | @ 218 | γ 219 | μ 220 | φ 221 | φ. 222 | × 223 | Δ 224 | ■ 225 | ▲ 226 | sub 227 | exp 228 | sup 229 | sub 230 | Lex 231 | # 232 | % 233 | & 234 | ' 235 | + 236 | +ξ 237 | ++ 238 | - 239 | -β 240 | < 241 | <± 242 | <Δ 243 | <λ 244 | <φ 245 | << 246 | = 247 | = 248 | =☆ 249 | =- 250 | > 251 | >λ 252 | _ 253 | ~± 254 | ~+ 255 | [⑤f] 256 | [⑤d] 257 | [②i] 258 | ≈ 259 | [②G] 260 | [①f] 261 | LI 262 | ㈧ 263 | [- 264 | ...... 265 | 〉 266 | [③⑩] 267 | 第二 268 | 一番 269 | 一直 270 | 一个 271 | 一些 272 | 许多 273 | 种 274 | 有的是 275 | 也就是说 276 | 末##末 277 | 啊 278 | 阿 279 | 哎 280 | 哎呀 281 | 哎哟 282 | 唉 283 | 俺 284 | 俺们 285 | 按 286 | 按照 287 | 吧 288 | 吧哒 289 | 把 290 | 罢了 291 | 被 292 | 本 293 | 本着 294 | 比 295 | 比方 296 | 比如 297 | 鄙人 298 | 彼 299 | 彼此 300 | 边 301 | 别 302 | 别的 303 | 别说 304 | 并 305 | 并且 306 | 不比 307 | 不成 308 | 不单 309 | 不但 310 | 不独 311 | 不管 312 | 不光 313 | 不过 314 | 不仅 315 | 不拘 316 | 不论 317 | 不怕 318 | 不然 319 | 不如 320 | 不特 321 | 不惟 322 | 不问 323 | 不只 324 | 朝 325 | 朝着 326 | 趁 327 | 趁着 328 | 乘 329 | 冲 330 | 除 331 | 除此之外 332 | 除非 333 | 除了 334 | 此 335 | 此间 336 | 此外 337 | 从 338 | 从而 339 | 打 340 | 待 341 | 但 342 | 但是 343 | 当 344 | 当着 345 | 到 346 | 得 347 | 的 348 | 的话 349 | 等 350 | 等等 351 | 地 352 | 第 353 | 叮咚 354 | 对 355 | 对于 356 | 多 357 | 多少 358 | 而 359 | 而况 360 | 而且 361 | 而是 362 | 而外 363 | 而言 364 | 而已 365 | 尔后 366 | 反过来 367 | 反过来说 368 | 反之 369 | 非但 370 | 非徒 371 | 否则 372 | 嘎 373 | 嘎登 374 | 该 375 | 赶 376 | 个 377 | 各 378 | 各个 379 | 各位 380 | 各种 381 | 各自 382 | 给 383 | 根据 384 | 跟 385 | 故 386 | 故此 387 | 固然 388 | 关于 389 | 管 390 | 归 391 | 果然 392 | 果真 393 | 过 394 | 哈 395 | 哈哈 396 | 呵 397 | 和 398 | 何 399 | 何处 400 | 何况 401 | 何时 402 | 嘿 403 | 哼 404 | 哼唷 405 | 呼哧 406 | 乎 407 | 哗 408 | 还是 409 | 还有 410 | 换句话说 411 | 换言之 412 | 或 413 | 或是 414 | 或者 415 | 极了 416 | 及 417 | 及其 418 | 及至 419 | 即 420 | 即便 421 | 即或 422 | 即令 423 | 即若 424 | 即使 425 | 几 426 | 几时 427 | 己 428 | 既 429 | 既然 430 | 既是 431 | 继而 432 | 加之 433 | 假如 434 | 假若 435 | 假使 436 | 鉴于 437 | 将 438 | 较 439 | 较之 440 | 叫 441 | 接着 442 | 结果 443 | 借 444 | 紧接着 445 | 进而 446 | 尽 447 | 尽管 448 | 经 449 | 经过 450 | 就 451 | 就是 452 | 就是说 453 | 据 454 | 具体地说 455 | 具体说来 456 | 开始 457 | 开外 458 | 靠 459 | 咳 460 | 可 461 | 可见 462 | 可是 463 | 可以 464 | 况且 465 | 啦 466 | 来 467 | 来着 468 | 离 469 | 例如 470 | 哩 471 | 连 472 | 连同 473 | 两者 474 | 了 475 | 临 476 | 另 477 | 另外 478 | 另一方面 479 | 论 480 | 嘛 481 | 吗 482 | 慢说 483 | 漫说 484 | 冒 485 | 么 486 | 每 487 | 每当 488 | 们 489 | 莫若 490 | 某 491 | 某个 492 | 某些 493 | 拿 494 | 哪 495 | 哪边 496 | 哪儿 497 | 哪个 498 | 哪里 499 | 哪年 500 | 哪怕 501 | 哪天 502 | 哪些 503 | 哪样 504 | 那 505 | 那边 506 | 那儿 507 | 那个 508 | 那会儿 509 | 那里 510 | 那么 511 | 那么些 512 | 那么样 513 | 那时 514 | 那些 515 | 那样 516 | 乃 517 | 乃至 518 | 呢 519 | 能 520 | 你 521 | 你们 522 | 您 523 | 宁 524 | 宁可 525 | 宁肯 526 | 宁愿 527 | 哦 528 | 呕 529 | 啪达 530 | 旁人 531 | 呸 532 | 凭 533 | 凭借 534 | 其 535 | 其次 536 | 其二 537 | 其他 538 | 其它 539 | 其一 540 | 其余 541 | 其中 542 | 起 543 | 起见 544 | 起见 545 | 岂但 546 | 恰恰相反 547 | 前后 548 | 前者 549 | 且 550 | 然而 551 | 然后 552 | 然则 553 | 让 554 | 人家 555 | 任 556 | 任何 557 | 任凭 558 | 如 559 | 如此 560 | 如果 561 | 如何 562 | 如其 563 | 如若 564 | 如上所述 565 | 若 566 | 若非 567 | 若是 568 | 啥 569 | 上下 570 | 尚且 571 | 设若 572 | 设使 573 | 甚而 574 | 甚么 575 | 甚至 576 | 省得 577 | 时候 578 | 什么 579 | 什么样 580 | 使得 581 | 是 582 | 是的 583 | 首先 584 | 谁 585 | 谁知 586 | 顺 587 | 顺着 588 | 似的 589 | 虽 590 | 虽然 591 | 虽说 592 | 虽则 593 | 随 594 | 随着 595 | 所 596 | 所以 597 | 他 598 | 他们 599 | 他人 600 | 它 601 | 它们 602 | 她 603 | 她们 604 | 倘 605 | 倘或 606 | 倘然 607 | 倘若 608 | 倘使 609 | 腾 610 | 替 611 | 通过 612 | 同 613 | 同时 614 | 哇 615 | 万一 616 | 往 617 | 望 618 | 为 619 | 为何 620 | 为了 621 | 为什么 622 | 为着 623 | 喂 624 | 嗡嗡 625 | 我 626 | 我们 627 | 呜 628 | 呜呼 629 | 乌乎 630 | 无论 631 | 无宁 632 | 毋宁 633 | 嘻 634 | 吓 635 | 相对而言 636 | 像 637 | 向 638 | 向着 639 | 嘘 640 | 呀 641 | 焉 642 | 沿 643 | 沿着 644 | 要 645 | 要不 646 | 要不然 647 | 要不是 648 | 要么 649 | 要是 650 | 也 651 | 也罢 652 | 也好 653 | 一 654 | 一般 655 | 一旦 656 | 一方面 657 | 一来 658 | 一切 659 | 一样 660 | 一则 661 | 依 662 | 依照 663 | 矣 664 | 以 665 | 以便 666 | 以及 667 | 以免 668 | 以至 669 | 以至于 670 | 以致 671 | 抑或 672 | 因 673 | 因此 674 | 因而 675 | 因为 676 | 哟 677 | 用 678 | 由 679 | 由此可见 680 | 由于 681 | 有 682 | 有的 683 | 有关 684 | 有些 685 | 又 686 | 于 687 | 于是 688 | 于是乎 689 | 与 690 | 与此同时 691 | 与否 692 | 与其 693 | 越是 694 | 云云 695 | 哉 696 | 再说 697 | 再者 698 | 在 699 | 在下 700 | 咱 701 | 咱们 702 | 则 703 | 怎 704 | 怎么 705 | 怎么办 706 | 怎么样 707 | 怎样 708 | 咋 709 | 照 710 | 照着 711 | 者 712 | 这 713 | 这边 714 | 这儿 715 | 这个 716 | 这会儿 717 | 这就是说 718 | 这里 719 | 这么 720 | 这么点儿 721 | 这么些 722 | 这么样 723 | 这时 724 | 这些 725 | 这样 726 | 正如 727 | 吱 728 | 之 729 | 之类 730 | 之所以 731 | 之一 732 | 只是 733 | 只限 734 | 只要 735 | 只有 736 | 至 737 | 至于 738 | 诸位 739 | 着 740 | 着呢 741 | 自 742 | 自从 743 | 自个儿 744 | 自各儿 745 | 自己 746 | 自家 747 | 自身 748 | 综上所述 749 | 总的来看 750 | 总的来说 751 | 总的说来 752 | 总而言之 753 | 总之 754 | 纵 755 | 纵令 756 | 纵然 757 | 纵使 758 | 遵照 759 | 作为 760 | 兮 761 | 呃 762 | 呗 763 | 咚 764 | 咦 765 | 喏 766 | 啐 767 | 喔唷 768 | 嗬 769 | 嗯 770 | 嗳 -------------------------------------------------------------------------------- /datasets.py: -------------------------------------------------------------------------------- 1 | from torch.utils.data import Dataset, DataLoader 2 | import jieba 3 | import numpy as np 4 | 5 | def read_dict(voc_dict_path): 6 | voc_dict = {} 7 | dict_list = open(voc_dict_path).readlines() 8 | for item in dict_list: 9 | item = item.split(",") 10 | voc_dict[item[0]] = int(item[1].strip()) 11 | return voc_dict 12 | 13 | def load_data(data_path,data_stop_path): 14 | data_list = open(data_path).readlines()[1:] 15 | stops_word = open(data_stop_path).readlines() 16 | stops_word = [line.strip() for line in stops_word] 17 | stops_word.append(" ") 18 | stops_word.append("\n") 19 | data = [] 20 | max_len_seq = 0 21 | np.random.shuffle(data_list) 22 | for item in data_list[:1000]: 23 | label = item[0] 24 | content = item[2:].strip() 25 | seg_list = jieba.cut(content, cut_all=False) 26 | seg_res = [] 27 | for seg_item in seg_list: 28 | if seg_item in stops_word: 29 | continue 30 | seg_res.append(seg_item) 31 | if len(seg_res) > max_len_seq: 32 | max_len_seq = len(seg_res) 33 | data.append([label, seg_res]) 34 | return data, max_len_seq 35 | 36 | 37 | class text_ClS(Dataset): 38 | def __init__(self, voc_dict_path, data_path, data_stop_path, max_len_seq=None): 39 | self.data_path = data_path 40 | self.data_stop_path = data_stop_path 41 | self.voc_dict = read_dict(voc_dict_path) 42 | self.data, self.max_seq_len = load_data(self.data_path, self.data_stop_path) 43 | if max_len_seq is not None: 44 | self.max_seq_len = max_len_seq 45 | np.random.shuffle(self.data) 46 | 47 | 48 | def __len__(self): 49 | return len(self.data) 50 | 51 | def __getitem__(self, item): 52 | data = self.data[item] 53 | label = int(data[0]) 54 | word_list = data[1] 55 | input_idx = [] 56 | for word in word_list: 57 | if word in self.voc_dict.keys(): 58 | input_idx.append(self.voc_dict[word]) 59 | else: 60 | input_idx.append(self.voc_dict[""]) 61 | if len(input_idx) < self.max_seq_len: 62 | input_idx += [self.voc_dict[""] for _ in range(self.max_seq_len - len(input_idx))] 63 | data = np.array(input_idx) 64 | return label, data 65 | 66 | def data_loader(dataset, config): 67 | return DataLoader(dataset, batch_size=config.batch_size, shuffle=config.is_shuffle) 68 | 69 | # if __name__ == "__main__": 70 | # data_path = "/Users/wangruiqian/Documents/Code/Project/sentiment_classification_pytorch/data/weibo_senti_100k.csv" 71 | # data_stop_path = "/Users/wangruiqian/Documents/Code/Project/sentiment_classification_pytorch/data/hit_stopword" 72 | # dict_path = "/Users/wangruiqian/Documents/Code/Project/sentiment_classification_pytorch/data/dict" 73 | # dataset = text_ClS(dict_path, data_path, data_stop_path) 74 | # train_dataloader = data_loader(dataset, config) 75 | # for i, batch in enumerate(train_dataloader): 76 | # print(batch[1].size()) -------------------------------------------------------------------------------- /models.py: -------------------------------------------------------------------------------- 1 | import torch 2 | import torch.nn as nn 3 | import torch.nn.functional as F 4 | import numpy as np 5 | 6 | class Model(nn.Module): 7 | def __init__(self, config): 8 | super(Model, self).__init__() 9 | self.embeding = nn.Embedding(config.n_vocab, 10 | config.embed_size, 11 | padding_idx=config.n_vocab - 1) 12 | self.lstm = nn.LSTM(config.embed_size, 13 | config.hidden_size, 14 | config.num_layers, 15 | bidirectional=True, batch_first=True, 16 | dropout=config.dropout) 17 | self.maxpool = nn.MaxPool1d(config.pad_size) 18 | self.fc = nn.Linear(config.hidden_size * 2 + config.embed_size, 19 | config.num_classes) 20 | self.softmax = nn.Softmax(dim=1) 21 | 22 | def forward(self, x): 23 | embed = self.embeding(x) # [batchsize, seqlen, embed_size] 24 | out, _ = self.lstm(embed) 25 | out = torch.cat((embed, out), 2) 26 | out = F.relu(out) 27 | out = out.permute(0, 2, 1) 28 | out = self.maxpool(out).reshape(out.size()[0], -1) 29 | out = self.fc(out) 30 | out = self.softmax(out) 31 | return out 32 | 33 | if __name__ == "__main__": 34 | from configs import Config 35 | cfg = Config() 36 | cfg.pad_size = 640 37 | model_textcls = Model(config=cfg) 38 | input_tensor = torch.tensor([i for i in range(640)]).reshape([1, 640]) 39 | out_tensor = model_textcls.forward(input_tensor) 40 | print(out_tensor.size()) 41 | print(out_tensor) -------------------------------------------------------------------------------- /process/data_precess.py: -------------------------------------------------------------------------------- 1 | import jieba 2 | 3 | data_path = "/Users/wangruiqian/Documents/Code/Project/sentiment_classification_pytorch/data/weibo_senti_100k.csv" 4 | data_stop_path = "/Users/wangruiqian/Documents/Code/Project/sentiment_classification_pytorch/data/hit_stopword" 5 | data_list = open(data_path).readlines()[1:] 6 | data_stop_list = open(data_stop_path).readlines() 7 | data_stop_list = [i.strip() for i in data_stop_list] 8 | data_stop_list.append(" ") 9 | data_stop_list.append("\n") 10 | print(data_stop_list) 11 | 12 | voc_dict = {} # 根据语料库中的词构建字典,key:word , value:频次 13 | min_seq = 1 # 过滤掉字典中词出现小于等于 1 次的词 14 | top_n = 1000 # 字典的最大长度 15 | UNK = "" # unknow 16 | PAD = "" # 问题建模时,扩展成同等长度的向量 17 | 18 | for item in data_list: 19 | label = item[0] 20 | content = item[2:].strip() 21 | seg_list = jieba.cut(content, cut_all=False) 22 | 23 | seg_word_list = [] 24 | for seg_word in seg_list: 25 | if seg_word in data_stop_list: 26 | continue 27 | seg_word_list.append(seg_word) 28 | if seg_word in voc_dict.keys(): 29 | voc_dict[seg_word] = voc_dict[seg_word] + 1 30 | else: 31 | voc_dict[seg_word] = 1 32 | 33 | print("分词前的句子:", content) 34 | print("分词后的句子:", seg_word_list) 35 | 36 | print("老词典:", voc_dict) 37 | # 过滤掉字典中出现频率小于等于 min_seq 的词,并且按照出现的频率从大到小排序,取前 top_n 词作为词典 38 | voc_list = sorted([_ for _ in voc_dict.items() if _[1] > min_seq], key=lambda x: x[1], reverse=True)[:top_n] 39 | # 重新构建字典,根据词出现频率排序后的字典中词的位置设置新的索引 40 | voc_dict = {word_count[0]: idx for idx, word_count in enumerate(voc_list)} 41 | 42 | print("构建的新词典:",voc_dict) 43 | 44 | voc_dict.update({UNK: len(voc_dict), PAD: len(voc_dict) + 1}) 45 | 46 | print("添加 UNK,PAD 元素", voc_dict) 47 | 48 | # 写入词典信息 49 | ff = open("/Users/wangruiqian/Documents/Code/Project/sentiment_classification_pytorch/data/dict", "w") 50 | for item in voc_dict.keys(): 51 | ff.writelines("{},{}\n".format(item, voc_dict[item])) 52 | ff.close() -------------------------------------------------------------------------------- /train.py: -------------------------------------------------------------------------------- 1 | import torch 2 | import torch.nn as nn 3 | from torch import optim 4 | from models import Model 5 | from datasets import data_loader, text_ClS 6 | from configs import Config 7 | 8 | cfg = Config() 9 | data_path = "/Users/wangruiqian/Documents/Code/Project/sentiment_classification_pytorch/data/weibo_senti_100k.csv" 10 | data_stop_path = "/Users/wangruiqian/Documents/Code/Project/sentiment_classification_pytorch/data/hit_stopword" 11 | dict_path = "/Users/wangruiqian/Documents/Code/Project/sentiment_classification_pytorch/data/dict" 12 | 13 | dataset = text_ClS(dict_path, data_path, data_stop_path) 14 | train_dataloader = data_loader(dataset, cfg) 15 | 16 | cfg.pad_size = dataset.max_seq_len 17 | print(cfg.pad_size) 18 | 19 | model_text_cls = Model(cfg) 20 | model_text_cls.to(cfg.devices) 21 | loss_func = nn.CrossEntropyLoss() 22 | 23 | optimizer = optim.Adam(model_text_cls.parameters(), lr=cfg.learn_rate) 24 | scheduler = torch.optim.lr_scheduler.StepLR(optimizer, 25 | step_size=1, 26 | gamma=0.9) 27 | 28 | for epoch in range(cfg.num_epochs): 29 | for i, batch in enumerate(train_dataloader): 30 | label, data = batch 31 | data = torch.tensor(data).to(cfg.devices) 32 | label = torch.tensor(label, dtype=torch.int64).to(cfg.devices) 33 | 34 | optimizer.zero_grad() 35 | pred = model_text_cls.forward(data) 36 | loss_val = loss_func(pred, label) 37 | 38 | # print(pred) 39 | # print(label) 40 | print("epoch is {}, ite is {}, val is {}".format(epoch, i, loss_val)) 41 | loss_val.backward() 42 | optimizer.step() 43 | 44 | scheduler.step() 45 | if epoch % 10 == 0: 46 | torch.save(model_text_cls.state_dict(), "models/{}.pth".format(epoch)) --------------------------------------------------------------------------------