├── README.md ├── news_seed.xlsx ├── test_data.csv └── train_data.csv /README.md: -------------------------------------------------------------------------------- 1 | # 财经新闻情感分类数据集 2 | 3 | ### 数据说明 4 | 本数据集主要用于训练财经新闻情感分类的深度学习模型。 5 | 数据来源于雪球网上万得资讯发布的正负面新闻标题,通过爬虫采集到7046条新闻标题作为种子数据集,其中正面新闻5147条,负面新闻1899条。 6 | 7 | 由于数据量太少,所以需要对数据进行扩充,扩充的策略是通过搜索引擎搜索和筛选,得到最终的数据集。 8 | 9 | 数据集中包含17149条新闻数据,包括`日期`、`公司`、`代码`、`正/负面`、`标题`、`正文`6个字段,其中正面新闻12514条,负面新闻4635条。 10 | 11 | ![数据样例](https://cdn.weiweiblog.cn/20190515190731.png) 12 | 13 | ### 文件说明 14 | - news_seed.xlsx: 种子数据集 15 | - train_data.csv: 可用于训练的数据集 16 | - test_data.csv: 可用于测试的数据集 17 | -------------------------------------------------------------------------------- /news_seed.xlsx: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/wwwxmu/Dataset-of-financial-news-sentiment-classification/9e3166942fed246c193ec67996d5294debfd71e3/news_seed.xlsx --------------------------------------------------------------------------------