├── README.md ├── simtrain_to05sts.txt └── simtrain_to05sts_same.txt /README.md: -------------------------------------------------------------------------------- 1 | # ChineseSTS 2 | STS 中文文本语义相似度语料库建设 3 | 4 | 文本语义相似度(Semantic Text Similarity)是自然语言处理处理中的基本问题。 5 | 6 | 相似度值:[0,5],5:相似度最高(意思一样),0:相似度最低(语义相反或不相干) 7 | 8 | 应用范围:QA、自动客服、搜索引擎、语义理解、自动阅卷...... 9 | 10 | 项目意义:目前英文sts语料训练数据较为丰富,中文sts(Chinese Semantic Text Similarity)语料很少,而语料是文本进行深度学习的基本起点。 11 | 12 | 项目实施起始日期:2016-06-06 06:06:06 0 0 131 66 13 | 14 | 如有引用或使用本训练集请注明作者信息: 15 | 唐善成, 白云悦, 马付玉. 中文语义相似度训练集. 西安科技大学.2016. https://github.com/IAdmireu/ChineseSTS 16 | 17 | Tang Shancheng, Bai Yunyue, Ma Fuyu. Chinese Semantic Text Similarity Trainning Dataset. Xi'an University of Science and Technology.2016. https://github.com/IAdmireu/ChineseSTS 18 | --------------------------------------------------------------------------------