├── .gitattributes └── README.md /.gitattributes: -------------------------------------------------------------------------------- 1 | # Auto detect text files and perform LF normalization 2 | * text=auto 3 | -------------------------------------------------------------------------------- /README.md: -------------------------------------------------------------------------------- 1 | # machine_learning_resource 2 | 神经网络模型的网络结构参数 3 | 从 https://github.com/fchollet/deep-learning-models/releases 下载 4 | 拷贝到C:\Users\XXX\.keras\models 使用 5 | 6 | tensorflow模型下载: 7 | https://github.com/tensorflow/models/blob/master/research/slim/README.md 8 | 9 | mobilenet v2模型: 10 | https://github.com/tensorflow/models/blob/master/research/slim/nets/mobilenet/README.md 11 | 12 | mobilenet v1模型: 13 | https://github.com/tensorflow/models/blob/master/research/slim/nets/mobilenet_v1.md 14 | 15 | 预训练模型下载: 16 | https://github.com/tensorflow/models/tree/master/research/slim#pre-trained-models 17 | 18 | 模型tensorflow实现: 19 | https://github.com/tensorflow/models/tree/master/research/slim/nets 20 | 21 | # 数据集 22 | 23 | ## CV数据集 24 | 1. MS-Celeb-1M 数据集 25 | MS-Celeb-1M 是微软的一个非常大的人脸识别数据库,它是从名人榜上选择前100万的名人,然后通过搜索引擎采集每个名人大约100张人脸图片而形成的。 26 | [官方下载地址](https://www.microsoft.com/en-us/research/project/ms-celeb-1m-challenge-recognizing-one-million-celebrities-real-world/) 27 | 28 | 2. Adience 数据集 29 | Adience 数据集包含26580张图片,总共含有2284类,涉及的年龄范围有8个区段(0~2、4~6、8~13、15~20、25~32、38~43、48~53、60~),并且这个数据集含有噪声、姿势、光照等变化,尽可能真实地反映现实世界 30 | [官方下载地址](http://www.openu.ac.il/home/hassner/Adience/data.html#agegender) 31 | 32 | 33 | ## NLP数据集 34 | 1. VCTK-Corpus数据集(10G) 35 | VCTK-Corpus数据集可用来训练声纹识别,ASR;数据集中包含说话人(ID、年龄、性别、国家、地区),录音wav文件,说话内容txt文件。 36 | ([官方下载地址](http://homepages.inf.ed.ac.uk/jyamagis/release/VCTK-Corpus.tar.gz)) ([下载地址1](https://datashare.is.ed.ac.uk/handle/10283/2651)) ([百度网盘](https://pan.baidu.com/s/13ATxLTeGrdfi6159oOg89w)(ix2j)) 37 | 38 | **[http://www.openslr.org/resources.php系列英语数据集 start]** 39 | 1. Yesno 40 | 一个人用希伯来语记录是或否的60个录音; 每个录音长八个字。 41 | [官方下载地址](http://www.openslr.org/1/) 42 | 43 | 2. Vystadial 44 | 英语和捷克语数据,来自Vystadial项目 45 | [官方下载地址](http://www.openslr.org/6/) 46 | 47 | 3. TED-LIUM(21G) 48 | 来自TED讲座的英语语音识别训练语料库,由缅因州大学信息实验室(LIUM)创建 49 | [官方下载地址](http://www.openslr.org/7/) 50 | 51 | 4. TED-LIUMv2 52 | TED-LIUM语料库发布2,来自TED讲座的英语语音识别训练语料库,由缅因州大学信息实验室(LIUM)创建(在这里镜像) 53 | [官方下载地址](http://www.openslr.org/19/) 54 | 55 | 5. TED-LIUM Release 3 56 | TED-LIUM corpus release 3 57 | [官方下载地址](https://www.openslr.org/51/) 58 | 59 | 6. LibriSpeech language models, vocabulary and G2P models 60 | 语言建模资源,用于LibriSpeech ASR语料库 61 | [官方下载地址](http://www.openslr.org/11/) 62 | 63 | 7. libriSpeech_ASR_corpus数据集 64 | 该数据集是包含大约1000小时的英语语音的大型语料库。这些数据来自LibriVox项目的有声读物。它已被分割并正确对齐,如果你正在寻找一个起点,请查看已准备好的声学模型,这些模型在kaldi-asr.org和语言模型上进行了训练,适合评估。 65 | [官方下载地址](https://www.openslr.org/12) 66 | 67 | 8. Mini LibriSpeech ASR corpus数据集 68 | 用于回归测试的一个LibriSpeech ASR corpus子集 69 | [官方下载地址](http://www.openslr.org/31/) 70 | 71 | 9. Free ST American English Corpus 72 | 由Surfingtech(www.surfing.ai)提供的免费美式英语语料库,包含来自10位发言者的话语,每位发言者约有350个话语 73 | [官方下载地址](http://www.openslr.org/45/) 74 | 75 | 10. THCHS-30(中文) 76 | THCHS-30是在安静的办公室环境下,通过单个碳粒麦克风录取的,总时长超过30个小时。大部分参与录音的人员是会说流利普通话的大学生。采样频率16kHz,采样大小16bits。 77 | THCHS-30的文本选取自大容量的新闻,目的是为了扩充863语音库。我们选取1000句来录音。 78 | [官方下载地址](http://www.openslr.org/18/) 79 | 80 | 11. Aishell(中文) 81 | 普通话数据,由北京贝壳科技有限公司提供 82 | 录音时长178小时;录音文本涉及智能家居、无人驾驶、工业生产等11个领域;录制过程在安静室内环境中;同时使用3种不同设备: 高保真麦克风(44.1kHz,16-bit),Android系统手机(16kHz,16-bit),iOS系统手机(16kHz,16-bit),高保真麦克风录制的音频降采样为16kHz,用于制作AISHELL-ASR0009-OS1;400名来自中国不同口音区域的发言人参与录制。经过专业语音校对人员转写标注,并通过严格质量检验,此数据库文本正确率在95%以上。分为训练集、开发集、测试集。 83 | [官方下载地址](http://www.openslr.org/33/) 84 | 85 | 12. Free ST Chinese Mandarin Corpus(中文) 86 | 由Surfingtech(www.surfing.ai)提供的免费中文普通话语料库,包含855位发言者的话语,102600个话语; 87 | [官方下载地址](http://www.openslr.org/38/) 88 | 89 | 13. Primewords Chinese Corpus Set 1(中文) 90 | 上海Primewords有限公司(www.primewords.cn)发布的中文普通话语料库,包含100小时的语音数据 91 | [官方下载地址](http://www.openslr.org/47/) 92 | 93 | **[http://www.openslr.org/resources.php系列英语数据集 end]** 94 | 95 | 1. VoxForge 96 | 该数据集是带口音的语音清洁数据集,对测试模型在不同重音或语调下的鲁棒性非常有用。 97 | http://www.voxforge.org/ 98 | [官方下载地址](https://voice.mozilla.org/zh-CN/datasets) 99 | 100 | 2. TIMIT数据集 101 | TIMIT数据集是来自美国630个人每个人说十个给定的句子,每一个句子都有标记 102 | [百度云](https://pan.baidu.com/s/1Mv3dqsGWynidRq3cisY2dQ)(95k2) 103 | 104 | 3. voxceleb 105 | [官方下载地址](http://www.robots.ox.ac.uk/~vgg/data/voxceleb/) 106 | 107 | 4. CN-Celeb 108 | 109 | 包含1,000名中国明星(包括歌星、影星、说唱艺人等)在采访、歌舞及影视作品中的声音片段。这些片段全部由视频网站经过自动化处理程序提取,并通过人工校验得到。每位明星的声音时长约20分钟,整个数据集近300小时。该数据包含了11类实际场景,覆盖了噪音、信道、发音方式等各方面的复杂性,特别适用于研究复杂场景下的说话人识别技术。 110 | 111 | [资讯](https://mp.weixin.qq.com/s?__biz=MzU4MTA0NDE5NQ==&mid=2247484908&idx=1&sn=741d35cd78cef4abdc30862b14b39ccc&chksm=fd4cd760ca3b5e7662db73e3eba0ac100d8f3a065e030149a3b4d23061d481177c87b688ea5a&mpshare=1&scene=1&srcid=&sharer_sharetime=1574937937399&sharer_shareid=4be01134ded225b7a2f66ecb5d5991d3&key=4af88d8dcfc4a010fc9a448510eecd2ca4dffb1c30ba107f30f70ccee59292b1e5f961034b5cbb6be7579ea44e8b74e6e470cc16606888e7f9c3231fb705392fe783dcdfc7864f8367c31e02133c6717&ascene=1&uin=MTAzNzg3MTgyMg%3D%3D&devicetype=Windows+10&version=6207024c&lang=zh_CN&exportkey=AeZg%2B%2FUXhpg88DM0%2BluzmJg%3D&pass_ticket=ptHC5cvmD6qT2CMYgw1viT29Pu2bF3E8p2arHNIdbiQiE%2FGgpqj7bEBu9Pr4gzOP) 112 | 113 | [官方下载地址](http://openslr.org/82/) 114 | 115 | 116 | 117 | --------------------------------------------------------------------------------