├── .gitattributes
└── README.md


/.gitattributes:
--------------------------------------------------------------------------------
1 | # Auto detect text files and perform LF normalization
2 | * text=auto
3 | 


--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
  1 | # machine_learning_resource
  2 | 神经网络模型的网络结构参数
  3 | 从 https://github.com/fchollet/deep-learning-models/releases 下载
  4 | 拷贝到C:\Users\XXX\.keras\models 使用
  5 | 
  6 | tensorflow模型下载：  
  7 | https://github.com/tensorflow/models/blob/master/research/slim/README.md
  8 | 
  9 | mobilenet v2模型：  
 10 | https://github.com/tensorflow/models/blob/master/research/slim/nets/mobilenet/README.md
 11 | 
 12 | mobilenet v1模型：  
 13 | https://github.com/tensorflow/models/blob/master/research/slim/nets/mobilenet_v1.md
 14 | 
 15 | 预训练模型下载：  
 16 | https://github.com/tensorflow/models/tree/master/research/slim#pre-trained-models  
 17 | 
 18 | 模型tensorflow实现：  
 19 | https://github.com/tensorflow/models/tree/master/research/slim/nets  
 20 | 
 21 | # 数据集
 22 | 
 23 | ## CV数据集
 24 | 1. MS-Celeb-1M 数据集  
 25 | MS-Celeb-1M 是微软的一个非常大的人脸识别数据库，它是从名人榜上选择前100万的名人，然后通过搜索引擎采集每个名人大约100张人脸图片而形成的。  
 26 | [官方下载地址](https://www.microsoft.com/en-us/research/project/ms-celeb-1m-challenge-recognizing-one-million-celebrities-real-world/)    
 27 | 
 28 | 2. Adience 数据集  
 29 | Adience 数据集包含26580张图片，总共含有2284类，涉及的年龄范围有8个区段（0～2、4～6、8～13、15～20、25～32、38～43、48～53、60～），并且这个数据集含有噪声、姿势、光照等变化，尽可能真实地反映现实世界  
 30 | [官方下载地址](http://www.openu.ac.il/home/hassner/Adience/data.html#agegender)  
 31 | 
 32 | 
 33 | ## NLP数据集
 34 | 1. VCTK-Corpus数据集(10G)
 35 | VCTK-Corpus数据集可用来训练声纹识别，ASR；数据集中包含说话人（ID、年龄、性别、国家、地区),录音wav文件，说话内容txt文件。  
 36 | ([官方下载地址](http://homepages.inf.ed.ac.uk/jyamagis/release/VCTK-Corpus.tar.gz))  ([下载地址1](https://datashare.is.ed.ac.uk/handle/10283/2651))  ([百度网盘](https://pan.baidu.com/s/13ATxLTeGrdfi6159oOg89w)(ix2j))    
 37 | 
 38 | **[http://www.openslr.org/resources.php系列英语数据集 start]**
 39 | 1. Yesno  
 40 | 一个人用希伯来语记录是或否的60个录音; 每个录音长八个字。    
 41 | [官方下载地址](http://www.openslr.org/1/)  
 42 | 
 43 | 2. Vystadial    
 44 | 英语和捷克语数据，来自Vystadial项目        
 45 | [官方下载地址](http://www.openslr.org/6/)  
 46 | 
 47 | 3. TED-LIUM（21G）  
 48 | 来自TED讲座的英语语音识别训练语料库，由缅因州大学信息实验室（LIUM）创建  
 49 | [官方下载地址](http://www.openslr.org/7/)  
 50 | 
 51 | 4. TED-LIUMv2  
 52 | TED-LIUM语料库发布2，来自TED讲座的英语语音识别训练语料库，由缅因州大学信息实验室（LIUM）创建（在这里镜像）  
 53 | [官方下载地址](http://www.openslr.org/19/)  
 54 | 
 55 | 5. TED-LIUM Release 3  
 56 | TED-LIUM corpus release 3  
 57 | [官方下载地址](https://www.openslr.org/51/)     
 58 | 
 59 | 6. LibriSpeech language models, vocabulary and G2P models  
 60 | 语言建模资源，用于LibriSpeech ASR语料库        
 61 | [官方下载地址](http://www.openslr.org/11/) 
 62 | 
 63 | 7. libriSpeech_ASR_corpus数据集  
 64 | 该数据集是包含大约1000小时的英语语音的大型语料库。这些数据来自LibriVox项目的有声读物。它已被分割并正确对齐，如果你正在寻找一个起点，请查看已准备好的声学模型，这些模型在kaldi-asr.org和语言模型上进行了训练，适合评估。    
 65 | [官方下载地址](https://www.openslr.org/12)  
 66 | 
 67 | 8. Mini LibriSpeech ASR corpus数据集   
 68 | 用于回归测试的一个LibriSpeech ASR corpus子集  
 69 | [官方下载地址](http://www.openslr.org/31/)  
 70 | 
 71 | 9. Free ST American English Corpus
 72 | 由Surfingtech（www.surfing.ai）提供的免费美式英语语料库，包含来自10位发言者的话语，每位发言者约有350个话语  
 73 | [官方下载地址](http://www.openslr.org/45/)
 74 | 
 75 | 10. THCHS-30(中文)  
 76 | THCHS-30是在安静的办公室环境下，通过单个碳粒麦克风录取的，总时长超过30个小时。大部分参与录音的人员是会说流利普通话的大学生。采样频率16kHz，采样大小16bits。  
 77 | THCHS-30的文本选取自大容量的新闻，目的是为了扩充863语音库。我们选取1000句来录音。  
 78 | [官方下载地址](http://www.openslr.org/18/)    
 79 | 
 80 | 11. Aishell（中文）
 81 | 普通话数据，由北京贝壳科技有限公司提供  
 82 | 录音时长178小时；录音文本涉及智能家居、无人驾驶、工业生产等11个领域；录制过程在安静室内环境中；同时使用3种不同设备： 高保真麦克风（44.1kHz，16-bit），Android系统手机（16kHz，16-bit），iOS系统手机（16kHz，16-bit），高保真麦克风录制的音频降采样为16kHz，用于制作AISHELL-ASR0009-OS1；400名来自中国不同口音区域的发言人参与录制。经过专业语音校对人员转写标注，并通过严格质量检验，此数据库文本正确率在95%以上。分为训练集、开发集、测试集。  
 83 | [官方下载地址](http://www.openslr.org/33/)    
 84 | 
 85 | 12. Free ST Chinese Mandarin Corpus（中文）  
 86 | 由Surfingtech（www.surfing.ai）提供的免费中文普通话语料库，包含855位发言者的话语，102600个话语;   
 87 | [官方下载地址](http://www.openslr.org/38/)     
 88 | 
 89 | 13. Primewords Chinese Corpus Set 1(中文)  
 90 | 上海Primewords有限公司（www.primewords.cn）发布的中文普通话语料库，包含100小时的语音数据  
 91 | [官方下载地址](http://www.openslr.org/47/)  
 92 | 
 93 | **[http://www.openslr.org/resources.php系列英语数据集 end]**  
 94 | 
 95 | 1. VoxForge  
 96 |   该数据集是带口音的语音清洁数据集，对测试模型在不同重音或语调下的鲁棒性非常有用。
 97 |   http://www.voxforge.org/    
 98 |   [官方下载地址](https://voice.mozilla.org/zh-CN/datasets)    
 99 | 
100 | 2. TIMIT数据集  
101 |   TIMIT数据集是来自美国630个人每个人说十个给定的句子，每一个句子都有标记  
102 |   [百度云](https://pan.baidu.com/s/1Mv3dqsGWynidRq3cisY2dQ)(95k2)  
103 | 
104 | 3. voxceleb
105 |     [官方下载地址](http://www.robots.ox.ac.uk/~vgg/data/voxceleb/)
106 |     
107 | 4. CN-Celeb
108 | 
109 |     包含1,000名中国明星（包括歌星、影星、说唱艺人等）在采访、歌舞及影视作品中的声音片段。这些片段全部由视频网站经过自动化处理程序提取，并通过人工校验得到。每位明星的声音时长约20分钟，整个数据集近300小时。该数据包含了11类实际场景，覆盖了噪音、信道、发音方式等各方面的复杂性，特别适用于研究复杂场景下的说话人识别技术。  
110 | 
111 |     [资讯](https://mp.weixin.qq.com/s?__biz=MzU4MTA0NDE5NQ==&mid=2247484908&idx=1&sn=741d35cd78cef4abdc30862b14b39ccc&chksm=fd4cd760ca3b5e7662db73e3eba0ac100d8f3a065e030149a3b4d23061d481177c87b688ea5a&mpshare=1&scene=1&srcid=&sharer_sharetime=1574937937399&sharer_shareid=4be01134ded225b7a2f66ecb5d5991d3&key=4af88d8dcfc4a010fc9a448510eecd2ca4dffb1c30ba107f30f70ccee59292b1e5f961034b5cbb6be7579ea44e8b74e6e470cc16606888e7f9c3231fb705392fe783dcdfc7864f8367c31e02133c6717&ascene=1&uin=MTAzNzg3MTgyMg%3D%3D&devicetype=Windows+10&version=6207024c&lang=zh_CN&exportkey=AeZg%2B%2FUXhpg88DM0%2BluzmJg%3D&pass_ticket=ptHC5cvmD6qT2CMYgw1viT29Pu2bF3E8p2arHNIdbiQiE%2FGgpqj7bEBu9Pr4gzOP)  
112 | 
113 |     [官方下载地址](http://openslr.org/82/)  
114 | 
115 |     
116 | 
117 | 


--------------------------------------------------------------------------------