├── .gitignore ├── 20_year_FD.csv ├── LICENSE ├── README.md ├── getdata.ipynb └── train_regress.ipynb /.gitignore: -------------------------------------------------------------------------------- 1 | # Byte-compiled / optimized / DLL files 2 | __pycache__/ 3 | *.py[cod] 4 | *$py.class 5 | 6 | # C extensions 7 | *.so 8 | 9 | # Distribution / packaging 10 | .Python 11 | build/ 12 | develop-eggs/ 13 | dist/ 14 | downloads/ 15 | eggs/ 16 | .eggs/ 17 | lib/ 18 | lib64/ 19 | parts/ 20 | sdist/ 21 | var/ 22 | wheels/ 23 | pip-wheel-metadata/ 24 | share/python-wheels/ 25 | *.egg-info/ 26 | .installed.cfg 27 | *.egg 28 | MANIFEST 29 | 30 | # PyInstaller 31 | # Usually these files are written by a python script from a template 32 | # before PyInstaller builds the exe, so as to inject date/other infos into it. 33 | *.manifest 34 | *.spec 35 | 36 | # Installer logs 37 | pip-log.txt 38 | pip-delete-this-directory.txt 39 | 40 | # Unit test / coverage reports 41 | htmlcov/ 42 | .tox/ 43 | .nox/ 44 | .coverage 45 | .coverage.* 46 | .cache 47 | nosetests.xml 48 | coverage.xml 49 | *.cover 50 | *.py,cover 51 | .hypothesis/ 52 | .pytest_cache/ 53 | 54 | # Translations 55 | *.mo 56 | *.pot 57 | 58 | # Django stuff: 59 | *.log 60 | local_settings.py 61 | db.sqlite3 62 | db.sqlite3-journal 63 | 64 | # Flask stuff: 65 | instance/ 66 | .webassets-cache 67 | 68 | # Scrapy stuff: 69 | .scrapy 70 | 71 | # Sphinx documentation 72 | docs/_build/ 73 | 74 | # PyBuilder 75 | target/ 76 | 77 | # Jupyter Notebook 78 | .ipynb_checkpoints 79 | 80 | # IPython 81 | profile_default/ 82 | ipython_config.py 83 | 84 | # pyenv 85 | .python-version 86 | 87 | # pipenv 88 | # According to pypa/pipenv#598, it is recommended to include Pipfile.lock in version control. 89 | # However, in case of collaboration, if having platform-specific dependencies or dependencies 90 | # having no cross-platform support, pipenv may install dependencies that don't work, or not 91 | # install all needed dependencies. 92 | #Pipfile.lock 93 | 94 | # PEP 582; used by e.g. github.com/David-OConnor/pyflow 95 | __pypackages__/ 96 | 97 | # Celery stuff 98 | celerybeat-schedule 99 | celerybeat.pid 100 | 101 | # SageMath parsed files 102 | *.sage.py 103 | 104 | # Environments 105 | .env 106 | .venv 107 | env/ 108 | venv/ 109 | ENV/ 110 | env.bak/ 111 | venv.bak/ 112 | 113 | # Spyder project settings 114 | .spyderproject 115 | .spyproject 116 | 117 | # Rope project settings 118 | .ropeproject 119 | 120 | # mkdocs documentation 121 | /site 122 | 123 | # mypy 124 | .mypy_cache/ 125 | .dmypy.json 126 | dmypy.json 127 | 128 | # Pyre type checker 129 | .pyre/ 130 | -------------------------------------------------------------------------------- /LICENSE: -------------------------------------------------------------------------------- 1 | MIT License 2 | 3 | Copyright (c) 2021 ssfgunner 4 | 5 | Permission is hereby granted, free of charge, to any person obtaining a copy 6 | of this software and associated documentation files (the "Software"), to deal 7 | in the Software without restriction, including without limitation the rights 8 | to use, copy, modify, merge, publish, distribute, sublicense, and/or sell 9 | copies of the Software, and to permit persons to whom the Software is 10 | furnished to do so, subject to the following conditions: 11 | 12 | The above copyright notice and this permission notice shall be included in all 13 | copies or substantial portions of the Software. 14 | 15 | THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR 16 | IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, 17 | FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE 18 | AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER 19 | LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, 20 | OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE 21 | SOFTWARE. 22 | -------------------------------------------------------------------------------- /README.md: -------------------------------------------------------------------------------- 1 | # 数据挖掘大作业——上证指数股票预测分析 2 | 3 | get_data.ipynb——数据获取代码,获取50ETF上市以来的数据 4 | 5 | 20_year_FD.csv——爬取得到的数据集 6 | 7 | train_regress.ipynb——训练代码 8 | -------------------------------------------------------------------------------- /getdata.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "cells": [ 3 | { 4 | "cell_type": "markdown", 5 | "metadata": {}, 6 | "source": [ 7 | "# 通用行情数据接口" 8 | ] 9 | }, 10 | { 11 | "cell_type": "code", 12 | "execution_count": 1, 13 | "metadata": { 14 | "ExecuteTime": { 15 | "end_time": "2020-12-15T02:40:04.841555Z", 16 | "start_time": "2020-12-15T02:40:04.162543Z" 17 | } 18 | }, 19 | "outputs": [], 20 | "source": [ 21 | "import tushare as ts\n", 22 | "ts.set_token('{your_token}')#账号的token\n", 23 | "df = ts.pro_bar()" 24 | ] 25 | }, 26 | { 27 | "cell_type": "markdown", 28 | "metadata": {}, 29 | "source": [ 30 | "# 爬取20年内的基金数据" 31 | ] 32 | }, 33 | { 34 | "cell_type": "markdown", 35 | "metadata": {}, 36 | "source": [ 37 | "### 生成日期列表" 38 | ] 39 | }, 40 | { 41 | "cell_type": "code", 42 | "execution_count": 3, 43 | "metadata": { 44 | "ExecuteTime": { 45 | "end_time": "2020-12-15T02:50:05.664538Z", 46 | "start_time": "2020-12-15T02:50:05.653536Z" 47 | } 48 | }, 49 | "outputs": [ 50 | { 51 | "data": { 52 | "text/plain": [ 53 | "['20201215', '20201214', '20201213', '20201212', '20201211']" 54 | ] 55 | }, 56 | "execution_count": 3, 57 | "metadata": {}, 58 | "output_type": "execute_result" 59 | } 60 | ], 61 | "source": [ 62 | "import datetime\n", 63 | "import time\n", 64 | "today = '2020-12-15'\n", 65 | "date_list = []\n", 66 | "time_tuple = time.strptime(today,\"%Y-%m-%d\")\n", 67 | "year,month,day = time_tuple[:3]\n", 68 | "for i in range(365*20):\n", 69 | " date_list.append((datetime.date(year,month,day)-datetime.timedelta(days=i)).strftime(\"%Y%m%d\"))\n", 70 | "date_list[0:5]" 71 | ] 72 | }, 73 | { 74 | "cell_type": "markdown", 75 | "metadata": {}, 76 | "source": [ 77 | "### 爬取数据" 78 | ] 79 | }, 80 | { 81 | "cell_type": "code", 82 | "execution_count": 4, 83 | "metadata": { 84 | "ExecuteTime": { 85 | "end_time": "2020-12-15T02:57:33.854939Z", 86 | "start_time": "2020-12-15T02:51:28.846556Z" 87 | } 88 | }, 89 | "outputs": [ 90 | { 91 | "name": "stdout", 92 | "output_type": "stream", 93 | "text": [ 94 | "爬取第20201206天数据,数据总长度为:7\n", 95 | "爬取第20201126天数据,数据总长度为:14\n", 96 | "爬取第20201116天数据,数据总长度为:22\n", 97 | "爬取第20201106天数据,数据总长度为:28\n", 98 | "爬取第20201027天数据,数据总长度为:36\n", 99 | "爬取第20201017天数据,数据总长度为:42\n", 100 | "爬取第20201007天数据,数据总长度为:48\n", 101 | "爬取第20200927天数据,数据总长度为:51\n", 102 | "爬取第20200917天数据,数据总长度为:58\n", 103 | "爬取第20200907天数据,数据总长度为:66\n", 104 | "爬取第20200828天数据,数据总长度为:72\n", 105 | "爬取第20200818天数据,数据总长度为:80\n", 106 | "爬取第20200808天数据,数据总长度为:86\n", 107 | "爬取第20200729天数据,数据总长度为:94\n", 108 | "爬取第20200719天数据,数据总长度为:101\n", 109 | "爬取第20200709天数据,数据总长度为:108\n", 110 | "爬取第20200629天数据,数据总长度为:116\n", 111 | "爬取第20200619天数据,数据总长度为:120\n", 112 | "爬取第20200609天数据,数据总长度为:128\n", 113 | "爬取第20200530天数据,数据总长度为:134\n", 114 | "爬取第20200520天数据,数据总长度为:142\n", 115 | "爬取第20200510天数据,数据总长度为:149\n", 116 | "爬取第20200430天数据,数据总长度为:153\n", 117 | "爬取第20200420天数据,数据总长度为:161\n", 118 | "爬取第20200410天数据,数据总长度为:167\n", 119 | "爬取第20200331天数据,数据总长度为:174\n", 120 | "爬取第20200321天数据,数据总长度为:180\n", 121 | "爬取第20200311天数据,数据总长度为:188\n", 122 | "爬取第20200301天数据,数据总长度为:195\n", 123 | "爬取第20200220天数据,数据总长度为:202\n", 124 | "爬取第20200210天数据,数据总长度为:210\n", 125 | "爬取第20200131天数据,数据总长度为:215\n", 126 | "爬取第20200121天数据,数据总长度为:218\n", 127 | "爬取第20200111天数据,数据总长度为:224\n", 128 | "爬取第20200101天数据,数据总长度为:231\n", 129 | "爬取第20191222天数据,数据总长度为:238\n", 130 | "爬取第20191212天数据,数据总长度为:245\n", 131 | "爬取第20191202天数据,数据总长度为:253\n", 132 | "爬取第20191122天数据,数据总长度为:259\n", 133 | "爬取第20191112天数据,数据总长度为:267\n", 134 | "爬取第20191102天数据,数据总长度为:273\n", 135 | "爬取第20191023天数据,数据总长度为:281\n", 136 | "爬取第20191013天数据,数据总长度为:288\n", 137 | "爬取第20191003天数据,数据总长度为:292\n", 138 | "爬取第20190923天数据,数据总长度为:298\n", 139 | "爬取第20190913天数据,数据总长度为:303\n", 140 | "爬取第20190903天数据,数据总长度为:311\n", 141 | "爬取第20190824天数据,数据总长度为:317\n", 142 | "爬取第20190814天数据,数据总长度为:325\n", 143 | "爬取第20190804天数据,数据总长度为:332\n", 144 | "爬取第20190725天数据,数据总长度为:339\n", 145 | "爬取第20190715天数据,数据总长度为:347\n", 146 | "爬取第20190705天数据,数据总长度为:353\n", 147 | "爬取第20190625天数据,数据总长度为:361\n", 148 | "爬取第20190615天数据,数据总长度为:367\n", 149 | "爬取第20190605天数据,数据总长度为:374\n", 150 | "爬取第20190526天数据,数据总长度为:381\n", 151 | "爬取第20190516天数据,数据总长度为:388\n", 152 | "爬取第20190506天数据,数据总长度为:396\n", 153 | "爬取第20190426天数据,数据总长度为:399\n", 154 | "爬取第20190416天数据,数据总长度为:407\n", 155 | "爬取第20190406天数据,数据总长度为:413\n", 156 | "爬取第20190327天数据,数据总长度为:420\n", 157 | "爬取第20190317天数据,数据总长度为:427\n", 158 | "爬取第20190307天数据,数据总长度为:434\n", 159 | "爬取第20190225天数据,数据总长度为:442\n", 160 | "爬取第20190215天数据,数据总长度为:448\n", 161 | "爬取第20190205天数据,数据总长度为:452\n", 162 | "爬取第20190126天数据,数据总长度为:457\n", 163 | "爬取第20190116天数据,数据总长度为:465\n", 164 | "爬取第20190106天数据,数据总长度为:472\n", 165 | "爬取第20181227天数据,数据总长度为:477\n", 166 | "爬取第20181217天数据,数据总长度为:485\n", 167 | "爬取第20181207天数据,数据总长度为:491\n", 168 | "爬取第20181127天数据,数据总长度为:499\n", 169 | "爬取第20181117天数据,数据总长度为:505\n", 170 | "爬取第20181107天数据,数据总长度为:513\n", 171 | "爬取第20181028天数据,数据总长度为:520\n", 172 | "爬取第20181018天数据,数据总长度为:527\n", 173 | "爬取第20181008天数据,数据总长度为:535\n", 174 | "爬取第20180928天数据,数据总长度为:536\n", 175 | "爬取第20180918天数据,数据总长度为:543\n", 176 | "爬取第20180908天数据,数据总长度为:549\n", 177 | "爬取第20180829天数据,数据总长度为:557\n", 178 | "爬取第20180819天数据,数据总长度为:564\n", 179 | "爬取第20180809天数据,数据总长度为:571\n", 180 | "爬取第20180730天数据,数据总长度为:579\n", 181 | "爬取第20180720天数据,数据总长度为:585\n", 182 | "爬取第20180710天数据,数据总长度为:593\n", 183 | "爬取第20180630天数据,数据总长度为:599\n", 184 | "爬取第20180620天数据,数据总长度为:607\n", 185 | "爬取第20180610天数据,数据总长度为:613\n", 186 | "爬取第20180531天数据,数据总长度为:620\n", 187 | "爬取第20180521天数据,数据总长度为:628\n", 188 | "爬取第20180511天数据,数据总长度为:634\n", 189 | "爬取第20180501天数据,数据总长度为:641\n", 190 | "爬取第20180421天数据,数据总长度为:646\n", 191 | "爬取第20180411天数据,数据总长度为:654\n", 192 | "爬取第20180401天数据,数据总长度为:659\n", 193 | "爬取第20180322天数据,数据总长度为:666\n", 194 | "爬取第20180312天数据,数据总长度为:674\n", 195 | "爬取第20180302天数据,数据总长度为:680\n", 196 | "爬取第20180220天数据,数据总长度为:686\n", 197 | "爬取第20180210天数据,数据总长度为:689\n", 198 | "爬取第20180131天数据,数据总长度为:697\n", 199 | "爬取第20180121天数据,数据总长度为:704\n", 200 | "爬取第20180111天数据,数据总长度为:711\n", 201 | "爬取第20180101天数据,数据总长度为:718\n", 202 | "爬取第20171222天数据,数据总长度为:724\n", 203 | "爬取第20171212天数据,数据总长度为:732\n", 204 | "爬取第20171202天数据,数据总长度为:738\n", 205 | "爬取第20171122天数据,数据总长度为:746\n", 206 | "爬取第20171112天数据,数据总长度为:753\n", 207 | "爬取第20171102天数据,数据总长度为:760\n", 208 | "爬取第20171023天数据,数据总长度为:768\n", 209 | "爬取第20171013天数据,数据总长度为:774\n", 210 | "爬取第20171003天数据,数据总长度为:778\n", 211 | "爬取第20170923天数据,数据总长度为:783\n", 212 | "爬取第20170913天数据,数据总长度为:791\n", 213 | "爬取第20170903天数据,数据总长度为:798\n", 214 | "爬取第20170824天数据,数据总长度为:805\n", 215 | "爬取第20170814天数据,数据总长度为:813\n", 216 | "爬取第20170804天数据,数据总长度为:819\n", 217 | "爬取第20170725天数据,数据总长度为:827\n", 218 | "爬取第20170715天数据,数据总长度为:833\n", 219 | "爬取第20170705天数据,数据总长度为:841\n", 220 | "爬取第20170625天数据,数据总长度为:848\n", 221 | "爬取第20170615天数据,数据总长度为:855\n", 222 | "爬取第20170605天数据,数据总长度为:863\n", 223 | "爬取第20170526天数据,数据总长度为:867\n", 224 | "爬取第20170516天数据,数据总长度为:875\n", 225 | "爬取第20170506天数据,数据总长度为:881\n", 226 | "爬取第20170426天数据,数据总长度为:888\n", 227 | "爬取第20170416天数据,数据总长度为:895\n", 228 | "爬取第20170406天数据,数据总长度为:902\n", 229 | "爬取第20170327天数据,数据总长度为:908\n", 230 | "爬取第20170317天数据,数据总长度为:914\n", 231 | "爬取第20170307天数据,数据总长度为:922\n", 232 | "爬取第20170225天数据,数据总长度为:928\n", 233 | "爬取第20170215天数据,数据总长度为:936\n", 234 | "爬取第20170205天数据,数据总长度为:943\n", 235 | "爬取第20170126天数据,数据总长度为:945\n", 236 | "爬取第20170116天数据,数据总长度为:953\n", 237 | "爬取第20170106天数据,数据总长度为:959\n", 238 | "爬取第20161227天数据,数据总长度为:966\n", 239 | "爬取第20161217天数据,数据总长度为:972\n", 240 | "爬取第20161207天数据,数据总长度为:980\n", 241 | "爬取第20161127天数据,数据总长度为:987\n", 242 | "爬取第20161117天数据,数据总长度为:994\n", 243 | "爬取第20161107天数据,数据总长度为:1002\n", 244 | "爬取第20161028天数据,数据总长度为:1008\n", 245 | "爬取第20161018天数据,数据总长度为:1016\n", 246 | "爬取第20161008天数据,数据总长度为:1022\n", 247 | "爬取第20160928天数据,数据总长度为:1025\n", 248 | "爬取第20160918天数据,数据总长度为:1032\n", 249 | "爬取第20160908天数据,数据总长度为:1037\n", 250 | "爬取第20160829天数据,数据总长度为:1045\n", 251 | "爬取第20160819天数据,数据总长度为:1051\n", 252 | "爬取第20160809天数据,数据总长度为:1059\n", 253 | "爬取第20160730天数据,数据总长度为:1065\n", 254 | "爬取第20160720天数据,数据总长度为:1073\n", 255 | "爬取第20160710天数据,数据总长度为:1080\n", 256 | "爬取第20160630天数据,数据总长度为:1087\n", 257 | "爬取第20160620天数据,数据总长度为:1095\n", 258 | "爬取第20160610天数据,数据总长度为:1100\n", 259 | "爬取第20160531天数据,数据总长度为:1107\n", 260 | "爬取第20160521天数据,数据总长度为:1113\n", 261 | "爬取第20160511天数据,数据总长度为:1121\n", 262 | "爬取第20160501天数据,数据总长度为:1127\n", 263 | "爬取第20160421天数据,数据总长度为:1134\n", 264 | "爬取第20160411天数据,数据总长度为:1142\n", 265 | "爬取第20160401天数据,数据总长度为:1147\n", 266 | "爬取第20160322天数据,数据总长度为:1155\n", 267 | "爬取第20160312天数据,数据总长度为:1161\n", 268 | "爬取第20160302天数据,数据总长度为:1169\n", 269 | "爬取第20160221天数据,数据总长度为:1176\n", 270 | "爬取第20160211天数据,数据总长度为:1181\n", 271 | "爬取第20160201天数据,数据总长度为:1186\n", 272 | "爬取第20160122天数据,数据总长度为:1192\n", 273 | "爬取第20160112天数据,数据总长度为:1200\n", 274 | "爬取第20160102天数据,数据总长度为:1206\n", 275 | "爬取第20151223天数据,数据总长度为:1213\n", 276 | "爬取第20151213天数据,数据总长度为:1220\n", 277 | "爬取第20151203天数据,数据总长度为:1227\n", 278 | "爬取第20151123天数据,数据总长度为:1235\n", 279 | "爬取第20151113天数据,数据总长度为:1241\n", 280 | "爬取第20151103天数据,数据总长度为:1249\n", 281 | "爬取第20151024天数据,数据总长度为:1255\n", 282 | "爬取第20151014天数据,数据总长度为:1263\n", 283 | "爬取第20151004天数据,数据总长度为:1267\n", 284 | "爬取第20150924天数据,数据总长度为:1272\n", 285 | "爬取第20150914天数据,数据总长度为:1280\n", 286 | "爬取第20150904天数据,数据总长度为:1285\n", 287 | "爬取第20150825天数据,数据总长度为:1292\n", 288 | "爬取第20150815天数据,数据总长度为:1298\n", 289 | "爬取第20150805天数据,数据总长度为:1306\n", 290 | "爬取第20150726天数据,数据总长度为:1313\n", 291 | "爬取第20150716天数据,数据总长度为:1320\n", 292 | "爬取第20150706天数据,数据总长度为:1328\n", 293 | "爬取第20150626天数据,数据总长度为:1334\n", 294 | "爬取第20150616天数据,数据总长度为:1341\n", 295 | "爬取第20150606天数据,数据总长度为:1347\n", 296 | "爬取第20150527天数据,数据总长度为:1355\n", 297 | "爬取第20150517天数据,数据总长度为:1362\n", 298 | "爬取第20150507天数据,数据总长度为:1369\n", 299 | "爬取第20150427天数据,数据总长度为:1376\n", 300 | "爬取第20150417天数据,数据总长度为:1382\n", 301 | "爬取第20150407天数据,数据总长度为:1390\n", 302 | "爬取第20150328天数据,数据总长度为:1395\n", 303 | "爬取第20150318天数据,数据总长度为:1403\n", 304 | "爬取第20150308天数据,数据总长度为:1410\n", 305 | "爬取第20150226天数据,数据总长度为:1417\n", 306 | "爬取第20150216天数据,数据总长度为:1420\n", 307 | "爬取第20150206天数据,数据总长度为:1426\n", 308 | "爬取第20150127天数据,数据总长度为:1434\n", 309 | "爬取第20150117天数据,数据总长度为:1440\n", 310 | "爬取第20150107天数据,数据总长度为:1448\n", 311 | "爬取第20141228天数据,数据总长度为:1453\n", 312 | "爬取第20141218天数据,数据总长度为:1460\n", 313 | "爬取第20141208天数据,数据总长度为:1468\n", 314 | "爬取第20141128天数据,数据总长度为:1474\n", 315 | "爬取第20141118天数据,数据总长度为:1482\n", 316 | "爬取第20141108天数据,数据总长度为:1488\n", 317 | "爬取第20141029天数据,数据总长度为:1496\n", 318 | "爬取第20141019天数据,数据总长度为:1503\n", 319 | "爬取第20141009天数据,数据总长度为:1510\n", 320 | "爬取第20140929天数据,数据总长度为:1513\n", 321 | "爬取第20140919天数据,数据总长度为:1519\n", 322 | "爬取第20140909天数据,数据总长度为:1527\n", 323 | "爬取第20140830天数据,数据总长度为:1532\n", 324 | "爬取第20140820天数据,数据总长度为:1540\n", 325 | "爬取第20140810天数据,数据总长度为:1547\n", 326 | "爬取第20140731天数据,数据总长度为:1554\n", 327 | "爬取第20140721天数据,数据总长度为:1562\n", 328 | "爬取第20140711天数据,数据总长度为:1568\n", 329 | "爬取第20140701天数据,数据总长度为:1576\n", 330 | "爬取第20140621天数据,数据总长度为:1582\n", 331 | "爬取第20140611天数据,数据总长度为:1590\n", 332 | "爬取第20140601天数据,数据总长度为:1596\n", 333 | "爬取第20140522天数据,数据总长度为:1603\n", 334 | "爬取第20140512天数据,数据总长度为:1611\n", 335 | "爬取第20140502天数据,数据总长度为:1616\n", 336 | "爬取第20140422天数据,数据总长度为:1623\n", 337 | "爬取第20140412天数据,数据总长度为:1629\n", 338 | "爬取第20140402天数据,数据总长度为:1636\n", 339 | "爬取第20140323天数据,数据总长度为:1643\n", 340 | "爬取第20140313天数据,数据总长度为:1650\n", 341 | "爬取第20140303天数据,数据总长度为:1658\n", 342 | "爬取第20140221天数据,数据总长度为:1664\n", 343 | "爬取第20140211天数据,数据总长度为:1672\n", 344 | "爬取第20140201天数据,数据总长度为:1674\n", 345 | "爬取第20140122天数据,数据总长度为:1681\n", 346 | "爬取第20140112天数据,数据总长度为:1688\n", 347 | "爬取第20140102天数据,数据总长度为:1695\n", 348 | "爬取第20131223天数据,数据总长度为:1702\n", 349 | "爬取第20131213天数据,数据总长度为:1708\n", 350 | "爬取第20131203天数据,数据总长度为:1716\n", 351 | "爬取第20131123天数据,数据总长度为:1722\n", 352 | "爬取第20131113天数据,数据总长度为:1730\n", 353 | "爬取第20131103天数据,数据总长度为:1737\n", 354 | "爬取第20131024天数据,数据总长度为:1744\n", 355 | "爬取第20131014天数据,数据总长度为:1752\n", 356 | "爬取第20131004天数据,数据总长度为:1756\n", 357 | "爬取第20130924天数据,数据总长度为:1761\n", 358 | "爬取第20130914天数据,数据总长度为:1765\n", 359 | "爬取第20130904天数据,数据总长度为:1773\n", 360 | "爬取第20130825天数据,数据总长度为:1780\n", 361 | "爬取第20130815天数据,数据总长度为:1787\n", 362 | "爬取第20130805天数据,数据总长度为:1795\n", 363 | "爬取第20130726天数据,数据总长度为:1801\n", 364 | "爬取第20130716天数据,数据总长度为:1809\n", 365 | "爬取第20130706天数据,数据总长度为:1815\n", 366 | "爬取第20130626天数据,数据总长度为:1823\n", 367 | "爬取第20130616天数据,数据总长度为:1830\n", 368 | "爬取第20130606天数据,数据总长度为:1834\n", 369 | "爬取第20130527天数据,数据总长度为:1842\n", 370 | "爬取第20130517天数据,数据总长度为:1848\n", 371 | "爬取第20130507天数据,数据总长度为:1856\n", 372 | "爬取第20130427天数据,数据总长度为:1859\n", 373 | "爬取第20130417天数据,数据总长度为:1867\n", 374 | "爬取第20130407天数据,数据总长度为:1874\n", 375 | "爬取第20130328天数据,数据总长度为:1879\n", 376 | "爬取第20130318天数据,数据总长度为:1887\n", 377 | "爬取第20130308天数据,数据总长度为:1893\n", 378 | "爬取第20130226天数据,数据总长度为:1901\n", 379 | "爬取第20130216天数据,数据总长度为:1907\n", 380 | "爬取第20130206天数据,数据总长度为:1910\n", 381 | "爬取第20130127天数据,数据总长度为:1917\n", 382 | "爬取第20130117天数据,数据总长度为:1924\n", 383 | "爬取第20130107天数据,数据总长度为:1932\n", 384 | "爬取第20121228天数据,数据总长度为:1935\n", 385 | "爬取第20121218天数据,数据总长度为:1943\n", 386 | "爬取第20121208天数据,数据总长度为:1949\n", 387 | "爬取第20121128天数据,数据总长度为:1957\n", 388 | "爬取第20121118天数据,数据总长度为:1964\n", 389 | "爬取第20121108天数据,数据总长度为:1971\n", 390 | "爬取第20121029天数据,数据总长度为:1979\n", 391 | "爬取第20121019天数据,数据总长度为:1985\n", 392 | "爬取第20121009天数据,数据总长度为:1993\n", 393 | "爬取第20120929天数据,数据总长度为:1994\n", 394 | "爬取第20120919天数据,数据总长度为:2002\n", 395 | "爬取第20120909天数据,数据总长度为:2009\n", 396 | "爬取第20120830天数据,数据总长度为:2016\n", 397 | "爬取第20120820天数据,数据总长度为:2024\n", 398 | "爬取第20120810天数据,数据总长度为:2030\n", 399 | "爬取第20120731天数据,数据总长度为:2038\n", 400 | "爬取第20120721天数据,数据总长度为:2044\n", 401 | "爬取第20120711天数据,数据总长度为:2052\n", 402 | "爬取第20120701天数据,数据总长度为:2059\n", 403 | "爬取第20120621天数据,数据总长度为:2065\n", 404 | "爬取第20120611天数据,数据总长度为:2073\n", 405 | "爬取第20120601天数据,数据总长度为:2079\n", 406 | "爬取第20120522天数据,数据总长度为:2087\n", 407 | "爬取第20120512天数据,数据总长度为:2093\n", 408 | "爬取第20120502天数据,数据总长度为:2101\n", 409 | "爬取第20120422天数据,数据总长度为:2106\n", 410 | "爬取第20120412天数据,数据总长度为:2113\n", 411 | "爬取第20120402天数据,数据总长度为:2118\n", 412 | "爬取第20120323天数据,数据总长度为:2124\n", 413 | "爬取第20120313天数据,数据总长度为:2132\n", 414 | "爬取第20120303天数据,数据总长度为:2138\n", 415 | "爬取第20120222天数据,数据总长度为:2146\n", 416 | "爬取第20120212天数据,数据总长度为:2153\n", 417 | "爬取第20120202天数据,数据总长度为:2160\n", 418 | "爬取第20120123天数据,数据总长度为:2163\n", 419 | "爬取第20120113天数据,数据总长度为:2169\n", 420 | "爬取第20120103天数据,数据总长度为:2176\n", 421 | "爬取第20111224天数据,数据总长度为:2181\n", 422 | "爬取第20111214天数据,数据总长度为:2189\n", 423 | "爬取第20111204天数据,数据总长度为:2196\n", 424 | "爬取第20111124天数据,数据总长度为:2203\n", 425 | "爬取第20111114天数据,数据总长度为:2211\n", 426 | "爬取第20111104天数据,数据总长度为:2217\n", 427 | "爬取第20111025天数据,数据总长度为:2225\n", 428 | "爬取第20111015天数据,数据总长度为:2231\n", 429 | "爬取第20111005天数据,数据总长度为:2236\n", 430 | "爬取第20110925天数据,数据总长度为:2241\n", 431 | "爬取第20110915天数据,数据总长度为:2248\n", 432 | "爬取第20110905天数据,数据总长度为:2255\n", 433 | "爬取第20110826天数据,数据总长度为:2261\n", 434 | "爬取第20110816天数据,数据总长度为:2269\n", 435 | "爬取第20110806天数据,数据总长度为:2275\n", 436 | "爬取第20110727天数据,数据总长度为:2283\n", 437 | "爬取第20110717天数据,数据总长度为:2290\n", 438 | "爬取第20110707天数据,数据总长度为:2297\n", 439 | "爬取第20110627天数据,数据总长度为:2305\n", 440 | "爬取第20110617天数据,数据总长度为:2311\n", 441 | "爬取第20110607天数据,数据总长度为:2319\n", 442 | "爬取第20110528天数据,数据总长度为:2324\n", 443 | "爬取第20110518天数据,数据总长度为:2332\n", 444 | "爬取第20110508天数据,数据总长度为:2339\n", 445 | "爬取第20110428天数据,数据总长度为:2345\n", 446 | "爬取第20110418天数据,数据总长度为:2353\n", 447 | "爬取第20110408天数据,数据总长度为:2359\n", 448 | "爬取第20110329天数据,数据总长度为:2365\n", 449 | "爬取第20110319天数据,数据总长度为:2371\n", 450 | "爬取第20110309天数据,数据总长度为:2379\n", 451 | "爬取第20110227天数据,数据总长度为:2386\n", 452 | "爬取第20110217天数据,数据总长度为:2393\n", 453 | "爬取第20110207天数据,数据总长度为:2399\n", 454 | "爬取第20110128天数据,数据总长度为:2402\n", 455 | "爬取第20110118天数据,数据总长度为:2410\n", 456 | "爬取第20110108天数据,数据总长度为:2416\n", 457 | "爬取第20101229天数据,数据总长度为:2423\n", 458 | "爬取第20101219天数据,数据总长度为:2430\n", 459 | "爬取第20101209天数据,数据总长度为:2437\n", 460 | "爬取第20101129天数据,数据总长度为:2445\n", 461 | "爬取第20101119天数据,数据总长度为:2451\n", 462 | "爬取第20101109天数据,数据总长度为:2459\n", 463 | "爬取第20101030天数据,数据总长度为:2465\n", 464 | "爬取第20101020天数据,数据总长度为:2473\n", 465 | "爬取第20101010天数据,数据总长度为:2480\n", 466 | "爬取第20100930天数据,数据总长度为:2482\n", 467 | "爬取第20100920天数据,数据总长度为:2487\n", 468 | "爬取第20100910天数据,数据总长度为:2493\n", 469 | "爬取第20100831天数据,数据总长度为:2501\n", 470 | "爬取第20100821天数据,数据总长度为:2507\n", 471 | "爬取第20100811天数据,数据总长度为:2515\n", 472 | "爬取第20100801天数据,数据总长度为:2522\n", 473 | "爬取第20100722天数据,数据总长度为:2529\n", 474 | "爬取第20100712天数据,数据总长度为:2537\n", 475 | "爬取第20100702天数据,数据总长度为:2543\n", 476 | "爬取第20100622天数据,数据总长度为:2551\n", 477 | "爬取第20100612天数据,数据总长度为:2554\n", 478 | "爬取第20100602天数据,数据总长度为:2562\n", 479 | "爬取第20100523天数据,数据总长度为:2569\n", 480 | "爬取第20100513天数据,数据总长度为:2576\n", 481 | "爬取第20100503天数据,数据总长度为:2583\n", 482 | "爬取第20100423天数据,数据总长度为:2589\n", 483 | "爬取第20100413天数据,数据总长度为:2597\n", 484 | "爬取第20100403天数据,数据总长度为:2602\n", 485 | "爬取第20100324天数据,数据总长度为:2610\n", 486 | "爬取第20100314天数据,数据总长度为:2617\n", 487 | "爬取第20100304天数据,数据总长度为:2624\n", 488 | "爬取第20100222天数据,数据总长度为:2632\n", 489 | "爬取第20100212天数据,数据总长度为:2633\n", 490 | "爬取第20100202天数据,数据总长度为:2641\n", 491 | "爬取第20100123天数据,数据总长度为:2647\n", 492 | "爬取第20100113天数据,数据总长度为:2655\n", 493 | "爬取第20100103天数据,数据总长度为:2662\n", 494 | "爬取第20091224天数据,数据总长度为:2668\n", 495 | "爬取第20091214天数据,数据总长度为:2676\n", 496 | "爬取第20091204天数据,数据总长度为:2682\n", 497 | "爬取第20091124天数据,数据总长度为:2690\n", 498 | "爬取第20091114天数据,数据总长度为:2696\n", 499 | "爬取第20091104天数据,数据总长度为:2704\n", 500 | "爬取第20091025天数据,数据总长度为:2711\n", 501 | "爬取第20091015天数据,数据总长度为:2718\n", 502 | "爬取第20091005天数据,数据总长度为:2722\n", 503 | "爬取第20090925天数据,数据总长度为:2726\n", 504 | "爬取第20090915天数据,数据总长度为:2734\n", 505 | "爬取第20090905天数据,数据总长度为:2740\n", 506 | "爬取第20090826天数据,数据总长度为:2748\n", 507 | "爬取第20090816天数据,数据总长度为:2755\n", 508 | "爬取第20090806天数据,数据总长度为:2762\n", 509 | "爬取第20090727天数据,数据总长度为:2770\n", 510 | "爬取第20090717天数据,数据总长度为:2776\n", 511 | "爬取第20090707天数据,数据总长度为:2784\n", 512 | "爬取第20090627天数据,数据总长度为:2790\n", 513 | "爬取第20090617天数据,数据总长度为:2798\n", 514 | "爬取第20090607天数据,数据总长度为:2805\n", 515 | "爬取第20090528天数据,数据总长度为:2810\n", 516 | "爬取第20090518天数据,数据总长度为:2818\n", 517 | "爬取第20090508天数据,数据总长度为:2824\n", 518 | "爬取第20090428天数据,数据总长度为:2831\n", 519 | "爬取第20090418天数据,数据总长度为:2837\n", 520 | "爬取第20090408天数据,数据总长度为:2845\n", 521 | "爬取第20090329天数据,数据总长度为:2851\n", 522 | "爬取第20090319天数据,数据总长度为:2858\n", 523 | "爬取第20090309天数据,数据总长度为:2866\n", 524 | "爬取第20090227天数据,数据总长度为:2872\n", 525 | "爬取第20090217天数据,数据总长度为:2880\n", 526 | "爬取第20090207天数据,数据总长度为:2886\n", 527 | "爬取第20090128天数据,数据总长度为:2891\n", 528 | "爬取第20090118天数据,数据总长度为:2896\n", 529 | "爬取第20090108天数据,数据总长度为:2903\n", 530 | "爬取第20081229天数据,数据总长度为:2909\n", 531 | "爬取第20081219天数据,数据总长度为:2915\n", 532 | "爬取第20081209天数据,数据总长度为:2923\n", 533 | "爬取第20081129天数据,数据总长度为:2929\n", 534 | "爬取第20081119天数据,数据总长度为:2937\n", 535 | "爬取第20081109天数据,数据总长度为:2944\n", 536 | "爬取第20081030天数据,数据总长度为:2951\n", 537 | "爬取第20081020天数据,数据总长度为:2959\n", 538 | "爬取第20081010天数据,数据总长度为:2965\n", 539 | "爬取第20080930天数据,数据总长度为:2969\n", 540 | "爬取第20080920天数据,数据总长度为:2974\n", 541 | "爬取第20080910天数据,数据总长度为:2981\n", 542 | "爬取第20080831天数据,数据总长度为:2988\n", 543 | "爬取第20080821天数据,数据总长度为:2995\n", 544 | "爬取第20080811天数据,数据总长度为:3003\n", 545 | "爬取第20080801天数据,数据总长度为:3009\n", 546 | "爬取第20080722天数据,数据总长度为:3017\n", 547 | "爬取第20080712天数据,数据总长度为:3023\n", 548 | "爬取第20080702天数据,数据总长度为:3031\n", 549 | "爬取第20080622天数据,数据总长度为:3038\n", 550 | "爬取第20080612天数据,数据总长度为:3045\n", 551 | "爬取第20080602天数据,数据总长度为:3052\n", 552 | "爬取第20080523天数据,数据总长度为:3058\n", 553 | "爬取第20080513天数据,数据总长度为:3066\n", 554 | "爬取第20080503天数据,数据总长度为:3072\n", 555 | "爬取第20080423天数据,数据总长度为:3078\n", 556 | "爬取第20080413天数据,数据总长度为:3085\n", 557 | "爬取第20080403天数据,数据总长度为:3091\n", 558 | "爬取第20080324天数据,数据总长度为:3099\n", 559 | "爬取第20080314天数据,数据总长度为:3105\n", 560 | "爬取第20080304天数据,数据总长度为:3113\n", 561 | "爬取第20080223天数据,数据总长度为:3119\n", 562 | "爬取第20080213天数据,数据总长度为:3127\n", 563 | "爬取第20080203天数据,数据总长度为:3129\n", 564 | "爬取第20080124天数据,数据总长度为:3136\n", 565 | "爬取第20080114天数据,数据总长度为:3144\n", 566 | "爬取第20080104天数据,数据总长度为:3150\n", 567 | "爬取第20071225天数据,数据总长度为:3156\n", 568 | "爬取第20071215天数据,数据总长度为:3162\n", 569 | "爬取第20071205天数据,数据总长度为:3170\n", 570 | "爬取第20071125天数据,数据总长度为:3177\n", 571 | "爬取第20071115天数据,数据总长度为:3184\n", 572 | "爬取第20071105天数据,数据总长度为:3192\n", 573 | "爬取第20071026天数据,数据总长度为:3198\n", 574 | "爬取第20071016天数据,数据总长度为:3206\n", 575 | "爬取第20071006天数据,数据总长度为:3212\n", 576 | "爬取第20070926天数据,数据总长度为:3215\n", 577 | "爬取第20070916天数据,数据总长度为:3222\n", 578 | "爬取第20070906天数据,数据总长度为:3229\n", 579 | "爬取第20070827天数据,数据总长度为:3237\n", 580 | "爬取第20070817天数据,数据总长度为:3243\n", 581 | "爬取第20070807天数据,数据总长度为:3251\n", 582 | "爬取第20070728天数据,数据总长度为:3257\n", 583 | "爬取第20070718天数据,数据总长度为:3265\n", 584 | "爬取第20070708天数据,数据总长度为:3272\n", 585 | "爬取第20070628天数据,数据总长度为:3279\n", 586 | "爬取第20070618天数据,数据总长度为:3287\n", 587 | "爬取第20070608天数据,数据总长度为:3293\n", 588 | "爬取第20070529天数据,数据总长度为:3301\n", 589 | "爬取第20070519天数据,数据总长度为:3307\n", 590 | "爬取第20070509天数据,数据总长度为:3315\n", 591 | "爬取第20070429天数据,数据总长度为:3317\n", 592 | "爬取第20070419天数据,数据总长度为:3324\n", 593 | "爬取第20070409天数据,数据总长度为:3332\n", 594 | "爬取第20070330天数据,数据总长度为:3338\n", 595 | "爬取第20070320天数据,数据总长度为:3346\n", 596 | "爬取第20070310天数据,数据总长度为:3352\n", 597 | "爬取第20070228天数据,数据总长度为:3360\n", 598 | "爬取第20070218天数据,数据总长度为:3362\n", 599 | "爬取第20070208天数据,数据总长度为:3369\n", 600 | "爬取第20070129天数据,数据总长度为:3377\n", 601 | "爬取第20070119天数据,数据总长度为:3383\n", 602 | "爬取第20070109天数据,数据总长度为:3391\n", 603 | "爬取第20061230天数据,数据总长度为:3394\n", 604 | "爬取第20061220天数据,数据总长度为:3402\n", 605 | "爬取第20061210天数据,数据总长度为:3409\n", 606 | "爬取第20061130天数据,数据总长度为:3416\n", 607 | "爬取第20061120天数据,数据总长度为:3424\n", 608 | "爬取第20061110天数据,数据总长度为:3430\n", 609 | "爬取第20061031天数据,数据总长度为:3438\n", 610 | "爬取第20061021天数据,数据总长度为:3444\n", 611 | "爬取第20061011天数据,数据总长度为:3452\n", 612 | "爬取第20061001天数据,数据总长度为:3454\n", 613 | "爬取第20060921天数据,数据总长度为:3461\n", 614 | "爬取第20060911天数据,数据总长度为:3469\n", 615 | "爬取第20060901天数据,数据总长度为:3475\n", 616 | "爬取第20060822天数据,数据总长度为:3483\n", 617 | "爬取第20060812天数据,数据总长度为:3489\n", 618 | "爬取第20060802天数据,数据总长度为:3497\n", 619 | "爬取第20060723天数据,数据总长度为:3504\n", 620 | "爬取第20060713天数据,数据总长度为:3511\n", 621 | "爬取第20060703天数据,数据总长度为:3519\n", 622 | "爬取第20060623天数据,数据总长度为:3525\n", 623 | "爬取第20060613天数据,数据总长度为:3533\n", 624 | "爬取第20060603天数据,数据总长度为:3539\n", 625 | "爬取第20060524天数据,数据总长度为:3547\n", 626 | "爬取第20060514天数据,数据总长度为:3554\n", 627 | "爬取第20060504天数据,数据总长度为:3559\n", 628 | "爬取第20060424天数据,数据总长度为:3564\n", 629 | "爬取第20060414天数据,数据总长度为:3570\n", 630 | "爬取第20060404天数据,数据总长度为:3578\n", 631 | "爬取第20060325天数据,数据总长度为:3584\n", 632 | "爬取第20060315天数据,数据总长度为:3592\n", 633 | "爬取第20060305天数据,数据总长度为:3599\n", 634 | "爬取第20060223天数据,数据总长度为:3606\n", 635 | "爬取第20060213天数据,数据总长度为:3614\n", 636 | "爬取第20060203天数据,数据总长度为:3619\n", 637 | "爬取第20060124天数据,数据总长度为:3621\n", 638 | "爬取第20060114天数据,数据总长度为:3627\n", 639 | "爬取第20060104天数据,数据总长度为:3635\n", 640 | "爬取第20051225天数据,数据总长度为:3640\n", 641 | "爬取第20051215天数据,数据总长度为:3647\n", 642 | "爬取第20051205天数据,数据总长度为:3655\n", 643 | "爬取第20051125天数据,数据总长度为:3661\n", 644 | "爬取第20051115天数据,数据总长度为:3669\n", 645 | "爬取第20051105天数据,数据总长度为:3675\n", 646 | "爬取第20051026天数据,数据总长度为:3683\n", 647 | "爬取第20051016天数据,数据总长度为:3690\n", 648 | "爬取第20051006天数据,数据总长度为:3695\n", 649 | "爬取第20050926天数据,数据总长度为:3700\n", 650 | "爬取第20050916天数据,数据总长度为:3706\n", 651 | "爬取第20050906天数据,数据总长度为:3714\n", 652 | "爬取第20050827天数据,数据总长度为:3720\n", 653 | "爬取第20050817天数据,数据总长度为:3728\n", 654 | "爬取第20050807天数据,数据总长度为:3735\n", 655 | "爬取第20050728天数据,数据总长度为:3742\n", 656 | "爬取第20050718天数据,数据总长度为:3750\n", 657 | "爬取第20050708天数据,数据总长度为:3756\n", 658 | "爬取第20050628天数据,数据总长度为:3764\n", 659 | "爬取第20050618天数据,数据总长度为:3770\n", 660 | "爬取第20050608天数据,数据总长度为:3778\n", 661 | "爬取第20050529天数据,数据总长度为:3785\n", 662 | "爬取第20050519天数据,数据总长度为:3792\n", 663 | "爬取第20050509天数据,数据总长度为:3800\n", 664 | "爬取第20050429天数据,数据总长度为:3801\n", 665 | "爬取第20050419天数据,数据总长度为:3809\n", 666 | "爬取第20050409天数据,数据总长度为:3815\n", 667 | "爬取第20050330天数据,数据总长度为:3823\n", 668 | "爬取第20050320天数据,数据总长度为:3830\n", 669 | "爬取第20050310天数据,数据总长度为:3837\n", 670 | "爬取第20050228天数据,数据总长度为:3845\n", 671 | "爬取第20050218天数据,数据总长度为:3848\n", 672 | "爬取第20050208天数据,数据总长度为:3848\n", 673 | "爬取第20050129天数据,数据总长度为:3848\n", 674 | "爬取第20050119天数据,数据总长度为:3848\n", 675 | "爬取第20050109天数据,数据总长度为:3848\n", 676 | "爬取第20041230天数据,数据总长度为:3848\n", 677 | "爬取第20041220天数据,数据总长度为:3848\n", 678 | "爬取第20041210天数据,数据总长度为:3848\n", 679 | "爬取第20041130天数据,数据总长度为:3848\n", 680 | "爬取第20041120天数据,数据总长度为:3848\n", 681 | "爬取第20041110天数据,数据总长度为:3848\n", 682 | "爬取第20041031天数据,数据总长度为:3848\n", 683 | "爬取第20041021天数据,数据总长度为:3848\n", 684 | "爬取第20041011天数据,数据总长度为:3848\n", 685 | "爬取第20041001天数据,数据总长度为:3848\n", 686 | "爬取第20040921天数据,数据总长度为:3848\n", 687 | "爬取第20040911天数据,数据总长度为:3848\n", 688 | "爬取第20040901天数据,数据总长度为:3848\n", 689 | "爬取第20040822天数据,数据总长度为:3848\n", 690 | "爬取第20040812天数据,数据总长度为:3848\n", 691 | "爬取第20040802天数据,数据总长度为:3848\n", 692 | "爬取第20040723天数据,数据总长度为:3848\n", 693 | "爬取第20040713天数据,数据总长度为:3848\n", 694 | "爬取第20040703天数据,数据总长度为:3848\n", 695 | "爬取第20040623天数据,数据总长度为:3848\n", 696 | "爬取第20040613天数据,数据总长度为:3848\n", 697 | "爬取第20040603天数据,数据总长度为:3848\n", 698 | "爬取第20040524天数据,数据总长度为:3848\n", 699 | "爬取第20040514天数据,数据总长度为:3848\n" 700 | ] 701 | }, 702 | { 703 | "ename": "KeyboardInterrupt", 704 | "evalue": "", 705 | "output_type": "error", 706 | "traceback": [ 707 | "\u001b[1;31m---------------------------------------------------------------------------\u001b[0m", 708 | "\u001b[1;31mKeyboardInterrupt\u001b[0m Traceback (most recent call last)", 709 | "\u001b[1;32m\u001b[0m in \u001b[0;36m\u001b[1;34m\u001b[0m\n\u001b[0;32m 6\u001b[0m \u001b[1;32mtry\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m 7\u001b[0m \u001b[0mpro\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0mts\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mpro_api\u001b[0m\u001b[1;33m(\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m----> 8\u001b[1;33m \u001b[0mtime\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0msleep\u001b[0m\u001b[1;33m(\u001b[0m\u001b[1;36m0.75\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m 9\u001b[0m \u001b[0mdf\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0mpro\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mfund_daily\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mts_code\u001b[0m \u001b[1;33m=\u001b[0m \u001b[1;34m'510050.SH'\u001b[0m\u001b[1;33m,\u001b[0m\u001b[0mtrade_date\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0mdate\u001b[0m\u001b[1;33m,\u001b[0m\u001b[0masset\u001b[0m\u001b[1;33m=\u001b[0m\u001b[1;34m'FD'\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m 10\u001b[0m \u001b[1;32mif\u001b[0m \u001b[0mi\u001b[0m \u001b[1;33m==\u001b[0m \u001b[1;36m0\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n", 710 | "\u001b[1;31mKeyboardInterrupt\u001b[0m: " 711 | ] 712 | } 713 | ], 714 | "source": [ 715 | "import pandas as pd\n", 716 | "import time\n", 717 | "i = 0\n", 718 | "for date in date_list:\n", 719 | " try:\n", 720 | " pro = ts.pro_api()\n", 721 | " time.sleep(0.75)\n", 722 | " df = pro.fund_daily(ts_code = '510050.SH',trade_date = date,asset='FD')\n", 723 | " if i == 0:\n", 724 | " data = df\n", 725 | " i+=1\n", 726 | " else:\n", 727 | " i+=1\n", 728 | " data = pd.concat([data,df])\n", 729 | " if i%100 == 0:\n", 730 | " print('爬取第{}天数据,数据总长度为:{}'.format(date,len(data)))\n", 731 | " except Exception as err:\n", 732 | " print(err)\n", 733 | " date_list.insert(0,date)\n", 734 | " time.sleep(30)" 735 | ] 736 | }, 737 | { 738 | "cell_type": "code", 739 | "execution_count": 5, 740 | "metadata": { 741 | "ExecuteTime": { 742 | "end_time": "2020-12-15T03:03:44.730317Z", 743 | "start_time": "2020-12-15T03:03:44.674321Z" 744 | } 745 | }, 746 | "outputs": [ 747 | { 748 | "data": { 749 | "text/html": [ 750 | "
\n", 751 | "\n", 764 | "\n", 765 | " \n", 766 | " \n", 767 | " \n", 768 | " \n", 769 | " \n", 770 | " \n", 771 | " \n", 772 | " \n", 773 | " \n", 774 | " \n", 775 | " \n", 776 | " \n", 777 | " \n", 778 | " \n", 779 | " \n", 780 | " \n", 781 | " \n", 782 | " \n", 783 | " \n", 784 | " \n", 785 | " \n", 786 | " \n", 787 | " \n", 788 | " \n", 789 | " \n", 790 | " \n", 791 | " \n", 792 | " \n", 793 | " \n", 794 | " \n", 795 | " \n", 796 | " \n", 797 | " \n", 798 | " \n", 799 | " \n", 800 | " \n", 801 | " \n", 802 | " \n", 803 | " \n", 804 | " \n", 805 | " \n", 806 | " \n", 807 | " \n", 808 | " \n", 809 | " \n", 810 | " \n", 811 | " \n", 812 | " \n", 813 | " \n", 814 | " \n", 815 | " \n", 816 | " \n", 817 | " \n", 818 | " \n", 819 | " \n", 820 | " \n", 821 | " \n", 822 | " \n", 823 | " \n", 824 | " \n", 825 | " \n", 826 | " \n", 827 | " \n", 828 | " \n", 829 | " \n", 830 | " \n", 831 | " \n", 832 | " \n", 833 | " \n", 834 | " \n", 835 | " \n", 836 | " \n", 837 | " \n", 838 | " \n", 839 | " \n", 840 | " \n", 841 | " \n", 842 | " \n", 843 | " \n", 844 | " \n", 845 | " \n", 846 | " \n", 847 | " \n", 848 | " \n", 849 | " \n", 850 | " \n", 851 | " \n", 852 | " \n", 853 | " \n", 854 | " \n", 855 | " \n", 856 | " \n", 857 | " \n", 858 | " \n", 859 | " \n", 860 | " \n", 861 | " \n", 862 | " \n", 863 | " \n", 864 | " \n", 865 | " \n", 866 | " \n", 867 | " \n", 868 | " \n", 869 | " \n", 870 | " \n", 871 | " \n", 872 | " \n", 873 | " \n", 874 | " \n", 875 | " \n", 876 | " \n", 877 | " \n", 878 | " \n", 879 | " \n", 880 | " \n", 881 | " \n", 882 | " \n", 883 | " \n", 884 | " \n", 885 | " \n", 886 | " \n", 887 | " \n", 888 | " \n", 889 | " \n", 890 | " \n", 891 | " \n", 892 | " \n", 893 | " \n", 894 | " \n", 895 | " \n", 896 | " \n", 897 | " \n", 898 | " \n", 899 | " \n", 900 | " \n", 901 | " \n", 902 | " \n", 903 | " \n", 904 | " \n", 905 | " \n", 906 | " \n", 907 | " \n", 908 | " \n", 909 | " \n", 910 | " \n", 911 | " \n", 912 | " \n", 913 | " \n", 914 | " \n", 915 | " \n", 916 | " \n", 917 | " \n", 918 | " \n", 919 | " \n", 920 | " \n", 921 | " \n", 922 | " \n", 923 | " \n", 924 | " \n", 925 | " \n", 926 | " \n", 927 | " \n", 928 | " \n", 929 | " \n", 930 | " \n", 931 | " \n", 932 | " \n", 933 | " \n", 934 | " \n", 935 | " \n", 936 | " \n", 937 | "
ts_codetrade_datepre_closeopenhighlowclosechangepct_chgvolamount
0510050.SH202012153.4613.4583.4713.4373.4640.0030.08673004023.961037206.954
0510050.SH202012143.4293.4353.4663.4303.4610.0320.93323034085.371046907.314
0510050.SH202012113.4563.4693.4783.4033.429-0.027-0.78135406706.551857613.082
0510050.SH202012103.4703.4613.4773.4393.456-0.014-0.40354583334.101586191.032
0510050.SH202012093.4993.5073.5203.4653.470-0.029-0.82885122861.031791501.940
....................................
0510050.SH200503010.8720.8700.8730.8650.867-0.005-0.57342080944.56180573.596
0510050.SH200502280.8800.8780.8790.8700.872-0.008-0.90911879651.93164467.462
0510050.SH200502250.8760.8770.8870.8750.8800.0040.45665064606.95446597.972
0510050.SH200502240.8760.8760.8760.8680.8760.0000.00004516142.23394141.216
0510050.SH200502230.8870.8810.8820.8660.876-0.011-1.240112697425.421111793.167
\n", 938 | "

3848 rows × 11 columns

\n", 939 | "
" 940 | ], 941 | "text/plain": [ 942 | " ts_code trade_date pre_close open high low close change \\\n", 943 | "0 510050.SH 20201215 3.461 3.458 3.471 3.437 3.464 0.003 \n", 944 | "0 510050.SH 20201214 3.429 3.435 3.466 3.430 3.461 0.032 \n", 945 | "0 510050.SH 20201211 3.456 3.469 3.478 3.403 3.429 -0.027 \n", 946 | "0 510050.SH 20201210 3.470 3.461 3.477 3.439 3.456 -0.014 \n", 947 | "0 510050.SH 20201209 3.499 3.507 3.520 3.465 3.470 -0.029 \n", 948 | ".. ... ... ... ... ... ... ... ... \n", 949 | "0 510050.SH 20050301 0.872 0.870 0.873 0.865 0.867 -0.005 \n", 950 | "0 510050.SH 20050228 0.880 0.878 0.879 0.870 0.872 -0.008 \n", 951 | "0 510050.SH 20050225 0.876 0.877 0.887 0.875 0.880 0.004 \n", 952 | "0 510050.SH 20050224 0.876 0.876 0.876 0.868 0.876 0.000 \n", 953 | "0 510050.SH 20050223 0.887 0.881 0.882 0.866 0.876 -0.011 \n", 954 | "\n", 955 | " pct_chg vol amount \n", 956 | "0 0.0867 3004023.96 1037206.954 \n", 957 | "0 0.9332 3034085.37 1046907.314 \n", 958 | "0 -0.7813 5406706.55 1857613.082 \n", 959 | "0 -0.4035 4583334.10 1586191.032 \n", 960 | "0 -0.8288 5122861.03 1791501.940 \n", 961 | ".. ... ... ... \n", 962 | "0 -0.5734 2080944.56 180573.596 \n", 963 | "0 -0.9091 1879651.93 164467.462 \n", 964 | "0 0.4566 5064606.95 446597.972 \n", 965 | "0 0.0000 4516142.23 394141.216 \n", 966 | "0 -1.2401 12697425.42 1111793.167 \n", 967 | "\n", 968 | "[3848 rows x 11 columns]" 969 | ] 970 | }, 971 | "execution_count": 5, 972 | "metadata": {}, 973 | "output_type": "execute_result" 974 | } 975 | ], 976 | "source": [ 977 | "data" 978 | ] 979 | }, 980 | { 981 | "cell_type": "markdown", 982 | "metadata": {}, 983 | "source": [ 984 | "### 给数据增加标签列,1表示涨,0表示跌" 985 | ] 986 | }, 987 | { 988 | "cell_type": "code", 989 | "execution_count": 8, 990 | "metadata": { 991 | "ExecuteTime": { 992 | "end_time": "2020-12-15T03:21:10.809796Z", 993 | "start_time": "2020-12-15T03:21:10.688766Z" 994 | } 995 | }, 996 | "outputs": [], 997 | "source": [ 998 | "data_sort = data.sort_values(['ts_code','trade_date'],ascending=['False','False'])" 999 | ] 1000 | }, 1001 | { 1002 | "cell_type": "code", 1003 | "execution_count": 9, 1004 | "metadata": { 1005 | "ExecuteTime": { 1006 | "end_time": "2020-12-15T03:36:23.040012Z", 1007 | "start_time": "2020-12-15T03:36:23.020012Z" 1008 | } 1009 | }, 1010 | "outputs": [ 1011 | { 1012 | "data": { 1013 | "text/html": [ 1014 | "
\n", 1015 | "\n", 1028 | "\n", 1029 | " \n", 1030 | " \n", 1031 | " \n", 1032 | " \n", 1033 | " \n", 1034 | " \n", 1035 | " \n", 1036 | " \n", 1037 | " \n", 1038 | " \n", 1039 | " \n", 1040 | " \n", 1041 | " \n", 1042 | " \n", 1043 | " \n", 1044 | " \n", 1045 | " \n", 1046 | " \n", 1047 | " \n", 1048 | " \n", 1049 | " \n", 1050 | " \n", 1051 | " \n", 1052 | " \n", 1053 | " \n", 1054 | " \n", 1055 | " \n", 1056 | " \n", 1057 | " \n", 1058 | " \n", 1059 | " \n", 1060 | " \n", 1061 | " \n", 1062 | " \n", 1063 | " \n", 1064 | " \n", 1065 | " \n", 1066 | " \n", 1067 | " \n", 1068 | " \n", 1069 | " \n", 1070 | " \n", 1071 | " \n", 1072 | " \n", 1073 | " \n", 1074 | " \n", 1075 | " \n", 1076 | " \n", 1077 | " \n", 1078 | " \n", 1079 | " \n", 1080 | " \n", 1081 | " \n", 1082 | " \n", 1083 | " \n", 1084 | " \n", 1085 | " \n", 1086 | " \n", 1087 | " \n", 1088 | " \n", 1089 | " \n", 1090 | " \n", 1091 | " \n", 1092 | " \n", 1093 | " \n", 1094 | " \n", 1095 | " \n", 1096 | " \n", 1097 | " \n", 1098 | " \n", 1099 | " \n", 1100 | " \n", 1101 | " \n", 1102 | " \n", 1103 | " \n", 1104 | " \n", 1105 | " \n", 1106 | " \n", 1107 | " \n", 1108 | " \n", 1109 | " \n", 1110 | " \n", 1111 | " \n", 1112 | " \n", 1113 | " \n", 1114 | " \n", 1115 | " \n", 1116 | " \n", 1117 | " \n", 1118 | " \n", 1119 | " \n", 1120 | " \n", 1121 | " \n", 1122 | " \n", 1123 | "
ts_codetrade_datepre_closeopenhighlowclosechangepct_chgvolamountlabel
0510050.SH200502230.8870.8810.8820.8660.876-0.011-1.240112697425.421111793.167False
0510050.SH200502240.8760.8760.8760.8680.8760.0000.00004516142.23394141.216True
0510050.SH200502250.8760.8770.8870.8750.8800.0040.45665064606.95446597.972True
0510050.SH200502280.8800.8780.8790.8700.872-0.008-0.90911879651.93164467.462False
0510050.SH200503010.8720.8700.8730.8650.867-0.005-0.57342080944.56180573.596False
\n", 1124 | "
" 1125 | ], 1126 | "text/plain": [ 1127 | " ts_code trade_date pre_close open high low close change \\\n", 1128 | "0 510050.SH 20050223 0.887 0.881 0.882 0.866 0.876 -0.011 \n", 1129 | "0 510050.SH 20050224 0.876 0.876 0.876 0.868 0.876 0.000 \n", 1130 | "0 510050.SH 20050225 0.876 0.877 0.887 0.875 0.880 0.004 \n", 1131 | "0 510050.SH 20050228 0.880 0.878 0.879 0.870 0.872 -0.008 \n", 1132 | "0 510050.SH 20050301 0.872 0.870 0.873 0.865 0.867 -0.005 \n", 1133 | "\n", 1134 | " pct_chg vol amount label \n", 1135 | "0 -1.2401 12697425.42 1111793.167 False \n", 1136 | "0 0.0000 4516142.23 394141.216 True \n", 1137 | "0 0.4566 5064606.95 446597.972 True \n", 1138 | "0 -0.9091 1879651.93 164467.462 False \n", 1139 | "0 -0.5734 2080944.56 180573.596 False " 1140 | ] 1141 | }, 1142 | "execution_count": 9, 1143 | "metadata": {}, 1144 | "output_type": "execute_result" 1145 | } 1146 | ], 1147 | "source": [ 1148 | "label = data_sort['pre_close']<=data_sort['close']\n", 1149 | "data_sort['label'] = label\n", 1150 | "data_sort.head()" 1151 | ] 1152 | }, 1153 | { 1154 | "cell_type": "code", 1155 | "execution_count": 11, 1156 | "metadata": { 1157 | "ExecuteTime": { 1158 | "end_time": "2020-12-15T03:36:30.911032Z", 1159 | "start_time": "2020-12-15T03:36:28.944011Z" 1160 | } 1161 | }, 1162 | "outputs": [], 1163 | "source": [ 1164 | "data_sort.to_csv('20_year_FD.csv',index = False)" 1165 | ] 1166 | } 1167 | ], 1168 | "metadata": { 1169 | "kernelspec": { 1170 | "display_name": "Python 3", 1171 | "language": "python", 1172 | "name": "python3" 1173 | }, 1174 | "language_info": { 1175 | "codemirror_mode": { 1176 | "name": "ipython", 1177 | "version": 3 1178 | }, 1179 | "file_extension": ".py", 1180 | "mimetype": "text/x-python", 1181 | "name": "python", 1182 | "nbconvert_exporter": "python", 1183 | "pygments_lexer": "ipython3", 1184 | "version": "3.7.9" 1185 | }, 1186 | "varInspector": { 1187 | "cols": { 1188 | "lenName": 16, 1189 | "lenType": 16, 1190 | "lenVar": 40 1191 | }, 1192 | "kernels_config": { 1193 | "python": { 1194 | "delete_cmd_postfix": "", 1195 | "delete_cmd_prefix": "del ", 1196 | "library": "var_list.py", 1197 | "varRefreshCmd": "print(var_dic_list())" 1198 | }, 1199 | "r": { 1200 | "delete_cmd_postfix": ") ", 1201 | "delete_cmd_prefix": "rm(", 1202 | "library": "var_list.r", 1203 | "varRefreshCmd": "cat(var_dic_list()) " 1204 | } 1205 | }, 1206 | "types_to_exclude": [ 1207 | "module", 1208 | "function", 1209 | "builtin_function_or_method", 1210 | "instance", 1211 | "_Feature" 1212 | ], 1213 | "window_display": false 1214 | } 1215 | }, 1216 | "nbformat": 4, 1217 | "nbformat_minor": 4 1218 | } 1219 | --------------------------------------------------------------------------------