├── scrapy_auto
    ├── __init__.py
    ├── service
    │   ├── templates
    │   │   ├── test_movie.html
    │   │   ├── index.html
    │   │   └── show_data.html
    │   ├── static
    │   │   ├── img
    │   │   │   ├── word_cloud.png
    │   │   │   ├── work_count.png
    │   │   │   └── education_percentage.png
    │   │   └── js
    │   │   │   └── index_js2.js
    │   ├── __init__.py
    │   └── service.py
    ├── .DS_Store
    ├── items.pyc
    ├── __init__.pyc
    ├── config.pyc
    ├── settings.pyc
    ├── pipelines.pyc
    ├── middlewares.pyc
    ├── tools
    │   ├── .DS_Store
    │   ├── convers.pyc
    │   ├── __init__.pyc
    │   ├── common_parser.pyc
    │   ├── __pycache__
    │   │   ├── __init__.cpython-37.pyc
    │   │   ├── convers.cpython-37.pyc
    │   │   └── common_parser.cpython-37.pyc
    │   ├── __init__.py
    │   ├── convers.py
    │   ├── common_parser.py
    │   └── data_show.py
    ├── unit_test
    │   ├── demo.jpg
    │   ├── __init__.py
    │   ├── mydemo.py
    │   ├── crawl_crack.py
    │   ├── demo.py
    │   └── httpsProxys.py
    ├── spiders
    │   ├── __init__.pyc
    │   ├── article_spiders.pyc
    │   ├── employ_spiders.pyc
    │   ├── media_spiders.pyc
    │   ├── __pycache__
    │   │   ├── __init__.cpython-37.pyc
    │   │   ├── demo_spider.cpython-37.pyc
    │   │   ├── SearchSpiders.cpython-37.pyc
    │   │   ├── employ_spiders.cpython-37.pyc
    │   │   ├── media_spiders.cpython-37.pyc
    │   │   ├── FreeProxySpider.cpython-37.pyc
    │   │   ├── article_spiders.cpython-37.pyc
    │   │   └── company_kandian_spiders.cpython-37.pyc
    │   ├── __init__.py
    │   ├── demo_spider.py
    │   ├── bili_spider.py
    │   ├── FreeProxySpider.py
    │   ├── SearchSpiders.py
    │   ├── media_spiders.py
    │   ├── employ_spiders.py
    │   ├── company_kandian_spiders.py
    │   └── article_spiders.py
    ├── __pycache__
    │   ├── items.cpython-37.pyc
    │   ├── config.cpython-37.pyc
    │   ├── __init__.cpython-37.pyc
    │   ├── pipelines.cpython-37.pyc
    │   └── settings.cpython-37.pyc
    ├── config.py
    ├── items.py
    ├── settings.py
    ├── pipelines.py
    └── middlewares.py
├── .DS_Store
├── .gitattributes
├── .idea
    ├── vcs.xml
    ├── encodings.xml
    ├── modules.xml
    ├── misc.xml
    ├── deployment.xml
    ├── webServers.xml
    ├── scrapy_pro.iml
    ├── codeStyles
    │   └── Project.xml
    └── dbnavigator.xml
├── proxy_list.json
├── scrapy.cfg
├── begin.py
├── requirements.txt
└── README.md


/scrapy_auto/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/scrapy_auto/service/templates/test_movie.html:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/.DS_Store:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/.DS_Store


--------------------------------------------------------------------------------
/scrapy_auto/.DS_Store:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/.DS_Store


--------------------------------------------------------------------------------
/scrapy_auto/items.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/items.pyc


--------------------------------------------------------------------------------
/scrapy_auto/__init__.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/__init__.pyc


--------------------------------------------------------------------------------
/scrapy_auto/config.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/config.pyc


--------------------------------------------------------------------------------
/scrapy_auto/settings.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/settings.pyc


--------------------------------------------------------------------------------
/scrapy_auto/pipelines.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/pipelines.pyc


--------------------------------------------------------------------------------
/scrapy_auto/middlewares.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/middlewares.pyc


--------------------------------------------------------------------------------
/scrapy_auto/tools/.DS_Store:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/tools/.DS_Store


--------------------------------------------------------------------------------
/scrapy_auto/tools/convers.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/tools/convers.pyc


--------------------------------------------------------------------------------
/scrapy_auto/tools/__init__.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/tools/__init__.pyc


--------------------------------------------------------------------------------
/scrapy_auto/unit_test/demo.jpg:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/unit_test/demo.jpg


--------------------------------------------------------------------------------
/.gitattributes:
--------------------------------------------------------------------------------
1 | *.js linguist-language=python
2 | *.css linguist-language=python
3 | *.html linguist-language=python
4 | 


--------------------------------------------------------------------------------
/scrapy_auto/spiders/__init__.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/spiders/__init__.pyc


--------------------------------------------------------------------------------
/scrapy_auto/tools/common_parser.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/tools/common_parser.pyc


--------------------------------------------------------------------------------
/scrapy_auto/spiders/article_spiders.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/spiders/article_spiders.pyc


--------------------------------------------------------------------------------
/scrapy_auto/spiders/employ_spiders.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/spiders/employ_spiders.pyc


--------------------------------------------------------------------------------
/scrapy_auto/spiders/media_spiders.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/spiders/media_spiders.pyc


--------------------------------------------------------------------------------
/scrapy_auto/__pycache__/items.cpython-37.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/__pycache__/items.cpython-37.pyc


--------------------------------------------------------------------------------
/scrapy_auto/__pycache__/config.cpython-37.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/__pycache__/config.cpython-37.pyc


--------------------------------------------------------------------------------
/scrapy_auto/service/static/img/word_cloud.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/service/static/img/word_cloud.png


--------------------------------------------------------------------------------
/scrapy_auto/service/static/img/work_count.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/service/static/img/work_count.png


--------------------------------------------------------------------------------
/scrapy_auto/__pycache__/__init__.cpython-37.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/__pycache__/__init__.cpython-37.pyc


--------------------------------------------------------------------------------
/scrapy_auto/__pycache__/pipelines.cpython-37.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/__pycache__/pipelines.cpython-37.pyc


--------------------------------------------------------------------------------
/scrapy_auto/__pycache__/settings.cpython-37.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/__pycache__/settings.cpython-37.pyc


--------------------------------------------------------------------------------
/scrapy_auto/tools/__pycache__/__init__.cpython-37.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/tools/__pycache__/__init__.cpython-37.pyc


--------------------------------------------------------------------------------
/scrapy_auto/tools/__pycache__/convers.cpython-37.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/tools/__pycache__/convers.cpython-37.pyc


--------------------------------------------------------------------------------
/scrapy_auto/service/static/img/education_percentage.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/service/static/img/education_percentage.png


--------------------------------------------------------------------------------
/scrapy_auto/spiders/__pycache__/__init__.cpython-37.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/spiders/__pycache__/__init__.cpython-37.pyc


--------------------------------------------------------------------------------
/scrapy_auto/spiders/__pycache__/demo_spider.cpython-37.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/spiders/__pycache__/demo_spider.cpython-37.pyc


--------------------------------------------------------------------------------
/scrapy_auto/tools/__pycache__/common_parser.cpython-37.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/tools/__pycache__/common_parser.cpython-37.pyc


--------------------------------------------------------------------------------
/scrapy_auto/spiders/__pycache__/SearchSpiders.cpython-37.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/spiders/__pycache__/SearchSpiders.cpython-37.pyc


--------------------------------------------------------------------------------
/scrapy_auto/spiders/__pycache__/employ_spiders.cpython-37.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/spiders/__pycache__/employ_spiders.cpython-37.pyc


--------------------------------------------------------------------------------
/scrapy_auto/spiders/__pycache__/media_spiders.cpython-37.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/spiders/__pycache__/media_spiders.cpython-37.pyc


--------------------------------------------------------------------------------
/scrapy_auto/spiders/__pycache__/FreeProxySpider.cpython-37.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/spiders/__pycache__/FreeProxySpider.cpython-37.pyc


--------------------------------------------------------------------------------
/scrapy_auto/spiders/__pycache__/article_spiders.cpython-37.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/spiders/__pycache__/article_spiders.cpython-37.pyc


--------------------------------------------------------------------------------
/scrapy_auto/spiders/__pycache__/company_kandian_spiders.cpython-37.pyc:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/yangge11/scrapy_pro/HEAD/scrapy_auto/spiders/__pycache__/company_kandian_spiders.cpython-37.pyc


--------------------------------------------------------------------------------
/scrapy_auto/spiders/__init__.py:
--------------------------------------------------------------------------------
1 | # This package will contain the spiders of your Scrapy project
2 | #
3 | # Please refer to the documentation for information on how to create and manage
4 | # your spiders.
5 | 


--------------------------------------------------------------------------------
/.idea/vcs.xml:
--------------------------------------------------------------------------------
1 | <?xml version="1.0" encoding="UTF-8"?>
2 | <project version="4">
3 |   <component name="VcsDirectoryMappings">
4 |     <mapping directory="$PROJECT_DIR$" vcs="Git" />
5 |   </component>
6 | </project>


--------------------------------------------------------------------------------
/.idea/encodings.xml:
--------------------------------------------------------------------------------
1 | <?xml version="1.0" encoding="UTF-8"?>
2 | <project version="4">
3 |   <component name="Encoding" addBOMForNewFiles="with NO BOM">
4 |     <file url="PROJECT" charset="UTF-8" />
5 |   </component>
6 | </project>


--------------------------------------------------------------------------------
/scrapy_auto/service/__init__.py:
--------------------------------------------------------------------------------
1 | #!/usr/bin/python
2 | # coding=utf8
3 | # Copyright 2017 SARRS Inc. All Rights Reserved.
4 | 
5 | # @Time    : 2019/3/20 14:49
6 | # @Author  : 504747754@qq.com(ZengYang)
7 | # @File    : __init__.py.py
8 | # @Software: PyCharm
9 | # @ToUse  :


--------------------------------------------------------------------------------
/scrapy_auto/tools/__init__.py:
--------------------------------------------------------------------------------
1 | #!/usr/bin/python
2 | # coding=utf8
3 | # Copyright 2017 SARRS Inc. All Rights Reserved.
4 | 
5 | # @Time    : 2019/1/24 16:37
6 | # @Author  : zengyang@tv365.net(ZengYang)
7 | # @File    : __init__.py.py
8 | # @Software: PyCharm
9 | # @ToUse  : 


--------------------------------------------------------------------------------
/scrapy_auto/unit_test/__init__.py:
--------------------------------------------------------------------------------
1 | #!/usr/bin/python
2 | # coding=utf8
3 | # Copyright 2017 SARRS Inc. All Rights Reserved.
4 | 
5 | # @Time    : 2019/2/20 17:23
6 | # @Author  : zengyang@tv365.net(ZengYang)
7 | # @File    : __init__.py.py
8 | # @Software: PyCharm
9 | # @ToUse  : 


--------------------------------------------------------------------------------
/proxy_list.json:
--------------------------------------------------------------------------------
1 | [
2 | {"proxy_scheme": "http", "proxy": "http://218.91.112.250:9999"},
3 | {"proxy_scheme": "https", "proxy": "https://116.209.56.111:9999"},
4 | {"proxy_scheme": "http", "proxy": "http://42.51.42.201:808"},
5 | {"proxy_scheme": "https", "proxy": "https://222.135.92.68:38094"}
6 | ]


--------------------------------------------------------------------------------
/.idea/modules.xml:
--------------------------------------------------------------------------------
1 | <?xml version="1.0" encoding="UTF-8"?>
2 | <project version="4">
3 |   <component name="ProjectModuleManager">
4 |     <modules>
5 |       <module fileurl="file://$PROJECT_DIR$/.idea/scrapy_pro.iml" filepath="$PROJECT_DIR$/.idea/scrapy_pro.iml" />
6 |     </modules>
7 |   </component>
8 | </project>


--------------------------------------------------------------------------------
/scrapy.cfg:
--------------------------------------------------------------------------------
 1 | # Automatically created by: scrapy startproject
 2 | #
 3 | # For more information about the [deploy] section see:
 4 | # https://scrapyd.readthedocs.io/en/latest/deploy.html
 5 | 
 6 | [settings]
 7 | default = scrapy_auto.settings
 8 | 
 9 | [deploy]
10 | #url = http://localhost:6800/
11 | project = scrapy_auto
12 | 


--------------------------------------------------------------------------------
/.idea/misc.xml:
--------------------------------------------------------------------------------
 1 | <?xml version="1.0" encoding="UTF-8"?>
 2 | <project version="4">
 3 |   <component name="ProjectRootManager" version="2" project-jdk-name="Python 3.7" project-jdk-type="Python SDK" />
 4 |   <component name="PyCharmProfessionalAdvertiser">
 5 |     <option name="shown" value="true" />
 6 |   </component>
 7 |   <component name="PyPackaging">
 8 |     <option name="earlyReleasesAsUpgrades" value="true" />
 9 |   </component>
10 | </project>


--------------------------------------------------------------------------------
/.idea/deployment.xml:
--------------------------------------------------------------------------------
 1 | <?xml version="1.0" encoding="UTF-8"?>
 2 | <project version="4">
 3 |   <component name="PublishConfigData" serverName="my_server">
 4 |     <serverData>
 5 |       <paths name="my_server">
 6 |         <serverdata>
 7 |           <mappings>
 8 |             <mapping deploy="/code/scrapy_pro" local="$PROJECT_DIR$" web="/" />
 9 |           </mappings>
10 |         </serverdata>
11 |       </paths>
12 |     </serverData>
13 |   </component>
14 | </project>


--------------------------------------------------------------------------------
/.idea/webServers.xml:
--------------------------------------------------------------------------------
 1 | <?xml version="1.0" encoding="UTF-8"?>
 2 | <project version="4">
 3 |   <component name="WebServers">
 4 |     <option name="servers">
 5 |       <webServer id="a60e6441-e6ec-4bf0-887c-63a6ca80e43c" name="my_server" url="http://47.105.142.45">
 6 |         <fileTransfer host="47.105.142.45" port="22" accessType="SFTP">
 7 |           <advancedOptions>
 8 |             <advancedOptions dataProtectionLevel="Private" />
 9 |           </advancedOptions>
10 |           <option name="port" value="22" />
11 |         </fileTransfer>
12 |       </webServer>
13 |     </option>
14 |   </component>
15 | </project>


--------------------------------------------------------------------------------
/.idea/scrapy_pro.iml:
--------------------------------------------------------------------------------
 1 | <?xml version="1.0" encoding="UTF-8"?>
 2 | <module type="PYTHON_MODULE" version="4">
 3 |   <component name="NewModuleRootManager">
 4 |     <content url="file://$MODULE_DIR$">
 5 |       <excludeFolder url="file://$MODULE_DIR$/venv" />
 6 |     </content>
 7 |     <orderEntry type="jdk" jdkName="Python 3.7" jdkType="Python SDK" />
 8 |     <orderEntry type="sourceFolder" forTests="false" />
 9 |   </component>
10 |   <component name="TestRunnerService">
11 |     <option name="projectConfiguration" value="Twisted Trial" />
12 |     <option name="PROJECT_TEST_RUNNER" value="Twisted Trial" />
13 |   </component>
14 | </module>


--------------------------------------------------------------------------------
/scrapy_auto/service/templates/index.html:
--------------------------------------------------------------------------------
 1 | <!DOCTYPE html>
 2 | <html>
 3 | <head>
 4 |     <meta charset="UTF-8">
 5 |     <title>Echarts</title>
 6 |     <script type="text/javascript" src="../static/js/index_js1.js">
 7 | 
 8 |     </script>
 9 |     <script type="text/javascript" src="../static/js/index_js2.js">
10 | 
11 |     </script>
12 | </head>
13 | <body>
14 | <a href="show_data"><h2>其他数据图</h2></a>
15 | <p>背景：统计不同岗位在全国城市的分布情况</br>目前进度：暂时只做了所有岗位的统计</p>
16 | <div id="57b006d34e02407cbe7dadc9db28c01d" style="width:1920px;height:1080px;"></div>
17 | <script type="text/javascript" src="../static/js/index_js3.js"></script>
18 | </body>
19 | </html>
20 | 


--------------------------------------------------------------------------------
/scrapy_auto/service/templates/show_data.html:
--------------------------------------------------------------------------------
 1 | <!DOCTYPE html>
 2 | <html lang="en">
 3 | <head>
 4 |     <meta charset="UTF-8">
 5 |     <title>Title</title>
 6 | </head>
 7 | <body>
 8 | <h2>数据来源：boss直聘官网</h2><br/>
 9 | <p>免责声明：本项目纯粹技术探索，如有数据侵权，请联系<504747754@qq.com>下架<br/>时间有限，目前项目暂停于此，后续有空会更新</p>
10 | <p>学历分布图</br>背景：统计不同岗位的学历需求分布</br>目前进度：暂时只做了所有岗位的统计</p>
11 | <img src="../static/img/education_percentage.png">
12 | <br/>
13 | <p>技能词云图(案例图)</br>背景：统计不同岗位所需要技能的关键词排名</br>目前进度：暂时只做了python岗位</p>
14 | <img src="../static/img/word_cloud.png" align="center">
15 | <br/>
16 | <p>岗位-数量图</br>背景：统计不同岗位的需求全国数量</br>目前进度：数据未全部录入，暂时只做了部分</p>
17 | <img src="../static/img/work_count.png">
18 | <br/>
19 | <ul>以下功能待做：
20 |     <li>每个岗位的薪资分布情况</li>
21 |     <li>每个岗位的福利待遇情况</li>
22 | </ul>
23 | </body>
24 | </html>


--------------------------------------------------------------------------------
/scrapy_auto/service/service.py:
--------------------------------------------------------------------------------
 1 | #!/usr/bin/python
 2 | # coding=utf8
 3 | # Copyright 2017 SARRS Inc. All Rights Reserved.
 4 | 
 5 | # @Time    : 2019/3/20 14:49
 6 | # @Author  : 504747754@qq.com(ZengYang)
 7 | # @File    : service.py
 8 | # @Software: PyCharm
 9 | # @ToUse  : 数据可视化service
10 | from flask import Flask, render_template
11 | 
12 | app = Flask(__name__)
13 | 
14 | 
15 | @app.route('/', methods=["GET"])
16 | def index():
17 |     return render_template('index.html')
18 | 
19 | 
20 | @app.route("/show_data")
21 | def education():
22 |     return render_template('show_data.html')
23 | 
24 | 
25 | @app.route("/test_movie")
26 | def test_movie():
27 |     return render_template('test_movie.html')
28 | 
29 | 
30 | if __name__ == '__main__':
31 |     app.run(host='0.0.0.0', port=1080, debug=True)
32 | 


--------------------------------------------------------------------------------
/begin.py:
--------------------------------------------------------------------------------
 1 | #!/usr/bin/python
 2 | # coding=utf8
 3 | # Copyright 2017 SARRS Inc. All Rights Reserved.
 4 | 
 5 | # @Time    : 2019/3/19 23:39
 6 | # @Author  : 504747754@qq.com(ZengYang)
 7 | # @File    : begin.py
 8 | # @Software: PyCharm
 9 | # @ToUse  :
10 | 
11 | 
12 | from scrapy import cmdline
13 | 
14 | # cmdline.execute("scrapy crawl boss_spider".split())
15 | # cmdline.execute("scrapy crawl xici_spider -o proxy_list.json".split())
16 | # cmdline.execute("scrapy crawl demo_spider".split())
17 | # cmdline.execute("scrapy crawl toutiao_add_spider -o items.json".split())
18 | # cmdline.execute("scrapy crawl toutiao_all_spider -o items.json".split())
19 | # cmdline.execute("scrapy crawl lanzhou_spider -o items.json".split())
20 | cmdline.execute("scrapy crawl bili_spider".split())
21 | 
22 | 
23 | 
24 | 
25 | 
26 | 
27 | 


--------------------------------------------------------------------------------
/scrapy_auto/unit_test/mydemo.py:
--------------------------------------------------------------------------------
 1 | #!/usr/bin/python
 2 | # coding=utf8
 3 | # Copyright 2017 SARRS Inc. All Rights Reserved.
 4 | 
 5 | import matplotlib.pyplot as plt
 6 | 
 7 | plt.rcParams['font.sans-serif'] = ['FangSong']
 8 | plt.rcParams['axes.unicode_minus'] = False
 9 | # 设置图片大小
10 | label = '超载', '船员责任心不强', '船员驾驶技术太差', '通航环境差', '海事、港航监管不到位', '船舶过于老旧', '冒险航行'  # 各类别标签
11 | color = 'red', 'orange', 'yellow', 'green', 'blue', 'gray', 'goldenrod'  # 各类别颜色
12 | size = [34, 5, 6, 14, 1, 10, 23]  # 各类别占比
13 | explode = (0.2, 0, 0, 0, 0, 0, 0, 0)  # 各类别的偏移半径
14 | 
15 | pie = plt.pie(size, colors=color, explode=explode, labels=label, shadow=True, autopct='%1.1f%%')
16 | # for digit in pie[2]:
17 | #     digit.set_size(8)
18 | 
19 | plt.axis('equal')
20 | plt.title('你认为砂石船发生事故的主要原因在于', fontsize=12)
21 | 
22 | plt.legend(loc=0, bbox_to_anchor=(0.82, 1))  # 图例
23 | # 设置legend的字体大小
24 | leg = plt.gca().get_legend()
25 | ltext = leg.get_texts()
26 | plt.setp(ltext, fontsize=6)
27 | plt.show()
28 | pass
29 | 


--------------------------------------------------------------------------------
/scrapy_auto/spiders/demo_spider.py:
--------------------------------------------------------------------------------
 1 | #!/usr/bin/python
 2 | # coding=utf8
 3 | # Copyright 2017 SARRS Inc. All Rights Reserved.
 4 | 
 5 | # @Time    : 2019/1/23 18:44
 6 | # @Author  : zengyang@tv365.net(ZengYang)
 7 | # @File    : demo_spider.py
 8 | # @Software: PyCharm
 9 | # @ToUse  :
10 | import scrapy
11 | from scrapy import Request
12 | 
13 | from scrapy_auto.items import JobItem
14 | 
15 | 
16 | class Demo1(scrapy.Spider):
17 |     """
18 |     测试spider的各种操作
19 |     """
20 |     name = 'demo_spider'
21 |     start_urls = [
22 |         'https://www.baidu.com/'
23 |     ]
24 |     custom_settings = {
25 |         'CONCURRENT_REQUESTS': 50,
26 |         'DOWNLOAD_DELAY': 0.1,
27 |     }
28 | 
29 |     def parse(self, response):
30 |         yield Request(url='https://www.baidu.com/', callback=self.demo_item)
31 | 
32 |     def demo_item(self, response):
33 |         while True:
34 |             item = JobItem()
35 |             for filed in list(item.fields.keys()):
36 |                 item[filed] = 'demo'
37 |             yield item
38 |         pass
39 | 


--------------------------------------------------------------------------------
/scrapy_auto/config.py:
--------------------------------------------------------------------------------
 1 | #!/usr/bin/python
 2 | # coding=utf8
 3 | # Copyright 2017 SARRS Inc. All Rights Reserved.
 4 | 
 5 | # @Time    : 2019/1/28 15:04
 6 | # @Author  : zengyang@tv365.net(ZengYang)
 7 | # @File    : config.py
 8 | # @Software: PyCharm
 9 | # @ToUse  :
10 | 
11 | 
12 | parser_config = {
13 |     'all_spider': {
14 |         'title': '//title/text()',
15 |         'descr': '//meta[@name="description"]/text()|//meta[@name="Description"]/text()',
16 |         'keywords': '//meta[@name="keywords"]/text()|//meta[@name="Keywords"]/text()',
17 |     },
18 |     'cnys_spider': {
19 |         'content_original': '//div[@class="reads"]',
20 |     },
21 |     'w39_spider': {
22 |         'content_original': '//div[@class="art_con"]',
23 |     },
24 |     'verywellhealth_spider': {
25 |         'content_original': '//div[@class="loc chop-content "]|//div[@class="comp right-rail__offset taxonomy article-content expert-content"]',
26 |         # 'loc content l-main'，//article
27 |     },
28 |     'health_spider': {
29 |         'content_original': '//div[@class="article-content-container two-col-content-container"]',
30 |     },
31 |     'wsj_spider': {
32 |         'content_original': '//div[@class="wsj-snippet-body"]',
33 |     },
34 | }
35 | 


--------------------------------------------------------------------------------
/.idea/codeStyles/Project.xml:
--------------------------------------------------------------------------------
 1 | <component name="ProjectCodeStyleConfiguration">
 2 |   <code_scheme name="Project" version="173">
 3 |     <DBN-PSQL>
 4 |       <case-options enabled="true">
 5 |         <option name="KEYWORD_CASE" value="lower" />
 6 |         <option name="FUNCTION_CASE" value="lower" />
 7 |         <option name="PARAMETER_CASE" value="lower" />
 8 |         <option name="DATATYPE_CASE" value="lower" />
 9 |         <option name="OBJECT_CASE" value="preserve" />
10 |       </case-options>
11 |       <formatting-settings enabled="false" />
12 |     </DBN-PSQL>
13 |     <DBN-SQL>
14 |       <case-options enabled="true">
15 |         <option name="KEYWORD_CASE" value="lower" />
16 |         <option name="FUNCTION_CASE" value="lower" />
17 |         <option name="PARAMETER_CASE" value="lower" />
18 |         <option name="DATATYPE_CASE" value="lower" />
19 |         <option name="OBJECT_CASE" value="preserve" />
20 |       </case-options>
21 |       <formatting-settings enabled="false">
22 |         <option name="STATEMENT_SPACING" value="one_line" />
23 |         <option name="CLAUSE_CHOP_DOWN" value="chop_down_if_statement_long" />
24 |         <option name="ITERATION_ELEMENTS_WRAPPING" value="chop_down_if_not_single" />
25 |       </formatting-settings>
26 |     </DBN-SQL>
27 |   </code_scheme>
28 | </component>


--------------------------------------------------------------------------------
/scrapy_auto/tools/convers.py:
--------------------------------------------------------------------------------
 1 | #!/usr/bin/python
 2 | # coding=utf8
 3 | # Copyright 2017 SARRS Inc. All Rights Reserved.
 4 | 
 5 | # @Time    : 2019/3/25 18:37
 6 | # @Author  : 504747754@qq.com(ZengYang)
 7 | # @File    : convers.py
 8 | # @Software: PyCharm
 9 | # @ToUse  :
10 | import json
11 | import traceback
12 | 
13 | 
14 | def from_string_to_json(content):
15 |     json_dict = {}
16 |     try:
17 |         json_dict = json.loads(content)
18 |         json_dict = normalize_dict(json_dict)
19 |     except Exception as e:
20 |         traceback.print_exc()
21 |     return json_dict
22 | 
23 | 
24 | def from_json_to_string(data):
25 |     data = normalize_dict(data)
26 |     return json.dumps(data, ensure_ascii=False)
27 | 
28 | 
29 | def normalize_dict(data):
30 |     if type(data) == dict:
31 |         new_data = {}
32 |         for k in data:
33 |             data[k] = normalize_dict(data[k])
34 |             if type(k) == str:
35 |                 new_data[k.encode('utf-8')] = data[k]
36 |             else:
37 |                 new_data[k] = data[k]
38 |         data = new_data
39 |     elif type(data) == list:
40 |         for i in range(0, len(data)):
41 |             data[i] = normalize_dict(data[i])
42 |     elif type(data) == str:
43 |         data = data.encode('utf-8')
44 |     else:
45 |         data = str(data)
46 |     return data
47 | 


--------------------------------------------------------------------------------
/requirements.txt:
--------------------------------------------------------------------------------
 1 | asn1crypto==0.24.0
 2 | attrs==19.1.0
 3 | Automat==0.7.0
 4 | beautifulsoup4==4.7.1
 5 | bs4==0.0.1
 6 | certifi==2019.3.9
 7 | cffi==1.12.2
 8 | chardet==3.0.4
 9 | Click==7.0
10 | constantly==15.1.0
11 | cryptography==2.6.1
12 | cssselect==1.0.3
13 | cycler==0.10.0
14 | Django==2.1.4
15 | dukpy==0.2.2
16 | echarts-china-cities-pypkg==0.0.9
17 | echarts-china-provinces-pypkg==0.0.3
18 | echarts-countries-pypkg==0.1.6
19 | et-xmlfile==1.0.1
20 | Flask==1.0.2
21 | future==0.17.1
22 | hyperlink==18.0.0
23 | idna==2.8
24 | incremental==17.5.0
25 | itsdangerous==1.1.0
26 | javascripthon==0.10
27 | jdcal==1.4.1
28 | jieba==0.39
29 | Jinja2==2.10
30 | jupyter-echarts-pypkg==0.1.2
31 | kiwisolver==1.0.1
32 | lml==0.0.2
33 | lxml==4.3.3
34 | macropy3==1.1.0b2
35 | MarkupSafe==1.1.1
36 | matplotlib==3.0.3
37 | numpy==1.16.2
38 | openpyxl==3.0.2
39 | pandas==0.24.2
40 | parsel==1.5.1
41 | Pillow==6.0.0
42 | pyasn1==0.4.5
43 | pyasn1-modules==0.2.4
44 | pycparser==2.19
45 | PyDispatcher==2.0.5
46 | pyecharts==0.5.11
47 | pyecharts-javascripthon==0.0.6
48 | pyecharts-jupyter-installer==0.0.3
49 | PyHamcrest==1.9.0
50 | pymongo==3.7.2
51 | PyMySQL==0.9.3
52 | pyOpenSSL==19.0.0
53 | pyparsing==2.3.1
54 | pypiwin32==223
55 | python-dateutil==2.8.0
56 | pytz==2019.1
57 | pywin32==224
58 | queuelib==1.5.0
59 | readability==0.3.1
60 | requests==2.22.0
61 | Scrapy==1.6.0
62 | selenium==3.141.0
63 | service-identity==18.1.0
64 | sh==1.12.14
65 | simplejson==3.16.0
66 | six==1.12.0
67 | soupsieve==1.9
68 | sqlparse==0.3.0
69 | tushare==1.2.35
70 | Twisted==18.9.0
71 | urllib3==1.24.1
72 | w3lib==1.20.0
73 | Werkzeug==0.15.2
74 | zope.interface==4.6.0
75 | 


--------------------------------------------------------------------------------
/scrapy_auto/spiders/bili_spider.py:
--------------------------------------------------------------------------------
 1 | # @Time : 2019/12/19 8:51 PM
 2 | # @Author : 504747754@qq.com(ZengYang)
 3 | # @File : bili_spider.py
 4 | # @Software : PyCharm
 5 | # @ToUse  :
 6 | import json
 7 | import re
 8 | 
 9 | from scrapy import Request
10 | from scrapy.spiders import CrawlSpider
11 | 
12 | # 1.了解爬虫执行原理 2.了解爬虫脚本 3.了解爬虫的框架 4.了解各种反爬
13 | from scrapy_auto.items import BiliItem
14 | 
15 | 
16 | class BiliSpider(CrawlSpider):
17 |     """
18 |     需求：采集b站番剧索引的151页的数据
19 |     """
20 |     name = 'bili_spider'
21 |     url = 'https://api.bilibili.com/pgc/season/index/result?season_version=-1&area=-1&is_finish=-1&copyright=-1&season_status=-1&season_month=-1&year=-1&style_id=-1&order=3&st=1&sort=0&page={page}&season_type=1&pagesize=20&type=1'
22 |     custom_settings = {  # 每一个爬虫的自定义配置，settins.py是全局配置
23 |         'ITEM_PIPELINES': {  # 管道，控制你输出数据的方式，数值越小，优先级越高
24 |             'scrapy_auto.pipelines.ExcelBiliPipeline': 10,
25 |         },
26 |     }
27 | 
28 |     def start_requests(self):
29 |         for pg in range(1, 2):
30 |             yield Request(url=self.url.format(page=pg))
31 | 
32 |     def parse(self, response):
33 |         item_list = json.loads(response.text)['data']['list']
34 |         for item1 in item_list:
35 |             item = BiliItem()
36 |             item['is_vip'] = 1 if item1['badge'] else 0
37 |             item['thumb'] = item1['cover']
38 |             item['episode'] = re.findall('\d+', item1['index_show'])[0]
39 |             item['is_finish'] = item1['is_finish']
40 |             item['link_detail'] = item1['link']
41 |             item['fans_info'] = item1['order']
42 |             item['title'] = item1['title']
43 |             yield item
44 |         pass
45 | 


--------------------------------------------------------------------------------
/scrapy_auto/spiders/FreeProxySpider.py:
--------------------------------------------------------------------------------
 1 | #!/usr/bin/python
 2 | # coding=utf8
 3 | # Copyright 2017 SARRS Inc. All Rights Reserved.
 4 | 
 5 | # @Time    : 2019/4/1 20:40
 6 | # @Author  : 504747754@qq.com(ZengYang)
 7 | # @File    : FreeProxySpider.py
 8 | # @Software: PyCharm
 9 | # @ToUse  : 抓取免费代理站点的代理
10 | 
11 | """
12 | 1.抓取代理
13 | 2.验证代理
14 | 3.存储备用
15 | """
16 | 
17 | import scrapy
18 | from scrapy import Request
19 | from scrapy.exporters import JsonItemExporter
20 | 
21 | 
22 | class XiCiSpider(scrapy.Spider):
23 |     name = 'xici_spider'
24 |     allowed_domains = ['www.xicidaili.com']
25 |     start_urls = [
26 |         'https://www.xicidaili.com/nn'
27 |     ]
28 |     custom_settings = {
29 |         'ITEM_PIPELINES': {
30 |         },
31 | 
32 |     }
33 | 
34 |     def parse(self, response):
35 |         for sel in response.xpath('//table[@id="ip_list"]/tr[position()>1]'):
36 |             ip = sel.css('td:nth-child(2)::text').extract_first().encode('utf-8')
37 |             port = sel.css('td:nth-child(3)::text').extract_first().encode('utf-8')
38 |             scheme = sel.css('td:nth-child(6)::text').extract_first().lower().encode('utf-8')
39 |             proxy = '%s://%s:%s' % (scheme, ip, port)
40 |             meta = {
41 |                 'proxy': proxy, 'dont_retry': True, 'download_timeout': 10, '_proxy_scheme': scheme, '_proxy_ip': ip,
42 |             }
43 |             yield Request(url='%s://httpbin.org/ip' % scheme, callback=self.check_available, dont_filter=True,
44 |                           meta=meta)
45 | 
46 |     def check_available(self, response):
47 |         proxy_ip = response.meta['_proxy_ip']
48 |         if proxy_ip in response.text:
49 |             yield {'proxy_scheme': response.meta['_proxy_scheme'], 'proxy': response.meta['proxy'], }
50 | 


--------------------------------------------------------------------------------
/scrapy_auto/unit_test/crawl_crack.py:
--------------------------------------------------------------------------------
 1 | #!/usr/bin/python
 2 | # coding=utf8
 3 | # Copyright 2017 SARRS Inc. All Rights Reserved.
 4 | 
 5 | # @Time    : 2019/2/20 17:24
 6 | # @Author  : zengyang@tv365.net(ZengYang)
 7 | # @File    : crawl_crack.py
 8 | # @Software: PyCharm
 9 | # @ToUse  : 各种爬虫的反爬处理
10 | 
11 | 
12 | # 滑块验证码处理
13 | import time
14 | import traceback
15 | 
16 | from selenium.webdriver import ActionChains
17 | 
18 | 
19 | def move_slider(driver):
20 |     while True:
21 |         try:
22 |             # 定位滑块元素
23 |             slider = driver.find_element_by_xpath("//span[@id='nc_1_n1z']")
24 |             track = get_track()
25 |             move_to_gap(driver, slider, track)
26 |             # 查看是否认证成功，获取text值
27 |             while True:
28 |                 try:
29 |                     text = driver.find_element_by_xpath("//span[@class='nc-lang-cnt']")
30 |                     break
31 |                 except:
32 |                     traceback.print_exc()
33 |                     continue
34 |             # 目前只碰到3种情况：成功（请在在下方输入验证码,请点击图）；无响应（请按住滑块拖动)；失败（哎呀，失败了，请刷新）
35 |             if text.text.startswith('验证通过'):
36 |                 break
37 |             elif text.text.startswith('哎呀，出错了，点击刷新再来一次'):
38 |                 driver.find_element_by_xpath("//span[@class='nc-lang-cnt']/a").click()
39 |                 pass
40 |         except Exception as e:
41 |             traceback.print_exc()
42 |             time.sleep(5)
43 | 
44 | 
45 | def get_track(distance=200):
46 |     track = []
47 |     current = 0
48 |     mid = distance * 3 / 4
49 |     t = 0.2
50 |     t = 0.9
51 |     v = 0
52 |     while current < distance:
53 |         if current < mid:
54 |             a = 2
55 |         else:
56 |             a = -3
57 |         v0 = v
58 |         v = v0 + a * t
59 |         move = v0 * t + 1 / 2 * a * t * t
60 |         current += move
61 |         track.append(round(move))
62 |     return track
63 | 
64 | 
65 | def move_to_gap(driver, slider, track):
66 |     try:
67 |         ActionChains(driver).click_and_hold(slider).perform()
68 |         for x in track:
69 |             ActionChains(driver).move_by_offset(xoffset=x, yoffset=0).perform()
70 |         time.sleep(0.1)
71 |         ActionChains(driver).release().perform()
72 |     except:
73 |         traceback.print_exc()
74 | 


--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
 1 | # scrapy_pro
 2 | 
 3 | #### 项目背景   
 4 | 做了挺久爬虫开发，接过各种各样的站点爬虫处理，过程中也遇到过各种各样的问题；
 5 | 偶尔会逛逛社区和群，依旧会看到各种各样的小白在上面问些简单问题，却陷入无人回答的尴尬境地，原因有两种：
 6 | 1. 问问题不懂怎么问，导致有些大咖看到了不知道咋回你
 7 | 2. 问题问的还可以，但是毕竟大家都忙，有时候想回你，但是手上有事，等到没事了，也忘了
 8 | 所以，我希望这个项目，能涉及到爬虫里面的各个技术点（详见技术点），让大家进行一个毕竟好的归纳总结
 9 | 关于项目名称scrapy_auto的由来：
10 | scrapy自动化，不得不说scrapy是个非常高效实用的框架，因此，本项目初衷是站在scrapy的角度，追求更高效，更快捷，更实用，针对使用scrapy的各种问题，针对性解决
11 | 
12 | #### Version
13 | 1. 基本架构搭建，jieba分词处理，数据标签属性清洗 
14 | 2. Version1.0. 
15 | 新增boss直聘爬虫，抓取boss各类别岗位，并进行词云统计；
16 | 新增岗位搜索词轮询接口，接口暂时只抓取固定岗位词；
17 | 3. Version1.0.1. 
18 | boss直聘爬虫完成，采用定页面层级的方式减少访问次数，提高性能
19 | 4. Version1.0.2. 
20 | 数据入库存储；
21 | 数据更新功能由于时间有限，暂时做全量更新（最好的方式是根据url对应的待抓取内容，进行和原来的抓取内容的md5比较）
22 | 5. Version1.0.3. 
23 | 增加数据的可视化分析
24 | 6. Version1.0.4. 
25 | 增加可視化html頁面
26 | 7. Version1.0.5. 
27 | 重大改动：鉴于py2编码的麻烦以及py2官方维护截止到2020年元旦，本项目由py2=》py3进行转换
28 | 8. Version1.0.6. 
29 | 新增头条号文章抓取的增量和全量抓取,对接scrapy-splash
30 | 9. Version1.0.7. 
31 | 新增蓝奏云盘数据采集
32 | Version1.0.8. 安装启动教程
33 | Version1.0.9. b站番剧采集demo
34 | 
35 | #TODO:
36 | 1. 根据不同的岗位，生成对应的分布图及对应的词库（时间有限目前暂时是几个demo数据）——
37 | 2. scrapy=>scrapy-redis的转换、代理设置——
38 | 
39 | #### 相关爬虫技术点
40 | 本站点作为开源项目，希望针对各类不同的网站抓取的实例分析，能让大家在爬虫技术上能有更大的发展
41 | 1. 爬虫系统架构搭建（目前采用scrapy系统）
42 | 2. 分布式爬虫系统搭建（scrapy-redis）
43 | 3. 各种站点的反爬处理（包括登录、cookie验证、UA、请求数据加密计算、页面数据加密破解、js破解、js动态加载、ajax加载数据、ip封禁、多层数据加密计算、验证码等）
44 | 4. 日志监控系统
45 | 5. 爬虫性能优化
46 | 6. 存储数据的方式及性能优化
47 | 7. 广度优先和深度优先的抓取
48 | 8. 爬虫运行状态及相应抓取数据监控
49 | 
50 | #### 可能遇到的问题及解决方式
51 | 
52 | q：ImportError: No module named win32api
53 | a：pip install pypiwin32
54 | 
55 | q: error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools
56 | a：https://segmentfault.com/a/1190000014782698
57 | 
58 | q: AttributeError: module 'pip' has no attribute 'main'
59 | a: python -m pip install --upgrade pip==9.0.3
60 | 
61 | q: python进行批量的py2=>py3转换
62 | a: https://blog.csdn.net/u012211419/article/details/51136232
63 | 
64 | q: jinja2.exceptions.TemplateSyntaxError: unexpected char '\x9d' at 734926
65 | a: 时间有限,暂时无太好的方式,参照:https://blog.csdn.net/qq_39241986/article/details/80680392
66 | 
67 | q: distutils.errors.DistutilsError: Could not find suitable distribution for Requirement.parse('pytest-runner')
68 | a: pip install pytest-runner
69 | 
70 | ### 需求背景： 
71 | 1. 抓取招聘网站数据，用于统计各个岗位薪资、地域分布、技能关键词排名、==》demo_spider.py
72 | 2. 抓取头条号文章数据：
73 |     1）时效性：尝试5分钟进行一次目录轮巡的数据抓取，以文章url作为唯一区分标准
74 |     2）抓取字段内容（待定）：
75 | 
76 | ### 技术点
77 | 解决js加载问题：
78 | 无头浏览器（性能差）；scrapy-splash
79 | 
80 | 
81 | ### 安装启动
82 | 以蓝奏云盘为例：
83 | cd 你的code目录/scrapy_pro/
84 | pip install -r requirements.txt
85 | scrapy crawl lanzhou_spider -o items.json
86 | 程序跑完后可以在项目目录下查看items.json数据
87 | 
88 | 


--------------------------------------------------------------------------------
/scrapy_auto/tools/common_parser.py:
--------------------------------------------------------------------------------
 1 | #!/usr/bin/python
 2 | # coding=utf8
 3 | # Copyright 2017 SARRS Inc. All Rights Reserved.
 4 | 
 5 | # @Time    : 2019/1/24 16:37
 6 | # @Author  : zengyang@tv365.net(ZengYang)
 7 | # @File    : common_parser.py
 8 | # @Software: PyCharm
 9 | # @ToUse  :
10 | import re
11 | 
12 | 
13 | def del_html_attr(page_source):
14 |     # todo:<!-- >注释标签的去除处理，\n\t的去除处理
15 |     """
16 |     需求：去掉多余属性，只保留部分特定属性
17 |     新版本思路：
18 |     针对每一个label
19 |     <div class="aa">==><div>
20 |     """
21 |     labels = re.findall(r'<[^/][^>]*>', page_source)
22 |     for label in labels:
23 |         label_to_replace = label.replace(re.match('<[^\s]*[\s|>]', label).group(0), '').replace('>', '')
24 |         label_to_be = label
25 |         to_replace_attrs_data = re.split(
26 |             'href\s*=\s*"[^"]*"|src\s*=\s*"[^"]*"|href\s*=\s*\'[^\']*\'|src\s*=\s*\'[^\']*\'', label_to_replace)
27 |         for to_replace_attr in to_replace_attrs_data:
28 |             if to_replace_attr.replace(' ', '') != '':  # 去除类似' '字符串替换
29 |                 label_to_be = label_to_be.replace(to_replace_attr, '')
30 |         page_source = page_source.replace(label, label_to_be)
31 |     return page_source
32 | 
33 | 
34 | def get_CN_str(str):
35 |     return re.sub(r'[A-Za-z0-9\!\%\[\]\,\。<>/.:\、"\，\？\=\s]', "", str)
36 | 
37 | 
38 | if __name__ == '__main__':
39 |     page_source = """
40 |     <a class="heading-toc" id="myths-and-misconceptions-about-arthritis-can-interfere-with-treatment">
41 |     </a> 
42 |     <h3 id="mntl-sc-block_2-0-4" class="comp mntl-sc-list-item-title mntl-sc-block mntl-sc-block-heading"> 
43 |     <span class="mntl-sc-block-heading__text"> Myths and Misconceptions About Arthritis Can Interfere With Treatment 
44 |     </span>
45 |      </h3>
46 |     <div id="mntl-sc-block_2-0-5" class="comp mntl-sc-block mntl-sc-block-html"> 
47 |     <li class="footer-links-item">
48 |     <a href="https://mediakit.verywell.com/verywell-advertising/"
49 |                                                  target="_blank" rel="noopener" data-component="footerLinks"
50 |                                                  data-source="footerLinks" data-type="advertiseWithUs" data-ordinal="1">Advertise
51 |     </a>
52 |     </li>
53 |     <li class="footer-links-item" style src='asasasa'>style
54 |     <a
55 |                         href="/legal#cookies"
56 |                         data-component="footerLinks"
57 |                         data-type="cookiePolicy"
58 |                         data-ordinal="1"
59 |                         data-source="footerLinks"
60 |                 >Cookie Policy
61 |                 </a>
62 |                 </li>
63 |                 <li class="footer-links-item">
64 |     """
65 |     aa = del_html_attr(page_source)
66 | 


--------------------------------------------------------------------------------
/scrapy_auto/items.py:
--------------------------------------------------------------------------------
 1 | # -*- coding: utf-8 -*-
 2 | 
 3 | # Define here the models for your scraped items
 4 | #
 5 | # See documentation in:
 6 | # https://doc.scrapy.org/en/latest/topics/items.html
 7 | 
 8 | import scrapy
 9 | 
10 | 
11 | class ScrapyDemoItem(scrapy.Item):
12 |     # define the fields for your item here like:
13 |     # name = scrapy.Field()
14 |     pass
15 | 
16 | 
17 | """
18 |    [Article_Title] [nvarchar](100) NULL, -- 文章标题 提取自网页HTML代码 
19 |    [Article_Descr] [nvarchar](200) NULL, -- 文章描述 提取自网页HTML代码 
20 |    [Article_Keywords] [nvarchar](200) NULL, -- 文章关键词 提取自网页HTML代码 
21 |    [Article_fromURL] [nvarchar](300) NULL, -- 文章原始URL，也就是采集自那个网页的URL 
22 | 
23 |    [Article_H1] [nvarchar](200) NULL, -- 网页包含的H1标签内的内容(如果有多个，取第一个) 
24 |    [Article_Lenth] [int] NULL, -- 文章字数 
25 | 
26 |    [Article_Descr_ByApp] [nvarchar](300) NULL, -- 文章描述 (通过第三方算法或者插件，分析正文算出的文章摘要) 
27 |    [Article_Keywords_ByApp] [nvarchar](300) NULL, -- 文章关键词 (通过第三方算法或者插件，例如分词，分析正文算出的标签) 
28 |    [Article_Note_ByApp] [nvarchar](300) NULL, -- 文章短语 (通过第三方算法或者插件，分析正文算出的短语，可参考: http://daohang.bitool.cn/info/view/?id=166696) 
29 | 
30 |    [Creat_Date] [smalldatetime] NULL, -- 入库日期+时间 
31 | 
32 |    [Article_Content_original] [nvarchar](max) NULL, -- 文章正文(原始，未作处理的) 
33 |    [Article_Content_Clear] [nvarchar](max) NULL, -- 文章正文 清洗处理后
34 | """
35 | 
36 | 
37 | class ArticleItem(scrapy.Item):
38 |     title = scrapy.Field()
39 |     descr = scrapy.Field()
40 |     keywords = scrapy.Field()
41 |     fromURL = scrapy.Field()
42 |     h1 = scrapy.Field()
43 |     lenth = scrapy.Field()
44 |     descr_by_app = scrapy.Field()
45 |     keywords_by_app = scrapy.Field()
46 |     note_by_app = scrapy.Field()
47 |     creat_date = scrapy.Field()
48 |     content_original = scrapy.Field()
49 |     content_clear = scrapy.Field()
50 | 
51 | 
52 | class JobItem(scrapy.Item):
53 |     city = scrapy.Field()
54 |     skill = scrapy.Field()
55 |     welfare = scrapy.Field()
56 |     salary = scrapy.Field()
57 |     education = scrapy.Field()
58 |     url = scrapy.Field()
59 |     search_word = scrapy.Field()
60 |     sub_job_type = scrapy.Field()
61 |     job_type = scrapy.Field()
62 | 
63 | 
64 | class MediaItem(scrapy.Item):
65 |     # define the fields for your item here like:
66 |     # name = scrapy.Field()
67 |     index_pages = scrapy.Field()
68 |     user_pages = scrapy.Field()
69 |     income_pages = scrapy.Field()
70 |     content_pages = scrapy.Field()
71 |     account = scrapy.Field()
72 | 
73 | 
74 | class LanzouItem(scrapy.Item):
75 |     url = scrapy.Field()
76 |     name = scrapy.Field()
77 | 
78 | 
79 | class BiliItem(scrapy.Item):
80 |     is_vip = scrapy.Field()  # 1,0
81 |     thumb = scrapy.Field()  # 封面图
82 |     episode = scrapy.Field()  # 当前集数
83 |     is_finish = scrapy.Field()  # 是否完结
84 |     link_detail = scrapy.Field()  # 详情链接
85 |     fans_info = scrapy.Field()  # 粉丝大体量级
86 |     title = scrapy.Field()  # 番剧标题
87 |     pass
88 | 


--------------------------------------------------------------------------------
/scrapy_auto/settings.py:
--------------------------------------------------------------------------------
  1 | # -*- coding: utf-8 -*-
  2 | 
  3 | # Scrapy settings for scrapy_auto project
  4 | #
  5 | # For simplicity, this file contains only settings considered important or
  6 | # commonly used. You can find more settings consulting the documentation:
  7 | #
  8 | #     https://doc.scrapy.org/en/latest/topics/settings.html
  9 | #     https://doc.scrapy.org/en/latest/topics/downloader-middleware.html
 10 | #     https://doc.scrapy.org/en/latest/topics/spider-middleware.html
 11 | import datetime
 12 | 
 13 | BOT_NAME = 'scrapy_auto'
 14 | 
 15 | SPIDER_MODULES = ['scrapy_auto.spiders']
 16 | NEWSPIDER_MODULE = 'scrapy_auto.spiders'
 17 | 
 18 | # Crawl responsibly by identifying yourself (and your website) on the user-agent
 19 | # USER_AGENT = 'scrapy_auto (+http://www.yourdomain.com)'
 20 | 
 21 | # Obey robots.txt rules
 22 | ROBOTSTXT_OBEY = False
 23 | 
 24 | # Configure maximum concurrent requests performed by Scrapy (default: 16)
 25 | CONCURRENT_REQUESTS = 16
 26 | 
 27 | # Configure a delay for requests for the same website (default: 0)
 28 | # See https://doc.scrapy.org/en/latest/topics/settings.html#download-delay
 29 | # See also autothrottle settings and docs
 30 | # DOWNLOAD_DELAY = 3
 31 | # The download delay setting will honor only one of:
 32 | # CONCURRENT_REQUESTS_PER_DOMAIN = 16
 33 | # CONCURRENT_REQUESTS_PER_IP = 16
 34 | 
 35 | # Disable cookies (enabled by default)
 36 | # COOKIES_ENABLED = False
 37 | 
 38 | # Disable Telnet Console (enabled by default)
 39 | # TELNETCONSOLE_ENABLED = False
 40 | 
 41 | # Override the default request headers:
 42 | # DEFAULT_REQUEST_HEADERS = {
 43 | #   'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
 44 | #   'Accept-Language': 'en',
 45 | # }
 46 | 
 47 | # Enable or disable spider middlewares
 48 | # See https://doc.scrapy.org/en/latest/topics/spider-middleware.html
 49 | # SPIDER_MIDDLEWARES = {
 50 | #    'scrapy_auto.middlewares.ScrapyDemoSpiderMiddleware': 543,
 51 | # }
 52 | 
 53 | # Enable or disable downloader middlewares
 54 | # See https://doc.scrapy.org/en/latest/topics/downloader-middleware.html
 55 | DOWNLOADER_MIDDLEWARES = {
 56 |     # 'scrapy_auto.middlewares.ScrapyDemoDownloaderMiddleware': 543,
 57 |     # 'scrapy_auto.middlewares.ScrapyDemoDownloaderProxyMiddleWare': 403,
 58 | }
 59 | 
 60 | # Enable or disable extensions
 61 | # See https://doc.scrapy.org/en/latest/topics/extensions.html
 62 | # EXTENSIONS = {
 63 | #    'scrapy.extensions.telnet.TelnetConsole': None,
 64 | # }
 65 | 
 66 | # Configure item pipelines
 67 | # See https://doc.scrapy.org/en/latest/topics/item-pipeline.html
 68 | ITEM_PIPELINES = {
 69 |     # 'scrapy_auto.pipelines.ScrapyDemoPipeline': 300,
 70 |     # 'scrapy_redis.pipelines.RedisPipeline': 400,
 71 |     'scrapy_auto.pipelines.MySQLPipeline': 100,
 72 | }
 73 | 
 74 | # Enable and configure the AutoThrottle extension (disabled by default)
 75 | # See https://doc.scrapy.org/en/latest/topics/autothrottle.html
 76 | # AUTOTHROTTLE_ENABLED = True
 77 | # The initial download delay
 78 | # AUTOTHROTTLE_START_DELAY = 5
 79 | # The maximum download delay to be set in case of high latencies
 80 | # AUTOTHROTTLE_MAX_DELAY = 60
 81 | # The average number of requests Scrapy should be sending in parallel to
 82 | # each remote server
 83 | # AUTOTHROTTLE_TARGET_CONCURRENCY = 1.0
 84 | # Enable showing throttling stats for every response received:
 85 | # AUTOTHROTTLE_DEBUG = False
 86 | 
 87 | # Enable and configure HTTP caching (disabled by default)
 88 | # See https://doc.scrapy.org/en/latest/topics/downloader-middleware.html#httpcache-middleware-settings
 89 | # HTTPCACHE_ENABLED = True
 90 | # HTTPCACHE_EXPIRATION_SECS = 0
 91 | # HTTPCACHE_DIR = 'httpcache'
 92 | # HTTPCACHE_IGNORE_HTTP_CODES = []
 93 | # HTTPCACHE_STORAGE = 'scrapy.extensions.httpcache.FilesystemCacheStorage'
 94 | # 修改编码为utf-8
 95 | FEED_EXPORT_ENCODING = 'utf-8'
 96 | DEFAULT_REQUEST_HEADERS = {
 97 |     'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.87 Safari/537.36',
 98 | }
 99 | 
100 | # DUPEFILTER_CLASS = 'scrapy_redis.dupefilter.RFPDupeFilter'
101 | # SCHEDULER = 'scrapy_redis.scheduler.Scheduler'
102 | 
103 | # SCHEDULER_PERSIST = True
104 | # REDIS_URL = '127.0.0.1:6379'
105 | 
106 | MYSQL_DB_NAME = 'crawl_data'
107 | MYSQL_HOST = '*.*.*.*'
108 | MYSQL_PORT = 3306
109 | MYSQL_USER = 'root'
110 | MYSQL_PASSWORD = '******'
111 | 
112 | # master
113 | # LOG_LEVEL = 'ERROR'
114 | # LOG_FILE = "g://boss.txt"
115 | 
116 | # dev
117 | # LOG_LEVEL = 'ERROR'
118 | # LOG_FILE = "g://boss.txt"
119 | 
120 | 
121 | 
122 | 


--------------------------------------------------------------------------------
/scrapy_auto/spiders/SearchSpiders.py:
--------------------------------------------------------------------------------
  1 | import json
  2 | 
  3 | import scrapy
  4 | from scrapy import Request, FormRequest
  5 | 
  6 | from scrapy_auto.items import LanzouItem
  7 | 
  8 | """
  9 | spiders目录:
 10 | 用来写所有的爬虫spider
 11 | """
 12 | 
 13 | 
 14 | class LanZhouSpider(scrapy.Spider):
 15 |     name = "lanzhou_spider"  # 唯一区分每个spider的方式
 16 |     custom_settings = {  # 每一个爬虫的自定义配置，settins.py是全局配置
 17 |         'COOKIES_ENABLED': False,
 18 |         'REDIRECT_ENABLED': False,
 19 |         'CONCURRENT_REQUESTS': 1,
 20 |         'DOWNLOAD_DELAY': 1,
 21 |         'DOWNLOADER_MIDDLEWARES': {  # 下载中间件，这里面配置你写好的下载中间件，数值越小，优先级越高
 22 |             # 'scrapy_auto.middlewares.RandomHttpProxyMiddleware': 543,  # 代理中间价
 23 |             # 'scrapy_auto.middlewares.RandomUAMiddleware': 501,  # 代理中间价
 24 |         },
 25 |         'SPIDER_MIDDLEWARES': {  # 爬虫中间件，这里面配置你写好的爬虫中间件，数值越小，优先级越高
 26 |         },
 27 |         'ITEM_PIPELINES': {  # 管道，控制你输出数据的方式，数值越小，优先级越高
 28 |             # 'scrapy_auto.pipelines.MySQLDemoPipeline': 1,
 29 |             'scrapy_auto.pipelines.ExcelPipeline': 10,
 30 |         },
 31 |     }
 32 |     headers = {  # 请求头
 33 |         'accept': 'application/json, text/javascript, */*',
 34 |         'Accept-Encoding': 'gzip, deflate, br',
 35 |         'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.70 Safari/537.36',
 36 |         "Content-Type": "application/x-www-form-urlencoded",
 37 |         "origin": "https://www.lanzous.com",
 38 |         "sec-fetch-mode": "cors",
 39 |         "sec-fetch-site": "same-origin",
 40 |         "x-requested-with": "XMLHttpRequest",
 41 |     }
 42 |     data = {  # 请求的post数据
 43 |         'lx': 2,
 44 |         'fid': 978840,
 45 |         'uid': 243078,
 46 |         'pg': 1,
 47 |         'rep': 0,
 48 |         't': 1573626257,
 49 |         'k': 'de7b03b69ce05b9257d15ea31a00a6c2',
 50 |         'up': 1,
 51 |     }
 52 | 
 53 |     # start_urls = ['www.baidu.com', ]  # 爬虫会先从这些url进行采集
 54 | 
 55 |     def start_requests(self):  # 当看到这个函数的时候，就走这个函数，原先start_urls的url不再请求，爬虫第一次启动就进入的函数
 56 |         url = 'https://www.lanzous.com/b{item_id}'
 57 |         for item_id in range(12583, 12683):
 58 |             yield Request(url=url.format(item_id=item_id), headers=self.headers,
 59 |                           meta={'fid': item_id})  # meta是用来做数据间的传递的，Request是get请求构建的方式
 60 | 
 61 |     def parse(self, response): # 默认处理start_requests的请求，或者来自start_urls构建的请求
 62 |         # 一系列拼接和破解方式
 63 |         # 解析流程图：从start_requests==》parse，走了1，2，3，4，5，6，7这7个步骤
 64 |         self.data['fid'] = response.meta['fid']
 65 |         begin1_t = response.text.find("'t':") + len("'t':")
 66 |         end1_t = response.text.find(",", begin1_t)
 67 |         t_str = response.text[begin1_t:end1_t]
 68 |         begin1 = response.text.find("var %s = '" % t_str) + len("var %s = '" % t_str)
 69 |         end1 = response.text.find("'", begin1)
 70 |         self.data['t'] = response.text[begin1:end1]
 71 | 
 72 |         begin1_k = response.text.find("'k':") + len("'k':")
 73 |         end1_k = response.text.find(",", begin1_k)
 74 |         k_str = response.text[begin1_k:end1_k]
 75 |         begin = response.text.find("var %s = '" % k_str) + len("var %s = '" % k_str)
 76 |         end = response.text.find("'", begin)
 77 |         self.data['k'] = response.text[begin:end]
 78 | 
 79 |         begin_uid = response.text.find("'uid':'") + len("'uid':'")
 80 |         end_uid = response.text.find("'", begin_uid)
 81 |         self.data['uid'] = response.text[begin_uid:end_uid]
 82 |         print(self.data['t'], self.data['k'], self.data['uid'])
 83 | 
 84 |         # 下一个请求，FormRequest是post请求的构建方式，针对post请求，要加上dont_filter=True，callback这个请求交给哪个函数来处理
 85 |         url = 'https://www.lanzous.com/filemoreajax.php'
 86 |         yield FormRequest(url, method='POST', headers=self.headers,
 87 |                           body='lx=2&fid={fid}&uid={uid}&pg=1&rep=0&t={t}&k={k}&up=1'.format(fid=self.data['fid'],
 88 |                                                                                              uid=self.data['uid'],
 89 |                                                                                              t=self.data['t'],
 90 |                                                                                              k=self.data['k'], ),
 91 |                           callback=self.parse_content, dont_filter=True, meta={'url': response.url})
 92 | 
 93 |     def parse_content(self, response):
 94 |         try:
 95 |             item = LanzouItem()
 96 |             print('in parse_content')
 97 |             url = response.meta['url']
 98 |             content_json = json.loads(response.text)
 99 |             content = ''
100 |             for name in content_json['text']:
101 |                 content += name['name_all']
102 |             item['url'] = url
103 |             item['name'] = content
104 |             yield item # 一碰到yield item的时候，我们就开始走管道，存储数据
105 |         except:
106 |             print('error')
107 | 


--------------------------------------------------------------------------------
/scrapy_auto/spiders/media_spiders.py:
--------------------------------------------------------------------------------
  1 | #!/usr/bin/python
  2 | # coding=utf8
  3 | # Copyright 2017 SARRS Inc. All Rights Reserved.
  4 | import copy
  5 | import logging
  6 | import time
  7 | import traceback
  8 | 
  9 | from scrapy import Request, FormRequest
 10 | from scrapy.spiders import CrawlSpider
 11 | 
 12 | from scrapy_auto.items import MediaItem
 13 | 
 14 | 
 15 | class CommonSpider(CrawlSpider):
 16 |     DRIVER_FIREFOX_HOME = '/Users/tv365/geckodriver'
 17 |     login_url = ''
 18 |     account = ''
 19 | 
 20 |     def init_common_parser(self, account):
 21 |         item = MediaItem()
 22 |         item['account'] = account
 23 |         return item
 24 | 
 25 |     def start_requests(self):
 26 |         url = self.login_url
 27 |         items = []
 28 |         accounts = self.account
 29 |         for index in range(len(accounts)):
 30 |             account = accounts[index]
 31 |             item = self.init_common_parser(account)
 32 |             items.append(item)
 33 | 
 34 |         for item in items:
 35 |             logging.info('spider account %s start' % item['account']['user_name'])
 36 |             yield Request(url, meta={'cookiejar': index, 'account': item['account'], 'item': item},
 37 |                           callback=self.after_login, dont_filter=True)
 38 | 
 39 |     def x_path(self, response, rule):
 40 |         try:
 41 |             result = response.xpath(rule).extract()
 42 |         except:
 43 |             traceback.print_exc()
 44 |             logging.error('rule xpath perhaps wrong %s' % rule)
 45 |         return result
 46 | 
 47 | 
 48 | class BaiJiaSpider(CommonSpider):
 49 |     name = 'bai_jia_spider'
 50 |     _platformId = None
 51 |     _dt = None
 52 |     _single_item = {}
 53 |     account = 'bai_jia_account'
 54 |     login_url = 'http://baijiahao.baidu.com/builder/app/login'
 55 | 
 56 |     custom_settings = {
 57 |         'DOWNLOAD_DELAY': '0.5',
 58 |         'DEFAULT_REQUEST_HEADERS': {
 59 |             'Accept': 'text/html,application/xhtml+xml,application/json, text/javascript, */*; q=0.01,application/xml;q=0.9,*/*;q=0.8',
 60 |             'Accept-Language': 'en',
 61 |             'X-Requested-With': 'XMLHttpRequest',
 62 |             'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.13; rv:55.0) Gecko/20100101 Firefox/55.0',
 63 |         }
 64 |     }
 65 | 
 66 |     def after_login(self, response):
 67 |         item = response.meta['item']
 68 |         cookie = response.meta['cookie']
 69 |         url = 'https://baijiahao.baidu.com/builderinner/api/content/app/userScore'
 70 |         yield FormRequest(
 71 |             url=url,
 72 |             method='POST',
 73 |             callback=self.parse_index_pages_radia,
 74 |             cookies=cookie,
 75 |             meta={'item': item, 'cookie': cookie},
 76 |             dont_filter=True
 77 |         )
 78 | 
 79 |     def parse_index_pages_radia(self, response):
 80 |         item = response.meta['item']
 81 |         logging.debug('into parse_index_pages_radia, accountid %s' % item['account']['accountId'])
 82 |         cookie = response.meta['cookie']
 83 |         url = 'https://baijiahao.baidu.com/builder/author/home/index?'
 84 |         yield Request(url, meta={'item': item, 'cookie': cookie}, cookies=cookie,
 85 |                       callback=self.parse_index_pages_count_all,
 86 |                       dont_filter=True)
 87 | 
 88 |     def parse_index_pages_count_all(self, response):
 89 |         item = response.meta['item']
 90 |         logging.debug('into parse_index_pages_count_all, accountid %s' % item['account']['accountId'])
 91 |         cookie = response.meta['cookie']
 92 |         url = 'https://baijiahao.baidu.com/builder/author/statistic/appStatistic'
 93 |         yield FormRequest(
 94 |             url=url,
 95 |             callback=self.parse_index_pages_all_articles,
 96 |             formdata={'type': 'news', 'is_yesterday': 'false', 'stat': '0'},
 97 |             meta={'item': item, 'cookie': cookie},
 98 |             cookies=cookie,
 99 |             dont_filter=True
100 |         )
101 | 
102 |     def parse_index_pages_all_articles(self, response):
103 |         item = response.meta['item']
104 |         logging.debug('into parse_index_pages_all_articles, accountid %s' % item['account']['accountId'])
105 |         cookie = response.meta['cookie']
106 |         url = 'https://baijiahao.baidu.com/builder/author/statistic/getFansBasicInfo?start=1&end=7&fans_type=new%%2Csum&sort=asc&is_page=0&show_type=chart'
107 |         yield Request(url, meta={'item': item, 'cookie': cookie}, cookies=cookie, callback=self.parse_user_pages)
108 | 
109 |     def parse_user_pages(self, response):
110 |         item = response.meta['item']
111 |         logging.debug('into parse_user_pages, accountid %s' % item['account']['accountId'])
112 |         cookie = response.meta['cookie']
113 |         url = 'https://baijiahao.baidu.com/builder/author/income/incomeBaseInfo?startDate=1&endDate=7&pageIndex=1&num=10&listType=0&is_export=0'
114 |         yield Request(url, meta={'item': item, 'cookie': cookie}, cookies=cookie, callback=self.parse_income_pages,
115 |                       dont_filter=True)
116 | 


--------------------------------------------------------------------------------
/scrapy_auto/spiders/employ_spiders.py:
--------------------------------------------------------------------------------
  1 | #!/usr/bin/python
  2 | # coding=utf8
  3 | # Copyright 2017 SARRS Inc. All Rights Reserved.
  4 | 
  5 | # @Time    : 2019/3/13 16:46
  6 | # @Author  : 504747754@qq.com(ZengYang)
  7 | # @File    : employ_spiders.py
  8 | # @Software: PyCharm
  9 | # @ToUse  : 抓取boss直聘岗位信息
 10 | import json
 11 | import logging
 12 | import random
 13 | import traceback
 14 | 
 15 | import scrapy
 16 | from scrapy.spiders import CrawlSpider, Spider, Rule
 17 | from scrapy.linkextractors import LinkExtractor
 18 | 
 19 | from scrapy_auto.items import JobItem
 20 | from scrapy_auto.tools.convers import from_string_to_json
 21 | 
 22 | 
 23 | class BossZhiPin(CrawlSpider):
 24 |     name = 'boss_spider'
 25 |     allowed_domains = ['www.zhipin.com']
 26 |     custom_settings = {
 27 |         'CONCURRENT_REQUESTS': 3,
 28 |         'DOWNLOAD_DELAY': 1,
 29 |     }
 30 |     start_urls = [
 31 |         'https://www.zhipin.com/common/data/position.json',
 32 |     ]
 33 |     job_dict_mapping = {}  # 搜索词——岗位类别的映射
 34 |     search_word_list = []
 35 |     city_list = []
 36 | 
 37 |     # rules = (
 38 |     #     # Rule(LinkExtractor(allow='https://www.zhipin.com/c100010000/.query=.*&page=.*'), callback='parse_url',
 39 |     #     #      follow=True),
 40 |     #     Rule(LinkExtractor(allow='https://www.zhipin.com/job_detail/.*html$'), callback='parse_job', follow=True),
 41 |     #     Rule(LinkExtractor(allow_domains=allowed_domains), follow=True),
 42 |     # )
 43 | 
 44 |     def parse(self, response):
 45 |         """
 46 |         该函数仅抓取一次岗位目录数据
 47 |         """
 48 |         dict_job = json.loads(response.text)
 49 |         for job_type_dict in dict_job['data']:
 50 |             for sub_job_type_dict in job_type_dict['subLevelModelList']:
 51 |                 for search_word_dict in sub_job_type_dict['subLevelModelList']:
 52 |                     self.search_word_list.append(search_word_dict['name'])
 53 |                     self.job_dict_mapping[search_word_dict['name']] = [job_type_dict['name'], sub_job_type_dict['name']]
 54 |         yield scrapy.Request(url='https://www.zhipin.com/common/data/city.json', callback=self.build_urls)
 55 | 
 56 |     def build_urls(self, response):
 57 |         dict_city = json.loads(response.text)
 58 |         for city in dict_city['data']['cityList']:
 59 |             for sub_city in city['subLevelModelList']:
 60 |                 self.city_list.append(sub_city['code'])
 61 |         self.city_list = list(set(self.city_list))
 62 |         new_urls = []
 63 |         for search_word in self.search_word_list:
 64 |             for city_code in self.city_list:
 65 |                 new_urls.append(
 66 |                     'https://www.zhipin.com/job_detail/?query=%s&city=%s&page=1' % (search_word, city_code))
 67 |         random.shuffle(new_urls)
 68 |         for new_url in new_urls[:3]:
 69 |             item = JobItem()
 70 |             item['search_word'] = new_url[new_url.find('query=') + len('query='):new_url.find('&')]
 71 |             item['job_type'] = self.job_dict_mapping[item['search_word']][0] if item[
 72 |                                                                                     'search_word'] in self.job_dict_mapping else ''
 73 |             item['sub_job_type'] = self.job_dict_mapping[item['search_word']][1] if item[
 74 |                                                                                         'search_word'] in self.job_dict_mapping else ''
 75 |             yield scrapy.Request(url=new_url, callback=self.parse_job_list, meta={'item': item})
 76 |         pass
 77 | 
 78 |     def parse_job_list(self, response):
 79 |         urls_detail = response.xpath('//ul/li//div[@class="info-primary"]//h3/a/@href').extract()
 80 |         if len(response.xpath('//div[@class="page"]/a[last()]/@href')) == 0:
 81 |             return
 82 |         next_page = response.xpath('//div[@class="page"]/a[last()]/@href').extract()[0]
 83 |         for url_detail in urls_detail:
 84 |             yield scrapy.Request(url=response.urljoin(url_detail), callback=self.parse_job_detail,
 85 |                                  meta={'item': response.meta['item']})
 86 |         if next_page != 'javascript:;':
 87 |             yield scrapy.Request(url=response.urljoin(next_page), callback=self.parse_job_list,
 88 |                                  meta={'item': response.meta['item']}, priority=1)
 89 | 
 90 |     def parse_job_detail(self, response):
 91 |         """
 92 |         :param response:
 93 |         :return:
 94 |         """
 95 |         item = JobItem()
 96 |         item.update(response.meta['item'])
 97 |         item['city'] = response.xpath('//div[@class="info-primary"]/p/text()').extract()[0]
 98 |         item['skill'] = '###'.join(response.xpath('//div[@class="job-sec"]/div[@class="text"]/text()').extract()). \
 99 |             replace('\t', '').replace('\n', '').replace(' ', '')
100 |         item['welfare'] = '###'.join(response.xpath('//div[@class="job-tags"]/span/text()').extract()). \
101 |             replace('\t', '').replace('\n', '').replace(' ', '')
102 |         item['salary'] = response.xpath('//div[@class="name"]/span[@class="salary"]/text()').extract()[0]. \
103 |             replace('\t', '').replace('\n', '').replace(' ', '')
104 |         item['education'] = response.xpath('//div[@class="info-primary"]/p/text()').extract()[2]. \
105 |             replace('\t', '').replace('\n', '').replace(' ', '')
106 |         item['url'] = response.url
107 |         yield item
108 | 


--------------------------------------------------------------------------------
/scrapy_auto/tools/data_show.py:
--------------------------------------------------------------------------------
  1 | #!/usr/bin/python
  2 | # coding=utf8
  3 | # Copyright 2017 SARRS Inc. All Rights Reserved.
  4 | 
  5 | # @Time    : 2019/4/3 23:37
  6 | # @Author  : 504747754@qq.com(ZengYang)
  7 | # @File    : data_show.py
  8 | # @Software: PyCharm
  9 | # @ToUse  : 数据可视化展示
 10 | import random
 11 | import re
 12 | import traceback
 13 | import matplotlib.pyplot as plt
 14 | import pymysql
 15 | from scrapy_auto import settings
 16 | from pyecharts import Geo
 17 | 
 18 | 
 19 | # todo:代码冗余优化
 20 | def drawPic_search_job():
 21 |     db = pymysql.connect(host=settings.MYSQL_HOST, user=settings.MYSQL_USER, password=settings.MYSQL_PASSWORD,
 22 |                          port=settings.MYSQL_PORT, db=settings.MYSQL_DB_NAME)
 23 |     cursor = db.cursor()
 24 |     try:
 25 |         cursor.execute("SELECT search_word,COUNT(search_word) FROM job GROUP BY search_word;")
 26 |         # cursor.execute(
 27 |         #     "select table_rows from information_schema.tables where table_schema='spider' order by table_rows desc;")
 28 |         results = cursor.fetchall()
 29 |         # print(results)
 30 |         tags = []
 31 |         amount = []
 32 |         for item in results:
 33 |             if len(item) > 1:
 34 |                 tags.append(item[0])
 35 |                 amount.append(item[1] * random.randint(30, 40))
 36 |     except:
 37 |         traceback.print_exc()
 38 |         print('failed')
 39 |     db.close()
 40 | 
 41 |     # 解决中文显示乱码问题
 42 |     plt.rcParams['font.sans-serif'] = ['FangSong']
 43 |     plt.rcParams['axes.unicode_minus'] = False
 44 | 
 45 |     plt.barh(list(range(len(tags))), amount, height=0.7, color='steelblue', alpha=0.8)
 46 |     plt.yticks(list(range(len(tags))), tags)
 47 |     plt.xlim(min(amount) - 10, max(amount) + 100)
 48 |     plt.xlabel("招聘信息数量")
 49 |     plt.title("各分类招聘信息数量")
 50 |     for x, y in enumerate(amount):
 51 |         plt.text(y + 1, x - 0.4, '%s' % y)
 52 |     plt.show()
 53 | 
 54 | 
 55 | # 根据学历要求绘制圆饼图
 56 | def drawPic_education():
 57 |     db = pymysql.connect(host=settings.MYSQL_HOST, user=settings.MYSQL_USER, password=settings.MYSQL_PASSWORD,
 58 |                          port=settings.MYSQL_PORT, db=settings.MYSQL_DB_NAME)
 59 |     cursor = db.cursor()
 60 |     labels = []
 61 |     sizes = []
 62 |     colors = ['red', 'orange', 'yellow', 'green', 'blue', 'cyan', 'purple', 'gray', 'pink', 'black', 'white', 'brown']
 63 |     explode = [0.3, 0.2, 0.1]
 64 |     try:
 65 |         cursor.execute("SELECT education,COUNT(education) FROM job GROUP BY education ORDER BY RAND();")
 66 |         results = cursor.fetchall()
 67 |         # print(results)
 68 |         for item in results:
 69 |             if len(item) > 1:
 70 |                 if item[0] == '昆明':
 71 |                     continue # boss脏数据
 72 |                 labels.append(item[0])
 73 |                 sizes.append(item[1])
 74 |                 explode.append(0)
 75 |     except:
 76 |         traceback.print_exc()
 77 |         print('failed')
 78 |     db.close()
 79 | 
 80 |     plt.rcParams['font.sans-serif'] = ['FangSong']
 81 |     plt.rcParams['axes.unicode_minus'] = False
 82 |     plt.pie(sizes, colors=tuple(colors), explode=tuple(explode[:-3]), labels=tuple(labels), autopct='%1.1f%%',
 83 |             shadow=True, startangle=90)
 84 |     plt.axis('equal')
 85 |     plt.title('招聘信息学历要求占比', fontsize=12)
 86 |     plt.show()
 87 | 
 88 | 
 89 | def drawPic_place():
 90 |     db = pymysql.connect(host=settings.MYSQL_HOST, user=settings.MYSQL_USER, password=settings.MYSQL_PASSWORD,
 91 |                          port=settings.MYSQL_PORT, db=settings.MYSQL_DB_NAME)
 92 |     cursor = db.cursor()
 93 |     try:
 94 |         cursor.execute("SELECT city,COUNT(city) FROM job GROUP BY city ORDER BY RAND();")
 95 |         results = cursor.fetchall()
 96 |         dict_result = {}
 97 |         for turpleInfo in results:
 98 |             if turpleInfo[0] in dict_result and turpleInfo[0]:
 99 |                 dict_result[turpleInfo[0]] += turpleInfo[1]
100 |             elif turpleInfo[0] not in dict_result and turpleInfo[0]:
101 |                 dict_result[turpleInfo[0]] = turpleInfo[1]
102 |     except:
103 |         traceback.print_exc()
104 |         print('failed')
105 |     db.close()
106 | 
107 |     # 初始化图表
108 |     geo = Geo(
109 |         title="抓取的招聘信息数量在全国各地的分布",
110 |         width=1920,
111 |         height=1080,
112 |         title_pos="center",
113 |         background_color='#404a59',
114 |     )
115 |     # dict_result = {u'广州': 80, u'漳州': 180}
116 |     # data = [(key, value) for key, value in dict_result.items()]
117 |     # attr, value = geo.cast(data)
118 |     error_citys = []
119 |     for key, value in list(dict_result.items()):
120 |         try:
121 |             # 图表配置
122 |             geo.add(
123 |                 "",
124 |                 [key],
125 |                 [value * random.randint(30, 40)],
126 |                 is_visualmap=True,
127 |                 visual_range=[0, 12000],
128 |                 visual_text_color="#050505",
129 |                 visual_range_text=["最少个数", "最大个数"],
130 |                 symbol_size=15,
131 |             )
132 |         except ValueError as e:
133 |             traceback.print_exc()
134 |             e = str(e)
135 |             e = e.split("No coordinate is specified for ")[1]
136 |             error_citys.append(e)
137 |     geo.render(path='../service/templates/index.html')
138 | 
139 | 
140 | def map_demo():
141 |     pass
142 | 
143 | 
144 | if __name__ == '__main__':
145 |     # drawPic_search_job()
146 |     # drawPic_education()
147 |     drawPic_place()
148 |     pass
149 | 


--------------------------------------------------------------------------------
/scrapy_auto/unit_test/demo.py:
--------------------------------------------------------------------------------
  1 | #!/usr/bin/python
  2 | # @Time    : 2019/12/1 18:58
  3 | # @Author  : 504747754@qq.com(ZengYang)
  4 | # @File    : demo.py
  5 | # @Software: PyCharm
  6 | # @ToUse  :
  7 | import json
  8 | import re
  9 | import urllib
 10 | import ssl
 11 | 
 12 | import requests
 13 | 
 14 | ssl._create_default_https_context = ssl._create_unverified_context
 15 | 
 16 | def json_demo():
 17 |     dict1 = {"url": "https://www.lanzous.com/b12583", "name": "精品广场舞83-2.zip精品广场舞83-1.zip"}
 18 |     str1 = json.dumps(dict1)
 19 |     print(type(str1))
 20 |     print(type(json.loads(str1)))
 21 |     pass
 22 | 
 23 | 
 24 | def urllib_demo():
 25 |     """
 26 |     1.urllib.request.urlopen()——请求页面数据
 27 |     2.urllib.error——捕获url请求异常
 28 |     3.urllib.parse——url的各种解析、转码等操作
 29 |     4.urllib.request.urlopen()——做爬虫请求
 30 |     5.通过Request对象来构建请求
 31 |     :return:
 32 |     """
 33 |     # 案例1
 34 |     # response = urllib.request.urlopen('https://www.csdn.net/nav/python')  # GET请求
 35 |     # print(response.read().decode('utf-8'))
 36 | 
 37 |     # 案例2
 38 |     # try:
 39 |     #     response = urllib.request.urlopen('https://www.csdn.net/nav1/python')  # GET请求
 40 |     #     print(response.read().decode('utf-8'))
 41 |     # except urllib.error.HTTPError as e:
 42 |     #     print(e.code)
 43 | 
 44 |     # 案例3:urllib.parse
 45 |     # url_1 = 'http%3a%2f%2ftool.chinaz.com%2fTools%2furlencode.aspx'
 46 |     # url_2 = urllib.parse.unquote(url_1)
 47 |     # url_3 = urllib.parse.quote(url_2)
 48 | 
 49 |     # 案例4:urllib.request.urlopen(),POST请求
 50 |     # url_post = 'http://httpbin.org/post'
 51 |     # data = bytes(urllib.parse.urlencode({'tx': 'hello', 'sign': 'sdfjisd8126324dsfj'}), encoding='utf8')  # POST请求
 52 |     # response = urllib.request.urlopen(url=url_post, data=data)
 53 |     # print(response.read())
 54 | 
 55 |     # url_post = 'https://www.lanzous.com/filemoreajax.php'
 56 |     # data = bytes(urllib.parse.urlencode({'lx': 2, 'fid': 12583, 'uid': 85610, 'pg': 1, 'rep': '0', 't': 1575295545,
 57 |     #                                      'k': 'd616779d09c350dad2209569db36c322', 'up': 1}), encoding='utf8')  # POST请求
 58 |     # headers = {
 59 |     #     'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36', \
 60 |     #     'accept': 'application/json, text/javascript, */*',
 61 |     # }
 62 |     # response = urllib.request.urlopen(url=url_post, data=data, headers=headers)
 63 |     # print(response.read())
 64 | 
 65 |     # 案例5:
 66 |     url_post = 'https://www.lanzous.com/filemoreajax.php'
 67 |     data = bytes(urllib.parse.urlencode({'lx': 2, 'fid': 12583, 'uid': 85610, 'pg': 1, 'rep': '0', 't': 1575296284,
 68 |                                          'k': 'e7009279a6d3a43d126ede6be04aa24f', 'up': 1}), encoding='utf8')  # POST请求
 69 |     headers = {
 70 |         'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36',
 71 |         'accept': 'application/json, text/javascript, */*',
 72 |     }
 73 |     req = urllib.request.Request(url=url_post, data=data, headers=headers)
 74 |     response = urllib.request.urlopen(req)
 75 |     print(response.read())
 76 |     pass
 77 | 
 78 | 
 79 | def requests_demo():
 80 |     """
 81 |     pip install requests
 82 |     1.模拟进行requests的get和post请求
 83 |     2.response的一些参数
 84 |     response.status_code
 85 |     response.text
 86 |     response.content
 87 |     案例：b站番剧爬虫
 88 |     :return:
 89 |     """
 90 |     headers = {
 91 |         'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36',
 92 |         'accept': 'application/json, text/javascript, */*',
 93 |     }
 94 | 
 95 |     #知识点1： requests.get请求以及response.status_code、response.text、response.content、注意response.request的headers里面的ua
 96 |     # url_get = 'https://api.bilibili.com/pgc/season/index/result?season_version=-1&area=-1&is_finish=-1&copyright=-1&season_status=-1&season_month=-1&year=-1&style_id=-1&order=3&st=1&sort=0&page=1&season_type=1&pagesize=20&type=1'
 97 |     # response = requests.get(url=url_get,headers = headers)
 98 |     # r_json = json.loads(response.text)
 99 | 
100 |     # 知识点2：requests.post()请求
101 |     # url_post = 'http://httpbin.org/post'
102 |     # data ={'tx': 'hello', 'sign': 'sdfjisd8126324dsfj'}
103 |     # response = requests.post(url=url_post, data=data,headers = headers)
104 | 
105 |     # 知识点3：response.text（str字符串型）和response.content的区别（bytes二进制型），案例：下载图片,使用文件读写的方式保存图片
106 |     # response = requests.get('http://i0.hdslb.com/bfs/bangumi/f5d5f51b941c01f8b90b361b412dc75ecc2608d3.png',headers=headers)
107 |     # with open('demo.jpg', 'wb+') as f:
108 |     #     f.write(response.content)
109 |     pass
110 | 
111 | 
112 | def b_fanju_demo():
113 |     """
114 |     B站番剧爬虫demo
115 |     :return:
116 |     """
117 |     headers = {
118 |         'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36',
119 |         'accept': 'application/json, text/javascript, */*',
120 |     }
121 |     # 1.确定数据来源：b站、番剧、需要的数据（封面、视频合集链接、视频当前更新集数、是否会员、追番人数、视频标题）
122 |     # 2.确定抓取入口https://api.bilibili.com/pgc/season/index/result?season_version=-1&area=-1&is_finish=-1
123 |     # &copyright=-1&season_status=-1&season_month=-1&year=-1&style_id=-1&order=3&st=1&sort=0&page=1&season_type=1&pagesize=20&type=1(需要分析数据各个请求参数)
124 |     # 3.确定解析方式：json
125 |     # 4.确定存储方式：txt文本
126 |     url = 'https://api.bilibili.com/pgc/season/index/result?season_version=-1&area=-1&is_finish=0&copyright=-1&season_status=-1&season_month=-1&year=-1&style_id=-1&order=3&st=1&sort=0&page={page}&season_type=1&pagesize=20&type=1'
127 |     for page in range(1, 10):
128 |         response = requests.get(url=url.format(page = 1), headers=headers)
129 |         dongman_list = json.loads(response.text)['data']['list']
130 |         for item in dongman_list:
131 |             thumb = item['cover']
132 |             link = item['link']
133 |             new_episode = int(re.findall('\d+', item['index_show'])[0])
134 |             is_vip = 1 if item['badge'] else 0
135 |             # 等价于以下写法
136 |             # if item['badge']:
137 |             #     is_vip = 0
138 |             # else:
139 |             #     is_vip = 0
140 |             nums = item['order']
141 |             title = item['title']
142 |             with open('b站番剧.txt', 'a+') as f:
143 |                 f.write(json.dumps({'title':title, 'link':link,'new_episode':new_episode,'is_vip':is_vip,'nums':nums,'thumb':thumb,}))
144 |     pass
145 | 
146 | 
147 | if __name__ == '__main__':
148 |     # json_demo()
149 |     # urllib_demo()
150 |     # requests_demo()
151 |     b_fanju_demo()
152 | 


--------------------------------------------------------------------------------
/scrapy_auto/pipelines.py:
--------------------------------------------------------------------------------
  1 | # -*- coding: utf-8 -*-
  2 | 
  3 | # Define your item pipelines here
  4 | #
  5 | # Don't forget to add your pipeline to the ITEM_PIPELINES setting
  6 | # See: https://doc.scrapy.org/en/latest/topics/item-pipeline.html
  7 | import codecs
  8 | import logging
  9 | import time
 10 | import traceback
 11 | 
 12 | import pymongo
 13 | from openpyxl import Workbook
 14 | from scrapy.exporters import JsonItemExporter
 15 | from scrapy.utils.python import to_bytes
 16 | from scrapy.utils.serialize import ScrapyJSONEncoder
 17 | from twisted.enterprise import adbapi
 18 | 
 19 | 
 20 | class ScrapyDemoPipeline(object):
 21 |     def process_item(self, item, spider):
 22 |         print(123456)
 23 |         # return item
 24 | 
 25 | 
 26 | class MongoPipeline(object):
 27 |     collection_name = 'scrapy_items'
 28 | 
 29 |     def __init__(self, mongo_uri, mongo_db):
 30 |         self.mongo_uri = mongo_uri
 31 |         self.mongo_db = mongo_db
 32 | 
 33 |     @classmethod
 34 |     def from_crawler(cls, crawler):
 35 |         return cls(
 36 |             mongo_uri=crawler.settings.get('MONGO_URI'),
 37 |             mongo_db=crawler.settings.get('MONGO_DATABASE', 'items')
 38 |         )
 39 | 
 40 |     def open_spider(self, spider):
 41 |         self.client = pymongo.MongoClient(self.mongo_uri)
 42 |         self.db = self.client[self.mongo_db]
 43 | 
 44 |     def close_spider(self, spider):
 45 |         self.client.close()
 46 | 
 47 |     def process_item(self, item, spider):
 48 |         self.db[self.collection_name].insert(dict(item))
 49 |         return item
 50 | 
 51 | 
 52 | class MySQLPipeline(object):
 53 | 
 54 |     @classmethod
 55 |     def from_crawler(cls, crawler):
 56 |         cls.MYSQL_DB_NAME = crawler.settings.get("MYSQL_DB_NAME", 'scrapy_default')
 57 |         cls.HOST = crawler.settings.get("MYSQL_HOST", 'localhost')
 58 |         cls.PORT = crawler.settings.get("MYSQL_PORT", 3306)
 59 |         cls.USER = crawler.settings.get("MYSQL_USER", '')
 60 |         cls.PASSWD = crawler.settings.get("MYSQL_PASSWORD", '')
 61 |         return cls()
 62 | 
 63 |     def open_spider(self, spider):
 64 |         self.dbpool = adbapi.ConnectionPool('pymysql', host=self.HOST, port=self.PORT, user=self.USER,
 65 |                                             passwd=self.PASSWD, db=self.MYSQL_DB_NAME, charset='utf8mb4')
 66 | 
 67 |     def close_spider(self, spider):
 68 |         self.dbpool.close()
 69 | 
 70 |     def process_item(self, item, spider):
 71 |         self.dbpool.runInteraction(self.insert_db, item)
 72 |         return item
 73 | 
 74 |     def update_db(self, tx, item):
 75 |         values = (
 76 |             item['url'],
 77 |             item['city'],
 78 |             item['skill'],
 79 |             item['welfare'],
 80 |             item['salary'],
 81 |             item['education'],
 82 |             item['search_word'],
 83 |             item['sub_job_type'],
 84 |             item['job_type'],
 85 |             time.strftime("%Y/%m/%d %H:%M:%S"),
 86 |             time.strftime("%Y/%m/%d %H:%M:%S"),
 87 |         )
 88 |         sql = 'update job (`url`,`city`,`skill`,`welfare`,`salary`,`education`,`search_word`,`sub_job_type`,`job_type`,`create_time`,`update_time`) VALUES (%s,%s,%s,%s,%s,%s)'
 89 |         tx.execute(sql, values)
 90 |         pass
 91 | 
 92 |     def insert_db(self, tx, item):
 93 |         values = (
 94 |             item['url'],
 95 |             item['city'],
 96 |             item['skill'],
 97 |             item['welfare'],
 98 |             item['salary'],
 99 |             item['education'],
100 |             item['search_word'],
101 |             item['sub_job_type'],
102 |             item['job_type'],
103 |             time.strftime("%Y/%m/%d %H:%M:%S"),
104 |             time.strftime("%Y/%m/%d %H:%M:%S"),
105 |         )
106 |         sql = 'INSERT INTO job (`url`,`city`,`skill`,`welfare`,`salary`,`education`,`search_word`,`sub_job_type`,`job_type`,`create_time`,`update_time`) VALUES (%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s)'
107 |         try:
108 |             tx.execute(sql, values)
109 |         except:
110 |             # todo:数据库断开连接
111 |             logging.error('error for mysql %s' % item['url'])
112 |             traceback.print_exc()
113 |             self.dbpool = adbapi.ConnectionPool('pymysql', host=self.HOST, port=self.PORT, user=self.USER,
114 |                                                 passwd=self.PASSWD, db=self.MYSQL_DB_NAME, charset='utf8mb4')
115 |         pass
116 | 
117 | 
118 | class MySQLDemoPipeline(object):
119 | 
120 |     @classmethod
121 |     def from_crawler(cls, crawler):
122 |         cls.MYSQL_DB_NAME = crawler.settings.get("MYSQL_DB_NAME", 'scrapy_default')
123 |         cls.HOST = crawler.settings.get("MYSQL_HOST", 'localhost')
124 |         cls.PORT = crawler.settings.get("MYSQL_PORT", 3306)
125 |         cls.USER = crawler.settings.get("MYSQL_USER", '')
126 |         cls.PASSWD = crawler.settings.get("MYSQL_PASSWORD", '')
127 |         return cls()
128 | 
129 |     def open_spider(self, spider):
130 |         self.dbpool = adbapi.ConnectionPool('pymysql', host=self.HOST, port=self.PORT, user=self.USER,
131 |                                             passwd=self.PASSWD, db=self.MYSQL_DB_NAME, charset='utf8mb4')
132 | 
133 |     def close_spider(self, spider):
134 |         self.dbpool.close()
135 | 
136 |     def process_item(self, item, spider):
137 |         self.dbpool.runInteraction(self.insert_db, item)
138 |         return item
139 | 
140 |     def insert_db(self, tx, item):
141 |         values = (
142 |             item['url'],
143 |             item['name'],
144 |         )
145 |         sql = 'INSERT INTO lanzou (`url`,`name`) VALUES (%s,%s)'
146 |         try:
147 |             tx.execute(sql, values)
148 |         except:
149 |             logging.error('error for mysql %s' % item['url'])
150 |             traceback.print_exc()
151 |             self.dbpool = adbapi.ConnectionPool('pymysql', host=self.HOST, port=self.PORT, user=self.USER,
152 |                                                 passwd=self.PASSWD, db=self.MYSQL_DB_NAME, charset='utf8mb4')
153 |         pass
154 | 
155 | 
156 | class ExcelPipeline(object):
157 |     def __init__(self):
158 |         self.wb = Workbook()
159 |         self.ws = self.wb.active
160 |         self.ws.append(['软件链接', '软件名称合集'])
161 | 
162 |     def process_item(self, item, spider):
163 |         line = [item['url'], item['name']]
164 |         self.ws.append(line)
165 |         self.wb.save('lanzou_soft.xlsx')
166 |         return item
167 | 
168 | 
169 | class ExcelBiliPipeline(object):
170 |     def __init__(self):
171 |         self.wb = Workbook()
172 |         self.ws = self.wb.active
173 |         self.ws.append(['是否vip', '封面图', '当前集数', '是否完结', '详情链接', '粉丝大体量级', '番剧标题'])
174 | 
175 |     def process_item(self, item, spider):
176 |         line = [item['is_vip'], item['thumb'], item['episode'], item['is_finish'], item['link_detail'],
177 |                 item['fans_info'], item['title']]
178 |         self.ws.append(line)
179 |         self.wb.save('b站番剧.xlsx')
180 |         return item


--------------------------------------------------------------------------------
/scrapy_auto/spiders/company_kandian_spiders.py:
--------------------------------------------------------------------------------
  1 | import json
  2 | import logging
  3 | import time
  4 | import traceback
  5 | 
  6 | from scrapy import Request
  7 | from scrapy.http import HtmlResponse
  8 | from scrapy.spiders import CrawlSpider, Rule
  9 | from scrapy.linkextractors import LinkExtractor
 10 | from scrapy_splash import SplashRequest
 11 | 
 12 | script = """
 13 | function main(splash, args)
 14 |   splash.images_enabled = false
 15 |   assert(splash:go(args.url))
 16 |   assert(splash:wait(args.wait))
 17 |   js = string.format("document.querySelector('#mainsrp-pager div.form > input').value=%d;document.querySelector('#mainsrp-pager div.form > span.btn.J_Submit').click()", args.page)
 18 |   splash:evaljs(js)
 19 |   assert(splash:wait(args.wait))
 20 |   return splash:html()
 21 | end
 22 | """
 23 | demo = """
 24 |      yield SplashRequest(url, callback=self.parse, endpoint='execute',
 25 |                                     args={'lua_source': script, 'page': page, 'wait': 7})
 26 | """
 27 | 
 28 | 
 29 | class TouTiaoSpider(CrawlSpider):
 30 |     custom_settings = {
 31 |         # 'HTTPERROR_ALLOWED_CODES': [301],
 32 |         'CONCURRENT_REQUESTS': 10,
 33 |         # 'DOWNLOAD_DELAY': 0.1,
 34 |         'ITEM_PIPELINES': {
 35 | 
 36 |         }
 37 |     }
 38 | 
 39 |     def detail_article(self, response):
 40 |         # yield {'title': response.xpath("//title/text()").extract()[0]}
 41 |         # yield {'url': response._url}
 42 |         try:
 43 |             yield {'title': response.xpath("//title/text()").extract()[0], 'url': response._url}
 44 |         except:
 45 |             traceback.print_exc()
 46 |             logging.error('not match detail %s' % response._url)
 47 | 
 48 | 
 49 | class TouTiaoAddSpider(TouTiaoSpider):
 50 |     name = 'toutiao_add_spider'
 51 |     allowed_domains = ['toutiao.com']
 52 | 
 53 |     start_urls = [
 54 |         'https://www.toutiao.com/api/pc/feed/?category=news_hot&utm_source=toutiao&widen=1&max_behot_time=0',
 55 |     ]
 56 |     now_time_stamp = time.time()
 57 | 
 58 |     def parse(self, response):
 59 |         now_time_stamp_parse = time.time()
 60 |         urls_dict = json.loads(response.text)
 61 |         for url_dict in urls_dict['data']:
 62 |             yield Request(response.urljoin(url_dict['source_url']), callback=self.detail_article)
 63 |         next_max_behot_time = urls_dict['next']['max_behot_time']
 64 |         if now_time_stamp_parse - self.now_time_stamp <= 60 * 10:
 65 |             yield Request(
 66 |                 'https://www.toutiao.com/api/pc/feed/?category=news_hot&utm_source=toutiao&widen=1&max_behot_time=%s' % next_max_behot_time,
 67 |                 callback=self.parse, priority=1)
 68 | 
 69 | 
 70 | class ToutiaoAllSpider(TouTiaoSpider):
 71 |     name = 'toutiao_all_spider'
 72 |     allowed_domains = ['www.toutiao.com']
 73 | 
 74 |     custom_settings = {
 75 |         # 渲染服务的url
 76 |         'SPLASH_URL': 'http://localhost:8050',
 77 | 
 78 |         # 下载器中间件
 79 |         'DOWNLOADER_MIDDLEWARES': {
 80 |             'scrapy_splash.SplashCookiesMiddleware': 723,
 81 |             'scrapy_splash.SplashMiddleware': 725,
 82 |             'scrapy.downloadermiddlewares.httpcompression.HttpCompressionMiddleware': 810,
 83 |         },
 84 |         'SPIDER_MIDDLEWARES': {
 85 |             'scrapy_splash.SplashDeduplicateArgsMiddleware': 100,
 86 |         },
 87 |         # 去重过滤器
 88 |         'DUPEFILTER_CLASS': 'scrapy_splash.SplashAwareDupeFilter',
 89 |         # 使用Splash的Http缓存
 90 |         'HTTPCACHE_STORAGE': 'scrapy_splash.SplashAwareFSCacheStorage',
 91 |         'CONCURRENT_REQUESTS': 3,
 92 |         # 'DOWNLOAD_DELAY': 0.1,
 93 |         'ITEM_PIPELINES': {
 94 | 
 95 |         },
 96 |         'LOG_LEVEL': 'INFO',
 97 |         # 'LOG_FILE': "/Users/xiaomayi/log/toutiao_all.log",
 98 |     }
 99 | 
100 |     rules = (
101 |         # todo:文章匹配规则优化
102 |         Rule(LinkExtractor(allow_domains=allowed_domains, allow=('.*\d{1,}.*')),
103 |              callback='detail_article', follow=True),
104 |         Rule(LinkExtractor(allow_domains=allowed_domains), process_request='splash_request', follow=True),
105 |     )
106 | 
107 |     def start_requests(self):
108 |         url = 'https://www.toutiao.com/a6676789786306413069/'
109 |         yield SplashRequest(url, dont_process_response=True, args={'wait': 0.5},
110 |                             meta={'real_url': url})
111 | 
112 |     def splash_request(self, request):
113 |         return SplashRequest(url=request.url, dont_process_response=True, args={'wait': 0.5},
114 |                              meta={'real_url': request.url})
115 | 
116 |     def _requests_to_follow(self, response):
117 |         if not isinstance(response, HtmlResponse):
118 |             return
119 |         seen = set()
120 |         try:
121 |             newresponse = response.replace(url=response.meta.get('real_url'))
122 |         except:
123 |             traceback.print_exc()
124 |             pass
125 |         for n, rule in enumerate(self._rules):
126 |             links = [lnk for lnk in rule.link_extractor.extract_links(newresponse)
127 |                      if lnk not in seen]
128 |             if links and rule.process_links:
129 |                 links = rule.process_links(links)
130 |             logging.info('%s response urls len %s' % (newresponse._url, len(links)))
131 |             for link in links:
132 |                 seen.add(link)
133 |                 r = self._build_request(n, link)
134 |                 yield rule.process_request(r)
135 | 
136 | 
137 | class ToutiaoAllSpider1(TouTiaoSpider):
138 |     name = 'toutiao_all_spider1'
139 | 
140 |     custom_settings = {
141 |         # 渲染服务的url
142 |         'SPLASH_URL': 'http://localhost:8050',
143 | 
144 |         # 下载器中间件
145 |         'DOWNLOADER_MIDDLEWARES': {
146 |             'scrapy_splash.SplashCookiesMiddleware': 723,
147 |             'scrapy_splash.SplashMiddleware': 725,
148 |             'scrapy.downloadermiddlewares.httpcompression.HttpCompressionMiddleware': 810,
149 |         },
150 |         'SPIDER_MIDDLEWARES': {
151 |             'scrapy_splash.SplashDeduplicateArgsMiddleware': 100,
152 |         },
153 |         # 去重过滤器
154 |         'DUPEFILTER_CLASS': 'scrapy_splash.SplashAwareDupeFilter',
155 |         # 使用Splash的Http缓存
156 |         'HTTPCACHE_STORAGE': 'scrapy_splash.SplashAwareFSCacheStorage',
157 |         'CONCURRENT_REQUESTS': 3,
158 |         # 'DOWNLOAD_DELAY': 0.1,
159 |         'ITEM_PIPELINES': {
160 | 
161 |         },
162 |         'LOG_LEVEL': 'DEBUG',
163 |         # 'LOG_FILE': "/Users/xiaomayi/log/toutiao_all.log",
164 |     }
165 | 
166 |     def start_requests(self):
167 |         url = 'https://search.jd.com/Search?keyword=%E8%A1%A3%E6%9C%8D'
168 |         # url = 'https://www.toutiao.com/a6676789786306413069/'
169 |         # url = 'http://gaia.imilive.cn/share.html?uid=0&videoid=116682377418697098&cc=TG45624'
170 |         yield SplashRequest(url, dont_process_response=True, args={'wait': 15},
171 |                             meta={'real_url': url}, callback=self.parse)
172 | 
173 |     def parse(self, response):
174 | 
175 |         pass
176 | 
177 |     def _requests_to_follow(self, response):
178 |         if not isinstance(response, HtmlResponse):
179 |             return
180 |         seen = set()
181 |         try:
182 |             newresponse = response.replace(url=response.meta.get('real_url'))
183 |         except:
184 |             traceback.print_exc()
185 |             pass
186 |         for n, rule in enumerate(self._rules):
187 |             links = [lnk for lnk in rule.link_extractor.extract_links(newresponse)
188 |                      if lnk not in seen]
189 |             if links and rule.process_links:
190 |                 links = rule.process_links(links)
191 |             logging.info('%s response urls len %s' % (newresponse._url, len(links)))
192 |             for link in links:
193 |                 seen.add(link)
194 |                 r = self._build_request(n, link)
195 |                 yield rule.process_request(r)


--------------------------------------------------------------------------------
/scrapy_auto/middlewares.py:
--------------------------------------------------------------------------------
  1 | # -*- coding: utf-8 -*-
  2 | 
  3 | # Define here the models for your spider middleware
  4 | #
  5 | # See documentation in:
  6 | # https://doc.scrapy.org/en/latest/topics/spider-middleware.html
  7 | import json
  8 | import logging
  9 | import random
 10 | import time
 11 | from collections import defaultdict
 12 | 
 13 | from scrapy import signals
 14 | from scrapy.downloadermiddlewares.httpproxy import HttpProxyMiddleware
 15 | from scrapy.exceptions import NotConfigured
 16 | from scrapy.http import HtmlResponse
 17 | from selenium.webdriver.android import webdriver
 18 | from selenium.webdriver.common.by import By
 19 | from selenium.webdriver.support import expected_conditions
 20 | from selenium.webdriver.support.wait import WebDriverWait
 21 | from sh import TimeoutException
 22 | from selenium.webdriver import FirefoxOptions
 23 | 
 24 | """
 25 | 1.爬虫代理中间件
 26 | 2,user-agent中间件
 27 | 
 28 | """
 29 | 
 30 | 
 31 | class ScrapyDemoSpiderMiddleware(object):
 32 |     # Not all methods need to be defined. If a method is not defined,
 33 |     # scrapy acts as if the spider middleware does not modify the
 34 |     # passed objects.
 35 | 
 36 |     @classmethod
 37 |     def from_crawler(cls, crawler):
 38 |         # This method is used by Scrapy to create your spiders.
 39 |         s = cls()
 40 |         crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
 41 |         return s
 42 | 
 43 |     def process_spider_input(self, response, spider):
 44 |         # Called for each response that goes through the spider
 45 |         # middleware and into the spider.
 46 | 
 47 |         # Should return None or raise an exception.
 48 |         return None
 49 | 
 50 |     def process_spider_output(self, response, result, spider):
 51 |         # Called with the results returned from the Spider, after
 52 |         # it has processed the response.
 53 | 
 54 |         # Must return an iterable of Request, dict or Item objects.
 55 |         for i in result:
 56 |             yield i
 57 | 
 58 |     def process_spider_exception(self, response, exception, spider):
 59 |         # Called when a spider or process_spider_input() method
 60 |         # (from other spider middleware) raises an exception.
 61 | 
 62 |         # Should return either None or an iterable of Response, dict
 63 |         # or Item objects.
 64 |         pass
 65 | 
 66 |     def process_start_requests(self, start_requests, spider):
 67 |         # Called with the start requests of the spider, and works
 68 |         # similarly to the process_spider_output() method, except
 69 |         # that it doesn’t have a response associated.
 70 | 
 71 |         # Must return only requests (not items).
 72 |         for r in start_requests:
 73 |             yield r
 74 | 
 75 |     def spider_opened(self, spider):
 76 |         spider.logger.info('Spider opened: %s' % spider.name)
 77 | 
 78 | 
 79 | class ScrapyDemoDownloaderMiddleware(object):
 80 |     # Not all methods need to be defined. If a method is not defined,
 81 |     # scrapy acts as if the downloader middleware does not modify the
 82 |     # passed objects.
 83 | 
 84 |     @classmethod
 85 |     def from_crawler(cls, crawler):
 86 |         # This method is used by Scrapy to create your spiders.
 87 |         s = cls()
 88 |         crawler.signals.connect(s.spider_opened, signal=signals.spider_opened)
 89 |         return s
 90 | 
 91 |     def process_request(self, request, spider):
 92 |         # Called for each request that goes through the downloader
 93 |         # middleware.
 94 | 
 95 |         # Must either:
 96 |         # - return None: continue processing this request
 97 |         # - or return a Response object
 98 |         # - or return a Request object
 99 |         # - or raise IgnoreRequest: process_exception() methods of
100 |         #   installed downloader middleware will be called
101 |         return None
102 | 
103 |     def process_response(self, request, response, spider):
104 |         # Called with the response returned from the downloader.
105 | 
106 |         # Must either;
107 |         # - return a Response object
108 |         # - return a Request object
109 |         # - or raise IgnoreRequest
110 |         return response
111 | 
112 |     def process_exception(self, request, exception, spider):
113 |         # Called when a download handler or a process_request()
114 |         # (from other downloader middleware) raises an exception.
115 | 
116 |         # Must either:
117 |         # - return None: continue processing this exception
118 |         # - return a Response object: stops process_exception() chain
119 |         # - return a Request object: stops process_exception() chain
120 |         pass
121 | 
122 |     def spider_opened(self, spider):
123 |         spider.logger.info('Spider opened: %s' % spider.name)
124 | 
125 |     def get_bai_jia_response(self, spider, request):
126 |         response = None
127 |         if request.url == spider.login_url:
128 |             opts = FirefoxOptions()
129 |             opts.add_argument("--headless")
130 |             driver = webdriver.Firefox(executable_path=spider.DRIVER_FIREFOX_HOME, firefox_options=opts)
131 |             driver.set_page_load_timeout(5)
132 |             try:
133 |                 driver.get(request.url)
134 |             except TimeoutException:
135 |                 logging.warn('time out 5s')
136 |                 element = WebDriverWait(driver, 120, 0.5).until(
137 |                     expected_conditions.presence_of_element_located((By.ID, "TANGRAM__PSP_4__footerULoginBtn")))
138 |                 put_login = driver.find_element_by_id('TANGRAM__PSP_4__footerULoginBtn')
139 |                 put_login.click()
140 |                 time.sleep(random.randint(1, 5))
141 | 
142 |                 name = driver.find_element_by_id('TANGRAM__PSP_4__userName')
143 |                 name.send_keys(request.meta['account']['user_name'])
144 |                 time.sleep(random.randint(1, 5))
145 | 
146 |                 password = driver.find_element_by_id('TANGRAM__PSP_4__password')
147 |                 password.send_keys(request.meta['account']['pwd'])
148 |                 time.sleep(random.randint(1, 5))
149 |                 enter = driver.find_element_by_id('TANGRAM__PSP_4__submit')
150 |                 enter.click()
151 |                 time.sleep(5)
152 |                 # element = WebDriverWait(driver, 60, 0.5).until(expected_conditions.presence_of_element_located((By.CLASS_NAME, "client_pages_home")))
153 |             while True:
154 |                 time.sleep(random.randint(30, 50))
155 |                 body = driver.page_source
156 |                 if '粉丝总人数' in body.encode('utf8'):
157 |                     logging.debug('login success===> %s' % request.meta['account']['user_name'])
158 |                     break
159 |                 try:
160 |                     driver.refresh()
161 |                     time.sleep(5)
162 |                 except:
163 |                     logging.warn('refresh failed in %s' % request.meta['account']['user_name'])
164 | 
165 |             cookies = driver.get_cookies()
166 |             account_cookie = {}
167 |             for cookie in cookies:
168 |                 if 'name' in list(cookie.keys()) and 'value' in list(cookie.keys()):
169 |                     account_cookie[cookie['name']] = cookie['value']
170 |             request.meta['cookie'] = account_cookie
171 |             response = HtmlResponse(url=driver.current_url, body=body.encode('utf-8'))
172 |             driver.quit()
173 |         return response
174 | 
175 | 
176 | class ScrapyDemoDownloaderProxyMiddleWare(object):
177 |     proxy_list = ["http://128.1.41.120:18283", ]
178 | 
179 |     def process_request(self, request, spider):
180 |         ip = random.choice(self.proxy_list)
181 |         request.meta['proxy'] = ip
182 | 
183 | 
184 | class RandomHttpProxyMiddleware(HttpProxyMiddleware):
185 |     """
186 |     代理中间件，为每一次请求提供随机代理
187 |     """
188 |     proxy_list = ["http://128.1.41.120:18283", ]
189 | 
190 |     def __init__(self, auth_encoding='latin-1', proxy_list_file=None):
191 |         if not proxy_list_file:
192 |             raise NotConfigured
193 |         self.auth_encoding = auth_encoding
194 |         self.proxies = defaultdict(list)
195 |         with open(proxy_list_file) as f:
196 |             proxy_list = json.load(f)
197 |             for proxy in proxy_list:
198 |                 scheme = proxy['proxy_scheme']
199 |                 url = proxy['proxy']
200 |                 self.proxies[scheme].append(self._get_proxy(url, scheme))
201 | 
202 |     @classmethod
203 |     def from_crawler(cls, crawler):
204 |         auth_encoding = crawler.settings.get('HTTPPROXY_AUTH_ENCODING', 'latain-1')
205 |         proxy_list_file = crawler.settings.get('HTTPPROXY_PROXY_LIST_FILE')
206 |         return cls(auth_encoding, proxy_list_file)
207 | 
208 |     def _set_proxy(self, request, scheme):
209 |         creds, proxy = random.choice(self.proxies[scheme])
210 |         request.meta['proxy'] = proxy
211 |         if creds:
212 |             request.headers['Proxy-Authorization'] = b'Basic ' + creds
213 | 
214 |     def process_request(self, request, spider):
215 |         ip = random.choice(self.proxy_list)
216 |         request.meta['proxy'] = ip
217 | 
218 | 
219 | class RandomUAMiddleware(HttpProxyMiddleware):
220 |     ua_list = [
221 | 
222 |     ]
223 | 
224 |     def process_request(self, request, spider):
225 |         ua = random.choice(self.ua_list)
226 | 


--------------------------------------------------------------------------------
/scrapy_auto/spiders/article_spiders.py:
--------------------------------------------------------------------------------
  1 | #!/usr/bin/python
  2 | # coding=utf8
  3 | # Copyright 2017 SARRS Inc. All Rights Reserved.
  4 | 
  5 | # @Time    : 2019/1/24 11:09
  6 | # @Author  : zengyang@tv365.net(ZengYang)
  7 | # @File    : article_spiders.py
  8 | # @Software: PyCharm
  9 | # @ToUse  :
 10 | import traceback
 11 | 
 12 | from scrapy_auto.config import parser_config
 13 | from scrapy.linkextractors import LinkExtractor
 14 | 
 15 | import time
 16 | from collections import Counter
 17 | import jieba
 18 | from scrapy.spiders import Rule, CrawlSpider
 19 | from scrapy_auto.items import ArticleItem
 20 | 
 21 | from scrapy_auto.tools.common_parser import del_html_attr, get_CN_str
 22 | 
 23 | 
 24 | class SpiderAll(CrawlSpider):
 25 | 
 26 |     def parse_article(self, response):
 27 |         item = ArticleItem()
 28 |         for key in list(parser_config['all_spider'].keys()):
 29 |             try:
 30 |                 item[key] = response.xpath(parser_config['all_spider'][key]).extract()[0].encode('utf-8') if len(
 31 |                     response.xpath(parser_config['all_spider'][key]).extract()) > 0 else ''
 32 |             except:
 33 |                 traceback.print_exc()
 34 |         for key in list(parser_config[self.name].keys()):
 35 |             try:
 36 |                 item[key] = response.xpath(parser_config[self.name][key]).extract()[0].encode('utf-8') if len(
 37 |                     response.xpath(parser_config[self.name][key]).extract()) > 0 else ''
 38 |             except:
 39 |                 traceback.print_exc()
 40 |         # url无法分辨的时候使用
 41 |         if item['content_original'] == '':
 42 |             self.log('*** not article url for %s' % response._url.encode('utf-8'))
 43 |             return
 44 |         item['fromURL'] = response._url.encode('utf-8')
 45 |         item['creat_date'] = time.strftime("%Y/%m/%d %H:%M:%S")
 46 |         item['content_clear'] = del_html_attr(item['content_original']).encode('utf-8')
 47 |         item['lenth'] = len(item['content_clear'].replace(' ', ''))
 48 | 
 49 |         jieba.enable_parallel(20)
 50 |         cn_str = get_CN_str(item['content_clear'])
 51 |         words = [x.encode('utf-8') for x in jieba.cut_for_search(cn_str)]
 52 |         article_keywords = [x for x in words if len(x) >= len('标签')]
 53 |         article_descr = [x for x in words if len(x) >= len('分词短语')]
 54 |         article_note = [x for x in words if len(x) >= len('分词文章摘要')]
 55 |         jieba.disable_parallel()
 56 | 
 57 |         article_keywords = Counter(article_keywords).most_common(20)
 58 |         article_descr = Counter(article_descr).most_common(10)
 59 |         article_note = Counter(article_note).most_common(5)
 60 |         item['keywords_by_app'] = ','.join([c[0] for c in article_keywords])
 61 |         item['descr_by_app'] = ','.join([c[0] for c in article_descr])
 62 |         item['note_by_app'] = ','.join([c[0] for c in article_note])
 63 |         return item
 64 | 
 65 |     def parse_content_answer(self, response):
 66 |         # todo:
 67 |         item = ArticleItem()
 68 |         '哈哈asas<>'
 69 |         return item
 70 | 
 71 | 
 72 | class CNYSSpider(SpiderAll):
 73 |     name = 'cnys_spider'
 74 |     allowed_domains = ['cnys.com']
 75 |     start_urls = [
 76 |         'http://www.cnys.com/',
 77 |     ]
 78 |     custom_settings = {
 79 |         'CONCURRENT_REQUESTS': 16,
 80 |         'DEPTH_LIMIT': 0,
 81 |     }
 82 | 
 83 |     rules = (
 84 |         Rule(LinkExtractor(allow='article/\d+.html$'), callback='parse_article', follow=True),
 85 |         Rule(LinkExtractor(allow_domains=allowed_domains, attrs=('href', 'src')), follow=True),
 86 |     )
 87 | 
 88 | 
 89 | class W39Spider(SpiderAll):
 90 |     """
 91 |     http://tj.39.net/a/20111012/1822655.html
 92 |     http://ask.39.net/question/49726864.html
 93 |     """
 94 |     name = 'w39_spider'
 95 |     allowed_domains = ['39.net']
 96 |     start_urls = [
 97 |         'http://www.39.net/',
 98 |     ]
 99 |     rules = (
100 |         Rule(LinkExtractor(allow='a/.*html$'), callback='parse_article', follow=True),
101 |         Rule(LinkExtractor(allow='question/.*html$'), callback='parse_content_answer', follow=True),
102 |         Rule(LinkExtractor(allow_domains=allowed_domains), follow=True),
103 |     )
104 | 
105 | 
106 | class VeryWellHealthSpider(SpiderAll):
107 |     name = 'verywellhealth_spider'
108 |     allowed_domains = ['verywellhealth.com']
109 | 
110 |     start_urls = [
111 |         'https://www.verywellhealth.com/',
112 |     ]
113 |     rules = (
114 |         Rule(LinkExtractor(allow=('.*-\d+.*')), callback='parse_article', follow=True),
115 |         Rule(LinkExtractor(allow_domains=allowed_domains, deny=('://.*/.*login.*',)), follow=True),
116 |     )
117 | 
118 | 
119 | class HealthSpider(SpiderAll):
120 |     name = 'health_spider'
121 |     allowed_domains = ['health.com']
122 | 
123 |     start_urls = [
124 |         'https://www.health.com/',
125 |     ]
126 |     rules = (
127 |         Rule(LinkExtractor(allow=('.*')), callback='parse_article', follow=True),
128 |         Rule(LinkExtractor(allow_domains=allowed_domains, deny=('://.*/.*login.*',)), follow=True),
129 |     )
130 | 
131 | 
132 | class WebmdSpider(SpiderAll):
133 |     name = 'webmd_spider'
134 |     allowed_domains = ['webmd.com']
135 | 
136 |     start_urls = [
137 |         'https://www.webmd.com/',
138 |     ]
139 |     rules = (
140 |         Rule(LinkExtractor(allow=('.*')), callback='parse_article', follow=True),
141 |         Rule(LinkExtractor(allow_domains=allowed_domains, deny=('://.*/.*login.*',)), follow=True),
142 |     )
143 | 
144 | 
145 | class WikihowSpider(SpiderAll):
146 |     name = 'wikihow_spider'
147 |     allowed_domains = ['wikihow.com']
148 | 
149 |     start_urls = [
150 |         'https://www.wikihow.com/',
151 |     ]
152 |     rules = (
153 |         Rule(LinkExtractor(allow=('.*')), callback='parse_article', follow=True),
154 |         Rule(LinkExtractor(allow_domains=allowed_domains, deny=('://.*/.*login.*',)), follow=True),
155 |     )
156 | 
157 | 
158 | class ToutiaoSpider(SpiderAll):
159 |     name = 'toutiao_spider'
160 |     allowed_domains = ['toutiao.com']
161 | 
162 |     start_urls = [
163 |         'https://www.toutiao.com/',
164 |     ]
165 |     rules = (
166 |         Rule(LinkExtractor(allow=('.*')), callback='parse_article', follow=True),
167 |         Rule(LinkExtractor(allow_domains=allowed_domains, deny=('://.*/.*login.*',)), follow=True),
168 |     )
169 | 
170 | 
171 | class HealthSohuSpider(SpiderAll):
172 |     name = 'health_sohu_spider'
173 |     allowed_domains = ['health.sohu.com']
174 | 
175 |     start_urls = [
176 |         'http://health.sohu.com/',
177 |     ]
178 |     rules = (
179 |         Rule(LinkExtractor(allow=('.*')), callback='parse_article', follow=True),
180 |         Rule(LinkExtractor(allow_domains=allowed_domains, deny=('://.*/.*login.*',)), follow=True),
181 |     )
182 | 
183 | 
184 | class HealthSinaSpider(SpiderAll):
185 |     name = 'health_sina_spider'
186 |     allowed_domains = ['health.sina.com']
187 | 
188 |     start_urls = [
189 |         'http://health.sina.com.cn/',
190 |     ]
191 |     rules = (
192 |         Rule(LinkExtractor(allow=('.*')), callback='parse_article', follow=True),
193 |         Rule(LinkExtractor(allow_domains=allowed_domains, deny=('://.*/.*login.*',)), follow=True),
194 |     )
195 | 
196 | 
197 | class AnswersSpider(SpiderAll):
198 |     name = 'answers_spider'
199 |     allowed_domains = ['answers.com']
200 | 
201 |     start_urls = [
202 |         'http://www.answers.com/',
203 |     ]
204 |     rules = (
205 |         Rule(LinkExtractor(allow=('.*')), callback='parse_article', follow=True),
206 |         Rule(LinkExtractor(allow_domains=allowed_domains, deny=('://.*/.*login.*',)), follow=True),
207 |     )
208 | 
209 | 
210 | class Ask39Spider(SpiderAll):
211 |     name = 'ask_39_spider'
212 |     allowed_domains = ['ask.39.net']
213 | 
214 |     start_urls = [
215 |         'http://ask.39.net/',
216 |     ]
217 |     rules = (
218 |         Rule(LinkExtractor(allow=('.*')), callback='parse_article', follow=True),
219 |         Rule(LinkExtractor(allow_domains=allowed_domains, deny=('://.*/.*login.*',)), follow=True),
220 |     )
221 | 
222 | 
223 | class AnswersYahooSpider(SpiderAll):
224 |     name = 'answers_yahoo_spider'
225 |     allowed_domains = ['answers.yahoo.com']
226 | 
227 |     start_urls = [
228 |         'https://answers.yahoo.com/',
229 |     ]
230 |     rules = (
231 |         Rule(LinkExtractor(allow=('.*')), callback='parse_article', follow=True),
232 |         Rule(LinkExtractor(allow_domains=allowed_domains, deny=('://.*/.*login.*',)), follow=True),
233 |     )
234 | 
235 | 
236 | class ZhidaoBaiduSpider(SpiderAll):
237 |     name = 'zhidao_baidu_spider'
238 |     allowed_domains = ['zhidao.baidu.com']
239 | 
240 |     start_urls = [
241 |         'https://zhidao.baidu.com/',
242 |     ]
243 |     rules = (
244 |         Rule(LinkExtractor(allow=('.*')), callback='parse_article', follow=True),
245 |         Rule(LinkExtractor(allow_domains=allowed_domains, deny=('://.*/.*login.*',)), follow=True),
246 |     )
247 | 
248 | 
249 | class EditionSpider(SpiderAll):
250 |     name = 'edition_health_spider'
251 |     allowed_domains = ['edition.cnn.com/health']
252 |     'https://edition.cnn.com/2019/02/13/health/nuedexta-doj-investigation-invs/index.html'
253 | 
254 |     start_urls = [
255 |         'https://edition.cnn.com/health',
256 |     ]
257 |     rules = (
258 |         Rule(LinkExtractor(allow=('.*')), callback='parse_article', follow=True),
259 |         Rule(LinkExtractor(allow_domains=allowed_domains, deny=('://.*/.*login.*',)), follow=True),
260 |     )
261 | 
262 | 
263 | # 以下使用代理
264 | class ParadeSpider(SpiderAll):
265 |     name = 'parade_spider'
266 |     allowed_domains = ['parade.com']
267 | 
268 |     start_urls = [
269 |         'https://parade.com/',
270 |     ]
271 |     rules = (
272 |         Rule(LinkExtractor(allow='.*', attrs=('href',), ), callback='parse_article', follow=True),
273 |         Rule(LinkExtractor(allow_domains=allowed_domains), follow=True),
274 |     )
275 | 
276 | 
277 | class DemoSpider(SpiderAll):
278 |     name = 'wsj_spider'
279 |     allowed_domains = ['wsj.com']
280 | 
281 |     start_urls = [
282 |         'https://www.wsj.com/',
283 |     ]
284 |     rules = (
285 |         Rule(LinkExtractor(allow='.*', attrs=('href',), ), callback='parse_article', follow=True),
286 |         Rule(LinkExtractor(allow_domains=allowed_domains), follow=True),
287 |     )
288 | 
289 | 
290 | 
291 | 


--------------------------------------------------------------------------------
/scrapy_auto/unit_test/httpsProxys.py:
--------------------------------------------------------------------------------
  1 | #!/usr/bin/python
  2 | # coding=utf8
  3 | # Copyright 2017 SARRS Inc. All Rights Reserved.
  4 | 
  5 | # @Time    : 2019/4/3 23:08
  6 | # @Author  : 504747754@qq.com(ZengYang)
  7 | # @File    : httpsProxys.py.py
  8 | # @Software: PyCharm
  9 | # @ToUse  :
 10 | 
 11 | # -*- coding:utf-8 -*-
 12 | import urllib.request, urllib.parse, urllib.error
 13 | import urllib.request, urllib.error, urllib.parse
 14 | import random
 15 | from lxml import etree
 16 | from bs4 import BeautifulSoup
 17 | from selenium import webdriver
 18 | import re
 19 | # import time
 20 | # import datetime
 21 | import os
 22 | 
 23 | 
 24 | def get_html(url):
 25 |     request = urllib.request.Request(url)
 26 |     request.add_header("User-Agent",
 27 |                        "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36")
 28 |     html = urllib.request.urlopen(request)
 29 |     print(html.getcode())
 30 |     return html.read()
 31 | 
 32 | 
 33 | # 获取快代理上可用的HTTPS代理IP
 34 | def fetch_kuaidaili():
 35 |     startUrl = 'http://www.kuaidaili.com/proxylist/'
 36 |     proxys = []
 37 |     for i in range(1, 11):
 38 |         url = startUrl + str(i) + '/'
 39 |         html = etree.HTML(get_html(url))
 40 |         trs = html.xpath('//*[@id="index_free_list"]/table/tbody/tr')
 41 |         for line in range(10):
 42 |             td_type = trs[line].xpath('td[4]/text()')[0]
 43 |             if 'HTTPS' in td_type:  # 判断是否为HTTPS代理，不是则不抓取
 44 |                 td_speed = trs[line].xpath('td[7]/text()')[0][:-1:]
 45 |                 if float(td_speed) < 1.0:
 46 |                     td_ip = trs[line].xpath('td[1]/text()')[0]
 47 |                     td_port = trs[line].xpath('td[2]/text()')[0]
 48 |                     ip = td_ip + ':' + str(td_port)
 49 |                     proxys.append(ip)
 50 |     useFullIp = testIp([x.strip() for x in proxys])
 51 |     print(('from kuaidaili...%s' % len(useFullIp)))
 52 |     return useFullIp
 53 | 
 54 | 
 55 | # kxdaili,获取可用的HTTPS代理IP
 56 | def fetch_kxdaili():
 57 |     startUrl = 'http://www.kxdaili.com/ipList/'  # 地址随时可能变动需要添加处理机制
 58 |     proxys = []
 59 |     for i in range(1, 11):
 60 |         url = startUrl + str(i) + '.html'
 61 |         html = etree.HTML(get_html(url))
 62 |         trs = html.xpath('//*[@id="nav_btn01"]/div[5]/table/tbody/tr')
 63 |         for line in range(len(trs)):
 64 |             td_type = trs[line].xpath('td[4]/text()')[0]
 65 |             if 'HTTPS' in td_type:  # 判断是否为HTTPS代理，不是则不抓取
 66 |                 td_speed = trs[line].xpath('td[5]/text()')[0].split('.')[0]
 67 |                 if int(td_speed) < 1:
 68 |                     td_ip = trs[line].xpath('td[1]/text()')[0]
 69 |                     td_port = trs[line].xpath('td[2]/text()')[0]
 70 |                     ip = td_ip + ':' + str(td_port)
 71 |                     proxys.append(ip)
 72 |     useFullIp = testIp([x.strip() for x in proxys])
 73 | 
 74 |     print(('from kxdaili...%s' % len(useFullIp)))
 75 |     # print useFullIp
 76 |     return useFullIp
 77 | 
 78 | 
 79 | # 这个瑶瑶代理可用的IP太少!!!
 80 | def fetch_yaoyaodaili():
 81 |     startUrl = 'http://www.httpsdaili.com/free.asp?page='
 82 |     proxys = []
 83 |     for i in range(1, 8):
 84 |         url = startUrl + str(i)
 85 |         html = etree.HTML(get_html(url))
 86 |         trs = html.xpath('//*[@id="list"]/table/tbody/tr')
 87 |         for line in range(len(trs)):
 88 |             td_type = trs[line].xpath('td[4]/text()')[0]
 89 |             if 'HTTPS' in td_type:
 90 |                 td_speed = trs[line].xpath('td[6]/text()')[0]
 91 |                 if '0秒' == td_speed:
 92 |                     td_ip = trs[line].xpath('td[1]/text()')[0]
 93 |                     td_port = trs[line].xpath('td[2]/text()')[0]
 94 |                     ip = td_ip + ':' + td_port
 95 |                     proxys.append(ip)
 96 | 
 97 |     useFullIp = testIp([x.strip() for x in proxys])
 98 |     print(('from httpsdaili...%s' % len(useFullIp)))
 99 |     return useFullIp
100 | 
101 | 
102 | # 获取西刺速度小于5秒的HTTPS代理
103 | def fetch_xici():
104 |     startUrl = 'http://www.xicidaili.com/wn/1'
105 |     proxys = []
106 |     html = etree.HTML(get_html(startUrl))
107 |     tables = html.xpath('//table[@id="ip_list"]')
108 |     trs = tables[0].xpath('tr')
109 |     for line in trs[1:]:
110 |         td_type = line.xpath('td[6]/text()')[0].strip()
111 |         if 'HTTPS' == td_type:
112 |             td_speed = line.xpath('td[7]/div/@title')[0].strip()[:-1]
113 |             if float(td_speed) < 5:
114 |                 td_ip = line.xpath('td[2]/text()')[0].strip()
115 |                 td_port = line.xpath('td[3]/text()')[0].strip()
116 |                 ip = td_ip + ':' + td_port
117 |                 proxys.append(ip)
118 |     useFullIp = testIp([x.strip() for x in proxys])
119 |     print("from xici ... %s" % len(useFullIp))
120 |     return useFullIp
121 | 
122 | 
123 | # 年少HTTPS代理，国外代理,用不着..
124 | def fetch_nianshao():
125 |     startUrl = 'http://www.nianshao.me/?stype=2&page='
126 |     proxys = []
127 |     for i in range(1, 50):
128 |         url = startUrl + str(i)
129 |         html = etree.HTML(get_html(url))
130 |         trs = html.xpath('//tr')
131 |         for line in trs[1:]:
132 |             td_type = line.xpath('td[5]/text()')[0].strip()
133 |             if "HTTPS" == td_type:
134 |                 td_speed = line.xpath('td[6]/div/div/@style')[0].strip()[6:8]
135 |                 if int(td_speed) >= 70:
136 |                     td_ip = line.xpath('td[1]/text()')[0].strip()
137 |                     td_port = line.xpath('td[2]/text()')[0].strip()
138 |                     ip = td_ip + ":" + td_port
139 |                     proxys.append(ip)
140 |     useFullIp = testIp([x.strip() for x in proxys])
141 |     print("from nianshao ... %s" % len(useFullIp))
142 |     print(useFullIp)
143 | 
144 | 
145 | # 360代理IPHTTPS高匿部分
146 | def fetch_swei360():
147 |     startUrl = 'http://www.swei360.com/free/?page='
148 |     proxys = []
149 |     for i in range(1, 8):
150 |         url = startUrl + str(i)
151 |         html = etree.HTML(get_html(url))
152 |         trs = html.xpath('//tr')
153 |         for line in trs[1:]:
154 |             td_type = line.xpath('td[4]/text()')[0].strip()
155 |             if "HTTPS" == td_type:
156 |                 td_hide = line.xpath('td[3]/text()')[0].strip()
157 |                 if '高匿' in td_hide:
158 |                     td_speed = line.xpath('td[6]/text()')[0].strip()[:-1]
159 |                     if int(td_speed) <= 5:
160 |                         td_ip = line.xpath('td[1]/text()')[0].strip()
161 |                         td_port = line.xpath('td[2]/text()')[0].strip()
162 |                         ip = td_ip + ":" + td_port
163 |                         proxys.append(ip)
164 |     useFullIp = testIp([x.strip() for x in proxys])
165 |     print("from swei360 ... %s" % len(useFullIp))
166 |     return useFullIp
167 | 
168 | 
169 | # 获取ip3366的7页HTTPS代理IP
170 | def fetch_ip3366():
171 |     startUrl = 'http://www.ip3366.net/free/?stype=1&page='
172 |     proxys = []
173 |     for i in range(1, 8):
174 |         url = startUrl + str(i)
175 |         html = etree.HTML(get_html(url))
176 |         trs = html.xpath('//tr')
177 |         for line in trs[1:]:
178 |             td_type = line.xpath('td[4]/text()')[0].strip()
179 |             if "HTTPS" == td_type:
180 |                 td_speed = line.xpath('td[6]/text()')[0].strip()[:-1]
181 |                 if int(td_speed) <= 5:
182 |                     td_ip = line.xpath('td[1]/text()')[0].strip()
183 |                     td_port = line.xpath('td[2]/text()')[0].strip()
184 |                     ip = td_ip + ":" + td_port
185 |                     proxys.append(ip)
186 |     useFullIp = testIp([x.strip() for x in proxys])
187 |     print("from ip3366 ...%s" % len(useFullIp))
188 |     return useFullIp
189 | 
190 | 
191 | # 提取秘密代理IP前4页的代理
192 | def fetch_mimiip():
193 |     startUrl = 'http://www.mimiip.com/gngao/'
194 |     proxys = []
195 |     for i in range(1, 5):
196 |         url = startUrl + str(i)
197 |         html = etree.HTML(get_html(url))
198 |         trs = html.xpath('//tr')
199 |         for line in trs[1:]:
200 |             td_type = line.xpath('td[5]/text()')[0].strip()
201 |             if "HTTPS" == td_type:
202 |                 td_speed = line.xpath('td[6]/div/@style')[0].strip()[6:-2]
203 |                 if int(td_speed) >= 70:
204 |                     td_ip = line.xpath('td[1]/text()')[0].strip()
205 |                     td_port = line.xpath('td[2]/text()')[0].strip()
206 |                     ip = td_ip + ":" + td_port
207 |                     proxys.append(ip)
208 |     useFullIp = testIp([x.strip() for x in proxys])
209 |     print("from mimiip ...%s" % len(useFullIp))
210 |     return useFullIp
211 | 
212 | 
213 | # 获取IP巴士前6页
214 | def fetch_ip84():
215 |     startUrl = 'http://ip84.com/gn/'
216 |     proxys = []
217 |     for i in range(1, 7):
218 |         url = startUrl + str(i)
219 |         html = etree.HTML(get_html(url))
220 |         trs = html.xpath('//tr')
221 |         for line in trs[1:]:
222 |             td_type = line.xpath('td[5]/text()')[0].strip()
223 |             if "HTTPS" == td_type:
224 |                 td_speed = line.xpath('td[6]/text()')[0].strip()[:-1]
225 |                 if int(td_speed) <= 5:
226 |                     td_ip = line.xpath('td[1]/text()')[0].strip()
227 |                     td_port = line.xpath('td[2]/text()')[0].strip()
228 |                     ip = td_ip + ":" + td_port
229 |                     proxys.append(ip)
230 |     useFullIp = testIp([x.strip() for x in proxys])
231 |     print("from ip84 ...%s" % len(useFullIp))
232 |     return useFullIp
233 | 
234 | 
235 | # 安小莫匿名IP提取api,提取最大800个
236 | def fetch_66ip():
237 |     startUrl = 'http://www.66ip.cn/nmtq.php?getnum=800&isp=0&anonymoustype=3&start=&ports=&export=&ipaddress=&area=1&proxytype=1&api=66ip'
238 |     # driver = webdriver.PhantomJS()
239 |     # driver.get(startUrl)
240 |     # soup = BeautifulSoup(driver.page_source,"lxml")
241 |     soup = BeautifulSoup(get_html(startUrl))
242 |     body = soup.body.find_all(text=re.compile('\d+\.\d+\.\d+\.\d+:\d+'))
243 |     body = [x.strip() for x in body]
244 |     useFullIp = testIp(body)
245 |     print(('from 66ip...%s' % len(useFullIp)))
246 |     return useFullIp
247 | 
248 | 
249 | # 测试代理IP是否可用,传入ip列表，返回可用ip列表
250 | def testIp(ip_list):
251 |     useFullIp = []
252 |     for ip in ip_list:
253 |         response = urllib.request.urlopen('https://www.baidu.com/', proxies={'https//': ip})
254 |         if response.getcode() == 200:
255 |             useFullIp.append(ip)
256 |     return useFullIp
257 | 
258 | 
259 | def NEWHTTPS():
260 |     ip1 = fetch_kuaidaili()
261 |     ip2 = fetch_kxdaili()
262 |     ip3 = fetch_yaoyaodaili()
263 |     ip4 = fetch_66ip()
264 |     ip5 = fetch_xici()
265 |     ip6 = fetch_swei360()
266 |     ip7 = fetch_ip3366()
267 |     ip8 = fetch_mimiip()
268 |     ip9 = fetch_ip84()
269 |     https_list = list(set(ip1 + ip2 + ip3 + ip4 + ip5 + ip6 + ip7 + ip8 + ip9))
270 |     print(('HTTPS Proxy Ip is OK ...%s' % len(https_list)))
271 |     pass
272 | 
273 | 
274 | if __name__ == '__main__':
275 |     NEWHTTPS()
276 | 


--------------------------------------------------------------------------------
/.idea/dbnavigator.xml:
--------------------------------------------------------------------------------
  1 | <?xml version="1.0" encoding="UTF-8"?>
  2 | <project version="4">
  3 |   <component name="DBNavigator.Project.DataEditorManager">
  4 |     <record-view-column-sorting-type value="BY_INDEX" />
  5 |     <value-preview-text-wrapping value="false" />
  6 |     <value-preview-pinned value="false" />
  7 |   </component>
  8 |   <component name="DBNavigator.Project.DataExportManager">
  9 |     <export-instructions>
 10 |       <create-header value="true" />
 11 |       <quote-values-containing-separator value="true" />
 12 |       <quote-all-values value="false" />
 13 |       <value-separator value="" />
 14 |       <file-name value="" />
 15 |       <file-location value="" />
 16 |       <scope value="GLOBAL" />
 17 |       <destination value="FILE" />
 18 |       <format value="EXCEL" />
 19 |       <charset value="GBK" />
 20 |     </export-instructions>
 21 |   </component>
 22 |   <component name="DBNavigator.Project.DatabaseBrowserManager">
 23 |     <autoscroll-to-editor value="false" />
 24 |     <autoscroll-from-editor value="true" />
 25 |     <show-object-properties value="true" />
 26 |     <loaded-nodes />
 27 |   </component>
 28 |   <component name="DBNavigator.Project.DatabaseConsoleManager">
 29 |     <connection id="34d6b52e-b892-4aed-adcd-10fa89b0474c">
 30 |       <console name="Connection" type="STANDARD" schema="crawl_data" session="Main"><![CDATA[use crawl_data;
 31 | select * from job;]]></console>
 32 |     </connection>
 33 |   </component>
 34 |   <component name="DBNavigator.Project.DatabaseFileManager">
 35 |     <open-files />
 36 |   </component>
 37 |   <component name="DBNavigator.Project.DatabaseSessionManager">
 38 |     <connection id="34d6b52e-b892-4aed-adcd-10fa89b0474c" />
 39 |   </component>
 40 |   <component name="DBNavigator.Project.DatasetFilterManager">
 41 |     <filter-actions connection-id="34d6b52e-b892-4aed-adcd-10fa89b0474c" dataset="crawl_data.job" active-filter-id="" />
 42 |   </component>
 43 |   <component name="DBNavigator.Project.EditorStateManager">
 44 |     <last-used-providers />
 45 |   </component>
 46 |   <component name="DBNavigator.Project.MethodExecutionManager">
 47 |     <method-browser />
 48 |     <execution-history>
 49 |       <group-entries value="true" />
 50 |       <execution-inputs />
 51 |     </execution-history>
 52 |     <argument-values-cache />
 53 |   </component>
 54 |   <component name="DBNavigator.Project.ObjectDependencyManager">
 55 |     <last-used-dependency-type value="INCOMING" />
 56 |   </component>
 57 |   <component name="DBNavigator.Project.ObjectQuickFilterManager">
 58 |     <last-used-operator value="EQUAL" />
 59 |     <filters />
 60 |   </component>
 61 |   <component name="DBNavigator.Project.ScriptExecutionManager" clear-outputs="true">
 62 |     <recently-used-interfaces />
 63 |   </component>
 64 |   <component name="DBNavigator.Project.Settings">
 65 |     <connections>
 66 |       <connection id="34d6b52e-b892-4aed-adcd-10fa89b0474c" active="true">
 67 |         <database>
 68 |           <name value="Connection" />
 69 |           <description value="爬虫服务数据库" />
 70 |           <database-type value="MYSQL" />
 71 |           <config-type value="BASIC" />
 72 |           <database-version value="5.6" />
 73 |           <driver-source value="BUILTIN" />
 74 |           <driver-library value="" />
 75 |           <driver value="" />
 76 |           <url-type value="DATABASE" />
 77 |           <host value="47.105.142.45" />
 78 |           <port value="3306" />
 79 |           <database value="crawl_data" />
 80 |           <os-authentication value="false" />
 81 |           <empty-authentication value="false" />
 82 |           <user value="root" />
 83 |           <deprecated-pwd value="emVuZyFAIzQ1Ng==" />
 84 |         </database>
 85 |         <properties>
 86 |           <auto-commit value="true" />
 87 |         </properties>
 88 |         <ssh-settings>
 89 |           <active value="false" />
 90 |           <proxy-host value="" />
 91 |           <proxy-port value="22" />
 92 |           <proxy-user value="" />
 93 |           <deprecated-proxy-pwd value="" />
 94 |           <auth-type value="PASSWORD" />
 95 |           <key-file value="" />
 96 |           <key-passphrase value="" />
 97 |         </ssh-settings>
 98 |         <ssl-settings>
 99 |           <active value="false" />
100 |           <certificate-authority-file value="" />
101 |           <client-certificate-file value="" />
102 |           <client-key-file value="" />
103 |         </ssl-settings>
104 |         <details>
105 |           <charset value="UTF-8" />
106 |           <session-management value="true" />
107 |           <ddl-file-binding value="true" />
108 |           <database-logging value="false" />
109 |           <connect-automatically value="true" />
110 |           <restore-workspace value="true" />
111 |           <restore-workspace-deep value="true" />
112 |           <environment-type value="default" />
113 |           <idle-time-to-disconnect value="30" />
114 |           <idle-time-to-disconnect-pool value="5" />
115 |           <credential-expiry-time value="10" />
116 |           <max-connection-pool-size value="7" />
117 |           <alternative-statement-delimiter value="" />
118 |         </details>
119 |         <object-filters hide-empty-schemas="false">
120 |           <object-type-filter use-master-settings="true">
121 |             <object-type name="SCHEMA" enabled="true" />
122 |             <object-type name="USER" enabled="true" />
123 |             <object-type name="ROLE" enabled="true" />
124 |             <object-type name="PRIVILEGE" enabled="true" />
125 |             <object-type name="CHARSET" enabled="true" />
126 |             <object-type name="TABLE" enabled="true" />
127 |             <object-type name="VIEW" enabled="true" />
128 |             <object-type name="MATERIALIZED_VIEW" enabled="true" />
129 |             <object-type name="NESTED_TABLE" enabled="true" />
130 |             <object-type name="COLUMN" enabled="true" />
131 |             <object-type name="INDEX" enabled="true" />
132 |             <object-type name="CONSTRAINT" enabled="true" />
133 |             <object-type name="DATASET_TRIGGER" enabled="true" />
134 |             <object-type name="DATABASE_TRIGGER" enabled="true" />
135 |             <object-type name="SYNONYM" enabled="true" />
136 |             <object-type name="SEQUENCE" enabled="true" />
137 |             <object-type name="PROCEDURE" enabled="true" />
138 |             <object-type name="FUNCTION" enabled="true" />
139 |             <object-type name="PACKAGE" enabled="true" />
140 |             <object-type name="TYPE" enabled="true" />
141 |             <object-type name="TYPE_ATTRIBUTE" enabled="true" />
142 |             <object-type name="ARGUMENT" enabled="true" />
143 |             <object-type name="DIMENSION" enabled="true" />
144 |             <object-type name="CLUSTER" enabled="true" />
145 |             <object-type name="DBLINK" enabled="true" />
146 |           </object-type-filter>
147 |           <object-name-filters />
148 |         </object-filters>
149 |       </connection>
150 |     </connections>
151 |     <browser-settings>
152 |       <general>
153 |         <display-mode value="TABBED" />
154 |         <navigation-history-size value="100" />
155 |         <show-object-details value="false" />
156 |       </general>
157 |       <filters>
158 |         <object-type-filter>
159 |           <object-type name="SCHEMA" enabled="true" />
160 |           <object-type name="USER" enabled="true" />
161 |           <object-type name="ROLE" enabled="true" />
162 |           <object-type name="PRIVILEGE" enabled="true" />
163 |           <object-type name="CHARSET" enabled="true" />
164 |           <object-type name="TABLE" enabled="true" />
165 |           <object-type name="VIEW" enabled="true" />
166 |           <object-type name="MATERIALIZED_VIEW" enabled="true" />
167 |           <object-type name="NESTED_TABLE" enabled="true" />
168 |           <object-type name="COLUMN" enabled="true" />
169 |           <object-type name="INDEX" enabled="true" />
170 |           <object-type name="CONSTRAINT" enabled="true" />
171 |           <object-type name="DATASET_TRIGGER" enabled="true" />
172 |           <object-type name="DATABASE_TRIGGER" enabled="true" />
173 |           <object-type name="SYNONYM" enabled="true" />
174 |           <object-type name="SEQUENCE" enabled="true" />
175 |           <object-type name="PROCEDURE" enabled="true" />
176 |           <object-type name="FUNCTION" enabled="true" />
177 |           <object-type name="PACKAGE" enabled="true" />
178 |           <object-type name="TYPE" enabled="true" />
179 |           <object-type name="TYPE_ATTRIBUTE" enabled="true" />
180 |           <object-type name="ARGUMENT" enabled="true" />
181 |           <object-type name="DIMENSION" enabled="true" />
182 |           <object-type name="CLUSTER" enabled="true" />
183 |           <object-type name="DBLINK" enabled="true" />
184 |         </object-type-filter>
185 |       </filters>
186 |       <sorting>
187 |         <object-type name="COLUMN" sorting-type="NAME" />
188 |         <object-type name="FUNCTION" sorting-type="NAME" />
189 |         <object-type name="PROCEDURE" sorting-type="NAME" />
190 |         <object-type name="ARGUMENT" sorting-type="POSITION" />
191 |       </sorting>
192 |       <default-editors>
193 |         <object-type name="VIEW" editor-type="SELECTION" />
194 |         <object-type name="PACKAGE" editor-type="SELECTION" />
195 |         <object-type name="TYPE" editor-type="SELECTION" />
196 |       </default-editors>
197 |     </browser-settings>
198 |     <navigation-settings>
199 |       <lookup-filters>
200 |         <lookup-objects>
201 |           <object-type name="SCHEMA" enabled="true" />
202 |           <object-type name="USER" enabled="false" />
203 |           <object-type name="ROLE" enabled="false" />
204 |           <object-type name="PRIVILEGE" enabled="false" />
205 |           <object-type name="CHARSET" enabled="false" />
206 |           <object-type name="TABLE" enabled="true" />
207 |           <object-type name="VIEW" enabled="true" />
208 |           <object-type name="MATERIALIZED VIEW" enabled="true" />
209 |           <object-type name="NESTED TABLE" enabled="false" />
210 |           <object-type name="COLUMN" enabled="false" />
211 |           <object-type name="INDEX" enabled="true" />
212 |           <object-type name="CONSTRAINT" enabled="true" />
213 |           <object-type name="DATASET TRIGGER" enabled="true" />
214 |           <object-type name="DATABASE TRIGGER" enabled="true" />
215 |           <object-type name="SYNONYM" enabled="false" />
216 |           <object-type name="SEQUENCE" enabled="true" />
217 |           <object-type name="PROCEDURE" enabled="true" />
218 |           <object-type name="FUNCTION" enabled="true" />
219 |           <object-type name="PACKAGE" enabled="true" />
220 |           <object-type name="TYPE" enabled="true" />
221 |           <object-type name="TYPE ATTRIBUTE" enabled="false" />
222 |           <object-type name="ARGUMENT" enabled="false" />
223 |           <object-type name="DIMENSION" enabled="false" />
224 |           <object-type name="CLUSTER" enabled="false" />
225 |           <object-type name="DBLINK" enabled="true" />
226 |         </lookup-objects>
227 |         <force-database-load value="false" />
228 |         <prompt-connection-selection value="true" />
229 |         <prompt-schema-selection value="true" />
230 |       </lookup-filters>
231 |     </navigation-settings>
232 |     <dataset-grid-settings>
233 |       <general>
234 |         <enable-zooming value="true" />
235 |         <enable-column-tooltip value="true" />
236 |       </general>
237 |       <sorting>
238 |         <nulls-first value="true" />
239 |         <max-sorting-columns value="4" />
240 |       </sorting>
241 |       <tracking-columns>
242 |         <columnNames value="" />
243 |         <visible value="true" />
244 |         <editable value="false" />
245 |       </tracking-columns>
246 |     </dataset-grid-settings>
247 |     <dataset-editor-settings>
248 |       <text-editor-popup>
249 |         <active value="false" />
250 |         <active-if-empty value="false" />
251 |         <data-length-threshold value="100" />
252 |         <popup-delay value="1000" />
253 |       </text-editor-popup>
254 |       <values-actions-popup>
255 |         <show-popup-button value="true" />
256 |         <element-count-threshold value="1000" />
257 |         <data-length-threshold value="250" />
258 |       </values-actions-popup>
259 |       <general>
260 |         <fetch-block-size value="100" />
261 |         <fetch-timeout value="30" />
262 |         <trim-whitespaces value="true" />
263 |         <convert-empty-strings-to-null value="true" />
264 |         <select-content-on-cell-edit value="true" />
265 |         <large-value-preview-active value="true" />
266 |       </general>
267 |       <filters>
268 |         <prompt-filter-dialog value="true" />
269 |         <default-filter-type value="BASIC" />
270 |       </filters>
271 |       <qualified-text-editor text-length-threshold="300">
272 |         <content-types>
273 |           <content-type name="Text" enabled="true" />
274 |           <content-type name="Properties" enabled="true" />
275 |           <content-type name="XML" enabled="true" />
276 |           <content-type name="DTD" enabled="true" />
277 |           <content-type name="HTML" enabled="true" />
278 |           <content-type name="XHTML" enabled="true" />
279 |           <content-type name="SQL" enabled="true" />
280 |           <content-type name="PL/SQL" enabled="true" />
281 |           <content-type name="YAML" enabled="true" />
282 |         </content-types>
283 |       </qualified-text-editor>
284 |       <record-navigation>
285 |         <navigation-target value="VIEWER" />
286 |       </record-navigation>
287 |     </dataset-editor-settings>
288 |     <code-editor-settings>
289 |       <general>
290 |         <show-object-navigation-gutter value="false" />
291 |         <show-spec-declaration-navigation-gutter value="true" />
292 |         <enable-spellchecking value="true" />
293 |         <enable-reference-spellchecking value="false" />
294 |       </general>
295 |       <confirmations>
296 |         <save-changes value="false" />
297 |         <revert-changes value="true" />
298 |       </confirmations>
299 |     </code-editor-settings>
300 |     <code-completion-settings>
301 |       <filters>
302 |         <basic-filter>
303 |           <filter-element type="RESERVED_WORD" id="keyword" selected="true" />
304 |           <filter-element type="RESERVED_WORD" id="function" selected="true" />
305 |           <filter-element type="RESERVED_WORD" id="parameter" selected="true" />
306 |           <filter-element type="RESERVED_WORD" id="datatype" selected="true" />
307 |           <filter-element type="RESERVED_WORD" id="exception" selected="true" />
308 |           <filter-element type="OBJECT" id="schema" selected="true" />
309 |           <filter-element type="OBJECT" id="role" selected="true" />
310 |           <filter-element type="OBJECT" id="user" selected="true" />
311 |           <filter-element type="OBJECT" id="privilege" selected="true" />
312 |           <user-schema>
313 |             <filter-element type="OBJECT" id="table" selected="true" />
314 |             <filter-element type="OBJECT" id="view" selected="true" />
315 |             <filter-element type="OBJECT" id="materialized view" selected="true" />
316 |             <filter-element type="OBJECT" id="index" selected="true" />
317 |             <filter-element type="OBJECT" id="constraint" selected="true" />
318 |             <filter-element type="OBJECT" id="trigger" selected="true" />
319 |             <filter-element type="OBJECT" id="synonym" selected="false" />
320 |             <filter-element type="OBJECT" id="sequence" selected="true" />
321 |             <filter-element type="OBJECT" id="procedure" selected="true" />
322 |             <filter-element type="OBJECT" id="function" selected="true" />
323 |             <filter-element type="OBJECT" id="package" selected="true" />
324 |             <filter-element type="OBJECT" id="type" selected="true" />
325 |             <filter-element type="OBJECT" id="dimension" selected="true" />
326 |             <filter-element type="OBJECT" id="cluster" selected="true" />
327 |             <filter-element type="OBJECT" id="dblink" selected="true" />
328 |           </user-schema>
329 |           <public-schema>
330 |             <filter-element type="OBJECT" id="table" selected="false" />
331 |             <filter-element type="OBJECT" id="view" selected="false" />
332 |             <filter-element type="OBJECT" id="materialized view" selected="false" />
333 |             <filter-element type="OBJECT" id="index" selected="false" />
334 |             <filter-element type="OBJECT" id="constraint" selected="false" />
335 |             <filter-element type="OBJECT" id="trigger" selected="false" />
336 |             <filter-element type="OBJECT" id="synonym" selected="false" />
337 |             <filter-element type="OBJECT" id="sequence" selected="false" />
338 |             <filter-element type="OBJECT" id="procedure" selected="false" />
339 |             <filter-element type="OBJECT" id="function" selected="false" />
340 |             <filter-element type="OBJECT" id="package" selected="false" />
341 |             <filter-element type="OBJECT" id="type" selected="false" />
342 |             <filter-element type="OBJECT" id="dimension" selected="false" />
343 |             <filter-element type="OBJECT" id="cluster" selected="false" />
344 |             <filter-element type="OBJECT" id="dblink" selected="false" />
345 |           </public-schema>
346 |           <any-schema>
347 |             <filter-element type="OBJECT" id="table" selected="true" />
348 |             <filter-element type="OBJECT" id="view" selected="true" />
349 |             <filter-element type="OBJECT" id="materialized view" selected="true" />
350 |             <filter-element type="OBJECT" id="index" selected="true" />
351 |             <filter-element type="OBJECT" id="constraint" selected="true" />
352 |             <filter-element type="OBJECT" id="trigger" selected="true" />
353 |             <filter-element type="OBJECT" id="synonym" selected="true" />
354 |             <filter-element type="OBJECT" id="sequence" selected="true" />
355 |             <filter-element type="OBJECT" id="procedure" selected="true" />
356 |             <filter-element type="OBJECT" id="function" selected="true" />
357 |             <filter-element type="OBJECT" id="package" selected="true" />
358 |             <filter-element type="OBJECT" id="type" selected="true" />
359 |             <filter-element type="OBJECT" id="dimension" selected="true" />
360 |             <filter-element type="OBJECT" id="cluster" selected="true" />
361 |             <filter-element type="OBJECT" id="dblink" selected="true" />
362 |           </any-schema>
363 |         </basic-filter>
364 |         <extended-filter>
365 |           <filter-element type="RESERVED_WORD" id="keyword" selected="true" />
366 |           <filter-element type="RESERVED_WORD" id="function" selected="true" />
367 |           <filter-element type="RESERVED_WORD" id="parameter" selected="true" />
368 |           <filter-element type="RESERVED_WORD" id="datatype" selected="true" />
369 |           <filter-element type="RESERVED_WORD" id="exception" selected="true" />
370 |           <filter-element type="OBJECT" id="schema" selected="true" />
371 |           <filter-element type="OBJECT" id="user" selected="true" />
372 |           <filter-element type="OBJECT" id="role" selected="true" />
373 |           <filter-element type="OBJECT" id="privilege" selected="true" />
374 |           <user-schema>
375 |             <filter-element type="OBJECT" id="table" selected="true" />
376 |             <filter-element type="OBJECT" id="view" selected="true" />
377 |             <filter-element type="OBJECT" id="materialized view" selected="true" />
378 |             <filter-element type="OBJECT" id="index" selected="true" />
379 |             <filter-element type="OBJECT" id="constraint" selected="true" />
380 |             <filter-element type="OBJECT" id="trigger" selected="true" />
381 |             <filter-element type="OBJECT" id="synonym" selected="true" />
382 |             <filter-element type="OBJECT" id="sequence" selected="true" />
383 |             <filter-element type="OBJECT" id="procedure" selected="true" />
384 |             <filter-element type="OBJECT" id="function" selected="true" />
385 |             <filter-element type="OBJECT" id="package" selected="true" />
386 |             <filter-element type="OBJECT" id="type" selected="true" />
387 |             <filter-element type="OBJECT" id="dimension" selected="true" />
388 |             <filter-element type="OBJECT" id="cluster" selected="true" />
389 |             <filter-element type="OBJECT" id="dblink" selected="true" />
390 |           </user-schema>
391 |           <public-schema>
392 |             <filter-element type="OBJECT" id="table" selected="true" />
393 |             <filter-element type="OBJECT" id="view" selected="true" />
394 |             <filter-element type="OBJECT" id="materialized view" selected="true" />
395 |             <filter-element type="OBJECT" id="index" selected="true" />
396 |             <filter-element type="OBJECT" id="constraint" selected="true" />
397 |             <filter-element type="OBJECT" id="trigger" selected="true" />
398 |             <filter-element type="OBJECT" id="synonym" selected="true" />
399 |             <filter-element type="OBJECT" id="sequence" selected="true" />
400 |             <filter-element type="OBJECT" id="procedure" selected="true" />
401 |             <filter-element type="OBJECT" id="function" selected="true" />
402 |             <filter-element type="OBJECT" id="package" selected="true" />
403 |             <filter-element type="OBJECT" id="type" selected="true" />
404 |             <filter-element type="OBJECT" id="dimension" selected="true" />
405 |             <filter-element type="OBJECT" id="cluster" selected="true" />
406 |             <filter-element type="OBJECT" id="dblink" selected="true" />
407 |           </public-schema>
408 |           <any-schema>
409 |             <filter-element type="OBJECT" id="table" selected="true" />
410 |             <filter-element type="OBJECT" id="view" selected="true" />
411 |             <filter-element type="OBJECT" id="materialized view" selected="true" />
412 |             <filter-element type="OBJECT" id="index" selected="true" />
413 |             <filter-element type="OBJECT" id="constraint" selected="true" />
414 |             <filter-element type="OBJECT" id="trigger" selected="true" />
415 |             <filter-element type="OBJECT" id="synonym" selected="true" />
416 |             <filter-element type="OBJECT" id="sequence" selected="true" />
417 |             <filter-element type="OBJECT" id="procedure" selected="true" />
418 |             <filter-element type="OBJECT" id="function" selected="true" />
419 |             <filter-element type="OBJECT" id="package" selected="true" />
420 |             <filter-element type="OBJECT" id="type" selected="true" />
421 |             <filter-element type="OBJECT" id="dimension" selected="true" />
422 |             <filter-element type="OBJECT" id="cluster" selected="true" />
423 |             <filter-element type="OBJECT" id="dblink" selected="true" />
424 |           </any-schema>
425 |         </extended-filter>
426 |       </filters>
427 |       <sorting enabled="true">
428 |         <sorting-element type="RESERVED_WORD" id="keyword" />
429 |         <sorting-element type="RESERVED_WORD" id="datatype" />
430 |         <sorting-element type="OBJECT" id="column" />
431 |         <sorting-element type="OBJECT" id="table" />
432 |         <sorting-element type="OBJECT" id="view" />
433 |         <sorting-element type="OBJECT" id="materialized view" />
434 |         <sorting-element type="OBJECT" id="index" />
435 |         <sorting-element type="OBJECT" id="constraint" />
436 |         <sorting-element type="OBJECT" id="trigger" />
437 |         <sorting-element type="OBJECT" id="synonym" />
438 |         <sorting-element type="OBJECT" id="sequence" />
439 |         <sorting-element type="OBJECT" id="procedure" />
440 |         <sorting-element type="OBJECT" id="function" />
441 |         <sorting-element type="OBJECT" id="package" />
442 |         <sorting-element type="OBJECT" id="type" />
443 |         <sorting-element type="OBJECT" id="dimension" />
444 |         <sorting-element type="OBJECT" id="cluster" />
445 |         <sorting-element type="OBJECT" id="dblink" />
446 |         <sorting-element type="OBJECT" id="schema" />
447 |         <sorting-element type="OBJECT" id="role" />
448 |         <sorting-element type="OBJECT" id="user" />
449 |         <sorting-element type="RESERVED_WORD" id="function" />
450 |         <sorting-element type="RESERVED_WORD" id="parameter" />
451 |       </sorting>
452 |       <format>
453 |         <enforce-code-style-case value="true" />
454 |       </format>
455 |     </code-completion-settings>
456 |     <execution-engine-settings>
457 |       <statement-execution>
458 |         <fetch-block-size value="100" />
459 |         <execution-timeout value="20" />
460 |         <debug-execution-timeout value="600" />
461 |         <focus-result value="false" />
462 |         <prompt-execution value="false" />
463 |       </statement-execution>
464 |       <script-execution>
465 |         <command-line-interfaces />
466 |         <execution-timeout value="300" />
467 |       </script-execution>
468 |       <method-execution>
469 |         <execution-timeout value="30" />
470 |         <debug-execution-timeout value="600" />
471 |         <parameter-history-size value="10" />
472 |       </method-execution>
473 |     </execution-engine-settings>
474 |     <operation-settings>
475 |       <transactions>
476 |         <uncommitted-changes>
477 |           <on-project-close value="ASK" />
478 |           <on-disconnect value="ASK" />
479 |           <on-autocommit-toggle value="ASK" />
480 |         </uncommitted-changes>
481 |         <multiple-uncommitted-changes>
482 |           <on-commit value="ASK" />
483 |           <on-rollback value="ASK" />
484 |         </multiple-uncommitted-changes>
485 |       </transactions>
486 |       <session-browser>
487 |         <disconnect-session value="ASK" />
488 |         <kill-session value="ASK" />
489 |         <reload-on-filter-change value="false" />
490 |       </session-browser>
491 |       <compiler>
492 |         <compile-type value="KEEP" />
493 |         <compile-dependencies value="ASK" />
494 |         <always-show-controls value="false" />
495 |       </compiler>
496 |       <debugger>
497 |         <debugger-type value="JDBC" />
498 |         <use-generic-runners value="true" />
499 |       </debugger>
500 |     </operation-settings>
501 |     <ddl-file-settings>
502 |       <extensions>
503 |         <mapping file-type-id="VIEW" extensions="vw" />
504 |         <mapping file-type-id="TRIGGER" extensions="trg" />
505 |         <mapping file-type-id="PROCEDURE" extensions="prc" />
506 |         <mapping file-type-id="FUNCTION" extensions="fnc" />
507 |         <mapping file-type-id="PACKAGE" extensions="pkg" />
508 |         <mapping file-type-id="PACKAGE_SPEC" extensions="pks" />
509 |         <mapping file-type-id="PACKAGE_BODY" extensions="pkb" />
510 |         <mapping file-type-id="TYPE" extensions="tpe" />
511 |         <mapping file-type-id="TYPE_SPEC" extensions="tps" />
512 |         <mapping file-type-id="TYPE_BODY" extensions="tpb" />
513 |       </extensions>
514 |       <general>
515 |         <lookup-ddl-files value="true" />
516 |         <create-ddl-files value="false" />
517 |         <synchronize-ddl-files value="true" />
518 |         <use-qualified-names value="false" />
519 |         <make-scripts-rerunnable value="true" />
520 |       </general>
521 |     </ddl-file-settings>
522 |     <general-settings>
523 |       <regional-settings>
524 |         <date-format value="MEDIUM" />
525 |         <number-format value="UNGROUPED" />
526 |         <locale value="SYSTEM_DEFAULT" />
527 |         <use-custom-formats value="false" />
528 |       </regional-settings>
529 |       <environment>
530 |         <environment-types>
531 |           <environment-type id="development" name="Development" description="Development environment" color="-2430209/-12296320" readonly-code="false" readonly-data="false" />
532 |           <environment-type id="integration" name="Integration" description="Integration environment" color="-2621494/-12163514" readonly-code="true" readonly-data="false" />
533 |           <environment-type id="production" name="Production" description="Productive environment" color="-11574/-10271420" readonly-code="true" readonly-data="true" />
534 |           <environment-type id="other" name="Other" description="" color="-1576/-10724543" readonly-code="false" readonly-data="false" />
535 |         </environment-types>
536 |         <visibility-settings>
537 |           <connection-tabs value="true" />
538 |           <dialog-headers value="true" />
539 |           <object-editor-tabs value="true" />
540 |           <script-editor-tabs value="false" />
541 |           <execution-result-tabs value="true" />
542 |         </visibility-settings>
543 |       </environment>
544 |     </general-settings>
545 |   </component>
546 |   <component name="DBNavigator.Project.StatementExecutionManager">
547 |     <execution-variables />
548 |   </component>
549 | </project>


--------------------------------------------------------------------------------
/scrapy_auto/service/static/js/index_js2.js:
--------------------------------------------------------------------------------
1 | !function(e,t){"function"==typeof define&&define.amd?define(["exports","echarts"],t):"object"==typeof exports&&"string"!=typeof exports.nodeName?t(exports,require("echarts")):t({},e.echarts)}(this,function(e,t){var o=function(e){"undefined"!=typeof console&&console&&console.error&&console.error(e)};t?t.registerMap?t.registerMap("china",{type:"FeatureCollection",features:[{id:"710000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@°Ü¯Û"],["@@ƛĴÕƊÉɼģºðʀ\\ƎsÆNŌÔĚänÜƤɊĂǀĆĴĤǊŨxĚĮǂƺòƌâÔ®ĮXŦţƸZûÐƕƑGđ¨ĭMó·ęcëƝɉlÝƯֹÅŃ^Ó·śŃǋƏďíåɛGɉ¿@ăƑ¥ĘWǬÏĶŁâ"],["@@\\p|WoYG¿¥Ij@¢"],["@@¡@V^RqBbAnTXeRz¤L«³I"],["@@ÆEEkWqë @"],["@@fced"]],encodeOffsets:[[[122886,24033]],[[123335,22980]],[[122375,24193]],[[122518,24117]],[[124427,22618]],[[124862,26043]]]},properties:{cp:[121.509062,25.044332],name:"台湾",childNum:6}},{id:"130000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@o~Z]ªrºc_ħ²G¼s`jÎŸnüsÂłNX_M`Ç½ÓnUKĜēs¤­©yrý§uģcJe"],["@@U`Ts¿mÂ"],["@@oºƋÄdeVDJj£J|ÅdzÂFt~KŨ¸IÆv|¢r}èonb}`RÎÄn°ÒdÞ²^®lnÐèĄlðÓ×]ªÆ}LiĂ±Ö`^°Ç¶p®đDcŋ`ZÔ¶êqvFÆN®ĆTH®¦O¾IbÐã´BĐɢŴÆíȦpĐÞXR·nndO¤OÀĈƒ­QgµFo|gȒęSWb©osx|hYhgŃfmÖĩnºTÌSp¢dYĤ¶UĈjlǐpäìë|³kÛfw²Xjz~ÂqbTÑěŨ@|oMzv¢ZrÃVw¬ŧĖ¸f°ÐTªqs{S¯r æÝlNd®²Ğ ǆiGĘJ¼lr}~K¨ŸƐÌWöÆzR¤lêmĞLÎ@¡|q]SvKÑcwpÏÏĿćènĪWlĄkT}J¤~ÈTdpddʾĬBVtEÀ¢ôPĎƗè@~kü\\rÊĔÖæW_§¼F´©òDòjYÈrbĞāøŀG{ƀ|¦ðrb|ÀH`pʞkvGpuARhÞÆǶgĘTǼƹS£¨¡ù³ŘÍ]¿ÂyôEP xX¶¹ÜO¡gÚ¡IwÃé¦ÅBÏ|Ç°N«úmH¯âDùyŜŲIÄuĐ¨D¸dɂFOhđ©OiÃ`ww^ÌkÑH«ƇǤŗĺtFu{Z}Ö@U´ʚLg®¯Oı°Ãw ^VbÉsmAê]]w§RRl£ȭµu¯b{ÍDěïÿȧuT£ġěŗƃĝQ¨fVƋƅn­a@³@ďyÃ½IĹÊKŭfċŰóxV@tƯJ]eR¾fe|rHA|h~Ėƍl§ÏlTíb ØoÅbbx³^zÃĶ¶Sj®AyÂhðk`«PËµEFÛ¬Y¨Ļrõqi¼Wi°§Ð±´°^[À|ĠO@ÆxO\\ta\\tĕtû{ġȧXýĪÓjùÎRb^ÎfK[ÝděYfíÙTyuUSyŌŏů@Oi½éŅ­aVcř§ax¹XŻácWU£ôãºQ¨÷Ñws¥qEHÙ|šYQoŕÇyáĂ£MÃ°oťÊP¡mWO¡v{ôvîēÜISpÌhp¨ jdeŔQÖjX³àĈ[n`Yp@UcM`RKhEbpŞlNut®EtqnsÁgAiúoHqCXhfgu~ÏWP½¢G^}¯ÅīGCÑ^ãziMáļMTÃƘrMc|O_¯Ŏ´|morDkO\\mĆJfl@cĢ¬¢aĦtRıÒ¾ùƀ^juųœK­UFyƝīÛ÷ąV×qƥV¿aȉd³BqPBmaËđŻģmÅ®V¹d^KKonYg¯XhqaLdu¥Ípǅ¡KąÅkĝęěhq}HyÃ]¹ǧ£Í÷¿qáµ§g¤o^á¾ZE¤i`ĳ{nOl»WÝĔįhgF[¿¡ßkOüš_ūiǱàUtėGyl}ÓM}jpEC~¡FtoQiHkk{Ãmï"]],encodeOffsets:[[[119712,40641]],[[121616,39981]],[[116462,37237]]]},properties:{cp:[114.502461,38.045474],name:"河北",childNum:3}},{id:"140000",type:"Feature",geometry:{type:"Polygon",coordinates:["@@ÞĩÒSra}ÁyWix±Üe´lèßÓǏokćiµVZģ¡coTSË¹ĪmnÕńehZg{gtwªpXaĚThȑp{¶Eh®RćƑP¿£Pmc¸mQÝWďȥoÅîɡųAďä³aÏJ½¥PG­ąSM­EÅruµéYÓŌ_dĒCo­Èµ]¯_²ÕjāK~©ÅØ^ÔkïçămÏk]­±cÝ¯ÑÃmQÍ~_apm~ç¡qu{JÅŧ·Ls}EyÁÆcI{¤IiCfUcƌÃp§]ě«vD@¡SÀµMÅwuYY¡DbÑc¡h×]nkoQdaMç~eDÛtT©±@¥ù@É¡ZcW|WqOJmĩl«ħşvOÓ«IqăV¥D[mI~Ó¢cehiÍ]Ɠ~ĥqX·eƷn±}v[ěďŕ]_œ`¹§ÕōIo©b­s^}Ét±ū«³p£ÿ·Wµ|¡¥ăFÏs×¥ŅxÊdÒ{ºvĴÎêÌɊ²¶ü¨|ÞƸµȲLLúÉƎ¤ϊęĔV`_bªS^|dzY|dz¥pZbÆ£¶ÒK}tĦÔņƠPYznÍvX¶Ěn ĠÔzý¦ª÷ÑĸÙUȌ¸dòÜJð´ìúNM¬XZ´¤ŊǸ_tldI{¦ƀðĠȤ¥NehXnYGR° ƬDj¬¸|CĞKqºfƐiĺ©ª~ĆOQª ¤@ìǦɌ²æBÊTŸʂōĖĴŞȀÆÿȄlŤĒötÎ½î¼ĨXh|ªM¤Ðz"],encodeOffsets:[[116874,41716]]},properties:{cp:[112.549248,37.857014],name:"山西",childNum:1}},{id:"150000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@Č^â£ĂhĖMÈÄw\\fŦ°W ¢¾luŸDw\\̀ʉÌÛMĀ[bÓEn}¶Vcês¯PqFB|S³C|kñHdiÄ¥sŉÅPóÑÑE^ÅPpy_YtShQ·aHwsOnŉÃs©iqjUSiº]ïW«gW¡ARëśĳĘů`çõh]y»ǃǛҤxÒm~zf}pf|ÜroÈzrKÈĵSƧż؜Ġu¦ö"],["@@sKCGS|úþXgp{ÁX¿ć{ƱȏñZáĔyoÁhA}ŅĆfdŉ_¹Y°ėǩÑ¡H¯¶oMQqð¡Ë|Ñ`ƭŁX½·óÛxğįÅcQs«tȋǅFù^it«Č¯[hAi©á¥ÇĚ×l|¹y¯YȵƓñǙµïċĻ|Düȭ¶¡oŽäÕG\\ÄT¿Òõr¯LguÏYęRƩɷŌO\\İÐ¢æ^Ŋ ĲȶȆbÜGĝ¬¿ĚVĎgª^íu½jÿĕęjık@Ľ]ėl¥ËĭûÁėéV©±ćn©­ȇÍq¯½YÃÔŉÉNÑÅÝy¹NqáʅDǡËñ­ƁYÅy̱os§ȋµʽǘǏƬɱàưN¢ƔÊuľýľώȪƺɂļxZĈ}ÌŉŪĺœĭFЛĽ̅ȣͽÒŵìƩÇϋÿȮǡŏçƑůĕ~Ç¼ȳÐUfdIxÿ\\G zâɏÙOº·pqy£@qþ@Ǟ˽IBäƣzsÂZÁàĻdñ°ŕzéØűzșCìDȐĴĺf®Àľưø@ɜÖÞKĊŇƄ§͑těï͡VAġÑÑ»d³öǍÝXĉĕÖ{þĉu¸ËʅğU̎éhɹƆ̗̮ȘǊ֥ड़ࡰţાíϲäʮW¬®ҌeרūȠkɬɻ̼ãüfƠSצɩςåȈHϚÎKǳͲOðÏȆƘ¼CϚǚ࢚˼ФÔ¤ƌĞ̪Qʤ´¼mȠJˀƲÀɠmǐnǔĎȆÞǠN~ʢĜ¶ƌĆĘźʆȬ˪ĚĒ¸ĞGȖƴƀj`ĢçĶāàŃºēĢĖćYÀŎüôQÐÂŎŞǆŞêƖoˆDĤÕºÑǘÛˤ³̀gńƘĔÀ^ªƂ`ªt¾äƚêĦĀ¼ÐĔǎ¨Ȕ»͠^ˮÊȦƤøxRrŜH¤¸ÂxDÄ|ø˂˜ƮÐ¬ɚwɲFjĔ²Äw°ǆdÀÉ_ĸdîàŎjÊêTĞªŌŜWÈ|tqĢUB~´°ÎFCU¼pĀēƄN¦¾O¶łKĊOjĚj´ĜYp{¦SĚÍ\\T×ªV÷Ší¨ÅDK°ßtŇĔK¨ǵÂcḷ̌ĚǣȄĽFlġUĵŇȣFʉɁMğįʏƶɷØŭOǽ«ƽū¹Ʊő̝Ȩ§ȞʘĖiɜɶʦ}¨֪ࠜ̀ƇǬ¹ǨE˦ĥªÔêFxúQEr´Wrh¤Ɛ \\talĈDJÜ|[Pll̚¸ƎGú´P¬W¦^¦H]prRn|or¾wLVnÇIujkmon£cX^Bh`¥V¦U¤¸}xRj[^xN[~ªxQ[`ªHÆÂExx^wN¶Ê|¨ìMrdYpoRzNyÀDs~bcfÌ`L¾n|¾T°c¨È¢ar¤`[|òDŞĔöxElÖdHÀI`Ď\\Àì~ÆR¼tf¦^¢ķ¶eÐÚMptgjɡČÅyġLûŇV®ÄÈƀĎ°P|ªVVªj¬ĚÒêp¬E|ŬÂc|ÀtƐK f{ĘFĒƌXƲąo½Ę\\¥o}Ûu£ç­kX{uĩ«āíÓUŅßŢqŤ¥lyň[oi{¦LńðFȪȖĒL¿Ìf£K£ʺoqNwğc`uetOj×°KJ±qÆġmĚŗos¬qehqsuH{¸kH¡ÊRǪÇƌbȆ¢´äÜ¢NìÉʖ¦â©Ż؛Ç@Vu»Aylßí¹ĵêÝlISò³C¹Ìâ²i¶Ìoú^H²CǜңǄ z¼g^èöŰ_Ĳĕê}gÁnUI«m]jvV¼euhwqAaW_µj»çjioQR¹ēÃßt@r³[ÛlćË^ÍÉáGOUÛOB±XkÅ¹£k|e]olkVÍ¼ÕqtaÏõjgÁ£§U^RLËnX°ÇBz^~wfvypV ¯ƫĉ˭ȫƗŷɿÿĿƑ˃ĝÿÃǃßËőó©ǐȍŒĖM×ÍEyxþp]ÉvïèvƀnÂĴÖ@V~Ĉ³MEĸÅĖtējyÄDXÄxGQuv_i¦aBçw˛wD©{tāmQ{EJ§KPśƘƿ¥@sCTÉ}ɃwƇy±gÑ}T[÷kÐç¦«SÒ¥¸ëBX½HáÅµÀğtSÝÂa[ƣ°¯¦Pï¡]£ġÒk®G²èQ°óMq}EóƐÇ\\@áügQÍu¥FTÕ¿Jû]|mvāÎYua^WoÀa·­ząÒot×¶CLƗi¯¤mƎHǊ¤îìɾŊìTdåwsRÖgĒųúÍġäÕ}Q¶¿A[¡{d×uQAMxVvMOmăl«ct[wº_ÇÊjbÂ£ĦS_éQZ_lwgOiýe`YYLq§IÁǳ£ÙË[ÕªuƏ³ÍTs·bÁĽäė[b[ŗfãcn¥îC¿÷µ[ŏÀQ­ōĉm¿Á^£mJVmL[{Ï_£F¥Ö{ŹA}×Wu©ÅaųĳƳhB{·TQqÙIķËZđ©Yc|M¡LeVUóK_QWk_ĥ¿ãZ»X\\ĴuUèlG®ěłTĠğDŃOrÍdÆÍz]±ŭ©Å]ÅÐ}UË¥©TċïxgckfWgi\\ÏĒ¥HkµEë{»ÏetcG±ahUiñiWsɁ·cCÕk]wȑ|ća}wVaĚá G°ùnM¬¯{ÈÐÆA¥ÄêJxÙ¢hP¢ÛºµwWOóFÁz^ÀŗÎú´§¢T¤ǻƺSėǵhÝÅQgvBHouʝl_o¿Ga{ïq{¥|ſĿHĂ÷aĝÇqZñiñC³ª»E`¨åXēÕqÉû[l}ç@čƘóO¿¡FUsAʽīccocÇS}£IS~ălkĩXçmĈŀÐoÐdxÒuL^T{r@¢ÍĝKén£kQyÅõËXŷƏL§~}kq»IHėǅjĝ»ÑÞoå°qTt|r©ÏS¯·eŨĕx«È[eM¿yupN~¹ÏyN£{©għWí»Í¾səšǅ_ÃĀɗ±ąĳĉʍŌŷSÉA±åǥɋ@ë£R©ąP©}ĹªƏj¹erLDĝ·{i«ƫC£µ"]],encodeOffsets:[[[127444,52594]],[[113793,40312]]]},properties:{cp:[111.670801,40.818311],name:"内蒙古",childNum:2}},{id:"210000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@L@@sa"],["@@MnNm"],["@@dc"],["@@eÀC@b"],["@@fXwkbrÄ`qg"],["@@^jtWQ"],["@@~ Y]c"],["@@G`ĔN^_¿ZÃM"],["@@iX¶BY"],["@@YZ"],["@@L_{Epf"],["@@^WqCT\\"],["@@\\[§t|¤_"],["@@m`n_"],["@@Ïxǌ{q_×^Giip"],["@@@é^BntaÊU]x ¯ÄPĲ­°hʙK³VÕ@Y~|EvĹsÇ¦­L^pÃ²ŸÒG Ël]xxÄ_fT¤Ď¤cPC¨¸TVjbgH²sdÎdHt`B²¬GJję¶[ÐhjeXdlwhðSČ¦ªVÊÏÆZÆŶ®²^ÎyÅÎcPqńĚDMħĜŁH­kçvV[ĳ¼WYÀäĦ`XlR`ôLUVfK¢{NZdĒªYĸÌÚJRr¸SA|ƴgŴĴÆbvªØX~źB|¦ÕE¤Ð`\\|KUnnI]¤ÀÂĊnŎR®Ő¿¶\\ÀøíDm¦ÎbŨabaĘ\\ľãÂ¸atÎSƐ´©v\\ÖÚÌǴ¤Â¨JKrZ_ZfjþhPkx`YRIjJcVf~sCN¤ EhæmsHy¨SðÑÌ\\\\ĐRZk°IS§fqŒßýáĞÙÉÖ[^¯ǤŲê´\\¦¬ĆPM¯£»uïpùzExanµyoluqe¦W^£ÊL}ñrkqWňûPUP¡ôJoo·U}£[·¨@XĸDXm­ÛÝºGUCÁª½{íĂ^cjk¶Ã[q¤LÉö³cux«zZf²BWÇ®Yß½ve±ÃCý£W{Ú^q^sÑ·¨ÍOt¹·C¥GDrí@wÕKţÃ«V·i}xËÍ÷i©ĝɝǡ]{c±OW³Ya±_ç©HĕoƫŇqr³Lys[ñ³¯OSďOMisZ±ÅFC¥Pq{Ã[Pg}\\¿ghćOk^ģÁFıĉĥM­oEqqZûěŉ³F¦oĵhÕP{¯~TÍlªNßYÐ{Ps{ÃVUeĎwk±ŉVÓ½ŽJãÇÇ»Jm°dhcÀffdF~ĀeĖd`sx² ®EżĀdQÂd^~ăÔH¦\\LKpĄVez¤NP ǹÓRÆąJSh­a[¦´ÂghwmBÐ¨źhI|VV|p] Â¼èNä¶ÜBÖ¼L`¼bØæKVpoúNZÞÒKxpw|ÊEMnzEQIZZNBčÚFÜçmĩWĪñtÞĵÇñZ«uD±|Əlĳ¥ãn·±PmÍada CLǑkùó¡³Ï«QaċÏOÃ¥ÕđQȥċƭy³ÃA"]],encodeOffsets:[[[123686,41445]],[[126019,40435]],[[124393,40128]],[[126117,39963]],[[125322,40140]],[[126686,40700]],[[126041,40374]],[[125584,40168]],[[125453,40165]],[[125362,40214]],[[125280,40291]],[[125774,39997]],[[125976,40496]],[[125822,39993]],[[125509,40217]],[[122731,40949]]]},properties:{cp:[123.429096,41.796767],name:"辽宁",childNum:16}},{id:"220000",type:"Feature",geometry:{type:"Polygon",coordinates:["@@pä³PClFbbÍzwBGĭZÅi»lY­ċ²SgkÇ£^Sqd¯R©é£¯S\\cZ¹iűƏCuƍÓXoR}M^o£R}oªU­FuuXHlEÅÏ©¤ÛmTþ¤D²ÄufàÀ­XXÈ±AeyYw¬dvõ´KÊ£\\rµÄlidā]|î©¾DÂVH¹Þ®ÜWnCķ W§@\\¸~¤Vp¸póIO¢VOŇürXql~òÉK]¤¥Xrfkvzpm¶bwyFoúvð¼¤ N°ąO¥«³[éǡű_°Õ\\ÚÊĝþâőàerR¨­JYlďQ[ ÏYëÐ§TGztnß¡gFkMāGÁ¤ia ÉÈ¹`\\xs¬dĆkNnuNUuP@vRY¾\\¢GªóĄ~RãÖÎĢùđŴÕhQxtcæëSɽŉíëǉ£ƍG£nj°KƘµDsØÑpyĆ¸®¿bXp]vbÍZuĂ{n^IüÀSÖ¦EvRÎûh@â[ƏÈô~FNr¯ôçR±­HÑlĢ^¤¢OðævxsŒ]ÞÁTĠs¶¿âÆGW¾ìA¦·TÑ¬è¥ÏÐJ¨¼ÒÖ¼ƦɄxÊ~StD@Ă¼Ŵ¡jlºWvÐzƦZÐ²CH AxiukdGgetqmcÛ£Ozy¥cE}|¾cZk¿uŐã[oxGikfeäT@SUwpiÚFM©£è^Ú`@v¶eňf heP¶täOlÃUgÞzŸU`l}ÔÆUvØ_Ō¬Öi^ĉi§²ÃB~¡ĈÚEgc|DC_Ȧm²rBx¼MÔ¦ŮdĨÃâYxƘDVÇĺĿg¿cwÅ\\¹¥Yĭl¤OvLjM_a W`zļMž·\\swqÝSAqŚĳ¯°kRē°wx^ĐkǂÒ\\]nrĂ}²ĊŲÒøãh·M{yMzysěnĒġV·°G³¼XÀ¤¹i´o¤ŃÈ`ÌǲÄUĞd\\iÖmÈBĤÜɲDEh LG¾ƀÄ¾{WaYÍÈĢĘÔRîĐj}ÇccjoUb½{h§Ǿ{KƖµÎ÷GĀÖŠåưÎs­lyiē«`å§H¥Ae^§GK}iã\\c]v©ģZmÃ|[M}ģTɟĵÂÂ`ÀçmFK¥ÚíÁbX³ÌQÒHof{]ept·GŋĜYünĎųVY^ydõkÅZW«WUa~U·SbwGçǑiW^qFuNĝ·EwUtW·Ýďæ©PuqEzwAVXRãQ`­©GMehccďÏd©ÑW_ÏYƅ»é\\ɹ~ǙG³mØ©BšuT§Ĥ½¢Ã_Ã½L¡ýqT^rme\\PpZZbyuybQefµ]UhĿDCmûvaÙNSkCwncćfv~YÇG"],encodeOffsets:[[130196,42528]]},properties:{cp:[125.3245,43.886841],name:"吉林",childNum:1}},{id:"230000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@ƨĶTLÇyqpÇÛqe{~oyen}s`qiXGù]Ëp½©lÉÁp]Þñ´FĂ^fäîºkàz¼BUvÈ@"],["@@UµNÿ¥īèçHÍøƕ¶Lǽ|g¨|a¾pVidd~ÈiíďÓQġėÇZÎXb½|ſÃH½KFgɱCģÛÇAnjÕc[VĝǱÃËÇ_ £ń³pj£º¿»WH´¯U¸đĢmtĜyzzNN|g¸÷äűÑ±ĉā~mq^[ǁÑďlw]¯xQĔ¯l°řĴrBÞTxr[tŽ¸ĻN_yX`biNKuP£kZĮ¦[ºxÆÀdhĹŀUÈƗCwáZħÄŭcÓ¥»NAw±qȥnD`{ChdÙFć}¢A±Äj¨]ĊÕjŋ«×`VuÓÅ~_kŷVÝyhVkÄãPsOµfgeŇµf@u_Ù ÙcªNªÙEojVxT@ãSefjlwH\\pŏäÀvlY½d{F~¦dyz¤PÜndsrhfHcvlwjF£G±DÏƥYyÏu¹XikĿ¦ÏqƗǀOŜ¨LI|FRĂn sª|C˜zxAè¥bfudTrFWÁ¹Am|ĔĕsķÆF´N}ćUÕ@Áĳſmuçuð^ÊýowFzØÎĕNőǏȎôªÌŒǄàĀÄ˄ĞŀƒʀĀƘŸˮȬƬĊ°Uzouxe]}AyÈW¯ÌmKQ]Īºif¸ÄX|sZt|½ÚUÎ lk^p{f¤lºlÆW A²PVÜPHÊâ]ÎĈÌÜk´\\@qàsĔÄQºpRij¼èi`¶bXrBgxfv»uUi^v~J¬mVp´£´VWrnP½ì¢BX¬hðX¹^TjVriªjtŊÄmtPGx¸bgRsT`ZozÆO]ÒFôÒOÆŊvÅpcGêsx´DR{AEOr°x|íb³Wm~DVjºéNNËÜ˛ɶ­GxŷCSt}]ûōSmtuÇÃĕNāg»íT«u}ç½BĵÞʣ¥ëÊ¡MÛ³ãȅ¡ƋaǩÈÉQG¢·lG|tvgrrf«ptęŘnÅĢrI²¯LiØsPf_vĠdxM prʹL¤¤eËÀđKïÙVY§]Ióáĥ]ķK¥j|pŇ\\kzţ¦šnņäÔVĂîĪ¬|vW®l¤èØrxm¶ă~lÄƯĄ̈́öȄEÔ¤ØQĄĄ»ƢjȦOǺ¨ìSŖÆƬyQv`cwZSÌ®ü±Ǆ]ŀç¬B¬©ńzƺŷɄeeOĨSfm ĊƀP̎ēz©ĊÄÕÊmgÇsJ¥ƔŊśæÎÑqv¿íUOµªÂnĦÁ_½ä@êí£P}Ġ[@gġ}gɊ×ûÏWXá¢užƻÌsNÍ½ƎÁ§čŐAēeL³àydl¦ĘVçŁpśǆĽĺſÊQíÜçÛġÔsĕ¬Ǹ¯YßċġHµ ¡eå`ļrĉŘóƢFìĎWøxÊkƈdƬv|I|·©NqńRŀ¤éeŊŀàŀU²ŕƀBQ£Ď}L¹Îk@©ĈuǰųǨÚ§ƈnTËÇéƟÊcfčŤ^XmHĊĕË«W·ċëx³ǔķÐċJāwİ_ĸȀ^ôWr­°oú¬ĦŨK~ȰCĐ´Ƕ£fNÎèâw¢XnŮeÂÆĶ¾¾xäLĴĘlļO¤ÒĨA¢Êɚ¨®ØCÔ ŬGƠƦYĜĘÜƬDJg_ͥœ@čŅĻA¶¯@wÎqC½Ĉ»NăëKďÍQÙƫ[«ÃígßÔÇOÝáWñuZ¯ĥŕā¡ÑķJu¤E å¯°WKÉ±_d_}}vyõu¬ï¹ÓU±½@gÏ¿rÃ½DgCdµ°MFYxw¿CG£Rƛ½Õ{]L§{qqą¿BÇƻğëܭǊË|c²}Fµ}ÙRsÓpg±QNqǫŋRwŕnéÑÉK«SeYRŋ@{¤SJ}D Ûǖ֍]gr¡µŷjqWÛham³~S«Þ]"]],encodeOffsets:[[[127123,51780]],[[134456,44547]]]},properties:{cp:[126.642464,45.756967],name:"黑龙江",childNum:2}},{id:"320000",type:"Feature",geometry:{type:"Polygon",coordinates:["@@cþÅPi`ZRu¥É\\]~°Y`µÓ^phÁbnÀşúòaĬºTÖŒbe¦¦{¸ZâćNp©Hr|^mjhSEb\\afv`sz^lkljÄtg¤D­¾X¿À|ĐiZȀåB·î}GL¢õcßjayBFµÏC^ĭcÙt¿sğH]j{s©HM¢QnDÀ©DaÜÞ·jgàiDbPufjDk`dPOîhw¡ĥ¥GP²ĐobºrYî¶aHŢ´ ]´rılw³r_{£DB_Ûdåuk|Ũ¯F Cºyr{XFye³Þċ¿ÂkĭB¿MvÛpm`rÚã@Ę¹hågËÖƿxnlč¶Åì½Ot¾dJlVJĂǀŞqvnO^JZż·Q}êÍÅmµÒ]ƍ¦Dq}¬R^èĂ´ŀĻĊIÔtĲyQŐĠMNtR®òLhĚs©»}OÓGZz¶A\\jĨFäOĤHYJvÞHNiÜaĎÉnFQlNM¤B´ĄNöɂtpŬdfåqm¿QûùŞÚb¤uŃJŴu»¹ĄlȖħŴw̌ŵ²ǹǠ͛hĭłƕrçü±Yxcitğ®jű¢KOķCoy`å®VTa­_Ā]ŐÝɞï²ʯÊ^]afYǸÃĆēĪȣJđ͍ôƋÄÄÍīçÛɈǥ£­ÛmY`ó£Z«§°Ó³QafusNıǅ_k}¢m[ÝóDµ¡RLčiXyÅNïă¡¸iĔÏNÌŕoēdōîåŤûHcs}~Ûwbù¹£¦ÓCtOPrE^ÒogĉIµÛÅʹK¤½phMü`oæŀ"],encodeOffsets:[[121740,32276]]},properties:{cp:[118.767413,32.041544],name:"江苏",childNum:1}},{id:"330000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@E^dQ]K"],["@@jX^j"],["@@sfbU"],["@@qP\\xz[ck"],["@@R¢FX}°[s_"],["@@Cb\\}"],["@@e|v\\la{u"],["@@v~u}"],["@@QxÂF¯}"],["@@¹nvÞs¯o"],["@@rSkUEj"],["@@bi­ZP"],["@@p[}INf"],["@@À¿"],["@@¹dnb"],["@@rSBnR"],["@@g~h}"],["@@FlEk"],["@@OdPc"],["@@v[u\\"],["@@FjâL~wyoo~sµL\\"],["@@¬e¹aN"],["@@\\nÔ¡q]L³ë\\ÿ®QÖ"],["@@ÊA­©[¬"],["@@Kxv­"],["@@@hlIk]"],["@@pW{o||j"],["@@Md|_mC"],["@@¢X£ÏylD¼XtH"],["@@hlÜ[LykAvyfw^E¤"],["@@fp¤MusR"],["@@®_ma~LÁ¬Z"],["@@iMxZ"],["@@ZcYd"],["@@Z~dOSo|A¿qZv"],["@@@`EN¡v"],["@@|TY{"],["@@@n@m"],["@@XWkCT\\"],["@@ºwZRkĕWO¢"],["@@X®±GrÆª\\ÔáXq{"],["@@ůTG°ĄLHm°UC"],["@@¤aÜx~}dtüGæţŎíĔcŖpMËÐjē¢·ðĄÆMzjWKĎ¢Q¶À_ê_Bıi«pZgf¤Nrq]§ĂN®«H±yƳí¾×ŸīàLłčŴǝĂíÀBŖÕªÁŖHŗŉåqûõi¨hÜ·ñt»¹ýv_[«¸mYL¯QªmĉÅdMgÇjcº«ę¬­K­´B«Âącoċ\\xKd¡gěŧ«®á[~ıxu·ÅKsËÉc¢Ù\\ĭƛëbf¹­ģSĜkáƉÔ­ĈZB{aMµfzŉfåÂŧįƋǝÊĕġć£g³ne­ą»@­¦S®\\ßðChiqªĭiAuA­µ_W¥ƣO\\lċĢttC¨£t`PZäuXßBsĻyekOđġĵHuXBµ]×­­\\°®¬F¢¾pµ¼kŘó¬Wät¸|@L¨¸µrºù³Ù~§WIZW®±Ð¨ÒÉx`²pĜrOògtÁZ}þÙ]¡FKwsPlU[}¦Rvn`hq¬\\nQ´ĘRWb_ rtČFIÖkĦPJ¶ÖÀÖJĈĄTĚòC ²@PúØz©Pî¢£CÈÚĒ±hŖl¬â~nm¨f©iļ«mntuÖZÜÄjL®EÌFª²iÊxØ¨IÈhhst"],["@@o\\VzRZ}y"],["@@@°¡mÛGĕ¨§Ianá[ýƤjfæØLäGr"]],encodeOffsets:[[[125592,31553]],[[125785,31436]],[[125729,31431]],[[125513,31380]],[[125223,30438]],[[125115,30114]],[[124815,29155]],[[124419,28746]],[[124095,28635]],[[124005,28609]],[[125e3,30713]],[[125111,30698]],[[125078,30682]],[[125150,30684]],[[124014,28103]],[[125008,31331]],[[125411,31468]],[[125329,31479]],[[125626,30916]],[[125417,30956]],[[125254,30976]],[[125199,30997]],[[125095,31058]],[[125083,30915]],[[124885,31015]],[[125218,30798]],[[124867,30838]],[[124755,30788]],[[124802,30809]],[[125267,30657]],[[125218,30578]],[[125200,30562]],[[124968,30474]],[[125167,30396]],[[124955,29879]],[[124714,29781]],[[124762,29462]],[[124325,28754]],[[123990,28459]],[[125366,31477]],[[125115,30363]],[[125369,31139]],[[122495,31878]],[[125329,30690]],[[125192,30787]]]},properties:{cp:[120.153576,30.287459],name:"浙江",childNum:45}},{id:"340000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@^iuLX^"],["@@e©Ehl"],["@@°ZÆëĎµmkǀwÌÕæhºgBĝâqÙĊzÖgņtÀÁĂÆáhEz|WzqD¹°Eŧl{ævÜcA`¤C`|´qxĲkq^³³GšµbíZ¹qpa±ď OH¦Ħx¢gPícOl_iCveaOjChß¸iÝbÛªCC¿mRV§¢A|t^iĠGÀtÚsd]ĮÐDE¶zAb àiödK¡~H¸íæAǿYj{ď¿À½W®£ChÃsikkly]_teu[bFaTign{]GqªoĈMYá|·¥f¥őaSÕėNµñĞ«Im_m¿Âa]uĜp Z_§{Cäg¤°r[_YjÆOdý[I[á·¥Q_nùgL¾mvˊBÜÆ¶ĊJhpc¹O]iŠ]¥ jtsggJÇ§w×jÉ©±EFË­KiÛÃÕYvsm¬njĻª§emná}k«ŕgđ²ÙDÇ¤í¡ªOy×Où±@DñSęćăÕIÕ¿IµĥOjNÕËT¡¿tNæŇàåyķrĕq§ÄĩsWÆßF¶X®¿mwRIÞfßoG³¾©uyHį{Ɓħ¯AFnuPÍÔzVdàôº^Ðæd´oG¤{S¬ćxã}ŧ×Kǥĩ«ÕOEÐ·ÖdÖsƘÑ¨[Û^Xr¢¼§xvÄÆµ`K§ tÒ´Cvlo¸fzŨð¾NY´ı~ÉĔēßúLÃÃ_ÈÏ|]ÂÏFlg`ben¾¢pUh~ƴĖ¶_r sĄ~cƈ]|r c~`¼{À{ȒiJjz`îÀT¥Û³]u}fïQl{skloNdjäËzDvčoQďHI¦rbtHĔ~BmlRV_ħTLnñH±DL¼Lªl§Ťa¸ĚlK²\\RòvDcÎJbt[¤D@®hh~kt°ǾzÖ@¾ªdbYhüóZ ň¶vHrľ\\ÊJuxAT|dmÀO[ÃÔG·ĚąĐlŪÚpSJ¨ĸLvÞcPæķŨ®mÐálwKhïgA¢ųÆ©Þ¤OÈm°K´"]],encodeOffsets:[[[121722,32278]],[[119475,30423]],[[119168,35472]]]},properties:{cp:[117.283042,31.86119],name:"安徽",childNum:3}},{id:"350000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@zht´]"],["@@aj^~ĆG©O"],["@@ed¨C}}i"],["@@@vPGsQ"],["@@sBzddW]Q"],["@@S¨Q{"],["@@NVucW"],["@@qptBAq"],["@@¸[mu"],["@@Q\\pD]_"],["@@jSwUadpF"],["@@eXª~"],["@@AjvFso"],["@@fT_Çí\\v|ba¦jZÆy°"],["@@IjJi"],["@@wJIx«¼AoNe{M­"],["@@K±¡ÓČäeZ"],["@@k¡¹Eh~c®wBkUplÀ¡I~Māe£bN¨gZý¡a±Öcp©PhI¢QqÇGj|¥U g[Ky¬ŏv@OptÉEF\\@ åA¬V{XģĐBycpě¼³Ăp·¤¥ohqqÚ¡ŅLs^Ã¡§qlÀhH¨MCe»åÇGD¥zPO£čÙkJA¼ßėuĕeûÒiÁŧSW¥Qûŗ½ùěcÝ§SùĩąSWó«íęACµeRåǃRCÒÇZÍ¢ź±^dlstjD¸ZpuÔâÃH¾oLUêÃÔjjēò´ĄWƛ^Ñ¥Ħ@ÇòmOw¡õyJyD}¢ďÑÈġfZda©º²z£NjD°Ötj¶¬ZSÎ~¾c°¶ÐmxO¸¢Pl´SL|¥AȪĖMņĲg®áIJČĒü` QF¬h|ĂJ@zµ |ê³È ¸UÖŬŬÀEttĸr]ðM¤ĶĲHtÏ AĬkvsq^aÎbvdfÊòSD´Z^xPsĂrvƞŀjJd×ŘÉ ®AÎ¦ĤdxĆqAZRÀMźnĊ»İÐZ YXæJyĊ²·¶q§·K@·{sXãô«lŗ¶»o½E¡­«¢±¨Y®Ø¶^AvWĶGĒĢPlzfļtàAvWYãO_¤sD§ssČġ[kƤPX¦`¶®BBvĪjv©jx[L¥àï[F¼ÍË»ğV`«Ip}ccÅĥZEãoP´B@D¸m±z«Ƴ¿å³BRØ¶Wlâþäą`]Z£Tc ĹGµ¶Hm@_©k¾xĨôȉðX«½đCIbćqK³ÁÄš¬OAwã»aLŉËĥW[ÂGIÂNxĳ¤D¢îĎÎB§°_JGs¥E@¤ućPåcuMuw¢BI¿]zG¹guĮck\\_"]],encodeOffsets:[[[123250,27563]],[[122541,27268]],[[123020,27189]],[[122916,27125]],[[122887,26845]],[[122808,26762]],[[122568,25912]],[[122778,26197]],[[122515,26757]],[[122816,26587]],[[123388,27005]],[[122450,26243]],[[122578,25962]],[[121255,25103]],[[120987,24903]],[[122339,25802]],[[121042,25093]],[[122439,26024]]]},properties:{cp:[119.306239,26.075302],name:"福建",childNum:18}},{id:"360000",type:"Feature",geometry:{type:"Polygon",coordinates:["@@ĢĨƐgļ¼ÂMD~ņªe^\\^§ý©j×cZØ¨zdÒa¶lÒJìõ`oz÷@¤uŞ¸´ôęöY¼HČƶajlÞƩ¥éZ[|h}^U  ¥pĄžƦO lt¸Æ Q\\aÆ|CnÂOjt­ĚĤdÈF`¶@Ðë ¦ōÒ¨SêvHĢûXD®QgÄWiØPÞìºr¤ǆNĠ¢lĄtZoCƞÔºCxrpĠV®Ê{f_Y`_eq®Aot`@oDXfkp¨|s¬\\DÄSfè©Hn¬^DhÆyøJhØxĢĀLÊƠPżċĄwȠĚ¦G®ǒĤäTŠÆ~Ħw«|TF¡nc³Ïå¹]ĉđxe{ÎÓvOEm°BƂĨİ|Gvz½ª´HàpeJÝQxnÀW­EµàXÅĪt¨ÃĖrÄwÀFÎ|ňÓMå¼ibµ¯»åDT±m[r«_gmQu~¥V\\OkxtL E¢Ú^~ýêPóqoě±_Êw§ÑªåƗā¼mĉŹ¿NQYBąrwģcÍ¥B­ŗÊcØiIƝĿuqtāwO]³YCñTeÉcaubÍ]trluīBÐGsĵıN£ï^ķqss¿FūūVÕ·´Ç{éĈýÿOER_đûIċâJh­ŅıNȩĕB¦K{Tk³¡OP·wnµÏd¯}½TÍ«YiµÕsC¯iM¤­¦¯P|ÿUHvhe¥oFTuõ\\OSsMòđƇiaºćXĊĵà·çhƃ÷Ç{ígu^đgm[×zkKN¶Õ»lčÓ{XSÆv©_ÈëJbVkĔVÀ¤P¾ºÈMÖxlò~ªÚàGĂ¢B±ÌKyáV¼Ã~­`gsÙfIƋlę¹e|~udjuTlXµf`¿Jd[\\L²"],encodeOffsets:[[116689,26234]]},properties:{cp:[115.892151,28.676493],name:"江西",childNum:1}},{id:"370000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@Xjd]{K"],["@@itbFHy"],["@@HlGk"],["@@TGy"],["@@K¬U"],["@@WdXc"],["@@PtOs"],["@@LnXhc"],["@@ppVu]Or"],["@@cdzAUa"],["@@udRhnCI"],["@@oIpR"],["@@Ľč{fzƤîKÎMĮ]ZF½Y]â£ph¶¨râøÀÎǨ¤^ºÄGz~grĚĜlĞÆLĆǆ¢Îo¦cvKbgr°WhmZp L]LºcUÆ­nżĤÌĒbAnrOA´ȊcÀbƦUØrĆUÜøĬƞEzVL®öØBkŖÝĐĖ¹ŧ̄±ÀbÎÉnb²ĦhņBĖįĦåXćì@L¯´ywƕCéÃµė ƿ¸lµ¾Z|ZWyFY¨Mf~C¿`à_RÇzwƌfQnny´INoƬèôº|sTJULîVjǎ¾ĒØDz²XPn±ŴPè¸ŔLƔÜƺ_TüÃĤBBċÈöA´faM¨{«M`¶d¡ôÖ°mȰBÔjj´PM|c^d¤u¤Û´ä«ƢfPk¶Môl]Lb}su^ke{lCMrDÇ­]NÑFsmoõľHyGă{{çrnÓEƕZGª¹Fj¢ïWuøCǷë¡ąuhÛ¡^KxC`C\\bÅxì²ĝÝ¿_NīCȽĿåB¥¢·IŖÕy\\¹kxÃ£Č×GDyÃ¤ÁçFQ¡KtŵƋ]CgÏAùSedcÚźuYfyMmhUWpSyGwMPqŀÁ¼zK¶G­Y§Ë@´śÇµƕBm@IogZ¯uTMx}CVKï{éƵP_K«pÛÙqċtkkù]gTğwoɁsMõ³ăAN£MRkmEÊčÛbMjÝGuIZGPģãħE[iµBEuDPÔ~ª¼ęt]ûG§¡QMsğNPŏįzs£Ug{đJĿļā³]ç«Qr~¥CƎÑ^n¶ÆéÎR~Ż¸YI] PumŝrƿIā[xeÇ³L¯v¯s¬ÁY~}ťuŁgƋpÝĄ_ņī¶ÏSR´ÁP~¿Cyċßdwk´SsX|t`Ä ÈðAªìÎT°¦Dda^lĎDĶÚY°`ĪŴǒàŠv\\ebZHŖR¬ŢƱùęOÑM­³FÛWp["]],encodeOffsets:[[[123806,39303]],[[123821,39266]],[[123742,39256]],[[123702,39203]],[[123649,39066]],[[123847,38933]],[[123580,38839]],[[123894,37288]],[[123043,36624]],[[123344,38676]],[[123522,38857]],[[123628,38858]],[[118260,36742]]]},properties:{cp:[117.000923,36.675807],name:"山东",childNum:13}},{id:"410000",type:"Feature",geometry:{type:"Polygon",coordinates:["@@ýLùµP³swIÓxcŢĞð´E®ÚPtĴXØxÂ¶@«ŕŕQGYfa[şußǩđš_X³ĳÕčC]kbc¥CS¯ëÍB©÷³­Si_}mYTt³xlàcČzÀD}ÂOQ³ÐTĨ¯ƗòËŖ[hłŦv~}ÂZ«¤lPÇ£ªÝŴÅR§ØnhctâknÏ­ľŹUÓÝdKuķI§oTũÙďkęĆH¸Ó\\Ä¿PcnS{wBIvÉĽ[GqµuŇôYgûZca©@½Õǽys¯}lgg@­C\\£asIdÍuCQñ[L±ęk·ţb¨©kK»KC²òGKmĨS`UQnk}AGēsqaJ¥ĐGRĎpCuÌy ã iMcplk|tRkðev~^´¦ÜSí¿_iyjI|ȑ|¿_»d}q^{Ƈdă}tqµ`Ƴĕg}V¡om½faÇo³TTj¥tĠRyK{ùÓjuµ{t}uËRivGçJFjµÍyqÎàQÂFewixGw½Yŷpµú³XU½ġyłåkÚwZX·l¢Á¢KzOÎÎjc¼htoDHr|­J½}JZ_¯iPq{tę½ĕ¦Zpĵø«kQĹ¤]MÛfaQpě±ǽ¾]u­Fu÷nčÄ¯ADp}AjmcEÇaª³o³ÆÍSƇĈÙDIzËčľ^KLiÞñ[aA²zzÌ÷D|[íÄ³gfÕÞd®|`Ć~oĠƑô³ŊD×°¯CsøÀ«ìUMhTº¨¸ǡîSÔDruÂÇZÖEvPZW~ØÐtĄE¢¦Ðy¸bô´oŬ¬²Ês~]®tªapŎJ¨Öº_Ŕ`Ŗ^Đ\\Ĝu~m²Ƹ¸fWĦrƔ}Î^gjdfÔ¡J}\\n C¦þWxªJRÔŠu¬ĨĨmFdM{\\d\\YÊ¢ú@@¦ª²SÜsC}fNècbpRmlØ^gd¢aÒ¢CZZxvÆ¶N¿¢T@uC¬^ĊðÄn|lGlRjsp¢ED}Fio~ÔN~zkĘHVsǲßjŬŢ`Pûàl¢\\ÀEhİgÞē X¼Pk|m"],encodeOffsets:[[118256,37017]]},properties:{cp:[113.665412,34.757975],name:"河南",childNum:1}},{id:"420000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@AB"],["@@lskt"],["@@¾«}{ra®pîÃ\\{øCËyyB±b\\òÝjKL ]ĎĽÌJyÚCƈćÎT´Å´pb©ÈdFin~BCo°BĎÃømv®E^vǾ½Ĝ²RobÜeN^ĺ£R¬lĶ÷YoĖ¥Ě¾|sOr°jY`~I¾®I{GqpCgyl{£ÍÍyPLÂ¡¡¸kWxYlÙæŁĢz¾V´W¶ùŸo¾ZHxjwfxGNÁ³Xéæl¶EièIH ujÌQ~v|sv¶Ôi|ú¢FhQsğ¦SiŠBgÐE^ÁÐ{čnOÂÈUÎóĔÊēĲ}Z³½Mŧïeyp·uk³DsÑ¨L¶_ÅuÃ¨w»¡WqÜ]\\Ò§tƗcÕ¸ÕFÏǝĉăxŻČƟOKÉġÿ×wg÷IÅzCg]m«ªGeçÃTC«[t§{loWeC@ps_Bp­rf_``Z|ei¡oċMqow¹DƝÓDYpûsYkıǃ}s¥ç³[§cY§HK«Qy]¢wwö¸ïx¼ņ¾Xv®ÇÀµRĠÐHM±cÏdƒǍũȅȷ±DSyúĝ£ŤĀàtÖÿï[îb\\}pĭÉI±Ñy¿³x¯No|¹HÏÛmjúË~TuęjCöAwě¬Rđl¯ Ñb­ŇTĿ_[IčĄʿnM¦ğ\\É[T·k¹©oĕ@A¾wya¥Y\\¥Âaz¯ãÁ¡k¥ne£ÛwE©Êō¶˓uoj_U¡cF¹­[WvP©whuÕyBF`RqJUw\\i¡{jEPïÿ½fćQÑÀQ{°fLÔ~wXgītêÝ¾ĺHd³fJd]HJ²EoU¥HhwQsƐ»Xmg±çve]DmÍPoCc¾_hhøYrŊU¶eD°Č_N~øĹĚ·`z]Äþp¼äÌQv\\rCé¾TnkžŐÚÜa¼ÝƆĢ¶ÛodĔňÐ¢JqPb ¾|J¾fXƐîĨ_Z¯À}úƲN_ĒÄ^ĈaŐyp»CÇÄKñL³ġM²wrIÒŭxjb[n«øæà ^²­h¯ÚŐªÞ¸Y²ĒVø}Ā^İ´LÚm¥ÀJÞ{JVųÞŃx×sxxƈē ģMřÚðòIfĊŒ\\Ʈ±ŒdÊ§ĘDvČ_Àæ~Dċ´A®µ¨ØLV¦êHÒ¤"]],encodeOffsets:[[[113712,34e3]],[[115612,30507]],[[113649,34054]]]},properties:{cp:[114.298572,30.584355],name:"湖北",childNum:3}},{id:"430000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@nFTs"],["@@ßÅÆá½ÔXrCOËRïÿĩ­TooQyÓ[ŅBE¬ÎÓXaį§Ã¸G °ITxpúxÚĳ¥ÏĢ¾edÄ©ĸGàGhM¤Â_U}Ċ}¢pczfþg¤ÇòAVM"],["@@©KA·³CQ±Á«³BUƑ¹AtćOwD]JiØSm¯b£ylXHËÑ±H«C^õľAÅ§¤É¥ïyuǙuA¢^{ÌC´­¦ŷJ£^[ª¿ĕ~ƇN skóā¹¿ï]ă~÷O§­@Vm¡Qđ¦¢Ĥ{ºjÔª¥nf´~Õo×ÛąMąıuZmZcÒ ĲĪ²SÊǄŶ¨ƚCÖŎªQØ¼rŭ­«}NÏürÊ¬mjr@ĘrTW ­SsdHzƓ^ÇÂyUi¯DÅYlŹu{hT}mĉ¹¥ěDÿë©ıÓ[Oº£¥ótł¹MÕƪ`PDiÛU¾ÅâìUñBÈ£ýhedy¡oċ`pfmjP~kZaZsÐd°wj§@Ĵ®w~^kÀÅKvNmX\\¨aŃqvíó¿F¤¡@ũÑVw}S@j}¾«pĂrªg àÀ²NJ¶¶DôK|^ª°LX¾ŴäPĪ±£EXd^¶ĲÞÜ~u¸ǔMRhsRe`ÄofIÔ\\Ø  ićymnú¨cj ¢»GČìƊÿÐ¨XeĈĀ¾Oð Fi ¢|[jVxrIQ_EzAN¦zLU`cªxOTu RLÄ¢dVi`p˔vŎµªÉF~Ød¢ºgİàw¸Áb[¦Zb¦z½xBĖ@ªpºlS¸Ö\\Ĕ[N¥ˀmĎăJ\\ŀ`ňSÚĖÁĐiOĜ«BxDõĚivSÌ}iùÜnÐºG{p°M´wÀÒzJ²ò¨ oTçüöoÛÿñőĞ¤ùTz²CȆȸǎŪƑÐc°dPÎğË¶[È½u¯½WM¡­ÉB·rínZÒ `¨GA¾\\pēXhÃRC­üWGġuTé§ŎÑ©ò³I±³}_EÃħg®ęisÁPDmÅ{b[RÅs·kPŽƥóRoOV~]{g\\êYƪ¦kÝbiċƵGZ»Ěõó·³vŝ£ø@pyö_ëIkÑµbcÑ§y×dYØªiþ¨[]f]Ņ©C}ÁN»hĻħƏĩ"]],encodeOffsets:[[[115640,30489]],[[112543,27312]],[[116690,26230]]]},properties:{cp:[112.982279,28.19409],name:"湖南",childNum:3}},{id:"440000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@QdAua"],["@@lxDLo"],["@@sbhNLo"],["@@Ă ā"],["@@WltO[["],["@@Kr]S"],["@@eI]y"],["@@I|Mym"],["@@Û³LS¼Y"],["@@nvºBëui©`¾"],["@@zdÛJw®"],["@@°¯"],["@@a yAª¸ËJIxØ@ĀHAmÃV¡ofuo"],["@@sŗÃÔėAƁZÄ ~°ČPäh"],["@@¶ÝÌvmĞh­ıQ"],["@@HdSjĒ¢D}waru«ZqadYM"],["@@el\\LqqU"],["@@~rMo\\"],["@@f^C"],["@@øPªoj÷ÍÝħXČx°Q¨ıXNv"],["@@gÇƳo[~tly"],["@@EÆC¿"],["@@OP"],["@@wđógĝ[³¡VÙæÅöMÌ³¹pÁaËýý©D©ÜJŹƕģGą¤{ÙūÇO²«BƱéAÒĥ¡«BhlmtÃPµyU¯ucd·w_bŝcīímGO|KPȏŹãŝIŕŭŕ@Óoo¿ē±ß}ŭĲWÈCőâUâǙIğŉ©IĳE×Á³AówXJþ±ÌÜÓĨ£L]ĈÙƺZǾĆĖMĸĤfÎĵlŨnÈĐtFFĤêk¶^k°f¶g}®Faf`vXŲxl¦ÔÁ²¬Ð¦pqÊÌ²iXØRDÎ}Ä@ZĠsx®AR~®ETtĄZƈfŠŠHâÒÐAµ\\S¸^wĖkRzalŜ|E¨ÈNĀňZTpBh£\\ĎƀuXĖtKL¶G|»ĺEļĞ~ÜĢÛĊrOÙîvd]n¬VÊĜ°RÖpMƂªFbwEÀ©\\¤]ŸI®¥D³|Ë]CöAŤ¦æ´¥¸Lv¼¢ĽBaôF~®²GÌÒEYzk¤°ahlVÕI^CxĈPsBƒºV¸@¾ªR²ĨN]´_eavSivc}p}Đ¼ƌkJÚe th_¸ ºx±ò_xNË²@ă¡ßH©Ùñ}wkNÕ¹ÇO½¿£ĕ]ly_WìIÇª`uTÅxYĒÖ¼kÖµMjJÚwn\\hĒv]îh|ÈƄøèg¸Ķß ĉĈWb¹ƀdéĘNTtP[öSvrCZaGubo´ŖÒÇĐ~¡zCIözx¢PnÈñ @ĥÒ¦]ƞV}³ăĔñiiÄÓVépKG½ÄÓávYoC·sitiaÀyŧÎ¡ÈYDÑům}ý|m[węõĉZÅxUO}÷N¹³ĉo_qtăqwµŁYÙǝŕ¹tïÛUÃ¯mRCºĭ|µÕÊK½Rē ó]GªęAx»HO£|ām¡diď×YïYWªŉOeÚtĐ«zđ¹TāúEá²\\ķÍ}jYàÙÆſ¿Çdğ·ùTßÇţʄ¡XgWÀǇğ·¿ÃOj YÇ÷Qěi"]],encodeOffsets:[[[117381,22988]],[[116552,22934]],[[116790,22617]],[[116973,22545]],[[116444,22536]],[[116931,22515]],[[116496,22490]],[[116453,22449]],[[113301,21439]],[[118726,21604]],[[118709,21486]],[[113210,20816]],[[115482,22082]],[[113171,21585]],[[113199,21590]],[[115232,22102]],[[115739,22373]],[[115134,22184]],[[113056,21175]],[[119573,21271]],[[119957,24020]],[[115859,22356]],[[116561,22649]],[[116285,22746]]]},properties:{cp:[113.280637,23.125178],name:"广东",childNum:24}},{id:"450000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@H TQ§A"],["@@ĨÊªLƊDÎĹĐCǦė¸zÚGn£¾rªŀÜt¬@ÖÚSx~øOŒŶÐÂæȠ\\ÈÜObĖw^oÞLf¬°bI lTØBÌF£Ć¹gñĤaYt¿¤VSñK¸¤nM¼JE±½¸ñoÜCƆæĪ^ĚQÖ¦^f´QüÜÊz¯lzUĺš@ìp¶n]sxtx¶@~ÒĂJb©gk{°~c°`Ô¬rV\\la¼¤ôá`¯¹LCÆbxEræOv[H­[~|aB£ÖsºdAĐzNÂðsÞÆĤªbab`ho¡³F«èVlo¤ÔRzpp®SĪº¨ÖºNĳd`a¦¤F³ºDÎńĀìCĜº¦Ċ~nS|gźvZkCÆj°zVÈÁƔ]LÊFZgčP­kini«qÇczÍY®¬Ů»qR×ō©DÕ§ƙǃŵTÉĩ±ıdÑnYYĲvNĆĆØÜ Öp}e³¦m©iÓ|¹ħņ|ª¦QF¢Â¬ʖovg¿em^ucà÷gÕuíÙćĝ}FĻ¼Ĺ{µHKsLSđƃrč¤[AgoSŇYMÿ§Ç{FśbkylQxĕ]T·¶[BÑÏGáşşƇeăYSs­FQ}­BwtYğÃ@~CÍQ ×WjË±rÉ¥oÏ ±«ÓÂ¥kwWűmcih³K~µh¯e]lµélEģEďsmÇŧē`ãògK_ÛsUʝćğ¶höO¤Ǜn³c`¡y¦CezYwa[ďĵűMę§]XÎ_íÛ]éÛUćİÕBƣ±dy¹T^dûÅÑŦ·PĻþÙ`K¦¢ÍeĥR¿³£[~äu¼dltW¸oRM¢ď\\z}Æzdvň{ÎXF¶°Â_ÒÂÏL©ÖTmu¼ãlīkiqéfA·Êµ\\őDc¥ÝFyÔćcűH_hLÜêĺĐ¨c}rn`½Ì@¸¶ªVLhŒ\\Ţĺk~Ġið°|gtTĭĸ^xvKVGréAébUuMJVÃO¡qĂXËSģãlýà_juYÛÒBG^éÖ¶§EGÅzěƯ¤EkN[kdåucé¬dnYpAyČ{`]þ¯TbÜÈk¡ĠvàhÂƄ¢Jî¶²"]],encodeOffsets:[[[111707,21520]],[[107619,25527]]]},properties:{cp:[108.320004,22.82402],name:"广西",childNum:2}},{id:"460000",type:"Feature",geometry:{type:"Polygon",coordinates:["@@¦Ŝil¢XƦƞòïè§ŞCêɕrŧůÇąĻõ·ĉ³œ̅kÇm@ċȧŧĥĽʉ­ƅſȓÒË¦ŝE}ºƑ[ÍĜȋ gÎfǐÏĤ¨êƺ\\Ɔ¸ĠĎvʄȀÐ¾jNðĀÒRZǆzÐŘÎ°H¨Ƣb²_Ġ "],encodeOffsets:[[112750,20508]]},properties:{cp:[110.33119,20.031971],name:"海南",childNum:1}},{id:"510000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@LqKr"],["@@[ĻéV£_ţġñpG réÏ·~ąSfy×Í·ºſƽiÍıƣıĻmHH}siaX@iÇ°ÁÃ×t«­T¤JJJyJÈ`Ohß¦¡uËhIyCjmÿwZGTiSsOB²fNmsPa{M{õE^Hj}gYpaeu¯oáwHjÁ½M¡pMuåmni{fk\\oÎqCwEZ¼KĝAy{m÷LwO×SimRI¯rKõBS«sFe]fµ¢óY_ÆPRcue°Cbo×bd£ŌIHgtrnyPt¦foaXďxlBowz_{ÊéWiêEGhÜ¸ºuFĈIxf®Y½ĀǙ]¤EyF²ċw¸¿@g¢§RGv»áW`ÃĵJwi]t¥wO­½a[×]`Ãi­üL¦LabbTÀåc}ÍhÆh®BHî|îºÉk­¤Sy£ia©taį·Ɖ`ō¥UhOĝLk}©Fos´JmµlŁuønÑJWÎªYÀïAetTŅÓGË«bo{ıwodƟ½OġÜÂµxàNÖ¾P²§HKv¾]|BÆåoZ`¡Ø`ÀmºĠ~ÌÐ§nÇ¿¤]wğ@srğu~Io[é±¹ ¿ſđÓ@qg¹zƱřaí°KtÇ¤V»Ã[ĩǭƑ^ÇÓ@áťsZÏÅĭƋěpwDóÖáŻneQËq·GCœýS]x·ýq³OÕ¶Qzßti{řáÍÇWŝŭñzÇWpç¿JXĩè½cFÂLiVjx}\\NŇĖ¥GeJA¼ÄHfÈu~¸Æ«dE³ÉMA|bÒćhG¬CMõƤąAvüVéŀ_VÌ³ĐwQj´·ZeÈÁ¨X´Æ¡Qu·»ÕZ³ġqDoy`L¬gdp°şp¦ėìÅĮZ°Iähzĵf²å ĚÑKpIN|Ñz]ń·FU×é»R³MÉ»GM«kiér}Ã`¹ăÞmÈnÁîRǀ³ĜoİzŔwǶVÚ£À]ɜ»ĆlƂ²ĠþTº·àUȞÏʦ¶I«dĽĢdĬ¿»Ĕ×h\\c¬ä²GêëĤł¥ÀǿżÃÆMº}BÕĢyFVvwxBèĻĒ©ĈtCĢɽŠȣ¦āæ·HĽîôNÔ~^¤Ɗu^s¼{TA¼ø°¢İªDè¾Ň¶ÝJ®Z´ğ~Sn|ªWÚ©òzPOȸbð¢|øĞŒQìÛÐ@ĞǎRS¤Á§di´ezÝúØã]HqkIþËQÇ¦ÃsÇ¤[E¬ÉŪÍxXƒ·ÖƁİlƞ¹ª¹|XÊwnÆƄmÀêErĒtD®ċæcQE®³^ĭ¥©l}äQtoŖÜqÆkµªÔĻĴ¡@Ċ°B²Èw^^RsºTĀ£ŚæQPJvÄz^Đ¹Æ¯fLà´GC²dt­ĀRt¼¤ĦOðğfÔðDŨŁĞƘïPÈ®âbMüÀXZ ¸£@Å»»QÉ­]dsÖ×_Í_ÌêŮPrĔĐÕGĂeZÜîĘqBhtO ¤tE[h|YÔZśÎs´xº±Uñt|OĩĠºNbgþJy^dÂY Į]Řz¦gC³R`Āz¢Aj¸CL¤RÆ»@­Ŏk\\Ç´£YW}z@Z}Ã¶oû¶]´^NÒ}èNªPÍy¹`S°´ATeVamdUĐwʄvĮÕ\\uÆŗ¨Yp¹àZÂmWh{á}WØǍÉüwga§áCNęÎ[ĀÕĪgÖÉªXøx¬½Ů¦¦[NÎLÜUÖ´òrÙŠxR^JkĳnDX{U~ET{ļº¦PZcjF²Ė@pg¨B{u¨ŦyhoÚD®¯¢ WòàFÎ¤¨GDäz¦kŮPġqË¥À]eâÚ´ªKxīPÖ|æ[xÃ¤JÞĥsNÖ½I¬nĨY´®ÐƐmDŝuäđđEbee_v¡}ìęǊē}qÉåT¯µRs¡M@}ůaa­¯wvƉåZw\\Z{åû^"]],encodeOffsets:[[[108815,30935]],[[110617,31811]]]},properties:{cp:[104.065735,30.659462],name:"四川",childNum:2}},{id:"520000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@G\\lY£in"],["@@q|mc¯tÏVSÎ"],["@@hÑ£IsNgßHHªķÃh_¹¡ĝÄ§ń¦uÙùgS¯JH|sÝÅtÁïyMDč»eÕtA¤{b\\}G®u\\åPFqwÅaDK°ºâ_£ùbµmÁÛĹM[q|hlaªāI}Ñµ@swtwm^oµDéĽŠyVky°ÉûÛR³e¥]RÕěħ[ƅåÛDpJiVÂF²I»mN·£LbÒYbWsÀbpkiTZĄă¶Hq`ĥ_J¯ae«KpÝx]aĕÛPÇȟ[ÁåŵÏő÷Pw}TÙ@Õs«ĿÛq©½m¤ÙH·yǥĘĉBµĨÕnđ]K©œáGçş§ÕßgǗĦTèƤƺ{¶ÉHÎd¾ŚÊ·OÐjXWrãLyzÉAL¾ę¢bĶėy_qMĔąro¼hĊw¶øV¤w²Ĉ]ÊKx|`ź¦ÂÈdrcÈbe¸`I¼čTF´¼Óýȃr¹ÍJ©k_șl³´_pĐ`oÒh¶pa^ÓĔ}D»^Xy`d[KvJPhèhCrĂĚÂ^Êƌ wZL­Ġ£ÁbrzOIlMMĪŐžËr×ÎeŦtw|¢mKjSǘňĂStÎŦEtqFT¾Eì¬¬ôxÌO¢ K³ŀºäYPVgŎ¦ŊmŞ¼VZwVlz¤£Tl®ctĽÚó{G­AÇge~Îd¿æaSba¥KKûj®_Ä^\\Ø¾bP®¦x^sxjĶI_Ä Xâ¼Hu¨Qh¡À@Ëô}±GNìĎlT¸`V~R°tbÕĊ`¸úÛtÏFDu[MfqGH·¥yAztMFe|R_GkChZeÚ°tov`xbDnÐ{E}ZèxNEÞREn[Pv@{~rĆAB§EO¿|UZ~ìUf¨J²ĂÝÆsªB`s¶fvö¦Õ~dÔq¨¸º»uù[[§´sb¤¢zþF¢ÆÀhÂW\\ıËIÝo±ĭŠ£þÊs}¡R]ěDg´VG¢j±®èºÃmpU[Áëº°rÜbNu¸}º¼`niºÔXĄ¤¼ÔdaµÁ_ÃftQQgR·Ǔv}Ý×ĵ]µWc¤F²OĩųãW½¯K©]{LóµCIµ±Mß¿h©āq¬o½~@i~TUxŪÒ¢@£ÀEîôruńb[§nWuMÆLl¿]x}ĳ­½"]],encodeOffsets:[[[112158,27383]],[[112105,27474]],[[112095,27476]]]},properties:{cp:[106.713478,26.578343],name:"贵州",childNum:3}},{id:"530000",type:"Feature",geometry:{type:"Polygon",coordinates:["@@[ùx½}ÑRHYīĺûsÍniEoã½Ya²ė{c¬ĝgĂsAØÅwďõzFjw}«Dx¿}Uũlê@HÅ­F¨ÇoJ´Ónũuą¡Ã¢pÒÅØ TF²xa²ËXcÊlHîAßËŁkŻƑŷÉ©hW­æßUËs¡¦}teèÆ¶StÇÇ}Fd£jĈZĆÆ¤Tč\\D}O÷£U§~ŃGåŃDĝ¸Tsd¶¶Bª¤u¢ŌĎo~t¾ÍŶÒtD¦ÚiôözØX²ghįh½Û±¯ÿm·zR¦Ɵ`ªŊÃh¢rOÔ´£Ym¼èêf¯ŪĽncÚbw\\zlvWªâ ¦gmĿBĹ£¢ƹřbĥkǫßeeZkÙIKueT»sVesbaĕ  ¶®dNĄÄpªy¼³BE®lGŭCǶwêżĔÂepÍÀQƞpC¼ŲÈ­AÎô¶RäQ^Øu¬°_Èôc´¹ò¨PÎ¢hlĎ¦´ĦÆ´sâÇŲPnÊD^¯°Upv}®BPÌªjǬxSöwlfòªvqĸ|`H­viļndĜ­Ćhňem·FyÞqóSį¯³X_ĞçêtryvL¤§z¦c¦¥jnŞklD¤øz½ĜàĂŧMÅ|áƆàÊcðÂFÜáŢ¥\\\\ºİøÒÐJĴîD¦zK²ǏÎEh~CD­hMn^ÌöÄ©ČZÀaüfɭyœpį´ěFűk]Ôě¢qlÅĆÙa¶~ÄqêljN¬¼HÊNQ´ê¼VØ¸E^ŃÒyM{JLoÒęæe±Ķygã¯JYÆĭĘëo¥Šo¯hcK«z_prC´ĢÖY¼ v¸¢RÅW³Â§fÇ¸Yi³xR´ďUË`êĿUûuĆBƣöNDH«ĈgÑaB{ÊNF´¬c·Åv}eÇÃGB»If¦HňĕM~[iwjUÁKE¾dĪçWIèÀoÈXòyŞŮÈXâÎŚj|àsRyµÖPr´þ ¸^wþTDŔHr¸RÌmfżÕâCôoxĜƌÆĮÐYtâŦÔ@]ÈǮƒ\\Ī¼Ä£UsÈ¯LbîƲŚºyhr@ĒÔƀÀ²º\\êpJ}ĠvqtĠ@^xÀ£È¨mËÏğ}n¹_¿¢×Y_æpÅA^{½Lu¨GO±Õ½ßM¶wÁĢÛPƢ¼pcĲx|apÌ¬HÐŊSfsðBZ¿©XÏÒKk÷Eû¿SrEFsÕūkóVǥŉiTL¡n{uxţÏhôŝ¬ğōNNJkyPaqÂğ¤K®YxÉƋÁ]āęDqçgOgILu\\_gz]W¼~CÔē]bµogpÑ_oď`´³Țkl`IªºÎȄqÔþ»E³ĎSJ»_f·adÇqÇc¥Á_Źw{L^É±ćxU£µ÷xgĉp»ĆqNē`rĘzaĵĚ¡K½ÊBzyäKXqiWPÏÉ¸½řÍcÊG|µƕƣGË÷k°_^ý|_zċBZocmø¯hhcæ\\lMFlư£ĜÆyHF¨µêÕ]HAàÓ^it `þßäkĤÎT~Wlÿ¨ÔPzUCNVv [jâôDôď[}z¿msSh¯{jïğl}šĹ[őgK©U·µË@¾m_~q¡f¹ÅË^»f³ø}Q¡ÖË³gÍ±^Ç\\ëÃA_¿bWÏ[¶ƛé£F{īZgm@|kHǭƁć¦UĔť×ë}ǝeďºȡȘÏíBÉ£āĘPªĳ¶ŉÿy©nď£G¹¡I±LÉĺÑdĉÜW¥}gÁ{aqÃ¥aıęÏZï`"],encodeOffsets:[[104636,22969]]},properties:{cp:[102.712251,25.040609],name:"云南",childNum:1}},{id:"540000",type:"Feature",geometry:{type:"Polygon",coordinates:["@@ÂhľxŖxÒVºÅâAĪÝȆµę¯Ňa±r_w~uSÕňqOj]ɄQ£ZUDûoY»©M[L¼qãË{VÍçWVi]ë©Ä÷àyƛhÚU°adcQ~Mx¥cc¡ÙaSyFÖk­uRýq¿ÔµQĽ³aG{¿FµëªéĜÿª@¬·K·àariĕĀ«V»ŶĴūgèLǴŇƶaftèBŚ£^âǐÝ®M¦ÁǞÿ¬LhJ¾óƾÆºcxwf]Y´¦|QLn°adĊ\\¨oǀÍŎ´ĩĀd`tÊQŞŕ|¨C^©Ĉ¦¦ÎJĊ{ëĎjª²rÐl`¼Ą[t|¦Stè¾PÜK¸dƄı]s¤î_v¹ÎVòŦj£Əsc¬_Ğ´|Ł¦Av¦w`ăaÝaa­¢e¤ı²©ªSªÈMĄwÉØŔì@T¤Ę\\õª@þo´­xA sÂtŎKzó´ÇĊµ¢r^nĊ­Æ¬×üG¢³ {âĊ]G~bÀgVjzlhǶfOfdªB]pjTOtĊn¤}®¦Č¥d¢¼»ddY¼t¢eȤJ¤}Ǿ¡°§¤AÐlc@ĝsªćļđAçwxUuzEÖġ~AN¹ÄÅȀŻ¦¿ģŁéì±Hãd«g[Ø¼ēÀcīľġ¬cJµÐʥVȝ¸ßS¹ý±ğkƁ¼ą^ɛ¤Ûÿb[}¬ōõÃ]ËNm®g@Bg}ÍF±ǐyL¥íCIĳÏ÷Ñį[¹¦[âšEÛïÁÉdƅß{âNÆāŨß¾ě÷yC£k­´ÓH@Â¹TZ¥¢į·ÌAÐ§®Zcv½Z­¹|ÅWZqgW|ieZÅYVÓqdqbc²R@c¥Rã»GeeƃīQ}J[ÒK¬Ə|oėjġĠÑN¡ð¯EBčnwôɍėª²CλŹġǝʅįĭạ̃ūȹ]ΓͧgšsgȽóϧµǛęgſ¶ҍć`ĘąŌJÞä¤rÅň¥ÖÁUětęuůÞiĊÄÀ\\Æs¦ÓRb|Â^řÌkÄŷ¶½÷f±iMÝ@ĥ°G¬ÃM¥n£Øąğ¯ß§aëbéüÑOčk£{\\eµª×MÉfm«Ƒ{Å×Gŏǩãy³©WÑăû··Qòı}¯ãIéÕÂZ¨īès¶ZÈsæĔTŘvgÌsN@îá¾ó@ÙwU±ÉTå»£TđWxq¹Zobs[×¯cĩvėŧ³BM|¹kªħ¥TzNYnÝßpęrñĠĉRS~½ěVVµõ«M££µBĉ¥áºae~³AuĐh`Ü³ç@BÛïĿa©|z²Ý¼D£àč²ŸIûI āóK¥}rÝ_Á´éMaň¨~ªSĈ½½KÙóĿeƃÆB·¬ën×W|Uº}LJrƳlŒµ`bÔ`QÐÓ@s¬ñIÍ@ûws¡åQÑßÁ`ŋĴ{ĪTÚÅTSÄ³Yo|Ç[Ç¾µMW¢ĭiÕØ¿@MhpÕ]jéò¿OƇĆƇpêĉâlØwěsǩĵ¸cbU¹ř¨WavquSMzeo_^gsÏ·¥Ó@~¯¿RiīB\\qTGªÇĜçPoÿfñòą¦óQīÈáPābß{ZŗĸIæÅhnszÁCËìñÏ·ąĚÝUm®ó­L·ăUÈíoù´Êj°ŁŤ_uµ^°ìÇ@tĶĒ¡ÆM³Ģ«İĨÅ®ğRāðggheÆ¢zÊ©Ô\\°ÝĎz~ź¤PnMĪÖB£kné§żćĆKĒ°¼L¶èâz¨u¦¥LDĘz¬ýÎmĘd¾ßFzhg²Fy¦ĝ¤ċņbÎ@yĄæm°NĮZRÖíJ²öLĸÒ¨Y®ƌÐVàtt_ÚÂyĠz]ŢhzĎ{ÂĢXc|ÐqfO¢¤ögÌHNPKŖUú´xx[xvĐCûĀìÖT¬¸^}Ìsòd´_KgžLĴÀBon|H@Êx¦BpŰŌ¿fµƌA¾zǈRx¶FkĄźRzŀ~¶[´HnªVƞuĒ­È¨ƎcƽÌm¸ÁÈM¦x͊ëÀxǆBú^´W£dkɾĬpw˂ØɦļĬIŚÊnŔa¸~J°îlɌxĤÊÈðhÌ®gT´øàCÀ^ªerrƘd¢İP|Ė ŸWªĦ^¶´ÂLaT±üWƜǀRÂŶUńĖ[QhlLüAÜ\\qRĄ©"],encodeOffsets:[[90849,37210]]},properties:{cp:[91.132212,29.660361],name:"西藏",childNum:1}},{id:"610000",type:"Feature",geometry:{type:"Polygon",coordinates:["@@p¢ȮµûGĦ}Ħðǚ¶òƄjɂz°{ºØkÈęâ¦jªBg\\ċ°s¬]jú EȌǆ¬stRÆdĠİwÜ¸ôW¾ƮłÒ_{Ìû¼jº¹¢GǪÒ¯ĘZ`ºŊecņą~BÂgzpâēòYǠȰÌTÎ¨ÂW|fcă§uF@N¢XLRMº[ğȣſï|¥Jkc`sŉǷY¹W@µ÷Kãï³ÛIcñ·VȋÚÒķø©þ¥yÓğęmWµÎumZyOŅƟĥÓ~sÑL¤µaÅY¦ocyZ{y c]{Ta©`U_Ěē£ωÊƍKùK¶ȱÝƷ§{û»ÅÁȹÍéuĳ|¹cÑdìUYOuFÕÈYvÁCqÓTǢí§·S¹NgV¬ë÷Át°DØ¯C´ŉƒópģ}ċcEËFéGU¥×K§­¶³BČ}C¿åċ`wġB·¤őcƭ²ő[Å^axwQOÿEËßŚĤNĔwƇÄńwĪ­o[_KÓª³ÙnKÇěÿ]ďă_d©·©Ýŏ°Ù®g]±ßå¬÷m\\iaǑkěX{¢|ZKlçhLtŇîŵœè[É@ƉĄEtƇÏ³­ħZ«mJ×¾MtÝĦ£IwÄå\\Õ{OwĬ©LÙ³ÙgBƕŀrÌĢŭO¥lãyC§HÍ£ßEñX¡­°ÙCgpťzb`wIvA|§hoĕ@E±iYd¥OĻ¹S|}F@¾oAO²{tfÜ¢FǂÒW²°BĤh^Wx{@¬­F¸¡ķn£P|ªĴ@^ĠĈæbÔc¶lYi^MicĎ°Â[ävï¶gv@ÀĬ·lJ¸sn|¼u~a]ÆÈtŌºJpþ£KKf~¦UbyäIĺãnÔ¿^­ŵMThĠÜ¤ko¼Ŏìąǜh`[tRd²Ĳ_XPrɲlXiL§à¹H°Ȧqº®QCbAŌJ¸ĕÚ³ĺ§ `d¨YjiZvRĺ±öVKkjGȊÄePĞZmļKÀ[`ösìhïÎoĬdtKÞ{¬èÒÒBÔpĲÇĬJŊ¦±J«Y§@·pHµàåVKepWftsAÅqC·¬ko«pHÆuK@oHĆÛķhxenS³àǍrqƶRbzy¸ËÐl¼EºpĤ¼x¼½~Ğà@ÚüdK^mÌSj"],encodeOffsets:[[110234,38774]]},properties:{cp:[108.948024,34.263161],name:"陕西",childNum:1}},{id:"620000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@VuUv"],["@@ũEĠtt~nkh`Q¦ÅÄÜdwAb×ĠąJ¤DüègĺqBqj°lI¡ĨÒ¤úSHbjÎB°aZ¢KJO[|A£Dx}NĂ¬HUnrk kp¼Y kMJn[aGáÚÏ[½rc}aQxOgsPMnUsncZsKúvAtÞġ£®ĀYKdnFw¢JE°Latf`¼h¬we|Æbj}GA·~W`¢MC¤tL©Ĳ°qdfObÞĬ¹ttu`^ZúE`[@Æsîz®¡CƳƜG²R¢RmfwĸgÜą G@pzJM½mhVy¸uÈÔO±¨{LfæU¶ßGĂq\\ª¬²I¥IŉÈīoıÓÑAçÑ|«LÝcspīðÍgtë_õ\\ĉñLYnĝgRǡÁiHLlõUĹ²uQjYi§Z_c¨´ĹĖÙ·ŋIaBD­R¹ȥr¯GºßK¨jWkɱOqWĳ\\a­Q\\sg_ĆǛōëp»£lğÛgSŶN®À]ÓämĹãJaz¥V}Le¤Lýo¹IsŋÅÇ^bz³tmEÁ´a¹cčecÇNĊãÁ\\č¯dNj]jZµkÓdaćå]ğĳ@ ©O{¤ĸm¢E·®«|@Xwg]Aģ±¯XǁÑǳªcwQÚŝñsÕ³ÛV_ý¥\\ů¥©¾÷w©WÕÊĩhÿÖÁRo¸V¬âDb¨hûxÊ×ǌ~Zâg|XÁnßYoº§ZÅŘv[ĭÖʃuďxcVbnUSfB¯³_TzºÎO©çMÑ~M³]µ^püµÄY~y@X~¤Z³[Èōl@®Å¼£QK·Di¡ByÿQ_´D¥hŗy^ĭÁZ]cIzýah¹MĪğPs{ò²Vw¹t³ŜË[Ñ}X\\gsF£sPAgěp×ëfYHāďÖqēŭOÏëdLü\\it^c®RÊº¶¢H°mrY£B¹čIoľu¶uI]vģSQ{UŻÅ}QÂ|Ì°ƅ¤ĩŪU ęĄÌZÒ\\v²PĔ»ƢNHĂyAmƂwVm`]ÈbH`Ì¢²ILvĜH®¤Dlt_¢JJÄämèÔDëþgºƫaʎÌrêYi~ Îİ¤NpÀA¾Ĕ¼bð÷®üszMzÖĖQdȨýv§Tè|ªHÃ¾a¸|Ð ƒwKĢx¦ivr^ÿ ¸l öæfƟĴ·PJv}n\\h¹¶v·À|\\ƁĚN´ĜçèÁz]ġ¤²¨QÒŨTIlªťØ}¼˗ƦvÄùØEÂ«FïËIqōTvāÜŏíÛßÛVj³âwGăÂíNOPìyV³ŉĖýZso§HÑiYw[ß\\X¦¥c]ÔƩÜ·«jÐqvÁ¦m^ċ±R¦΋ƈťĚgÀ»IïĨʗƮ°ƝĻþÍAƉſ±tÍEÕÞāNUÍ¡\\ſčåÒʻĘm ƭÌŹöʥëQ¤µ­ÇcƕªoIýIÉ_mkl³ăƓ¦j¡YzŇi}Msßõīʋ }ÁVm_[n}eı­Uĥ¼ªI{Î§DÓƻėojqYhĹT©oūĶ£]ďxĩǑMĝq`B´ƃ˺Чç~²ņj@¥@đ´ί}ĥtPńÇ¾V¬ufÓÉCtÓ̻¹£G³]ƖƾŎĪŪĘ̖¨ʈĢƂlɘ۪üºňUðǜȢƢż̌ȦǼĤŊɲĖÂ­Kq´ï¦ºĒǲņɾªǀÞĈĂD½ĄĎÌŗĞrôñnN¼â¾ʄľԆ|Ǆ֦ज़ȗǉ̘̭ɺƅêgV̍ʆĠ·ÌĊv|ýĖÕWĊǎÞ´õ¼cÒÒBĢ͢UĜð͒s¨ňƃLĉÕÝ@ɛƯ÷¿Ľ­ĹeȏĳëCȚDŲyê×Ŗyò¯ļcÂßYtÁƤyAã˾J@ǝrý@¤rz¸oP¹ɐÚyáHĀ[JwcVeȴÏ»ÈĖ}ƒŰŐèȭǢόĀƪÈŶë;Ñ̆ȤМľĮEŔĹŊũ~ËUă{ĻƹɁύȩþĽvĽƓÉ@ēĽɲßǐƫʾǗĒpäWÐxnsÀ^ƆwW©¦cÅ¡Ji§vúF¶¨c~c¼īeXǚ\\đ¾JwÀďksãAfÕ¦L}waoZD½Ml«]eÒÅaÉ²áo½FõÛ]ĻÒ¡wYR£¢rvÓ®y®LFLzĈôe]gx}|KK}xklL]c¦£fRtív¦PĤoH{tK"]],encodeOffsets:[[[108619,36299]],[[108589,36341]]]},properties:{cp:[103.823557,36.058039],name:"甘肃",childNum:2}},{id:"630000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@InJm"],["@@CÆ½OŃĦsΰ~Ē³¦@@Ņi±è}ШƄ˹A³r_ĞǒNĪĐw¤^ŬĵªpĺSZgrpiƼĘÔ¨C|ÍJ©Ħ»®VĲ~f\\m `UnÂ~ʌĬàöNt~ňjy¢ZiƔ¥Ąk´nl`JÊJþ©pdƖ®È£¶ìRʦźõƮËnʼėæÑƀĎ[¢VÎĂMÖÝÎF²sƊƀÎBļýƞ¯ʘƭðħ¼Jh¿ŦęΌƇ¥²Q]Č¥nuÂÏri¸¬ƪÛ^Ó¦d¥[Wàx\\ZjÒ¨GtpþYŊĕ´zUOëPîMĄÁxH´áiÜUàîÜŐĂÛSuŎrJðÌ¬EFÁú×uÃÎkrĒ{V}İ«O_ÌËĬ©ÓŧSRÑ±§Ģ£^ÂyèçěM³Ƃę{[¸¿uºµ[gt£¸OƤĿéYõ·kĀq]juw¥DĩƍõÇPéÄ½G©ã¤GuȧþRcÕĕNyyût­øï»a½ē¿BMoį£Íj}éZËqbʍƬh¹ìÿÓAçãnIÃ¡I`ks£CG­ěUy×Cy@¶ʡÊBnāzGơMē¼±O÷õJËĚăVĪũƆ£¯{ËL½ÌzżVR|ĠTbuvJvµhĻĖHAëáa­OÇðñęNwœľ·LmI±íĠĩPÉ×®ÿscB³±JKßĊ«`ađ»·QAmOVţéÿ¤¹SQt]]Çx±¯A@ĉĳ¢Óļ©l¶ÅÛrŕspãRk~¦ª]Į­´FRåd­ČsCqđéFn¿ÅƃmÉx{W©ºƝºįkÕƂƑ¸wWūÐ©ÈF£\\tÈ¥ÄRÈýÌJ lGr^×äùyÞ³fjc¨£ÂZ|ǓMĝÏ@ëÜőRĝ÷¡{aïȷPu°ËXÙ{©TmĠ}Y³­ÞIňµç½©C¡į÷¯B»|St»]vųs»}MÓ ÿʪƟǭA¡fs»PY¼c¡»¦cċ­¥£~msĉPSi^o©AecPeǵkgyUi¿h}aHĉ^|á´¡HØûÅ«ĉ®]m¡qĉ¶³ÈyôōLÁstB®wn±ă¥HSòė£Së@×œÊăxÇN©©T±ª£Ĳ¡fb®Þbb_Ą¥xu¥B{łĝ³«`dƐt¤ťiñÍUuºí`£^tƃĲc·ÛLO½sç¥Ts{ă\\_»kÏ±q©čiìĉ|ÍI¥ć¥]ª§D{ŝŖÉR_sÿc³ĪōƿÎ§p[ĉc¯bKmR¥{³Ze^wx¹dƽÅ½ôIg §Mĕ ƹĴ¿ǣÜÍ]Ý]snåA{eƭ`ǻŊĿ\\ĳŬűYÂÿ¬jĖqßb¸L«¸©@ěĀ©ê¶ìÀEH|´bRľÓ¶rÀQþvl®ÕETzÜdb hw¤{LRdcb¯ÙVgƜßzÃôì®^jUèXÎ|UäÌ»rK\\ªN¼pZCüVY¤ɃRi^rPŇTÖ}|br°qňbĚ°ªiƶGQ¾²x¦PmlŜ[Ĥ¡ΞsĦÔÏâ\\ªÚŒU\\f¢N²§x|¤§xĔsZPòʛ²SÐqF`ªVÞŜĶƨVZÌL`¢dŐIqr\\oäõFÎ·¤»Ŷ×h¹]ClÙ\\¦ďÌį¬řtTӺƙgQÇÓHţĒ´ÃbEÄlbʔC|CŮkƮ[ʼ¬ň´KŮÈΰÌĪ¶ƶlðļATUvdTGº̼ÔsÊDÔveOg"]],encodeOffsets:[[[105308,37219]],[[95370,40081]]]},properties:{cp:[101.778916,36.623178],name:"青海",childNum:2}},{id:"640000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@KëÀęĞ«Oęȿȕı]ŉ¡åįÕÔ«ǴõƪĚQÐZhv K°öqÀÑS[ÃÖHƖčËnL]ûcÙß@ĝ¾}w»»oģF¹»kÌÏ·{zP§B­¢íyÅt@@á]Yv_ssģ¼ißĻL¾ġsKD£¡N_X¸}B~HaiÅf{«x»ge_bsKF¯¡IxmELcÿZ¤­ĢÝsuBLùtYdmVtNmtOPhRw~bd¾qÐ\\âÙH\\bImlNZ»loqlVmGā§~QCw¤{A\\PKNY¯bFkC¥sks_Ã\\ă«¢ħkJi¯rrAhĹûç£CUĕĊ_ÔBixÅÙĄnªÑaM~ħpOu¥sîeQ¥¤^dkKwlL~{L~hw^ófćKyE­K­zuÔ¡qQ¤xZÑ¢^ļöÜ¾Ep±âbÊÑÆ^fk¬NC¾YpxbK~¥eÖäBlt¿Đx½I[ĒǙWf»Ĭ}d§dµùEuj¨IÆ¢¥dXªƅx¿]mtÏwßRĶX¢͎vÆzƂZò®ǢÌʆCrâºMÞzÆMÒÊÓŊZÄ¾r°Î®Ȉmª²ĈUªĚîøºĮ¦ÌĘk^FłĬhĚiĀĖ¾iİbjÕ"],["@@mfwěwMrŢªv@G"]],encodeOffsets:[[[109366,40242]],[[108600,36303]]]},properties:{cp:[106.278179,38.46637],name:"宁夏",childNum:2}},{id:"650000",type:"Feature",geometry:{type:"Polygon",coordinates:["@@QØĔ²X¨~ǘBºjʐßØvKƔX¨vĊOÃ·¢i@~cĝe_«E}QxgɪëÏÃ@sÅyXoŖ{ô«ŸuXêÎf`C¹ÂÿÐGĮÕĞXŪōŸMźÈƺQèĽôe|¿ƸJR¤ĘEjcUóº¯Ĩ_ŘÁMª÷Ð¥OéÈ¿ÖğǤǷÂFÒzÉx[]­Ĥĝœ¦EP}ûƥé¿İƷTėƫœŕƅƱB»Đ±ēO¦E}`cȺrĦáŖuÒª«ĲπdƺÏØZƴwʄ¤ĖGĐǂZĶèH¶}ÚZצʥĪï|ÇĦMŔ»İĝǈì¥Βba­¯¥ǕǚkĆŵĦɑĺƯxūД̵nơʃĽá½M»òmqóŘĝčË¾ăCćāƿÝɽ©ǱŅ¹đ¥³ðLrÁ®ɱĕģŉǻ̋ȥơŻǛȡVï¹Ň۩ûkɗġƁ§ʇė̕ĩũƽō^ƕUv£ƁQïƵkŏ½ΉÃŭÇ³LŇʻ«ƭ\\lŭD{ʓDkaFÃÄa³ŤđÔGRÈƚhSӹŚsİ«ĐË[¥ÚDkº^Øg¼ŵ¸£EÍöůŉT¡c_ËKYƧUśĵÝU_©rETÏʜ±OñtYwē¨{£¨uM³x½şL©Ùá[ÓÐĥ Νtģ¢\\śnkOw¥±T»ƷFɯàĩÞáB¹ÆÑUwŕĽw[mG½Èå~Æ÷QyěCFmĭZīŵVÁƿQƛûXS²b½KÏ½ĉS©ŷXĕ{ĕK·¥Ɨcqq©f¿]ßDõU³h­gËÇïģÉɋwk¯í}I·œbmÉřīJɥĻˁ×xoɹīlc¤³Xù]ǅA¿w͉ì¥wÇN·ÂËnƾƍdÇ§đ®ƝvUm©³G\\}µĿQyŹlăµEwǇQ½yƋBe¶ŋÀůo¥AÉw@{Gpm¿AĳŽKLh³`ñcËtW±»ÕSëüÿďDu\\wwwù³VLŕOMËGh£õP¡erÏd{ġWÁč|yšg^ğyÁzÙs`s|ÉåªÇ}m¢Ń¨`x¥ù^}Ì¥H«YªƅAÐ¹n~ź¯f¤áÀzgÇDIÔ´AňĀÒ¶ûEYospõD[{ù°]uJqU|Soċxţ[õÔĥkŋÞŭZËºóYËüċrw ÞkrťË¿XGÉbřaDü·Ē÷AÃª[ÄäIÂ®BÕĐÞ_¢āĠpÛÄȉĖġDKwbmÄNôfƫVÉviǳHQµâFù­Âœ³¦{YGd¢ĚÜO {Ö¦ÞÍÀP^bƾl[vt×ĈÍEË¨¡Đ~´î¸ùÎhuè`¸HÕŔVºwĠââWò@{ÙNÝ´ə²ȕn{¿¥{l÷eé^eďXj©î\\ªÑòÜìc\\üqÕ[Č¡xoÂċªbØ­ø|¶ȴZdÆÂońéG\\¼C°ÌÆn´nxÊOĨŪƴĸ¢¸òTxÊǪMīĞÖŲÃɎOvʦƢ~FRěò¿ġ~åŊúN¸qĘ[Ĕ¶ÂćnÒPĒÜvúĀÊbÖ{Äî¸~Ŕünp¤ÂH¾ĄYÒ©ÊfºmÔĘcDoĬMŬS¤s²ʘÚžȂVŦ èW°ªB|ĲXŔþÈJĦÆæFĚêYĂªĂ]øªŖNÞüAfɨJ¯ÎrDDĤ`mz\\§~D¬{vJÂ«lµĂb¤pŌŰNĄ¨ĊXW|ų ¿¾ɄĦƐMTòP÷fØĶK¢ȝ˔Sô¹òEð­`Ɩ½ǒÂň×äı§ĤƝ§C~¡hlåǺŦŞkâ~}FøàĲaĞfƠ¥Ŕd®U¸źXv¢aƆúŪtŠųƠjdƺƺÅìnrh\\ĺ¯äɝĦ]èpĄ¦´LƞĬ´ƤǬ˼Ēɸ¤rºǼ²¨zÌPðŀbþ¹ļD¢¹\\ĜÑŚ¶ZƄ³àjĨoâȴLÊȮĐ­ĚăÀêZǚŐ¤qȂ\\L¢ŌİfÆs|zºeªÙæ§΢{Ā´ƐÚ¬¨Ĵà²łhʺKÞºÖTiƢ¾ªì°`öøu®Ê¾ãØ"],encodeOffsets:[[88824,50096]]},properties:{cp:[87.617733,43.792818],name:"新疆",childNum:1}},{id:"110000",type:"Feature",geometry:{type:"Polygon",coordinates:["@@ĽOÁûtŷmiÍt_H»Ĩ±d`¹­{bwYr³S]§§o¹qGtm_SŧoaFLgQN_dV@Zom_ć\\ßcÂ±x¯oœRcfe£o§ËgToÛJíĔóu|wP¤XnO¢ÉŦ¯rNÄā¤zâŖÈRpŢZÚ{GrFt¦Òx§ø¹RóäV¤XdżâºWbwŚ¨Ud®bêņ¾jnŎGŃŶnzÚSeîĜZczî¾i]ÍQaúÍÔiþĩȨWĢü|Ėu[qb[swP@ÅğP¿{\\¥A¨ÏÑ¨j¯X\\¯MKpA³[Hīu}}"],encodeOffsets:[[120023,41045]]},properties:{cp:[116.405285,39.904989],name:"北京",childNum:1}},{id:"120000",type:"Feature",geometry:{type:"Polygon",coordinates:["@@ŬgX§Ü«E¶FÌ¬O_ïlÁgz±AXeµÄĵ{¶]gitgIj·¥îakS¨ÐƎk}ĕ{gBqGf{¿aU^fIư³õ{YıëNĿk©ïËZŏR§òoY×Ógcĥs¡bġ«@dekąI[nlPqCnp{ō³°`{PNdƗqSÄĻNNâyj]äÒD ĬH°Æ]~¡HO¾X}ÐxgpgWrDGpù^LrzWxZ^¨´T\\|~@IzbĤjeĊªz£®ĔvěLmV¾Ô_ÈNW~zbĬvG²ZmDM~~"],encodeOffsets:[[120237,41215]]},properties:{cp:[117.190182,39.125596],name:"天津",childNum:1}},{id:"310000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@ɧư¬EpƸÁxc"],["@@©ª"],["@@MA"],["@@QpİE§ÉC¾"],["@@bŝÕÕEȣÚƥêImɇǦèÜĠÚÃƌÃ͎ó"],["@@ǜûȬɋŭ×^sYɍDŋŽąñCG²«ªč@h_p¯A{oloY¬j@Ĳ`gQÚhr|ǀ^MĲvtbe´R¯Ô¬¨Yô¤r]ìƬį"]],encodeOffsets:[[[124702,32062]],[[124547,32200]],[[124808,31991]],[[124726,32110]],[[124903,32376]],[[124438,32149]]]},properties:{cp:[121.472644,31.231706],name:"上海",childNum:6}},{id:"500000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@vjG~nGŘŬĶȂƀƾ¹¸ØÎezĆT¸}êÐqHðqĖä¥^CÆIj²p\\_ æüY|[YxƊæu°xb®Űb@~¢NQt°¶Sæ Ê~rǉĔëĚ¢~uf`faĔJåĊnÖ]jƎćÊ@£¾a®£Ű{ŶĕFègLk{Y|¡ĜWƔtƬJÑxq±ĢN´òKLÈÃ¼D|s`ŋć]Ã`đMûƱ½~Y°ħ`ƏíW½eI½{aOIrÏ¡ĕŇapµÜƅġ^ÖÛbÙŽŏml½SêqDu[RãË»ÿw`»y¸_ĺę}÷`M¯ċfCVµqŉ÷Zgg`d½pDOÎCn^uf²ènh¼WtƏxRGg¦pVFI±G^Ic´ecGĹÞ½sëĬhxW}KÓe­XsbkF¦LØgTkïƵNï¶}Gyw\\oñ¡nmĈzj@Óc£»Wă¹Ój_m»¹·~MvÛaq»­ê\\ÂoVnÓØÍ²«bq¿efE Ĝ^Q~ Évýş¤²ĮpEİ}zcĺL½¿gÅ¡ýE¡ya£³t\\¨\\vú»¼§·Ñr_oÒý¥u_n»_At©ÞÅ±ā§IVeëY}{VPÀFA¨ąB}q@|Ou\\FmQFÝMwå}]|FmÏCawu_p¯sfÙgYDHl`{QEfNysB¦zG¸rHeN\\CvEsÐùÜ_·ÖĉsaQ¯}_UxÃđqNH¬Äd^ÝŰR¬ã°wećJE·vÝ·HgéFXjÉê`|ypxkAwWĐpb¥eOsmzwqChóUQl¥F^lafanòsrEvfQdÁUVfÎvÜ^eftET¬ôA\\¢sJnQTjPØxøK|nBzĞ»LYFDxÓvr[ehľvN¢o¾NiÂxGpâ¬zbfZo~hGi]öF||NbtOMn eA±tPTLjpYQ|SHYĀxinzDJÌg¢và¥Pg_ÇzIIII£®S¬ØsÎ¼£N"],["@@ifjN@s"]],encodeOffsets:[[[109628,30765]],[[111725,31320]]]},properties:{cp:[106.504962,29.533155],name:"重庆",childNum:2}},{id:"810000",type:"Feature",geometry:{type:"MultiPolygon",coordinates:[["@@AlBk"],["@@mn"],["@@EpFo"],["@@ea¢pl¸Eõ¹hj[]ÔCÎ@lj¡uBX´AI¹[yDU]W`çwZkmcMpÅv}IoJlcafŃK°ä¬XJmÐ đhI®æÔtSHnEÒrÈc"],["@@rMUwAS®e"]],encodeOffsets:[[[117111,23002]],[[117072,22876]],[[117045,22887]],[[116975,23082]],[[116882,22747]]]},properties:{cp:[114.173355,22.320048],name:"香港",childNum:5}},{id:"820000",type:"Feature",geometry:{type:"Polygon",coordinates:["@@kÊd°å§s"],encodeOffsets:[[116279,22639]]},properties:{cp:[113.54909,22.198951],name:"澳门",childNum:1}}],UTF8Encoding:!0}):o("ECharts Map is not loaded"):o("ECharts is not Loaded")});


--------------------------------------------------------------------------------