├── .github
    ├── ISSUE_TEMPLATE.md
    └── workflows
    │   └── npm-test.yml
├── Dockerfile
├── README.md
├── _build
    └── pack_up.js
├── archive
    ├── 163.js
    ├── 23us.2018.js
    ├── 23us.js
    ├── 2manhua.js
    ├── 36mh.js
    ├── 37yue.js
    ├── 50mh.js
    ├── 517.js
    ├── 57mh.js
    ├── 733mh.js
    ├── 76.js
    ├── 81xsw.js
    ├── 88bag.js
    ├── 999comics.js
    ├── AlphaPolis_2016-20170619.js
    ├── MAGCOMI.js
    ├── OVERLAP.js
    ├── XOY.js
    ├── aikanmh.js
    ├── biquge.js
    ├── buka.js
    ├── ck101.js
    ├── comico.js
    ├── comico_jp.js
    ├── comico_jp_plus.js
    ├── dagu.js
    ├── dmeden.js
    ├── duoduomh.js
    ├── emw.js
    ├── hhcool.js
    ├── iqg365.js
    ├── manhuatai.2018.js
    ├── nokiacn.js
    ├── ohmanhua.js
    ├── r2hm.js
    ├── remanba.js
    ├── renamer_nyaa.js
    ├── tohomh.js
    ├── wuyouhui.js
    ├── xbiquge.js
    ├── yinvmh.js
    └── youma.js
├── arrangement
    ├── classify_and_compress.js
    ├── list_kuaiZip.js
    ├── recover_mulitiple_downloaded_bad_file.js
    └── renamer.js
├── book.cmn-Hant-TW
    ├── ebookservice.js
    ├── epub_hans_to_hant.js
    ├── fetch_all_links.js
    ├── ljswio.js
    └── podcasts.js
├── comic.cmn-Hans-CN
    ├── 1kkk.js
    ├── 733dm.js
    ├── 90mh.js
    ├── 930mh.js
    ├── baozimh.org.js
    ├── baozimh_cn.js
    ├── bilibili.js
    ├── comic.cmn-Hans-CN.bat
    ├── dajiaochong.js
    ├── dm5.js
    ├── dmzj.js
    ├── dongman.js
    ├── gufengmh.js
    ├── hanmanwo.js
    ├── kanman.js
    ├── katui.js
    ├── kuaikan.js
    ├── manhuacat.js
    ├── manhuadb.js
    ├── manhuagui.js
    ├── manhuaniu.js
    ├── mh1234.js
    ├── mh160.js
    ├── migudm.js
    ├── mymhh.js
    ├── pufei.js
    ├── qiman5.js
    ├── qq.bat
    ├── qq.js
    ├── sfacg.js
    ├── taduo.js
    ├── toomics_sc.js
    ├── u17.js
    └── weibo.js
├── comic.cmn-Hant-TW
    ├── 18comic.chapter.html
    ├── 18comic.js
    ├── 18comic.work.html
    ├── baozimh.js
    ├── cartoonmad.js
    ├── comicbus.js
    ├── dogemanga.js
    ├── manhuagui_tw.js
    ├── toomics_tc.js
    └── webtoon.js
├── comic.en-US
    ├── bookcube.js
    ├── mrblue.js
    ├── toomics_en.js
    └── webtoon_en.js
├── comic.ja-JP
    ├── AlphaPolis_official_manga.js
    ├── AlphaPolis_user_manga.js
    ├── ComicWalker.js
    ├── cycomi.js
    ├── moae.js
    ├── nico_seiga.js
    ├── tmca.js
    └── youngaceup.js
├── document
    ├── README.cmn-Hans-CN.md
    ├── README.cmn-Hant-TW.md
    ├── README.en-US.md
    └── README.ja-JP.md
├── gui_electron
    ├── gui_electron.css
    ├── gui_electron.html
    ├── gui_electron.js
    ├── gui_electron_functions.js
    └── icon
    │   ├── rasen2.ico
    │   └── rasen2.png
├── novel.cmn-Hans-CN
    ├── 51shucheng.js
    ├── 630book.js
    ├── 69shu.js
    ├── 88dus.js
    ├── biqizw.js
    ├── biqugse.js
    ├── booktxt.js
    ├── cwjjj.js
    ├── daocaoren.js
    ├── ecxs.js
    ├── fxnzw.js
    ├── huaxiangju.js
    ├── kanshushenzhan.js
    ├── kanunu.js
    ├── luoxia.js
    ├── novel.cmn-Hans-CN.bat
    ├── piaotian.js
    ├── qidian.js
    ├── quanben.js
    ├── x81zw.js
    ├── xbiquge.cc.js
    ├── xbiquge.so.js
    ├── xbiquke.js
    ├── xshuyaya.js
    ├── zhuishubang.js
    └── zwdu.js
├── novel.ja-JP
    ├── AlphaPolis.js
    ├── Hameln.js
    ├── kakuyomu.js
    ├── mid.js
    ├── mnlt.js
    ├── noc.js
    ├── novel.ja-JP.bat
    └── yomou.js
├── package.json
├── start_gui_electron.bat
├── start_gui_electron.sh
├── work_crawler.default_configuration.js
├── work_crawler.updater.js
└── work_crawler_loader.js


/.github/ISSUE_TEMPLATE.md:
--------------------------------------------------------------------------------
 1 | ﻿<!--
 2 | 
 3 | 感謝您的愛用並回報問題。 **回報問題時請將標題填詳細完整一些。**
 4 | 有些問題在最新版本已修復完畢，您可能得要確認使用的是最新版本的網路作品下載工具。
 5 | 
 6 | 若是您使用後問題已解決，請記得回來關掉本議題。仍發現有相關問題的話，可重開這個議題。
 7 | 遇到不同的問題，請另外開個新議題來修正。
 8 | 
 9 | 本工具以修正錯誤為主，由於人力有限，這邊主要把精力放在維護常用的網站。新增網站僅在行有餘力時為之，請見諒。
10 | 英語或韓語的網站煩請利用 Free Manga Downloader 之類軟體會比較好。這邊幾乎不會上英語或者韓語網站，就算做了出來也很少在做維護，沒有專門看英語韓語網站的工具維護得勤勞。
11 | I am sorry that for English or Korean sites, using Free Manga Downloader is much suitable. For the deficiency of time, it is hard to maintain the tools instantly.
12 | 新增網站時，請 **一個網站開一個議題，除了在標題說明要新增網站，並加上網站名稱**。
13 | 另外增加網站往往要耗費時間、作許多考量，之後還需維護；請確認網站經常更新、付費作品不多，並請附個其他網站未揭載之作品。
14 | 
15 | 太久沒有回應的議題，將會被關閉。
16 | 
17 | 請在提交問題的同時，附帶如下信息，方便我們盡快幫您解決問題，謝謝。
18 | 
19 | Thank you for reporting issues.
20 | Plese fill the template when you reporting a new issue, thank you!
21 | 
22 | -->
23 | 
24 | * **Version**: <!-- 您使用的 work_crawler 為哪個版本: 安裝包, 懶人安裝法 -->
25 | * **Interface**: <!-- 您使用的 work_crawler 為哪個介面: 圖形介面, 命令列介面 -->
26 | * **Arguments**: <!-- 採用命令列介面時所下的指令，或者使用圖形介面時的網站與作品名稱/作品ID -->
27 | 
28 | <!-- 請描述出了什麼問題、下載的網站與作品名稱、造成問題的操作步驟、您預期的行為等。您可貼上錯誤訊息與執行時的畫面，謝謝。 -->
29 | 
30 | 


--------------------------------------------------------------------------------
/.github/workflows/npm-test.yml:
--------------------------------------------------------------------------------
 1 | # https://github.com/actions/starter-workflows/blob/main/ci/node.js.yml
 2 | # This workflow will do a clean install of node dependencies, build the source code and run tests across different versions of node
 3 | # For more information see: https://help.github.com/actions/language-and-framework-guides/using-nodejs-with-github-actions
 4 | 
 5 | name: Node.js CI test
 6 | 
 7 | on:
 8 |   push:
 9 |     branches: [ master ]
10 |   pull_request:
11 |     branches: [ master ]
12 | 
13 | jobs:
14 |   test:
15 | 
16 |     runs-on: ubuntu-latest
17 | 
18 |     strategy:
19 |       matrix:
20 |         # 0.12.x will cause `Fatal error in ../deps/v8/src/lookup.cc, line 47`
21 |         # https://github.com/kanasimi/CeJS/runs/2105877783?check_suite_focus=true
22 |         node-version: [ 0.10.x, 14.x, 16.x ]
23 |         # See supported Node.js release schedule at https://nodejs.org/en/about/releases/
24 | 
25 |     steps:
26 |     - uses: actions/checkout@v2
27 |     - name: Use Node.js ${{ matrix.node-version }}
28 |       uses: actions/setup-node@v1
29 |       with:
30 |         node-version: ${{ matrix.node-version }}
31 |     #- run: npm ci
32 |     #- run: npm run build --if-present
33 |     - run: npm run test
34 | 


--------------------------------------------------------------------------------
/Dockerfile:
--------------------------------------------------------------------------------
 1 | # https://hub.docker.com/r/kanasimi/work_crawler
 2 | 
 3 | # https://www.jinnsblog.com/2018/12/docker-dockerfile-guide.html
 4 | # https://nodejs.org/zh-cn/docs/guides/nodejs-docker-webapp/
 5 | # https://ithelp.ithome.com.tw/articles/10192519
 6 | # https://www.electron.build/multi-platform-build#docker
 7 | 
 8 | # https://github.com/nodejs/docker-node
 9 | # https://hub.docker.com/_/node/
10 | # https://derickbailey.com/2017/03/09/selecting-a-node-js-image-for-docker/
11 | FROM node:12
12 | # FROM electronuserland/builder
13 | 
14 | # Create app directory
15 | WORKDIR /app
16 | # copy files
17 | COPY work_crawler.updater.js /app
18 | RUN ["node", "work_crawler.updater.js"]
19 | 
20 | # application's default port
21 | EXPOSE 80
22 | 
23 | CMD ["sh", "-c", "cd work_crawler-master && sh start_gui_electron.sh"]
24 | 
25 | # docker build .
26 | # docker image ls
27 | # docker tag {DOCKER_IMAGE_ID} kanasimi/work_crawler:2.1.0
28 | # docker push kanasimi/work_crawler
29 | 
30 | # docker pull kanasimi/work_crawler
31 | # docker run -it --rm --name kanasimi/work_crawler
32 | # Enter the container
33 | # docker exec -it kanasimi/work_crawler /bin/bash
34 | 
35 | 


--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
 1 | ﻿[![GitHub release](https://img.shields.io/github/release/kanasimi/work_crawler.svg)](https://github.com/kanasimi/work_crawler/releases/latest/)
 2 | ![GitHub Release Date](https://img.shields.io/github/release-date/kanasimi/work_crawler.svg)
 3 | ![Github commits (since latest release)](https://img.shields.io/github/commits-since/kanasimi/work_crawler/latest.svg)
 4 | ![GitHub commit activity the past week, 4 weeks, year](https://img.shields.io/github/commit-activity/y/kanasimi/work_crawler.svg)
 5 | [![Github All Releases Downloads](https://img.shields.io/github/downloads/kanasimi/work_crawler/total.svg)](https://github.com/kanasimi/work_crawler/releases)
 6 | [![Known Vulnerabilities](https://snyk.io/test/github/kanasimi/work_crawler/badge.svg?targetFile=package.json)](https://snyk.io/test/github/kanasimi/work_crawler?targetFile=package.json)
 7 | [![codebeat badge](https://codebeat.co/badges/3a891138-ee8a-411a-90dd-20513f4f6a2b)](https://codebeat.co/projects/github-com-kanasimi-work_crawler-master)
 8 | <!--
 9 | ![Github Release Downloads](https://img.shields.io/github/downloads/kanasimi/work_crawler/v1.4/total.svg)
10 | ![Github Release Downloads](https://img.shields.io/github/downloads/kanasimi/work_crawler/latest/total.svg)
11 | -->
12 | 
13 | # CeJS online novels / comics downloader
14 | - [en] Tools to download novels (→ epub) and comics.<br />
15 | 	→ **[English document](document/README.en-US.md)**
16 | - [TW] 批量下載小說 (→ epub)、漫畫網站作品的工具。<br />
17 | 	→ **[繁體中文說明](document/README.cmn-Hant-TW.md)**
18 | - [CN] 批量下载小说 (→ epub)、漫画网站作品的网络爬虫。<br />
19 | 	→ **[简体中文说明](document/README.cmn-Hans-CN.md)**
20 | - [ja] ウェブ小説 (→ epub)、ウェブ漫画作品を一括ダウンロードツール。<br />
21 | 	→ **[日本語の説明](document/README.ja-JP.md)**
22 | 
23 | ## Language support 多語言支援
24 | Welcome to join [the translating project](https://github.com/kanasimi/work_crawler/issues/185)! [一緒に翻訳しましょう](https://github.com/kanasimi/work_crawler/issues/185)！
25 | 
26 | | Language 語言 | Support 支援狀況 | README.md |
27 | |---|:---:|---|
28 | | 繁體中文 | ✔️ | [繁體中文說明](document/README.cmn-Hant-TW.md) |
29 | | 简体中文 | ✔️ | [简体中文说明](document/README.cmn-Hans-CN.md) |
30 | | English | ✔️ | [English document](document/README.en-US.md) |
31 | | Português brasileiro | 🚧 |
32 | | 日本語 | 🚧 | [日本語の説明](document/README.ja-JP.md) |
33 | | 한국어 | 🚧 |
34 | 
35 | ## OS support 作業系統支援
36 | | Platform 作業系統平臺 | Support 支援狀況 |
37 | |---|:---:|
38 | | Windows | ✔️ |
39 | | macOS | ✔️ |
40 | | UNIX, Linux | ✔️ |
41 | <!-- | Android | ❌ | -->
42 | 
43 | ## Interface 支援介面
44 | | Interface 介面/界面 インターフェース | Support 支援狀況 |
45 | |---|:---:|
46 | | [GUI](https://en.wikipedia.org/wiki/Graphical_user_interface) 視窗/图形 グラフィカル | ✔️ |
47 | | [CLI](https://en.wikipedia.org/wiki/Command-line_interface) 命令列/命令行 コマンドライン | ✔️ |
48 | | API 應用程式介面 | ✔️ |
49 | 
50 | ## Features 特點
51 | GUI supports different languages: 視窗型態介面支援不同語系：
52 | ![支援不同語系](https://lh3.googleusercontent.com/-EOQgYAap6YPw7iKQRlvlA4-fr37-4SddypCw44H2uhgpgmQ6FtpjjJ-qg_gJHbwfNRn8GNvvoYqE46yIQwg3xOVzR-5mzfqX8tPhOM06iYdF2gXOuIddcN5rNlCMhmmIxYye7SX8g=w2400)
53 | 
54 | Many download options: 有許多可調整的下載選項：
55 | ![有許多可調整的下載選項](https://lh3.googleusercontent.com/uEUr-iYs1JKoZukar44sOqxSL908uPTSjSG4eDco-O8bFjjIFkxSRsPy2UMkcnI3Z7Hfn-zZ2wdE9OjRr1CQZs_DfoGjvJLBCoRg9g4GH-JxG9ZpwT8fX8srn958jBzJzNbWcMvdIg=w2400)
56 | 
57 | Optional dark theme: 可選用暗色系主題：
58 | ![暗色系主題](https://lh3.googleusercontent.com/qS2i8iJTQ21bY8_IbHkBDG0__svP_zJIaYXKREbXW3lNmYA4XyJVLfJ0eyvJ6mb_k0jmGXNLRmKsngfdob-lkrLrHq9HLkcP3vVgXxx4ZQLbA85o7bRAurPiN_-Py3t7AZoop5S78g=w2400)
59 | 
60 | Search websites and download works with one click: 能一鍵搜尋各網站與下載作品：
61 | ![一鍵搜尋各網站與下載作品](https://lh3.googleusercontent.com/pz0zKuF5-kxFle8EgoUMfNAF7V8Kq6M_Dw9HVBvbXrF3hIW94voHHstMSsoZXmmmuVCxCk-Tfev6g0OJ2Ee7aZViYGiCB9hi5lJRlJ0r0eY9KjYkgW-BV2OOq8fPwp0Hi8RylR-YQQ=w2400)
62 | 


--------------------------------------------------------------------------------
/archive/163.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載网易漫画的工具。 Download 163 comics.
  3 |  */
  4 | 
  5 | 'use strict';
  6 | 
  7 | require('../work_crawler_loader.js');
  8 | 
  9 | // ----------------------------------------------------------------------------
 10 | 
 11 | var crawler = new CeL.work_crawler({
 12 | 	// recheck:從頭檢測所有作品之所有章節。
 13 | 	// recheck : true,
 14 | 	// one_by_one : true,
 15 | 
 16 | 	// 2017/4: https://manhua.163.com/
 17 | 	// 2019/5: 網易漫畫網址更動 → https://163.bilibili.com/
 18 | 	base_URL : 'https://163.bilibili.com/',
 19 | 
 20 | 	// allow .jpg without EOI mark.
 21 | 	// allow_EOI_error : true,
 22 | 	// 當圖像檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。
 23 | 	// skip_error : true,
 24 | 
 25 | 	// 解析 作品名稱 → 作品id get_work()
 26 | 	search_URL : 'search/book/key/hints.json?key=',
 27 | 	parse_search_result : function(html, get_label) {
 28 | 		html = JSON.parse(html).books.data;
 29 | 		var id_list = html.map(function(book) {
 30 | 			book.title = get_label(book.title);
 31 | 			return book.id = book.bookId;
 32 | 		});
 33 | 		return [ id_list, html ];
 34 | 	},
 35 | 	// id_of_search_result : function(cached_data) { return cached_data; },
 36 | 	title_of_search_result : 'title',
 37 | 
 38 | 	// 取得作品的章節資料。 get_work_data()
 39 | 	work_URL : 'source/',
 40 | 	parse_work_data : function(html, get_label) {
 41 | 		var title = get_label(html.between(
 42 | 				'<h1 class="f-toe sr-detail__heading">', '</h1>')),
 43 | 		//
 44 | 		text = html.between('<div class="sr-detail__middle js-detail-middle">',
 45 | 				'<div class="sr-detail__bottom f-cb js-detail-bottom">'),
 46 | 		//
 47 | 		matched, PATTERN = /<dt>([^<>]+)<\/dt>[\s\n]*<dd>([\s\S]+?)<\/dd>/g,
 48 | 		//
 49 | 		// work_data={id,title,author,authors,chapter_count,last_update,last_download:{date,chapter}}
 50 | 		work_data = {
 51 | 			// 必要屬性：須配合網站平台更改。
 52 | 			title : title,
 53 | 
 54 | 			// 選擇性屬性：須配合網站平台更改。
 55 | 			author : get_label(html.between(
 56 | 					'<div class="sr-detail__author-text f-fl">', '<')),
 57 | 			last_update : get_label(html.between(
 58 | 			//
 59 | 			'<div class="sr-notice__text f-toe', '</div>').between('>'))
 60 | 		};
 61 | 
 62 | 		while (matched = PATTERN.exec(text)) {
 63 | 			work_data[get_label(matched[1])] = get_label(matched[2]);
 64 | 		}
 65 | 
 66 | 		// e.g., "连载中"
 67 | 		work_data.status = work_data.状态;
 68 | 		delete work_data.状态;
 69 | 		work_data.description = work_data.简介;
 70 | 		delete work_data.简介;
 71 | 		work_data.题材 = work_data.题材.split(/[\s\n]+/);
 72 | 
 73 | 		return work_data;
 74 | 	},
 75 | 	chapter_list_URL : function(work_id) {
 76 | 		return 'book/catalog/' + work_id + '.json';
 77 | 	},
 78 | 	get_chapter_list : function(work_data, html) {
 79 | 		var chapter_json = JSON.parse(html).catalog.sections;
 80 | 
 81 | 		if (chapter_json.length < 1) {
 82 | 			throw 'sections.length = ' + chapter_json.length + ', not 1!';
 83 | 		}
 84 | 
 85 | 		CeL.fs_write(work_data.directory
 86 | 		//
 87 | 		+ chapter_json[0].bookId + '.json', html);
 88 | 
 89 | 		if (chapter_json.length === 1) {
 90 | 			// 正常情況:只有第一章。
 91 | 			work_data.chapter_list = chapter_json[0].sections;
 92 | 			return;
 93 | 		}
 94 | 
 95 | 		// assert: sections >= 2
 96 | 		work_data.chapter_list = [];
 97 | 		function add_section(section) {
 98 | 			if (Array.isArray(section.sections)) {
 99 | 				// assert: section.leaf === false
100 | 				var title_hierarchy = this.clone();
101 | 				title_hierarchy.push(section.fullTitle);
102 | 				CeL.debug(title_hierarchy.join(' - '), 2);
103 | 				section.sections.forEach(add_section, title_hierarchy);
104 | 			} else {
105 | 				// assert: section.leaf && section.sectionId
106 | 				CeL.debug(section.fullTitle, 3);
107 | 				section.title_hierarchy = this;
108 | 				work_data.chapter_list.push(section);
109 | 			}
110 | 		}
111 | 
112 | 		chapter_json.forEach(add_section, []);
113 | 	},
114 | 
115 | 	// 取得每一個章節的各個影像內容資料。 get_chapter_data()
116 | 	chapter_URL : function(work_data, chapter_NO) {
117 | 		return 'reader/' + work_data.id + '/'
118 | 				+ work_data.chapter_list[chapter_NO - 1].sectionId;
119 | 	},
120 | 	parse_chapter_data : function(html, work_data, get_label, chapter_NO) {
121 | 		var seedLength = html.between('window.DATA.seedLength = ', ';') | 0,
122 | 		//
123 | 		chapter_data = html.between('window.PG_CONFIG', '</script>');
124 | 		if (!seedLength && !chapter_data) {
125 | 			chapter_data = html
126 | 			// e.g., 太子: <h3>因版权限制，您所在的地区无法观看，敬请海涵</h3>
127 | 			.between('<div class="error-nodata">', '</div>');
128 | 			chapter_data = get_label(chapter_data.between('<h3>', '</h3>')
129 | 					|| chapter_data);
130 | 			this.onerror(chapter_data || 'No chapter data get', work_data);
131 | 			return;
132 | 		}
133 | 
134 | 		chapter_data = 'chapter_data'
135 | 		//
136 | 		+ chapter_data.replace(/window\.PG_CONFIG/g, 'chapter_data')
137 | 		// 改成 true 會下載 webp
138 | 		.replace(/window\.IS_SUPPORT_WEBP/g, 'false');
139 | 		// console.log(chapter_data);
140 | 		eval(chapter_data);
141 | 
142 | 		// 設定必要的屬性。
143 | 		chapter_data.title = chapter_data.section.fullTitle;
144 | 		chapter_data.image_list = chapter_data.images;
145 | 		// 2017/6/15 改版。
146 | 		chapter_data.images.forEach(function(image) {
147 | 			image.url = image.url.slice(0, -seedLength);
148 | 		});
149 | 
150 | 		chapter_data.limited = work_data.chapter_list[chapter_NO - 1].needPay;
151 | 
152 | 		return chapter_data;
153 | 	}
154 | });
155 | 
156 | // ----------------------------------------------------------------------------
157 | 
158 | // CeL.set_debug(3);
159 | 
160 | start_crawler(crawler, typeof module === 'object' && module);
161 | 


--------------------------------------------------------------------------------
/archive/23us.2018.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載2016 顶点小说(http://www.23us.cc)的工具。 Download 23us novels.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.PTCMS');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.PTCMS({
16 | 	// 23us 在連續下載2000章左右後似乎會自動404，得要等如3分鐘才會回復。
17 | 	// 明確指定自上次下載過的章節接續下載。
18 | 	// recheck : false,
19 | 
20 | 	base_URL : 'https://www.23us.cc/',
21 | 
22 | 	// 解析 作品名稱 → 作品id get_work()
23 | 	baidu_cse : '1682272515249779940',
24 | 
25 | 	// 取得作品的章節資料。 get_work_data()
26 | 	work_URL : function(work_id) {
27 | 		return 'html/' + (work_id.slice(0, -3) || 0) + '/' + work_id + '/';
28 | 	},
29 | 	// 取得包含章節列表的文字範圍。
30 | 	get_chapter_list_contents : function(html) {
31 | 		return html.between('<dl class="chapterlist">', '</dl>');
32 | 	}
33 | });
34 | 
35 | // ----------------------------------------------------------------------------
36 | 
37 | // CeL.set_debug(3);
38 | 
39 | start_crawler(crawler, typeof module === 'object' && module);
40 | 


--------------------------------------------------------------------------------
/archive/23us.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載 2011 顶点小说 的工具。 Download 23us novels.
  3 |  * 
  4 |  * 這網站可能使用 PTCMS?
  5 |  */
  6 | 
  7 | 'use strict';
  8 | 
  9 | require('../work_crawler_loader.js');
 10 | 
 11 | // ----------------------------------------------------------------------------
 12 | 
 13 | CeL.run('application.storage.EPUB');
 14 | 
 15 | // ----------------------------------------------------------------------------
 16 | 
 17 | var crawler = new CeL.work_crawler({
 18 | 	// auto_create_ebook, automatic create ebook
 19 | 	// MUST includes CeL.application.locale!
 20 | 	need_create_ebook : true,
 21 | 	// recheck:從頭檢測所有作品之所有章節與所有圖片。不會重新擷取圖片。對漫畫應該僅在偶爾需要從頭檢查時開啟此選項。default:false
 22 | 	// recheck='changed': 若是已變更，例如有新的章節，則重新下載/檢查所有章節內容。否則只會自上次下載過的章節接續下載。
 23 | 	recheck : 'changed',
 24 | 
 25 | 	// one_by_one : true,
 26 | 
 27 | 	// 2020/2/29: https://www.x23us.com/
 28 | 	base_URL : 'https://www.23ddw.cc/',
 29 | 	charset : 'gbk',
 30 | 
 31 | 	// 解析 作品名稱 → 作品id get_work()
 32 | 	search_URL : 'modules/article/search.php?searchtype=keywords&searchkey=',
 33 | 	parse_search_result : function(html, get_label) {
 34 | 		// console.log(html);
 35 | 		var matched = html.match(/og:url" content="[^<>"]+?\/(\d+)\/?"/);
 36 | 		if (matched) {
 37 | 			return [ [ +matched[1] ],
 38 | 			//
 39 | 			[ get_label(html.between('<h1>', '</h1>').replace('全文阅读', '')) ] ];
 40 | 		}
 41 | 
 42 | 		var id_data = [],
 43 | 		// {Array}id_list = [id,id,...]
 44 | 		id_list = [];
 45 | 
 46 | 		// <table class="grid" width="100%" align="center">
 47 | 		// <caption><b style="color:red;">元尊</b>搜索结果</caption>
 48 | 		html.between('<table', '</table>').each_between('<tr>', '</tr>',
 49 | 		// <td class="odd"><a href="https://www.x23us.com/book/69123"><b
 50 | 		// style="color:red">元尊</b></a></td>
 51 | 		function(text) {
 52 | 			// console.log(text);
 53 | 			var matched = text.match(
 54 | 			//
 55 | 			/<a href="[^<>"]+?\/(\d+)\/?"[^<>]*>([\s\S]+?)<\/a>/);
 56 | 			if (!matched)
 57 | 				return;
 58 | 			id_list.push(+matched[1]);
 59 | 			id_data.push(get_label(matched[2]));
 60 | 		});
 61 | 
 62 | 		return [ id_list, id_data ];
 63 | 	},
 64 | 
 65 | 	// 取得作品的章節資料。 get_work_data()
 66 | 	work_URL : 'book/',
 67 | 	parse_work_data : function(html, get_label, extract_work_data) {
 68 | 		var work_data = {
 69 | 			// 必要屬性：須配合網站平台更改。
 70 | 			title : get_label(html.between('<h1>', '</h1>')
 71 | 			//
 72 | 			.replace('全文阅读', '')),
 73 | 
 74 | 			// 選擇性屬性：須配合網站平台更改。
 75 | 			image : html.between('全文阅读</h1></dd>', '</div>').between('src="',
 76 | 					'"'),
 77 | 			description : html.between('内容简介：</b></p>',
 78 | 					'<p style="display:none" id="sidename">').between(
 79 | 					'</table>')
 80 | 
 81 | 		}, get_next_between = html.between(' id="at">', '</table>')
 82 | 				.find_between('>', '<'), text;
 83 | 
 84 | 		extract_work_data(work_data, html.between(' id="at">', '</table>'),
 85 | 				/<th>([\s\S]+?)<\/th><td>([\s\S]+?)<\/td>/g);
 86 | 
 87 | 		extract_work_data(work_data, html);
 88 | 
 89 | 		html.between('<p class="widget-toc-workStatus">', '</p>')
 90 | 		//
 91 | 		.each_between('<span>', '</span>', function(text) {
 92 | 			work_data.status.push(get_label(text));
 93 | 		});
 94 | 
 95 | 		Object.assign(work_data, {
 96 | 			// 選擇性屬性：須配合網站平台更改。
 97 | 			// e.g., 连载中, 連載中
 98 | 			status : work_data.文章状态,
 99 | 			category : work_data.文章类别,
100 | 			author : work_data.文章作者,
101 | 			last_update : work_data.最后更新,
102 | 			site_name : '顶点小说'
103 | 		});
104 | 
105 | 		work_data.site_name = work_data.site_name.between(null, ' ');
106 | 
107 | 		if (work_data.image
108 | 		// 處理特殊圖片: ignore site default image
109 | 		// http://www.23us.com/modules/article/images/nocover.jpg
110 | 		&& work_data.image.includes('nocover.jpg')) {
111 | 			delete work_data.image;
112 | 		}
113 | 
114 | 		// console.log(work_data);
115 | 		return work_data;
116 | 	},
117 | 	// 對於章節列表與作品資訊分列不同頁面(URL)的情況，應該另外指定.chapter_list_URL。
118 | 	chapter_list_URL : function(work_id) {
119 | 		return 'html/' + (work_id / 1000 | 0) + '/' + work_id + '/';
120 | 	},
121 | 	get_chapter_list : function(work_data, html, get_label) {
122 | 		work_data.chapter_list = [];
123 | 		html.between(' id="at">', '<div ')
124 | 		//
125 | 		.each_between('<td', '</td>', function(text) {
126 | 			work_data.chapter_list.push({
127 | 				url : text.between(' href="', '"'),
128 | 				title : get_label(text.between('<a ', '</a>').between('>'))
129 | 			});
130 | 		});
131 | 	},
132 | 
133 | 	// 取得每一個章節的各個影像內容資料。 get_chapter_data()
134 | 	chapter_URL : function(work_data, chapter_NO) {
135 | 		return work_data.chapter_list_URL
136 | 				+ work_data.chapter_list[chapter_NO - 1].url;
137 | 	},
138 | 	parse_chapter_data : function(html, work_data, get_label, chapter_NO) {
139 | 		this.add_ebook_chapter(work_data, chapter_NO, {
140 | 			title : get_label(html.between('<h1>', '</h1>')
141 | 			//
142 | 			.replace(/^正文/, '')),
143 | 			text : html.between('<dd id="contents">', '</dd>')
144 | 		});
145 | 	}
146 | });
147 | 
148 | // ----------------------------------------------------------------------------
149 | 
150 | // CeL.set_debug(3);
151 | 
152 | start_crawler(crawler, typeof module === 'object' && module);
153 | 


--------------------------------------------------------------------------------
/archive/2manhua.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載爱漫画的工具。 Download 2manhua comics.
  3 |  * 
  4 |  * 爱漫画 by 漫画之家 http://www.manhuazj.com/
  5 |  */
  6 | 
  7 | 'use strict';
  8 | 
  9 | require('../work_crawler_loader.js');
 10 | 
 11 | // ----------------------------------------------------------------------------
 12 | 
 13 | var crawler = new CeL.work_crawler({
 14 | 	// 所有的子檔案要修訂註解說明時，應該都要順便更改在CeL.application.net.comic中Comic_site.prototype內的母comments，並以其為主體。
 15 | 
 16 | 	// 本站常常無法取得圖片，因此得多重新檢查。
 17 | 	// recheck:從頭檢測所有作品之所有章節與所有圖片。不會重新擷取圖片。對漫畫應該僅在偶爾需要從頭檢查時開啟此選項。
 18 | 	// recheck : true,
 19 | 	// 當無法取得chapter資料時，直接嘗試下一章節。在手動+監視下recheck時可併用此項。
 20 | 	// skip_chapter_data_error : true,
 21 | 
 22 | 	// 當圖像檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。
 23 | 	skip_error : true,
 24 | 
 25 | 	// one_by_one : true,
 26 | 	base_URL : 'http://www.2manhua.com/',
 27 | 
 28 | 	// 取得伺服器列表。
 29 | 	// use_server_cache : true,
 30 | 	server_URL : function() {
 31 | 		// http://www.2manhua.com/templates/default/scripts/configs.js?v=1.0.3
 32 | 		return this.base_URL + 'templates/default/scripts/configs.js';
 33 | 	},
 34 | 	parse_server_list : function(html) {
 35 | 		return Object.values(JSON.parse(
 36 | 		//
 37 | 		html.replace(/^[^{]+/, '').replace(/[^}]+$/, '')
 38 | 		//
 39 | 		.replace(/'/g, '"')).host)
 40 | 		//
 41 | 		.map(function(server_data) {
 42 | 			return server_data[0];
 43 | 		});
 44 | 	},
 45 | 
 46 | 	// 解析 作品名稱 → 作品id get_work()
 47 | 	search_URL : 'handler/suggest?cb=_&key=',
 48 | 	parse_search_result : function(html) {
 49 | 		// e.g.,
 50 | 		// _([{"id":"28015","t":"民工勇者","u":"/comic/28015/","cid":"/comic/28015/0208","ct":"207话","s":"0"},{"id":"28093","t":"无敌勇者王(民工勇者)","u":"/comic/28093/","cid":"/comic/28093/02","ct":"199话","s":"0"}])
 51 | 		var id_data = html ? JSON.parse(html.between('(').replace(/\)[^)]*$/,
 52 | 				'')) : [];
 53 | 		return [ id_data, id_data ];
 54 | 	},
 55 | 	id_of_search_result : function(cached_data) {
 56 | 		return cached_data.id | 0;
 57 | 	},
 58 | 	title_of_search_result : 't',
 59 | 
 60 | 	// 取得作品的章節資料。 get_work_data()
 61 | 	work_URL : function(work_id) {
 62 | 		// e.g., http://www.2manhua.com/comic/25652.html
 63 | 		return 'comic/' + work_id + '.html';
 64 | 	},
 65 | 	parse_work_data : function(html, get_label, extract_work_data) {
 66 | 		var work_data = {
 67 | 			// 必要屬性：須配合網站平台更改。
 68 | 			title : html.between('og:novel:title" content="', '"')
 69 | 					|| html.between('<h1>', '</h1>'),
 70 | 
 71 | 			// 選擇性屬性：須配合網站平台更改。
 72 | 			// <meta property="og:novel:status" content="已完结"/>
 73 | 			status : html.between('<meta property="og:novel:status" content="',
 74 | 					'"/>'),
 75 | 			description : get_label(html.between('"intro-all"', '</div>')
 76 | 					.between('>'))
 77 | 		};
 78 | 		// 由 meta data 取得作品資訊。
 79 | 		extract_work_data(work_data, html);
 80 | 		extract_work_data(work_data, html.between('book-detail', 'intro-act'),
 81 | 				/<strong>([^<>]+?)<\/strong>(.+?)<\/span>/g);
 82 | 		return work_data;
 83 | 	},
 84 | 	get_chapter_list : function(work_data, html) {
 85 | 		work_data.chapter_list = [];
 86 | 		var matched, page,
 87 | 		// 2017/7/22
 88 | 		PATTERN_page = /<ul (?:style="display:block;")?>(.+?)<\/ul>/g,
 89 | 		/**
 90 | 		 * e.g., <code>
 91 | 		<li><a href="/comic/25652/072.html" title="72回 碧霞坠" class="status0" target="_blank"><span>72回<i>14p</i></span></a></li>
 92 | 		</code>
 93 | 		 */
 94 | 		PATTERN_chapter =
 95 | 		// [all,href,title,inner]
 96 | 		/<li><a href="([^"<>]+)" title="([^"<>]+)"[^<>]*>(.+?)<\/a><\/li>/g;
 97 | 		while (page = PATTERN_page.exec(html)) {
 98 | 			page = page[1];
 99 | 			var chapter_list = [];
100 | 			while (matched = PATTERN_chapter.exec(page)) {
101 | 				matched[2] = matched[2].trim();
102 | 				if (matched[3] = matched[3].between('<i>', '</i>')) {
103 | 					matched[2] = matched[2] + ' ' + matched[3];
104 | 				}
105 | 				chapter_list.push({
106 | 					title : matched[2],
107 | 					url : encodeURI(matched[1])
108 | 				});
109 | 			}
110 | 			work_data.chapter_list.append(chapter_list.reverse());
111 | 		}
112 | 
113 | 		return;
114 | 
115 | 		// 已被棄置的排序方法。
116 | 		work_data.chapter_list.sort(function(chapter_data_1, chapter_data_2) {
117 | 			var matched_1 = chapter_data_1.url.match(/(\d+)\.htm/),
118 | 			// 依照.url排序。
119 | 			matched_2 = chapter_data_2.url.match(/(\d+)\.htm/);
120 | 			if (matched_1 && matched_2) {
121 | 				return matched_1[1] - matched_2[1];
122 | 			}
123 | 			return chapter_data_1.url < chapter_data_2.url ? -1 : 1;
124 | 			// 依照.title排序。
125 | 			return chapter_data_1.title < chapter_data_2.title ? -1 : 1;
126 | 		});
127 | 	},
128 | 
129 | 	parse_chapter_data : function(html, work_data, get_label) {
130 | 		// decode chapter data
131 | 		function decode(code) {
132 | 			code = eval(code).replace(/^[^=]+/, 'code');
133 | 			return eval(code);
134 | 		}
135 | 
136 | 		var chapter_data = html.between('<script type="text/javascript">eval',
137 | 				'\n');
138 | 		if (!chapter_data || !(chapter_data = decode(chapter_data))) {
139 | 			return;
140 | 		}
141 | 
142 | 		// 設定必要的屬性。
143 | 		chapter_data.title = get_label(html.between('<h2>', '</h2>'));
144 | 		chapter_data.image_count = chapter_data.fc;
145 | 		chapter_data.image_list = chapter_data.fs.map(function(url) {
146 | 			return {
147 | 				url : url
148 | 			}
149 | 		});
150 | 
151 | 		return chapter_data;
152 | 	}
153 | });
154 | 
155 | // ----------------------------------------------------------------------------
156 | 
157 | // CeL.set_debug(3);
158 | 
159 | start_crawler(crawler, typeof module === 'object' && module);
160 | 


--------------------------------------------------------------------------------
/archive/36mh.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 36漫画网 的工具。 Download 36mh comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.SinMH');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.SinMH({
16 | 	// 36mh\quanzhifashi 全职法师\0338 326 山道惊魂\quanzhifashi-338-015.jpg
17 | 	skip_error : true,
18 | 
19 | 	base_URL : 'https://www.36mh.com/',
20 | 
21 | 	chapter_inverted_order : true
22 | });
23 | 
24 | // ----------------------------------------------------------------------------
25 | 
26 | // CeL.set_debug(3);
27 | 
28 | start_crawler(crawler, typeof module === 'object' && module);
29 | 


--------------------------------------------------------------------------------
/archive/37yue.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載三七阅读的工具。 Download 37yue comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('./work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | var _37yue = new CeL.work_crawler({
12 | 	// recheck:從頭檢測所有作品之所有章節。
13 | 	// recheck : true,
14 | 	// one_by_one : true,
15 | 	base_URL : 'http://www.37yue.com/',
16 | 
17 | 	// 解析 作品名稱 → 作品id get_work()
18 | 	search_URL : 'getjson.shtml?q=',
19 | 
20 | 	// 取得作品的章節資料。 get_work_data()
21 | 	work_URL : function(work_id) {
22 | 		return this.base_URL + 'manhua/' + work_id + '/';
23 | 	},
24 | 	parse_work_data : function(html, get_label, extract_work_data) {
25 | 		var work_data = {
26 | 			// 必要屬性：須配合網站平台更改。
27 | 			title : get_label(html.between('<h1 class="title">', '</h1>')),
28 | 
29 | 			// 選擇性屬性：須配合網站平台更改。
30 | 			description : get_label(html.between('<div class="summary">')
31 | 					.between('<div class="bd">', '</div>'))
32 | 		};
33 | 		extract_work_data(work_data,
34 | 				html.between('<div class="info">', '</div>'),
35 | 				/<dt>([^<>]+)<\/dt>[\s\n]*<dd>([^<>]+)<\/dd>/g);
36 | 		return work_data;
37 | 	},
38 | 	get_chapter_list : function(work_data, html) {
39 | 		work_data.chapter_list = [];
40 | 		var matched,
41 | 		/**
42 | 		 * e.g., <code>
43 | 		<li><a href="1110267.html" title="149+150">149+150</a></li>
44 | 		</code>
45 | 		 */
46 | 		PATTERN_chapter =
47 | 		// [all,href,title,inner]
48 | 		/<li><a href="([^"<>]+)" title="([^"<>]+)"[^<>]*>(.+?)<\/a><\/li>/g;
49 | 		html = html.between('list-chapter', '</ul>');
50 | 		while (matched = PATTERN_chapter.exec(html)) {
51 | 			work_data.chapter_list.push({
52 | 				url : matched[1],
53 | 				title : matched[2].trim()
54 | 			});
55 | 		}
56 | 		if (work_data.chapter_list.length > 1) {
57 | 			// 轉成由舊至新之順序。
58 | 			work_data.chapter_list.reverse();
59 | 		}
60 | 	},
61 | 
62 | 	// 取得每一個章節的各個影像內容資料。 get_chapter_data()
63 | 	chapter_URL : function(work_data, chapter_NO) {
64 | 		return this.work_URL(work_data.id)
65 | 				+ work_data.chapter_list[chapter_NO - 1].url;
66 | 	},
67 | 	parse_chapter_data : function(html, work_data, get_label) {
68 | 		// decode chapter data
69 | 		function decode(code) {
70 | 			return eval('code=' + code);
71 | 		}
72 | 
73 | 		var chapter_data = html.between('var mh_info=', '</script>').trim()
74 | 				.replace(/;$/, '');
75 | 		if (!chapter_data || !(chapter_data = decode(chapter_data))) {
76 | 			return;
77 | 		}
78 | 
79 | 		// 設定必要的屬性。
80 | 		chapter_data.title = chapter_data.pagename;
81 | 		chapter_data.image_count = chapter_data.totalimg;
82 | 		chapter_data.image_list = chapter_data.imglist.split('$$')
83 | 		//
84 | 		.map(function(url) {
85 | 			return {
86 | 				url : url
87 | 			}
88 | 		});
89 | 
90 | 		return chapter_data;
91 | 	}
92 | });
93 | 
94 | // ----------------------------------------------------------------------------
95 | 
96 | // CeL.set_debug(3);
97 | 
98 | _37yue.start(work_id);
99 | 


--------------------------------------------------------------------------------
/archive/50mh.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 漫画堆（原 50漫画网） 的工具。 Download manhuadui comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.SinMH');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | // https://stackoverflow.com/questions/20082893/unable-to-verify-leaf-signature
16 | // for Error: unable to verify the first certificate
17 | // code: 'UNABLE_TO_VERIFY_LEAF_SIGNATURE'
18 | process.env['NODE_TLS_REJECT_UNAUTHORIZED'] = '0';
19 | 
20 | var crawler = CeL.SinMH({
21 | 	// one_by_one : true,
22 | 	skip_error : true,
23 | 
24 | 	// 201/3/30: https://www.50mh.com/
25 | 	// 201/5/29 前更改域名與名稱→ 漫画堆 https://www.manhuadui.com/
26 | 	base_URL : 'https://www.manhuadui.com/',
27 | 
28 | 	search_URL : 'API',
29 | 	api_base_URL : 'https://450.manhuadang.net/',
30 | 	id_of_search_result : 'slug',
31 | 
32 | 	// @see function decrypt20180904() @
33 | 	// https://www.manhuadui.com/js/decrypt20180904.js
34 | 	crypto : {
35 | 		key : "123456781234567G",
36 | 		iv : 'ABCDEF1G34123412'
37 | 	}
38 | });
39 | 
40 | // ----------------------------------------------------------------------------
41 | 
42 | // CeL.set_debug(3);
43 | 
44 | start_crawler(crawler, typeof module === 'object' && module);
45 | 


--------------------------------------------------------------------------------
/archive/517.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 我要去漫画 的工具。 Download 517manhua.com comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.qTcms2017');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.qTcms2017({
16 | 	// 圖像檔案下載失敗處理方式：忽略/跳過圖像錯誤。當404圖像不存在、檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。default:false
17 | 	skip_error : true,
18 | 
19 | 	// one_by_one : true,
20 | 
21 | 	// {Natural|String|Function}當網站不允許太過頻繁的訪問讀取/access時，可以設定下載章節資訊/章節內容前的等待時間。
22 | 	// 2019/5/8 5s: OK
23 | 	// 2019/5/9 200: OK
24 | 	// chapter_time_interval : 100,
25 | 
26 | 	// e.g.,
27 | 	// http://pic1.085p.com/upload23/72889/2019/01-13/20190113193831_8982xtnnvyuu_small.jpg
28 | 	// {Natural}MIN_LENGTH:最小容許圖案檔案大小 (bytes)。
29 | 	MIN_LENGTH : 200,
30 | 
31 | 	base_URL : 'http://www.517manhua.com/',
32 | 
33 | 	// 2020-09-09T08:08:55.000Z 改版
34 | 	// http://www.517manhua.com/template/skin1_3687/css/d7s/js/show.20170501.js?20201205201326
35 | 	qTcms_m_indexurl : "http://images.yiguahai.com/"
36 | 
37 | });
38 | 
39 | // ----------------------------------------------------------------------------
40 | 
41 | // CeL.set_debug(3);
42 | 
43 | start_crawler(crawler, typeof module === 'object' && module);
44 | 


--------------------------------------------------------------------------------
/archive/57mh.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 57漫画网 的工具。 Download 57mh comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.SinMH2013');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.SinMH2013({
16 | 	// 早於2017/11-2019/1底換域名: http://www.57mh.com/
17 | 	// 2019/2/15 19:56 最後一次成功連接 http://www.5qmh.com/
18 | 	// 2019/3/1 改 http://www.wuqimh.com/
19 | 	// 2023/1/30 前改 https://www.wuqimh.net/ 圖片多無法讀取
20 | 	base_URL : 'https://www.wuqimh.net/'
21 | });
22 | 
23 | // ----------------------------------------------------------------------------
24 | 
25 | // CeL.set_debug(3);
26 | 
27 | start_crawler(crawler, typeof module === 'object' && module);
28 | 


--------------------------------------------------------------------------------
/archive/733mh.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載733漫画网的工具。 Download 733mh comics.
  3 |  * 
  4 |  * @see qTcms 晴天漫画程序 晴天漫画系统 http://manhua.qingtiancms.com/
  5 |  */
  6 | 
  7 | 'use strict';
  8 | 
  9 | require('../work_crawler_loader.js');
 10 | 
 11 | // ----------------------------------------------------------------------------
 12 | 
 13 | var crawler = new CeL.work_crawler({
 14 | 	// 所有的子檔案要修訂註解說明時，應該都要順便更改在CeL.application.net.comic中Comic_site.prototype內的母comments，並以其為主體。
 15 | 
 16 | 	// 本站常常無法取得圖片，因此得多重新檢查。
 17 | 	// recheck:從頭檢測所有作品之所有章節與所有圖片。不會重新擷取圖片。對漫畫應該僅在偶爾需要從頭檢查時開啟此選項。
 18 | 	// recheck : true,
 19 | 	// 當無法取得chapter資料時，直接嘗試下一章節。在手動+監視下recheck時可併用此項。
 20 | 	// skip_chapter_data_error : true,
 21 | 
 22 | 	// allow .jpg without EOI mark.
 23 | 	// allow_EOI_error : true,
 24 | 	// 當圖像檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。
 25 | 	skip_error : true,
 26 | 
 27 | 	// one_by_one : true,
 28 | 
 29 | 	// 2018/6/4 6:34 最後一次成功存取 http://www.733mh.com/
 30 | 	// 之後更改域名
 31 | 	base_URL : 'http://www.733mh.net/',
 32 | 	charset : 'gb2312',
 33 | 
 34 | 	// 取得伺服器列表。
 35 | 	// use_server_cache : true,
 36 | 	// http://www.733mh.com/style/js/global.js
 37 | 	server_URL : 'style/js/global.js',
 38 | 	parse_server_list : function(html) {
 39 | 		var server_list = [],
 40 | 		// e.g., WebimgServerURL[0]="http://img.tsjjx.com/"
 41 | 		// WebimgServerURL[0]="http://www.733mh.com/fd.php?url=http://img.tsjjx.com/";
 42 | 		matched, PATTERN = /\nWebimgServerURL\[\d\]\s*=\s*"([^"]+)"/g;
 43 | 		while (matched = PATTERN.exec(html)) {
 44 | 			server_list.push(matched[1].between('url=') || matched[1]);
 45 | 		}
 46 | 		// console.log(server_list);
 47 | 		return server_list;
 48 | 	},
 49 | 
 50 | 	// 解析 作品名稱 → 作品id get_work()
 51 | 	search_URL : 'e/search/'
 52 | 			+ '?searchget=1&show=title,player,playadmin,pinyin&keyboard=',
 53 | 	parse_search_result : function(html) {
 54 | 		var id_list = [], id_data = [], matched, PATTERN =
 55 | 		/**
 56 | 		 * e.g., <code>
 57 | 		<dt><a href="/mh/27576" title="时空使徒">时空使徒</a></dt>
 58 | 		</code>
 59 | 		 */
 60 | 		/<a href="\/mh\/(\d+)\/?" title="([^"<>]+)">/g;
 61 | 		while (matched = PATTERN.exec(html)) {
 62 | 			id_list.push(+matched[1]);
 63 | 			id_data.push(matched[2]);
 64 | 		}
 65 | 		return [ id_list, id_data ];
 66 | 	},
 67 | 
 68 | 	// 取得作品的章節資料。 get_work_data()
 69 | 	work_URL : function(work_id) {
 70 | 		return 'mh/' + work_id + '/';
 71 | 	},
 72 | 	parse_work_data : function(html, get_label, extract_work_data) {
 73 | 		var work_data = {
 74 | 			// 必要屬性：須配合網站平台更改。
 75 | 			title : get_label(
 76 | 			//
 77 | 			html.between('<h1>', '</h1>')),
 78 | 
 79 | 			// 選擇性屬性：須配合網站平台更改。
 80 | 			description : get_label(html.between(
 81 | 					'<div class="introduction" id="intro1">', '</div>'))
 82 | 		};
 83 | 		// 由 meta data 取得作品資訊。
 84 | 		extract_work_data(work_data, html);
 85 | 		extract_work_data(work_data, html.between('<div class="info">',
 86 | 				'<div class="info_cover">'),
 87 | 				/<em>([^<>]+?)<\/em>([\s\S]*?)<\/p>/g);
 88 | 
 89 | 		Object.assign(work_data, {
 90 | 			author : work_data.原著作者,
 91 | 			last_update : work_data.更新时间,
 92 | 			status : work_data.漫画状态
 93 | 		});
 94 | 
 95 | 		return work_data;
 96 | 	},
 97 | 	get_chapter_list : function(work_data, html, get_label) {
 98 | 		var text = html.between('<div class="w980_b1px mt10 clearfix">',
 99 | 				'<div class="introduction" id="intro1">').between('<ul>',
100 | 				'</ul>');
101 | 		// console.log(text);
102 | 
103 | 		/**
104 | 		 * e.g., <code>
105 | 
106 | 		// 733mh.js
107 | 		<li><a href="/mh/27576/359123.html" title="179：失踪">179：失踪</a></li>
108 | 
109 | 		// mh1234.js
110 | 		<li>
111 | 		<a  href="/comic/12549/554098.html">第1话：周家圣龙（上）<i></i></a>
112 | 		</li>
113 | 
114 | 		</code>
115 | 		 */
116 | 		work_data.chapter_list = [];
117 | 		work_data.inverted_order = true;
118 | 		var matched, PATTERN_chapter =
119 | 		// [ , chapter_url, chapter_title ]
120 | 		/<a href="(\/mh\/[^<>"]+)" title="([^<>"]+)"/g;
121 | 		while (matched = PATTERN_chapter.exec(text)) {
122 | 			work_data.chapter_list.push({
123 | 				url : matched[1],
124 | 				title : get_label(matched[2])
125 | 			});
126 | 		}
127 | 		// console.log(work_data);
128 | 	},
129 | 
130 | 	parse_chapter_data : function(html, work_data) {
131 | 		function decode(packed) {
132 | 			var photosr = [];
133 | 			// decode chapter data @ every picture page
134 | 			eval(eval(Buffer.from(packed, 'base64').toString().slice(4)));
135 | 			// 通常[0]===undefined
136 | 			return photosr.filter(function(url) {
137 | 				return !!url;
138 | 			});
139 | 		}
140 | 
141 | 		var chapter_data = html && html.between('packed="', '"');
142 | 		if (chapter_data) {
143 | 			chapter_data = decode(chapter_data);
144 | 		} else if (chapter_data = html
145 | 				&& html.between('photosr[1] ="',
146 | 						'var maxpages=photosr.length-1;')) {
147 | 			// e.g., http://www.733mh.net/mh/18102/465176.html
148 | 			var photosr = [];
149 | 			eval('photosr[1] ="' + chapter_data);
150 | 			photosr.shift();
151 | 			chapter_data = photosr;
152 | 		}
153 | 		if (!chapter_data) {
154 | 			CeL.log('無法解析資料！');
155 | 			return;
156 | 		}
157 | 		// console.log(JSON.stringify(chapter_data));
158 | 		// console.log(chapter_data.length);
159 | 		// CeL.set_debug(6);
160 | 
161 | 		// 設定必要的屬性。
162 | 		chapter_data = {
163 | 			image_list : chapter_data
164 | 		};
165 | 		// console.log(JSON.stringify(chapter_data));
166 | 
167 | 		return chapter_data;
168 | 	}
169 | });
170 | 
171 | // ----------------------------------------------------------------------------
172 | 
173 | // CeL.set_debug(3);
174 | 
175 | start_crawler(crawler, typeof module === 'object' && module);
176 | 


--------------------------------------------------------------------------------
/archive/76.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 76漫画 的工具。 Download http://www.srweh.com/ comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.qTcms2017');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.qTcms2017({
16 | 	// 本站採用採集其他網站圖片的方法，錯漏圖片太多。
17 | 	skip_error : true,
18 | 
19 | 	// one_by_one : true,
20 | 
21 | 	base_URL : 'http://www.srweh.com/'
22 | });
23 | 
24 | // ----------------------------------------------------------------------------
25 | 
26 | // CeL.set_debug(3);
27 | 
28 | start_crawler(crawler, typeof module === 'object' && module);
29 | 


--------------------------------------------------------------------------------
/archive/81xsw.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載2016 八一中文网的工具。 Download 81xsw novels.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.PTCMS');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.PTCMS({
16 | 	// 最後一次成功下載此網站作品日期: 2019/1/12。
17 | 	base_URL : 'http://www.81xsw.com/',
18 | 	charset : 'gbk',
19 | 
20 | 	// 提取出引數（如 URL）中的作品ID 以回傳。
21 | 	extract_work_id : function(work_information) {
22 | 		return /^[\d_]+$/.test(work_information) && work_information;
23 | 	},
24 | 
25 | 	// 解析 作品名稱 → 作品id get_work()
26 | 	baidu_cse : '16095493717575840686',
27 | 
28 | 	// 取得包含章節列表的文字範圍。
29 | 	get_chapter_list_contents : function(html) {
30 | 		return html.between('<div id="list">', '</div>');
31 | 	}
32 | });
33 | 
34 | // ----------------------------------------------------------------------------
35 | 
36 | // CeL.set_debug(3);
37 | 
38 | start_crawler(crawler, typeof module === 'object' && module);
39 | 


--------------------------------------------------------------------------------
/archive/88bag.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 188漫画网 的工具。 Download 88bag comics.
 3 |  * 
 4 |  * @see qTcms 晴天漫画程序 晴天漫画系统 手机端 http://manhua3.qingtiancms.com/
 5 |  */
 6 | 
 7 | 'use strict';
 8 | 
 9 | require('../work_crawler_loader.js');
10 | 
11 | // ----------------------------------------------------------------------------
12 | 
13 | CeL.run('application.net.work_crawler.sites.qTcms2017');
14 | 
15 | // ----------------------------------------------------------------------------
16 | 
17 | var crawler = CeL.qTcms2017({
18 | 	// 圖像檔案下載失敗處理方式：忽略/跳過圖像錯誤。當404圖像不存在、檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。default:false
19 | 	skip_error : true,
20 | 
21 | 	// {Natural}最小容許圖案檔案大小 (bytes)。
22 | 	// MIN_LENGTH : 500,
23 | 
24 | 	base_URL : 'http://m.88bag.net/'
25 | });
26 | 
27 | // ----------------------------------------------------------------------------
28 | 
29 | // CeL.set_debug(3);
30 | 
31 | start_crawler(crawler, typeof module === 'object' && module);
32 | 


--------------------------------------------------------------------------------
/archive/999comics.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 99漫畫網 的工具。 Download 999comics comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.SinMH2013');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.SinMH2013({
16 | 	// one_by_one : true,
17 | 
18 | 	base_URL : 'https://www.999comics.com/',
19 | 	no_need_to_revert : true,
20 | 
21 | 	// 取得伺服器列表。
22 | 	// use_server_cache : true,
23 | 	server_URL : function() {
24 | 		// https://www.999comics.com/static/scripts/configs.js?v=8
25 | 		return this.base_URL + 'static/scripts/configs.js';
26 | 	},
27 | 
28 | 	// 解析 作品名稱 → 作品id get_work()
29 | 	search_URL : function(work_title) {
30 | 		// CeL.set_debug(9);
31 | 		return 'word/?cb=_&key=' + escape(work_title);
32 | 
33 | 		// NG:
34 | 		return [ 'word/', {
35 | 			cb : 'jQuery'
36 | 			// @see .expando
37 | 			+ ('1.8.3' + Math.random()).replace(/\D/g, "") + '_' + Date.now(),
38 | 			key : escape(work_title),
39 | 			_ : Date.now()
40 | 		} ];
41 | 	},
42 | 
43 | 	// 取得作品的章節資料。 get_work_data()
44 | 	work_URL : function(work_id) {
45 | 		// e.g., https://www.999comics.com/comic/33485/
46 | 		return 'comic/' + work_id + '/';
47 | 	},
48 | 
49 | 	// e.g., 34444 異世界精靈的奴隸醬, 33485 會歪掉的啊
50 | 	trim_trailing_newline : true
51 | });
52 | 
53 | // ----------------------------------------------------------------------------
54 | 
55 | // CeL.set_debug(3);
56 | 
57 | start_crawler(crawler, typeof module === 'object' && module);
58 | 


--------------------------------------------------------------------------------
/archive/AlphaPolis_2016-20170619.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載アルファポリス - 電網浮遊都市 - 小説的工具。 Download AlphaPolis novels.
  3 |  * 
  4 |  * @see 小説投稿サイト https://matome.naver.jp/odai/2139450042041120001
  5 |  *      http://www.akatsuki-novels.com/novels/ranking_total
  6 |  *      http://www.mai-net.net/bbs/sst/sst.php?act=list&cate=all&page=1
  7 |  *      https://github.com/whiteleaf7/narou
  8 |  *      https://github.com/59naga/scrape-narou
  9 |  */
 10 | 
 11 | 'use strict';
 12 | 
 13 | require('./work_crawler_loader.js');
 14 | 
 15 | // ----------------------------------------------------------------------------
 16 | 
 17 | CeL.run([ 'application.storage.EPUB'
 18 | // CeL.character.load()
 19 | , 'data.character'
 20 | // .to_file_name()
 21 | , 'application.net',
 22 | // CeL.detect_HTML_language()
 23 | , 'application.locale' ]);
 24 | 
 25 | var charset = 'EUC-JP';
 26 | CeL.character.load(charset);
 27 | 
 28 | var AlphaPolis = new CeL.work_crawler({
 29 | 	// auto_create_ebook, automatic create ebook
 30 | 	// MUST includes CeL.application.locale!
 31 | 	need_create_ebook : true,
 32 | 	// recheck:從頭檢測所有作品之所有章節。
 33 | 	// 'changed': 若是已變更，例如有新的章節，則重新下載/檢查所有章節內容。
 34 | 	recheck : 'changed',
 35 | 
 36 | 	// one_by_one : true,
 37 | 	base_URL : 'http://www.alphapolis.co.jp/',
 38 | 	charset : charset,
 39 | 
 40 | 	// 解析 作品名稱 → 作品id get_work()
 41 | 	search_URL : function(work_title) {
 42 | 		return [ this.base_URL + 'top/search/', {
 43 | 			// 2: 小説
 44 | 			'data[tab]' : 2,
 45 | 			'data[refer]' : work_title
 46 | 		} ];
 47 | 	},
 48 | 	parse_search_result : function(html) {
 49 | 		var id_data = [],
 50 | 		// {Array}id_list = [id,id,...]
 51 | 		id_list = [];
 52 | 		html.each_between('<h3 class="title">', '</a>', function(text) {
 53 | 			id_list.push(+text.between(' href="/content/cover/', '/"'));
 54 | 			id_data.push(text.between('>'));
 55 | 		});
 56 | 		return [ id_list, id_data ];
 57 | 	},
 58 | 
 59 | 	// 取得作品的章節資料。 get_work_data()
 60 | 	work_URL : function(work_id) {
 61 | 		return 'content/cover/' + (work_id | 0);
 62 | 	},
 63 | 	parse_work_data : function(html, get_label) {
 64 | 		var work_data = {
 65 | 			// 必要屬性：須配合網站平台更改。
 66 | 			title : html.between('"og:title" content="', '"'),
 67 | 
 68 | 			// 選擇性屬性：須配合網站平台更改。
 69 | 			// e.g., 连载中, 連載中
 70 | 			status : get_label(
 71 | 					html.between('<div class="category novel_content">',
 72 | 							'</div>')).split(/[\s\n]+/),
 73 | 			author : get_label(html.between('<div class="author">', '</a>')),
 74 | 			last_update : get_label(html.between('<th>更新日時</th>', '</td>')),
 75 | 			site_name : 'アルファポリス'
 76 | 
 77 | 		}, PATTERN = /<meta property="og:([^"]+)" content="([^"]+)"/g, matched;
 78 | 
 79 | 		while (matched = PATTERN.exec(html)) {
 80 | 			work_data[matched[1]] = get_label(matched[2]);
 81 | 		}
 82 | 
 83 | 		if (work_data.image
 84 | 		// 處理特殊圖片: ignore site default image
 85 | 		&& work_data.image.endsWith('\/ogp.png')) {
 86 | 			delete work_data.image;
 87 | 		}
 88 | 
 89 | 		return work_data;
 90 | 	},
 91 | 	get_chapter_list : function(work_data, html) {
 92 | 		work_data.chapter_list = [];
 93 | 		html = html.between('<div class="toc cover_body">',
 94 | 		// 不能用'<div class="each_other_title">':
 95 | 		// 有些作品沒有"この作品を読んでいる人はこんな作品も読んでいます！"
 96 | 		// e.g., ちょっと魔王になって人類救ってくる
 97 | 		'<div class="ad section">')
 98 | 		//
 99 | 		.each_between('<li', '</li>', function(text) {
100 | 			work_data.chapter_list.push({
101 | 				url : text.between('<a href="', '"'),
102 | 				date : text.between('<span class="open_date">', '</span>')
103 | 				//
104 | 				.to_Date({
105 | 					zone : work_data.time_zone
106 | 				}),
107 | 				title : text.between('<span class="title">', '</span>')
108 | 			});
109 | 		});
110 | 	},
111 | 
112 | 	// 檢測所取得內容的章節編號是否相符。
113 | 	check_chapter_NO : [ '<div class="total_content_block_count">', '/' ],
114 | 	parse_chapter_data : function(html, work_data, get_label, chapter_NO) {
115 | 		this.add_ebook_chapter(work_data, chapter_NO, {
116 | 			title : html.between('<div class="chapter_title">', '</div>'),
117 | 			sub_title : html.between('<h2>', '</h2>'),
118 | 			text : html.between('<div class="text', '<a class="bookmark ')
119 | 					.between('>', {
120 | 						tail : '</div>'
121 | 					})
122 | 		});
123 | 	}
124 | });
125 | 
126 | // ----------------------------------------------------------------------------
127 | 
128 | // CeL.set_debug(3);
129 | 
130 | AlphaPolis.start(work_id);
131 | 


--------------------------------------------------------------------------------
/archive/MAGCOMI.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載 MAGCOMI(マグコミ) 的工具。 Download MAG Garden COMIC ONLINE.
  3 |  * 
  4 |  * @see ActiBook https://ebook.digitalink.ne.jp/
  5 |  */
  6 | 
  7 | 'use strict';
  8 | 
  9 | require('../work_crawler_loader.js');
 10 | 
 11 | // ----------------------------------------------------------------------------
 12 | 
 13 | var crawler = new CeL.work_crawler({
 14 | 	// 所有的子檔案要修訂註解說明時，應該都要順便更改在CeL.application.net.comic中Comic_site.prototype內的母comments，並以其為主體。
 15 | 
 16 | 	// 日本的網路漫畫網站習慣刪掉舊章節，因此每一次都必須從頭檢查。
 17 | 	recheck : true,
 18 | 
 19 | 	// 當網站不允許太過頻繁的訪問/access時，可以設定下載之前的等待時間(ms)。
 20 | 	// 2019/6/16: 0-4s 常常下載到十幾二十個作品後中斷連線出現錯誤。
 21 | 	// 2019/6/30: 6s 依然會出現 ECONNRESET: socket hang up
 22 | 	// 2019/7/10: 15s 依然錯誤。換個useragent可以重設限制。限制應該是在圖片伺服器上？
 23 | 	chapter_time_interval : '20s',
 24 | 
 25 | 	// one_by_one : true,
 26 | 	base_URL : 'https://comic.mag-garden.co.jp/',
 27 | 
 28 | 	// 規範 work id 的正規模式；提取出引數中的作品id 以回傳。
 29 | 	extract_work_id : function(work_information) {
 30 | 		if (/^[a-z_\-\d]+$/.test(work_information))
 31 | 			return work_information;
 32 | 	},
 33 | 
 34 | 	// 解析 作品名稱 → 作品id get_work()
 35 | 	search_URL : '?s=',
 36 | 	parse_search_result : function(html, get_label) {
 37 | 		var id_list = [], id_data = [];
 38 | 		html.each_between('<p class="cont post">', '</div>',
 39 | 		//
 40 | 		function(text) {
 41 | 			var url = text.match(/ href="([^<>"]+)"/),
 42 | 			//
 43 | 			title = get_label(text.between('<h2>', '</h2>'));
 44 | 			id_list.push(url[1].match(/\/([a-z_\-\d]+)\/$/)[1]);
 45 | 			id_data.push(title);
 46 | 		});
 47 | 
 48 | 		return [ id_list, id_data ];
 49 | 	},
 50 | 
 51 | 	// 取得作品的章節資料。 get_work_data()
 52 | 	work_URL : function(work_id) {
 53 | 		return work_id + '/';
 54 | 	},
 55 | 	parse_work_data : function(html, get_label, extract_work_data) {
 56 | 		var work_data = {
 57 | 			// 必要屬性：須配合網站平台更改。
 58 | 			author : get_label(html.between('<small>著者:</small>', '</h3>')),
 59 | 
 60 | 			// 選擇性屬性：須配合網站平台更改。
 61 | 			status : html.between('<ul class="article-tags">', '</ul>')
 62 | 					.all_between('<li>', '</li>').map(get_label),
 63 | 			last_update : get_label(html.between('<h2 class="clearfix">',
 64 | 					'</h2>').between('<time datetime="', '"'))
 65 | 					|| (new Date).toISOString(),
 66 | 			next_update : get_label(html.between(
 67 | 			// 次回の更新予定は12月30日です。
 68 | 			'<p class="article-next">', '</p>'))
 69 | 		};
 70 | 
 71 | 		// 連載は終了しました。
 72 | 		if (work_data.next_update.includes('終了')) {
 73 | 			work_data.status.unshift('終了');
 74 | 		}
 75 | 
 76 | 		extract_work_data(work_data, html);
 77 | 
 78 | 		// 放在這裡以預防被extract_work_data()覆蓋。
 79 | 		Object.assign(work_data, {
 80 | 			description : get_label(html.between('<div class="feature">',
 81 | 					'</div>'))
 82 | 		});
 83 | 
 84 | 		// console.log(work_data);
 85 | 		return work_data;
 86 | 	},
 87 | 	get_chapter_list : function(work_data, html, get_label) {
 88 | 		var matched, PATTERN_chapter = /<a href="([^"]+)"[^<>]*>(.+?)<\/a>/g;
 89 | 
 90 | 		html = html.between('<div class="container-fluid">', '</section>');
 91 | 
 92 | 		work_data.chapter_list = [];
 93 | 		while (matched = PATTERN_chapter.exec(html)) {
 94 | 			var basePath = matched[1].replace(/\/HTML5\/.+/, '/');
 95 | 			var chapter_data = {
 96 | 				base_URL : basePath,
 97 | 				url : basePath + 'iPhone/ibook.xml',
 98 | 				title : get_label(matched[2])
 99 | 			};
100 | 			work_data.chapter_list.push(chapter_data);
101 | 		}
102 | 		work_data.chapter_list.reverse();
103 | 
104 | 		// 因為中間的章節可能已經被下架，因此依章節標題來定章節編號。
105 | 		this.set_chapter_NO_via_title(work_data);
106 | 	},
107 | 
108 | 	parse_chapter_data : function(html, work_data, get_label, chapter_NO) {
109 | 		// @see loadPageData @
110 | 		// https://comic.mag-garden.co.jp/assets/files/work_id/HTML5/assets/javascripts/application.js
111 | 		// imageSource = pieceDirectory + "/" + pageno + ".jpg";
112 | 		// pieceDirectory = baseDirectory + "/" + scale
113 | 		// parseDefinition: baseDirectory = basePath + "/books/images"
114 | 		// basePath = '..'
115 | 		// scale = 2
116 | 
117 | 		var chapter_data = work_data.chapter_list[chapter_NO - 1];
118 | 		Object.assign(chapter_data, {
119 | 			// 設定必要的屬性。
120 | 			title : get_label(html.between('<name>', '</name>')),
121 | 			image_count : html.between('<total>', '</total>') | 0,
122 | 			image_list : []
123 | 		});
124 | 
125 | 		for (var index = 0; index < chapter_data.image_count;) {
126 | 			chapter_data.image_list.push({
127 | 				url : chapter_data.base_URL + 'books/images/2/' + ++index
128 | 						+ '.jpg'
129 | 			});
130 | 		}
131 | 
132 | 		return chapter_data;
133 | 	}
134 | });
135 | 
136 | // ----------------------------------------------------------------------------
137 | 
138 | // CeL.set_debug(3);
139 | 
140 | start_crawler(crawler, typeof module === 'object' && module);
141 | 


--------------------------------------------------------------------------------
/archive/OVERLAP.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載 OVERLAP - オーバーラップ コミックガルド 的工具。 Download OVERLAP GARDO comics.
  3 |  * 
  4 |  * @see ActiBook https://ebook.digitalink.ne.jp/
  5 |  */
  6 | 
  7 | 'use strict';
  8 | 
  9 | require('../work_crawler_loader.js');
 10 | 
 11 | // ----------------------------------------------------------------------------
 12 | 
 13 | var crawler = new CeL.work_crawler({
 14 | 	// 所有的子檔案要修訂註解說明時，應該都要順便更改在CeL.application.net.comic中Comic_site.prototype內的母comments，並以其為主體。
 15 | 
 16 | 	// 日本的網路漫畫網站習慣刪掉舊章節，因此每一次都必須從頭檢查。
 17 | 	recheck : true,
 18 | 
 19 | 	// one_by_one : true,
 20 | 	base_URL : 'https://over-lap.co.jp/',
 21 | 
 22 | 	// 取得作品的章節資料。 get_work_data()
 23 | 	work_URL : function(work_id) {
 24 | 		return 'Form/Product/ProductDetail.aspx?cat=CGS&pid=' + 'ZG'
 25 | 				+ work_id.pad(4);
 26 | 	},
 27 | 	parse_work_data : function(html, get_label, extract_work_data) {
 28 | 		var work_data = {
 29 | 			// 必要屬性：須配合網站平台更改。
 30 | 			author : html.between('<div class="auth">', '</div>').split(
 31 | 					'</span>').map(get_label).filter(function(name) {
 32 | 				return !!name;
 33 | 			}).map(function(name) {
 34 | 				matched = name.match(/(?:著|原作)／(.+)/);
 35 | 				return matched ? matched[1].trim() : name;
 36 | 			}),
 37 | 
 38 | 			// 選擇性屬性：須配合網站平台更改。
 39 | 			last_update : get_label(html.between('<div class="limit">',
 40 | 					'</div>'))
 41 | 					|| (new Date).toISOString()
 42 | 		}, matched = work_data.last_update
 43 | 				.match(/[^\d](\d{4}[.\-\/]\d{1,2}[.\-\/]\d{1,2})[^\d]/);
 44 | 
 45 | 		if (matched) {
 46 | 			work_data.last_update = matched[1];
 47 | 		}
 48 | 
 49 | 		extract_work_data(work_data, html);
 50 | 
 51 | 		// 放在這裡以預防被extract_work_data()覆蓋。
 52 | 		Object.assign(work_data, {
 53 | 			description : get_label(html.between('<div id="main_text">',
 54 | 					'<div id="main_release">').between('<p>', '</p>'))
 55 | 		});
 56 | 
 57 | 		// console.log(work_data);
 58 | 		return work_data;
 59 | 	},
 60 | 	get_chapter_list : function(work_data, html, get_label) {
 61 | 		var matched, PATTERN_chapter = /<div class="number"([\s\S]+?)<\/div>/g;
 62 | 
 63 | 		work_data.chapter_list = [];
 64 | 		while (matched = PATTERN_chapter.exec(html)) {
 65 | 			var base_URL = matched[1].match(
 66 | 			//
 67 | 			/ href="([^<>"]*\/gardo\/series\/([^<>"\/]+)\/)/)[1];
 68 | 			// @see iPhonePath
 69 | 			// https://over-lap.co.jp/gardo/series/????/HTML5/assets/javascripts/application.js
 70 | 			var chapter_data = {
 71 | 				base_URL : base_URL,
 72 | 				url : base_URL + 'iPhone/ibook.xml',
 73 | 				title : get_label(matched[1].between('<h2>', '</h2>'))
 74 | 			};
 75 | 			work_data.chapter_list.push(chapter_data);
 76 | 		}
 77 | 		work_data.chapter_list.reverse();
 78 | 
 79 | 		// 因為中間的章節可能已經被下架，因此依章節標題來定章節編號。
 80 | 		this.set_chapter_NO_via_title(work_data);
 81 | 	},
 82 | 
 83 | 	parse_chapter_data : function(html, work_data, get_label, chapter_NO) {
 84 | 		var chapter_data = work_data.chapter_list[chapter_NO - 1];
 85 | 		Object.assign(chapter_data, {
 86 | 			// 設定必要的屬性。
 87 | 			title : get_label(html.between('<title>', '</title>')),
 88 | 			image_count : html.between('<total>', '</total>') | 0,
 89 | 			image_list : []
 90 | 		});
 91 | 
 92 | 		for (var index = 0; index < chapter_data.image_count;) {
 93 | 			chapter_data.image_list.push(chapter_data.base_URL
 94 | 					+ 'books/images/2/' + ++index + '.jpg');
 95 | 		}
 96 | 
 97 | 		return chapter_data;
 98 | 	}
 99 | });
100 | 
101 | // ----------------------------------------------------------------------------
102 | 
103 | // CeL.set_debug(3);
104 | 
105 | start_crawler(crawler, typeof module === 'object' && module);
106 | 


--------------------------------------------------------------------------------
/archive/XOY.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 XOY（ジョイ） 漫畫 的工具。 Download XOY comics. (comic.ja-JP)
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.webtoon');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.webtoon({
16 | 	base_URL : 'https://xoy.webtoons.com/',
17 | 	language_code : 'ja'
18 | });
19 | 
20 | // ----------------------------------------------------------------------------
21 | 
22 | // CeL.set_debug(3);
23 | 
24 | start_crawler(crawler, typeof module === 'object' && module);
25 | 


--------------------------------------------------------------------------------
/archive/aikanmh.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 爱看漫画 的工具。 Download aikanmh comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.qTcms2017');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.qTcms2017({
16 | 	// {Natural}最小容許圖案檔案大小 (bytes)。
17 | 	// MIN_LENGTH : 500,
18 | 
19 | 	skip_error : true,
20 | 
21 | 	base_URL : 'http://www.aikanmh.cn/'
22 | });
23 | 
24 | // ----------------------------------------------------------------------------
25 | 
26 | // CeL.set_debug(3);
27 | 
28 | start_crawler(crawler, typeof module === 'object' && module);
29 | 


--------------------------------------------------------------------------------
/archive/biquge.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 笔趣阁 小说 的工具。 Download biquge novels.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.PTCMS');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.PTCMS({
16 | 	base_URL : 'https://www.xs.la/',
17 | 
18 | 	// 解析 作品名稱 → 作品id get_work()
19 | 	search_URL : 'https://sou.xanbhx.com/search?siteid=xsla&q=',
20 | 	parse_search_result : 'biquge',
21 | 
22 | 	// 取得作品的章節資料。 get_work_data()
23 | 	work_URL : function(work_id) {
24 | 		return (work_id / 1000 | 0) + '_' + work_id + '/';
25 | 	},
26 | 	// 取得包含章節列表的文字範圍。
27 | 	get_chapter_list_contents : function(html) {
28 | 		return html.between('<div id="list">', '</div>');
29 | 	}
30 | });
31 | 
32 | // ----------------------------------------------------------------------------
33 | 
34 | // CeL.set_debug(3);
35 | 
36 | start_crawler(crawler, typeof module === 'object' && module);
37 | 


--------------------------------------------------------------------------------
/archive/comico.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 comico - 全彩長條漫畫 (韓國 NHN Taiwan Corp.) 的工具。 Download comico comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.comico');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | // CeL.set_debug(3);
16 | 
17 | // crawler(configuration, callback, initializer)
18 | CeL.comico({
19 | 	base_URL : 'https://www.comico.com.tw/',
20 | 
21 | 	// 2020/8/18-21? 需要coin閱讀的會給一張圖，卻又403。
22 | 	// skip_error : true,
23 | 
24 | 	// search_head_token : '<li class="list-article02__item">',
25 | 	// PATTERN_search : /<a href="[^<>"]*?titleNo=(\d+)"[\s\S]*? alt="([^"]+)"/,
26 | 
27 | 	// 取得作品的章節資料。 get_work_data()
28 | 	work_URL : function(work_id) {
29 | 		return work_id + '/';
30 | 	}
31 | 
32 | }, function(crawler) {
33 | 	start_crawler(crawler, typeof module === 'object' && module);
34 | }, function(crawler) {
35 | 	setup_crawler(crawler, typeof module === 'object' && module);
36 | });
37 | 


--------------------------------------------------------------------------------
/archive/comico_jp.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 comico（コミコ） 的工具。 Download comico comics. (comic.ja-JP)
 3 |  * 
 4 |  * modify from comico.js
 5 |  */
 6 | 
 7 | 'use strict';
 8 | 
 9 | require('../work_crawler_loader.js');
10 | 
11 | // ----------------------------------------------------------------------------
12 | 
13 | CeL.run('application.net.work_crawler.sites.comico');
14 | 
15 | // ----------------------------------------------------------------------------
16 | 
17 | // CeL.set_debug(3);
18 | 
19 | CeL.comico({
20 | 	base_URL : 'https://www.comico.jp/',
21 | 
22 | 	// <div class="list-search-result">
23 | 	// <ul class="list-search-result__list _searchList">
24 | 	// <li class="list-search-result__item" data-result-type="official">
25 | 	// 每個項目的<li>開頭。
26 | 	search_head_token : ' data-result-type="official">',
27 | 	PATTERN_search : /<a href="[^<>"]*?titleNo=(\d+)"[\s\S]*? alt="([^"]+)"/,
28 | 
29 | 	// 取得作品的章節資料。 get_work_data()
30 | 	work_URL : 'articleList.nhn?titleNo='
31 | 
32 | }, function(crawler) {
33 | 	start_crawler(crawler, typeof module === 'object' && module);
34 | }, function(crawler) {
35 | 	setup_crawler(crawler, typeof module === 'object' && module);
36 | });
37 | 


--------------------------------------------------------------------------------
/archive/comico_jp_plus.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 comico（コミコ） オトナ限定 的工具。 Download comico adult comics. (comic.ja-JP)
 3 |  * 
 4 |  * modify from comico.js
 5 |  */
 6 | 
 7 | 'use strict';
 8 | 
 9 | require('../work_crawler_loader.js');
10 | 
11 | // ----------------------------------------------------------------------------
12 | 
13 | CeL.run('application.net.work_crawler.sites.comico');
14 | 
15 | // ----------------------------------------------------------------------------
16 | 
17 | // CeL.set_debug(3);
18 | 
19 | CeL.comico({
20 | 	base_URL : 'https://plus.comico.jp/',
21 | 
22 | 	// 每個項目的<li>開頭。
23 | 	search_head_token : ' data-result-type="official">',
24 | 	PATTERN_search : /<a href="[^<>"]*?titleNo=(\d+)"[\s\S]*? alt="([^"]+)"/,
25 | 
26 | 	// 取得作品的章節資料。 get_work_data()
27 | 	work_URL : function(work_id) {
28 | 		return 'manga/' + work_id + '/';
29 | 	},
30 | 
31 | 	consume_url : 'manga/consume/index.nhn'
32 | 
33 | }, function(crawler) {
34 | 	start_crawler(crawler, typeof module === 'object' && module);
35 | }, function(crawler) {
36 | 	setup_crawler(crawler, typeof module === 'object' && module);
37 | });
38 | 


--------------------------------------------------------------------------------
/archive/dagu.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載 大古漫画网 的工具。 Download dagu comics.
  3 |  * 
  4 |  * 2018/10/19–11/24 間，[9妹漫画网](http://www.9mdm.com/)改名大古漫画网。<br />
  5 |  * 2019/11/28–12/5 間，大古漫画网 改版，採用晴天漫画程序。
  6 |  */
  7 | 
  8 | 'use strict';
  9 | 
 10 | require('../work_crawler_loader.js');
 11 | 
 12 | // ----------------------------------------------------------------------------
 13 | 
 14 | CeL.run('application.net.work_crawler.sites.qTcms2017');
 15 | 
 16 | // ----------------------------------------------------------------------------
 17 | 
 18 | var crawler = CeL.qTcms2017({
 19 | 	// 圖像檔案下載失敗處理方式：忽略/跳過圖像錯誤。當404圖像不存在、檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。default:false
 20 | 	skip_error : true,
 21 | 
 22 | 	// charset : '',
 23 | 
 24 | 	// {Natural}最小容許圖案檔案大小 (bytes)。
 25 | 	MIN_LENGTH : 500,
 26 | 
 27 | 	base_URL : 'https://www.dagumanhua.com/',
 28 | 
 29 | 	// 解析 作品名稱 → 作品id get_work()
 30 | 	search_URL : function(work_title) {
 31 | 		return [ 'e/search/index.php', {
 32 | 			show : 'title,writer',
 33 | 			tempid : 1,
 34 | 			tbname : 'sinfo',
 35 | 			keyboard : work_title
 36 | 		} ];
 37 | 	},
 38 | 	using_web_search : true,
 39 | 
 40 | 	pre_parse_chapter_data
 41 | 	// 執行在解析章節資料 process_chapter_data() 之前的作業 (async)。
 42 | 	// 必須自行保證執行 callback()，不丟出異常、中斷。
 43 | 	: function(XMLHttp, work_data, callback, chapter_NO) {
 44 | 		var chapter_data = work_data.chapter_list[chapter_NO - 1],
 45 | 		//
 46 | 		url = this.full_URL(chapter_data.url), html = XMLHttp.responseText,
 47 | 		//
 48 | 		image_count = html.between('totalpage =', ';').trim(), _this = this;
 49 | 
 50 | 		if (image_count === '[!--diypagenum--]') {
 51 | 			// displayed page number?
 52 | 			// console.log(html);
 53 | 
 54 | 			// e.g., http://www.9mdm.com/manhua/4353/141236.html
 55 | 			// https://www.dagumanhua.com/manhua/10008/317688.html
 56 | 			image_count = XMLHttp.responseText.between('<div class="mh_list">',
 57 | 					'</div>').match(/ src="[^"]+"/g);
 58 | 			// https://www.dagumanhua.com/manhua/4520/129933.html
 59 | 			image_count = image_count ? image_count.length : 0;
 60 | 		} else {
 61 | 			image_count = +image_count;
 62 | 		}
 63 | 
 64 | 		if (!(image_count >= 0)) {
 65 | 			throw work_data.title + ' #' + chapter_NO + ' '
 66 | 					+ chapter_data.title + ': Cannot get image count!';
 67 | 		}
 68 | 
 69 | 		// 將過去的 chapter_data.image_list cache 於 work_data.image_list。
 70 | 		if (work_data.image_list) {
 71 | 			chapter_data.image_list = work_data.image_list[chapter_NO - 1];
 72 | 			if (!this.reget_image_page && chapter_data.image_list
 73 | 					&& chapter_data.image_list.length === image_count) {
 74 | 				CeL.debug(work_data.title + ' #' + chapter_NO + ' '
 75 | 						+ chapter_data.title + ': Already got ' + image_count
 76 | 						+ ' images.');
 77 | 				chapter_data.image_list = chapter_data.image_list
 78 | 				// .slice() 重建以節省記憶體用量。
 79 | 				.slice().map(function(image_data) {
 80 | 					// 僅保留網址資訊，節省記憶體用量。
 81 | 					return typeof image_data === 'string' ? image_data
 82 | 					// else assert: CeL.is_Object(image_data)
 83 | 					: image_data.url;
 84 | 				});
 85 | 				callback();
 86 | 				return;
 87 | 			}
 88 | 		} else {
 89 | 			work_data.image_list = [];
 90 | 		}
 91 | 
 92 | 		function extract_image(XMLHttp) {
 93 | 			XMLHttp.responseText.between('<div class="mh_list">', '</div>')
 94 | 			// .each_between(): for
 95 | 			// https://www.dagumanhua.com/manhua/10008/317688.html
 96 | 			.each_between(' src="', '"', function(url) {
 97 | 				// .trim(): for 遮天 第92话 各打算盘
 98 | 				url = encodeURI(url.trim());
 99 | 				CeL.debug('Add image ' + chapter_data.image_list.length
100 | 				//
101 | 				+ '/' + image_count + ': ' + url, 1, 'extract_image');
102 | 				// 僅保留網址資訊，節省記憶體用量。
103 | 				chapter_data.image_list.push({
104 | 					get_URL_options : {
105 | 						headers : {
106 | 							// img.baidu.com.manhuapi.com 不可設定 Referer。
107 | 							Referer : ''
108 | 						}
109 | 					},
110 | 					// e.g.,
111 | 					// http://img.baidu.com.manhuapi.com/c/20180926/urgglxb2nz3.jpg
112 | 					url : url
113 | 				});
114 | 			});
115 | 		}
116 | 
117 | 		chapter_data.image_list = [];
118 | 		extract_image(XMLHttp);
119 | 
120 | 		CeL.run_serial(function(run_next, image_NO, index) {
121 | 			var image_page_url = url.replace(/(\.[^.]+)$/, '_' + image_NO
122 | 					+ '$1');
123 | 			if (false) {
124 | 				console.log('Get #' + index + '/' + image_count + ': '
125 | 						+ image_page_url);
126 | 			}
127 | 			CeL.log_temporary('Get image data page of §' + chapter_NO + ': '
128 | 					+ image_NO + '/' + image_count);
129 | 			_this.get_URL(image_page_url, function(XMLHttp) {
130 | 				extract_image(XMLHttp);
131 | 				run_next();
132 | 			}, null, true);
133 | 		}, image_count, 2, function() {
134 | 			work_data.image_list[chapter_NO - 1] = chapter_data.image_list
135 | 			// .slice() 重建以節省記憶體用量。
136 | 			.slice();
137 | 			callback();
138 | 		});
139 | 	},
140 | 	parse_chapter_data : function(html, work_data, get_label, chapter_NO) {
141 | 		var chapter_data = work_data.chapter_list[chapter_NO - 1];
142 | 		// console.log(chapter_data);
143 | 
144 | 		// 已在 pre_parse_chapter_data() 設定完 {Array}chapter_data.image_list
145 | 		return chapter_data;
146 | 	}
147 | });
148 | 
149 | // ----------------------------------------------------------------------------
150 | 
151 | // CeL.set_debug(3);
152 | 
153 | start_crawler(crawler, typeof module === 'object' && module);
154 | 


--------------------------------------------------------------------------------
/archive/dmeden.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 動漫伊甸園 漫畫 的工具。 Download dmeden.net comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.hhcool');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | CeL.hhcool({
16 | 
17 | 	base_URL : 'http://dmeden.net/',
18 | 
19 | 	base_comic_path : 'comicinfo'
20 | 
21 | }, function(crawler) {
22 | 	start_crawler(crawler, typeof module === 'object' && module);
23 | }, function(crawler) {
24 | 	setup_crawler(crawler, typeof module === 'object' && module);
25 | });
26 | 


--------------------------------------------------------------------------------
/archive/duoduomh.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 欢乐漫画网/多多漫画 的工具。 Download hlgoo/duoduomh comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.SinMH');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.SinMH({
16 | 	base_URL : 'https://www.hlgoo.cn/',
17 | 
18 | 	skip_error : true,
19 | 
20 | 	search_URL : 'API',
21 | 	id_of_search_result : 'slug'
22 | });
23 | 
24 | // ----------------------------------------------------------------------------
25 | 
26 | // CeL.set_debug(3);
27 | 
28 | start_crawler(crawler, typeof module === 'object' && module);
29 | 


--------------------------------------------------------------------------------
/archive/emw.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 一漫网 的工具。 Download emw comics.
 3 |  * 
 4 |  * @see qTcms 晴天漫画程序 晴天漫画系统
 5 |  */
 6 | 
 7 | 'use strict';
 8 | 
 9 | require('../work_crawler_loader.js');
10 | 
11 | // ----------------------------------------------------------------------------
12 | 
13 | CeL.run('application.net.work_crawler.sites.qTcms2017');
14 | 
15 | // ----------------------------------------------------------------------------
16 | 
17 | var crawler = CeL.qTcms2017({
18 | 	// {Natural}最小容許圖案檔案大小 (bytes)。
19 | 	// MIN_LENGTH : 500,
20 | 
21 | 	skip_error : true,
22 | 
23 | 	// 2018? http://www.emw162.com/
24 | 	// 2019/8: http://www.muyict.com/
25 | 	base_URL : 'http://www.muyict.com/'
26 | });
27 | 
28 | // ----------------------------------------------------------------------------
29 | 
30 | // CeL.set_debug(3);
31 | 
32 | start_crawler(crawler, typeof module === 'object' && module);
33 | 


--------------------------------------------------------------------------------
/archive/hhcool.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載HH漫画 汗汗酷漫的工具。 Download hhcool comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.hhcool');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | CeL.hhcool({
16 | 
17 | 	// base_URL : 'http://www.hhcool.com/',
18 | 	// 2018/4/27? 汗汗酷漫更改域名。最後一次存取: 2018/4/27 14:18
19 | 	// 2019/4 NG: http://www.hheehh.com/
20 | 	// 2019/4 NG: http://www.huhumh.com/
21 | 	// 2019/4 內容圖源相同: http://www.huhudm.com/ http://www.hhmmoo.com/
22 | 	// 2019/9 圖源相同: http://www.1manhua.net/
23 | 	base_URL : 'http://www.hhimm.com/'
24 | 
25 | }, function(crawler) {
26 | 	start_crawler(crawler, typeof module === 'object' && module);
27 | }, function(crawler) {
28 | 	setup_crawler(crawler, typeof module === 'object' && module);
29 | });
30 | 


--------------------------------------------------------------------------------
/archive/iqg365.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 365漫画网 的工具。 Download iqg365.com comics.
 3 |  * 
 4 |  * @see qTcms 晴天漫画程序 晴天漫画系统 http://manhua3.qingtiancms.com/
 5 |  */
 6 | 
 7 | 'use strict';
 8 | 
 9 | require('../work_crawler_loader.js');
10 | 
11 | // ----------------------------------------------------------------------------
12 | 
13 | CeL.run('application.net.work_crawler.sites.qTcms2017');
14 | 
15 | // ----------------------------------------------------------------------------
16 | 
17 | var crawler = CeL.qTcms2017({
18 | 	// 本站速度頗慢，必須等待較久否則容易中斷。
19 | 	// timeout : '60s',
20 | 
21 | 	// {Natural}最小容許圖案檔案大小 (bytes)。
22 | 	// MIN_LENGTH : 500,
23 | 
24 | 	skip_error : true,
25 | 
26 | 	base_URL : 'http://www.iqg365.com/'
27 | });
28 | 
29 | // ----------------------------------------------------------------------------
30 | 
31 | // CeL.set_debug(3);
32 | 
33 | start_crawler(crawler, typeof module === 'object' && module);
34 | 


--------------------------------------------------------------------------------
/archive/nokiacn.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 乙女漫画 的工具。 Download nokiacn.net comics.
 3 |  * 
 4 |  * @see qTcms 晴天漫画程序 晴天漫画系统 http://manhua3.qingtiancms.com/
 5 |  */
 6 | 
 7 | 'use strict';
 8 | 
 9 | require('../work_crawler_loader.js');
10 | 
11 | // ----------------------------------------------------------------------------
12 | 
13 | CeL.run('application.net.work_crawler.sites.qTcms2017');
14 | 
15 | // ----------------------------------------------------------------------------
16 | 
17 | var crawler = CeL.qTcms2017({
18 | 	// 圖像檔案下載失敗處理方式：忽略/跳過圖像錯誤。當404圖像不存在、檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。default:false
19 | 	skip_error : true,
20 | 
21 | 	// {Natural}最小容許圖案檔案大小 (bytes)。
22 | 	MIN_LENGTH : 500,
23 | 
24 | 	base_URL : 'http://www.nokiacn.net/',
25 | 
26 | 	// function f_qTcms_Pic_curUrl_realpic(v){
27 | 	// 2019/3: 'http://n.aiwenwo.net:55888'
28 | 	// 2019/9: 'http://n.aiwenwo.net'
29 | 	image_base_url : 'http://n.aiwenwo.net',
30 | 
31 | 	image_preprocessor : function(contents, image_data) {
32 | 		var index = contents && contents.length - 1;
33 | 
34 | 		if (!(index > 0) || contents[index] !== 0) {
35 | 			return;
36 | 		}
37 | 
38 | 		// 修正圖片結尾非正規格式之情況。
39 | 		// e.g., http://www.nokiacn.net/yinv/baozhuzheshigeyijinyueye/
40 | 		// http://n.aiwenwo.net:55888/upload2/1774/2018/03-17/20180317232906_4691cbjowu29a_small.jpeg
41 | 
42 | 		while (index > 0 && contents[--index] === 0)
43 | 			;
44 | 
45 | 		return contents.slice(0, index + 1);
46 | 	}
47 | });
48 | 
49 | // ----------------------------------------------------------------------------
50 | 
51 | // CeL.set_debug(3);
52 | 
53 | start_crawler(crawler, typeof module === 'object' && module);
54 | 


--------------------------------------------------------------------------------
/archive/r2hm.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 无双漫画 的工具。 Download r2hm comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.dm5');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.dm5({
16 | 	// MIN_LENGTH : 600,
17 | 
18 | 	base_URL : 'https://r2hm.com/',
19 | 
20 | 	// 解析 作品名稱 → 作品id get_work()
21 | 	// <a id="btnSearch" href="javascript:;">搜索</a>
22 | 	search_URL : 'search?keyword=',
23 | 
24 | 	work_URL : 'book/',
25 | 
26 | 	inverted_order : false,
27 | 
28 | 	pre_parse_chapter_data : null
29 | });
30 | 
31 | // ----------------------------------------------------------------------------
32 | 
33 | // CeL.set_debug(3);
34 | 
35 | start_crawler(crawler, typeof module === 'object' && module);
36 | 


--------------------------------------------------------------------------------
/archive/remanba.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載热漫吧网站的工具。 Download remanba comics.
  3 |  * 
  4 |  * 自 2016/12/27 14:42 最後一次成功連接後，下午起就持續 404 至 2017/2/10 未復原。
  5 |  */
  6 | 
  7 | 'use strict';
  8 | 
  9 | require('../work_crawler_loader.js');
 10 | 
 11 | // ----------------------------------------------------------------------------
 12 | 
 13 | var remanba = new CeL.comic.site({
 14 | 	// recheck:從頭檢測所有作品之所有章節。
 15 | 	// recheck : true,
 16 | 	// one_by_one : true,
 17 | 
 18 | 	// http://www.reman8.com/
 19 | 	base_URL : 'http://www.remanba.com/',
 20 | 
 21 | 	// allow .jpg without EOI mark.
 22 | 	// allow_EOI_error : true,
 23 | 	// 當圖像檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。
 24 | 	// skip_error : true,
 25 | 
 26 | 	// 取得伺服器列表。
 27 | 	// use_server_cache : true,
 28 | 	server_URL : function() {
 29 | 		return this.base_URL + 'template/v2/js/configs.js';
 30 | 	},
 31 | 	parse_server_list : function(html) {
 32 | 		return JSON.parse(
 33 | 		//
 34 | 		html.replace(/^[^{]+/, '').replace(/[^}]+$/, '')
 35 | 		//
 36 | 		.replace(/,[\s\n]*'IMG_ERR_MSG'[\s\S]+$/, '}')
 37 | 		//
 38 | 		.replace(/'/g, '"')).servs
 39 | 		//
 40 | 		.map(function(server_data) {
 41 | 			return server_data.host;
 42 | 		});
 43 | 	},
 44 | 
 45 | 	// 解析 作品名稱 → 作品id get_work()
 46 | 	search_URL : function(work_title) {
 47 | 		return this.base_URL + '/plus/ac.php?from=web&cs=utf-8&k='
 48 | 		// e.g., 找不到"隔离带 2"，須找"隔离带"。
 49 | 		+ encodeURIComponent(work_title.replace(/\s+\d+$/, '')
 50 | 		// "七公主 第三季" → search "七公主"
 51 | 		.replace(/\s+(.*)$/, ''));
 52 | 	},
 53 | 	parse_search_result : function(html) {
 54 | 		/**
 55 | 		 * e.g.,<code>
 56 | 		compResp("深渊", new Array("白色深渊","蝴蝶深渊","无限深渊~梦物语~","深渊幻象","深渊","深渊之塔","白色深渊","深渊","深渊边境","深渊骑士"), new Array("comic_106393","comic_117847","comic_122570","comic_124693","comic_126005","comic_126749","comic_127741","comic_143631","comic_149749","comic_150918"), new Array("","","","","","","","","",""));
 57 | 		 </code>
 58 | 		 */
 59 | 		var id_data = html ? JSON.parse(html.replace(/^.+?\(/, '[').replace(
 60 | 				/\)[^()]*$/, ']').replace(/new Array\((.*?)\)/g, '[$1]')) : [];
 61 | 		return [ id_data[2], id_data[1] ];
 62 | 	},
 63 | 	// id_of_search_result : '',
 64 | 	// title_of_search_result : '',
 65 | 	post_get_work_id : function(callback, work_title, search_result) {
 66 | 		CeL.get_URL(this.base_URL + 'plus/ac_comic.php?t=get_comic_info&id='
 67 | 				+ search_result[work_title].replace(/^comic_/, ''), function(
 68 | 				XMLHttp) {
 69 | 			var matched = XMLHttp.responseText;
 70 | 			if (matched
 71 | 			//
 72 | 			&& (matched = matched.match(/titleurl='([^']+)'/))) {
 73 | 				matched = matched[1].match(/([^\/]+)\/$/);
 74 | 			}
 75 | 			search_result[work_title] = matched && matched[1];
 76 | 			callback();
 77 | 		});
 78 | 	},
 79 | 
 80 | 	// 取得作品的章節資料。 get_work_data()
 81 | 	work_URL : function(work_id) {
 82 | 		return 'comic/' + work_id + '/';
 83 | 	},
 84 | 	parse_work_data : function(html, get_label, extract_work_data) {
 85 | 		var work_data = {
 86 | 			// 必要屬性：須配合網站平台更改。
 87 | 			title : html.between(
 88 | 					'<meta property="og:novel:book_name"content="', '"/>'),
 89 | 
 90 | 			// 選擇性屬性：須配合網站平台更改。
 91 | 			// <meta property="og:novel:status" content="已完结"/>
 92 | 			status : html.between('<meta property="og:novel:status"content="',
 93 | 					'"/>'),
 94 | 			description : get_label(html.between(
 95 | 					'</p><p class="movieintro"id="comic_intro_l">', '<div '))
 96 | 		};
 97 | 		extract_work_data(work_data, html.between('<ul class="movieinfo">',
 98 | 				'</ul>'), /<li[^<>]*>([^:]+):(.+?)<\/li>/g);
 99 | 		return work_data;
100 | 	},
101 | 	get_chapter_list : function(work_data, html) {
102 | 		work_data.chapter_list = [];
103 | 		var matched,
104 | 		/**
105 | 		 * e.g., <code>
106 | 		<li class="info_li"><a href="http://www.remanba.com/comic/ShenYuanBianJing/401349.html"target="_blank">01话.融化的尸体</a></li>
107 | 		</code>
108 | 		 */
109 | 		PATTERN_chapter =
110 | 		// [all,href,title]
111 | 		/<li class="info_li"><a href="([^<>"]+)"(?:[^<>]*)>([^<>]+)<\/a>/g;
112 | 		html = html.between('scrollcontain', 'box_tt_tab');
113 | 		while (matched = PATTERN_chapter.exec(html)) {
114 | 			work_data.chapter_list.push({
115 | 				url : matched[1],
116 | 				title : matched[2].trim()
117 | 			});
118 | 		}
119 | 		work_data.chapter_count = work_data.chapter_list.length;
120 | 		if (work_data.chapter_count > 1) {
121 | 			// 轉成由舊至新之順序。
122 | 			work_data.chapter_list = work_data.chapter_list.reverse();
123 | 		}
124 | 	},
125 | 
126 | 	// 取得每一個章節的各個影像內容資料。 get_chapter_data()
127 | 	parse_chapter_data : function(html, work_data, get_label) {
128 | 		// decode chapter data
129 | 		function decode(code) {
130 | 			code = eval(code).replace(/^[^=]+/, 'code');
131 | 			return eval(code);
132 | 		}
133 | 
134 | 		var chapter_data = html.between('<script type="text/javascript">eval',
135 | 				';</script>');
136 | 		if (!chapter_data || !(chapter_data = decode(chapter_data))) {
137 | 			return;
138 | 		}
139 | 
140 | 		// 設定必要的屬性。
141 | 		chapter_data.title = chapter_data.cname;
142 | 		chapter_data.image_count = chapter_data.len;
143 | 		chapter_data.image_list = chapter_data.files.map(function(url) {
144 | 			return {
145 | 				url : url
146 | 			}
147 | 		});
148 | 
149 | 		return chapter_data;
150 | 	}
151 | });
152 | 
153 | // ----------------------------------------------------------------------------
154 | 
155 | // CeL.set_debug(3);
156 | 
157 | remanba.start(work_id);
158 | 


--------------------------------------------------------------------------------
/archive/tohomh.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 土豪漫画 的工具。 Download tohomh comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.dm5');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.dm5({
16 | 	// 本網站常有圖片不存在的現象。
17 | 	skip_error : true,
18 | 
19 | 	chapter_time_interval : '4s',
20 | 
21 | 	// 2019/1/21 土豪漫畫網址更動 ← https://www.tohomh.com/
22 | 	base_URL : 'https://www.tohomh123.com/',
23 | 
24 | 	// 解析 作品名稱 → 作品id get_work()
25 | 	// <a id="btnSearch" href="javascript:void(0);"
26 | 	// onclick="mhsearch('/action/Search')">搜索</a>
27 | 	search_URL : 'action/Search?keyword=',
28 | 
29 | 	image_API : 'action/play/read?did='
30 | });
31 | 
32 | // ----------------------------------------------------------------------------
33 | 
34 | // CeL.set_debug(3);
35 | 
36 | start_crawler(crawler, typeof module === 'object' && module);
37 | 


--------------------------------------------------------------------------------
/archive/wuyouhui.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 友绘漫画网 的工具。 Download wuyouhui comics.
 3 |  * 
 4 |  * @see qTcms 晴天漫画程序 晴天漫画系统 手机端 http://manhua3.qingtiancms.com/
 5 |  */
 6 | 
 7 | 'use strict';
 8 | 
 9 | require('../work_crawler_loader.js');
10 | 
11 | // ----------------------------------------------------------------------------
12 | 
13 | CeL.run('application.net.work_crawler.sites.qTcms2017');
14 | 
15 | // ----------------------------------------------------------------------------
16 | 
17 | var crawler = CeL.qTcms2017({
18 | 	// {Natural}最小容許圖案檔案大小 (bytes)。
19 | 	// MIN_LENGTH : 500,
20 | 
21 | 	skip_error : true,
22 | 
23 | 	base_URL : 'http://m.wuyouhui.net/'
24 | });
25 | 
26 | // ----------------------------------------------------------------------------
27 | 
28 | // CeL.set_debug(3);
29 | 
30 | start_crawler(crawler, typeof module === 'object' && module);
31 | 


--------------------------------------------------------------------------------
/archive/xbiquge.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 新笔趣阁 小说 的工具。 Download xbiquge novels.
 3 |  * 
 4 |  * @see x81zw
 5 |  */
 6 | 
 7 | 'use strict';
 8 | 
 9 | require('../work_crawler_loader.js');
10 | 
11 | // ----------------------------------------------------------------------------
12 | 
13 | CeL.run('application.net.work_crawler.sites.PTCMS');
14 | 
15 | // ----------------------------------------------------------------------------
16 | 
17 | var crawler = CeL.PTCMS({
18 | 	base_URL : 'https://www.xbiquge6.com/',
19 | 
20 | 	// 解析 作品名稱 → 作品id get_work()
21 | 	search_URL : 'search.php?keyword=',
22 | 	parse_search_result : function(html, get_label) {
23 | 		// console.log(html);
24 | 
25 | 		var id_list = [], id_data = [];
26 | 		html.each_between('<div class="result-game-item-detail">',
27 | 		//
28 | 		'</div>', function(text) {
29 | 			var matched = text.match(
30 | 			/**
31 | 			 * <code>
32 | 
33 | 			<a cpos="title" href="https://www.xbiquge6.com/78_78513/" title="元尊" class="result-game-item-title-link" target="_blank">
34 | 
35 | 			</code>
36 | 			 */
37 | 			/<a [^<>]*?href="[^<>"]+?\/(?:\d+_)?(\d+)\/"[^<>]*>([\s\S]+?)<\/a>/
38 | 			//		
39 | 			);
40 | 			// console.log([ text, matched ]);
41 | 			if (matched) {
42 | 				id_list.push(+matched[1]);
43 | 				id_data.push(get_label(matched[2]));
44 | 			}
45 | 		});
46 | 		return [ id_list, id_data ];
47 | 	},
48 | 
49 | 	// 取得作品的章節資料。 get_work_data()
50 | 	work_URL : function(work_id) {
51 | 		return (work_id / 1000 | 0) + '_' + work_id + '/';
52 | 	},
53 | 	// 取得包含章節列表的文字範圍。
54 | 	get_chapter_list_contents : function(html) {
55 | 		return html.between('<div id="list">', '</div>');
56 | 	}
57 | });
58 | 
59 | // ----------------------------------------------------------------------------
60 | 
61 | // CeL.set_debug(3);
62 | 
63 | start_crawler(crawler, typeof module === 'object' && module);
64 | 


--------------------------------------------------------------------------------
/archive/yinvmh.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 乙女漫画 的工具。 Download yinvmh.com comics.
 3 |  * 
 4 |  * 整體採 qTcms 晴天漫画程序 晴天漫画系统 http://manhua3.qingtiancms.com/
 5 |  * 
 6 |  * 僅顯示作品頁面採用 dm5
 7 |  */
 8 | 
 9 | 'use strict';
10 | 
11 | require('../work_crawler_loader.js');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | CeL.run([ 'application.net.work_crawler.sites.qTcms2017',
16 | 		'application.net.work_crawler.sites.dm5' ]);
17 | 
18 | // ----------------------------------------------------------------------------
19 | 
20 | var crawler = CeL.dm5({
21 | 	base_URL : 'https://www.yinvmh.com/'
22 | });
23 | 
24 | crawler = CeL.qTcms2017({
25 | 	base_URL : crawler.base_URL,
26 | 	parse_work_data : crawler.parse_work_data,
27 | 	get_chapter_list : crawler.get_chapter_list,
28 | 
29 | 	// 圖像檔案下載失敗處理方式：忽略/跳過圖像錯誤。當404圖像不存在、檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。default:false
30 | 	skip_error : true
31 | });
32 | 
33 | // ----------------------------------------------------------------------------
34 | 
35 | // CeL.set_debug(3);
36 | 
37 | start_crawler(crawler, typeof module === 'object' && module);
38 | 


--------------------------------------------------------------------------------
/archive/youma.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 有码漫画 的工具。 Download youma comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.dm5');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.dm5({
16 | 	// 本網站偶爾有圖片不存在的現象。
17 | 	skip_error : true,
18 | 	// MIN_LENGTH : 400,
19 | 
20 | 	base_URL : 'https://www.youma.org/',
21 | 
22 | 	// 解析 作品名稱 → 作品id get_work()
23 | 	// <a id="btnSearch">搜索</a>
24 | 	search_URL : 'search?keyword=',
25 | 
26 | 	work_URL : 'book/',
27 | 
28 | 	inverted_order : false,
29 | 
30 | 	pre_parse_chapter_data : null
31 | });
32 | 
33 | // ----------------------------------------------------------------------------
34 | 
35 | // CeL.set_debug(3);
36 | 
37 | start_crawler(crawler, typeof module === 'object' && module);
38 | 


--------------------------------------------------------------------------------
/arrangement/list_kuaiZip.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * @fileoverview 檢測目標目錄中所有壓縮檔案，並且篩選列出可能是 快压（kuaiZip） 檔案。
 3 |  * 
 4 |  * @example<code>
 5 | 
 6 | node list_kuaiZip.js target_directory
 7 | 
 8 | </code>
 9 |  * 
10 |  * @since 2018/11/4 13:49:0
11 |  */
12 | 
13 | 'use strict';
14 | 
15 | global.need_work_id = false;
16 | 
17 | require('../work_crawler_loader.js');
18 | 
19 | var log_file = CeL.env.script_name + '.log.txt';
20 | 
21 | // ----------------------------------------------------------------------------
22 | // Load module.
23 | 
24 | CeL.run(
25 | // for
26 | );
27 | 
28 | // ----------------------------------------------------------------------------
29 | 
30 | // 要處理的目錄。
31 | var target_directory = process.argv[2]/* || '.' */;
32 | 
33 | if (!target_directory) {
34 | 	var main_script = require.main
35 | 			&& require.main.filename.match(/[^\\\/]+$/)[0];
36 | 	CeL.log('Usage:\n	node ' + main_script + ' "target directory"');
37 | 	process.exit();
38 | }
39 | 
40 | // -----------------------------------------------------------------
41 | 
42 | // 遍歷檔案系統，對每個 FSO 執行指定的動作。
43 | CeL.storage.traverse_file_system(target_directory, function(file_path) {
44 | 	// console.log(file_path);
45 | 	var matched = file_path.match(/^(.+[ .])bad\.(zip|rar)$/i);
46 | 	if (matched) {
47 | 		// recover
48 | 		// console.log([file_path, matched[1] + matched[2]]);
49 | 		// CeL.move_file(file_path, matched[1] + matched[2]);
50 | 
51 | 		// 跳過已經明確標示為有問題的檔案。
52 | 		return;
53 | 	}
54 | 
55 | 	var archive_file = new CeL.archive(file_path, {
56 | 		program_type : '7z'
57 | 	});
58 | 	// console.log(archive_file);
59 | 	archive_file.info();
60 | 	// console.log(archive_file);
61 | 	// throw 123123
62 | 
63 | 	// for 7z only!
64 | 	if (!archive_file.information) {
65 | 		console.log('檔頭有問題的檔案: ' + file_path);
66 | 		// 移動/標註此檔案為壞掉的壓縮檔。
67 | 		CeL.move_file(file_path, file_path
68 | 				.replace(/(\.(?:zip|rar))$/, '.bad$1'))
69 | 		// archive_file.verify();
70 | 		return;
71 | 	}
72 | 	if (!archive_file.information.Offset
73 | 			&& !archive_file.information['Tail Size']) {
74 | 		// archive_file.verify();
75 | 		return;
76 | 	}
77 | 	// 篩選出有問題的檔案
78 | 
79 | 	var read_file = archive_file.fso_status_list[0];
80 | 	if (archive_file.fso_status_list.length !== 1
81 | 	// "说明.txt". e.g., '佽隴.txt'@Big5
82 | 	|| !/^.{2,4}\.txt$/.test(read_file.path)
83 | 			|| read_file.size !== read_file['packed size']) {
84 | 		// 警告: 有效負載盡頭外還有其他資料
85 | 		console.log('有問題的檔案: ' + archive_file.fso_status_list);
86 | 		// 移動/標註此檔案為壞掉的壓縮檔。
87 | 		CeL.move_file(file_path, file_path
88 | 				.replace(/(\.(?:zip|rar))$/, '.bad$1'))
89 | 		return;
90 | 	}
91 | 	// 篩選出可能是 快压（KuaiZip） 檔案
92 | 
93 | 	console.log('可能是 快压（KuaiZip） 檔案: ' + file_path);
94 | 
95 | }, /\.(zip|rar)$/i);
96 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/1kkk.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 极速漫画 漫画人 的工具。 Download 1kkk comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.dm5');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.dm5({
16 | 	base_URL : 'http://www.1kkk.com/'
17 | });
18 | 
19 | // ----------------------------------------------------------------------------
20 | 
21 | // CeL.set_debug(3);
22 | 
23 | start_crawler(crawler, typeof module === 'object' && module);
24 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/733dm.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載733动漫网的工具。 Download 733dm comics.
  3 |  * 
  4 |  * @see qTcms 晴天漫画程序 晴天漫画系统 http://manhua3.qingtiancms.com/
  5 |  */
  6 | 
  7 | 'use strict';
  8 | 
  9 | require('../work_crawler_loader.js');
 10 | 
 11 | // ----------------------------------------------------------------------------
 12 | 
 13 | CeL.run('application.net.work_crawler.sites.qTcms2017');
 14 | 
 15 | // ----------------------------------------------------------------------------
 16 | 
 17 | var crawler = CeL.qTcms2017({
 18 | 	// 本站常常無法取得圖片，因此得多重新檢查。
 19 | 	// recheck:從頭檢測所有作品之所有章節與所有圖片。不會重新擷取圖片。對漫畫應該僅在偶爾需要從頭檢查時開啟此選項。
 20 | 	// recheck : true,
 21 | 	// 當無法取得chapter資料時，直接嘗試下一章節。在手動+監視下recheck時可併用此項。
 22 | 	// skip_chapter_data_error : true,
 23 | 
 24 | 	// allow .jpg without EOI mark.
 25 | 	// allow_EOI_error : true,
 26 | 	// 當圖像檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。
 27 | 	skip_error : true,
 28 | 
 29 | 	// 當網站不允許太過頻繁的訪問/access時，可以設定下載之前的等待時間(ms)。
 30 | 	// chapter_time_interval : '2s',
 31 | 
 32 | 	// 2018/3: https://www.733dm.net/
 33 | 	base_URL : 'https://www.733.so/',
 34 | 
 35 | 	// 733动漫网 2018/11/9 之後 (11/16之後?) 改版成 晴天漫画系统
 36 | 	// fs.readdirSync('.').forEach(function(d){if(/^\d+\s/.test(d))fs.renameSync(d,'manhua-'+d);})
 37 | 	// fs.readdirSync('.').forEach(function(d){if(/^manhua-/.test(d))fs.renameSync(d,d.replace(/^manhua-/,''));})
 38 | 	// 所有作品都使用這種作品類別前綴。
 39 | 	common_catalog : 'mh',
 40 | 
 41 | 	// 取得作品的章節資料。 get_work_data()
 42 | 	parse_chapter_data_201811 : function(html, work_data) {
 43 | 		var chapter_data = html.between('qTcms_S_m_murl_e="', '"');
 44 | 		if (chapter_data) {
 45 | 			// 對於非utf-8編碼之中文，不能使用 atob()???
 46 | 			chapter_data = atob(chapter_data).split("$qingtiandy$");
 47 | 		}
 48 | 		if (!chapter_data) {
 49 | 			CeL.log('無法解析資料！');
 50 | 			return;
 51 | 		}
 52 | 		// console.log(JSON.stringify(chapter_data));
 53 | 		// console.log(chapter_data.length);
 54 | 		// CeL.set_debug(6);
 55 | 
 56 | 		// 設定必要的屬性。
 57 | 		chapter_data = {
 58 | 			image_list : chapter_data.map(function(url) {
 59 | 				url = encodeURI(url);
 60 | 
 61 | 				// f_qTcms_Pic_curUrl() → f_qTcms_Pic_curUrl_realpic(v) @
 62 | 				// https://www.733.so/template/skin2/css/d7s/js/show.20170501.js?20190105114149
 63 | 				var timestamp = Date.now();
 64 | 				var File_Server = "http://img_733.234us.com/newfile.php?data=";
 65 | 
 66 | 				url = url.replace("http://www.baidu1.com/", "");
 67 | 				// using File_Server 图片服务器: 此 URL 會再轉址至圖片真實網址。
 68 | 				url = File_Server + btoa(url + "|" + timestamp + "|"
 69 | 				// 733dm.js: 2019/2/16 改版
 70 | 				+ html.between('qTcms_S_m_id="', '"') + "|"
 71 | 				//
 72 | 				+ html.between('qTcms_S_p_id="', '"') + "|pc");
 73 | 
 74 | 				return {
 75 | 					url : url
 76 | 				};
 77 | 			}, this)
 78 | 		};
 79 | 		// console.log(JSON.stringify(chapter_data));
 80 | 
 81 | 		return chapter_data;
 82 | 	},
 83 | 
 84 | 	// function f_qTcms_Pic_curUrl_realpic(v) @
 85 | 	// https://www.733.so/template/skin2/css/d7s/js/show.20190608.js?20190902222912
 86 | 	for_each_image : function(url, parameters, base64_encode) {
 87 | 		var File_Server = "https://api.733.so/newfile.php?data=";
 88 | 		return File_Server
 89 | 				+ base64_encode(url + "|" + Date.now() + "|"
 90 | 						+ parameters.qTcms_S_m_id + "|"
 91 | 						+ parameters.qTcms_S_p_id + "|pc");
 92 | 	}
 93 | });
 94 | 
 95 | // ----------------------------------------------------------------------------
 96 | 
 97 | // CeL.set_debug(3);
 98 | 
 99 | start_crawler(crawler, typeof module === 'object' && module);
100 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/90mh.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 90漫画网 的工具。 Download 90mh comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.SinMH');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.SinMH({
16 | 	// 本站常常無法取得圖片，因此得多重新檢查。
17 | 	// recheck:從頭檢測所有作品之所有章節與所有圖片。不會重新擷取圖片。對漫畫應該僅在偶爾需要從頭檢查時開啟此選項。
18 | 	// 有些漫畫作品分區分單行本、章節與外傳，當章節數量改變、添加新章節時就需要重新檢查。
19 | 	// recheck : 'changed',
20 | 
21 | 	// 圖像檔案下載失敗處理方式：忽略/跳過圖像錯誤。當404圖像不存在、檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。default:false
22 | 	skip_error : true,
23 | 
24 | 	// one_by_one : true,
25 | 
26 | 	// 2022/6/10: http://www.90mh.com/
27 | 	base_URL : 'http://www.90mh.com/',
28 | 
29 | 	search_URL : 'API',
30 | 	id_of_search_result : 'slug'
31 | });
32 | 
33 | // ----------------------------------------------------------------------------
34 | 
35 | // CeL.set_debug(3);
36 | 
37 | start_crawler(crawler, typeof module === 'object' && module);
38 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/930mh.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 亲亲漫画网 的工具。 Download 930mh.com → duzhez.com comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.SinMH');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.SinMH({
16 | 	// one_by_one : true,
17 | 
18 | 	// 2020/4/24 單一作品 1s: NG, 1200ms: OK
19 | 	chapter_time_interval : 6000,
20 | 
21 | 	// 圖像檔案下載失敗處理方式：忽略/跳過圖像錯誤。當404圖像不存在、檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。default:false
22 | 	skip_error : true,
23 | 
24 | 	// old: http://www.duzhez.com/
25 | 	// 2019/8 改網址: http://www.93gmh.com/
26 | 	// 2019/10/17 改網址: http://www.rubobo.com/
27 | 	// 2021/2/25 改網址: https://www.acgcd.com/
28 | 	// 2022/11/3前: https://www.acgqd.com/
29 | 	base_URL : 'https://www.acgqd.com/',
30 | 
31 | 	extract_work_id : function(work_information) {
32 | 		return CeL.is_digits(work_information) && work_information;
33 | 	},
34 | 
35 | 	// for 年轻人脱离黑魔法虽然刻不容缓、但试着就业之后待遇却很好、社长和使魔也非常可爱真是棒极了！
36 | 	acceptable_types : 'images',
37 | 
38 | 	search_URL : 'API',
39 | 	api_base_URL : 'https://api.acg.gd/',
40 | 
41 | 	/**
42 | 	 * @see function cops201921() @ http://www.duzhez.com/js/cops201921.js<br /> →
43 | 	 * 2019/5/1 亲亲漫画改版: function kda20190501() @ http://www.duzhez.com/js/kda20190501.js
44 | 	 */
45 | 	crypto_duzhez : {
46 | 		key : "9Xc4PMs2cvQinnbd",
47 | 		iv : "ioXA45KJnv98ccSB"
48 | 	},
49 | 	/**
50 | 	 * 2019/8 改網址: function pt20190804() @ http://www.93gmh.com/js/pt20190804.js
51 | 	 */
52 | 	crypto : {
53 | 		key : "u1S2Bvvwp1XZ37B9",
54 | 		iv : "2VNNjmjywpbnsYmW"
55 | 	},
56 | 	/**
57 | 	 * 2019/10/17 改網址: function jmzz20191018() @ http://www.rubobo.com/js/jmzz20191018.js
58 | 	 */
59 | 	crypto : {
60 | 		iv : "opb4x7z21vg1f3gI",
61 | 		key : "cxNB23W8xzKJV26O",
62 | 	},
63 | 
64 | 	/**
65 | 	 * 處理特殊圖片: 有些會下載成盜鏈圖片 http://mhimg.acg.gd:44236/images/logo/dl.jpg
66 | 	 */
67 | 	is_limited_image_url : function(image_url) {
68 | 		return image_url.endsWith('logo/dl.jpg');
69 | 	}
70 | });
71 | 
72 | // ----------------------------------------------------------------------------
73 | 
74 | // CeL.set_debug(3);
75 | 
76 | start_crawler(crawler, typeof module === 'object' && module);
77 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/baozimh.org.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載包子漫畫的工具。 Download baozimh comics.
  3 |  */
  4 | 
  5 | 'use strict';
  6 | 
  7 | require('../work_crawler_loader.js');
  8 | 
  9 | // ----------------------------------------------------------------------------
 10 | 
 11 | var crawler = new CeL.work_crawler({
 12 | 	// 2023/6/16: https://baozimh.org/
 13 | 	// 2023/9/1 前網站改版為手機友好外觀
 14 | 	base_URL : 'https://baozimh.org/',
 15 | 
 16 | 	// 最小容許圖案檔案大小 (bytes)。
 17 | 	// 對於極少出現錯誤的網站，可以設定一個比較小的數值，並且設定.allow_EOI_error=false。因為這類型的網站要不是無法取得檔案，要不就是能夠取得完整的檔案；要取得破損檔案，並且已通過EOI測試的機會比較少。
 18 | 	// 對於有些圖片只有一條細橫桿的情況。
 19 | 	MIN_LENGTH : 50,
 20 | 	// e.g., wonengkandaochenggonglu-namu 我能看到成功率/0199 第199话
 21 | 	// 霁月之下/wonengkandaochenggonglu-namu-199-135.jpg
 22 | 
 23 | 	// 2023/6/27 20:3:3 時間間距太短會出現 異常 HTTP 狀態碼 502
 24 | 	one_by_one : '1s',
 25 | 	chapter_time_interval : '1s',
 26 | 
 27 | 	// 當圖像檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。
 28 | 	skip_error : true,
 29 | 
 30 | 	// e.g., 原来我是修仙大佬 0092 九十二话 .webp
 31 | 	acceptable_types : 'webp',
 32 | 
 33 | 	search_URL : '?s=',
 34 | 	parse_search_result : function(html, get_label) {
 35 | 		// console.log(html);
 36 | 		var id_list = [], id_data = [];
 37 | 		html.each_between('<h2', '</h2>', function(text) {
 38 | 			text = text.between('<a href="');
 39 | 			id_list.push(text.between(null, '"').between('manga/', '/'));
 40 | 			id_data.push(get_label(text.between('>', '<')));
 41 | 		});
 42 | 		// console.log([ id_list, id_data ]);
 43 | 		return [ id_list, id_data ];
 44 | 	},
 45 | 
 46 | 	work_URL : function(work_id) {
 47 | 		return 'manga/' + work_id + '/';
 48 | 	},
 49 | 	parse_work_data : function(html, get_label, extract_work_data) {
 50 | 		// console.log(html);
 51 | 		var work_data = {
 52 | 			// 必要屬性：須配合網站平台更改。
 53 | 			title : get_label(html.between(
 54 | 			// <h1 class="mb-2 text-xl">武炼巅峰 <span class="
 55 | 			'<h1 class="', '</h1>').between('>')
 56 | 			//
 57 | 			.replace(/<span [\s\S]+$/, '')),
 58 | 			author : get_label(html.between(
 59 | 			// <span class="font-medium">作者：</span><a
 60 | 			// href="/manga-author/pi-ka-pi"><span>噼咔噼,
 61 | 			'<span class="font-medium">作者：', '</div>')),
 62 | 
 63 | 			// 選擇性屬性：須配合網站平台更改。
 64 | 			tags : html.between('<span class="font-medium">類型：', '</div>')
 65 | 			//
 66 | 			.split('</a>').map(function(tag) {
 67 | 				return get_label(tag).replace(/,$/, '').replace(/^#/, '');
 68 | 			}),
 69 | 			description : get_label(html
 70 | 					.between('<p class="text-medium line-clamp-4 my-unit-md">',
 71 | 							'</div>'))
 72 | 		/**
 73 | 		 * cover image<code>
 74 | 		<div class="w-full h-full relative flex  justify-center items-center backdrop-blur-lg md:p-20 px-28 py-unit-sm rounded-lg"><img src="https://cover1.baozimh.org/cover/tx/wuliandianfeng/30_19_15_325982f153d0f3d4b52d617a579da96e_1640862941502.webp" alt="武炼巅峰"
 75 | 		<code>
 76 | 		 */
 77 | 		// cover_image :
 78 | 		};
 79 | 		// console.log(work_data);
 80 | 
 81 | 		// 由 meta data 取得作品資訊。
 82 | 		extract_work_data(work_data, html);
 83 | 
 84 | 		// console.log(work_data);
 85 | 		return work_data;
 86 | 	},
 87 | 	chapter_list_URL : function(work_id, work_data) {
 88 | 		return 'chapterlist/' + work_id + '/';
 89 | 	},
 90 | 	get_chapter_list : function(work_data, html, get_label) {
 91 | 		// console.log(html);
 92 | 		var _this = this;
 93 | 		// reset chapter list
 94 | 		work_data.chapter_list = [];
 95 | 		html = html.between('<ul class="main version-chaps">', '</ul>');
 96 | 		// <a id="shenchongjinhua-yuewenmanhua_47872a3603753b47872_223"
 97 | 		// href="https://baozimh.org/manga/shenchongjinhua-yuewenmanhua/47872a3603753b47872_223/"
 98 | 		// class="wp-manga-chapterlist">213 无尽轮回迷宫 <span
 99 | 		// class="chapter-release-date"><i>12分钟 ago</i></span> </a>
100 | 		html.each_between('<a id="', '</a>', function(text) {
101 | 			var chapter_data = {
102 | 				title : get_label(text.between('>', '<')),
103 | 				date : get_label(text.between(
104 | 						'<span class="chapter-release-date">', '</span>')),
105 | 				url : text.between(' href="', '"')
106 | 			};
107 | 			_this.add_chapter(work_data, chapter_data);
108 | 		});
109 | 		work_data.inverted_order = true;
110 | 		// console.log(work_data.chapter_list);
111 | 	},
112 | 
113 | 	parse_chapter_data : function(html, work_data, get_label, chapter_NO) {
114 | 		var chapter_data = work_data.chapter_list[chapter_NO - 1];
115 | 
116 | 		var image_list = chapter_data.image_list = [];
117 | 
118 | 		html = html.between('<div class="gb-inside-container">',
119 | 				'class="site-footer')
120 | 				|| html;
121 | 		html = html.replace(/<noscript>[\s\S]+?<\/noscript>/g, '');
122 | 		html.each_between('<img', '>', function(text) {
123 | 			var url = text.between('data-src="', '"')
124 | 					|| text.between('src="', '"');
125 | 			image_list.push({
126 | 				title : get_label(text.between('title="', '"')),
127 | 				url : url
128 | 			});
129 | 		});
130 | 		// console.log(image_list);
131 | 
132 | 		return chapter_data;
133 | 	}
134 | 
135 | });
136 | 
137 | // ----------------------------------------------------------------------------
138 | 
139 | // CeL.set_debug(3);
140 | 
141 | start_crawler(crawler, typeof module === 'object' && module);
142 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/baozimh_cn.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載包子漫畫的工具。 Download baozimh comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.baozimh');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = new CeL.baozimh({
16 | 	// 2022: https://cn.baozimh.com/ , https://cn.webmota.com/
17 | 	// 2022/11/19 已採用 Cloudflare 的阻斷服務攻擊保護。
18 | 	base_URL : 'https://cn.baozimh.com/'
19 | });
20 | 
21 | // ----------------------------------------------------------------------------
22 | 
23 | // CeL.set_debug(3);
24 | 
25 | start_crawler(crawler, typeof module === 'object' && module);
26 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/comic.cmn-Hans-CN.bat:
--------------------------------------------------------------------------------
 1 | @ECHO OFF
 2 | REM parallelly
 3 | CHCP 65001
 4 | REM CHCP 936
 5 | REM CD /D D:\USB\cgi-bin\program\comic
 6 | 
 7 | REM CD "%~n0"
 8 | REM It's often too slow, so trying to execute parallelly.
 9 | FORFILES /M *.js /C "cmd.exe /c IF @isdir==FALSE START node @file l=@fname.txt archive_old_works || PAUSE"
10 | 
11 | REM CD ..
12 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/dm5.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 动漫屋网/漫画人 的工具。 Download dm5.com comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.dm5');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | // https://stackoverflow.com/questions/31673587/error-unable-to-verify-the-first-certificate-in-nodejs
16 | // fix Error: unable to verify the first certificate
17 | // process.env['NODE_TLS_REJECT_UNAUTHORIZED'] = 0;
18 | 
19 | var crawler = CeL.dm5({
20 | 	one_by_one : true,
21 | 	// 2019/9: https://www.dm5.com/
22 | 	// 2019/10: 可以使用 http://cnc.dm5.com/
23 | 	// 2020/2: http://www.dm5.com/
24 | 	base_URL : 'http://www.dm5.com/',
25 | 	extract_work_id : function(work_information) {
26 | 		// /^manhua-[a-z\-\d]+$/;
27 | 		// e.g., http://www.dm5.com/manhua-1122/
28 | 		// http://www.dm5.com/manhua--c-94-okazu/
29 | 		return /^manhua-[a-z\-\d]+$/.test(work_information)
30 | 		//
31 | 		&& work_information;
32 | 	}
33 | });
34 | 
35 | // ----------------------------------------------------------------------------
36 | 
37 | // CeL.set_debug(3);
38 | 
39 | start_crawler(crawler, typeof module === 'object' && module);
40 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/dongman.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 咚漫中文官网 韓國漫畫 的工具。 Download dongmanmanhua comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.webtoon');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.webtoon({
16 | 	// https://www.webtoons.com/zh-hans/
17 | 	base_URL : 'https://www.dongmanmanhua.cn/',
18 | 
19 | 	// 解析 作品名稱 → 作品id get_work()
20 | 	// 2018/7/25: search/autoComplete?keyword=
21 | 	search_URL : 'search/autoComplete?keyword='
22 | });
23 | 
24 | // ----------------------------------------------------------------------------
25 | 
26 | // CeL.set_debug(3);
27 | 
28 | start_crawler(crawler, typeof module === 'object' && module);
29 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/gufengmh.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 古风漫画网 的工具。 Download GuFengMH.Com comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.SinMH');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.SinMH({
16 | 	// 本站常常無法取得圖片，因此得多重新檢查。
17 | 	// recheck:從頭檢測所有作品之所有章節與所有圖片。不會重新擷取圖片。對漫畫應該僅在偶爾需要從頭檢查時開啟此選項。
18 | 	// 有些漫畫作品分區分單行本、章節與外傳，當章節數量改變、添加新章節時就需要重新檢查。
19 | 	// recheck : 'changed',
20 | 
21 | 	// 圖像檔案下載失敗處理方式：忽略/跳過圖像錯誤。當404圖像不存在、檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。default:false
22 | 	skip_error : true,
23 | 
24 | 	// one_by_one : true,
25 | 
26 | 	// chapter_time_interval : '5s',
27 | 
28 | 	// 2018/3/7 改變網址: http://www.gufengmh.com/ → https://www.gufengmh8.com/
29 | 	// 2021/12/27–2022/7/12 網址: https://www.gufengmh9.com/
30 | 	// 2022/7/16– : → https://www.123gf.com/
31 | 	// 2023/10/14 → https://www.gufengmh.com/
32 | 	base_URL : 'https://www.gufengmh.com/',
33 | 
34 | 	search_URL : 'API',
35 | 	id_of_search_result : 'slug'
36 | });
37 | 
38 | // ----------------------------------------------------------------------------
39 | 
40 | // CeL.set_debug(3);
41 | 
42 | start_crawler(crawler, typeof module === 'object' && module);
43 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/hanmanwo.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 韩漫窝 漫画 的工具。 Download hanmanwo comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.dm5');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.dm5({
16 | 	// 本網站偶爾有圖片不存在的現象。
17 | 	skip_error : true,
18 | 	// MIN_LENGTH : 400,
19 | 
20 | 	base_URL : 'http://www.hanmanwo.com/',
21 | 
22 | 	// 解析 作品名稱 → 作品id get_work()
23 | 	// <a id="btnSearch">搜索</a>
24 | 	search_URL : 'search?keyword=',
25 | 
26 | 	work_URL : 'book/',
27 | 
28 | 	inverted_order : false,
29 | 
30 | 	pre_parse_chapter_data : null
31 | });
32 | 
33 | // ----------------------------------------------------------------------------
34 | 
35 | // CeL.set_debug(3);
36 | 
37 | start_crawler(crawler, typeof module === 'object' && module);
38 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/kanman.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載 鄂州看漫画动漫有限公司 看漫画 的工具。 Download kanman comics.
  3 |  */
  4 | 
  5 | 'use strict';
  6 | 
  7 | require('../work_crawler_loader.js');
  8 | 
  9 | // ----------------------------------------------------------------------------
 10 | 
 11 | /**
 12 |  * <code>
 13 | 
 14 |  <li class="item" data-id="0" data-chapter="1650644"><a title="第1话 一梦八万年" href="/107447/1.html" target="_self"><div class="img"><img src="//resource.mhxk.com/kanman_pc/static/images/comm/space.gif" data-src="//image.yqmh.com/chapter_cover/107447/1650644.jpg-300x150.jpg" data-error="//image.yqmh.com/mh/107447_2_1.jpg-300x150.jpg" alt="第1话 一梦八万年"> <i class="j_chapter_badge"></i></div><p class="name"><i class="j_chapter_badge"></i>第1话 一梦八万年</p></a></li>
 15 | 
 16 |  </code>
 17 |  */
 18 | var PATTERN_chapter = /<li([^<>]*)><a title="([^<>"]+)" href="([^<>"]+)"[^<>]*>([\s\S]+?)<\/li>/g,
 19 | //
 20 | crawler = new CeL.work_crawler({
 21 | 	// 所有的子檔案要修訂註解說明時，應該都要順便更改在CeL.application.net.comic中Comic_site.prototype內的母comments，並以其為主體。
 22 | 
 23 | 	// {Natural}最小容許圖案檔案大小 (bytes)。
 24 | 	// MIN_LENGTH : 500,
 25 | 
 26 | 	// 圖像檔案下載失敗處理方式：忽略/跳過圖像錯誤。當404圖像不存在、檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。default:false
 27 | 	skip_error : true,
 28 | 
 29 | 	// 當網站不允許太過頻繁的訪問/access時，可以設定下載之前的等待時間(ms)。
 30 | 	// 模仿實際人工請求。
 31 | 	// chapter_time_interval : '1s',
 32 | 
 33 | 	// one_by_one : true,
 34 | 	base_URL : 'https://www.kanman.com/',
 35 | 
 36 | 	// 解析 作品名稱 → 作品id get_work()
 37 | 	search_URL : 'api/getsortlist/'
 38 | 			+ '?product_id=1&productname=kmh&platformname=pc&search_key=',
 39 | 	parse_search_result : function(html, get_label) {
 40 | 		html = JSON.parse(html).data;
 41 | 		return [ html, html ];
 42 | 	},
 43 | 	id_of_search_result : 'comic_id',
 44 | 	title_of_search_result : 'comic_name',
 45 | 
 46 | 	// 取得作品的章節資料。 get_work_data()
 47 | 	work_URL : function(work_id) {
 48 | 		return work_id + '/';
 49 | 	},
 50 | 	parse_work_data : function(html, get_label, extract_work_data) {
 51 | 		var text = html.between('<div class="content">'), work_data = {
 52 | 		// 必要屬性：須配合網站平台更改。
 53 | 
 54 | 		// 選擇性屬性：須配合網站平台更改。
 55 | 		};
 56 | 
 57 | 		extract_work_data(work_data, html);
 58 | 
 59 | 		Object.assign(work_data, {
 60 | 			description : get_label(text.between('<div class="introduce">',
 61 | 					'</div>').between('</h2>')),
 62 | 			last_update : work_data.update_time
 63 | 		});
 64 | 
 65 | 		// console.log(work_data);
 66 | 		return work_data;
 67 | 	},
 68 | 	get_chapter_list : function(work_data, html, get_label) {
 69 | 		html = html.between(' id="j_chapter_list"', '</ol>');
 70 | 
 71 | 		work_data.chapter_list = [];
 72 | 		var matched;
 73 | 		while (matched = PATTERN_chapter.exec(html)) {
 74 | 			var chapter_data = {
 75 | 				url : matched[3],
 76 | 				title : get_label(matched[2])
 77 | 			};
 78 | 			if (matched[1].includes('lock')) {
 79 | 				chapter_data.limited = true;
 80 | 				work_data.some_limited = true;
 81 | 			}
 82 | 			matched = matched[3].match(/\/\d+\/(.+?)\.html$/);
 83 | 			chapter_data.id = matched[1];
 84 | 			work_data.chapter_list.push(chapter_data);
 85 | 		}
 86 | 	},
 87 | 
 88 | 	// 取得每一個章節的內容與各個影像資料。
 89 | 	chapter_URL : function(work_data, chapter_NO) {
 90 | 		var chapter_data = work_data.chapter_list[chapter_NO - 1];
 91 | 		// console.trace(chapter_data);
 92 | 		var url = new CeL.URI('https://www.kanman.com/api/getchapterinfov2');
 93 | 		url.search_params.set_parameters({
 94 | 			product_id : 1,
 95 | 			productname : "kmh",
 96 | 			platformname : "pc",
 97 | 			comic_id : work_data.id,
 98 | 			chapter_newid : chapter_data.id,
 99 | 			isWebp : 0,
100 | 			quality : "high"
101 | 		});
102 | 		// e.g.,
103 | 		// https://www.kanman.com/api/getchapterinfov2?product_id=1&productname=kmh&platformname=pc&comic_id=105967&chapter_newid=2&isWebp=0&quality=high
104 | 		// console.trace(url.toString());
105 | 		return url.toString();
106 | 	},
107 | 	pre_parse_chapter_data
108 | 	// 執行在解析章節資料 process_chapter_data() 之前的作業 (async)。
109 | 	// 必須自行保證執行 callback()，不丟出異常、中斷。
110 | 	: function(XMLHttp, work_data, callback, chapter_NO) {
111 | 		var chapter_data = work_data.chapter_list[chapter_NO - 1],
112 | 		//
113 | 		html = XMLHttp.responseText, _this = this;
114 | 		// console.trace(html);
115 | 		try {
116 | 			html = JSON.parse(html).data;
117 | 		} catch (e) {
118 | 			CeL.warn({
119 | 				// gettext_config:{"id":"unable-to-parse-chapter-data-for-«$1»-§$2"}
120 | 				T : [ '無法解析《%1》§%2 之章節資料！', work_data.title, chapter_NO ]
121 | 			});
122 | 			callback();
123 | 			return;
124 | 		}
125 | 		// console.trace(html);
126 | 		Object.assign(chapter_data, html);
127 | 		chapter_data.image_list
128 | 		//
129 | 		= chapter_data.current_chapter.chapter_img_list;
130 | 		// 減少寫入的資料大小。
131 | 		delete chapter_data.current_chapter.chapter_img_list;
132 | 		delete chapter_data.prev_chapter;
133 | 		if (chapter_data.next_chapter) {
134 | 			var next_chapter_data = work_data.chapter_list[chapter_NO - 1];
135 | 			next_chapter_data.chapter_img_list
136 | 			//
137 | 			= chapter_data.next_chapter.chapter_img_list;
138 | 			delete chapter_data.next_chapter;
139 | 		}
140 | 		callback();
141 | 	}
142 | });
143 | 
144 | // ----------------------------------------------------------------------------
145 | 
146 | // CeL.set_debug(3);
147 | 
148 | start_crawler(crawler, typeof module === 'object' && module);
149 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/katui.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 卡推漫画 的工具。 Download katui comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.qTcms2014');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.qTcms2014({
16 | 	// 圖像檔案下載失敗處理方式：忽略/跳過圖像錯誤。當404圖像不存在、檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。default:false
17 | 	skip_error : true,
18 | 
19 | 	// e.g., 蓝翅 http://www.700mh.com/manhua/736/
20 | 	acceptable_types : 'webp',
21 | 
22 | 	// 2018/8/8: http://www.katui.net/
23 | 	// 2019/6: 改 http://www.700mh.com/
24 | 	base_URL : 'http://www.700mh.com/',
25 | 
26 | 	/**
27 | 	 * 處理特殊圖片: 遇到下架章節時圖片會顯示 http://fo.700mh.com/2018/03/14/pb.jpg
28 | 	 */
29 | 	is_limited_image_url : function(image_url) {
30 | 		// 這時 chapter_data.image_count 似乎全部都是 3
31 | 		return image_url.endsWith('2018/03/14/pb.jpg');
32 | 	}
33 | });
34 | 
35 | // ----------------------------------------------------------------------------
36 | 
37 | // CeL.set_debug(3);
38 | 
39 | start_crawler(crawler, typeof module === 'object' && module);
40 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/kuaikan.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載快看漫画的工具。 Download kuaikanmanhua comics.
  3 |  * 
  4 |  * @since 2018/10/20-11/8 改版. 2019/4/7-12 快看漫画改版，重寫程式碼。
  5 |  */
  6 | 
  7 | 'use strict';
  8 | 
  9 | require('../work_crawler_loader.js');
 10 | 
 11 | // ----------------------------------------------------------------------------
 12 | 
 13 | var crawler = new CeL.work_crawler({
 14 | 	// recheck:從頭檢測所有作品之所有章節。
 15 | 	// recheck : true,
 16 | 	// one_by_one : true,
 17 | 	base_URL : 'https://www.kuaikanmanhua.com/',
 18 | 
 19 | 	// 最小容許圖案檔案大小 (bytes)。
 20 | 	// 對於極少出現錯誤的網站，可以設定一個比較小的數值，並且設定.allow_EOI_error=false。因為這類型的網站要不是無法取得檔案，要不就是能夠取得完整的檔案；要取得破損檔案，並且已通過EOI測試的機會比較少。
 21 | 	// 對於有些圖片只有一條細橫桿的情況。
 22 | 	MIN_LENGTH : 150,
 23 | 
 24 | 	// allow .jpg without EOI mark.
 25 | 	// allow_EOI_error : true,
 26 | 	// 當圖像檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。
 27 | 	// skip_error : true,
 28 | 
 29 | 	// 解析 作品名稱 → 作品id get_work()
 30 | 	// 2022/10
 31 | 	search_URL : 'sou/',
 32 | 	parse_search_result : function(html, get_label) {
 33 | 		// html = html.between('<div class="resultList cls">');
 34 | 		// console.log(html);
 35 | 		var id_list = [], id_data = [];
 36 | 		html.each_between('<a href="/web/topic/', '</a>', function(text) {
 37 | 			id_list.push(text.between(null, '"'));
 38 | 			id_data.push(get_label(text.between('title="', '"')));
 39 | 		});
 40 | 		return [ id_list, id_data ];
 41 | 	},
 42 | 
 43 | 	search_URL_2021 : function(work_title, get_label) {
 44 | 		return 'v1/search/topic?q=' + encodeURIComponent(work_title)
 45 | 				+ '&since=0&size=20&f=3';
 46 | 	},
 47 | 	parse_search_result_2021 : function(html, get_label) {
 48 | 		html = JSON.parse(html).data.hit;
 49 | 		return [ html, html ];
 50 | 	},
 51 | 	id_of_search_result_2021 : 'id',
 52 | 	title_of_search_result_2021 : 'title',
 53 | 
 54 | 	// old than search_URL_2021
 55 | 	search_URL_web : 's/result/',
 56 | 	parse_search_result_web : function(html, get_label) {
 57 | 		html = html.between('<div class="resultList cls">',
 58 | 		// <div class="footerBox"><div class="Footer">
 59 | 		'<div class="footerBox">');
 60 | 
 61 | 		var id_list = [], id_data = [];
 62 | 		/**
 63 | 		 * <code>
 64 | 		</p> <div class="resultList cls"><div class="TabW184 fl padding16"><a href="https://www.kuaikanmanhua.com/web/topic/3131" target="_blank" class="link  ">
 65 | 		</code>
 66 | 		 */
 67 | 		html.split('<div class="TabW184').forEach(function(token, index) {
 68 | 			var title = token.between('<span class="itemTitle">', '</span>');
 69 | 			if (!title) {
 70 | 				// Skip the first one.
 71 | 				return;
 72 | 			}
 73 | 			id_data.push(title);
 74 | 			var id = token.match(/<a [\s\S]*?href="[^<>"]+\/(\d+)"/);
 75 | 			id_list.push(id[1]);
 76 | 		});
 77 | 
 78 | 		return [ id_list, id_data ];
 79 | 	},
 80 | 
 81 | 	// 取得作品的章節資料。 get_work_data()
 82 | 	work_URL : function(work_id) {
 83 | 		return 'web/topic/' + work_id;
 84 | 	},
 85 | 	parse_work_data : function(html, get_label, extract_work_data) {
 86 | 		var work_data = {
 87 | 			// 必要屬性：須配合網站平台更改。
 88 | 			title : get_label(html.between('<h3 class="title">', '</h3>')),
 89 | 			author : get_label(html.between('<div class="nickname">',
 90 | 			//
 91 | 			'</div>')),
 92 | 
 93 | 		// 選擇性屬性：須配合網站平台更改。
 94 | 		// 2019/3: 总热度 <span class="hot-num">12.83亿</span>, 2019/4: 人气值
 95 | 		};
 96 | 
 97 | 		// 由 meta data 取得作品資訊。
 98 | 		// extract_work_data(work_data, html);
 99 | 
100 | 		html = eval(html
101 | 		//
102 | 		.between('<script>window.__NUXT__=', ';</script>')).data[0];
103 | 		// console.trace(html);
104 | 		Object.assign(work_data, html.topicInfo);
105 | 		work_data.chapter_list = html.comics
106 | 		// 2022/10/24前 改版
107 | 		// .reverse()
108 | 		//
109 | 		.map(function(chapter_data, index) {
110 | 			chapter_data.url = 'web/comic/' + chapter_data.id;
111 | 			if (chapter_data.locked) {
112 | 				chapter_data.limited = true;
113 | 			}
114 | 			return chapter_data;
115 | 		});
116 | 		// console.log(work_data);
117 | 		return work_data;
118 | 	},
119 | 
120 | 	// 取得每一個章節的各個影像內容資料。 get_chapter_data()
121 | 	parse_chapter_data : function(html, work_data, get_label, chapter_NO) {
122 | 		html = eval(html
123 | 		//
124 | 		.between('<script>window.__NUXT__=', ';</script>')).data[0];
125 | 		// console.trace(html);
126 | 
127 | 		var chapter_data = work_data.chapter_list[chapter_NO - 1];
128 | 
129 | 		chapter_data.image_list = html.comicInfo.comicImages;
130 | 		// delete html.comicInfo.comicImages;
131 | 
132 | 		if (chapter_data.limited) {
133 | 			this.set_start_chapter_NO_next_time(work_data, chapter_NO);
134 | 		}
135 | 
136 | 		// `comicInfo` 的資訊較不精確!
137 | 		// Object.assign(chapter_data, html.comicInfo);
138 | 		// console.log(chapter_data);
139 | 		// console.log(work_data);
140 | 
141 | 		return chapter_data;
142 | 	}
143 | });
144 | 
145 | // ----------------------------------------------------------------------------
146 | 
147 | // CeL.set_debug(3);
148 | 
149 | start_crawler(crawler, typeof module === 'object' && module);
150 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/manhuacat.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 漫画猫 的工具。 Download manhuacat comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.manhuadb');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | CeL.manhuadb({
16 | 
17 | 	// manhuacat.js: 一次下載太多檔案，會造成IP被圖片伺服器封鎖超過1天。
18 | 	// chapter_time_interval : '10s',
19 | 	// 單行本圖片較多且大，因此採用一個圖一個圖取得的方式。
20 | 	// 2021/12/5 2s 太過頻繁會被封鎖。
21 | 	one_by_one : '4s',
22 | 
23 | 	// 2022/3/21 6:37 最後一次成功連接 https://www.manhuacat.com/
24 | 	// 2022/4/24 6:49:8 域名更換 https://www.maofly.com/
25 | 	base_URL : 'https://www.maofly.com/',
26 | 
27 | 	acceptable_types : 'webp|jpg',
28 | 
29 | 	// reget_image_page : true,
30 | 
31 | 	// 解析 作品名稱 → 作品id get_work()
32 | 	search_URL : 'search.html?q=',
33 | 	PATTERN_search
34 | 	//
35 | 	: /<a href="(?:[^"]*?)\/manga\/(\d+)\.html" title="([^<>"]+)"/,
36 | 
37 | 	// 取得作品的章節資料。 get_work_data()
38 | 	work_URL : function(work_id) {
39 | 		return 'manga/' + work_id + '.html';
40 | 	},
41 | 	inverted_order : true,
42 | 
43 | 	decoder_URL :
44 | 	//
45 | 	'https://raw.githubusercontent.com/pieroxy/lz-string/master/libs/'
46 | 			+ 'lz-string.js',
47 | 	decode_chapter_data : function(chapter_data) {
48 | 		// var LZString = require(this.main_directory + 'lz-string.js');
49 | 		return this.LZString.decompressFromBase64(chapter_data).split(',');
50 | 	},
51 | 	// asset_domain=vg_r_data[_0x4cb2('0xc','s$hR')](_0x4cb2('0x4e','I8#P'));
52 | 	// img_pre=_0x4cb2('0x52','yKDU');
53 | 	image_prefix : "https://mao.mhtupian.com/uploads/"
54 | 
55 | }, function(crawler) {
56 | 	start_crawler(crawler, typeof module === 'object' && module);
57 | }, function(crawler) {
58 | 	setup_crawler(crawler, typeof module === 'object' && module);
59 | });
60 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/manhuadb.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 漫画DB 的工具。 Download manhuadb comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.manhuadb');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = new CeL.manhuadb({
16 | 	// 2018/8: http://www.manhuadb.com/
17 | 	// 2020/4/11: https://www.manhuadb.com/
18 | 	base_URL : 'https://www.manhuadb.com/'
19 | 
20 | });
21 | 
22 | // ----------------------------------------------------------------------------
23 | 
24 | start_crawler(crawler, typeof module === 'object' && module);
25 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/manhuagui.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載漫画柜的工具。 Download manhuagui comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.manhuagui');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | // CeL.set_debug(3);
16 | 
17 | // crawler(configuration, callback, initializer)
18 | CeL.manhuagui({
19 | 
20 | }, function(crawler) {
21 | 	start_crawler(crawler, typeof module === 'object' && module);
22 | }, function(crawler) {
23 | 	setup_crawler(crawler, typeof module === 'object' && module);
24 | });
25 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/manhuaniu.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 漫画牛 的工具。 Download manhuaniu comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.SinMH');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.SinMH({
16 | 	// recheck:從頭檢測所有作品之所有章節與所有圖片。不會重新擷取圖片。對漫畫應該僅在偶爾需要從頭檢查時開啟此選項。
17 | 	// 有些漫畫作品分區分單行本、章節與外傳，當章節數量改變、添加新章節時就需要重新檢查。
18 | 	// recheck : 'changed',
19 | 
20 | 	// 2019/5/9: https://www.manhuaniu.com/
21 | 	// 2022/11/3前: https://www.manhuatian.com/
22 | 	base_URL : 'https://www.manhuatian.com/'
23 | });
24 | 
25 | // ----------------------------------------------------------------------------
26 | 
27 | // CeL.set_debug(3);
28 | 
29 | start_crawler(crawler, typeof module === 'object' && module);
30 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/mh1234.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 漫画1234 的工具。 Download mh1234 comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.SinMH');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | // https://stackoverflow.com/questions/20082893/unable-to-verify-leaf-signature
16 | // for Error: unable to verify the first certificate
17 | // code: 'UNABLE_TO_VERIFY_LEAF_SIGNATURE'
18 | process.env['NODE_TLS_REJECT_UNAUTHORIZED'] = '0';
19 | 
20 | var crawler = CeL.SinMH({
21 | 	// 循序逐個、一個個下載圖像。僅對漫畫有用，對小說無用。小說章節皆為逐個下載。 Download images one by one.
22 | 	// one_by_one : true,
23 | 
24 | 	// e.g., mh1234\8504 龙飞不败\0011 第11卷\8504-11-001 bad.jpg
25 | 	skip_error : true,
26 | 
27 | 	// 似乎無此API
28 | 	try_to_get_blocked_work : false,
29 | 
30 | 	// https://www.mh1234.com/assets/d74ff3d8/js/theme.js
31 | 	// Created by Shen.L on 2016/1/28.
32 | 	// SinMH.initChapter, SinTheme.initChapter, SinConf.resHost
33 | 	// 2023/6/25 前自 https://www.mh1234.com/ 改成 https://www.ymh1234.com/
34 | 	base_URL : 'https://www.ymh1234.com/',
35 | 
36 | 	work_URL : function(work_id) {
37 | 		return 'comic/' + work_id + '.html';
38 | 	},
39 | 
40 | 	// modify from 733mh.js: for https://www.mh1234.com/
41 | 	get_chapter_list : function(work_data, html, get_label) {
42 | 		var latest_chapter_list = work_data.chapter_list;
43 | 
44 | 		var text = html.between('<div class="w980_b1px mt10 clearfix">',
45 | 				'<div class="introduction" id="intro1">').between('<ul',
46 | 				'</ul>');
47 | 		// console.log(text);
48 | 
49 | 		/**
50 | 		 * e.g., <code>
51 | 
52 | 		// 733mh.js
53 | 		<li><a href="/mh/27576/359123.html" title="179：失踪">179：失踪</a></li>
54 | 
55 | 		// mh1234.js
56 | 		<li>
57 | 		<a  href="/comic/12549/554098.html">第1话：周家圣龙（上）<i></i></a>
58 | 		</li>
59 | 
60 | 		</code>
61 | 		 */
62 | 		work_data.chapter_list = [];
63 | 		work_data.inverted_order = false;
64 | 		var matched, PATTERN_chapter =
65 | 		// [ , chapter_url, chapter_title ]
66 | 		/<a\s+href="(\/comic\/[^<>"]+)">([\s\S]+?)<\/a>/g;
67 | 		while (matched = PATTERN_chapter.exec(text)) {
68 | 			work_data.chapter_list.push({
69 | 				url : matched[1],
70 | 				title : get_label(matched[2])
71 | 			});
72 | 		}
73 | 		// console.log(work_data);
74 | 
75 | 		this.check_filtered(work_data, html, get_label,
76 | 		//
77 | 		latest_chapter_list);
78 | 	}
79 | });
80 | 
81 | // ----------------------------------------------------------------------------
82 | 
83 | // CeL.set_debug(3);
84 | 
85 | start_crawler(crawler, typeof module === 'object' && module);
86 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/mymhh.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 梦游漫画 的工具。 Download mymhh comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.dm5');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.dm5({
16 | 	// 本網站偶爾有圖片不存在的現象。
17 | 	skip_error : true,
18 | 	MIN_LENGTH : 400,
19 | 
20 | 	// 2020/1: https://mymhh.com/
21 | 	// 2020/2: https://www.mumumh.com/
22 | 	// 2020/3/26: Also https://www.mymhh.com/
23 | 	// 2022/11/4前: 404 https://www.mymhh.com/
24 | 	base_URL : 'https://www.17te.com/',
25 | 	// 2020/1: 僅能以手機觀看。
26 | 	user_agent : 'Mozilla/5.0 (iPad; CPU OS 11_0 like Mac OS X)'
27 | 			+ ' AppleWebKit/604.1.34 (KHTML, like Gecko)'
28 | 			+ ' Version/11.0 Mobile/15A5341f Safari/604.1',
29 | 
30 | 	// 解析 作品名稱 → 作品id get_work()
31 | 	// <a id="btnSearch">搜索</a>
32 | 	search_URL : 'search?keyword=',
33 | 
34 | 	work_URL : 'book/',
35 | 
36 | 	inverted_order : false,
37 | 
38 | 	pre_parse_chapter_data : null
39 | });
40 | 
41 | // ----------------------------------------------------------------------------
42 | 
43 | // CeL.set_debug(3);
44 | 
45 | start_crawler(crawler, typeof module === 'object' && module);
46 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/pufei.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 扑飞漫画 的工具。 Download pufei comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.qTcms2014');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.qTcms2014({
16 | 	// 圖像檔案下載失敗處理方式：忽略/跳過圖像錯誤。當404圖像不存在、檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。default:false
17 | 	skip_error : true,
18 | 
19 | 	// 出錯：連線中斷
20 | 	one_by_one : true,
21 | 
22 | 	// old: http://www.pufei.net/
23 | 	// 2020/2/17 http://www.pufei8.com/
24 | 	// 2022/6/25前 http://www.pufei.cc/
25 | 	// 2022/11/6前 https://www.ythuiju.com/
26 | 	base_URL : 'https://www.ythuiju.com/',
27 | 
28 | 	postfix_image_url : function(url) {
29 | 		// http://www.pufei8.com/manhua/32508/index.html
30 | 		if (/^https?:\/\//.test(url))
31 | 			return url;
32 | 
33 | 		// old: @see function loadview() @ /skin/2014mh/view.js
34 | 		// return 'http://res.img.pufei.net/' + url;
35 | 
36 | 		// 2020/2/17 @see imgserver @ function loadview() @
37 | 		// http://www.pufei.net/skin/2014mh/view.js
38 | 		// 2020/2/17 http://res.img.fffimage.com/
39 | 		// 2020-2022? http://res.img.220012.net/
40 | 		// 2022/6/25前 http://res.img.tueqi.com/
41 | 		return 'http://res.img.tueqi.com/' + url;
42 | 	}
43 | });
44 | 
45 | // ----------------------------------------------------------------------------
46 | 
47 | // CeL.set_debug(3);
48 | 
49 | start_crawler(crawler, typeof module === 'object' && module);
50 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/qq.bat:
--------------------------------------------------------------------------------
1 | @echo off
2 | REM chcp 65001
3 | chcp 932
4 | REM cd/d D:\USB\cgi-bin\program\comic
5 | node "%~n0.js" "l=%~n0.txt" || PAUSE
6 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/taduo.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 塔多漫画网 的工具。 Download taduo comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.qTcms2014');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.qTcms2014({
16 | 	base_URL : 'http://www.taduo.net/',
17 | 
18 | 	/**
19 | 	 * 處理特殊圖片: 遇到下架章節時圖片會顯示 http://mh.lianzhixiu.com/2018/03/14/pb.jpg
20 | 	 * 
21 | 	 * <code>
22 | 	  <div id="section">
23 | 	  <div class="wp">  <div class="mh_tsw2"><div class="mh_ts2" style="color:#f40;font-size: 15px;">  <b>蓝翅漫画</b>中因为版权或其他问题，我们将对所有章节进行屏蔽！</div>    </div></div>
24 | 	  </div>
25 | 	</code>
26 | 	 */
27 | 	is_limited_image_url : function(image_url) {
28 | 		// 這時 chapter_data.image_count 似乎全部都是 3
29 | 		return image_url.endsWith('2018/03/14/pb.jpg');
30 | 	}
31 | });
32 | 
33 | // ----------------------------------------------------------------------------
34 | 
35 | // CeL.set_debug(3);
36 | 
37 | start_crawler(crawler, typeof module === 'object' && module);
38 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/toomics_sc.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 Toomics 玩漫 漫画 的工具。 Download toomics comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.toomics');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.toomics({
16 | 	LANG_PREFIX : 'sc'
17 | });
18 | 
19 | // ----------------------------------------------------------------------------
20 | 
21 | // CeL.set_debug(3);
22 | 
23 | start_crawler(crawler, typeof module === 'object' && module);
24 | 


--------------------------------------------------------------------------------
/comic.cmn-Hans-CN/weibo.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載 漫画-微博动漫- 的工具。 Download weibo comics.
  3 |  */
  4 | 
  5 | 'use strict';
  6 | 
  7 | require('../work_crawler_loader.js');
  8 | 
  9 | // ----------------------------------------------------------------------------
 10 | 
 11 | var crawler = new CeL.work_crawler({
 12 | 	// recheck:從頭檢測所有作品之所有章節。
 13 | 	// recheck : true,
 14 | 	// one_by_one : true,
 15 | 	base_URL : 'http://manhua.weibo.com/',
 16 | 	API_URL : 'http://apiwap.vcomic.com/wbcomic/',
 17 | 
 18 | 	// 最小容許圖案檔案大小 (bytes)。
 19 | 	// 對於極少出現錯誤的網站，可以設定一個比較小的數值，並且設定.allow_EOI_error=false。因為這類型的網站要不是無法取得檔案，要不就是能夠取得完整的檔案；要取得破損檔案，並且已通過EOI測試的機會比較少。
 20 | 	// 對於有些圖片只有一條細橫桿的情況。
 21 | 	// MIN_LENGTH : 150,
 22 | 
 23 | 	// allow .jpg without EOI mark.
 24 | 	// allow_EOI_error : true,
 25 | 	// 當圖像檔案過小，或是被偵測出非圖像(如不具有EOI)時，依舊強制儲存檔案。
 26 | 	skip_error : true,
 27 | 
 28 | 	// 解析 作品名稱 → 作品id get_work()
 29 | 	search_URL : function(work_title, get_label) {
 30 | 		return this.API_URL + 'home/search?page_num=1&rows_num=16&word='
 31 | 				+ encodeURIComponent(work_title) + '&_request_from=pc';
 32 | 	},
 33 | 	parse_search_result : function(html, get_label) {
 34 | 		// console.log(html);
 35 | 		html = JSON.parse(html.trim()).data.data;
 36 | 		return [ html, html ];
 37 | 	},
 38 | 	id_of_search_result : 'comic_id',
 39 | 	title_of_search_result : 'name',
 40 | 
 41 | 	// 取得作品的章節資料。 get_work_data()
 42 | 	work_URL : function(work_id) {
 43 | 		return this.API_URL + 'comic/comic_show?comic_id=' + work_id
 44 | 				+ '&_request_from=pc';
 45 | 	},
 46 | 	parse_work_data : function(html, get_label, extract_work_data) {
 47 | 		// .trim(): 去除不可見的空白字元。
 48 | 		var work_data = JSON.parse(html.trim()).data;
 49 | 		// console.log(work_data);
 50 | 		Object.assign(work_data, {
 51 | 			// 必要屬性：須配合網站平台更改。
 52 | 			title : work_data.comic.name,
 53 | 			// or use {Array}work_data.new_author
 54 | 			author : work_data.comic.sina_nickname,
 55 | 			status : work_data.comic.is_end
 56 | 			//
 57 | 			&& work_data.comic.is_end !== "0" ? '连载中' : '已完结',
 58 | 			some_limited : work_data.comic.chapter_default_price > 0
 59 | 		// 選擇性屬性：須配合網站平台更改。
 60 | 		});
 61 | 
 62 | 		return work_data;
 63 | 	},
 64 | 	get_chapter_list : function(work_data, html, get_label) {
 65 | 		// console.log(work_data.chapter_list);
 66 | 		// console.log(JSON.stringify(work_data.chapter_list));
 67 | 		var free_chapter_hash = work_data.is_allow_read.comic.try_read_chapters
 68 | 				.to_hash();
 69 | 		// console.log(free_chapter_hash);
 70 | 		work_data.chapter_list.forEach(function(chapter_data) {
 71 | 			Object.assign(chapter_data, {
 72 | 				limited : !(chapter_data.chapter_id in free_chapter_hash),
 73 | 				title : chapter_data.chapter_name,
 74 | 				url : this.API_URL + 'comic/comic_play?chapter_id='
 75 | 						+ chapter_data.chapter_id + '&_request_from=pc'
 76 | 			});
 77 | 		}, this);
 78 | 	},
 79 | 
 80 | 	// 取得每一個章節的各個影像內容資料。 get_chapter_data()
 81 | 	parse_chapter_data : function(html, work_data, get_label, chapter_NO) {
 82 | 		// console.log(html);
 83 | 		var chapter_data = JSON.parse(html.trim()).data, site_ver = 'site_ver='
 84 | 				+ chapter_data.site_ver;
 85 | 
 86 | 		// console.log(chapter_data);
 87 | 		if (!chapter_data.json_content.page
 88 | 		// 本章为付费章节
 89 | 		&& !chapter_data.is_allow_read.is_chapter_read) {
 90 | 			chapter_data.limited = true;
 91 | 			return;
 92 | 		}
 93 | 
 94 | 		if (Array.isArray(chapter_data.json_content)
 95 | 		// 本章为抢先看章节: "json_content":[]
 96 | 		&& chapter_data.json_content.length === 0) {
 97 | 			var time = chapter_data.chapter.charge_end_time * 1000;
 98 | 			if (time > Date.now()) {
 99 | 				CeL.info([ this.id + ':', {
100 | 					// gettext_config:{"id":"§$1-«$2»-must-wait-until-$3-to-read.-skipping-the-remaining-chapters"}
101 | 					T : [ '§%1《%2》之後必須等到 %3 才能閱讀。跳過餘下的章節。',
102 | 					//
103 | 					chapter_NO + '/' + work_data.chapter_count,
104 | 					//
105 | 					chapter_data.chapter.chapter_name,
106 | 					//
107 | 					(new Date(time)).format('%Y/%m/%d %H:%M') ]
108 | 				} ]);
109 | 				work_data.chapter_count = chapter_NO - 1;
110 | 				return;
111 | 			}
112 | 		}
113 | 
114 | 		if (chapter_data.json_content.page.length === 1
115 | 		//
116 | 		&& !chapter_data.json_content.page[0].newImgUrl
117 | 		//
118 | 		&& chapter_data.json_content.page[0].mobileImgUrl) {
119 | 			CeL.warn([ this.id + ':', {
120 | 				// gettext_config:{"id":"«$1»-is-a-paid-member-only-work-you-must-purchase-before-reading"}
121 | 				T : [ '《%1》是付費會員專享作品，您必須購買後才能閱讀！', work_data.title ]
122 | 			} ]);
123 | 			return;
124 | 		}
125 | 
126 | 		// chapter_data.image_count = chapter_data.json_content.header.pageNum;
127 | 		(chapter_data.image_list = chapter_data.json_content.page)
128 | 		// @see .formatImgSrc @
129 | 		// http://img.manhua.weibo.com/static/c/dist/static/js/play.js?version=11.19
130 | 		.forEach(function(image_data) {
131 | 			var url = image_data.newImgUrl;
132 | 			if (url.includes('?')) {
133 | 				if (/([&?])site_ver=/.test(url))
134 | 					url = url.replace(/([&?])site_ver=[^&]*/, '$1' + site_ver);
135 | 				else
136 | 					url += '&' + site_ver;
137 | 			} else {
138 | 				url += '?' + site_ver;
139 | 			}
140 | 			image_data.url = url;
141 | 		});
142 | 
143 | 		return chapter_data;
144 | 	}
145 | });
146 | 
147 | // ----------------------------------------------------------------------------
148 | 
149 | // CeL.set_debug(3);
150 | 
151 | start_crawler(crawler, typeof module === 'object' && module);
152 | 


--------------------------------------------------------------------------------
/comic.cmn-Hant-TW/18comic.chapter.html:
--------------------------------------------------------------------------------
 1 | ﻿<html>
 2 | <head>
 3 | <meta http-equiv="content-type" content="text/html;charset=utf-8" />
 4 | <script type="text/javascript" charset="utf-8" src="chapter_data.js"></script>
 5 | </head>
 6 | <body>
 7 | <script type="text/javascript">
 8 | 
 9 | document.title = chapter_data.title;
10 | 
11 | function show_image(image, canvas) {
12 | 	const width = canvas.width = image.width;
13 | 	const height = canvas.height = image.height;
14 | 	canvas.style.display = 'block';
15 | 	const ctx = canvas.getContext('2d');
16 | 
17 | 	const slice_count = 10;
18 | 	const remainder = height % slice_count;
19 | 	for (let index = 0, cut_to_y = height, slice_height = Math.floor(height / slice_count); index < slice_count; index++) {
20 | 		const copy_from_y = index * slice_height;
21 | 		if (index === slice_count - 1) {
22 | 			cut_to_y = 0;
23 | 			slice_height += remainder;
24 | 		} else
25 | 			cut_to_y -= slice_height;
26 | 		ctx.drawImage(image,
27 | 			0, copy_from_y, width, slice_height,
28 | 			0, cut_to_y, width, slice_height);
29 | 	}
30 | 	// free
31 | 	image.onload = image.src = null;
32 | }
33 | 
34 | for (let index = 0; index < chapter_data.image_list.length;) {
35 | 	const canvas = document.createElement('canvas');
36 | 	document.body.appendChild(canvas);
37 | 
38 | 	const image = document.createElement('img');
39 | 	image.onload = show_image.bind(null, image, canvas);
40 | 	image.src = chapter_data.image_file_prefix + String(++index).padStart(3, 0) + chapter_data.image_file_postfix;
41 | }
42 | 
43 | </script>
44 | 
45 | </body>
46 | </html>


--------------------------------------------------------------------------------
/comic.cmn-Hant-TW/18comic.work.html:
--------------------------------------------------------------------------------
  1 | ﻿<html>
  2 | <head>
  3 | <meta http-equiv="content-type" content="text/html;charset=utf-8" />
  4 | <script type="text/javascript" charset="utf-8" src="work_data.js"></script>
  5 | <style>
  6 | #chapter_selector_header {
  7 | 	/* width: 20em; */
  8 | 	text-align: right;
  9 | 	cursor: pointer;
 10 | 	background: #afa;
 11 | }
 12 | 
 13 | #chapter_selector_panel {
 14 | 	max-height: 800px;
 15 | 	overflow: auto;
 16 | }
 17 | 
 18 | .chapter_selector {
 19 | 	cursor: pointer;
 20 | 	background: #ddf;
 21 | 	padding: 1pt .5em;
 22 | }
 23 | .chapter_selector:hover {
 24 | 	background: #aaf;
 25 | }
 26 | </style>
 27 | </head>
 28 | 
 29 | <body>
 30 | 
 31 | <div style="float:right; width: 20em;">
 32 | 	<div style="position: fixed; top: 0;">
 33 | 		<div id="chapter_selector_header">Select chapters</div>
 34 | 		<div id="chapter_selector_panel"></div>
 35 | 	</div>
 36 | </div>
 37 | 
 38 | <h2 id="title_panel"></h2>
 39 | <div id="image_panel"></div>
 40 | 
 41 | <div id="usage_panel">
 42 | 本頁面僅能用於新版瀏覽器。且您必須先解開所有壓縮檔才能以本頁面瀏覽圖片！<br />
 43 | 可使用左右方向鍵以控制前後章節。<br />
 44 | 下載時採用 <code>archive_images=false</code> 將不會壓縮檔案。
 45 | </div>
 46 | 
 47 | <script type="text/javascript">
 48 | 
 49 | function set_title(chapter_data) {
 50 | 	const chapter_title = (chapter_data ? chapter_data.title + ' - ' : '') + work_data.title;
 51 | 	document.title = chapter_title;
 52 | 	document.getElementById("title_panel").innerText = chapter_title;
 53 | }
 54 | set_title();
 55 | 
 56 | function show_image(image, canvas) {
 57 | 	const width = canvas.width = image.width;
 58 | 	const height = canvas.height = image.height;
 59 | 	canvas.style.display = 'block';
 60 | 	const ctx = canvas.getContext('2d');
 61 | 
 62 | 	const slice_count = 10;
 63 | 	const remainder = height % slice_count;
 64 | 	for (let index = 0, cut_to_y = height, slice_height = Math.floor(height / slice_count); index < slice_count; index++) {
 65 | 		const copy_from_y = index * slice_height;
 66 | 		if (index === slice_count - 1) {
 67 | 			cut_to_y = 0;
 68 | 			slice_height += remainder;
 69 | 		} else
 70 | 			cut_to_y -= slice_height;
 71 | 		ctx.drawImage(image,
 72 | 			0, copy_from_y, width, slice_height,
 73 | 			0, cut_to_y, width, slice_height);
 74 | 	}
 75 | 	// free
 76 | 	image.onload = image.src = null;
 77 | 	// hidden chapter_selector_panel
 78 | 	trigger_chapter_selector_panel('none');
 79 | 	location.hash = '';
 80 | 	location.hash = 'title_panel';
 81 | }
 82 | 
 83 | 
 84 | let chapter_index_now;
 85 | function load_chapter(chapter_index) {
 86 | 	// reset
 87 | 	image_panel.innerHTML = '';
 88 | 
 89 | 	chapter_index_now = chapter_index;
 90 | 	const chapter_data = work_data.chapter_list[chapter_index];
 91 | 	//console.log(chapter_data);
 92 | 	set_title(chapter_data);
 93 | 	//const chapter_NO = chapter_index + 1;
 94 | 	//const chapter_directory = String(chapter_NO).padStart(4, 0) + ' ' + chapter_data.title + '/';
 95 | 	for (let index = 0; index < chapter_data.image_list.length; index++) {
 96 | 		const image = document.createElement('img');
 97 | 		const chapter_id = chapter_data.url.match(/\d+$/)[0];
 98 | 		if (chapter_id >= 220980) {
 99 | 			const canvas = document.createElement('canvas');
100 | 			image_panel.appendChild(canvas);
101 | 			image.onload = show_image.bind(null, image, canvas);
102 | 		} else {
103 | 			trigger_chapter_selector_panel('none');
104 | 			image.style.display = 'block';
105 | 			image_panel.appendChild(image);
106 | 		}
107 | 		if (false) {
108 | 			const file_name =
109 | 				//work_data.id+'-' +chapter_NO+'-' + String(++index).padStart(3, 0) + chapter_data.image_list[index].url.match(/(\.[a-z]+)(?:\?[^?]*)$/)[1]
110 | 				chapter_data.image_list[index].file.match(/[^\\\/]+$/)[0];
111 | 			image.src = chapter_directory + file_name;
112 | 		}
113 | 		image.src = chapter_data.image_list[index].file.match(/[^\\\/]+[\\\/][^\\\/]+$/)[0].replace(/\\/g, '/');
114 | 	}
115 | }
116 | 
117 | work_data.chapter_list.forEach((chapter_data, chapter_index) => {
118 | 	const div = document.createElement('div');
119 | 	div.innerText = chapter_data.title;
120 | 	div.onclick = load_chapter.bind(null, chapter_index);
121 | 	div.className = 'chapter_selector';
122 | 	document.getElementById("chapter_selector_panel").appendChild(div);
123 | });
124 | 
125 | 
126 | function trigger_chapter_selector_panel(display) {
127 | 	const chapter_selector_panel = document.getElementById("chapter_selector_panel");
128 | 	if (typeof display !== 'string')
129 | 		display = chapter_selector_panel.style.display === 'none' ? 'block' : 'none';
130 | 	if (chapter_selector_panel.style.display !== display)
131 | 		chapter_selector_panel.style.display = display;
132 | }
133 | document.getElementById("chapter_selector_header").onclick = trigger_chapter_selector_panel;
134 | 
135 | 
136 | document.addEventListener('keydown', event => {
137 | 	// console.log(event);
138 | 	if (!event.altKey && !event.ctrlKey && !event.altKey && !event.shiftKey) {
139 | 		switch (event.key) {
140 | 		case "ArrowLeft":
141 | 			load_chapter(chapter_index_now > 0 ? chapter_index_now - 1 : work_data.chapter_list.length - 1);
142 | 			break;
143 | 
144 | 		case "ArrowRight":
145 | 			load_chapter(chapter_index_now + 1 < work_data.chapter_list.length ? chapter_index_now + 1 : 0);
146 | 			break;
147 | 		}
148 | 	}
149 | });
150 | 
151 | </script>
152 | 
153 | </body>
154 | </html>


--------------------------------------------------------------------------------
/comic.cmn-Hant-TW/baozimh.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載包子漫畫的工具。 Download baozimh comics.
 3 |  * 
 4 |  * @since 2022/11/3 5:55:24
 5 |  */
 6 | 
 7 | 'use strict';
 8 | 
 9 | require('../work_crawler_loader.js');
10 | 
11 | // ----------------------------------------------------------------------------
12 | 
13 | CeL.run('application.net.work_crawler.sites.baozimh');
14 | 
15 | // ----------------------------------------------------------------------------
16 | 
17 | var crawler = new CeL.baozimh({
18 | 	base_URL : 'https://www.baozimh.com/'
19 | });
20 | 
21 | // ----------------------------------------------------------------------------
22 | 
23 | // CeL.set_debug(3);
24 | 
25 | start_crawler(crawler, typeof module === 'object' && module);
26 | 


--------------------------------------------------------------------------------
/comic.cmn-Hant-TW/manhuagui_tw.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載漫畫櫃繁體的工具。 Download manhuagui comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.manhuagui');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | // CeL.set_debug(3);
16 | 
17 | // crawler(configuration, callback, initializer)
18 | CeL.manhuagui({
19 | 
20 | 	base_URL : 'https://tw.manhuagui.com/',
21 | 	script_base_URL : 'https://cf.hamreus.com/scripts_tw/'
22 | 
23 | }, function(crawler) {
24 | 	start_crawler(crawler, typeof module === 'object' && module);
25 | }, function(crawler) {
26 | 	setup_crawler(crawler, typeof module === 'object' && module);
27 | });
28 | 


--------------------------------------------------------------------------------
/comic.cmn-Hant-TW/toomics_tc.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 Toomics 玩漫 - 免費網路漫畫 的工具。 Download toomics comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.toomics');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.toomics({
16 | 	LANG_PREFIX : 'tc'
17 | });
18 | 
19 | // ----------------------------------------------------------------------------
20 | 
21 | // CeL.set_debug(3);
22 | 
23 | start_crawler(crawler, typeof module === 'object' && module);
24 | 


--------------------------------------------------------------------------------
/comic.cmn-Hant-TW/webtoon.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 WEBTOON 中文官網 韓國漫畫 的工具。 Download NAVER WEBTOON comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.webtoon');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.webtoon({
16 | 	// https://www.webtoons.com/zh-hant/
17 | 	language_code : 'zh-hant',
18 | 
19 | 	// 規範 work id 的正規模式；提取出引數中的作品id 以回傳。
20 | 	extract_work_id : function(work_information) {
21 | 		if (CeL.is_digits(work_information)
22 | 		// e.g., webtoon 投稿新星專區 id 下載: "challenge_00000"
23 | 		|| /^([a-z]+)_(\d+)$/.test(work_information))
24 | 			return work_information;
25 | 	},
26 | 
27 | 	// 2018/10: 投稿新星專區 用預設方法(callback var API)搜尋不到，得要用網頁的方法。
28 | 	search_URL : 'zh-hant/search?keyword=',
29 | 	parse_search_result : function(html, get_label) {
30 | 		// console.log(html);
31 | 		// <h3 class="search_result">投稿新星專區作品 (1個結果)</h3>
32 | 		html = html.between('"search_result"',
33 | 		// <div class="ranking_lst search">
34 | 		'"ranking_lst search"');
35 | 
36 | 		var id_list = [], id_data = [];
37 | 		html.each_between('<li>', '</li>', function(token) {
38 | 			// console.log(token);
39 | 			var matched = token
40 | 			// e.g., <a href="/challenge/episodeList?titleNo=211344"
41 | 			.match(/(?:\/([a-z]+)\/)?episodeList\?titleNo=(\d+)/);
42 | 			id_list.push(matched[1] ? matched[1] + '_' + matched[2]
43 | 					: +matched[2]);
44 | 			id_data.push(get_label(token.between('<p class="subj">', '</p>')));
45 | 		});
46 | 
47 | 		return [ id_list, id_data ];
48 | 	}
49 | });
50 | 
51 | // ----------------------------------------------------------------------------
52 | 
53 | // CeL.set_debug(3);
54 | 
55 | start_crawler(crawler, typeof module === 'object' && module);
56 | 


--------------------------------------------------------------------------------
/comic.en-US/bookcube.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 e북포털 북큐브 漫畫 的工具。 Download bookcube comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.sequential');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.sequential({
16 | 	// 設定預設可容許的最小圖像大小。
17 | 	MIN_LENGTH : 6000,
18 | 
19 | 	base_URL : 'https://toon.bookcube.com/',
20 | 
21 | 	// 取得作品的章節資料。 get_work_data()
22 | 	work_URL : function(work_id) {
23 | 		// 必須是圖片網址的起始部分。
24 | 		// e.g.,
25 | 		// https://toon.bookcube.com/toon/viewer/image.asp?webtoon_num=150087
26 | 		return 'toon/viewer/image.asp?webtoon_num=' + work_id;
27 | 	},
28 | 
29 | 	// 依照給定序列取得圖片網址。
30 | 	get_image_url : function(work_data, chapter_NO, image_index) {
31 | 		// e.g.,
32 | 		// https://toon.bookcube.com/toon/viewer/image.asp?webtoon_num=150087&split_num=001&file_idx=1
33 | 		return this.work_URL(work_data.id) + '&split_num=' + chapter_NO.pad(3)
34 | 				+ '&file_idx=' + (image_index + 1);
35 | 	}
36 | });
37 | 
38 | // ----------------------------------------------------------------------------
39 | 
40 | // CeL.set_debug(3);
41 | 
42 | start_crawler(crawler, typeof module === 'object' && module);
43 | 


--------------------------------------------------------------------------------
/comic.en-US/mrblue.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 미스터블루 (Mr.Blue) 漫畫 的工具。 Download mrblue comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.sequential');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.sequential({
16 | 	// http://www.mrblue.com/webtoon/all
17 | 	base_URL : 'http://comics.mrblue.com/',
18 | 
19 | 	// 規範 work id 的正規模式；提取出引數中的作品id 以回傳。
20 | 	extract_work_id : function(work_information) {
21 | 		// e.g., "wt_HQ0005"
22 | 		if (/^[a-z_\-\d]+$/i.test(work_information))
23 | 			return work_information;
24 | 	},
25 | 
26 | 	// 取得作品的章節資料。 get_work_data()
27 | 	work_URL : function(work_id) {
28 | 		// 必須是圖片網址的起始部分。
29 | 		return 'MrBlueComicsData_04/webtoon/' + work_id + '/';
30 | 	},
31 | 
32 | 	// 依照給定序列取得圖片網址。
33 | 	get_image_url : function(work_data, chapter_NO, image_index) {
34 | 		return this.work_URL(work_data.id) + chapter_NO + '/'
35 | 				+ (image_index + 1).pad(3) + '.jpg';
36 | 	}
37 | });
38 | 
39 | // ----------------------------------------------------------------------------
40 | 
41 | // CeL.set_debug(3);
42 | 
43 | start_crawler(crawler, typeof module === 'object' && module);
44 | 


--------------------------------------------------------------------------------
/comic.en-US/toomics_en.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 Toomics - Free comics 的工具。 Download toomics comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.toomics');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.toomics({
16 | 	LANG_PREFIX : 'en'
17 | });
18 | 
19 | // ----------------------------------------------------------------------------
20 | 
21 | // CeL.set_debug(3);
22 | 
23 | start_crawler(crawler, typeof module === 'object' && module);
24 | 


--------------------------------------------------------------------------------
/comic.en-US/webtoon_en.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 LINE WEBTOON 漫畫 的工具。 Download NAVER WEBTOON comics.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.webtoon');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.webtoon({
16 | 	language_code : 'en'
17 | });
18 | 
19 | // ----------------------------------------------------------------------------
20 | 
21 | // CeL.set_debug(3);
22 | 
23 | start_crawler(crawler, typeof module === 'object' && module);
24 | 


--------------------------------------------------------------------------------
/comic.ja-JP/AlphaPolis_official_manga.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載アルファポリス - 電網浮遊都市 - 公式漫画的工具。 Download AlphaPolis official manga.
  3 |  */
  4 | 
  5 | 'use strict';
  6 | 
  7 | require('../work_crawler_loader.js');
  8 | 
  9 | // ----------------------------------------------------------------------------
 10 | 
 11 | CeL.run('application.net.work_crawler.sites.AlphaPolis');
 12 | 
 13 | // ----------------------------------------------------------------------------
 14 | 
 15 | var crawler = CeL.AlphaPolis({
 16 | 	// 當網站不允許太過頻繁的訪問/access時，可以設定下載之前的等待時間(ms)。
 17 | 	// 模仿實際人工請求。
 18 | 	// chapter_time_interval : '5s',
 19 | 
 20 | 	work_type : 'manga/official',
 21 | 
 22 | 	// 取得作品的章節資料。 get_work_data()
 23 | 	parse_work_data : function(html, get_label, extract_work_data) {
 24 | 		// console.log(html);
 25 | 		var work_data = {
 26 | 			// 必要屬性：須配合網站平台更改。
 27 | 			title : get_label(html.between(
 28 | 			// 2019/1/21 アルファポリス 公式漫画 改版
 29 | 			'<div class="manga-detail-description', '</div>')
 30 | 			// <div class="manga-detail-description section"> <div
 31 | 			// class="title"> <h1>title</h1> </div>
 32 | 			.between('<h1>', '</h1>')),
 33 | 
 34 | 			// 選擇性屬性：須配合網站平台更改。
 35 | 			// e.g., 连载中, 連載中
 36 | 			// <div class="wrap-content-status">
 37 | 			status : html.between('<div class="status">', '</div>').split(
 38 | 			// 2022/7: </a>
 39 | 			'</span>' && '</a>').map(get_label),
 40 | 			author : get_label(html.between('<div class="author-label">',
 41 | 					'</a>')),
 42 | 			last_update : get_label(html.between('<div class="up-time">',
 43 | 					'</div>')),
 44 | 			next_update : get_label(html
 45 | 			// <span class="next-up-time">
 46 | 			.between(' class="next-up-time">', '<')),
 47 | 			description : get_label(html.between('<div class="outline">',
 48 | 					'</div>')),
 49 | 			// site_name : 'アルファポリス'
 50 | 			language : 'ja-JP'
 51 | 
 52 | 		};
 53 | 
 54 | 		// console.log(html);
 55 | 		extract_work_data(work_data, html);
 56 | 
 57 | 		work_data.status = work_data.status.concat(
 58 | 				html.between(' class="manga-detail-tags', '</div>')
 59 | 						.between('>').split('</a>').map(get_label))
 60 | 		//
 61 | 		.filter(function(tag) {
 62 | 			return !!tag;
 63 | 		});
 64 | 
 65 | 		// console.log(work_data);
 66 | 		return work_data;
 67 | 	},
 68 | 	get_chapter_list : function(work_data, html) {
 69 | 		work_data.chapter_list = [];
 70 | 		// 2020/7/17: <a data-order="34" class="episode RentalContent"
 71 | 		// <a data-order="35" class="episode "
 72 | 		// 2022/7/2: <div class="episode-list"
 73 | 		html = html.between('class="episode-list', '<div class="scroll')
 74 | 		// <div class="scroll scroll-up" id="ScrollUp"><img
 75 | 		// src="/img/official_manga/under_arrow.svg?1543454323"
 76 | 		// alt="最上部へ"/></div>
 77 | 		.between('>');
 78 | 
 79 | 		// 2020/7/17: <div data-order="0000" class="episode-unit">...</div>
 80 | 		// 2022/7/2: <div class="episode-unit" data-order="6067">
 81 | 		html.each_between(' class="episode-unit"', null, function(text) {
 82 | 			// console.log(JSON.stringify(text));
 83 | 			var chapter_data = {
 84 | 				// <div class="title">第1回</div>
 85 | 				title : text.between(' class="title">', '</').trim(),
 86 | 				url : '/manga/official/'
 87 | 				// <a
 88 | 				// href="https://www.alphapolis.co.jp/manga/official/995000294/5863"
 89 | 				+ text.between('/manga/official/', '"'),
 90 | 				date : text.between('<div class="up-time">', '</div>')
 91 | 				//
 92 | 				.replace('更新', ''),
 93 | 				// <span class="likes-count">1,690</span>
 94 | 				likes : text.between(' class="likes-count">', '</'),
 95 | 				// <span class="comments-count">4</span>
 96 | 				comments : text.between(' class="comments-count">', '</'),
 97 | 				// <div class="rental-coin">70AC</div>
 98 | 				limited : text.between(' class="rental-coin">', '</'),
 99 | 				// <div class="volume"> 1巻収録 </div>
100 | 				// <div class="volume">13巻収録</div>
101 | 				収録 : text.between(' class="volume">', '</').trim()
102 | 			};
103 | 			// console.log(chapter_data);
104 | 			work_data.chapter_list.push(chapter_data);
105 | 		});
106 | 		work_data.chapter_list.reverse();
107 | 		// console.log(work_data.chapter_list);
108 | 	}
109 | 
110 | });
111 | 
112 | // ----------------------------------------------------------------------------
113 | 
114 | // CeL.set_debug(3);
115 | 
116 | start_crawler(crawler, typeof module === 'object' && module);
117 | 


--------------------------------------------------------------------------------
/comic.ja-JP/AlphaPolis_user_manga.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載アルファポリス - 電網浮遊都市 - Web漫画/無料の投稿漫画 的工具。 Download AlphaPolis user manga.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.AlphaPolis');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.AlphaPolis({
16 | 	// 當網站不允許太過頻繁的訪問/access時，可以設定下載之前的等待時間(ms)。
17 | 	// 模仿實際人工請求。
18 | 	// chapter_time_interval : '5s',
19 | 
20 | 	work_type : 'manga',
21 | 
22 | 	// 提取出引數（如 URL）中的作品ID 以回傳。
23 | 	extract_work_id : function(work_information) {
24 | 		return /^\d+-\d+$/.test(work_information) && work_information;
25 | 	}
26 | 
27 | });
28 | 
29 | // ----------------------------------------------------------------------------
30 | 
31 | // CeL.set_debug(3);
32 | 
33 | start_crawler(crawler, typeof module === 'object' && module);
34 | 


--------------------------------------------------------------------------------
/comic.ja-JP/moae.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載 講談社 モーニング・アフタヌーン・イブニング合同Webコミックサイト モアイ 的工具。 Download Kodansha moae
  3 |  * comics.
  4 |  */
  5 | 
  6 | 'use strict';
  7 | 
  8 | require('../work_crawler_loader.js');
  9 | 
 10 | // ----------------------------------------------------------------------------
 11 | 
 12 | var crawler = new CeL.work_crawler({
 13 | 	// 所有的子檔案要修訂註解說明時，應該都要順便更改在CeL.application.net.comic中Comic_site.prototype內的母comments，並以其為主體。
 14 | 
 15 | 	// 日本的網路漫畫網站習慣刪掉舊章節，因此每一次都必須從頭檢查。
 16 | 	recheck : true,
 17 | 
 18 | 	// one_by_one : true,
 19 | 	base_URL : 'http://www.moae.jp/',
 20 | 
 21 | 	// 規範 work id 的正規模式；提取出引數中的作品id 以回傳。
 22 | 	extract_work_id : function(work_information) {
 23 | 		if (/^[a-z_\-\d]+$/.test(work_information))
 24 | 			return work_information;
 25 | 	},
 26 | 
 27 | 	// 解析 作品名稱 → 作品id get_work()
 28 | 	search_URL : 'comic/list?keyword=',
 29 | 	parse_search_result : function(html, get_label) {
 30 | 		html = html.between('<ul class="box-set">', '</ul>');
 31 | 		var id_list = [], id_data = [];
 32 | 		html.each_between('<li>', '</li>',
 33 | 		//
 34 | 		function(text) {
 35 | 			var url = text.match(/ href="([^<>"]+)"/),
 36 | 			//
 37 | 			title = get_label(text.between('<span class="book-title">',
 38 | 					'</span>'));
 39 | 			id_list.push(url[1].match(/\/([a-z_\-\d]+)$/)[1]);
 40 | 			id_data.push(title);
 41 | 		});
 42 | 
 43 | 		return [ id_list, id_data ];
 44 | 	},
 45 | 
 46 | 	// 取得作品的章節資料。 get_work_data()
 47 | 	work_URL : function(work_id) {
 48 | 		return 'comic/' + work_id;
 49 | 	},
 50 | 	parse_work_data : function(html, get_label, extract_work_data) {
 51 | 		var work_data = {
 52 | 			// 必要屬性：須配合網站平台更改。
 53 | 			// e.g., "<h3>ジサツナキーの角（四季賞2018夏 佳作）<span>（2018/12/28）</span></h3>"
 54 | 			author : get_label(html.between(
 55 | 					'<section class="mod-profile-block">', '</section>')
 56 | 			// e.g., "<dt>宮川舟<span class="notes">（みやかわふね）</span></dt>"
 57 | 			.between('<dt>', '<')),
 58 | 
 59 | 			// 選擇性屬性：須配合網站平台更改。
 60 | 			last_update : get_label(html.between('<h3>', '</h3>').between(
 61 | 					'<span>（', '）</span>'))
 62 | 					|| (new Date).toISOString()
 63 | 		};
 64 | 
 65 | 		extract_work_data(work_data, html);
 66 | 		work_data.title = work_data.title.replace(/\/[^\/]+$/, '');
 67 | 
 68 | 		// console.log(work_data);
 69 | 		return work_data;
 70 | 	},
 71 | 	pre_get_chapter_list : function(callback, work_data, html, get_label) {
 72 | 		if (false && !html.includes('<div id="backnumber-pager">')) {
 73 | 			// 可能只有一個章節。
 74 | 			work_data.chapter_list = [ {
 75 | 				episode_no : 1
 76 | 			} ];
 77 | 			// return;
 78 | 		}
 79 | 
 80 | 		function get_chapter_data_URL(chapter_NO) {
 81 | 			return work_data.url + '/1/episode_list?page=' + (chapter_NO || '')
 82 | 					+ '&mpp=15';
 83 | 		}
 84 | 
 85 | 		var _this = this;
 86 | 		function parse_JSON(XMLHttp) {
 87 | 			try {
 88 | 				return JSON.parse(XMLHttp.responseText);
 89 | 			} catch (e) {
 90 | 				_this.onerror('Cannot parse chapter list!', work_data);
 91 | 				callback();
 92 | 			}
 93 | 		}
 94 | 
 95 | 		this.get_URL(get_chapter_data_URL(), function(XMLHttp) {
 96 | 			var data = parse_JSON(XMLHttp);
 97 | 			if (!data)
 98 | 				return;
 99 | 			// console.log(data);
100 | 
101 | 			if (!Array.isArray(data.pager) || data.pager.length !== 1) {
102 | 				_this.onerror('Unknown data! ' + JSON.stringify(data),
103 | 						work_data);
104 | 			}
105 | 			work_data.pager = data.pager[0];
106 | 			work_data.chapter_list = data.ep;
107 | 
108 | 			CeL.run_serial(function(run_next, item, index, list) {
109 | 				CeL.log_temporary(item + '/' + work_data.pager.maxPage);
110 | 
111 | 				_this.get_URL(get_chapter_data_URL(item), function(XMLHttp) {
112 | 					data = parse_JSON(XMLHttp);
113 | 					if (!data)
114 | 						return;
115 | 					work_data.chapter_list.append(data.ep);
116 | 					run_next();
117 | 				}, true);
118 | 
119 | 			}, work_data.pager.maxPage, 2, callback);
120 | 		});
121 | 	},
122 | 	get_chapter_list : function(work_data, html, get_label) {
123 | 		work_data.chapter_list.forEach(function(chapter_data) {
124 | 			chapter_data.title = chapter_data.subtitle || work_data.title;
125 | 			chapter_data.url = this.work_URL(work_data.id) + '/'
126 | 					+ chapter_data.episode_no;
127 | 		}, this);
128 | 
129 | 		// 因為中間的章節可能已經被下架，因此依章節標題來定章節編號。
130 | 		this.set_chapter_NO_via_title(work_data);
131 | 		// console.log(work_data);
132 | 	},
133 | 
134 | 	parse_chapter_data : function(html, work_data, get_label, chapter_NO) {
135 | 		html = html.between('<div id="main-block">',
136 | 				'<div class="main-pager" id="pager">');
137 | 
138 | 		var chapter_data = work_data.chapter_list[chapter_NO - 1];
139 | 		chapter_data.image_list = [];
140 | 		html.each_between('<div class="img"', '</div>',
141 | 		//
142 | 		function(text) {
143 | 			var url = text.match(/ data-original="([^"]+)"/)
144 | 					|| text.match(/ url="([^"]+)"/);
145 | 			chapter_data.image_list.push(url[1]);
146 | 		});
147 | 
148 | 		return chapter_data;
149 | 	}
150 | });
151 | 
152 | // ----------------------------------------------------------------------------
153 | 
154 | // CeL.set_debug(3);
155 | 
156 | start_crawler(crawler, typeof module === 'object' && module);
157 | 


--------------------------------------------------------------------------------
/comic.ja-JP/tmca.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 KADOKAWA CORPORATION webエース TYPE-MOONコミックエース 的工具。 Download TYPE-MOON
 3 |  * comics.
 4 |  */
 5 | 
 6 | 'use strict';
 7 | 
 8 | require('../work_crawler_loader.js');
 9 | 
10 | // ----------------------------------------------------------------------------
11 | 
12 | CeL.run('application.net.work_crawler.sites.ace');
13 | 
14 | // ----------------------------------------------------------------------------
15 | 
16 | var crawler = CeL.ace({
17 | 	// CeL.get_script_name()
18 | 	site : 'tmca'
19 | });
20 | 
21 | // ----------------------------------------------------------------------------
22 | 
23 | // CeL.set_debug(3);
24 | 
25 | start_crawler(crawler, typeof module === 'object' && module);
26 | 


--------------------------------------------------------------------------------
/comic.ja-JP/youngaceup.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 KADOKAWA CORPORATION webエース ヤングエースUP（アップ） Webコミック 的工具。 Download YOUNG
 3 |  * ACE UP comics.
 4 |  */
 5 | 
 6 | 'use strict';
 7 | 
 8 | require('../work_crawler_loader.js');
 9 | 
10 | // ----------------------------------------------------------------------------
11 | 
12 | CeL.run('application.net.work_crawler.sites.ace');
13 | 
14 | // ----------------------------------------------------------------------------
15 | 
16 | var crawler = CeL.ace({
17 | 	// CeL.get_script_name()
18 | 	site : 'youngaceup'
19 | });
20 | 
21 | // ----------------------------------------------------------------------------
22 | 
23 | // CeL.set_debug(3);
24 | 
25 | start_crawler(crawler, typeof module === 'object' && module);
26 | 


--------------------------------------------------------------------------------
/document/README.en-US.md:
--------------------------------------------------------------------------------
 1 | ﻿# CeJS online novels / comics downloader
 2 | - [en] Tools to download novels (→ epub) and comics.
 3 | 
 4 | ## Quick view
 5 | * [Installation](#installation)
 6 |    * [Speedy installation](#speedy-installation)
 7 | * [Execution](#execution)
 8 | 
 9 | ## Language support
10 | Welcome to join [the translating project](https://github.com/kanasimi/work_crawler/issues/185)!
11 | 
12 | | Language | Support |
13 | |---|:---:|
14 | | 繁體中文 | ✔️ |
15 | | 简体中文 | ✔️ |
16 | | English | ✔️ |
17 | | Português brasileiro | 🚧 |
18 | | 日本語 | 🚧 |
19 | | 한국어 | 🚧 |
20 | 
21 | ## OS support
22 | | Platform | Support |
23 | |---|:---:|
24 | | Windows | ✔️ |
25 | | macOS | ✔️ |
26 | | UNIX, Linux | ✔️ |
27 | <!-- | Android | ❌ | -->
28 | 
29 | ## Interface
30 | | Interface | Support |
31 | |---|:---:|
32 | | [GUI](https://en.wikipedia.org/wiki/Graphical_user_interface) | ✔️ |
33 | | [CLI](https://en.wikipedia.org/wiki/Command-line_interface) | ✔️ |
34 | | API | ✔️ |
35 | 
36 | ## Features
37 | * 🚧 Not yet translated, please refer to [Chinese document](README.cmn-Hant-TW.md).
38 | 
39 | ## Supported sites
40 | * 🚧 Not yet translated, please refer to [Chinese document](README.cmn-Hant-TW.md).
41 | 
42 | ## Installation
43 | 1. Install [7-Zip](https://www.7-zip.org/) 18.01+
44 | 2. Install the released package from [release page ![GitHub release](https://img.shields.io/github/release/kanasimi/work_crawler.svg)](https://github.com/kanasimi/work_crawler/releases/latest/)
45 | 
46 | ### Speedy installation
47 | Speedy installation supports stable editions.
48 | 1. Please install [node.js](https://nodejs.org/) and [7-Zip](https://www.7-zip.org/) 18.01+.
49 | 2. Save the install-script <code>[work_crawler.updater.js](https://raw.githubusercontent.com/kanasimi/work_crawler/master/work_crawler.updater.js)</code>.
50 | 3. Using [node.js](https://nodejs.org/) to executing <code>[work_crawler.updater.js](https://raw.githubusercontent.com/kanasimi/work_crawler/master/work_crawler.updater.js)</code>.
51 | 4. And then you can [try it](#execution) now!
52 | 
53 | * 🚧 Not yet full translated, please refer to [Chinese document](README.cmn-Hant-TW.md).
54 | 
55 | ### Legacy installation
56 | 1. Please see [Node.js usage section at CeJS](https://github.com/kanasimi/CeJS#nodejs-usage--nodejs-運行方式) for detail.
57 | 2. Setup [_repository_path_list.txt](https://github.com/kanasimi/CeJS/blob/master/_for%20include/_repository_path_list.sample.txt) if necessary.
58 | 3. Setup `work_crawler.configuration.js` (see [work_crawler.default_configuration.js](https://github.com/kanasimi/work_crawler/blob/master/work_crawler.default_configuration.js)).
59 | 
60 | #### Setup GUI
61 | * 🚧 Not yet full translated, please refer to [Chinese document](README.cmn-Hant-TW.md).
62 | 
63 | ## Execution
64 | If you want to use [GUI](https://zh.wikipedia.org/wiki/%E5%9B%BE%E5%BD%A2%E7%94%A8%E6%88%B7%E7%95%8C%E9%9D%A2), please executing `start_gui_electron.bat` or `start_gui_electron.sh` under the directory `work_crawler-master`.
65 | 
66 | * 🚧 Not yet translated, please refer to [Chinese document](README.cmn-Hant-TW.md).
67 | 
68 | ## Workflow
69 | * 🚧 Not yet translated, please refer to [Chinese document](README.cmn-Hant-TW.md).
70 | 
71 | ## Uninstallation
72 | * 🚧 Not yet translated, please refer to [Chinese document](README.cmn-Hant-TW.md).
73 | 
74 | ## FAQ
75 | * 🚧 Not yet translated, please refer to [Chinese document](README.cmn-Hant-TW.md).
76 | 
77 | ## Notes
78 | * 🚧 Not yet translated, please refer to [Chinese document](README.cmn-Hant-TW.md).
79 | 
80 | ## Purpose
81 | * 🚧 Not yet translated, please refer to [Chinese document](README.cmn-Hant-TW.md).
82 | 
83 | ## Announce
84 | * 🚧 Not yet translated, please refer to [Chinese document](README.cmn-Hant-TW.md).
85 | 
86 | ## Contact
87 | Contact us at [GitHub](https://github.com/kanasimi/work_crawler/issues).
88 | 
89 | [![logo](https://raw.githubusercontent.com/kanasimi/CeJS/master/_test%20suite/misc/logo.jpg)](http://lyrics.meicho.com.tw/)
90 | 


--------------------------------------------------------------------------------
/gui_electron/gui_electron.css:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/kanasimi/work_crawler/0c3b99aa557881bad8980a09a6473c16390a25b2/gui_electron/gui_electron.css


--------------------------------------------------------------------------------
/gui_electron/gui_electron.html:
--------------------------------------------------------------------------------
  1 | ﻿<!DOCTYPE html>
  2 | <html>
  3 | <head>
  4 | <meta charset="UTF-8" />
  5 | <title data-gettext="CeJS 網路小說漫畫下載工具"></title>
  6 | <link rel="stylesheet" href="gui_electron.css" />
  7 | <script src="gui_electron_functions.js"></script>
  8 | </head>
  9 | <body>
 10 | 	<div id="language_menu"></div>
 11 | 
 12 | 	<!-- <h2>CeJS 網路小說漫畫下載工具 online novels / comics downloader</h2> -->
 13 | 	<div class="panel">
 14 | 		<label> 📘<span data-gettext="作品名稱或🆔"></span> <input
 15 | 			id="input_work_id" value="" title="快速鍵: Ctrl + V 貼上作品名稱或 id"
 16 | 			onmouseover="this.select(); this.focus();" />
 17 | 		</label> <b class="button" onclick="paste_text();" title="貼上作品名稱或 id"> 📋<span
 18 | 			data-gettext="貼上"></span>
 19 | 		</b> <b class="button" onclick="start_gui_crawler();">▶<span
 20 | 			data-gettext="開始下載"></span></b>
 21 | 		<!--  <b class="button"
 22 | 			onclick="stop_task();">暫停下載</b> <b class="button"
 23 | 			onclick="continue_task();">繼續下載</b> <b class="button"
 24 | 			onclick="cancel_task();">取消下載</b> -->
 25 | 		<b class="button" onclick="search_work_title();" title="搜尋各網站並下載作品。">
 26 | 			👀<span data-gettext="搜尋"></span>
 27 | 		</b> <b class="button" onclick="open_download_directory();"> 📂<span
 28 | 			data-gettext="開啓下載目錄"></span>
 29 | 		</b>
 30 | 	</div>
 31 | 
 32 | 	<div id="operation_panel">
 33 | 		<div>
 34 | 			<div id="download_sites_panel" class="panel">
 35 | 				<h3 id="download_sites_trigger" title="使用網路小說/漫畫作品網站（單選）">
 36 | 					<span data-gettext="網路作品網站"></span>
 37 | 				</h3>
 38 | 				<div id="download_sites_list"></div>
 39 | 			</div>
 40 | 		</div>
 41 | 
 42 | 		<div id="right_panel">
 43 | 			<div id="attention_panel" class="panel">
 44 | 				<div id="close_attention_panel_button" title="close"
 45 | 					onclick="return hide_attention_panel();">×</div>
 46 | 				<div id="attention_inner">Please wait. Loading... 請稍等。載入中……</div>
 47 | 			</div>
 48 | 
 49 | 			<div id="favorites_panel">
 50 | 				<h3 id="favorites_trigger">
 51 | 					😘<span data-gettext="最愛作品清單"></span>
 52 | 				</h3>
 53 | 				<!-- 💖 -->
 54 | 				<div id="favorite_list"></div>
 55 | 			</div>
 56 | 
 57 | 			<div id="download_options_panel" class="panel">
 58 | 				<h3 id="download_options_trigger">
 59 | 					<!-- 🎛 -->
 60 | 					⚙️<span data-gettext="下載選項"></span>
 61 | 				</h3>
 62 | 			</div>
 63 | 
 64 | 			<div id="search_results_panel" class="panel">
 65 | 				<h3 id="search_results_trigger">
 66 | 					👀<span data-gettext="搜尋結果"></span>
 67 | 				</h3>
 68 | 				<div id="search_results"></div>
 69 | 			</div>
 70 | 
 71 | 			<div id="download_job_panel" class="panel">
 72 | 				<h3 id="download_job_trigger">
 73 | 					📥<span data-gettext="下載中的作品"></span>
 74 | 				</h3>
 75 | 				<div id="download_job_queue"></div>
 76 | 			</div>
 77 | 		</div>
 78 | 	</div>
 79 | 
 80 | 	<hr />
 81 | 	<b class="button" onclick="CeL.Log.clear();"> ⎚<!-- ✨ --> <span
 82 | 		data-gettext="清除訊息"></span>
 83 | 	</b>
 84 | 	<b class="button"
 85 | 		onclick="this.children[0].innerHTML = CeL.Log.toggle() ? '📖' : '📕';">
 86 | 		<span>📖</span><span data-gettext="顯示/隱藏訊息"></span>
 87 | 	</b>
 88 | 	<label for="max_logs"> <span></span><span class="disabled"
 89 | 		style="cursor: pointer;" data-gettext="不限制訊息行數"
 90 | 		onclick="check_max_logs.call(this);"></span>
 91 | 	</label>
 92 | 	<input style="display: none;" id="max_logs" type="number" pattern="\d*"
 93 | 		max="99999" min="0" value="500"></input>
 94 | 
 95 | 	<b class="button" onclick="open_DevTools();"> 🐞<!-- 🧪 --> <span
 96 | 		data-gettext="開啟偵錯工具/開發人員工具"></span>
 97 | 	</b>
 98 | 
 99 | 	<span id="small_tips"></span>
100 | 
101 | 	<div id="select_theme_panel"></div>
102 | 
103 | 	<div id="log_panel"></div>
104 | 
105 | 	<audio id="finished_sound">
106 | 		<source
107 | 			src="https://upload.wikimedia.org/wikipedia/commons/b/bd/Artu_speech_03.ogg"
108 | 			type="audio/ogg" autoplay="false" />
109 | 		Your browser does not support the audio tag.
110 | 	</audio>
111 | </body>
112 | </html>


--------------------------------------------------------------------------------
/gui_electron/icon/rasen2.ico:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/kanasimi/work_crawler/0c3b99aa557881bad8980a09a6473c16390a25b2/gui_electron/icon/rasen2.ico


--------------------------------------------------------------------------------
/gui_electron/icon/rasen2.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/kanasimi/work_crawler/0c3b99aa557881bad8980a09a6473c16390a25b2/gui_electron/icon/rasen2.png


--------------------------------------------------------------------------------
/novel.cmn-Hans-CN/630book.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載2017 恋上你看书网的工具。 Download 630book novels. 本站在流量大的時候，似乎會限制讀取速率。
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.PTCMS');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.PTCMS({
16 | 	base_URL : 'http://www.630book.la/',
17 | 	charset : 'gbk',
18 | 
19 | 	// recheck:從頭檢測所有作品之所有章節。
20 | 	// recheck=false:明確指定自上次下載過的章節接續下載。
21 | 	recheck : 'changed',
22 | 
23 | 	// 解析 作品名稱 → 作品id get_work()
24 | 	// 2017/7/24: 630book 這兩天(之前)開始採用百度搜索。
25 | 	baidu_cse : '7838902352036767286',
26 | 
27 | 	// 解析 作品名稱 → 作品id get_work()
28 | 	_search_URL : 'modules/article/search.php?'
29 | 			+ 'searchtype=articlename&searchkey=',
30 | 	// TODO: http://www.630book.la/modules/article/search.php?q=
31 | 	_parse_search_result : function(html, get_label) {
32 | 		var id_data = [],
33 | 		// {Array}id_list = [id,id,...]
34 | 		id_list = [], get_next_between = html.find_between(
35 | 				'<td class="odd" align="center"><a href="/shu/', '</a>'), text;
36 | 
37 | 		while ((text = get_next_between()) !== undefined) {
38 | 			// 從URL網址中解析出作品id。
39 | 			var matched = text.between(null, '"').match(/([\d_]+)\.html$/);
40 | 			id_list.push(matched[1]);
41 | 			matched = text.between('>');
42 | 			id_data.push(get_label(matched));
43 | 		}
44 | 
45 | 		return [ id_list, id_data ];
46 | 	},
47 | 
48 | 	// for search:
49 | 	// http://www.630book.la/top/monthvisit/
50 | 	// p={};document.querySelectorAll('span[class="l2"]>a').forEach(function(n){p[n.innerText]=n.href.match(/\/(\d+)\.html$/)[1];});JSON.stringify(p)
51 | 	// JSON.stringify(Object.assign())
52 | 
53 | 	// 取得作品的章節資料。 get_work_data()
54 | 	work_URL : function(work_id) {
55 | 		return '/shu/' + work_id + '.html';
56 | 	},
57 | 	// 取得包含章節列表的文字範圍。
58 | 	get_chapter_list_contents : function(html) {
59 | 		return html.between('<dl class="zjlist">', '</dl>');
60 | 	}
61 | });
62 | 
63 | // ----------------------------------------------------------------------------
64 | 
65 | // CeL.set_debug(3);
66 | 
67 | start_crawler(crawler, typeof module === 'object' && module);
68 | 


--------------------------------------------------------------------------------
/novel.cmn-Hans-CN/88dus.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載八八读书网/2017 88读书网的工具。 Download 88dus novels.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.PTCMS');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.PTCMS({
16 | 	base_URL : 'https://www.88dus.com/',
17 | 	charset : 'gbk',
18 | 
19 | 	// 解析 作品名稱 → 作品id get_work()
20 | 	// baidu_cse : '2308740887988514756',
21 | 	search_URL : {
22 | 		URL : 'search/so.php?search_field=0&q=',
23 | 		charset : 'utf8'
24 | 	},
25 | 	parse_search_result : function(html, get_label) {
26 | 		var id_list = [], id_data = [];
27 | 		html.each_between('<div class="block_txt">', '</div>', function(text) {
28 | 			id_list.push(text.between(' href="/xiaoshuo/', '"').between('/',
29 | 					'/'));
30 | 			id_data.push(get_label(text.between('<h2>', '</h2>')));
31 | 		});
32 | 		return [ id_list, id_data ];
33 | 	},
34 | 
35 | 	// 取得作品的章節資料。 get_work_data()
36 | 	work_URL : function(work_id) {
37 | 		return 'xiaoshuo/' + (work_id.slice(0, -3) || 0) + '/' + work_id + '/';
38 | 	},
39 | 	// 取得包含章節列表的文字範圍。
40 | 	get_chapter_list_contents : function(html) {
41 | 		return html.between('<div class="mulu">', '</div>');
42 | 	}
43 | });
44 | 
45 | // ----------------------------------------------------------------------------
46 | 
47 | // CeL.set_debug(3);
48 | 
49 | start_crawler(crawler, typeof module === 'object' && module);
50 | 


--------------------------------------------------------------------------------
/novel.cmn-Hans-CN/biqizw.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載 比奇中文网 小说 的工具。 Download biqizw novels.
  3 |  */
  4 | 
  5 | 'use strict';
  6 | 
  7 | require('../work_crawler_loader.js');
  8 | 
  9 | // ----------------------------------------------------------------------------
 10 | 
 11 | CeL.run('application.net.work_crawler.sites.PTCMS');
 12 | 
 13 | // ----------------------------------------------------------------------------
 14 | 
 15 | var crawler = CeL.PTCMS({
 16 | 	// 2024/3/9 前: https://www.biqizw.com/
 17 | 	base_URL : 'https://www.biqizw.com/',
 18 | 	charset : 'gbk',
 19 | 
 20 | 	search_work_interval : '30s',
 21 | 	chapter_time_interval : '1s',
 22 | 
 23 | 	// 解析 作品名稱 → 作品id get_work()
 24 | 	search_URL : 'modules/article/search.php?searchkey=',
 25 | 	parse_search_result : 'biquge',
 26 | 
 27 | 	// 取得作品的章節資料。 get_work_data()
 28 | 	work_URL : function(work_id) {
 29 | 		return (work_id / 1000 | 0) + '_' + work_id + '/';
 30 | 	},
 31 | 	// 取得包含章節列表的文字範圍。
 32 | 	get_chapter_list_contents : function(html) {
 33 | 		return html.between('<div id="list">', '</div>');
 34 | 	},
 35 | 	// 去掉前後網站廣告。
 36 | 	remove_ads : function remove_ads(text) {
 37 | 		// 去掉前後網站廣告。
 38 | 		text = text.replace(
 39 | 		/**
 40 | 		 * <code>
 41 | 		// https://www.biqizw.com/3_3733/3167227.html	第39章“师兄，承让了！”
 42 | 		比奇中文网 www.biqizw.com，最快更新长生：开局一条命，修为全靠苟 ！<br><br>
 43 | 		</code>
 44 | 		 */
 45 | 		/[^<>]+中文网\s*[\w.]+，最快更新[^<>]+/, '')
 46 | 
 47 | 		.replace(
 48 | 		/**
 49 | 		 * <code>
 50 | 		// https://www.biqizw.com/3_3733/3167227.html
 51 | 		</code>
 52 | 		 */
 53 | 		/无尽的昏迷过后，时宇猛地从床上起身。想要看最新章节内容，请下载星星阅读app，[\s\S]+比奇中文/, '')
 54 | 
 55 | 		.replace(
 56 | 		/**
 57 | 		 * <code>
 58 | 		// https://www.biqizw.com/3_3733/3167227.html
 59 | 		<br /><br /> &nbsp;&nbsp;&nbsp;&nbsp;&lt;a href=&quot;<a href="http://www.biqizw.com&quot;" target="_blank">http://www.biqizw.com&quot;</a> target=&quot;_blank&quot;&gt;<a href="http://www.biqizw.com&lt;/a&gt;" target="_blank">www.biqizw.com&lt;/a&gt;</a> 比奇中文
 60 | 		</code>
 61 | 		 */
 62 | 		/&lt;a href=[\s\S]+?(<br[^<>]*>|$)/, '$1')
 63 | 
 64 | 		.replace(
 65 | 		/**
 66 | 		 * <code>
 67 | 
 68 | 		// https://www.biqizw.com/3_3733/3167190.html	长生：开局一条命，修为全靠苟 第2章 宗门里的摸鱼日常
 69 | 		学不到。Μ.<br /><br /> &nbsp;&nbsp;&nbsp;&nbsp;
 70 | 
 71 | 		// https://www.biqizw.com/3_3733/3167191.html	长生：开局一条命，修为全靠苟 第3章 猪肉铺的姑娘
 72 | 		说了话。【1】 【6】 【6】 【小】 【说】<br /><br /> &nbsp;&nbsp;&nbsp;&nbsp;
 73 | 
 74 | 		// https://www.biqizw.com/3_3733/3167192.html	长生：开局一条命，修为全靠苟 第4章 不试一试，怎么知道不行呢？
 75 | 		宗门的安危。”ωＷＷ.<br /><br /> &nbsp;&nbsp;&nbsp;&nbsp;
 76 | 
 77 | 		// https://www.biqizw.com/3_3733/3167194.html	长生：开局一条命，修为全靠苟 第6章 人生若只如初见
 78 | 		熟悉的面容。大风小说<br /><br /> &nbsp;
 79 | 
 80 | 		// https://www.biqizw.com/3_3733/3167200.html	长生：开局一条命，修为全靠苟 第12章 苟着也能惹祸上身？
 81 | 		撂倒了……166小说<br /><br />
 82 | 
 83 | 		// https://www.biqizw.com/3_3733/3167531.html	长生：开局一条命，修为全靠苟 第341章 百年计划
 84 | 		166小说 无尽的昏迷过后，时宇猛地从床上起身。
 85 | 		</code>
 86 | 		 */
 87 | 		/(?:ωＷＷ\.|166小说|大风小说|(?<=\W)Μ\.|【1】 【6】 【6】 【小】 【说】)(<br[^<>]*>|\s*$)/g
 88 | 		//
 89 | 		, '$1')
 90 | 
 91 | 		.replace(
 92 | 		/**
 93 | 		 * <code>
 94 | 
 95 | 		// https://www.biqizw.com/3_3733/3167227.html	长生：开局一条命，修为全靠苟 第39章“师兄，承让了！”
 96 | 		以压倒性的优势取得了胜利。水印广告测试&nbsp;&nbsp; 水印广告测试<br /><br />
 97 | 		时宇猛地从床上起身。想要看最新章节内容，请下载星星阅读app，无广告免费阅读最新章节内容。网站已经不更新最新章节内容，已经星星阅读小说APP更新最新章节内容。<br /><br />
 98 | 		这不是他！下载星星阅读app，阅读最新章节内容无广告免费<br /><br />
 99 | 
100 | 		</code>
101 | 		 */
102 | 		/(?:水印广告测试|想要看最新章节内容|下载星星阅读)[^<>]*?(<br[^<>]*>)/, '$1')
103 | 
104 | 		;
105 | 
106 | 		// console.log(text);
107 | 		return text;
108 | 	}
109 | });
110 | 
111 | // ----------------------------------------------------------------------------
112 | 
113 | // CeL.set_debug(3);
114 | 
115 | start_crawler(crawler, typeof module === 'object' && module);
116 | 


--------------------------------------------------------------------------------
/novel.cmn-Hans-CN/biqugse.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 笔趣阁 小说 的工具。 Download biqugse novels.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.PTCMS');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var PATTERN_pages = /(?:<br\s*\/?>)*(?:&nbsp;)*(?:（本章未完，请点击下一页继续阅读）)?最新网址：(?:<br\s*\/?>)*(?:&nbsp;)*第[^<>()]+?章 [^<>()]+? \(第\d\/\d页\)(?:<br\s*\/?>)+/g;
16 | 
17 | var crawler = CeL.PTCMS({
18 | 	base_URL : 'http://www.biqugse.com/',
19 | 	must_browse_first : true,
20 | 
21 | 	chapter_time_interval : 200,
22 | 
23 | 	// 解析 作品名稱 → 作品id get_work()
24 | 	search_URL : function(key) {
25 | 		return [ 'case.php?m=search', {
26 | 			key : key
27 | 		} ];
28 | 	},
29 | 	parse_search_result : function(html, get_label) {
30 | 		// console.log(html);
31 | 		html = html.between('<div id="newscontent">', '</ul>');
32 | 		// console.log(html);
33 | 
34 | 		var id_list = [], id_data = [];
35 | 		html.each_between('<li>', '</li>', function(text) {
36 | 			var matched = text.match(
37 | 			/**
38 | 			 * <code>
39 | 
40 | 			// biqugse.js
41 | 			<li><span class="s1">[武侠修真]</span>
42 | 			<span class="s2"><a href="/507/" target="_blank">走进修仙</a></span>
43 | 			<span class="s3"><a href="/507/34139004.html" target="_blank">后日谈二、三则</a></span>
44 | 			<span  class="s4">吾道长不孤</span>
45 | 			<span class="s5">12-01</span>
46 | 			</li>
47 | 
48 | 			</code>
49 | 			 */
50 | 			/<a href="[^<>"]*\/(?:\d+_)?(\d+)\/"[^<>]*>([\s\S]+?)<\/a>/);
51 | 			// console.log([ text, matched ]);
52 | 			if (matched) {
53 | 				id_list.push(+matched[1]);
54 | 				id_data.push(get_label(matched[2]));
55 | 			}
56 | 		});
57 | 		return [ id_list, id_data ];
58 | 	},
59 | 
60 | 	// 取得作品的章節資料。 get_work_data()
61 | 	work_URL : function(work_id) {
62 | 		return '/' + work_id + '/';
63 | 	},
64 | 	// 取得包含章節列表的文字範圍。
65 | 	get_chapter_list_contents : function(html) {
66 | 		return html.between('<div id="list">', '</div>');
67 | 	},
68 | 
69 | 	remove_ads : function(text, chapter_data) {
70 | 		text = text
71 | 
72 | 		/**
73 | 		 * <code>
74 | 
75 | 		// http://www.biqugse.com/107322/103843803.html	长生，从养鸡杂役开始 >第79章博弈
76 | 		<br/>最新网址：&nbsp;&nbsp;&nbsp;&nbsp;第七十九章 博弈 (第1/3页)<br/>
77 | 		<br/>&nbsp;&nbsp;&nbsp;&nbsp;（本章未完，请点击下一页继续阅读）最新网址：<br/>&nbsp;&nbsp;&nbsp;&nbsp;第七十九章 博弈 (第2/3页)<br/>
78 | 
79 | 		</code>
80 | 		 */
81 | 		.replace(PATTERN_pages, '')
82 | 
83 | 		;
84 | 
85 | 		return text;
86 | 	}
87 | });
88 | 
89 | // ----------------------------------------------------------------------------
90 | 
91 | // CeL.set_debug(3);
92 | 
93 | start_crawler(crawler, typeof module === 'object' && module);
94 | 


--------------------------------------------------------------------------------
/novel.cmn-Hans-CN/booktxt.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 顶点小说 的工具。 Download booktxt novels.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.PTCMS');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | // for Error: unable to verify the first certificate
16 | // code: 'UNABLE_TO_VERIFY_LEAF_SIGNATURE'
17 | process.env['NODE_TLS_REJECT_UNAUTHORIZED'] = '0';
18 | 
19 | var crawler = CeL.PTCMS({
20 | 	base_URL : 'https://www.booktxt.net/',
21 | 	charset : 'gbk',
22 | 
23 | 	// 解析 作品名稱 → 作品id get_work()
24 | 	search_URL : 'https://so.biqusoso.com/s1.php?ie=gbk&siteid=booktxt.net&s=2758772450457967865&q=',
25 | 	parse_search_result : 'biquge',
26 | 
27 | 	// 取得作品的章節資料。 get_work_data()
28 | 	work_URL : function(work_id) {
29 | 		return (work_id / 1000 | 0) +'_' + work_id + '/';
30 | 	},
31 | 	// 取得包含章節列表的文字範圍。
32 | 	get_chapter_list_contents : function(html) {
33 | 		return html.between('<div id="list">', '</div>');
34 | 	}
35 | });
36 | 
37 | // ----------------------------------------------------------------------------
38 | 
39 | // CeL.set_debug(3);
40 | 
41 | start_crawler(crawler, typeof module === 'object' && module);
42 | 


--------------------------------------------------------------------------------
/novel.cmn-Hans-CN/huaxiangju.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 花香居 小說 的工具。 Download huaxiangju novels.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.jieqi_article');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.jieqi_article({
16 | 
17 | 	base_URL : 'https://www.huaxiangju.com/',
18 | 
19 | 	inverted_order : true,
20 | 
21 | 	// 去掉網站廣告。
22 | 	remove_ads : function(text) {
23 | 		// 去掉前後網站廣告。
24 | 		text = text.replace(
25 | 		// 花香居提供女生言情小说在线阅读，言情小说免费阅读，言情小说TXT下载，言情小说阅读之家。https://www.huaxiangju.com/
26 | 		/&#33457;&#39321;&#23621;.+?&#46;&#99;&#111;&#109;&#47;/g, '');
27 | 
28 | 		text = text.replace(
29 | 		// remove 顶点小说ＷｗＷ．ＸＳ⒉②２．ＣＯＭ http://www.xs222.com/
30 | 		// 顶.?点.?小.?说
31 | 		/[『』]?顶[『』]?点[『』]?小[『』]?说Ｗｗ[『』]?Ｗ．[『』]?Ｘ([『』]|&nbsp;)*Ｓ⒉②２．ＣＯＭ/, '')
32 | 		// 被審查而消失、變造的文字
33 | 		.replace(/大6/g, '大陆').replace(/\*\*裸/g, '赤裸裸').replace(/\*\*/g, '赤裸裸')
34 | 		// 求活的意志
35 | 		.replace(/求生\*\*/g, '求生意志');
36 | 
37 | 		text = text
38 | 		// e.g., https://www.huaxiangju.com/25087/6323179.html
39 | 		.replace(/^(?:热门|&#160;|&amp;|&nbsp;|<br[^<>]*>|[&:;])+/, '');
40 | 		if (!text.includes('<div'))
41 | 			text = text.replace(/<\/div>/g, '').trim();
42 | 
43 | 		// console.log(text);
44 | 		return text;
45 | 	}
46 | });
47 | 
48 | // ----------------------------------------------------------------------------
49 | 
50 | // CeL.set_debug(3);
51 | 
52 | start_crawler(crawler, typeof module === 'object' && module);
53 | 


--------------------------------------------------------------------------------
/novel.cmn-Hans-CN/kanshushenzhan.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 看书神站 小說 的工具。 Download kanshushenzhan novels.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.jieqi_article');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | // <br />
16 | // &nbsp;&nbsp;&nbsp;&nbsp;本站重要通知:请使用百度搜索“看书神站”,无广告、破防盗版、更新快,会员同步书架,请
17 | // gegegengxin (按住三秒复制) !!<br />阅读<a href="/132800/">万古剑神</a>最新章节，就上<a
18 | // href="/">看书神站！</a></p>
19 | var PATTERN_ads = /(?:<br \/>\n(?:&nbsp;)*本站重要通知:[^<>]+)?<br \/>阅读<a href="[^<>"]+">[^<>]+<\/a>最新章节，就上<a href="\/">看书神站！<\/a>$/,
20 | //
21 | crawler = CeL.jieqi_article({
22 | 
23 | 	base_URL : 'https://www.kanshushenzhan.com/',
24 | 
25 | 	// 去掉前後網站廣告。
26 | 	remove_ads : function(text) {
27 | 		return text.replace(PATTERN_ads, '');
28 | 	}
29 | });
30 | 
31 | // ----------------------------------------------------------------------------
32 | 
33 | // CeL.set_debug(3);
34 | 
35 | start_crawler(crawler, typeof module === 'object' && module);
36 | 


--------------------------------------------------------------------------------
/novel.cmn-Hans-CN/novel.cmn-Hans-CN.bat:
--------------------------------------------------------------------------------
 1 | @ECHO OFF
 2 | CHCP 65001
 3 | REM CHCP 950
 4 | REM CD /D D:\USB\cgi-bin\program\comic
 5 | 
 6 | REM CD "%~n0"
 7 | REM It's often too slow, so trying to execute parallelly.
 8 | REM + modify_work_list_when_archive_old_works
 9 | FORFILES /M *.js /C "cmd.exe /c IF @isdir==FALSE START node @file l=list.txt || PAUSE"
10 | 
11 | REM START node ck101.js l=ck101.txt
12 | START node kanunu.js l=kanunu.txt
13 | REM CD ..
14 | 


--------------------------------------------------------------------------------
/novel.cmn-Hans-CN/x81zw.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 2013 新八一中文网的工具。 Download x81zw novels.
 3 |  * 
 4 |  * @see xbiquge
 5 |  */
 6 | 
 7 | 'use strict';
 8 | 
 9 | require('../work_crawler_loader.js');
10 | 
11 | // ----------------------------------------------------------------------------
12 | 
13 | CeL.run('application.net.work_crawler.sites.PTCMS');
14 | 
15 | // ----------------------------------------------------------------------------
16 | 
17 | /**
18 |  * <code>
19 |  <h3 class="result-item-title result-game-item-title">
20 |  <a cpos="title" href="/book/4/4235/" title="诡秘之主" class="result-game-item-title-link" target="_blank">
21 |  诡秘之主
22 |  </a >
23 |  </h3 >
24 |  </code>
25 |  */
26 | // [ all, id, title, title ]
27 | var PATTERN_search_anchor = /<a [^<>]*?href="[^<>"]+?\/(\d+)\/?"[^<>]+?title="([^<>"]+)"[^<>]*?>([\s\S]+?)<\/a>/,
28 | //
29 | crawler = CeL.PTCMS({
30 | 	base_URL : 'https://www.x81zw.com/',
31 | 
32 | 	// 提取出引數（如 URL）中的作品ID 以回傳。
33 | 	extract_work_id : function(work_information) {
34 | 		return /^[\d_]+$/.test(work_information) && work_information;
35 | 	},
36 | 
37 | 	// 解析 作品名稱 → 作品id get_work()
38 | 	search_URL : 'search.php?keyword=',
39 | 	parse_search_result : function(html, get_label) {
40 | 		// console.log(html);
41 | 		var id_data = [],
42 | 		// {Array}id_list = [id,id,...]
43 | 		id_list = [];
44 | 
45 | 		html.each_between(' class="result-item-title', '</h3>', function(text) {
46 | 			// console.log(text);
47 | 			var matched = text.match(PATTERN_search_anchor);
48 | 			id_list.push(+matched[1]);
49 | 			id_data.push(get_label(matched[2]));
50 | 		});
51 | 
52 | 		return [ id_list, id_data ];
53 | 	},
54 | 
55 | 	// 取得作品的章節資料。 get_work_data()
56 | 	work_URL : function(work_id) {
57 | 		return 'book/' + (work_id / 1000 | 0) + '/' + work_id;
58 | 	},
59 | 	// 取得包含章節列表的文字範圍。
60 | 	get_chapter_list_contents : function(html) {
61 | 		return html.between('<div id="list">', '</div>');
62 | 	},
63 | 	pre_add_ebook_chapter : function(data) {
64 | 		// console.log(data.text);
65 | 		data.text = data.text.replace(/([\s\S]+?)<首发[\s\S]+?(?:<br>|$)/g,
66 | 		//
67 | 		function(all, front) {
68 | 			var index = front.lastIndexOf('<br>');
69 | 			if (index >= 0)
70 | 				front = front.slice(0, index);
71 | 			return front;
72 | 		})
73 | 		// e.g., https://www.x81zw.com/book/63/63675/43268085.html
74 | 		// "<aonclick>防采集自动加载失败，点击手动加载，不支持阅读模式，请安装最新版浏览器！</aonclick></divid>"
75 | 		.replace(/<aonclick>[\s\S]+?<\/aonclick>/g, '').replace(/<\/?divid>/g,
76 | 				'');
77 | 		// console.log(data.text);
78 | 	}
79 | });
80 | 
81 | // ----------------------------------------------------------------------------
82 | 
83 | // CeL.set_debug(3);
84 | 
85 | start_crawler(crawler, typeof module === 'object' && module);
86 | 


--------------------------------------------------------------------------------
/novel.cmn-Hans-CN/xbiquge.cc.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 笔趣阁 小说 的工具。 Download xbiquge novels.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.PTCMS');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.PTCMS({
16 | 	// 2021/10/3 前: https://www.xbiquge.cc/ → https://www.xbiquge.so/
17 | 	base_URL : 'https://www.xbiquge.so/',
18 | 	charset : 'gbk',
19 | 
20 | 	// chapter_time_interval : '6s',
21 | 
22 | 	// 解析 作品名稱 → 作品id get_work()
23 | 	search_URL : 'modules/article/search.php?searchkey=',
24 | 	parse_search_result : 'biquge',
25 | 	search_work_interval : '30s',
26 | 
27 | 	// 取得作品的章節資料。 get_work_data()
28 | 	work_URL : function(work_id) {
29 | 		return 'book/' + work_id + '/';
30 | 	},
31 | 	// 取得包含章節列表的文字範圍。
32 | 	get_chapter_list_contents : function(html) {
33 | 		return html.between('<div id="list">', '</div>');
34 | 	},
35 | 	// 去掉前後網站廣告。
36 | 	remove_ads : function(text) {
37 | 		// 去掉前後網站廣告。
38 | 		text = text.replace(
39 | 		// 笔趣阁 www.xbiquge.cc，最快更新不朽凡人最新章节！<br><br>
40 | 		// 笔趣阁 www.xbiquge.cc，最快更新凡人修仙传 ！<br><br>
41 | 		/^[\s\n]*笔趣阁.+?最快更新.+?！(?:<br>)+/g, '').replace(
42 | 		// 天才壹秒記住『愛♂去÷小?說→網』，為您提供精彩小說閱讀。<br />
43 | 		/^[^<>]+提供精彩小說閱讀。<br[^<>]*>/g, '').replace(
44 | 		// 天才壹秒記住『愛♂去÷小?說→網』，為您提供精彩小說閱讀。<br />
45 | 		/【愛.去.小.說.網[^【】]{5,20}】/g, '');
46 | 
47 | 		// console.log(text);
48 | 		return text;
49 | 	}
50 | });
51 | 
52 | // ----------------------------------------------------------------------------
53 | 
54 | // CeL.set_debug(3);
55 | 
56 | start_crawler(crawler, typeof module === 'object' && module);
57 | 


--------------------------------------------------------------------------------
/novel.cmn-Hans-CN/xbiquge.so.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 笔趣阁 小说 的工具。 Download xbiquge.so novels.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.PTCMS');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.PTCMS({
16 | 	// 2022/8/16 15:41:36
17 | 	base_URL : 'https://www.xbiquge.so/',
18 | 	charset : 'gbk',
19 | 
20 | 	// chapter_time_interval : '6s',
21 | 	// 两次搜索的间隔时间不得少于 30 秒
22 | 	search_work_interval : '30s',
23 | 
24 | 	// 解析 作品名稱 → 作品id get_work()
25 | 	search_URL : 'modules/article/search.php?searchkey=',
26 | 	parse_search_result : 'biquge',
27 | 
28 | 	// 取得作品的章節資料。 get_work_data()
29 | 	work_URL : function(work_id) {
30 | 		return 'book/' + work_id + '/';
31 | 	},
32 | 	// 取得包含章節列表的文字範圍。
33 | 	get_chapter_list_contents : function(html) {
34 | 		return html.between('<div id="list">', '</div>');
35 | 	},
36 | 	// 去掉前後網站廣告。
37 | 	remove_ads : function(text) {
38 | 		// 去掉前後網站廣告。
39 | 		text = text.replace(
40 | 		// https://www.xbiquge.so/book/31671/27172195.html
41 | 		// 笔趣阁 www.xbiquge.so，最快更新那年那蝉那把剑 ！<br><br>
42 | 		/^[\s\n]*笔趣阁.+?最快更新.+?！(?:<br>)+/g, '').replace(
43 | 		// 天才壹秒記住『愛♂去÷小?說→網』，為您提供精彩小說閱讀。<br />
44 | 		/^[^<>]+提供精彩小說閱讀。<br[^<>]*>/g, '').replace(
45 | 		// 天才壹秒記住『愛♂去÷小?說→網』，為您提供精彩小說閱讀。<br />
46 | 		/【愛.去.小.說.網[^【】]{5,20}】/g, '');
47 | 
48 | 		/**
49 | 		 * <code>
50 | 
51 | 		TODO:
52 | 
53 | 		https://www.ptwxz.com/html/10/10605/8716905.html
54 | 
55 | 		&nbsp;&nbsp;&nbsp;&nbsp;【看书福利】关注公众..号【投资好文】，每天看书抽现金/点币!<br /><br />
56 | 
57 | 		https://www.ptwxz.com/html/10/10605/8700476.html
58 | 		https://www.ptwxz.com/html/10/10605/8718557.html
59 | 
60 | 		&nbsp;&nbsp;&nbsp;&nbsp;&emsp;&emsp;【领现金红包】看书即可领现金！关注微信.公众号【书友大本营】，现金/点币等你拿！<br /><br />
61 | 
62 | 
63 | 		https://www.ptwxz.com/html/10/10605/8721411.html
64 | 		&nbsp;&nbsp;&nbsp;&nbsp;&emsp;&emsp;【书友福利】看书即可得现金or点币，还有iPhone12、Switch等你抽！关注vx公众号【书友大本营】可领！<br /><br />
65 | 
66 | 		</code>
67 | 		 */
68 | 
69 | 		// console.log(text);
70 | 		return text;
71 | 	}
72 | });
73 | 
74 | // ----------------------------------------------------------------------------
75 | 
76 | // CeL.set_debug(3);
77 | 
78 | start_crawler(crawler, typeof module === 'object' && module);
79 | 


--------------------------------------------------------------------------------
/novel.cmn-Hans-CN/xbiquke.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載 笔趣阁 小说 的工具。 Download xbiquke novels.
  3 |  */
  4 | 
  5 | 'use strict';
  6 | 
  7 | require('../work_crawler_loader.js');
  8 | 
  9 | // ----------------------------------------------------------------------------
 10 | 
 11 | CeL.run('application.net.work_crawler.sites.PTCMS');
 12 | 
 13 | // ----------------------------------------------------------------------------
 14 | 
 15 | var // https://www.xxbiquke.net/64_64816/29478622.html
 16 | // 记住网址m.ｘｂｅｑｕｇｅ．ｃｏｍ
 17 | PATTERN_ads_base = generate_bi_width_pattern('b') + '.'
 18 | 		+ generate_bi_width_pattern('qu') + '.'
 19 | 		+ generate_bi_width_pattern('e.'),
 20 | //
 21 | crawler = CeL.PTCMS({
 22 | 	// 2023/8/20 之前: http://www.xbiquke.net/ → https://www.xxbiquke.net/
 23 | 	// 但直接連結似乎會被屏蔽?
 24 | 	base_URL : 'http://www.xbiquke.net/',
 25 | 	// must_browse_first : true,
 26 | 
 27 | 	// 2024/1/30 速度太快似乎會被禁?
 28 | 	chapter_time_interval : '5s',
 29 | 
 30 | 	search_URL : 'search?keyword=',
 31 | 	parse_search_result : 'biquge',
 32 | 
 33 | 	// 取得作品的章節資料。 get_work_data()
 34 | 	work_URL : function(work_id) {
 35 | 		return (work_id / 1000 | 0) + '_' + work_id + '/';
 36 | 	},
 37 | 	extract_work_data : function(work_data, html, get_label,
 38 | 	//
 39 | 	extract_work_data) {
 40 | 		var text = html.between('<div id="info">', '</div>');
 41 | 		extract_work_data(work_data, text, /<p>([^：]+)：([\s\S]+?)<\/p>/g);
 42 | 		Object.assign(work_data, {
 43 | 			title : get_label(text.between('<h1>', '</h1>')),
 44 | 			author : work_data['作  者'],
 45 | 			image : html.between('<div id="fmimg">', '</div>').between('<img ')
 46 | 					.between('src="', '"'),
 47 | 			last_update : work_data.最后更新,
 48 | 			latest_chapter : work_data.最新章节,
 49 | 			status : work_data.书籍状态
 50 | 		});
 51 | 	},
 52 | 
 53 | 	// 取得包含章節列表的文字範圍。
 54 | 	get_chapter_list_contents : function(html) {
 55 | 		return html.between('<div id="list"', '</div>');
 56 | 	},
 57 | 
 58 | 	PATTERN_ads_1 : new RegExp('(?:一秒记住|记住网址|首发网址)(?:'
 59 | 			+ generate_bi_width_pattern('http://') + ')?(?:'
 60 | 			// https://www.xxbiquke.net/64_64816/29478099.html
 61 | 			// "一秒记住ｈｔｔｐ://ｍ．xxbiquｋｅ．ｎｅｔ"
 62 | 			+ generate_bi_width_pattern('m.xx') + '?' + PATTERN_ads_base
 63 | 			+ '[a-zａ-ｚ]+' + generate_bi_width_pattern('/') + '?)', 'g'),
 64 | 	remove_ads : function(text, chapter_data) {
 65 | 		// http://www.xbiquke.net/29_29775/21316959.html
 66 | 		text = text.replace(/(?:\s|&nbsp;)*<p\s+class="[^"]*">\s*/g, '<p>')
 67 | 				.replace(/\s*<\/p>\s*<br\s*\/?>/g, '</p>').replace(
 68 | 						this.PATTERN_ads_1, '');
 69 | 		var matched = text.match(new RegExp('(.{0,20}' + PATTERN_ads_base
 70 | 				+ '.{0,20})'));
 71 | 		if (matched) {
 72 | 			CeL.warn('remove_ads: 發現《' + chapter_data.title + '》尚殘留廣告標記: '
 73 | 					+ matched[1]);
 74 | 			// console.trace(chapter_data);
 75 | 		}
 76 | 
 77 | 		text = CeL.work_crawler.fix_general_censorship(text);
 78 | 
 79 | 		text = CeL.work_crawler.fix_general_ADs(text);
 80 | 
 81 | 		return text;
 82 | 	}
 83 | });
 84 | 
 85 | // https://zh.wikipedia.org/wiki/全形和半形
 86 | // bi-width forms
 87 | function generate_bi_width_pattern(halfwidth_string) {
 88 | 	return halfwidth_string.chars().map(function(char) {
 89 | 		var fullwidth;
 90 | 		var charCode = char.charCodeAt(0);
 91 | 		// https://github.com/rockonyu/StringToWide/blob/master/StringToWide/StringExtension.cs
 92 | 		// https://www.firbug.com/a/202107/438874.html
 93 | 		// 半形符號轉全形
 94 | 		// 全形空格為12288，半形空格為32
 95 | 		// 其他字元半形(33-126)與全形(65281-65374)的對應關係是：均相差 65248 (0xFEE0)
 96 | 		if (char === ' ') {
 97 | 			fullwidth = '　';
 98 | 		} else if (32 < charCode && charCode < 127) {
 99 | 			// 全形 = 半形 + 0xfee0
100 | 			fullwidth = String.fromCharCode(charCode + 0xfee0);
101 | 		} else {
102 | 			return char;
103 | 		}
104 | 
105 | 		// assert: !!fullwidth === true
106 | 		return '[' + char + fullwidth + ']';
107 | 	}).join('');
108 | }
109 | 
110 | // ----------------------------------------------------------------------------
111 | 
112 | // CeL.set_debug(3);
113 | 
114 | start_crawler(crawler, typeof module === 'object' && module);
115 | 


--------------------------------------------------------------------------------
/novel.cmn-Hans-CN/xshuyaya.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載丫丫电子书的工具。 Download xshuyaya novels.
  3 |  */
  4 | 
  5 | 'use strict';
  6 | 
  7 | require('../work_crawler_loader.js');
  8 | 
  9 | // ----------------------------------------------------------------------------
 10 | 
 11 | CeL.run([ 'application.storage.EPUB'
 12 | // CeL.detect_HTML_language()
 13 | , 'application.locale' ]);
 14 | 
 15 | // ----------------------------------------------------------------------------
 16 | 
 17 | var crawler = new CeL.work_crawler({
 18 | 	// auto_create_ebook, automatic create ebook
 19 | 	// MUST includes CeL.application.locale!
 20 | 	need_create_ebook : true,
 21 | 	// recheck:從頭檢測所有作品之所有章節與所有圖片。不會重新擷取圖片。對漫畫應該僅在偶爾需要從頭檢查時開啟此選項。default:false
 22 | 	// recheck='changed': 若是已變更，例如有新的章節，則重新下載/檢查所有章節內容。否則只會自上次下載過的章節接續下載。
 23 | 	// recheck : 'changed',
 24 | 
 25 | 	// site_name : '丫丫电子书',
 26 | 
 27 | 	language : 'cmn-Hans-CN',
 28 | 
 29 | 	// old: shuyaya.com
 30 | 	// 2022/3/22: http://www.xshuyaya.net/
 31 | 	// 2022/6/1: http://www.shuyy.cc/
 32 | 	// 2022/6/21: http://www.shuyyw.com/
 33 | 	// 2022/11/4前: http://www.shuyyw.cc/ → http://www.shuyy8.com/
 34 | 	// 2024/8/8前: 備用網址 http://www.shuyy8.cc/
 35 | 	base_URL : 'http://www.shuyy8.com/',
 36 | 
 37 | 	// 解析 作品名稱 → 作品id get_work()
 38 | 	search_URL : 'search?wd=',
 39 | 	parse_search_result : function(html, get_label) {
 40 | 		// console.log(html);
 41 | 		var id_data = [],
 42 | 		// {Array}id_list = [id,id,...]
 43 | 		id_list = [];
 44 | 
 45 | 		html = html.between('<ul class="clearfix">', '</ul>');
 46 | 		html.each_between('<li>', '</li>', function(text) {
 47 | 			var matched = text.match(
 48 | 			//
 49 | 			/<a href="[^<>"]+\/book\/(\d+)\/"[^<>]*>(.+?)<\/a>/);
 50 | 			if (matched) {
 51 | 				id_list.push(matched[1]);
 52 | 				id_data.push(matched[2]);
 53 | 			}
 54 | 		});
 55 | 
 56 | 		// console.log([ id_list, id_data ]);
 57 | 		return [ id_list, id_data ];
 58 | 	},
 59 | 
 60 | 	// 取得作品的章節資料。 get_work_data()
 61 | 	work_URL : function(work_id) {
 62 | 		return 'book/' + work_id + '/';
 63 | 	},
 64 | 	parse_work_data : function(html, get_label, extract_work_data) {
 65 | 		// <div class="logocss"><a href="/">丫丫电子书</a></div>
 66 | 		this.site_name = get_label(html.between('<div class="logocss">',
 67 | 				'</div>'));
 68 | 		var text = html.between('<p class="author">', '</p>');
 69 | 		var work_data = {
 70 | 			// 必要屬性：須配合網站平台更改。
 71 | 			title : get_label(html.between('<h1>', '</h1>')),
 72 | 
 73 | 			// 選擇性屬性：須配合網站平台更改。
 74 | 			latest_chapter : get_label(html.between(
 75 | 					'<div class="lastrecord">最新章节：', '</div>')),
 76 | 			description : get_label(html.between('<div class="r_cons">内容简介:',
 77 | 					'</div>')),
 78 | 			image : html.between('<div class="con_limg">').between(
 79 | 					'<img src="', '"')
 80 | 		};
 81 | 
 82 | 		// 由 meta data 取得作品資訊。
 83 | 		extract_work_data(work_data, html);
 84 | 
 85 | 		// console.log(text);
 86 | 		extract_work_data(work_data, text,
 87 | 				/([^<>：]+)：<span[^<>]+>([\s\S]*?)<\/span>/g);
 88 | 
 89 | 		work_data = Object.assign({
 90 | 			author : work_data.作者,
 91 | 			tag : work_data.书本标签
 92 | 		}, work_data);
 93 | 
 94 | 		// console.log(html);
 95 | 		// console.log(work_data);
 96 | 		return work_data;
 97 | 	},
 98 | 	// 對於章節列表與作品資訊分列不同頁面(URL)的情況，應該另外指定.chapter_list_URL。
 99 | 	chapter_list_URL : function(work_id) {
100 | 		return 'read/' + work_id + '/';
101 | 	},
102 | 	get_chapter_list : function(work_data, html, get_label) {
103 | 		html = html.between('<h1>');
104 | 		work_data.last_update = get_label(html.between('更新时间：', '</span>'));
105 | 		// reset work_data.chapter_list
106 | 		work_data.chapter_list = [];
107 | 		html.each_between('<div ', '</div>', function(text) {
108 | 			var part_title = text.between('<h2>', '</h2>');
109 | 			if (part_title && !part_title.includes('正文')) {
110 | 				crawler.set_part(work_data, part_title);
111 | 				return;
112 | 			}
113 | 			text = text.between('<ul>', '</ul>');
114 | 			if (!text)
115 | 				return;
116 | 			// console.log(text);
117 | 			text.each_between('<li>', '</li>', function(item) {
118 | 				var matched = item
119 | 						.match(/<a href="([^<>"]+)"[^<>]*>([\s\S]+?)<\/a>/);
120 | 				if (!matched)
121 | 					return;
122 | 				var chapter_data = {
123 | 					url : matched[1],
124 | 					title : get_label(matched[2])
125 | 				};
126 | 				crawler.add_chapter(work_data, chapter_data);
127 | 			});
128 | 		});
129 | 		// console.log(work_data.chapter_list);
130 | 	},
131 | 
132 | 	// 取得每一個章節的各個影像內容資料。 get_chapter_data()
133 | 	parse_chapter_data : function(html, work_data, get_label, chapter_NO) {
134 | 		// console.log(html);
135 | 		// 在取得小說章節內容的時候，若發現有章節被目錄漏掉，則將之補上。
136 | 		this.check_next_chapter(work_data, chapter_NO, html);
137 | 
138 | 		var text = html.between('<div id="content">', '</div>');
139 | 		// <div class="bzend"><span>本章结束</span>
140 | 		text = text.replace(/<div class="bzend"[\s\S]+/, '');
141 | 
142 | 		text = CeL.work_crawler.fix_general_censorship(text);
143 | 
144 | 		text = CeL.work_crawler.fix_general_ADs(text);
145 | 
146 | 		this.add_ebook_chapter(work_data, chapter_NO, text);
147 | 	}
148 | });
149 | 
150 | // ----------------------------------------------------------------------------
151 | 
152 | // CeL.set_debug(3);
153 | 
154 | start_crawler(crawler, typeof module === 'object' && module);
155 | 


--------------------------------------------------------------------------------
/novel.cmn-Hans-CN/zhuishubang.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 追书帮 小說 的工具。 Download zhuishubang novels.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.jieqi_article');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | // 本↘书↘首↘发↘追↘书↘帮↘http://m.zhuishubang.com/
16 | var PATTERN_ads = /免-费-首-发→【追】【书】【帮】|★首发追书帮★|★看★最★新★章★节★百★度★搜★追★书★帮★|本↘书↘首↘发↘追↘书↘帮↘http:[a-z.\/]+/g,
17 | //
18 | crawler = CeL.jieqi_article({
19 | 
20 | 	base_URL : 'https://www.zhuishubang.com/',
21 | 
22 | 	inverted_order : true,
23 | 
24 | 	// 去掉前後網站廣告。
25 | 	remove_ads : function(text) {
26 | 		return text.replace(PATTERN_ads, '');
27 | 	}
28 | });
29 | 
30 | // ----------------------------------------------------------------------------
31 | 
32 | // CeL.set_debug(3);
33 | 
34 | start_crawler(crawler, typeof module === 'object' && module);
35 | 


--------------------------------------------------------------------------------
/novel.cmn-Hans-CN/zwdu.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載 2015 八一中文网的工具。 Download zwdu novels.
 3 |  * 
 4 |  * @see xbiquge
 5 |  */
 6 | 
 7 | 'use strict';
 8 | 
 9 | require('../work_crawler_loader.js');
10 | 
11 | // ----------------------------------------------------------------------------
12 | 
13 | CeL.run('application.net.work_crawler.sites.PTCMS');
14 | 
15 | // ----------------------------------------------------------------------------
16 | 
17 | /**
18 |  * <code>
19 |  <h3 class="result-item-title result-game-item-title">
20 |  <a cpos="title" href="/book/4/4235/" title="诡秘之主" class="result-game-item-title-link" target="_blank">
21 |  诡秘之主
22 |  </a >
23 |  </h3 >
24 |  </code>
25 |  */
26 | // [ all, id, title, title ]
27 | var PATTERN_search_anchor = /<a [^<>]*?href="[^<>"]+?\/(\d+)\/?"[^<>]+?title="([^<>"]+)"[^<>]*?>([\s\S]+?)<\/a>/,
28 | //
29 | crawler = CeL.PTCMS({
30 | 	base_URL : 'https://www.zwdu.com/',
31 | 	charset : 'gbk',
32 | 
33 | 	// 提取出引數（如 URL）中的作品ID 以回傳。
34 | 	extract_work_id : function(work_information) {
35 | 		return /^[\d_]+$/.test(work_information) && work_information;
36 | 	},
37 | 
38 | 	// 解析 作品名稱 → 作品id get_work()
39 | 	search_URL : {
40 | 		URL : 'search.php?keyword=',
41 | 		charset : 'utf8'
42 | 	},
43 | 	parse_search_result : function(html, get_label) {
44 | 		// console.log(html);
45 | 		var id_data = [],
46 | 		// {Array}id_list = [id,id,...]
47 | 		id_list = [];
48 | 
49 | 		html.each_between(' class="result-item-title', '</h3>', function(text) {
50 | 			// console.log(text);
51 | 			var matched = text.match(PATTERN_search_anchor);
52 | 			id_list.push(+matched[1]);
53 | 			id_data.push(get_label(matched[2]));
54 | 		});
55 | 
56 | 		return [ id_list, id_data ];
57 | 	},
58 | 
59 | 	// 取得作品的章節資料。 get_work_data()
60 | 	work_URL : 'book/',
61 | 	// 取得包含章節列表的文字範圍。
62 | 	get_chapter_list_contents : function(html) {
63 | 		return html.between('<div id="list">', '</div>');
64 | 	}
65 | });
66 | 
67 | // ----------------------------------------------------------------------------
68 | 
69 | // CeL.set_debug(3);
70 | 
71 | start_crawler(crawler, typeof module === 'object' && module);
72 | 


--------------------------------------------------------------------------------
/novel.ja-JP/AlphaPolis.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * 批量下載アルファポリス - 電網浮遊都市 - 小説的工具。 Download AlphaPolis novels.
  3 |  * 
  4 |  * @see 小説投稿サイト https://matome.naver.jp/odai/2139450042041120001
  5 |  *      http://www.akatsuki-novels.com/novels/ranking_total
  6 |  *      http://www.mai-net.net/bbs/sst/sst.php?act=list&cate=all&page=1
  7 |  *      https://github.com/whiteleaf7/narou
  8 |  *      https://github.com/59naga/scrape-narou
  9 |  */
 10 | 
 11 | 'use strict';
 12 | 
 13 | require('../work_crawler_loader.js');
 14 | 
 15 | // ----------------------------------------------------------------------------
 16 | 
 17 | CeL.run('application.net.work_crawler.sites.AlphaPolis');
 18 | 
 19 | // ----------------------------------------------------------------------------
 20 | 
 21 | var crawler = CeL.AlphaPolis({
 22 | 	// auto_create_ebook, automatic create ebook
 23 | 	// MUST includes CeL.application.locale!
 24 | 	need_create_ebook : true,
 25 | 	// recheck:從頭檢測所有作品之所有章節。
 26 | 	// 'changed': 若是已變更，例如有新的章節，則重新下載/檢查所有章節內容。
 27 | 	// ** 以本站來說太消耗時間。
 28 | 	recheck : 'changed',
 29 | 
 30 | 	// 2018/10/16-19 間開始: 頁面讀得太頻繁，例如連續讀取20個頁面，之後會只提供無內容頁面。
 31 | 	// 開新的 instance 可以多重下載作品。
 32 | 	// 2019/1/29-2020/6: 13s 還不行, 15s OK (每20個章節需要超過5分鐘)
 33 | 	// 2020/8/9 20s 不行, 20s OK
 34 | 	chapter_time_interval : '20s',
 35 | 
 36 | 	work_type : 'novel',
 37 | 
 38 | 	// 解析 作品名稱 → 作品id get_work()
 39 | 	parse_search_result : function(html, get_label) {
 40 | 		// console.trace(html);
 41 | 		var id_data = [],
 42 | 		// {Array}id_list = [id,id,...]
 43 | 		id_list = [];
 44 | 		html.each_between('<h2 class="title">', '</h2>', function(text) {
 45 | 			/**
 46 | 			 * <code>
 47 | 
 48 | 			<a href="https://www.alphapolis.co.jp/novel/904773584/638380930" target="_blank" class="">余りモノ異世界人の自由生活～勇者じゃないので勝手にやらせてもらいます～</a>
 49 | 
 50 | 			</code>
 51 | 			 */
 52 | 			// console.trace(text);
 53 | 			id_list.push(text.between('/novel/', '"')
 54 | 			//
 55 | 			.replace('/', '-'));
 56 | 			// get <a>.innerText
 57 | 			id_data.push(get_label(text.between('>', '<')));
 58 | 		});
 59 | 		// console.trace([ id_list, id_data ]);
 60 | 		return [ id_list, id_data ];
 61 | 	},
 62 | 
 63 | 	// 2017/6/27 アルファポリスアプリの小説レンタルサービス開始
 64 | 	// https://www.alphapolis.co.jp/diary/view/12394/
 65 | 	// 有些作品章節編號可能會被跳過。
 66 | 	// 檢測所取得內容的章節編號是否相符。
 67 | 	_check_chapter_NO : [ '<div class="page-count">', '/' ],
 68 | 	parse_chapter_data : function(html, work_data, get_label, chapter) {
 69 | 		// <div class="text " id="novelBoby">
 70 | 		var text = html.between('<div class="text',
 71 | 		// <div class="episode-navigation section ">
 72 | 		'<div class="episode-navigation');
 73 | 		if (text.includes('しおりを挟む</a>')) {
 74 | 			text = text.between(null, {
 75 | 				tail : 'しおりを挟む</a>'
 76 | 			});
 77 | 		}
 78 | 		text = text.between('>', {
 79 | 			tail : '</div>'
 80 | 		});
 81 | 		if (text.length < 200 && text.includes(' id="LoadingEpisode"')) {
 82 | 			// console.log(html);
 83 | 			CeL.warn((work_data.title || work_data.id)
 84 | 			//
 85 | 			+ ': 讀取太過頻繁，只取得了無內容頁面！');
 86 | 			// text: <div class="dots-indicator" id="LoadingEpisode">
 87 | 			// assert: get_label(text) === ''
 88 | 			text = '';
 89 | 		}
 90 | 		this.add_ebook_chapter(work_data, chapter, {
 91 | 			title : html.between('<div class="chapter-title">', '</div>'),
 92 | 			sub_title : html.between('<h2 class="episode-title">', '</h2>'),
 93 | 			text : text
 94 | 		});
 95 | 	}
 96 | });
 97 | 
 98 | // ----------------------------------------------------------------------------
 99 | 
100 | // CeL.set_debug(3);
101 | 
102 | start_crawler(crawler, typeof module === 'object' && module);
103 | 


--------------------------------------------------------------------------------
/novel.ja-JP/mid.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載小説家になろう/ミッドナイトノベルズ的工具。 Download syosetu.com novels.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.yomou');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.yomou({
16 | 	site_name : 'ミッドナイトノベルズ',
17 | 	base_URL : 'https://mid.syosetu.com/',
18 | 	isR18 : true
19 | });
20 | 
21 | // ----------------------------------------------------------------------------
22 | 
23 | // CeL.set_debug(3);
24 | 
25 | start_crawler(crawler, typeof module === 'object' && module);
26 | 


--------------------------------------------------------------------------------
/novel.ja-JP/mnlt.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載小説家になろう/ムーンライトノベルズ的工具。 Download syosetu.com novels.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.yomou');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.yomou({
16 | 	site_name : 'ムーンライトノベルズ',
17 | 	base_URL : 'https://mnlt.syosetu.com/',
18 | 	isR18 : true
19 | });
20 | 
21 | // ----------------------------------------------------------------------------
22 | 
23 | // CeL.set_debug(3);
24 | 
25 | start_crawler(crawler, typeof module === 'object' && module);
26 | 


--------------------------------------------------------------------------------
/novel.ja-JP/noc.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載小説家になろう/ノクターンノベルズ的工具。 Download syosetu.com novels.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.yomou');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.yomou({
16 | 	site_name : 'ノクターンノベルズ',
17 | 	base_URL : 'https://noc.syosetu.com/',
18 | 	isR18 : true
19 | });
20 | 
21 | // ----------------------------------------------------------------------------
22 | 
23 | // CeL.set_debug(3);
24 | 
25 | start_crawler(crawler, typeof module === 'object' && module);
26 | 


--------------------------------------------------------------------------------
/novel.ja-JP/novel.ja-JP.bat:
--------------------------------------------------------------------------------
 1 | @ECHO OFF
 2 | REM parallelly
 3 | CHCP 65001
 4 | REM CHCP 932
 5 | REM CD /D D:\USB\cgi-bin\program\comic
 6 | 
 7 | REM CD "%~n0"
 8 | REM It's often too slow, so trying to execute parallelly.
 9 | FORFILES /M *.js /C "cmd.exe /c IF @isdir==FALSE START node @file l=@fname.txt || PAUSE"
10 | 
11 | REM CD ..
12 | 


--------------------------------------------------------------------------------
/novel.ja-JP/yomou.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * 批量下載小説家になろう/小説を読もう！的工具。 Download syosetu.com novels.
 3 |  */
 4 | 
 5 | 'use strict';
 6 | 
 7 | require('../work_crawler_loader.js');
 8 | 
 9 | // ----------------------------------------------------------------------------
10 | 
11 | CeL.run('application.net.work_crawler.sites.yomou');
12 | 
13 | // ----------------------------------------------------------------------------
14 | 
15 | var crawler = CeL.yomou();
16 | 
17 | // ----------------------------------------------------------------------------
18 | 
19 | // CeL.set_debug(3);
20 | 
21 | start_crawler(crawler, typeof module === 'object' && module);
22 | 


--------------------------------------------------------------------------------
/package.json:
--------------------------------------------------------------------------------
  1 | {
  2 | 	"name" : "work_crawler",
  3 | 	"title" : "CeJS online novels and comics downloader",
  4 | 	"version" : "v2.14.0",
  5 | 	"description" : "A tool using CeJS library to download online novels / comics.",
  6 | 	"keywords" : [ "comic-downloader", "novel-downloader", "cejs",
  7 | 			"downloader", "download-comic", "epub", "ebook", "comics",
  8 | 			"webcomics", "manga-downloader", "manga", "narou", "novels",
  9 | 			"crawler" ],
 10 | 	"author" : {
 11 | 		"name" : "Colorless echo",
 12 | 		"email" : "vimunci@gmail.com",
 13 | 		"url" : "https://github.com/kanasimi/work_crawler"
 14 | 	},
 15 | 	"contributors" : [ "vimunci" ],
 16 | 	"license" : "BSD-3-Clause",
 17 | 	"homepage" : "https://github.com/kanasimi/work_crawler",
 18 | 	"bugs" : {
 19 | 		"url" : "https://github.com/kanasimi/work_crawler/issues"
 20 | 	},
 21 | 	"repository" : {
 22 | 		"type" : "git",
 23 | 		"url" : "https://github.com/kanasimi/work_crawler.git"
 24 | 	},
 25 | 
 26 | 	"main" : "gui_electron/gui_electron.js",
 27 | 	"scripts" : {
 28 | 		"start" : "node_modules/.bin/electron .",
 29 | 		"pack" : "node_modules/.bin/electron-builder --dir",
 30 | 		"dist" : "node_modules/.bin/electron-builder",
 31 | 		"postinstall" : "node_modules/.bin/electron-builder install-app-deps"
 32 | 	},
 33 | 
 34 | 	"build" : {
 35 | 		"productName" : "work_crawler",
 36 | 		"appId" : "org.kanasimi.work_crawler",
 37 | 		"directories" : {
 38 | 			"output" : "build"
 39 | 		},
 40 | 		"publish" : [ {
 41 | 			"provider" : "github",
 42 | 			"owner" : "kanasimi",
 43 | 			"repo" : "work_crawler"
 44 | 		} ],
 45 | 		"files" : [ "package.json", "node_modules/*", "resources/*",
 46 | 				"_CeL.loader.nodejs.js", "gui_electron/**/*",
 47 | 				"work_crawler_loader.js",
 48 | 				"work_crawler.default_configuration.js", "comic.*/**/*",
 49 | 				"novel.*/**/*" ],
 50 | 
 51 | 		"mac" : {
 52 | 			"category" : "Network",
 53 | 			"target" : [ "dmg", "pkg", "zip" ],
 54 | 			"icon" : "gui_electron/icon/rasen2.png"
 55 | 		},
 56 | 		"dmg" : {
 57 | 			"icon" : "gui_electron/icon/rasen2.png",
 58 | 			"contents" : [ {
 59 | 				"x" : 110,
 60 | 				"y" : 150
 61 | 			}, {
 62 | 				"x" : 240,
 63 | 				"y" : 150,
 64 | 				"type" : "link",
 65 | 				"path" : "/Applications"
 66 | 			} ]
 67 | 		},
 68 | 		"mas" : {
 69 | 			"icon" : "gui_electron/icon/rasen2.png",
 70 | 			"extendInfo" : {
 71 | 				"ElectronTeamID" : "TEAMID"
 72 | 			},
 73 | 			"category" : "public.app-category.entertainment"
 74 | 		},
 75 | 
 76 | 		"linux" : {
 77 | 			"target" : [ {
 78 | 				"target" : "AppImage",
 79 | 				"arch" : [ "x64" ]
 80 | 			}, {
 81 | 				"target" : "deb",
 82 | 				"arch" : [ "x64" ]
 83 | 			}, {
 84 | 				"target" : "apk"
 85 | 			} ],
 86 | 			"category" : "Network",
 87 | 			"icon" : "gui_electron/icon/rasen2.png"
 88 | 		},
 89 | 
 90 | 		"win" : {
 91 | 			"target" : [ {
 92 | 				"target" : "nsis",
 93 | 				"arch" : [ "x64", "ia32" ]
 94 | 			} ],
 95 | 			"icon" : "gui_electron/icon/rasen2.ico"
 96 | 		},
 97 | 
 98 | 		"nsis" : {
 99 | 			"oneClick" : false,
100 | 			"perMachine" : false,
101 | 			"allowElevation" : true,
102 | 			"allowToChangeInstallationDirectory" : true,
103 | 			"createDesktopShortcut" : true,
104 | 			"runAfterFinish" : true
105 | 		}
106 | 	},
107 | 	"engines" : {
108 | 		"node" : ">=8.12.0"
109 | 	},
110 | 	"devDependencies" : {
111 | 		"electron" : "latest",
112 | 		"electron-builder" : "latest"
113 | 	},
114 | 	"dependencies" : {
115 | 		"electron-updater" : "latest",
116 | 		"gh-updater" : "latest",
117 | 		"cejs" : "latest"
118 | 	}
119 | }
120 | 


--------------------------------------------------------------------------------
/start_gui_electron.bat:
--------------------------------------------------------------------------------
1 | @ECHO OFF
2 | CHCP 65001
3 | 
4 | ECHO Loading work_crawler GUI...
5 | 
6 | node_modules\.bin\electron . 2> nul || %USERPROFILE%\node_modules\.bin\electron . || ECHO Please install electron first! && PAUSE
7 | 


--------------------------------------------------------------------------------
/start_gui_electron.sh:
--------------------------------------------------------------------------------
1 | #!/bin/sh
2 | 
3 | echo "Loading work_crawler GUI..."
4 | 
5 | # Will call "main" @ package.json
6 | node_modules/.bin/electron . || ~/node_modules/.bin/electron .
7 | 


--------------------------------------------------------------------------------
/work_crawler.default_configuration.js:
--------------------------------------------------------------------------------
 1 | ﻿/**
 2 |  * @name CeJS online novels / comics downloader configuration. CeJS
 3 |  *       網路小說漫畫下載工具的主要設定。
 4 |  * @fileoverview ** This file is private. Please fill the data and rename this
 5 |  *               file to "work_crawler.configuration.js".
 6 |  * 
 7 |  * 請注意：請別直接改變 `work_crawler.default_configuration.js` 的設定。
 8 |  * 這個檔案在每次更新時，都會被覆寫成新版本的預設設定。若欲更改設定，請編輯 `work_crawler.configuration.js`
 9 |  * 這個檔案，不要編輯 `work_crawler.default_configuration.js`！
10 |  */
11 | 
12 | 'use strict';
13 | 
14 | // default directory to place comic images and novels.
15 | // 指定所有網站採用之預設主要下載目錄，所下載的作品檔案預設會放置到此主要目錄之工具檔名稱底下。
16 | // 請記得在引號中，目錄分隔號必須輸入兩次！
17 | // '': the same directory as the .js running,
18 | // or default download location of user.
19 | globalThis.data_directory = '';
20 | 
21 | // 設定是否開啟自動更新功能。
22 | globalThis.auto_update = true;
23 | 
24 | // npm: 若有 CeJS module 則用之。
25 | globalThis.use_cejs_mudule = true;
26 | 
27 | // ------------------------------------
28 | 
29 | // 代理伺服器 "hostname:port"
30 | globalThis.proxy_server = '';
31 | 
32 | /** {String|Function}儲存最愛作品清單的目錄。可以把最愛作品清單放在獨立的檔案，便於編輯。 */
33 | globalThis.favorite_list_directory = '';
34 | // 儲存最愛作品清單的目錄 @ .main_directory。
35 | favorite_list_directory = function() {
36 | 	return this.main_directory + 'favorite.txt';
37 | };
38 | 
39 | /** {String|Function}當只輸入 "l" 時的轉換。 */
40 | globalThis.default_favorite_list = '';
41 | 
42 | // ------------------------------------
43 | // configuration for arrangement/*.js
44 | 
45 | // default directory to place completed files
46 | // 將會被指定為第一個存在的目錄。
47 | globalThis.completed_directory = [ '', '' ];
48 | 
49 | // 檔案分類完後要放置的標的目錄。
50 | globalThis.catalog_directory = '';
51 | 
52 | // ------------------------------------
53 | // 各個網站獨特的設定/特別的個人化設定。
54 | globalThis.site_configuration = {};
55 | 
56 | // comico 搭配閱讀卷示範
57 | site_configuration.comico = site_configuration.comico_jp = site_configuration.comico_jp_plus = {
58 | 	// 讓本工具自動使用閱讀卷。警告:閱讀券使用完就沒了。不可回復。
59 | 	// auto_use_ticket : true,
60 | 	// 警告:帳號資訊是用明碼存放在檔案中。
61 | 	loginid : '',
62 | 	password : ''
63 | };
64 | 
65 | // ニコニコ静画を利用する為にはniconicoのアカウントが必要です。
66 | site_configuration.nico_seiga = {
67 | 	// account
68 | 	mail_tel : '',
69 | 	// 警告:帳號資訊是用明碼存放在檔案中。
70 | 	password : '',
71 | 	cookie : ''
72 | };
73 | 


--------------------------------------------------------------------------------
/work_crawler.updater.js:
--------------------------------------------------------------------------------
  1 | ﻿/**
  2 |  * CeJS 網路小說漫畫下載工具 命令列介面自動更新工具。
  3 |  * 
  4 |  * @since 2018/8/27
  5 |  * 
  6 |  * @see _build/pack_up.js
  7 |  */
  8 | 
  9 | 'use strict';
 10 | 
 11 | var repository = 'gh-updater', branch = 'master', update_script_url = 'https://raw.githubusercontent.com/kanasimi/'
 12 | 		+ repository + '/' + branch + '/' + 'GitHub.updater.node.js', updater;
 13 | 
 14 | // ----------------------------------------------------------------------------
 15 | // Using in GitHub.updater.node.js work_crawler.updater.js pack_up.js
 16 | 
 17 | function show_info(message) {
 18 | 	process.title = message;
 19 | 	console.info('\x1b[35;46m' + message + '\x1b[0m');
 20 | }
 21 | 
 22 | // ----------------------------------------------------------------------------
 23 | // Using in work_crawler.updater.js pack_up.js
 24 | 
 25 | // const
 26 | var node_https = require('https'), node_fs = require('fs');
 27 | 
 28 | function fetch_url(url, callback) {
 29 | 	var url_str = url;
 30 | 	if (process.env.socks_proxy) {
 31 | 		try {
 32 | 			var SocksProxyAgent = require('socks-proxy-agent').SocksProxyAgent;
 33 | 			url = require('url').parse(url);
 34 | 			url.agent = new SocksProxyAgent(process.env.socks_proxy);
 35 | 		} catch (e) {
 36 | 			console.error('Please install socks-proxy-agent to using proxy: ' + '`npm install socks-proxy-agent`');
 37 | 			throw e;
 38 | 		}
 39 | 	}
 40 | 
 41 | 	node_https.get(url, function(response) {
 42 | 		var buffer_array = [], sum_size = 0;
 43 | 
 44 | 		response.on('data', function(data) {
 45 | 			sum_size += data.length;
 46 | 			buffer_array.push(data);
 47 | 		});
 48 | 
 49 | 		response.on('end', function(e) {
 50 | 			var contents = Buffer.concat(buffer_array, sum_size).toString(),
 51 | 			// {String}url
 52 | 			file_name = url.match(/[^\\\/]+$/)[0];
 53 | 			console.info(file_name + ': ' + sum_size + ' bytes.');
 54 | 			try {
 55 | 				node_fs.writeFileSync(file_name, contents);
 56 | 			} catch (e) {
 57 | 				// e.g., read-only. testing now?
 58 | 				console.error(e);
 59 | 			}
 60 | 
 61 | 			if (typeof callback === 'function')
 62 | 				callback(file_name);
 63 | 		});
 64 | 	})
 65 | 	//
 66 | 	.on('error', function(e) {
 67 | 		// network error?
 68 | 		// console.error(e);
 69 | 		throw e;
 70 | 		if (typeof callback === 'function')
 71 | 			callback(null, e);
 72 | 	});
 73 | }
 74 | 
 75 | function fetch_url_promise(url) {
 76 | 	return new Promise(function(resolve, reject) {
 77 | 		fetch_url(url, function(file_name, error) {
 78 | 			if (error)
 79 | 				reject(error);
 80 | 			else
 81 | 				resolve(file_name);
 82 | 		});
 83 | 	});
 84 | }
 85 | 
 86 | /**
 87 |  * <code>
 88 |  curl -O https://raw.githubusercontent.com/kanasimi/work_crawler/master/work_crawler.updater.js
 89 |  * </code>
 90 |  */
 91 | function download_update_tool(update_script_url, callback) {
 92 | 	show_info('下載 ' + repository + ' 更新工具...');
 93 | 	fetch_url(update_script_url, callback);
 94 | }
 95 | 
 96 | // ----------------------------------------------------------------------------
 97 | 
 98 | download_update_tool(update_script_url, function(update_script_name, error) {
 99 | 	update_CeJS(update_script_name, update_finished);
100 | });
101 | 
102 | var latest_version_file, executing_at_tool_directory;
103 | function update_CeJS(update_script_name, callback) {
104 | 	executing_at_tool_directory = node_fs.existsSync('work_crawler_loader.js');
105 | 	// require('./gh-updater');
106 | 	updater = require('./' + update_script_name);
107 | 
108 | 	show_info('下載並更新 CeJS 網路小說漫畫下載工具...');
109 | 	updater.update('kanasimi/work_crawler', executing_at_tool_directory
110 | 	// 解開到當前目錄下。
111 | 	? '.' : '', function(version_data) {
112 | 		latest_version_file = version_data.latest_version_file;
113 | 
114 | 		if (executing_at_tool_directory) {
115 | 			// console.log('似乎在 CeJS 網路小說漫畫下載工具的工作目錄下，直接執行升級工具。');
116 | 			// console.log(process.cwd());
117 | 		} else {
118 | 			process.chdir('work_crawler-master');
119 | 		}
120 | 
121 | 		show_info('下載並更新 Colorless echo JavaScript kit (CeJS) 組件...');
122 | 		updater.update(null, null, function() {
123 | 			update_dependencies();
124 | 			callback();
125 | 		}, {
126 | 			fetch_opencc : true
127 | 		});
128 | 	});
129 | }
130 | 
131 | function update_dependencies() {
132 | 	var package_data = JSON.parse(node_fs.readFileSync('package.json'));
133 | 
134 | 	// 配置圖形使用者介面。
135 | 	updater.update_package('electron', {
136 | 		message : '下載並更新圖形介面需要用到的組件 electron...',
137 | 		development : true,
138 | 		// 當 electron 正執行時，npm install, npm update
139 | 		// 會出現 EBUSY: resource busy or locked 的問題。
140 | 		skip_installed : true
141 | 	});
142 | 
143 | 	// update other dependent components listed in package_data.dependencies
144 | 	for ( var package_name in package_data.dependencies) {
145 | 		if (package_name === 'cejs') {
146 | 			// 已在 update_CeJS() 安裝過了。
147 | 			continue;
148 | 		}
149 | 		// npm install electron-builder
150 | 		updater.update_package(package_name);
151 | 	}
152 | 
153 | 	node_fs.chmodSync('start_gui_electron.sh', '0755');
154 | 	if (!executing_at_tool_directory) {
155 | 		// 避免第一次執行時檢查更新。
156 | 		node_fs.copyFileSync('../' + latest_version_file, latest_version_file);
157 | 	}
158 | }
159 | 
160 | function update_finished() {
161 | 	show_info('CeJS 網路小說漫畫下載工具 更新完畢.');
162 | }
163 | 


--------------------------------------------------------------------------------